(Klicken Sie auf wöchentliche E -Mails von Gesprächen mit den weltbesten CEOs und Entscheidungsträgern der Welt Hier.)
IBM war einer der Riesen des Computing des 20. Jahrhunderts. Es half bei der Gestaltung des modernen PCs und schuf die Erste KI, die einen menschlichen Champion besiegt Im Schachspiel.
Aber wenn Sie an AI denken, ist IBM möglicherweise nicht der erste oder sogar das zehnte Unternehmen, das sich in den Sinn kündigt. Es trainiert keine großen Modelle und macht nicht mehr Produkte für Verbraucher und konzentriert sich stattdessen auf den Verkauf an andere Unternehmen. “Wir sind ein B2B -Unternehmen und erklären, was wir dem durchschnittlichen Leser antun – wir werden alle Hilfe nehmen, die wir bekommen können”, scherzte IBM -CEO Arvind Krishna vor einem kürzlich durchgeführten Interview mit der Zeit.
Trotzdem lauert eine interessante KI -Geschichte in dieser berühmten Institution. IBM baut tatsächlich KI-Modelle auf-nicht massive wie OpenAIs GPT4-O oder Googles Gemini, aber kleinere, die für die Verwendung in Einstellungen mit hohen Einstellungen konzipiert sind, in denen Genauigkeit eine Prämie erreicht. Wenn das KI -Geschäft reift, wird dies in den Köpfen der Wall Street- und Silicon Valley -Investoren eine kritische unbeantwortete Frage erhoben: Werden die wirtschaftlichen Gewinne der KI für die Unternehmen, die massive „Foundation -Modelle“ wie OpenAI ausbilden, hauptsächlich auftreten? Oder werden sie stattdessen an die Unternehmen fließen-wie IBM-, die die schlanksten, billigsten und genauesten Modelle aufbauen können, die auf bestimmte Anwendungskräfte zugeschnitten sind? Die Zukunft der Branche könnte davon abhängen.
Die Zeit sprach Anfang Februar vor a mit Krishna Zeremonie während dessen erhielt er eine Zeit100 AI Impact Award.
Dieses Interview wurde aus Klarheit kondensiert und bearbeitet.
IBM baute in den neunziger Jahren Deep Blue, die erste Schach -KI, die einen menschlichen Champion besiegte. Dann, im Jahr 2011, IBMs Watson war der erste, der die Spielshow gefährdete. Aber heute trainiert IBM keine großen KI -Systeme wie OpenAI oder Google. Können Sie erklären, warum die Entscheidung getroffen wurde, aus dem KI -Rennen einen Rücksitz zu treffen?
Wenn Sie sich Schach und Gefahr ansehen, war der Grund, diese Herausforderungen zu stellen, der richtige. Sie wählen eine Sache aus, von der die Leute glauben, dass Computer es nicht können, und wenn Sie es können, vermitteln Sie die Kraft der Technologie.
Hier war der Ort, an dem wir losgingen: Wir haben angefangen, Systeme zu bauen, die ich monolithisch bezeichnen werde. Wir fingen an zu sagen, lass uns ein Problem wie Krebs angreifen. Das stellte sich als falscher Ansatz heraus. Es lohnt sich absolut zu lösen, also habe ich keine Fehler, was unsere Teams zu diesem Zeitpunkt getan haben. Sind wir jedoch dafür bekannt, Ärzte zu sein? Verstehen wir, wie Krankenhäuser und Protokolle funktionieren? Verstehen wir, wie der Regulierungsbehörde in diesem Bereich funktioniert? NEIN.
Im Nachhinein wünschte ich, wir hätten zu Beginn nur ein paar Minuten darüber nachgedacht.
Dann sagten wir, ok, Sie können immer größere Modelle produzieren und sie werden immer mehr Berechnung einnehmen. Option 1, nehmen Sie also eine Milliarde Dollar Berechnung und Sie produzieren ein Modell. Um nun eine Rendite zu erzielen, müssen Sie den Leuten einen bestimmten Betrag in Rechnung stellen. Aber können wir es auf ein viel kleineres Modell destillieren, das möglicherweise nicht so viel berechnet wird und viel, viel billiger zu betreiben ist, aber ein Einstellungsmodell für eine Aufgabe in einem geschäftlichen Kontext ist? Das führte zum Geschäftsobjektiv.
Aber eines der zentralen Imbissbuden der letzten 10 Jahre im Deep Learning scheint zu sein, dass Sie mehr aus KI -Systemen herausholen können, indem Sie nur versuchen, sie Generalisten zu machen, als Sie können, indem Sie versuchen, sie auf einen einzelnen Bereich spezialisiert zu machen. Rechts? Das wird als “als” bezeichnet “die bittere Lektion. ““
Ich könnte damit höflich nicht einverstanden sein. Wenn Sie bereit sind, eine Antwort zu haben, ist dies vielleicht nur zu 90% genau. Aber wenn ich einen Hochofen kontrollieren möchte, muss er 100% der Fälle korrekt sein. Dieses Modell hat eine bessere Vorstellung von der Zeitreihenanalyse, die in sie eingebacken ist.
Es ist keine Generalistenmaschine, die sich entschlossen hat, Moby Dick irgendwie intuitiv zu machen, um seine Antwort zu finden. Also mit Respekt, nein. Wenn Sie tatsächlich versuchen, an Orte zu gelangen, an denen Sie eine viel höhere Genauigkeit benötigen, können Sie mit einem kleineren Modell tatsächlich viel besser abschneiden.
Ich glaube tatsächlich, dass es ein paar sehr große Modelle geben wird. Sie kosten ein paar Milliarden Dollar, um zu trainieren, oder vielleicht sogar mehr. Und es wird Tausende kleinerer Modelle geben, die für die Purpose geeignet sind. Sie werden die großen für das Unterrichten nutzen, aber nicht wirklich für ihr inhärentes Wissen.
Werden die wichtigsten wirtschaftlichen Vorteile der KI den größten Unternehmen, die die Foundation -Modelle schulen, eingehen? Oder an die kleineren Unternehmen, die diese Modelle auf bestimmte Anwendungsfälle anwenden?
Ich denke, es ist genau “und.” Ich denke, die Analogie der KI ist wahrscheinlich den frühen Tagen des Internets am nächsten. Stellen Sie sich also im Internet die Frage, ist es nur für sehr große Unternehmen oder für sehr kleine Unternehmen nützlich?
Nehmen Sie zwei entgegengesetzte Beispiele. Wenn ich ein Video -Streaming -Geschäft erstellen möchte, desto mehr Inhalte haben Sie, je mehr Menschen Sie dienen können. Sie erhalten einen Netzwerkeffekt, Sie erhalten eine Skaleneffekte. Auf der anderen Seite haben Sie eine Ladenfront wie Etsy. Plötzlich kann die Person, die ein Handwerker ist, der zwei Gegenstände pro Jahr herstellt, immer noch präsent, da die Verteilungskosten extrem niedrig sind.
Wie hat Ihre Antwort auf diese Frage die Richtung Ihres Geschäfts beeinflusst?
Wir haben tief darüber nachgedacht. Im Jahr 2020 sagten wir: Sollten wir alle unsere Investitionen in den Versuch einsetzen, ein sehr großes Modell zu bauen? Wenn es sich um ein sehr großes Modell handelt, sind die Kosten für das Ausführen dieser Modelle, nennen wir es das Quadrat der Größe des Modells.
Wenn ich also ein 10 -Milliarden -Parametermodell habe und ein 1 -Billionen -Parametermodell habe, wird es 10.000 -mal teurer, das sehr große Modell auszuführen. Dann drehen Sie sich um und stellen die Frage, wenn es nur 1% besser ist, möchte ich dann wirklich 10.000 Mal mehr bezahlen? Und diese Antwort in der Geschäftswelt ist fast immer nein.
Aber wenn es 10 -mal kleiner sein kann, hey, das lohnt sich, denn das sinkt um mehr als 90% der Kosten für das Laufen. Das hat unsere Entscheidung getrieben.
Reden wir darüber Quantencomputer. IBM ist ein großer Investor in Quantum. Was ist Ihre größere Bildstrategie dort?
Also haben wir uns vor mehr als 10 Jahren als Gebiet für Investitionen ausgewählt. Wir kamen zu dem Schluss, dass es ein technisches Problem mehr ist als ein wissenschaftliches Problem. In dem Moment, in dem es ein technisches Problem ist, müssen Sie sich jetzt die Frage stellen, können Sie die beiden grundlegenden Probleme lösen, die dort sind?
Erstens sind die Fehlerraten wirklich hoch, aber auch normale Computer. Was die Leute nicht erkennen, ist: Es gibt Techniken, die es fehlerfrei erscheinen lassen. Auch auf den Maschinen, auf denen wir uns befinden, gibt es auf der sehr grundlegenden Ebene Fehler, aber sie korrigieren sich selbst, und so sehen wir sie nicht.
Zwei, weil Quantum von Natur aus auf Quantenebene arbeitet, kann sehr winzige Energiemengen einen sogenannten Kohärenzverlust verursachen. Sie arbeiten also nicht sehr lange. Wir glaubten, wenn wir uns einer Millisekunde nahe kommen könnten, können Sie einige wirklich, wirklich sorgfältige Berechnungen durchführen.
Und so gingen wir einen Weg und wir glauben, dass wir bei der Fehlerkorrektur viel Fortschritte gemacht haben. Wir sind wahrscheinlich in einem Zehntel Millisekunde, noch nicht ganz in einer Millisekunde, zu den Kohärenzzeiten. Wir spüren in den nächsten drei, vier, fünf Jahren – ich gebe mich bis Ende des Jahrzehnts – wir werden in dieser Front etwas Bemerkenswertes sehen und ich bin wirklich glücklich, wo unser Team ist.
Wenn Sie den riesigen Durchbruch machen können, den Sie sagen, bis Ende des Jahrzehnts zu machen, wohin ist das IBM als Unternehmen? Lassen Sie das in einer dominanten Position in der nächsten Technologiewelle?
Es gibt Hardware, und dann gibt es alle Leute, die sie ausnutzen werden. Lassen Sie mich zunächst damit beginnen: Die Leute, die es ausnutzen werden, werden alle unsere Kunden sein. Sie erhalten den Wert, egal ob es sich um eine materielle Entdeckung oder bessere Batterien oder bessere Düngemittel oder bessere Drogen handelt, dieser Wert wird von unseren Kunden erhalten.
Aber wer kann ihnen einen funktionierenden Quantencomputer geben? Ich denke, dass die Zeitleiste und die Durchbrüche, von denen ich spreche, übernachtete, dass wir eine enorme Position und den First-Mover-Vorteil in diesem Markt gibt, zu einem Punkt, an dem ich denke, dass wir die de-facto-Antwort für diese Technologien werden würden.
Technologie war schon immer additiv. Das Smartphone hat den Laptop nicht entfernt. Ich denke, Quantum wird additiv sein. Aber ähnlich wie wir bei der Erfindung von Mainframes im PC geholfen haben, wir werden vielleicht eine ganze Weile auf derselben Position einnehmen.
Source link