Chinas KI -Boom beschleunigt sich mit Alibabas neuem Modell


On 5. März veröffentlichte der chinesische Tech -Riese Alibaba sein neuestes KI -Argumentationsmodell. QWQ-32Bwas zu einem Anstieg von 8% in den in Hongkong aufgeführten Aktien des Unternehmens führt. Zwar weniger fähig als Amerikas führende KI -Systeme wie OpenAIs O3 oder Anthropics Claude 3.7 SonettDas Modell spielt Berichten zufolge ungefähr so ​​gut wie sein chinesischer Konkurrent Deepseeks Modell, R1, obwohl es erheblich weniger Rechenleistung erfordert, um sich zu entwickeln und zu laufen. Seine Schöpfer sagen QWQ-32B verkörpert einen „alten philosophischen Geist“, indem er Probleme mit „echtem Wunder und Zweifel“ angeht.

“Es spiegelt die breitere Wettbewerbsfähigkeit des Chinas Frontier AI -Ökosystems wider”, sagt Scott Singer, Gastwissenschaftler für das Programm für Technologie- und Internationale Angelegenheiten bei der Carnegie Stiftment for International Peace. Dieses Ökosystem umfasst Deepseeks R1 und Tencent’s Hunyuan Das Modell, von dem der anthropische Mitbegründer Jack Clark sagte, ist durch einige Maßnahmen „Weltklasse“. Die Bewertungen des neuesten Modells von Alibaba sind jedoch vorläufig aufgrund der inhärente Herausforderung Modellfunktionen, und weil das Modell bisher nur von Alibaba selbst bewertet wurde. “Die Informationsumgebung ist momentan nicht sehr reich”, sagt Singer.

Ein weiterer Schritt auf dem Weg zu Agi

Seit der Veröffentlichung des R1 -Modells von Deepseek im Januar stand Chinas Tech -Ökosystem im Rampenlicht über den globalen Aktienmarkt – insbesondere, wie die USA zunehmend sehen selbst Als Rennen gegen China zur Schaffung künstlicher allgemeine Intelligenz (AGI)-heftig fortgeschrittene KI-Systeme, die die meisten kognitiven Arbeiten ausführen können, von Grafikdesign bis hin zu maschinellen Lernforschung. Es wird allgemein erwartet Experten sind sehr skeptische Menschen in der Lage, die Kontrolle über ein solches System zu behalten, unabhängig davon, wer es schafft).

“Wir sind zuversichtlich, dass die Kombination stärkerer Fundamentmodelle mit Verstärkungslernen durch skalierte Rechenressourcen uns dem Erreichen von AGI näher bringen wird.” schrieb Das Team hinter Alibabas neuestem Modell. Die Suche nach Agi durchdringt die führenden KI -Labors. Deepseeks GEBEHALTES ZIEL ist „das Geheimnis von Agi mit Neugier aufzulösen“. Openai’s MissionInzwischen ist es, „sicherzustellen, dass künstliche allgemeine Intelligenz – AII -Systeme, die im Allgemeinen schlauer sind als Menschen – die gesamte Menschheit aufweisen“. Führende KI -CEOs einschließlich der KI -CEOs Sam AltmanAnwesend Dario AmodeiUnd Elon Moschus Alle erwarten, dass AGI-ähnliche Systeme in der gegenwärtigen Amtszeit von Präsident Trump aufgebaut werden.

Mehr lesen: Wie China trotz der US -Chip -Beschränkungen in KI voranschreitet

Chinas Wende

Alibabas neueste KI-Veröffentlichung kommt nur zwei Wochen, nachdem der Mitbegründer des Unternehmens, Jack Ma, in der ersten Reihe in A abgebildet wurde treffen Zwischen Präsident Xi Jinping und den herausragenden Geschäftsführern des Landes. Seit 2020 kritisierte Ma öffentlich staatliche Aufsichtsbehörden und staatliche Banken, um Innovationen zu unterdrücken und mit einer „Pfandhaus-Mentalität“ zu arbeiten, und war im öffentlichen Rampenlicht weitgehend abwesend. In dieser Zeit hat die chinesische Regierung die Tech -Branche festgelegt, strengere Regeln dafür auferlegt, wie Unternehmen Daten verwenden und auf dem Markt konkurrieren und gleichzeitig mehr Kontrolle über wichtige digitale Plattformen übernehmen können.

Singer sagt, dass bis 2022 klar wurde, dass die größere Bedrohung für das Land nicht die Tech -Industrie, sondern die wirtschaftliche Stagnation war. “Diese wirtschaftliche Stagnationsgeschichte und der Versuch, sie umzukehren, hat in den letzten 18 Monaten wirklich so viel Politik geprägt”, sagt Singer. China bewegt sich schnell in die hochmoderne Technologie mit mindestens 13 Stadtregierungen und 10 staatlichen Energieunternehmen Berichten zufolge Bereits Deepseek -Modelle in ihre Systeme eingesetzt.

Technische Innovation

Das Modell von Alibaba stellt eine Fortsetzung bestehender Trends dar: In den letzten Jahren haben die KI -Systeme die Leistung durchweg zugenommen und gleichzeitig billiger zu betreiben. Gemeinnützige Forschungsorganisation Epoch AI Schätzungen Dass die Menge an Rechenleistung zum Training von KI -Systemen verwendet wurde, ist jedes Jahr um mehr als 4x zugenommen, und dank regelmäßiger Verbesserungen des Algorithmusdesigns wird die Rechenleistung jedes Jahr dreimal effizienter eingesetzt. Anders ausgedrückt, könnte ein System, das beispielsweise im vergangenen Jahr 10.000 fortschrittliche Computerchips zum Training benötigt, mit nur einem Drittel in diesem Jahr geschult werden.

Trotz Effizienzverbesserungen warnt Singer davor, dass High-End-Computerchips für die fortschrittliche KI-Entwicklung von entscheidender Bedeutung sind-eine Realität, die uns die Exportkontrolle auf diese Chips zu einer anhaltenden Herausforderung für chinesische KI-Unternehmen wie Alibaba und Deepseek macht, deren CEO es hat zitiert Zugang zu Chips anstelle von Geld oder Talent als größter Engpass.

QWQ (ausgesprochen wie Quill) ist die neueste, die sich einer neuen Generation von Systemen anschließt, die als „Argumentationsmodelle“ in Rechnung gestellt werden, die einige als ein neues Paradigma in AI darstellen. Zuvor wurden KI -Systeme besser, indem sie sowohl die Menge an Rechenleistung als auch die Menge und Qualität der Daten, auf die sie geschult wurden, skalierten. In diesem neuen Paradigma liegt der Schwerpunkt darauf, ein bereits geschultes Modell zu nehmen-in diesem Fall Qwen 2.5-32b-und die Berechnung des Systems, das das System verwendet, um auf eine bestimmte Abfrage zu reagieren. Als Qwen -Team schreibt”Wenn Sie Zeit haben, nachzudenken, zu befragen und zu reflektieren, blühen das Modell des Modells für Mathematik und Programmierblüten wie eine Blume, die sich der Sonne öffnet.” Dies steht im Einklang mit Trends, die mit westlichen Modellen beobachtet werden und bei denen Techniken, die es ihnen ermöglichen, länger zu denken, zu signifikanten Verbesserungen der Leistung bei komplexen analytischen Problemen führte.

Alibabas QWQ wurde „offenes Gewicht“ veröffentlicht, was bedeutet, dass die Gewichte, die das Modell bilden-in Form einer Computerdatei zugänglich-heruntergeladen und lokal ausgeführt werden können, auch auf einem High-End-Laptop. Interessanterweise lenkte eine Vorschau des im November veröffentlichten Vorschau des Modells erheblich weniger Aufmerksamkeit. Sänger merkt an, dass „der Aktienmarkt im Allgemeinen auf Modellfreisetzungen und nicht auf die Flugbahn der Technologie reagiert“, was sich voraussichtlich auf beiden Seiten des Pazifiks weiter verbessert. “Das chinesische Ökosystem enthält eine Reihe von Spielern, die alle Modelle herausstellen, die sehr mächtig und überzeugend sind, und es ist nicht klar, wer auftauchen wird, wenn alles gesagt und getan ist, um das beste Modell zu haben”, sagt er.



Source link