Deepseek ist viral geworden.
Das chinesische AI Lab Deepseek brach diese Woche in das Mainstream -Bewusstsein ein Die Chatbot -App stieg ganz oben in den Apple App Store -Charts (und Google Play auch). Deepseeks KI-Modelle, die mit recheneffizienten Techniken trainiert wurden, haben Wall Street Analysten geführt – und Technologen – zu fragen, ob die USA ihre Führung im KI -Rennen aufrechterhalten können und ob die Nachfrage nach KI -Chips aufrechterhalten wird.
Aber woher kam Deepseek und wie ist es so schnell zu internationalem Ruhm geworden?
Deepseeks Trader -Ursprünge
Deepseek wird von High-Flyer Capital Management unterstützt, einem chinesischen quantitativen Hedgefonds, der KI verwendet, um seine Handelsentscheidungen zu informieren.
KI -Enthusiast Liang Wenfeng Mitbegründung von High-Flyer im Jahr 2015. Wenfeng, der Berichten zufolge als Student an der Zhejiang University mit dem Handel mit dem Handel gestoßen war, startete 2019 einen Hedgefonds, der sich auf die Entwicklung und Bereitstellung von AI-Algorithmen konzentrierte.
Im Jahr 2023 startete High-Flyer Deepseek als Labor für die Erforschung von KI-Tools, die von seinem Finanzgeschäft getrennt sind. Mit High-Flyer als einer seiner Investoren wurde das Labor in seine eigene Firma, auch Deepseek genannt.
Vom ersten Tag an baute Deepseek seine eigenen Rechenzentrumscluster für das Modelltraining. Aber wie andere KI -Unternehmen in China, Deepseek wurde von US -Exportverboten auf Hardware betroffen. Um eines seiner neueren Modelle auszubilden, musste das Unternehmen NVIDIA H800-Chips verwenden, eine weniger Kraft eines Chips, dem H100, der US-Unternehmen zur Verfügung steht.
Das technische Team von Deepseek soll jung sein. Die Firma Berichten zufolge aggressiv Rekruten Doktoranden -KI -Forscher von Top chinesischen Universitäten. Deepseek stellt auch Menschen ohne Informatik -Hintergrund ein Um seiner Technologie zu helfen, eine breite Palette von Themen besser zu verstehen, gemäß der New York Times.
Deepseeks starke Modelle
Deepseek stellte im November 2023 seine erste Modelle vor-Deepseek Codierer, Deepseek LLM und Deepseek Chat. begann zu bemerken.
Deepseek-V2, ein allgemeines text- und bildanalysierendes System, hat in verschiedenen KI-Benchmarks eine gute Leistung erzielt-und war zu dieser Zeit weitaus billiger als vergleichbare Modelle. Es zwang Deepseeks Inlandswettbewerb, einschließlich Bytedance und Alibaba, dazu, die Nutzungspreise für einige ihrer Modelle zu senken und andere völlig frei zu machen.
Deepseek-V3im Dezember 2024 gestartet und nur zu Deepseeks Bekanntheit beigetragen.
Laut dem internen Benchmark -Test von Deepseek übertrifft Deepseek V3 beide herunterladbare, offen verfügbare Modelle wie Meta’s Lama und „geschlossene“ Modelle, auf die nur durch eine API zugegriffen werden kann, wie OpenAIs Gpt-4o.
Ebenso beeindruckend ist Deepseeks R1 -Argumentationsmodell. Deepseek wurde im Januar veröffentlicht und behauptet R1 führt ebenso wie das O1 -Modell von OpenAI auf wichtigen Benchmarks durch.
Als Argumentationsmodell überprüft R1 sich die Fakten selbst, was es dazu beiträgt, einige der Fallstricke zu vermeiden, die normalerweise Modelle stolpern. Die Argumentationsmodelle dauern etwas länger-normalerweise Sekunden bis Minuten länger-, um zu Lösungen zu gelangen, im Vergleich zu einem typischen Nicht-Begrenzungsmodell. Der Vorteil ist, dass sie in Bereichen wie Physik, Naturwissenschaften und Mathematik tendenziell zuverlässiger sind.
Es gibt jedoch einen Nachteil von R1, Deepseek V3 und Deepseeks anderen Modellen. Als Chinesisch-entwickelte KI sind sie unterworfen Benchmarking durch Chinas Internetregulierungsbehörde, um sicherzustellen, dass seine Antworten „kernkern sozialistische Werte verkörpern“. In Deepseeks Chatbot -App wird beispielsweise R1 keine Fragen zum Tiananmen Square oder Taiwans Autonomie beantworten.
Ein disruptiver Ansatz
Wenn Deepseek ein Geschäftsmodell hat, ist nicht klar, was dieses Modell genau ist. Das Unternehmen bewertet seine Produkte und Dienstleistungen weit unter dem Marktwert – und verschenkt andere kostenlos.
Die Art und Weise, wie Deepseek es sagt, haben die Durchbrüche der Effizienz ermöglicht, extreme Kostenwettkämpfe aufrechtzuerhalten. Einige Experten Disput Die Zahlen des Unternehmens haben jedoch geliefert.
Was auch immer der Fall sein mag, Entwickler haben sich in Deepseeks Modelle begeben, die nicht Open Source sind, da der Ausdruck allgemein verstanden wird, aber unter zulässigen Lizenzen verfügbar ist, die eine kommerzielle Nutzung ermöglichen. Laut Clem Delangue, dem CEO von Sugging Face, einer der Plattformen, auf denen Deepseeks Modelle veranstaltet werden, veranstaltet sie. Entwickler auf dem Umarmungsgesicht haben über 500 „Derivat“ -Modelle von R1 erstellt Das haben 2,5 Millionen Downloads zusammengegeben.
Deepseeks Erfolg mit größeren und etablierteren Konkurrenten war beschrieben als “aufstrebende KI” Und “Überdropfen.” Der Erfolg des Unternehmens war zumindest teilweise verantwortlich für Der Aktienkurs von Nvidia sank am Montag um 18% um 18%und für eine öffentliche Antwort auslösen vom OpenAI -CEO Sam Altman.
Microsoft kündigte an, dass Deepseek für seinen Azure AI Foundry -Service erhältlich istMicrosoft -Plattform, die KI -Dienste für Unternehmen im Rahmen eines einzelnen Banners zusammenbringt. Als CEO Mark Zuckerberg nach Deepseeks Auswirkungen auf die KI-Ausgaben von META während seines Ertrags im ersten Quartal gefragt wurde, sagte CEO Mark Zuckerberg Die Ausgaben für die KI -Infrastruktur werden weiterhin ein „strategischer Vorteil“ sein für Meta.
Gleichzeitig, Einige Unternehmen verbieten Deepseekund so sind es ganz Länder Und Regierungen. New York State auch Deepseek verboten, auf Regierungsgeräten eingesetzt zu werden.
Was Deepseeks Zukunft betrifft, ist es nicht klar. Verbesserte Modelle sind selbstverständlich. Aber die US -Regierung scheint zu sein Wachstum vorsichtig mit dem, was es als schädlichen fremden Einfluss wahrnimmt.
TechCrunch hat einen AI-ausgerichteten Newsletter! Melden Sie sich hier an Um es jeden Mittwoch in Ihren Posteingang zu bekommen.
Diese Geschichte wurde ursprünglich am 28. Januar 2025 veröffentlicht und wird kontinuierlich mit weiteren Informationen aktualisiert.
Source link