Sambanova trifft 198 Token pro Sekunde auf die volle, nicht destillierte Deek-R1 671b mit nur 16 SN40L RDU-Chips



  • Sambanova läuft Deepseek-R1 bei 198 Token/Sekunden mit 16 benutzerdefinierten Chips
  • Der SN40L RDU -Chip ist angeblich schneller 3x, 5x effizienter als GPUs
  • 5x Speed ​​Boost wird in Kürze versprochen, mit einer Kapazität von 100x bis zum Jahresende in der Cloud

Chinesische KI -Aufstart Deepseek hat Sehr schnell machte sich einen Namen Im Jahr 2025, das mit seinem großflächigen Open-Source-Sprachmodell R1 für fortschrittliche Argumentationsaufgaben erstellt wurde und die Leistung der Topmodelle der Branche entspricht und gleichzeitig kosteneffizienter ist.

Sambanova Systems, ein KI-Startup, das 2017 von Experten der Sun/Oracle und der Stanford University gegründet wurde, hat nun angekündigt, was sie behauptet, der weltweit schnellste Einsatz der bisherigen Deepseek-R1 671b LLM.



Source link