Die Regierung startet Datenplattform für indische KI -Modelle, Beefs Up Shared GPU -Kapazität


Der Minister für Informationstechnologie, Ashwini Vaishnaw, sagte bei der Ankündigung der AI Kosha -Plattform, dass 14.000 GPUs für den gemeinsamen Zugang in Auftrag gegeben wurden, verglichen mit rund 10.000, als er Anfang dieses Jahres angekündigt wurde. Datei

Der Minister für Informationstechnologie, Ashwini Vaishnaw, sagte bei der Ankündigung der AI Kosha -Plattform, dass 14.000 GPUs für den gemeinsamen Zugang in Auftrag gegeben wurden, verglichen mit rund 10.000, als er Anfang dieses Jahres angekündigt wurde. Datei | Fotokredit: Ani

Die Regierung der Union am Donnerstag (6. März 2025) hat AI Kosha, eine Plattform mit Datensätzen, gestartet, die als Zuhause für nicht personenbezogene Daten angepriesen wird, die bei der Entwicklung künstlicher Intelligenzmodelle und -tools helfen werden. Zum Start enthält die Plattform 316 Datensätze, wobei der Großteil davon Programm zur Erstellung oder Validierung von Sprachübersetzungstools für indische Sprachen ist.

Die Indiaai Datasets-Plattform ist eine der sieben Säulen der Indiaai-Mission, der wichtigsten allgemeinen staatlichen KI-Bemühungen der Gewerkschaftsregierung. Die Mission hat einen Aufwand von 10.370 Mrd. GBP, und im vergangenen Monat kündigte das Zentrum an, dass Startups und Akademie im Rahmen seiner Rechenkapazitätsnäuer in der Lage sein würden, den gepoolten Zugriff auf Grafikverarbeitungseinheiten (GPUs) zu verwenden, die zum Training und Ausführen von KI -Modellen erforderlich sind.

Abgesehen von der Übersetzung enthalten die begrenzten Datensätze Einsendungen der Open -Dateninitiative von Telangana, wie z. B. Gesundheitsdaten, Zensusdaten 2011; Satellitenbilder, die von indischen Satelliten festgehalten wurden; Meteorologische und Verschmutzungsdaten usw.

Mehr GPUs

Der Minister für Informationstechnologie, Ashwini Vaishnaw, sagte bei der Ankündigung der AI Kosha -Plattform, dass 14.000 GPUs für den gemeinsamen Zugang in Auftrag gegeben wurden, verglichen mit rund 10.000, als er Anfang dieses Jahres angekündigt wurde. Weitere GPUs werden vierteljährlich hinzugefügt, sagte Vaishnaw.

Der Minister gab auch ein Update über die von der Regierung unterstützten Anstrengungen zur Schaffung eines einheimischen Grundlagenmodells, ein Ziel, das nach dem Erfolg von Deepseek, dem chinesischen Unternehmen, das ein solches Modell zu schulen und starten konnte, zu einem Bruchteil der Kosten, die amerikanische Firmen wie OpenAI und Google ausgeben mussten, dringend gewonnen hat. “Jetzt wird das Team tatsächlich mit der Bewertung dieser Anwendungen überschwemmt”, sagte Vaishnaw, was auf ein großes Interesse von Startups hinweist, um ein solches grundlegendes Modell für Indien zu erstellen.

Regierungsdatensätze

Dies ist nicht das erste Mal, dass die Gewerkschaftsregierung versucht hat, öffentliche Daten zu aggregieren, um andere Unternehmen zu nutzen, um sie zu nutzen. Die Open Governance Data Platform der Regierung (Daten.gov.in) beherbergt derzeit über 12.000 Datensätze, die von verschiedenen Regierungsbehörden in ganz Indien bereitgestellt werden. Die Regierung hat „Chief Data Officers“ in verschiedenen Ministerien und Abteilungen ausgewiesen und sie ermutigt, Datensätze bereitzustellen, die von Forschern, Unternehmen und anderen Teilen der Regierung verwendet werden können.

Im Jahr 2018 bildete die Regierung ein Komitee, um die Möglichkeit von überzeugenden Unternehmen zu untersuchen, um Startups und staatliche Zugang zu nicht persönlichen Daten wie Verkehrsdaten von Mitfahrgelegenheits-Apps zu gewähren, um neuen Teilnehmern zu helfen und die Politik der Regierung zu unterstützen. Das Komitee unter der Leitung von Kris Gopalakrishnan, Mitbegründer von Infosys, reichte seinen Bericht im Jahr 2020 ein. Die Vorschläge konfrontierten jedoch durch die Tech-Industrie, da private Akteure ihre Daten nicht mit anderen Parteien teilen konnten. Das Gespräch innerhalb der Regierung über nicht personenbezogene Daten von privaten Firmen fand weitgehend vor dem Aufkommen großer Sprachmodelle (LLMs) wie ChatGPT statt.



Source link