Der größte Teil des Fokus in der generativen KI lag auf textbasierten Schnittstellen, die zum Generieren von Text, Bildern und mehr verwendet wurden. Die nächste Welle scheint Stimme zu sein und rollt schnell ein. In der jüngsten Entwicklung gab Google heute an, dass es ab nächster Woche Chirp 3-seine Modelle für Sprach- und Text- und HD-Text-zu-Sprache-zu seiner Vertex-AI-Entwicklungsplattform hinzufügen würde.
Letzte Woche, Google kündigte leise an Dieser Chirp 3 würde 8 neue Stimmen für 31 Sprachen einführen. Zu den Anwendungsfällen für die Plattform gehören das Erstellen von Sprachassistenten, das Erstellen von Hörbüchern, die Entwicklung von Unterstützungsagenten und Sprachbekenntnissen für Videos. Die Nachrichten wurden bei einer Veranstaltung in den DeepMind Offices von Google in London bekannt gegeben.
Die Bemühungen kommen zur gleichen Zeit, dass auch andere mit ihrer Sprachki -Arbeit vorwärts springen. Letzte Woche kündigte Sesame – das Startup hinter den Virus, sehr realistisch klingenden AI -Apps „Maya“ und „Miles“ – die Einführung ihres Modells für Entwickler an, um ihre eigenen individuellen Apps und Dienste über die Technologie zu erstellen.
Insbesondere wird es in Chirp 3 Nutzungsbeschränkungen geben, um zu versuchen, Missbrauch in den Griff zu bekommen. “Wir arbeiten nur einige dieser Dinge mit unserem Sicherheitsteam durch”, sagte Thomas Kurian, CEO von Google Cloud, heute bei einer Nachrichtenereignis.
ElfLabs gehört zu den wichtigsten Startups, die erhoben haben Hunderte von Millionen in Finanzmitteln Um ihre Arbeit in KI -Sprachdiensten zu erweitern.
Die Nachrichten bringen Chirp 3 in den gleichen Stall wie Neuere Versionen seines Flaggschiffs LLM, Gemini, das werden sowie sein Bild-Generation-Modell getestet Bild und es ist teuer Veo 2 Videogenerierungswerkzeug.
Es bleibt zu bestätigen, ob das, was Google mit Chirp 3 veröffentlichen, genauso „realistisch“ sein wird wie einige der anderen KI -Bemühungen, „menschliche“ Stimmen zu erstellen (Sesams Arbeit fällt insbesondere auf). Aber wie Demis Hassabis, der CEO von DeepMind, betonte, bleibt dies ein Marathon, kein Sprint.
„Kurzfristig… diese Idee, dass (KI) eine Silberkugel für alles in den nächsten Jahren ist, sehe ich das noch nicht. Denken Sie, wir sind noch einige Jahre von so etwas wie Agi entfernt “, sagte er. „Es wird die Dinge ändern… im nächsten Jahrzehnt, also das Medium bis längerfristig. Es ist einer dieser interessanten Momente in der Zeit. “
Google startete die Vertex AI vorerst im Jahr 2021 Als Plattform für Entwickler, um maschinelles Lernen in der Cloud zu erstellen. Das war natürlich lange vor der Explosion des Interesses an KI und insbesondere der generativen KI mit dem Start der GPT -Dienste von OpenAI.
Seitdem lehnt sich das Unternehmen zum Teil wie es in die Scheitelpunktki spielt nachholen Zu andere Unternehmen Wie Microsoft und Amazon bauen sie auch generative KI -Tools für Entwickler auf. Neben der Erstellung generativer KI über Gemini können Entwickler die Scheitelpunkt -AI verwenden, um Daten zu klassifizieren, Modelle zu trainieren und Modelle für die Produktion einzurichten. Es wird interessant sein, ob es sich bewegt, um seinen ummauerten Garten auf Modelle zu erweitern, die über die von Google selbst erstellten hinausgehen.
Google erstellt seit Jahren „Chirp“ -Sprachdienste und kehrte wieder auf den Namen als Codename für seine frühen Bemühungen, gegen den Amazon -Alexa -Service zu konkurrieren.
Source link