Microsoft lanceert Phi-4, een nieuw generatief AI-model, in onderzoekspreview


Microsoft heeft de nieuwste toevoeging aan zijn Phi-familie van generatieve AI-modellen aangekondigd.

Het model heet Phi-4 en is op verschillende gebieden verbeterd ten opzichte van zijn voorgangers, beweert Microsoft, met name op het gebied van het oplossen van wiskundige problemen. Dat is deels het gevolg van de verbeterde kwaliteit van trainingsgegevens.

Phi-4 is vanaf donderdagavond in zeer beperkte mate beschikbaar: alleen op de onlangs gelanceerde versie van Microsoft Azure AI-gieterij ontwikkelingsplatform, en alleen voor onderzoeksdoeleinden onder een Microsoft Research-licentieovereenkomst.

Dit is het nieuwste kleine taalmodel van Microsoft, met een omvang van 14 miljard parameters, en het concurreert met andere kleine modellen zoals GPT-4o mini, Gemini 2.0 Flash en Claude 3.5 Haiku. Deze AI-modellen zijn vaak sneller en goedkoper in gebruik, maar de prestaties van kleine taalmodellen zijn de afgelopen jaren geleidelijk toegenomen.

In dit geval schrijft Microsoft de prestatiesprong van Phi-4 toe aan het gebruik van “synthetische datasets van hoge kwaliteit”, naast hoogwaardige datasets met door mensen gegenereerde inhoud en enkele niet-gespecificeerde verbeteringen na de training.

Veel AI-laboratoria kijken tegenwoordig nauwkeuriger naar innovaties die ze kunnen maken op het gebied van synthetische data en post-training. Dat zegt CEO van Scale AI, Alexandr Wang in een tweet donderdag dat “we een datamuur vóór de training hebben bereikt”, wat bevestigt meerdere rapporten over dit onderwerp de afgelopen weken.

De Phi-4 is met name het eerste model uit de Phi-serie dat wordt gelanceerd na het vertrek van Sébastien Bubeck. Voorheen een AI VP bij Microsoft en een sleutelfiguur in de Phi-modelontwikkeling van het bedrijf, Bubeck links Microsoft sluit zich in oktober aan bij OpenAI.



Source link