Over Opus gesproken, Claude 3.5 Opus is nergens te bekennen, zoals Dat zei AI-onderzoeker Simon Willison in een interview tegen Ars Technica. „Alle verwijzingen naar 3.5 Opus zijn spoorloos verdwenen en de prijs van 3.5 Haiku werd verhoogd op de dag dat deze werd uitgebracht“, zei hij. „Claude 3.5 Haiku is aanzienlijk duurder dan beide Gemini 1.5 Flitser En GPT-4o mini—de uitstekende goedkope modellen van de concurrenten van Anthropic.“
Goedkoper na verloop van tijd?
Tot nu toe hanteren nieuwere versies van AI-taalmodellen in de AI-industrie doorgaans vergelijkbare of goedkopere prijzen als hun voorgangers. Het bedrijf had aanvankelijk aangegeven dat de Claude 3.5 Haiku hetzelfde zou kosten als de vorige versie, voordat het de hogere tarieven aankondigde.
„Ik verwachtte dat dit een volledige vervanging zou zijn voor hun bestaande Claude 3 Haiku-model, op dezelfde manier waarop de Claude 3.5 Sonnet de bestaande Claude 3 Sonnet overschaduwde met behoud van dezelfde prijs“, zegt Willison. schreef op zijn blog. “Gezien de bewering van Anthropic dat hun nieuwe Haiku beter presteert dan hun oudere Claude 3 Opus, is deze prijs niet teleurstellend, maar toch een kleine verrassing.”
Claude 3.5 Haiku arriveert met enkele compromissen. Hoewel het model langere tekstuitvoer produceert en recentere trainingsgegevens bevat, kan het geen afbeeldingen analyseren zoals zijn voorganger. Alex Albert, hoofd ontwikkelaarsrelaties bij Anthropic, schreef op X dat de eerdere versie, Claude 3 Haiku, beschikbaar zal blijven voor gebruikers die behoefte hebben aan beeldverwerkingsmogelijkheden en lagere kosten.
Het nieuwe model is nog niet beschikbaar in de Claude.ai-webinterface of -app. In plaats daarvan draait het op de API van Anthropic en platforms van derden, waaronder AWS Bedrock. Anthropic brengt het model op de markt voor taken als coderingssuggesties, gegevensextractie en -labeling en inhoudsmoderatie, hoewel het, net als elke LLM, gemakkelijk met vertrouwen dingen kan verzinnen.
„Is het goed genoeg om de extra uitgaven te rechtvaardigen? Het zal moeilijk zijn om daar achter te komen“, vertelde Willison aan Ars. „Teams met robuuste geautomatiseerde evaluaties van hun gebruiksscenario's zullen op een goede plek zijn om die vraag te beantwoorden, maar die blijven zeldzaam.“