- Google Whisk gebruikt afbeeldingen als invoer in plaats van op tekst gebaseerde aanwijzingen
- Het is gebouwd op het generatieve AI-model Imagen 3 van Google
- De experimentele tool is gratis uit te proberen voor gebruikers in de VS
Googlen’s nieuwe AI-tool maakt het eenvoudiger om uw visuele concepten te creëren en te remixen. In plaats van je te vragen te beschrijven wat je in gedachten hebt, kun je met Whisk drie beeldprompts invoeren: één voor onderwerp, één voor scène en één voor stijl. Whisk zorgt voor de rest, waardoor het een meer intuïtieve manier is om met verschillende ideeën te experimenteren.
Terwijl de meeste beste AI-beeldgeneratoren vereisen dat je een gedetailleerde prompt schrijft, Whisk regelt dat achter de schermen. Wanneer u ter inspiratie afbeeldingen in de webgebaseerde Whisk-interface plaatst, kan Google’s Tweeling model analyseert ze automatisch en schrijft voor elk een gedetailleerd bijschrift. Deze worden vervolgens in de Afbeelding 3 model, om een passend beeld te creëren.
U kunt bijvoorbeeld een afbeelding van een auto als onderwerp toevoegen en een foto van een landelijk landschap als scène. Je zou een aquarel als stijl kunnen toevoegen om te zien wat Whisk maakt. Druk op de knop en je krijgt een paar afbeeldingen op basis van je invoer.
Vanaf hier is het eenvoudig om de afbeeldingen te remixen. Met de interface kunt u aanvullende op tekst gebaseerde details opgeven om de resultaten aan te passen. Je kunt ook eenvoudig verschillende bronafbeeldingen toevoegen of met de dobbelsteen gooien als je inspiratie nodig hebt. Nieuwe resultaten verschijnen in paren in de feed, waardoor het een intuïtieve manier is om ideeën te bedenken. U kunt er ook voor kiezen om afbeeldingen te verfijnen door de tekstprompt weer te geven en meer details toe te voegen.
Klop het op
Hoewel Whisk is ontworpen om de noodzaak van op tekst gebaseerde aanwijzingen te elimineren, biedt Google de mogelijkheid om de schriftelijke aanwijzingen te verfijnen, omdat de resultaten niet altijd overeenkomen met het bronmateriaal.
In een blogpost Over de experimentele tool legt Google uit dat Whisk “de essentie van je onderwerp vastlegt, en niet een exacte replica.” Het is slechts zo effectief als Gemini’s analyse van de afbeeldingen die u indient. Hoewel dit over het algemeen erg indrukwekkend is, dringt het ook niet tot je door: je zou verwachten dat Whisk het ene detail uit een afbeelding haalt, waar het zich op een ander detail concentreert.
Het bericht legt verder uit: “Aangezien Whisk slechts een paar belangrijke kenmerken uit uw afbeelding haalt, kan het afbeeldingen opleveren die afwijken van uw verwachtingen. Het gegenereerde onderwerp kan bijvoorbeeld een andere lengte, gewicht, kapsel of huidskleur hebben. We begrijpen dat deze functies cruciaal kunnen zijn voor uw project en dat Whisk misschien de plank misslaat, dus laten we u de onderliggende aanwijzingen op elk gewenst moment bekijken en bewerken.
Zelfs met deze tekortkomingen is Whisk een interessante toepassing van de bestaande AI-tools van Google. De onderliggende generatieve modellen zijn hetzelfde alsof je met Gemini zou chatten via de tekstinterface. Door te vertrouwen op beeldinvoer is Whisk echter een meer toegankelijke en intuïtieve manier voor visuele makers om met hun ideeën te spelen.
Op basis van vroege feedback van digitale creatieven noemt Google Whisk “een nieuw type creatieve tool” die bedoeld is voor “snelle visuele verkenning, niet voor pixel-perfecte bewerkingen.”
Hoe Google Whisk te proberen
Google Whisk is momenteel alleen beschikbaar voor gebruikers in de VS. Als u daar gevestigd bent, kunt u het uitproberen via uw webbrowser op labs.google/whisk.
De experimentele tool is volledig gratis om mee te spelen. Gegevens uit uw ervaring met Whisk worden teruggekoppeld naar Google om toekomstige AI-producten te helpen verfijnen en ontwikkelen.