AI, een briljante nerd-zusje?
Bij het updaten van mijn website wilde ik ook de afbeeldingen vernieuwen bij de verschillende blogs. De bestaande illustraties waren van verschillende kwaliteit, formaat en stijl. Belangrijker nog is dat de foto’s online zijn gevonden en dat er mogelijk sprake zou kunnen zijn van auteursrechtelijke problemen. Ik dacht de meeste van deze problemen op te lossen door afbeeldingen te genereren met DALL-E (onderdeel van ChatGPT 4). En dat werkte ook, meestal.
Het ziet er goed uit. Of niet?
Sommige onderwerpen zijn gemakkelijk voor mijn nieuwe AI-vriendin, DALL-E. Toen ik om een foto vroeg die illustreerde dat ‘Tijd = Geld’ of ‘Appels met peren vergelijken’, had ik geen klachten over het resultaat. Ook het ‘Baby on Board Sign’ was eenvoudig; Ik kon zelfs beslissen aan welke kant van het glas ik het bord wilde hebben. ‘Als je een hamer hebt, lijkt elk probleem op een spijker’ was blijkbaar een bekend concept, al zal het perspectief geen enkele tekenleraar overtuigen. Ik was erg onder de indruk toen ze ‘Nieuwsgierigheid’ vastlegde als een emotie op het gezicht van een kleine jongen, hoewel het jochie naar niets interessants keek. Het veranderen van geslacht of leeftijd was ook gemakkelijk. Opnieuw indrukwekkend!
Maar dan wordt het raar
DALL-E lijkt te worstelen met spelling. Telkens wanneer ik haar vroeg een woord of zin op een gereedschapskist, een T-shirt of een verkeersbord te zetten, had ze het negen van de tien keer fout. Wanneer ik opnieuw om dezelfde foto vroeg, maar dan met de juiste spelling, deed ze het meestal beter, maar zelden perfect. Om die reden zul je in mijn blogs vrijwel geen afbeeldingen met tekst tegenkomen. Ik had geen tijd om haar leren spellen.
Soms waren de resultaten ronduit raar. De ijsvogels zien er goed uit, alhoewel hun anatomie enigszins verwarrend is in de details. En de vis die uit het water springt, vertoont veel te veel gelijkenis met zijn belagers. Nog alarmerender zijn de handen. ‘Sourcing voor een betere wereld?’ is bijna perfect, maar elf vingers? Bij ‘Compliance en integriteit’ draait het in het plaatje om de handen, en dus zijn de zes vingers eigenlijk niet acceptabel. Als illustratie van de ‘Lift etiquette’ is de gegenereerde afbeelding voldoende liftig, maar je moet er geen tweede blik op werpen, want het is ook behoorlijk raar.
Geweldig, maar niet perfect
Ik begon deze hele onderneming door een blog te uploaden en daarbij om een illustratie te vragen. Ik zal je de resultaten besparen, maar het is veilig om te zeggen dat OpenAI op dat gebied nog wat werk te doen heeft. Tegelijkertijd zou ik, zelfs als mijn leven ervan afhing, geen plaatjes kunnen maken met een kwaliteit die zelfs maar in de buurt komt van wat ik uiteindelijk kreeg. Ik ben onder de indruk van bijna alle resultaten. Zelfs degenen die die ik uiteindelijk niet gebruikt heb en die werden vervangen door verbeterde versies, waren een goed startpunt. Een aantal iteraties met meer gerichte instructies leverde vaak duidelijke verbetering op.
Tegelijkertijd is het een beetje alsof je je huiswerk laat doen door je briljante nerd-zusje. Lees het aandachtig door voordat je het als eigen werk inlevert. Je kunt serieus in de problemen komen als je de uitkomsten niet zeer gedetailleerd nakijkt. Onderaan het scherm waarschuwt OpenAI dat ‘ChatGPT fouten kan maken. Overweeg om belangrijke informatie te controleren.’ Zelfs als er indrukwekkende resultaten worden geboekt, is die waarschuwing nog steeds zeer relevant.