Are OpenAI prejudecăți? Am verificat noi pentru tine

Imagine realizată de Global Voices cu OpenAI

Ambele tehnologii populare lansate recent de cei de la OpenAI, ChatGPT și DALL-E2, au atras multă atenție din partea mass-media și a utilizatorilor de platforme sociale. Există discuții în acest moment în domeniul drepturilor digitale, tehnologic și jurnalistic despre ce pot face aceste tehnologii,  despre ce locuri de muncă ar putea înlocui, despre cum trebuie abordate problemele legate de drepturi de autor și despre felul în care acestea ar putea amplifica prejudecățile existente.

Global Voices a experimentat cu DALL-E2, un program de inteligență artificială care generează imagini [pe baza unei descrieri text – n.tr.], pentru a observa ce ilustrații generează pornind de la utilizarea de limbi diferite. Am scris aceeași propoziție în nouă limbi: „Pictură în ulei a umbrei unei femei care suferă la fereastră”.

Iată rezultatele:

Engleză: Oil painting of a shadow of a grieving woman at the window.

Imagine realizată de Global Voices cu OpenAI

Spaniolă: Pintura al óleo de la sombra de una mujer en duelo ante la ventana.

Imagine realizată de Global Voices cu OpenAI

Cehă: Olejomalba stínu truchlící ženy u okna.

Imagine realizată de Global Voices cu OpenAI

Rusă: Картина маслом силуэт скорбящей женщины у окна.

Imagine realizată de Global Voices cu OpenAI

Indoneziană: Lukisan cat minyak bayangan seorang janda perempuan yang sedang berduka di samping jendela.

Imagine realizată de Global Voices cu OpenAI

Chineză simplificată: 窗边悲痛女人的影子油画.

Imagine realizată de Global Voices cu OpenAI

Kazahă: Терезедегі қайғылы әйелдің көлеңкесінің майлы бояу суретi.

Imagine realizată de Global Voices cu OpenAI

Uzbecă: Deraza oldida qayg'u chekayotgan ayol soyasining moyli rasmi.

Imagine realizată de Global Voices cu OpenAI

Limba malayalam: ജനാലയ്ക്കരികിൽ ദുഃഖിക്കുന്ന ഒരു സ്ത്രീയുടെ നിഴലിന്റെ ഓയിൽ പെയിന്റിംഗ്

Imagine realizată de Global Voices cu OpenAI

După cum se poate observa, unele dintre aceste imagini sunt destul de diferite față de ceea ce am cerut inițial. Acest lucru poate fi cauzat de o insuficiență a datelor în acele limbi. Inventatorii lui DALL-E explică într-un interviu pentru Tech Crunch că modelul se bazează pe o rețea neuronală numită CLIP (Contrastive Language-Image Pre-training). CLIP a fost pregătit cu ajutorul a 400 de milioane de perechi de imagini care aveau descrieri text preluate de pe internet. Iată ce spun cei de la OpenAI pe site-ul lor:

GPT-3 showed that language can be used to instruct a large neural network to perform a variety of text generation tasks. Image GPT showed that the same type of neural network can also be used to generate images with high fidelity. We extend these findings to show that manipulating visual concepts through language is now within reach.

GPT-3 a demonstrat că limbajul poate fi folosit pentru a instrui o rețea neuronală mare să îndeplinească sarcini variate de generare a unui text.  GPT pentru crearea de imagini demonstrează că același tip de rețea neuronală poate fi folosită și pentru a genera imagini de înaltă fidelitate. Extindem aceste rezultate pentru a arăta că manipularea vizuală a conceptelor cu ajutorul limbajului este acum posibilă.

„Trăim într-o lume vizuală”, spune Ilya Sutskever, cercetător șef la OpenAI, într-un interviu pentru MIT Technological Review:

In the long run, you’re going to have models which understand both text and images. AI will be able to understand language better because it can see what words and sentences mean.

În cele din urmă, vom avea modele care înțeleg atât text, cât și imagini. Inteligența artificială va putea înțelege limbajul mai bine pentru că poate vedea [în imagini – n.tr.] ce înseamnă cuvintele și propozițiile.

Din moment ce diverse limbi au produs rezultate atât de diferite, se pare că web scraping-ul (o modalitate de automatizare a extragerii informațiilor de pe internet – n.tr.) pe baza căruia funcționează modelul a folosit limbi de o circulație mai largă, precum engleza sau spaniola, dar nu și limbi mai puțin cunoscute.

Așadar, multe fotografii de pe internet care au o descriere în uzbecă sau malayalam nu au fost prezente în setul original de informații cu ajutorul căruia a fost pregătit programul de inteligență artificială. Dacă există intenția ca modelul să lucreze cu mai multe limbi, este nevoie ca acesta să fie pregătit mai mult cu imagini care au descrieri în alte limbi în afară de engleză. Altfel, utilizatorii din Kazahstan vor primi în continuare imagini cu mâncare, în loc de imagini cu o femeie, iar cei care vorbesc malayalam vor primi imagini cu natură. Imaginile bazate pe textul în rusă sunt în mod clar provocatoare. Imaginile bazate pe indoneziană înfățișează mai multe fete șezând, iar cele bazate pe cehă iau primul loc la originalitate, datorită unui borcan cu ulei care fură privirile. Imaginile bazate pe chineza simplificată sunt de-a dreptul înfricoșătoare.

Bineînțeles că nu putem spune, bazându-ne pe aceste rezultate, că OpenAI este rasist. Ceea ce putem observa aici este faptul că nu a primit suficiente informații în alte limbi în afară de engleză. Nu avem de unde să știm dacă acest lucru va rămâne așa sau nu, dar recomandăm cu tărie să nu rămână așa.

Începe discuția

Autori, vă rugăm Deconectează-te »

Indicații

  • Toate comentariile sunt verificate de un moderator. Nu trimite comentariul de mai multe ori sau va fi perceput ca fiind spam.
  • Te rugăm să-i tratezi pe ceilalți cu respect. Comentariile care conțin mesaje de ură, sunt obscene sau reprezintă atacuri personale nu vor fi aprobate.