Episodi 44

La mètrica de l'originalitat — part I

24 d'octubre 2022 · 00h 31min

El que havia de ser una conversa sobre la generació d'imatges amb intel·ligència artificial, acaba en un (llarg) debat sobre l'especialització humana, l'efímera societat en què vivim, i les feines del demà.

Si resulta que precisament avui vens de l'hort i no has sentit res sobre aquest tema, pots començar per aquí — ben segur esdevindrà el teu nou passatemps de la setmana.
Quan parlem de la volatilitat i aquesta societat líquida ens referim a com Internet crea cicles de valor i tendències de les quals avui tothom en parla, però demà ningú recorda.
No sabem si la generació d'imatges amb intel·ligència artificial ens deixarà sense feina, però en tal cas, sempre podem optar per reciclar-nos com a dissenyadors de miniatures per vídeos de xarxes socials.

Una setmana sense convidat i una addicció nova: Midjourney

Episodi sense convidat que arrenca amb la confessió d'una addicció. L'Àlex obre amb la boca plena de la seva dèria de sempre, la xocolata, però el vici nou el porta Marc: ficar-se a Midjourney a generar imatges de cotxes històrics i clàssics (ell és, de fet, el fan dels cotxes). Li demanes un Ford GT40 barroc amb els colors de Repsol o un Lamborghini Miura amb un toro pintat al capó a l'estil de Da Vinci, i l'eina t'ho escup. De passada deixa anar una altra dèria: Discord, que com a millennial feia servir com un Slack de color lila fins que va entendre que en realitat és una plataforma per construir-hi el que vulguis a sobre.

De Midjourney li agrada que et fica en un servidor amb gent d'altres països que en saben més que tu: veus els seus prompts i n'aprens. Però hi ha el cantó fosc, que tots dos comparen obertament amb el gambling: et regalen crèdits gratis perquè t'enganxis, fas proves dolentes, i quan vols la imatge bona en alta resolució te'ls has cremat tots. «La següent serà la bona», penses, com qui seu davant d'una màquina de Cirsa.

Per què un prompt no funciona com una cerca a Google

La conversa entra de seguida en el funcionament del prompt —la descripció a partir de la qual la IA genera la imatge. El més contraintuitiu: ser més específic no et dona necessàriament un millor resultat. Posar «Donald Trump assegut sol al despatx oval bevent una Diet Coke amb un fons postapocalíptic i explosions nuclears» no millora forçosament un simple «Donald Trump sentint-se sol».

És el contrari del SEO, on com més concreta és la cerca, millor trobes el que vols (l'exemple que fan servir: buscar «la regla del gol d'or del Mundial del 98» en comptes de «reglament esportiu»). Amb la generació d'imatges la lògica s'inverteix, i això és justament una de les coses que costa més d'interioritzar.

Quan deixarà de ser «intel·ligència artificial»

Apareix una idea que travessa tot l'episodi: un cop una tecnologia funciona, deixa de semblar màgia i la donem per descomptada. El que fa quatre dies ens explotava el cap, al cap de poc ja ens avorreix i ho tractem com una comoditat més. El hype de la generació d'imatges, avisen, podria seguir el mateix camí.

També es planteja la por evident: que això eclipsi la feina de dissenyadors gràfics i bancs d'imatges. La conclusió és que és inevitable i que passarà, però que la història de la tecnologia sol anar acompanyada de noves professions a la cresta de l'onada.

Thumbnail engineering i l'economia de l'especificitat

Marc treu un exemple d'aquestes feines noves: el thumbnail engineering, és a dir, la persona que dissenya les miniatures dels vídeos de YouTube perquè la gent hi cliqui, avui molt ben pagada i molt demandada. Hi suma l'artwork de pòdcast —recorda haver-ne buscat per al seu pòdcast sobre Mercedes a Upwork i Fiverr— i fins i tot gent especialitzada a gravar intros de pòdcast. La idea: l'especificitat de vegades també es recompensa, i sovint és la porta d'entrada per acabar fent més coses per al mateix client.

Generalistes contra especialistes (i les formigues)

D'aquí surt el debat central de la part I. Un dels dos recupera la màxima de l'altre —«l'especialització és per a les formigues»— per discutir-la: si hagués de donar un consell a un fill, li diria que en la vida hi ha dues vies, els generalistes que esdevenen problem solvers i emprenedors i s'han de buscar la vida, i els especialistes, que no els faltarà mai la feina perquè seran molt bons en una cosa molt concreta.

La rèplica matisa: tot especialista és un generalista reconvertit. Ningú es fa especialista en generació d'imatges del no-res; abans ha estat el típic que va comprar unes Google Glass, després un Oculus, després va passar per les criptos i els NFTs, fins que troba el nínxol on el retorn de la inversió és més alt i s'hi llança. La tàctica que es proposa, manllevada del món de les vendes, és la de la granada de fragmentació: quan comences a vendre per a una empresa, proves tots els canals —inbound, outbound, molts països— i convergeixes només allà on la metralla toca i dona retorn, deixant morir la resta.

La gent que es recicla amb cada moda

El retrat és afilat: tota la munió de gent que fa dos dies tenia per avatar un mico amb els ulls brillants a Twitter, fa quatre un punt d'Ethereum i fa vuit blockchain. Són generalistes purs del màrqueting que no arriben en profunditat enlloc —coneixen el bàsic de blockchain, de machine learning, de criptos— però que un bon dia troben un nínxol on especialitzar-se. La lectura de fons és la liquiditat i l'efimeralitat de la societat actual: les modes exploten i s'obliden en qüestió de mesos o setmanes.

Per què els NFTs i les criptos van petar

La conversa fa balanç de la bombolla anterior. La tesi: amb els NFTs hi va haver una correcció de mercat perquè va entrar massa gent, massa poc preparada, massa aviat, sobre un terreny poc fèrtil que no abastava tothom —amb el símil de l'escena de Titanic on, diuen, en realitat sí que hi cabien tots dos a la fusta. Es distingeix entre les shitcoins, mortes com qualsevol moda, i Bitcoin i Ethereum, que han sobreviscut perquè són les que més temps han madurat a nivell de producte i tecnologia.

El paral·lelisme és el de sempre: les empreses de patinets que entre 2014 i 2016 omplien Barcelona —deu o dotze en un mateix dia— i de les quals avui amb prou feines en queda una. Explosió, massa actors, i consolidació de mercat. La diferència, segons un dels dos, és que els models de monetització de la IA generativa semblen més sòlids, i per això s'hi creu un valor real que no veia en el blockchain.

El fotògraf de bodes i el valor 10x

Per il·lustrar la disrupció es recorre al pòdcast My First Million i al cas dels fotògrafs de bodes. Avui cada fotògraf té un valor alt com a individu, però tots acaben valent una cosa semblant. Què passa quan apareix una tecnologia que et genera les fotos de la teva boda sense haver de fer la boda, sense contractar ningú i sense esperar fins al maig vinent, per trenta euros i de manera instantània? Arribes al «10x»: deu vegades més valor en preu, velocitat i execució, eliminant l'intermediari.

Les feines, conclouen, no desapareixen sense més: pugen de rang. Sortiran el creador de prompts, l'entrenador de corpus, el corrector, i fins i tot eines com la que Microsoft va presentar per detectar si una cosa està feta amb IA —«feta la llei, feta la trampa»—, perquè hi haurà valor a distingir què és orgànic i què és generat, sobretot per evitar que un vídeo fals desencadeni una crisi.

L'educació com el gran punt cec

El to es torna més preocupat. Si abans calien mil·lennis per deixar bocabadat algú vingut del passat, ara potser només calen setmanes. El neguit: com expliques a les noves generacions que un contingut no és real quan hi neixen i hi naveguen des de petits? Es lamenta que als temaris de les escoles no s'hi vegi res d'això; el debat dels bootcamps sobre si la universitat ensenya o no a programar és menor al costat de com s'educa socialment davant la desinformació i la polarització, quan Google o YouTube ja t'ensenyen només el que vols veure.

La paradoxa de Moravec i la mètrica de l'originalitat

I aquí arriba el nus que dona títol a l'episodi i la nota d'esperança. La IA converteix tot en un problema matemàtic, i en això és boníssima. Es recorda la dita del sector, la paradoxa de Moravec: a una IA li és més fàcil aprendre matemàtiques que caminar, al revés que a una criatura, que entén caminar als dos anys però les mates no les domina ni als vuitanta.

Per això AlphaGo millora: té una mètrica clara sobre la qual optimitzar, jugades mesurables, un 63 que és més que un 32. Però com li dones a una IA la mètrica de l'originalitat o de la creativitat? No pots: en última instància ha de ser un humà qui digui «això és bo i això és dolent». Aquí està l'esperança amb què tanca la primera part —que potser podem ensenyar la màquina a fer coses en què nosaltres sempre serem millors que ella—, tot i admetre que no n'estan del tot segurs.

Escolta l'episodi