Episodi 67

TotGPT

27 de març 2023 · 00h 45min

Els creadors dels televisors 3D, el Metavers, les altcoins, la realitat virtual, els cotxes autònoms, o els NFTs — totes elles tecnologies buscant un cas d’ús que mai han trobat — et porten ara els models generatius. Han vingut per quedar-se o es tracta d’una tendència que caurà en l’oblit?

En una setmana plena de notícies, Microsoft ha anunciat Copilot, un assistent intel·ligent integrat de manera transversal en totes les seves eines de productivitat que promet fer-nos la vida més senzilla.
Per no quedar-se enrere, i com no podia ser d'una altra manera, Google també ha anunciat les seves incursions en l'espai intel·ligent de la mà de Bard, de manera que ja podríem dir que oficialment tothom té el seu.

Un divendres a la tarda per parlar del que tothom parla

Setmana sense convidat i gravació de divendres a la tarda, l'horari que a MarsBased deixa «el boli caigut». Un dels dos confessa que prefereix allargar un altre dia abans que treballar divendres a la tarda. És el preludi d'un episodi monogràfic sobre el que aquelles setmanes ho envaïa tot: ChatGPT, GPT-4, OpenAI, Bard i la pulsió de ficar intel·ligència artificial generativa fins «a les forquilles i als ganivets».

Ens faran treballar menys hores? La resposta és que no

Marc llança la pregunta clau —aquests models ens faran treballar menys?— i Àlex, tot i admetre que improvisa, ho té clar: no. La feina de marketing que ell porta a MarsBased en seria l'exemple: pot delegar tasques mecàniques a aquestes eines, però el backlog d'una empresa pròpia és «talment infinit», i cada procés que automatitzes només allibera temps que t'omples amb coses noves. Si es tragués de sobre l'edició del podcast de MarsBased, dedicaria aquelles hores a obrir nous fronts, no a descansar. Una vella promesa incomplerta, rebla: fa cent anys ja s'imaginava que la tecnologia ens alliberaria, i en comptes d'això «ens ha esclavitzat una mica més».

Tots dos coincideixen, això sí, que la IA no «treu» la feina sinó que la transforma: un dels dos, disculpant-se per ser tan «taxatiu», ho rebla amb el conductor de cavalls que es queda sense feina si no aprèn a conduir, però sense que la culpa sigui dels cotxes.

Els hiverns de la IA i per què aquest cop sembla diferent

Un dels dos repassa l'historial d'expectatives fallides per relativitzar el hype: el metaverse que no recorda «ni el seu inventor» (pobre Neal Stephenson), els NFTs, les altcoins que abans no tenir-ne era de babau i ara tenir-ne fa mala espina. Recorda que hi ha fins i tot un terme, l'AI Winter: l'IA general dels inicis, el Deep Blue d'IBM als escacs, l'AlphaGo de DeepMind —tots semblaven «la definitiva» i de cap se'n parla ja.

La pregunta és si vindrà un altre hivern. Àlex separa dues qüestions que la gent barreja: si això traurà feina, i si això és útil. Sobre la utilitat, creu que aquest cop va de debò perquè s'han trobat els casos d'ús i s'ha fet prou accessible perquè la gent normal el faci servir conscientment, a diferència de qui ja entrenava algoritmes sense saber-ho amb Google o TikTok.

Dues maneres de morir: sense cas d'ús o sense accessibilitat

Àlex proposa una graella per entendre què fracassa. D'una banda, tecnologia molt accessible però sense cas d'ús real —NFTs, DAOs, criptomonedes—: «tecnologia buscant una solució», inundada de marketers i hustlers que carreguen els projectes ben intencionats. De l'altra, tecnologia de molt valor però gens accessible, com la realitat virtual: caldria jugar amb «unes ulleres de mil dòlars» o un headset d'Oculus de tres mil, així que es queda en aigua estancada entre quatre friquis. La IA generativa, en canvi, hauria jugat bé el timing i hauria entrat de la mà d'empreses que donen confiança —NVIDIA, Microsoft, Adobe, Google, i tard o d'hora Apple—, combinant cas d'ús clar i barrera baixa: moltes eines tenen waitlist, però amb contactes hi entres en una setmana, i ChatGPT té versió gratuïta.

El cas Siri: dotze anys de l'oportunitat perduda

A Marc li fa gràcia que ara ho omplim tot d'IA quan el 2011 ja va aparèixer Siri —«dotze anys, que tecnològicament són disset mil·lennis»— i segueix igual de dolenta, però Apple la manté en comptes de matar el projecte. La teoria, mig en broma, és que sí que serveix: aquests assistents (Siri, Alexa, la Cortana de Microsoft) reben tants inputs que les empreses se'ls queden per a elles, sense treure millores substancials, fins a tenir alguna cosa revolucionària.

De fet, un dels dos aposta que la cursa dels assistents no la guanyarà cap dels tres actuals, sinó un producte nou derivat de tot aquell corpus entrenat —imagina un Microsoft que ressuscités «el clippy de tota la vida» com a orquestrador de GitHub Copilot i Office—, i es pregunta per què es prioritza l'assistent de text quan el futur immediat sembla la veu.

El plugin que ho posa tot a la sopa

Marc, fent de veu de producte, observa que no tot necessita un ChatGPT a dins, però que la febre és imparable. ChatGPT acaba de treure els plugins amb socis de pes —Expedia, Klarna, OpenTable, KAYAK, Instacart, Zapier, Wolfram Alpha—, i en convertir-ho en un plugin «drag and drop» de cop «fins i tot un Bullywug en té un»: sembla que facis el ruc si no n'hi poses. Aquí ve el seu pronòstic, on diu que vol estar equivocat: que d'aquí a dos mesos aquest format ja no el recordarem perquè alguna altra cosa li haurà passat la mà per la cara —com la generació d'imatges, que abans estava «a la sopa» i de cop no se'n sentia parlar enlloc.

Midjourney: feature o producte, i la barrera del Discord

L'altre matisa el pronòstic sobre les imatges: les noves versions de Midjourney (la 4 o la 5) ja resolen els dits i els caps desconnectats dels insectes, i el refinament és tal que retocant mínimament una imatge és «virtualment impossible» saber si és real o generada. Però potser Midjourney és més una feature que un producte: muntat sobre Discord, ningú no l'ha fet accessible —«la gent no sap què és Discord»—, i amb Stable Diffusion la barrera és més alta. De la conversa surt una crítica de fons a OpenAI: es ven com a oberta i és «de tot menys Open», no publica els models, i el consum elèctric d'entrenar amb les targetes H100 i A100 d'NVIDIA, a quinze milions cadascuna, hauria de fer pensar els qui blasmaven les criptos pel medi ambient.

Per què val la pena pagar i per què el tier gratuït és sagrat

Àlex defensa l'adopció amb números: ChatGPT Plus són vint dòlars al mes, i si ja paga trenta per Superhuman per al correu, per què no vint per una eina que li estalvia una hora transformant CSVs i que li permet deixar de pagar Grammarly. Tot i això, demana a OpenAI que no posi preus prohibitius ni capi l'accés, perquè en un estadi tan incipient és vital tenir com més gent millor ingerint dades: a Facebook ja li és igual tenir més usuaris, però aquestes eines encara perfeccionen l'algoritme amb cadascun. La recepta: un tier gratuït limitat i cobrar per velocitat i early access.

Equips virtuals i el programador molt més eficient

Apareixen els casos d'ús que entusiasmen. Amb els plugins, algú ha penjat un vídeo i ChatGPT li fa les transformacions —canviar còdecs, treure els primers segons, afegir música que no trepitgi la veu—, feines que abans demanaven comandes de Linux o Mac: «literalment estàs creant un equip virtual». Àlex hi suma dos exemples propis: és «absolutament negat» a Excel i mitja empresa li corre sobre fulls de càlcul, així que poder preguntar en llenguatge natural on ha gastat més els últims anys li estalvia hores; i com a programador que fa gairebé deu anys que no programa, encara veu prou l'error en el codi generat per corregir-lo en cinc minuts, i en fer el programador més eficient s'entrena l'algoritme perquè el dia de demà també hi arribi qui no programa.

L'art del bon prompt és l'art de delegar bé

El fil madura cap a una idea forta: delegar bé exigeix haver fet abans la feina tu mateix. Un dels dos explica que les coses que ha subcontractat li han anat bé perquè primer les feia ell i sabia què corregir; qui delega el blog o contracta agències de software només per estalviar cost, sense voluntat d'entendre, acaba donant instruccions inadequades i «li colen gols». Amb la IA passa igual: «si no fas la pregunta correcta, no rebràs la resposta correcta», i el bon prompting és donar context i rol, com formar algú de l'equip. Si no saps què és una desviació estàndard no la sabràs demanar; i els prompts dels «cunyats de l'IA» de Twitter porten dotze línies d'angular i distància focal que qui no sap fotografia no sabrà ni escriure. La conclusió és optimista: encara no hem vist les derivades de segon i tercer ordre, com qui veia l'iPhone sense preveure Uber.

La pregunta de tancament: la IA et farà la recerca?

L'episodi es tanca amb la broma habitual de la recerca. Es comenta que ChatGPT podria preparar llistes de temes o transcriure els episodis —amb una picada d'ullet a l'eina de transcripció de RSS.com—, i un dels dos diu que s'esforça cada dia a obrir ChatGPT per construir-ne l'hàbit i que faria servir Bard perquè va més ràpid, si no fos que encara no està disponible fora dels EUA. Sobre si la IA li farà la recerca, l'altre, fidel al «work smart, not work hard» i al principi de Pareto, admet que algun dia s'ho currarà, però que quan la fa a última hora va tan ràpid que no li donaria ni temps d'obrir ChatGPT.

Escolta l'episodi