Episodi 238

Superagent Llados

· 00h 53min

Estàvem buscant els catedràtics de la IA agèntica que, suposadament, gestionen dotzenes d’agents treballant dia i nit, de manera simultània, per fer créixer negocis bilionaris sense treballadors, que no requereixen més inversió que un Mac mini connectat a una casa de Bali.

D'aquests no n’hem trobat cap. Però almenys t’expliquem com nosaltres utilitzem Claude per a les nostres tasques rutinàries i fer-nos més productius.

L'autenticació bancària que semblava una estafa

Un dels amfitrions obre l'episodi indignat amb la verificació de pagament més dura que ha vist mai. Comprant en línia al lloc de sempre, després del confirmador de l'app del banc (3D Secure, que agraeix) i d'un SMS, li apareix un repte digne d'un examen d'ESO: «sumi a un número de sis dígits el resultat de sumar les posicions 2 i 4 del PIN de la seva targeta». Ni sap el PIN —sempre paga amb el mòbil— ni on és la targeta, així que ha hagut de baixar a l'oficina del banc per acabar una compra en línia. Era tan rebuscat que va pensar que la verificació mateixa era l'estafa. L'altre apunta que col·lecciona intents d'estafa «a nivell d'empresa» força enginyosos per a un futur episodi.

Hi ha hype amb els agents? El sufflé que comença a baixar

El cos de l'episodi arrenca amb una discrepància: un planteja que hi ha hype amb els agents d'IA i l'altre respon que «no és hype, és el millor que m'ha passat a la vida». De seguida, però, posen en quarantena la fauna que assegura tenir «50 agents treballant per mi mentre faig bíceps al gimnàs». El consell: divideix els claims per deu —si diuen 50 agents, en tenen 5; si diuen que treballen des del mòbil, hi dediquen una horeta dient-los què fer.

Marc, convertit en recepcionista de la IA

Marc es reconeix en part d'aquest col·lectiu: va amb el portàtil obert pertot, fins i tot al taxi, perquè té rutines en segon pla gairebé tot el dia. El problema és que, quan tanca la tapa, deixen de córrer —d'aquí que es plantegi un Mac mini a casa perquè no parin mai—. Descriu un canvi radical: per primera vegada treballa des de les notificacions del sistema, perquè l'avís que Claude ha acabat una tasca s'ha convertit en la seva safata d'entrada. Com que les rutines no apareixen a la llista de tasques de Claude Code, l'única manera d'arribar-hi és pel deep link de la notificació. El resultat és un context switching massiu: ja no decideix ell en què treballa, sinó que atén el primer que arriba, com l'atenció al client de la IA o un conserge en un front desk que va dient «cap allà, cap allà».

Ningú al gimnàs fa servir Claude: l'adopció és desigual

Àlex matisa l'eufòria. Fa sis o set mesos de la «revolució» de Claude Code i tots els threadboys que abans feien contingut d'usos de ChatGPT ara el fan de Claude —ChatGPT i Gemini gairebé han desaparegut d'aquests fils—, amb el típic vídeo de «t'explico en 14 minuts com ho estàs fent tot malament». Però quan va al gimnàs no veu ningú amb Claude: tothom mira Instagram, compra a Amazon o és a Tinder. I, sobretot, entrevistant CTOs al podcast de MarsBased constata que gairebé ningú té allò muntat; amics seus a Google, Stripe o Meta li diuen que no estan fent res d'això. La seva tesi: l'adopció ha estat molt desigual perquè no hi ha una manera estàndard de treballar-hi. Hi ha hagut tres o quatre acostaments (el Spec-Driven Development, el Research-Plan-Implement…), però la cadència de canvis és tan exagerada que no dona temps a consolidar res ni a comparar entre equips.

Els «lladós dels agents» i els cursos piramidals

D'aquí surt el concepte que dona títol a l'episodi. Àlex apunta que, per pura estadística, algun d'aquests que venen que tenen 50 agents i viuen a Bali acabarà sent «el lladó dels agents»: el que, en realitat, només et ven una estafa piramidal de cursos sobre com treballar amb això. I la seva màxima: en el moment que et passes a vendre cursos, és que no t'hi estàs guanyant la vida, perquè la gent rica no en ven —no necessita els 200 euros mensuals dels «pobres d'ànima» que han caigut al parany d'aquests depredadors.

Les grans veritats malgrat el sufflé

Marc separa el gra de la palla: de gent que realment visqui a Bali gràcies als agents en coneix zero; de la que ho aparenta, molta, però de tot el que diuen és veritat la meitat. Dit això, hi ha dues grans veritats. La primera, que aquesta tecnologia li ha canviat la manera de treballar al 100% —ha torçat les seves rutines per encabir-les en el nou paradigma perquè el multiplicador d'eficiència compensa les concessions—. La segona, que si avui muntes una empresa de zero la construiries molt diferent: la ràtio entre empleats i output és enorme si l'abraces des del primer dia, encara que una empresa que ja roda no pugui canviar cultura i processos d'avui per demà.

Middle-to-middle: el coll d'ampolla humà i la fatiga de decisió

Tots dos coincideixen que el cicle de vida d'una tasca encara no és end-to-end sinó middle-to-middle: l'impuls de fer una cosa ha de sortir de tu (la IA comença al punt 1, no al 0) i, al final, algú ho ha de revisar. Marc confessa que no li agrada publicar artefactes generats directament per un model i que sovint ell és el coll d'ampolla: té un funnel de grups dins de Claude Code i el de revisió final sempre és el més ple. Àlex hi suma la fatiga de decisió: a diferència de l'autocompletar de Cursor, on els canvis eren petits i revisables a l'instant, ara t'arriben canvis grans i transversals i una allau de permisos granulars. Quan portes 512 vegades dient que sí perquè tot estava bé, acabes tan cansat que el «gol» que et colen no el veuràs —com l'ocellet d'Homer Simpson picant el botó—. Tot plegat lliga amb la il·lusió de productivitat: estar fent moltes coses no vol dir avançar feina, i tenir tots els agents corrents pot ser un pretext d'ocupació, el nou «línies de codi escrites».

El context fragmentat de Claude i el truc dels symlinks

Una de les queixes de fons és que chat, cowork i code són tres instàncies de Claude amb context independent i sense visibilitat entre elles: Àlex va provar el cowork i no sabia res del que ell havia fet a code ni parlat al xat. Que ni la mateixa Anthropic tingui clar com unificar-ho —els grups viuen a code però no al xat— els sembla simptomàtic. Marc hi aporta un truc: com que l'automemòria de Claude es desa en una carpeta local del Mac, molta gent crea symlinks cap a una carpeta sincronitzada amb GitHub o iCloud perquè les memòries viatgin amb tu en canviar d'ordinador.

Com treballa Marc: Claude Code com a extensió de la ment

Marc explica el seu muntatge: només fa servir Claude Code i té un repositori privat a GitHub que funciona com el seu sistema de memòria, on documenta absolutament tot —com treballa, qui és qui, cada moviment i feature— en lloc de fer servir les eines de l'empresa. Així Claude té tot el context dels processos i, per exemple, llegeix les tasques a Notion i les identifica. Insisteix que no és rocket science: pots arribar molt lluny només dient «vull treballar en aquesta carpeta, guarda-ho tot i crea un sistema d'autodocumentació», i a còpia de corregir-lo es converteix gairebé en una extensió de la teva ment. El que el fascina és que tot funcioni a base de Markdowns i JSONs. Com a exemple, explica que va fer un skill amb accés a l'API de transcripcions que agafa el transcript d'un episodi, en corregeix els noms mal transcrits, construeix un diccionari i genera els resums atribuïts de cada episodi —exactament el procés que hi ha darrere d'aquestes notes—, per lots de deu.

Qui en treu més partit: generalistes i knowledge work

Per Marc, la tecnologia ha afavorit sobretot els generalistes sense trava burocràtica: si treballes en un corporate amb polítiques d'eines vas lligat; si abans depenies de molta gent per coordinar-te, t'ha donat ales. Posa l'exemple d'un resizer d'imatges que ningú a enginyeria li sabia ubicar i que Claude, amb accés de lectura als repositoris, li va situar al frontend en segons —«la millor resposta en tres dies»—. Per a la feina de coneixement, connectar la base de dades és transformador: anàlisis de tres hores de queries d'SQL ara són cinc minuts, sempre que li expliquis tota la lògica de negoci —els estatus, qui fa què, cada flag—, cosa que a ell li va portar un mes. Àlex, en canvi, tracta la mateixa MarsBased com si fos un producte sencer i hi aboca tot el context; ha tornat a programar activament i la web de l'empresa ja és «fluida», canvia d'un dia per l'altre no només de contingut sinó de forma.

El veredicte: 3x, no 100x, i prou cas als lladós

El tancament és equilibrat. La tecnologia els ha transformat la manera de treballar —progressen més de pressa, donen més valor per setmana, acaben abans els projectes—, però els guanys que prometien els cínics (els superagents, tot aquest «Herbalife de la productivitat») no estan passant. Parlen d'un 3x raonable, lluny del 100x o el 10x del discurs; els CTOs de la indústria ja firmarien un 3x, perquè el que veuen és un 2x com a molt. La conclusió i l'últim consell: si tens l'oportunitat, abraça el canvi i agafa't tan fort com puguis a aquesta eina que és superior a nosaltres… i no facis cas als lladós de la productivitat de la IA.

Escolta l'episodi