Los modelos de lenguaje y el dilema de la economía cognitiva
La doble cara de la moneda de ChatGPT y similares
Hoy, respondiendo un tweet ( o como se llamen ahora), me quedé pensando sobre este tema. Los recientes avances en modelos de lenguaje (en adelante LLM) como ChatGPT, plantean un dilema interesante. Por un lado, tienen el potencial de realizar tareas intelectuales por nosotros, desde traducir textos, redactar ensayos, programar código… Esta cesión puede llevar a que dejemos de ejercitar ciertas habilidades mentales. La externalización cognitiva no ha nacido con los LLM, pero el salto que va a producirse (que se está produciendo) en este sentido no tiene precedentes.
Sin embargo, al mismo tiempo, si se usan correctamente, estas herramientas también pueden reforzar nuestras habilidades. El ejemplo que puse en el tweet me parece el más fácil de entender: ChatGPT puede traducirnos todo y que no necesitemos aprender un idioma para leer un texto, y al mismo tiempo puede ayudarnos a aprender idiomas más rápido al proveer traducciones y correcciones instantáneas. Puede sugerir ideas y estructuras para escribir mejor. Incluso puede explicar conceptos de forma didáctica para ayudarnos a entender mejor.
Ese es el dilema: que nuestro cerebro constantemente busca cómo ahorrar energía. Evolutivamente tiene mucho sentido (consume la cuarta parte de ella), pero al igual que en un mundo de abundante comida post-procesada resulta un problema nuestra ancestral atracción por los azúcares más calóricos , la economía cognitiva nos puede jugar una mala pasada con los LLM. Si ChatGPT puede escribir un ensayo entero por nosotros, es tentador dejar que lo haga en lugar de hacer el esfuerzo mental de escribirlo nosotros mismos. Pero cediendo a esa tentación una y otra vez, no desarrollamos nuestras propias habilidades de escritura y pensamiento crítico.
Para aprovechar al máximo el potencial de aprendizaje de ChatGPT y evitar volvernos mentalmente complacientes, se requiere intencionalidad y esfuerzo, esto es, usar estas herramientas activamente, no pasivamente. Por ejemplo, en lugar de solo pedirle a ChatGPT que escriba un ensayo, podemos pedirle ideas y estructuras, pero escribirlo nosotros mismos. O al revés, cincelar concienzudamente un borrador creado por él, o pedirle retroalimentación de nuestros borradores para mejorar, no solo el producto final. Es un asistente maravilloso, pero justamente por ser eso no nos puede suplantar salvo en lo que conscientemente consideremos necesario. No podemos desligarnos de todos los procesos.
Con el tiempo, esto generará dos perfiles de uso de IA:
El uso activo: Aprovechar la tecnología para reforzar nuestras habilidades, no reemplazarlas. Es decir, realizar el trabajo cognitivo nosotros mismos, usando la IA como ayuda y guía.
El uso pasivo: Delegar todo el trabajo que se pueda a la IA para ahorrar esfuerzo mental, con lo que nuestras habilidades cognitivas se atrofiarán con el tiempo por falta de uso.
Por supuesto, no son excluyentes y habrá cosas con las que juiciosamente adoptaremos el perfil de uso pasivo. Pero habrá que vigilar la tentación de dejarse llevar que siempre estará ahí.
Por otro lado, en cuanto al ámbito laboral, en un mundo donde casi todos tengan acceso a estas herramientas, ¿cuál será el factor que marque la diferencia?
Nosotros.
Y siendo los LLM no deterministas y por tanto abiertos al error y necesitados de supervisión, ¿quién sacará más provecho de ellos?
Justamente quienes conozcan mejor la disciplina que tratan.
La clave estará en cultivar la autosupervisión y la autodisciplina para exprimir los beneficios de aprendizaje de los LLM y evitar volvernos mentalmente anémicos. Si podemos vencer esa inercia cerebral, estas tecnologías pueden elevarnos a nuevos niveles de conocimiento y habilidad. Pero requerirá de nuestro esfuerzo activo y constante en una sociedad en la que una de las grandes aspiraciones es la máxima comodidad.


He leído todos los artículos (un poco en diagonal, porque la vida da para lo que da) e iba a poner varios comentarios, pero al final está todo relacionado y creo que es mejor resumirlo aquí:
Por una parte no estoy muy de acuerdo con la línea de lo que has publicado sobre IA: no creo que se esté representando adecuadamente la crítica a la misma, pero también tengo bastante claro que toda resistencia al invento es fútil.
Si las mejoras de GPT4 son tan buenas como dices más que IA debe haber mucha curación humana y conexiones a bases de datos vía reglas de toda la vida ahí metidos, porque el modelo generativo+atención, tecnológicamente da para lo que da: interfaz de búsqueda en lenguaje natural (con todos los defectos de éste), herramienta creativa y procesador de textos. Que no es poco, pero de ninguna manera un buscador/asistente/profesor, como se usa ahora.
No veo que tiene de inexacto llamarlo "loro estocástico", más allá de ser un nombre rimbombante. El artículo que popularizó el término explica perfectamente las limitaciones y riesgos de estos modelos lingüisticos y está lleno de referencias que las muestran.
De GTP no he leido mucho más desde los papers originales, y he trasteado un poco pero parece claro muchos estudios tendrán que usar modelos antiguos porque los nuevos y sus datos de entrenamiento simplemente serán un secreto comercial y por tanto cerrados al escrutinio científico. Las publicaciones de OpenAI hace tiempo que son meros actos de relaciones públicas en tanto sus resultados no son reproducibles.
Por otra parte, si lo que se ofrece gratis es v3.5 vas a tener una creación dominada por esos resultados y el factor diferenciador no va a ser que un humano sepa hacer la query adecuada y corregir a posteriori gracias a su gran conocimiento del dominio, la diferencia estará en el acceso a esas versiones premium de herramientas con mejores resultados iniciales, ergo menor post procesado.
Esto es muy evidente con, por ejemplo, una traducción automática corregida por un traductor humano. Cuanto mejor sea la traducción de partida, menos oficio necesitas para obtener buenos resultados rápidamente, porque al final de eso va todo esto, menos horas de trabajo a realizar para el mismo resultado o uno lo suficientemente bueno. Eso inevitablemente devalúa el valor de todo ese trabajo porque quien te paga no es tonto y sabe que ahora puedes hacer en 1 hora lo que antes hacías en 10. Mira los sueldos y las plantillas en el periodismo.
Obviamente también tiene su reverso en forma de revalorización de lo artesanal, pero la mayoría no va a poder pagarlo con sus salarios devaluados y con el tiempo ni verán las ventajas de hacerlo, igual que hoy no puedes ni seguramente quieres pagar a un n retratista para que ponga su visión de ti al óleo, pudiendo elegir tú una foto, pasar un filtro, modificarla a tu gusto y autoimagen e imprimir o reimprimir un lienzo por 30€
Tendrás además una dependencia tecnológica brutal, a merced de que mañana te cambien el modelo de monetización (v. Unity, Adobe y el Pantone) o un rediseño de la API destruya tu formación en "prompt engineering" (v. los "técnicas seo" ante un cambio en el algoritmo de youtube, pagerank, etc.).
Personalmente sólo veo algo de esperanza en el open source y la posibilidad de usar un modelo base enganchado a tus propias bases de conocimiento (RAG) que permitan cierta democratización de la herramienta sin tener que darle feedback humano gratuito y todos tus datos a la megacorp de turno, pero la procacidad y la independenncia tampoco es algo que la gente valore mucho hasta que las consecuencias le estallan en la cara.
De la legislación espero y temo un remedio peor que la enfermedad, ya que no será sino una manera sutil de elevar barreras de entrada a competidores pequeños o política de vigilancia para todos.