(la imagen pertenece a la obra de Javier Bustos “Cuarteto #2 para sillas autónomas“)
I am sitting in a room es una de las obras más conocidas de un artista tartamudo que utilizó sus palabras hasta hacerlas desaparecer. Aclaremos: se trata de Alvin Lucier, creador de una pieza de arte sonoro que resulta de un proceso de grabación y regrabación de la grabación anterior donde se verifica la influencia de las características acústicas de la sala hasta que se vuelven más importantes y más audibles que las palabras iniciales.
Aunque parezca complejo, el procedimiento no lo es tanto y el resultado es fácilmente audible en distintos registros que se hicieron de la obra, como este:
Entre los primeros segundos y los últimos nos damos cuenta que el registro del texto se ve cada vez más comprometido en su inteligibilidad apareciendo sonidos que podrían ser parte de un oscilador pero que son refuerzos grabados una y otra vez resaltando las frecuencias de resonancia del recinto.
Esta obra abrió muchísimas preguntas dentro del ámbito del arte sonoro, pero nos interesa aquí pensar cómo la interacción entre la claridad e inteligibilidad interacciona con el entorno donde se escucha el mensaje. Lo más inquietante es la desaparición del mensaje original para dar lugar al protagonismo de la resonancia del mensaje en ese recinto particular. Si cambia el recinto (esto se realizó en muchísimas otras experiencias) cambian las frecuencias de resonancia dando un resultado distinto, pero que también hacen desaparecer el mensaje original (entendiendo como el texto o guión grabado por primera vez). Un modelo matemático que puede simular este efecto puede ser el de convolución, existiendo incluso simuladores de este efecto para PD o Max.
Si bien la matemática que se encuentra detrás de los LLM es completamente diferente, imaginé una analogía entre el recinto y los datos y la conversación típica de un GPT con el mensaje de la obra sonora mencionada.
Cuando realizamos alguna consulta a estos sistemas, parecen jugar a “I am sitting in the room”, encuentran las resonancias, y luego vuelven a las palabras para escribir algo coherente con esas resonancias, que puede tener muchísimas alternativas: muchos mensajes son compatibles con estas resonancias. De hecho, cuando corregimos en los chats, saben disculparse con amabilidad y ensayan otra respuesta (aun cuando corregimos algo que sabemos que es correcto).
Y adelanto que no me ocuparé de intentar rigor en esta relación. Quiero, sin embargo, encontrar una metáfora lo más didáctica posible para explicar por qué las construcciones textuales de un GPT se parecen mucho, y siempre toman una forma parecida, y que un algoritmo capaz de escribir está disociado del contenido de lo que escribe.
Con semejante licencia que me tomo en esta relación, cabe aclarar que la palabra resonancia en el arte sonoro es real, física, asociada a magnitudes, distancias, potencias y especialmente frecuencias. Pero cuando hablamos de palabras esta idea es solo una metáfora, pero que tal vez explique por qué las respuestas de las interfaces que derivan de los LLM tienen patrones comunes.
Y aquí es donde mi preocupación aumenta. La producción académica sufría antes de las “IA para todos” de una falta alarmante de originalidad. Lo único que salvaba a los artículos y tesis eran los buenos ensayos; y tal vez hoy ocurre lo mismo. Pero se agravó el fenómeno de la resonancia. Los trabajos no solo son poco originales, sino que también se nota el enfoque derivado de los sesgos del entrenamiento de las IA y del modo en el que se dirigen a nosotros.
En la época de superproducción de contenidos en todos los formatos imaginables estamos alimentando simultáneamente cajas de resonancia que dificultan la novedad en las ideas. Reproducir “I am sitting in a room” es una poderosa perfomance creativa; pero quedarse “just listening in the room” es una opción decepcionante frente a las posibilidades de la IA.
De hecho, ya estamos conociendo el cognitive debt en la relación brain-to-LLM

Guión original de la obra de Alvin Lucier
I am sitting in a room different from the one you are in
now. I am recording the sound of my speaking voice and I am
going to play it back into the room again and again until
the resonant frequencies of the room reinforce themselves
so that any semblance of my speech, with perhaps the
exception of r-r-r-rhythm, is destroyed. What you will
hear, then, are the natural resonant frequencies of the
room articulated by speech. I regard this activity nnnnnot
so much as a demonstration of a physical fact, but more as
a way to s-s-smooth out any irregularities my speech might
have.