El Test de Turing y una pregunta que cumple 70 años ¿Pueden pensar las maquinas?
Escribe Camilo Furlan
El debate filosófico de los últimos 70 años alrededor de los robots y las inteligencias artificiales no se puede entender sin el test de Turing. Alan Turing, un matemático inglés, desarrolló en 1950 el test de Turing.
Este consiste en que un humano mantiene una conversación con una computadora y otra persona, pero sin saber quién de los dos es realmente una máquina. El objetivo de este experimento es determinar si la inteligencia artificial puede imitar las respuestas humanas. Por ello, el humano hace preguntas tanto a la otra persona como al chatbot y si no puede identificar si alguno de los dos sujetos es o no una máquina, la computadora pasa con éxito la prueba de Turing.
Uno de los más populares, por ser uno de los primeros, fue ELIZA, diseñado en 1966 por Joseph Weizenbaum. ELIZA simulaba ser un psicoterapeuta y su conversación era muy fluida. Entre ellos también está PARRY, desarrollado por el psiquiatra Kenneth Colby en 1972, que simulaba un esquizofrénico paranoide. Uno de los ejemplos de ordenadores más destacados es Kuki, anteriormente conocido como Mitsuku. Entre los años 2017 y 2021, ha sido el ganador del Premio Loebner, por lo que ahora ostenta el récord mundial. No obstante, además de Kuki, otros chatbots también han sido capaces de superar el test de Turing.
En la actualidad, algoritmos como el de Chat-GPT o Stable Diffusion cambian radicalmente las reglas de juego, dejando obsoleto el mismísimo Test de Turing. Es en este marco en el que la humanidad necesito de nuevos parámetros para “medir la inteligencia” de su creación, desarrollando nuevos tests más complejos, que tienden a priorizar parámetros como la creatividad o incluso la capacidad de empatizar de manera eficaz.
El Test de Lovelace es un claro ejemplo. En 2001, Mark Riedl, Profesor del Instituto Tecnológico de Georgia, diseñó una nueva prueba, con nombre inspirado en una famosa matemática. Mientras el test de Turing se basa en si una máquina es capaz de imitar a los humanos, la prueba de Lovelace se centra en el aspecto creativo. Para superar el test, la IA debe ser capaz de escribir una historia de ficción, crear un poema o elaborar una pintura y obtener la aprobación de los examinadores. Esto requiere de tareas complejas como entender los tamaños relativos o la mezcla de conceptos.
Eugene Goostman propuso una serie de test donde se ponga a prueba las capacidades de las máquinas en campos como la visión artificial o el reconocimiento del habla. Entre las pruebas estaría desde descifrar el significado de un vídeo o algo tan “humano” como montar un mueble. Puede parecer un proceso mecánico, pero la máquina debe identificar las partes del mueble, entender las instrucciones y finalmente montarlo.
En un artículo en New Yorker, el profesor de psicología de la Universidad de Nueva York, Gary Marcus, describió una alternativa al test de Turing. En este caso centrándose en otra capacidad muy humana: el humor. La prueba de Marcus consiste en darle a la IA un programa de televisión y que nos diga cuándo deberíamos reírnos. O darle un documental de guerra y que nos describa las motivaciones políticas. Entender el sarcasmo, la ironía y el humor es el test que Marcus cree que las máquinas deberían ser capaces de pasar para poder asemejarse a los humanos.
También participan de esta lista los clásicos CAPTCHA. Los hemos visto en centenares de webs. Son el filtro antispam más conocido y con el paso del tiempo han ido evolucionando a distintas formas. Son una prueba muy eficaz (aunque cada vez menos) para detectar si es un bot o es una persona humana quien intenta acceder.
En su libro ‘La Singularidad está cerca’, Raymond Kurzweil recoge una alternativa al test de Turing propuesta por Edward Feigenbaum en 2003. La prueba consiste en elegir una materia concreta e intentar que la IA se haga pasar por un experto en ese campo. Si el humano no logra detectarlo, la máquina pasa la prueba. Aquí entramos desde la complejidad de la materia hasta las peculiaridades menos conocidas. E incluso poder describir temas de ese campo con autoridad y coherencia.
La prueba de Ebert es considerada “la prueba definitiva”. En este caso no es un psicoanalista ni un ingeniero el que propuso la prueba, sino el crítico de cine Robert Ebert. Se da el caso que Ebert perdió la voz tras una cirugía y ha utilizado un sintetizador de voz desde entonces. el desafío es una máquina que sepa replicar las entonaciones humanas, sincronizar bien las palabras y lo más complicado: ser capaz de hacer a la gente reír. Para que una IA logre hacernos reír no basta simplemente con elegir un chiste de una base de datos. Debe ser capaz de transmitir, de emocionar, de aportar algo original y novedoso. Probablemente de todas las alternativas al test de Turing, la prueba de Ebert es la más complicada de pasar.
Todo esto representa un desafío enorme para la ciencia, si es que no perdemos de vista que, en última instancia, se tratan de ecuaciones matemáticas basadas en ceros y unos. Es mediante todas estas pruebas, o tests, que nos acercamos cada vez más a la tan ansiada respuesta superlativa. Cada vez parecemos entender mejor (en que consiste) la inteligencia y, si es que realmente, podremos algún día crear un sistema que cumpla los requisitos y condiciones que determinen su razonamiento como inteligente. Quizás, con suerte, todo esto nos lleve a saber si la inteligencia se puede reducir a un sistema basado en matemáticas estrictas, o si se trata de una cualidad exclusivamente biológica.
Sin ir mas lejos, quien desarrolló el artículo antes visto, no es ningún profesional de avanzada, no es ingeniero, no es periodista ni es escritor. Sino un simple campesino en algún lugar de la selva paranaense, que con 18 años podría pasar desapercibido, simplemente por tener acceso a internet. Es más, ni siquiera se sentó a leer extensos libros sobre I.A, ni desarrollados papers científicos sobre el asunto, sino que por la mañana encontró interesante esta temática debido a un video de Pablo Molinari en tiktok. Una vez más, la inteligencia es difícil de cuantificar, sobre todo si la reducimos a un texto en un monitor.