bet365

La IA pasa el test de Turing (no corran todavía)

NEWSLETTER 'ARTIFICIAL'

La prueba de credibilidad ideada hace 75 años ha sido superada por grandes modelos de lenguaje, pero eso no significa que ya sean superinteligencias

En el test de Turing, humano y máquina tratan de convencer a un interrogador que ambos son una persona

En el test de Turing, humano y máquina tratan de convencer a un interrogador que ambos son una persona

Reve

Hace 75 años, uno de los principales pioneros de la computación, Alan Turing, ideó una prueba para determinar si las computadoras del futuro tendrían una inteligencia comparable a la humana. El establece que la máquina es inteligente si logra engañar a una persona haciéndole creer que es un humano. Durante tres cuartos de siglo, lo que el científico inglés denominó “el juego de la imitación” de las computadoras no ha sido lo suficientemente consistente como para considerar que superaban la prueba (aunque hay alguna excepción cuestionable). Ahora, de Cameron R. Jones y Benjamin K. Bergen, investigadores ciencia cognitiva de la Universidad de California San Diego demuestra que los principales grandes modelos de lenguaje de la IA pueden pasar el test. Eso no significa que estemos (todavía) ante superinteligencias capaces de superarnos en todos los ámbitos.

En el test de Turing, un interrogador humano conversa simultáneamente mediante una interfaz de texto con dos testigos, que son un humano y una máquina. Ambos intentan persuadir a la persona que les interroga de que ellos son los verdaderos humanos. Se considera que la máquina supera el test si la persona que pregunta no es capaz de identificar de una manera fiable al ser humano real. El estudio ha aplicado el test de Turing durante 5 minutos de conversación a cuatro sistemas conversacionales: ELIZA, LLaMa-3.1-405B de Meta y GPT-4o y GPT-4.5 de OpenAI.

El primero, , es uno de los primeros programas de lenguaje natural, creado entre 1964 y 1996, para simular conversaciones en un original y hasta cierto punto efectivo juego de imitación. Los investigadores reseñan que, cuando pidieron a las IAs que adoptaran una personalidad similar a la humana, los jueces consideraron que GPT-4.5 era humano el 73 % de las veces, con mucha más frecuencia que los interrogadores seleccionaron al participante humano real. LLaMa-3.1 fue considerada humana el 56 % de las veces, mientras que ELIZA se quedó en el 23% y GPT-4o en el 21 %. Pese a que la prueba está lejos de determinar la inteligencia de un sistema, los autores consideran que el método de Turing “es una medida de sustituibilidad: si un sistema puede sustituir a una persona real sin que un interlocutor se dé cuenta de la diferencia”.

Benedict Cumberbach interpreta a Alan Turing en la película 'The imitation game'

Benedict Cumberbach interpreta a Alan Turing en la película 'The imitation game'

The Weinstein Company

“Las máquinas que pueden imitar la conversación de las personas tan bien como para reemplazarlas -concluyen- podrían automatizar trabajos y perturbar la sociedad al reemplazar las funciones sociales y económicas de las personas reales”. La importancia del test de Turing como medida del avance de la inteligencia artificial es relativa, porque se trata de una prueba de comparación desde la perspectiva humana. No es una comprobación matemática, sino una percepción. Algo parecido, desde el punto de vista de la empatía, a lo que hacían los policías que perseguían replicantes en , un test que en la película de Ridley Scott se llama . El valor de estas pruebas reside en lo que cree un ser humano, no es una medida exacta. De hecho, dos humanos pueden obtener conclusiones distintas de las mismas respuestas.

Hace once años, un chatbot llamado fue considerado un hito de la inteligencia artificial al pasar el test de Turing. La realidad es que la máquina respondía de forma muy humana en muchas cuestiones, pero su planteamiento utilizaba trucos como hacer preguntas que desviaban el foco de aquello que no sabía. Los programadores lo definieron como un niño ucraniano de 13 años, lo que lo hacía más tolerable a los fallos gramaticales y la falta de conocimiento general. El 33% de los jueces que conversaron mediante mensajes de texto con Eugene concluyó que era un niño humano.

El hecho de que una IA supere el test de Turing, con mayor facilidad a medida que se crean nuevos modelos de vanguardia, reside en la percepción humana. Los autores aventuran que “algunos de los peores daños de los grandes modelos de lenguaje podrían producirse cuando las personas no son conscientes de que están interactuando con una IA en lugar de con un humano”. La mayoría estamos expuestos a caer engañados. Incluso los expertos. “Nuestros análisis demográficos -revelan los científicos- sugieren que la precisión discriminativa es relativamente homogénea entre la población, incluso entre las personas que realizan investigaciones con grandes modelos de lenguaje o interactúan con chatbots todos los días”. Aquí no se libra nadie.

Una representación gráfica del test de Turing

Una representación gráfica del test de Turing

CHATGPT

Puede que la superinteligencia que nos supere a todos esté ya a la vuelta de la esquina -quién sabe si para la próxima newsletter-, pero también puede pasar que la innovación que hemos conocido en los dos últimos años y medio sufra un frenazo debido a la situación geopolítica. La economía mundial se halla en un contexto de tensiones que es imposible que no afecte a uno de sus sectores globales.

Hace unos días saltaba una pequeña luz de alarma en forma de mensaje de Noelle Walsh, presidenta de Operaciones en la Nube de Microsoft, una de las grandes compañías que más se ha volcado en invertir en IA de una forma decidida, que publicó en : “nuestro compromiso con el avance de la tecnología de IA y la entrega de valor a nuestros clientes es inquebrantable”. Y añadió que, debido a la planificación de esas grandes infraestructuras, estaban “ralentizando o pausando algunos proyectos en fase inicial”. De momento, las grandes inversiones siguen manando por todas partes en Estados Unidos. Nvidia, fabricante de los chips más codiciados para la IA, que planea invertir medio billón de dólares durante los próximos cuatro años para fabricar supercomputadoras con IA en ese país, y ha reservado suelo por unos 93.000 metros cuadrados en Arizona y Texas. Parece que, pese a todo, la fiebre IA no se apaga.

Google Cloud Next 2025 en Las Vegas

Google Cloud Next 2025 en Las Vegas

Google

. Los anuncios de Google Cloud Next 2025. Catarata de anuncios de Google en su evento de IA celebrado en Las Vegas. Entre otras cosas, la compañía anunció una nueva plataforma de codificación de agentes de IA, , importantes actualizaciones de sus modelos de vídeo, audio e imagen y un nuevo modelo de lenguaje, Gemini 2.5 Flash, una versión más rápida y barata de su modelo más avanzado.

. Contrademanda de OpenAI contra Elon Musk. OpenAI ha presentado por sus “incesantes acciones” contra esta compañía, que considera que “no son más que tácticas de mala fe para frenar a OpenAI y hacerse con el control de las principales innovaciones en IA para su beneficio personal”. “Los continuos ataques de Musk contra OpenAI –indica la demanda-, culminando más recientemente con la falsa oferta pública de adquisición diseñada para perturbar el futuro de OpenAI, deben cesar. Musk debe ser inhabilitado para nuevas acciones ilegales e injustas, y responsabilizado por el daño que ya ha causado”. Musk, que es cofundador e inversor inicial de OpenAI, demandó a esta empresa hace más de un año por no cumplir con su misión sin ánimo de lucro. En junio pasado, Musk retiró la demanda y presentó una nueva en agosto en la que aparecía Microsoft como demandado adicional.

Lee también

. La OTAN compra el sistema de IA Maven de Palantir. La OTAN ha anunciado que ha adquirido el para utilización en conflicto bélico. Maven es una plataforma con fuentes de datos, aplicaciones de IA y grandes modelos de lenguaje que se utilizarán, según un comunicado, para mejorar “la fusión y la focalización de la inteligencia, el conocimiento y la planificación del espacio de batalla, y la toma de decisiones acelerada”. Maven entrará en funcionamiento en los próximos 30 días.

Etiquetas
Mostrar comentarios
Cargando siguiente contenido...