alan

Hace dos años conocí a Eugene Goostman, de 13 años, dueño de una cobaya y estudiante en Odessa, Ucrania. Hoy, este peculiar personaje –que en realidad es un chatbot, un programa informático capaz de mantener una conversación– está llenando la web de titulares que dicen que el sábado pasado se convirtió en el primer pedazo de software en haber superado el test de Turing, el test de inteligencia artificial más famoso del mundo.

 

Eugene, creado por Vladimir Veselov (nacido en Rusia y residente en EE.UU.) y Eugene Demchenko (ucraniano residente en Rusia), es en realidad un programa inteligente, además de ser realmente gracioso. Y de hecho engañó al 33% de las personas con las que conversó, que creyeron que Eugene era humano. Pero hay ciertas razones para que este resultado no sea el gran acontecimiento que quieren vendernos los medios.

 

Mentiras, malditas mentiras y Estadística.

Ideado por el famosísimo Alan Turing a principios de los cincuenta, el test de Turing reta a jueces humanos a conversar (por medio de una sencilla interfaz de texto, tipo chat) tanto con personas reales como con programas informáticos (chatbots). Después, deben decidir, en cada caso, si han estado hablando con un humano o con una máquina. Turing dijo que una máquina pasaría el test si era capaz de engañar a los jueces en más del 30% de las ocasiones.

 

Cuando conocí a Eugene, era juez en un test de Turing en el Parque Bletchley en Milton Keynes (Reino Unido), justo donde Turing ayudó a descifrar el código de la máquina de encriptación nazi “Enigma”. El test se había organizado para celebrar el centenario del nacimiento del genio inglés. Tuvimos que sentarnos en varios ordenadores y hablar, a ciegas, con chatbots y humanos mediante un programa de mensajería instantánea. Con 150 conversaciones llevadas a cabo por 30 jueces humanos, se dijo entonces que sería el test de Turing “más significativo estadísticamente” hasta la fecha. En ese torneo, el famoso Eugene engañó a los jueces el 29% de las veces; tan sólo un insignificante uno por ciento por debajo del 30% establecido por Turing. En el test más reciente, en la Royal Society de Londres, participaron el mismo número jueces y también se llevaron a cabo 150 conversaciones. Eugene superó su nota en cuatro puntos porcentuales, alcanzando un 33%. Suena impresionante, pero con tan sólo 30 jueces, apenas un puñado de ellos tienen que ser engañados por el chatbot para producir una mejora semejante.

 

Otros bots han aprobado el test de Turing

Cómo traducir las ideas de Turing, concebidas mucho antes del nacimiento del primer chatbot, a un test de inteligencia artificial eficaz ha sido un intenso tema de debate durante mucho tiempo. Pero ya en 1991, un chatbot llamado “PC Therapist” (creado por Joseph Weintraub) participó en un test de Turing y engañó a 5 de los 10 jueces. Un 50% de los humanos pensaban que estaban chateando con otro miembro de su especie. Mucho más recientemente, en 2011, el Clerverbot (robot inteligente , N. del T.) de Rollo Carpenter mantuvo una conversación con 30 humanos delante de un público compuesto por más de 1000 personas, y engañó al 59,3% de los jueces y del público.

 

En un email que recibí el año pasado invitándome a participar en el test de Turing de este año, uno de los organizadores, Huma Shah (de la Universidad de Reading, Reino Unido) me dijo que, precisamente por estos resultados tan recientes, pasar el test de Turing no era el objetivo del torneo:

 

“El propósito de el experimento de la Royal Society de este mes de junio no es descubrir si una máquina puede pasar el test de Turing con el famoso límite del 30%, especialmente sabiendo que ya en el 91 un chatbot fue capaz de superar la cuota del 50% de engaño  y teniendo en cuenta que ningún ordenador de hoy en día puede mantener una conversación como lo hacía, por ejemplo, HAL de 2001: Una odisea en el espacio.”

 

Lo que los organizadores querían era “motivar e inspirar a los niños para que se atrevieran a programar y a iniciarse en Robótica, algo que podría ayudarles a concienciarse sobre temas como la prevención de ataques cibernéticos”. Objetivos que valgan la pena. Esto no tiene nada que ver con Skynet.

 

Eugene sólo tiene 13 años

¿Considerarías a un adolescente como el súmmum de la inteligencia humana? Seguramente no. Esto es un arma de doble filo en el caso de Eugene: es inteligente y limitante al mismo tiempo. Si una máquina pasa el test de Turing es el fin. Nos han alcanzado. Son capaces de imitarnos perfectamente. Pero la trampa es la siguiente: nadie dice a qué tipo de personas tiene que imitar la máquina para ganar, lo cual nos lleva a hacernos la pregunta: ¿cuenta que imite a un niño de 13 años? Cuando conocí a Veselov en 2012 me dijo: “13 años es ni muy viejo, para saberlo todo, ni muy joven para no saber nada.” En otras palabras, es suficientemente mayor como para llevar una conversación, pero mucho más fácil de imitar que, digamos, Richard Dawkins o Stephen Hawking. Apuntando bajo: Eugene consigue engañarnos y simula ser una persona bastante bien. ¿Pero es realmente inteligente?

 

La inteligencia es algo más que chatear

Hoy en día, el test de Turing simboliza la inteligencia artificial, pero realmente sólo examina a los ordenadores en sus habilidades para conversar. Los humanos son capaces de mucho más. Por esto, en los últimos años, se ha intentado actualizar el test varias veces para poder comparar los ordenadores con una versión mucho más rica de la inteligencia humana. En el test de Turing visual, por ejemplo, se reta a los ordenadores a mimetizar nuestras habilidades visuales y espaciales.

Otros se preocupan de que es incorrecto usarnos a nosotros mismos como patrón de inteligencia, y que esto puede desembocar en que el descubrimiento de, digamos, un “mega-cerebro” nos pase desapercibido. Aparatos de inteligencia artificial –o extraterrestres inteligentes, por ejemplo– que resuelvan problemas de formas distintas pueden ser tanto o más inteligentes que nosotros, pero podrían suspender el test de Turing por sus prejuicios antropocéntricos. Con esto en mente, se están centrando muchos esfuerzos en crear un test de inteligencia universal, que mide la inteligencia como la habilidad de comprimir la información y de tomar decisiones.

 

Nada de esto debería menospreciar los logros de Veselov y Demchenko, sino que ayude a poner su creación en contexto. Sólo me queda añadir: cuando formé parte del jurado del test de Turing, clasifiqué bien a todos los chatbots como tales, incluido al listillo de Eugene.

 

N. del T.: El artículo está escrito en primera persona, de ahí que se mantenga durante toda la narración, pero ni el traductor formó parte de ningún test de Turing ni se cartea con los creadores del mocoso de Eugene.

 
Ilustración: Alan Turing según Jin Wicked
Artículo original publicado por Celeste Biever en NewScientist

Traductor

Web: Gomobel
Licenciado en Química por la Universidad de Zaragoza. Erasmus en la Universidad Pierre y Marie Curie de París. Actualmente realizo mi tesis doctoral sobre Química Bioorgánica en el Instituto de Síntesis Química y Catálisis Homogénea (UZ-CSIC). Divulgo todo lo que puedo porque me encanta, podéis leerme en @electrones, @isqch_divulga y escucharme en @elnanoscopio y @sciencebitches.

Divúlgame.NET


Warning: array_slice() expects parameter 1 to be array, null given in /srv/users/serverpilot/apps/wpsite/public/wp-content/themes/journal/singleDefault.php on line 241