top of page
  • Writer's picturecriptodiadia

La IA de Meta ha superado a los humanos en un clásico juego de mesa

Los investigadores de Meta han presentado el algoritmo de inteligencia artificial Cicero, que juega el juego de mesa Diplomacia a nivel humano.

Foto: analyticsinsight.


The Register escribe sobre ello.


La "diplomacia" se desarrolló en 1953. El juego se centra en la comunicación y las negociaciones entre los participantes. Cada uno de ellos desempeña el papel de uno de los siete estados europeos de principios del siglo XX.


Básicamente, Cicero es un chatbot que negocia con otros participantes para realizar movimientos efectivos. El algoritmo se basa en un modelo de lenguaje similar a BART con 2700 millones de parámetros.


Fue entrenado previamente en textos de Internet, así como en un conjunto de datos de más de 40,000 juegos de Diplomacia jugados en línea. El conjunto de datos contenía más de 12 millones de mensajes intercambiados entre personas durante el juego.

Captura de pantalla del juego "Diplomacia" con el agente de inteligencia artificial Cicero. Datos: Meta.


El resultado del diálogo de un agente de IA está vinculado a su módulo de pensamiento estratégico. Con él, Cicero crea "intenciones" que representan el posible conjunto de movimientos para diferentes jugadores.


“El módulo de pensamiento estratégico predice las políticas [acciones probables] de otros jugadores para el turno actual en función del estado del tablero y el diálogo general, y luego elige una política para el turno actual por sí mismo”, dijeron los investigadores.


A diferencia de los agentes de IA para el ajedrez, los investigadores aplicaron el aprendizaje supervisado utilizando datos de juegos anteriores. Sin embargo, el enfoque en sí mismo creó un modelo crédulo que podría ser fácilmente manipulado por jugadores sin escrúpulos, dijeron los investigadores.


Para evitar tales situaciones, los desarrolladores conectaron el algoritmo de planificación iterativa piKL a Cicero. Con él, el agente de IA refina la predicción inicial de la política del otro jugador y los movimientos planificados en función del diálogo entre el bot y los humanos. El algoritmo intenta mejorar los conjuntos de acciones esperados de los participantes evaluando diferentes opciones que darán los mejores resultados.


En el transcurso de dos meses, los investigadores probaron a Cicero en 40 juegos diplomáticos anónimos. Según los resultados de las pruebas, el agente de IA entró en el 10% superior de los participantes que jugaron más de una vez. En el ranking de usuarios que jugaron cinco o más juegos, el algoritmo ocupó el segundo lugar.


En los 40 juegos, el promedio de Cicero fue del 25,8 %, más del doble del promedio del 12,4 % de sus 82 oponentes.


El campeón mundial de diplomacia, Andrew Groff, elogió el enfoque sin emociones del algoritmo para el juego.


“Muchas personas suavizarán su enfoque o se vengarán, pero Cicerón nunca hace eso. Solo está interpretando la situación de la forma en que la ve. Por lo tanto, es despiadado en la implementación de su estrategia, pero no despiadado en el sentido de que moleste a otros jugadores”, dijo.


Según los desarrolladores, Cicero todavía comete algunos errores. Sin embargo, esperan que su investigación sea útil para otras aplicaciones, como chatbots para conversaciones largas o personajes de videojuegos realistas.


Meta también ha liberado el código fuente de Cicero para que cualquiera pueda contribuir a su desarrollo.


Recuerde que en noviembre, el gigante tecnológico apagó AI for Science tres días después del lanzamiento. El algoritmo fue acusado de generar falsificaciones y desinformación.


#META

bottom of page