Esta IA engaña y traiciona para lograr su objetivo. Sorpresa: los humanos también lo hacen

seunomorelos mayo 10, 2024

Sabemos que los modelos de IA generativa cometen errores e inventan cosas, pero esa preocupación se une a otra que es aún más inquietante: la de que una IA acabe engañándonos para lograr sus objetivos. Que es justo lo que acaba de pasar… más o menos.

Nuevo estudio a la vista. En el estudio ‘AI deception: A survey of examples, risks, and potential solutions’ (Patterns (2024), Park et al.), un grupo de investigadores ha tratado de determinar si los sistemas de inteligencia artificial pueden engañar a los seres humanos.

Yo engañé a una inteligencia artificial (Captcha 2x02)

CICERO sabe “hacer trampas”. Hace años que Meta desarrolló un modelo de IA llamado CICERO para competir con seres humanos en ‘Diplomacy’, un juego de estrategia en el que los jugadores intentan conquistar el mundo a base de alianzas. Según los autores del estudio, aunque Meta afirma que diseñó CICERO con el objetivo de ser “principalmente honesto y útil” y que tampoco “apuñalaría por la espalda intencionadamente” a sus aliados humanos, resulta que en el estudio sí lo hizo.

Apuñalando por la espalda. E el estudio los investigadores revelan que “descubrimos que la IA de Meta había aprendido cómo convertirse en maestra del engaño”. Según ellos, el desarrollo de la empresa de Zuckerberg “ha fracasado a la hora de entrenar su IA para ganar de forma honesta”. En esas partidas de Diplomacy mostraron capturas de conversaciones en las que la IA engañaba y traicionaba a sus aliados.

También en póquer o Starcraft II. Los responsables del estudio recuerdan que la IA también ha aprendido a tirarse un farol en partidas de póquer contra jugadores profesionales humanos, a lanzar falsos ataques en Starcraft II para derrotar a sus oponentes o a engañar sobre sus preferencias en simulaciones de negociaciones económicas.

Esto puede ir a más. El peligro es que estos sistemas, que ahora son inofensivos porque están orientados a jugar a juegos de estrategia, acaben convirtiéndose en la base de futuros modelos que aprendan aún mejor cómo engañar a los seres humanos para conseguir sus objetivos, sean los que sean.

Otros expertos dudan. Daniel Chávez Heras, profesor de Cultura Digital e Informática Creativa del King’s College de Londres, destacaba algo importante: “Todos los ejemplos que describen en el artículo se diseñaron para optimizar su rendimiento en entornos en los que el engaño puede ser ventajoso. Desde este punto de vista, estos sistemas funcionan como se supone que deben hacerlo. Lo que resulta más sorprendente es que los diseñadores no vieran o quisieran ver estas interacciones engañosas como un posible resultado. Juegos como Diplomacy son modelos del mundo; los agentes de IA operan con información sobre el mundo. El engaño existe en el mundo. ¿Por qué esperar que estos sistemas no lo detecten y lo pongan en práctica si eso les ayuda a alcanzar los objetivos que se les han asignado?

La IA no sabe que está engañando. Michael Robatos, catedrátivo de IA de la Universidad de Edimburgo, coincidía con Chávez Heras. Según él esos sistemas “no tienen ningún concepto del engaño ni ninguna intención de hacerlo. La única forma de evitar el engaño es que sus diseñadores lo eliminen como opción”. E Diplomacy traicionar es una estrategia válida, y en el póquer ir de farol también lo es, y por eso los seres humanos también aplican ese método para lograr sus objetivos. La IA está haciendo lo mismo. Para estos expertos el problema no es tanto que engañen (si les dejamos que lo hagan), sino que no haya comprobaciones de seguridad cuando se lanzan modelos de IA al mercado.

Imagen | toror con Midjourney

En Xataka | DeepMind anuncia AlphaFold 3: los medicamentos desarrollados con esta IA (y un negocio multimillonario) están muy cerca

source

seunomorelos mayo 10, 2024

Read Next

RTP dos Slots Fortune Tiger, Fortune Rabbit e Fortune Mouse da PG Soft

A PG Soft é renomada por seus slots inovadores e visualmente atraentes. Entre os jogos mais populares estão os slots da série Fortune: Fortune Tiger, Fortune Rabbit e Fortune Mouse. Um fator crucial para os jogadores é a taxa de retorno ao jogador (RTP), que indica a porcentagem das apostas que o jogo devolverá aos jogadores ao longo do tempo. Vamos analisar o RTP de cada um desses jogos para entender melhor suas chances de ganhar.

Fortune Tiger

Fortune Tiger é um slot vibrante que celebra a força e a prosperidade do tigre. Com um layout 3x3 e 10 linhas de pagamento fixas, este jogo é fácil de entender e oferece uma jogabilidade dinâmica. O RTP deste slot é de aproximadamente 96%, o que significa que, em média, para cada R$100 apostados, o jogo devolverá R$96 ao longo do tempo. Este percentual, combinado com os multiplicadores aleatórios que podem aumentar os ganhos em até 10x, torna Fortune Tiger uma escolha popular entre os jogadores que buscam grandes prêmios.

Fortune Rabbit

Fortune Rabbit encanta os jogadores com seu tema divertido e gráficos coloridos. Este slot possui um layout 5x4 com 1024 maneiras de ganhar, oferecendo muitas oportunidades para combinações vencedoras. A RTP do Fortune Rabbit é de aproximadamente 96.1%, proporcionando uma ligeira vantagem em comparação a outros slots. As funcionalidades de rodadas grátis e símbolos Wild adicionais aumentam significativamente as chances de ganhar, proporcionando uma experiência de jogo equilibrada e recompensadora.

Fortune Mouse

Fortune Mouse celebra o Ano do Rato com uma jogabilidade simples e envolvente. Com um layout 3x3 e 5 linhas de pagamento fixas, o RTP deste slot é de aproximadamente 96%. Os símbolos Wild e os multiplicadores durante as rodadas tornam o jogo ainda mais emocionante. Este slot é ideal para jogadores que buscam consistência e frequentes vitórias menores, mas com oportunidades de grandes prêmios.

Os slots Fortune Tiger, Fortune Rabbit e Fortune Mouse da PG Soft oferecem RTPs competitivos que garantem boas chances de retorno aos jogadores. Com gráficos impressionantes, jogabilidade envolvente e diversas funcionalidades bônus, cada um desses jogos proporciona uma experiência única e emocionante. Se você está procurando slots com alta RTP e grandes oportunidades de ganhar, esses títulos da PG Soft são excelentes escolhas. Experimente cada um deles e veja qual traz mais sorte para você!

Esta IA engaña y traiciona para lograr su objetivo. Sorpresa: los humanos también lo hacen

Read Next

El primer plegable tipo concha de Xiaomi se ha filtrado. Sus rivales tienen motivos para preocuparse

Apple utilizó datos de YouTube para entrenar su IA, según Proof News. Es un desafío para los términos del servicio

OnePlus Nord 4: el primer móvil 5G con cuerpo unibody completamente de metal

Volkswagen empieza a comprender a Toyota con el coche eléctrico. Así que invertirá 60.000 millones de euros en combustión

La industria de España se está trasladando de las ciudades tradicionales a la España Vaciada. El motivo: las renovables

Hoy toca clásico: la película ganadora de más Oscar de la historia acaba de llegar a Netflix

“Es un misterio cuando duermen”. Brasil ha encontrado la patrulla perfecta para sus peligrosas cárceles: gansos

Cuatro años después, aún hay miles de personas que no han pasado el covid: el misterio por resolver de "los novid"

La NASA acaba de confirmar la existencia de un túnel en la Luna: una cueva tan grande que plantea nuevas posibilidades

"Un grave riesgo": una vulnerabilidad en Outlook abre la puerta a que los usuarios sean infectados sin darse cuenta

El primer plegable tipo concha de Xiaomi se ha filtrado. Sus rivales tienen motivos para preocuparse

Apple utilizó datos de YouTube para entrenar su IA, según Proof News. Es un desafío para los términos del servicio

OnePlus Nord 4: el primer móvil 5G con cuerpo unibody completamente de metal

Volkswagen empieza a comprender a Toyota con el coche eléctrico. Así que invertirá 60.000 millones de euros en combustión

La industria de España se está trasladando de las ciudades tradicionales a la España Vaciada. El motivo: las renovables

Hoy toca clásico: la película ganadora de más Oscar de la historia acaba de llegar a Netflix

“Es un misterio cuando duermen”. Brasil ha encontrado la patrulla perfecta para sus peligrosas cárceles: gansos

Cuatro años después, aún hay miles de personas que no han pasado el covid: el misterio por resolver de "los novid"

La NASA acaba de confirmar la existencia de un túnel en la Luna: una cueva tan grande que plantea nuevas posibilidades

"Un grave riesgo": una vulnerabilidad en Outlook abre la puerta a que los usuarios sean infectados sin darse cuenta

Deja un comentario Cancelar respuesta

Read Next

El primer plegable tipo concha de Xiaomi se ha filtrado. Sus rivales tienen motivos para preocuparse

Apple utilizó datos de YouTube para entrenar su IA, según Proof News. Es un desafío para los términos del servicio

OnePlus Nord 4: el primer móvil 5G con cuerpo unibody completamente de metal

Volkswagen empieza a comprender a Toyota con el coche eléctrico. Así que invertirá 60.000 millones de euros en combustión

La industria de España se está trasladando de las ciudades tradicionales a la España Vaciada. El motivo: las renovables

Hoy toca clásico: la película ganadora de más Oscar de la historia acaba de llegar a Netflix

“Es un misterio cuando duermen”. Brasil ha encontrado la patrulla perfecta para sus peligrosas cárceles: gansos

Cuatro años después, aún hay miles de personas que no han pasado el covid: el misterio por resolver de "los novid"

La NASA acaba de confirmar la existencia de un túnel en la Luna: una cueva tan grande que plantea nuevas posibilidades

"Un grave riesgo": una vulnerabilidad en Outlook abre la puerta a que los usuarios sean infectados sin darse cuenta

El gran cambio en el diseño de WhatsApp: nuevo buscador con IA, mejor modo oscuro y todos los cambios que han llegado (y llegarán)

Mientras España tira 400.000 toneladas de limones, los agricultores han tenido una idea: arrancar miles de árboles

Related Articles

Deja un comentario Cancelar respuesta

RTP dos Slots Fortune Tiger, Fortune Rabbit e Fortune Mouse da PG Soft

Fortune Tiger

Fortune Rabbit

Fortune Mouse