De los creadores de "Sam Altman lidera el comité que vigila las acciones de Sam Altman", llega GPT-4 supervisando a GPT-4

seunomorelos junio 28, 2024

“GPT-4 para detectar los errores de GPT-4”, con estas palabras ha presentado el presidente de OpenAI, Greg Brockman, la más reciente propuesta de la compañía de inteligencia artificial para mejorar su modelo insignia en el campo de la programación. Estamos hablando de CriticGPT, un modelo basado en GPT-4 diseñado específicamente para detectar errores en la salida de código de ChatGPT.

La firma respaldada por Microsoft asegura que CriticGPT ha demostrado ser muy efectivo para ayudar a las personas a detectar errores en las respuestas del famoso chatbot. En pruebas internas, explican, los resultados de las personas que recibieron la ayuda de CriticGPT superaron en un 60% a las que hicieron el trabajo en solitario. Ahora, este modelo está listo para pasar a la siguiente etapa.

Una nueva herramienta para el aprendizaje por refuerzo

En las tareas de entrenamiento de modelos como GPT-4 entra en escena lo que se conoce como aprendizaje por refuerzo a partir de la retroalimentación humana (RLHF). Se trata de una técnica de machine learning que, en líneas generales, utiliza respuestas creadas por humanos, los llamados entrenadores de la IA, para mejorar la precisión del modelo para determinadas tareas.

OpenAI comenzará a desplegar modelos similares a CriticGPT entre sus entrenadores para ayudarles a detectar los errores cada vez más sutiles que suele reproducir GPT-4 a través de ChatGPT. “Este es un paso para poder evaluar los resultados de los sistemas avanzados de IA que pueden ser difíciles de calificar para las personas sin mejores herramientas”, ha dicho la compañía en su blog.

Pero, ¿cómo funciona CriticGPT? Como podemos ver en la imagen de arriba, el modelo escribe “críticas” a las respuestas de ChatGPT. Estas críticas no siempre son correctas, pero pueden ayudar a los entrenadores humanos a visibilizar problemas que podrían haber pasado desapercibidos. OpenAI describe a esta mecánica como una “asistencia” para el proceso de RLHF.

CriticGPT, al estar basado en GPT-4, también pasó por el proceso de aprendizaje por refuerzo a partir de la retroalimentación humana. Por curioso que parezca, a la luz de las pruebas, parece ser una buena idea para que ChatGPT basado en GPT-4 mejore en tareas de programación, campo donde algunos estudios han alertado el importante porcentaje de respuestas incorrectas del modelo.

Una cadena de jugueterías acaba de publicar el primer spot publicitario creado con Sora: el realismo se queda a medio camino

La compañía también está tratando de mejorar la seguridad de sus modelos después de la disolución de su equipo de “superalineación”. Para ello tiene un comité que está liderado por Sam Altman. Una de las misiones de este comité es presentar recomendaciones al consejo de administración presidido por Greg Brockman, pero de la compañía que tiene como CEO a Sam Altman.

Imágenes | OpenAI | Milad Fakurian | Village Global

En Xataka | YouTube ve un futuro en el que la IA clonará la música actual. Convencer a las discográficas no va a ser nada fácil

source

seunomorelos junio 28, 2024

Read Next

RTP dos Slots Fortune Tiger, Fortune Rabbit e Fortune Mouse da PG Soft

A PG Soft é renomada por seus slots inovadores e visualmente atraentes. Entre os jogos mais populares estão os slots da série Fortune: Fortune Tiger, Fortune Rabbit e Fortune Mouse. Um fator crucial para os jogadores é a taxa de retorno ao jogador (RTP), que indica a porcentagem das apostas que o jogo devolverá aos jogadores ao longo do tempo. Vamos analisar o RTP de cada um desses jogos para entender melhor suas chances de ganhar.

Fortune Tiger

Fortune Tiger é um slot vibrante que celebra a força e a prosperidade do tigre. Com um layout 3x3 e 10 linhas de pagamento fixas, este jogo é fácil de entender e oferece uma jogabilidade dinâmica. O RTP deste slot é de aproximadamente 96%, o que significa que, em média, para cada R$100 apostados, o jogo devolverá R$96 ao longo do tempo. Este percentual, combinado com os multiplicadores aleatórios que podem aumentar os ganhos em até 10x, torna Fortune Tiger uma escolha popular entre os jogadores que buscam grandes prêmios.

Fortune Rabbit

Fortune Rabbit encanta os jogadores com seu tema divertido e gráficos coloridos. Este slot possui um layout 5x4 com 1024 maneiras de ganhar, oferecendo muitas oportunidades para combinações vencedoras. A RTP do Fortune Rabbit é de aproximadamente 96.1%, proporcionando uma ligeira vantagem em comparação a outros slots. As funcionalidades de rodadas grátis e símbolos Wild adicionais aumentam significativamente as chances de ganhar, proporcionando uma experiência de jogo equilibrada e recompensadora.

Fortune Mouse

Fortune Mouse celebra o Ano do Rato com uma jogabilidade simples e envolvente. Com um layout 3x3 e 5 linhas de pagamento fixas, o RTP deste slot é de aproximadamente 96%. Os símbolos Wild e os multiplicadores durante as rodadas tornam o jogo ainda mais emocionante. Este slot é ideal para jogadores que buscam consistência e frequentes vitórias menores, mas com oportunidades de grandes prêmios.

Os slots Fortune Tiger, Fortune Rabbit e Fortune Mouse da PG Soft oferecem RTPs competitivos que garantem boas chances de retorno aos jogadores. Com gráficos impressionantes, jogabilidade envolvente e diversas funcionalidades bônus, cada um desses jogos proporciona uma experiência única e emocionante. Se você está procurando slots com alta RTP e grandes oportunidades de ganhar, esses títulos da PG Soft são excelentes escolhas. Experimente cada um deles e veja qual traz mais sorte para você!

De los creadores de "Sam Altman lidera el comité que vigila las acciones de Sam Altman", llega GPT-4 supervisando a GPT-4

Una nueva herramienta para el aprendizaje por refuerzo

Read Next

El primer plegable tipo concha de Xiaomi se ha filtrado. Sus rivales tienen motivos para preocuparse

Apple utilizó datos de YouTube para entrenar su IA, según Proof News. Es un desafío para los términos del servicio

OnePlus Nord 4: el primer móvil 5G con cuerpo unibody completamente de metal

Volkswagen empieza a comprender a Toyota con el coche eléctrico. Así que invertirá 60.000 millones de euros en combustión

La industria de España se está trasladando de las ciudades tradicionales a la España Vaciada. El motivo: las renovables

Hoy toca clásico: la película ganadora de más Oscar de la historia acaba de llegar a Netflix

“Es un misterio cuando duermen”. Brasil ha encontrado la patrulla perfecta para sus peligrosas cárceles: gansos

Cuatro años después, aún hay miles de personas que no han pasado el covid: el misterio por resolver de "los novid"

La NASA acaba de confirmar la existencia de un túnel en la Luna: una cueva tan grande que plantea nuevas posibilidades

"Un grave riesgo": una vulnerabilidad en Outlook abre la puerta a que los usuarios sean infectados sin darse cuenta

El primer plegable tipo concha de Xiaomi se ha filtrado. Sus rivales tienen motivos para preocuparse

Apple utilizó datos de YouTube para entrenar su IA, según Proof News. Es un desafío para los términos del servicio

OnePlus Nord 4: el primer móvil 5G con cuerpo unibody completamente de metal

Volkswagen empieza a comprender a Toyota con el coche eléctrico. Así que invertirá 60.000 millones de euros en combustión

La industria de España se está trasladando de las ciudades tradicionales a la España Vaciada. El motivo: las renovables

Hoy toca clásico: la película ganadora de más Oscar de la historia acaba de llegar a Netflix

“Es un misterio cuando duermen”. Brasil ha encontrado la patrulla perfecta para sus peligrosas cárceles: gansos

Cuatro años después, aún hay miles de personas que no han pasado el covid: el misterio por resolver de "los novid"

La NASA acaba de confirmar la existencia de un túnel en la Luna: una cueva tan grande que plantea nuevas posibilidades

"Un grave riesgo": una vulnerabilidad en Outlook abre la puerta a que los usuarios sean infectados sin darse cuenta

Deja un comentario Cancelar respuesta

Una nueva herramienta para el aprendizaje por refuerzo

Read Next

El primer plegable tipo concha de Xiaomi se ha filtrado. Sus rivales tienen motivos para preocuparse

Apple utilizó datos de YouTube para entrenar su IA, según Proof News. Es un desafío para los términos del servicio

OnePlus Nord 4: el primer móvil 5G con cuerpo unibody completamente de metal

Volkswagen empieza a comprender a Toyota con el coche eléctrico. Así que invertirá 60.000 millones de euros en combustión

La industria de España se está trasladando de las ciudades tradicionales a la España Vaciada. El motivo: las renovables

Hoy toca clásico: la película ganadora de más Oscar de la historia acaba de llegar a Netflix

“Es un misterio cuando duermen”. Brasil ha encontrado la patrulla perfecta para sus peligrosas cárceles: gansos

Cuatro años después, aún hay miles de personas que no han pasado el covid: el misterio por resolver de "los novid"

La NASA acaba de confirmar la existencia de un túnel en la Luna: una cueva tan grande que plantea nuevas posibilidades

"Un grave riesgo": una vulnerabilidad en Outlook abre la puerta a que los usuarios sean infectados sin darse cuenta

El mecanismo de Anticitera ya es menos enigmático: se lo debemos a la tecnología de las ondas gravitacionales

Ofertas top en smart TVs, móviles, PCs, aires acondicionados portátiles y más para este fin de semana: Cazando Gangas

Related Articles

Deja un comentario Cancelar respuesta

RTP dos Slots Fortune Tiger, Fortune Rabbit e Fortune Mouse da PG Soft

Fortune Tiger

Fortune Rabbit

Fortune Mouse