Apple utilizó datos de YouTube para entrenar su IA, según Proof News. Es un desafío para los términos del servicio

seunomorelos julio 17, 2024

Aunque todavía tienen mucho que mejorar, los chatbots de inteligencia artificial (IA) no dejan de sorprendernos con su capacidad para mantener conversaciones fluidas, responder a preguntas, analizar datos, entre muchas otras tareas. Para que todo esto sea posible, no obstante, las compañías de IA necesitan entrenar a los modelos de lenguaje que impulsan sus aplicaciones con ingentes cantidades de datos.

En la actualidad este es un tema que levanta cierta controversia. Los gigantes tecnológicos que desarrollan algunas de las soluciones de IA más importantes del momento no son demasiado explicativos a la hora de informar de dónde provienen los datos de entrenamiento utilizados. Ahora, una investigación de Proof News señala que firmas como Apple, Anthropic, Nvidia y Salesforce utilizaron datos de YouTube.

Subtítulos de YouTube para entrenar modelos de IA

El informe dice que una organización sin ánimos de lucro denominada EleutherAI recopiló los subtítulos de 173.536 vídeos de YouTube, extraídos de más de 48.000 canales. Los datos recopilados, que no incluían imágenes de vídeo, sino texto sin formato de los vídeos, generalmente con traducciones a diferentes idiomas, fueron utilizados para crear un conjunto de datos titulado “YouTube Subtitles”.

YouTube Subtitles, explican, incluye material de creador de contenidos como MrBeast y Marques Brownlee. También hay datos de canales educativos como Khan Academy, MIT y Harvard. El conjunto de datos de los subtítulos de YouTube, a su vez, forma parte de “Pile”, un set de entrenamiento conformado por 22 conjuntos de datos que también incluye material del Parlamento Europeo, Wikipedia en inglés y más.

La investigación añade que Pile está abierto al público. Bajo esta premisa, una gran cantidad de académicos y compañías los han utilizado para sus trabajos relacionados a la IA. Entre ellos se encuentran las mencionadas tecnológicas estadounidenses, que no tomaron los datos directamente desde YouTube, sino que se sirvieron del trabajo realizado por EleutherAI para entrenar algunos de sus modelos de IA.

Los términos de servicio de YouTube

El presente escenario nos lleva a preguntarnos qué papel juegan los términos de servicio de YouTube. A comienzos del segundo trimestre del año, el CEO de YouTube, Neal Mohan, brindó una respuesta bastante interesante tras ser preguntado si creía que OpenAI estaba entrenando Sora con material de su plataforma de vídeos.

Mohan dijo que si bien cierto contenido de YouTube, como el título del vídeo, el nombre del canal o el nombre del creador están expuestos a la tarea web scraping (raspado web) para que pueda aparecer en los motores de búsqueda, las reglas actuales no permiten la descarga de los vídeos o sus transcripciones.

Las transcripciones son, en esencia, la materia prima de los subtítulos, porque contienen el texto de lo que se dice en el video. En este sentido, el ejecutivo no dudó en afirmar en abril de este año que la descarga de transcripciones o fragmentos de vídeos es una “clara infracción” de los términos de servicio de la plataforma.

Hacer este anuncio habría demandado mucho tiempo y dinero. Alguien lo hizo en menos de 24 horas con la IA de Runway

Aquí, precisamente, entra en escena una segunda cuestión. Si bien el informe asegura que Apple, Anthropic, Nvidia y Salesforce utilizaron subtítulos de YouTube para entrenar algunos de sus modelos, no fueron estas compañías las que rasparon la plataforma para obtener estos datos. De esta tarea se encargó EleutherAI. Entonces, la gran pregunta es: si hay una infracción, ¿de quién es la responsabilidad?

Imágenes | Freepik |

En Xataka | 5.000 “tokens” de mi blog están siendo usados para entrenar una IA. No he dado mi permiso

En Xataka | OpenAI tiene un nuevo proyecto secreto, según Reuters: ‘Strawberry’ podrá razonar y hacer tareas complejas

source

seunomorelos julio 17, 2024

Read Next

RTP dos Slots Fortune Tiger, Fortune Rabbit e Fortune Mouse da PG Soft

A PG Soft é renomada por seus slots inovadores e visualmente atraentes. Entre os jogos mais populares estão os slots da série Fortune: Fortune Tiger, Fortune Rabbit e Fortune Mouse. Um fator crucial para os jogadores é a taxa de retorno ao jogador (RTP), que indica a porcentagem das apostas que o jogo devolverá aos jogadores ao longo do tempo. Vamos analisar o RTP de cada um desses jogos para entender melhor suas chances de ganhar.

Fortune Tiger

Fortune Tiger é um slot vibrante que celebra a força e a prosperidade do tigre. Com um layout 3x3 e 10 linhas de pagamento fixas, este jogo é fácil de entender e oferece uma jogabilidade dinâmica. O RTP deste slot é de aproximadamente 96%, o que significa que, em média, para cada R$100 apostados, o jogo devolverá R$96 ao longo do tempo. Este percentual, combinado com os multiplicadores aleatórios que podem aumentar os ganhos em até 10x, torna Fortune Tiger uma escolha popular entre os jogadores que buscam grandes prêmios.

Fortune Rabbit

Fortune Rabbit encanta os jogadores com seu tema divertido e gráficos coloridos. Este slot possui um layout 5x4 com 1024 maneiras de ganhar, oferecendo muitas oportunidades para combinações vencedoras. A RTP do Fortune Rabbit é de aproximadamente 96.1%, proporcionando uma ligeira vantagem em comparação a outros slots. As funcionalidades de rodadas grátis e símbolos Wild adicionais aumentam significativamente as chances de ganhar, proporcionando uma experiência de jogo equilibrada e recompensadora.

Fortune Mouse

Fortune Mouse celebra o Ano do Rato com uma jogabilidade simples e envolvente. Com um layout 3x3 e 5 linhas de pagamento fixas, o RTP deste slot é de aproximadamente 96%. Os símbolos Wild e os multiplicadores durante as rodadas tornam o jogo ainda mais emocionante. Este slot é ideal para jogadores que buscam consistência e frequentes vitórias menores, mas com oportunidades de grandes prêmios.

Os slots Fortune Tiger, Fortune Rabbit e Fortune Mouse da PG Soft oferecem RTPs competitivos que garantem boas chances de retorno aos jogadores. Com gráficos impressionantes, jogabilidade envolvente e diversas funcionalidades bônus, cada um desses jogos proporciona uma experiência única e emocionante. Se você está procurando slots com alta RTP e grandes oportunidades de ganhar, esses títulos da PG Soft são excelentes escolhas. Experimente cada um deles e veja qual traz mais sorte para você!

Apple utilizó datos de YouTube para entrenar su IA, según Proof News. Es un desafío para los términos del servicio

Subtítulos de YouTube para entrenar modelos de IA

Los términos de servicio de YouTube

Read Next

El primer plegable tipo concha de Xiaomi se ha filtrado. Sus rivales tienen motivos para preocuparse

OnePlus Nord 4: el primer móvil 5G con cuerpo unibody completamente de metal

Volkswagen empieza a comprender a Toyota con el coche eléctrico. Así que invertirá 60.000 millones de euros en combustión

La industria de España se está trasladando de las ciudades tradicionales a la España Vaciada. El motivo: las renovables

Hoy toca clásico: la película ganadora de más Oscar de la historia acaba de llegar a Netflix

“Es un misterio cuando duermen”. Brasil ha encontrado la patrulla perfecta para sus peligrosas cárceles: gansos

Cuatro años después, aún hay miles de personas que no han pasado el covid: el misterio por resolver de "los novid"

La NASA acaba de confirmar la existencia de un túnel en la Luna: una cueva tan grande que plantea nuevas posibilidades

"Un grave riesgo": una vulnerabilidad en Outlook abre la puerta a que los usuarios sean infectados sin darse cuenta

Beta pública de iOS 18, iPadOS 18, WatchOS 11 y macOS 15 Sequoia: cómo bajarlas e instalarlas

El primer plegable tipo concha de Xiaomi se ha filtrado. Sus rivales tienen motivos para preocuparse

OnePlus Nord 4: el primer móvil 5G con cuerpo unibody completamente de metal

Volkswagen empieza a comprender a Toyota con el coche eléctrico. Así que invertirá 60.000 millones de euros en combustión

La industria de España se está trasladando de las ciudades tradicionales a la España Vaciada. El motivo: las renovables

Hoy toca clásico: la película ganadora de más Oscar de la historia acaba de llegar a Netflix

“Es un misterio cuando duermen”. Brasil ha encontrado la patrulla perfecta para sus peligrosas cárceles: gansos

Cuatro años después, aún hay miles de personas que no han pasado el covid: el misterio por resolver de "los novid"

La NASA acaba de confirmar la existencia de un túnel en la Luna: una cueva tan grande que plantea nuevas posibilidades

"Un grave riesgo": una vulnerabilidad en Outlook abre la puerta a que los usuarios sean infectados sin darse cuenta

Beta pública de iOS 18, iPadOS 18, WatchOS 11 y macOS 15 Sequoia: cómo bajarlas e instalarlas

Deja un comentario Cancelar respuesta

Subtítulos de YouTube para entrenar modelos de IA

Los términos de servicio de YouTube

Read Next

El primer plegable tipo concha de Xiaomi se ha filtrado. Sus rivales tienen motivos para preocuparse

OnePlus Nord 4: el primer móvil 5G con cuerpo unibody completamente de metal

Volkswagen empieza a comprender a Toyota con el coche eléctrico. Así que invertirá 60.000 millones de euros en combustión

La industria de España se está trasladando de las ciudades tradicionales a la España Vaciada. El motivo: las renovables

Hoy toca clásico: la película ganadora de más Oscar de la historia acaba de llegar a Netflix

“Es un misterio cuando duermen”. Brasil ha encontrado la patrulla perfecta para sus peligrosas cárceles: gansos

Cuatro años después, aún hay miles de personas que no han pasado el covid: el misterio por resolver de "los novid"

La NASA acaba de confirmar la existencia de un túnel en la Luna: una cueva tan grande que plantea nuevas posibilidades

"Un grave riesgo": una vulnerabilidad en Outlook abre la puerta a que los usuarios sean infectados sin darse cuenta

Beta pública de iOS 18, iPadOS 18, WatchOS 11 y macOS 15 Sequoia: cómo bajarlas e instalarlas

Obras de rehabilitación y tecnificación hídrica mejorarán el riego en Amacuzac

El primer plegable tipo concha de Xiaomi se ha filtrado. Sus rivales tienen motivos para preocuparse

Related Articles

Deja un comentario Cancelar respuesta

RTP dos Slots Fortune Tiger, Fortune Rabbit e Fortune Mouse da PG Soft

Fortune Tiger

Fortune Rabbit

Fortune Mouse