El precio a pagar por tener IA es el saqueo de todo el contenido de Internet. Y Perplexity es solo el último ejemplo

seunomorelos julio 1, 2024

Midjourney y ChatGPT parecen mágicos. Crean obras digitales y textos de una forma asombrosa, y aunque a menudo meten la pata, sus resultados son a menudo convincentes e incluso impresionantes. Esa foto parece del Papa con abrigo de Balenciaga sigue pareciendo real, y ese código en Python funciona. Insisto. Parecen mágicos.

Pero tanto estos modelos de IA generativa como sus competidores no son mágicos. Son loros estocásticos que hacen uso de patrones estadísticos. No entienden lo que crean o generan. Y además, todo lo que hacen está basado en algo aún más importante.

Robar.

Si está en internet, puedo usarlo para mi IA

Es lo que están haciendo desde el principio. Las grandes empresas de IA necesitan ingentes cantidades de datos para entrenar a sus modelos, así que lo que han hecho es, sencillamente, cogerlos de internet. Sin avisar, sin pedir permiso, y sin aclarar luego qué datos habían usado.

Ninguna empresa de IA aclara cómo ha entrenado a esos modelos. No sabemos con exactitud de dónde han sacado toda la información. ¿Qué libros, sitios web, o imágenes han incluido en el entrenamiento? La transparencia es prácticamente nula.

Ninguna lo aclara del todo, y todas las empresas se escudan en el concepto del “uso justo” (fair use). Este concepto desarrollado en el derecho anglosajón permite el uso limitado de material protegido sin que sea necesario pedir permiso por hacerlo.

Esa recolección masiva y voraz de datos ha hecho que muchas empresas de IA comiencen a tener problemas legales. Las demandas por posibles violaciones de propiedad intelectual comenzaron a llegar muy pronto y se fueron haciendo cada vez más frecuentes.

¿Qué comenzaron a hacer las empresas de IA ante esas demandas (o la amenaza de que acabaran afectándolas)? Llegar a acuerdos con algunos proveedores de contenidos.

5.000 "tokens" de mi blog están siendo usados para entrenar una IA. No he dado mi permiso

Antes algunas cogían todo lo que podían de plataformas como Reddit, pero ahora tanto Google como OpenAI han resuelto sus diferencias tras negociar distintos tipos de quid pro quo.

Y lo que ha pasado con Reddit ha pasado con grupos editoriales como Prisa o Le Monde, y seguirá ocurriendo en el futuro: así las grandes de la IA se protegen y pueden seguir alimentando sus modelos sin parar.

Perplexity y las gotas que colman los vasos

Pero hay comportamientos aún más conflictivos. Tenemos un ejemplo perfecto en Perplexity, que poco a poco se convirtió en una sorprendente alternativa a Google e incluso a la Wikipedia.

Aquí nos hemos encontrado no con un motor de búsquedas, sino, como apuntaban en The Verge, con un “motor de respuestas”. El problema es cómo ha logrado hacer lo que hace.

Que no es ni más ni menos que robando.

Lo ha hecho aún en mayor medida que algunas de sus competidoras, porque esta startup está haciendo cosas inauditas. En primer lugar, está plagiando artículos enteros de otros medios. Lo hizo con un tema de Wired, por ejemplo.

En segundo, está saltándose los muros de pago de publicaciones como Forbes para poder recolectar información relativa a ciertos temas. No solo se saltó ese muro de pago, sino que apenas citó la investigación original de Forbes y plagió los gráficos e imágenes de ese tema.

El descubrimiento generó una nueva polémica en este ámbito. En Wired directamente acusaron a Perplexity de ser una máquina de hacer mierda, pero la empresa intentó salir al paso indicando que está debatiendo la forma de compartir ingresos con las publicaciones.

Esa empresa de inteligencia artificial no es la única en saltarse esos muros: estos días se ha revelado que Poe, el chatbot de la plataforma de preguntas y respuestas Quora, también lo hacía. Mientras que algunos expertos afirman que esto es una violación clara de los derechos de autor de esos contenidos, en Quora afirman que no es así y que se basan en servicios del tipo “leer más tarde” que cumplen con la ley.

Y entonces llegó el tercer y último descubrimiento a manos de un desarrollador llamado Robb Knight. Como explicó en su blog, en Perplexity estaban ignorando las directrices de los ficheros robots.txt que precisamente indican a los rastreadores de internet qué páginas rastrear y cuáles no.

Cómo conseguiremos que la inteligencia artificial no se nos vaya de las manos

Esos pequeños ficheros siempre han servido como forma de hacer que por ejemplo Google no mostrase en sus resultados ciertas partes de un sitio wbe, pero a los chicos de Perplexity les daba igual: ellos lo recolectaban absolutamente todo.

Srinivas echó balones fuera: no eran ellos quienes se los saltaban, sino las empresas que habían contratado para que rastrearan la web y suministraran más y más datos para su modelo de IA. Y cómo no, Perplexity no es la única en esquivar e ignorar los ficheros robots.txt: OpenAI y Anthropic hacen exactamente lo mismo.

Esa actitud ha hecho que por ejemplo Reddit se ponga en pie de guerra contra los scrapers, aunque la cosa ya venía de lejos. The New York Times, por ejemplo, demandó a Microsoft y a OpenAI porque no quiere que un chatbot mate al periodismo. Este diario ya publicó un reportaje en abril de 2024 avisando de cómo la voracidad de empresas como OpenAI, Google o Meta estaban (supuestamente) pasándose de la raya a la hora de entrenar sus modelos.

Pero es que ahí no acaba todo.

Captura De Pantalla 2024 07 01 A Las 10 59 09

Así lo demostraba el responsable de IA de Microsoft, Mustafa Suleyman, que en una entrevista reciente con CNBC defendía esa recolección indiscriminada de datos en internet:

“Creo que con respecto al contenido que ya está en la web abierta, el contrato social de ese contenido desde los años 90 ha sido que es de uso justo. Cualquiera puede copiarlo, recrearlo, reproducirlo. Ese ha sido el “freeware”, si se quiere, ese ha sido el entendimiento”.

Esa afirmación es terrible, sobre todo porque asume justo lo que están asumiendo todas las grandes de internet. Que no es más ni menos que todo lo que publicamos en internet está ahí para que ellas hagan lo que quieran con ello.

Que es precisamente lo que están haciendo.

Imagen | Xataka con Freepik

En Xataka | Los fallos no son lo que frena la IA de Google: consume en un segundo tanta electricidad como cargar siete coches eléctricos

source

seunomorelos julio 1, 2024

Read Next

RTP dos Slots Fortune Tiger, Fortune Rabbit e Fortune Mouse da PG Soft

A PG Soft é renomada por seus slots inovadores e visualmente atraentes. Entre os jogos mais populares estão os slots da série Fortune: Fortune Tiger, Fortune Rabbit e Fortune Mouse. Um fator crucial para os jogadores é a taxa de retorno ao jogador (RTP), que indica a porcentagem das apostas que o jogo devolverá aos jogadores ao longo do tempo. Vamos analisar o RTP de cada um desses jogos para entender melhor suas chances de ganhar.

Fortune Tiger

Fortune Tiger é um slot vibrante que celebra a força e a prosperidade do tigre. Com um layout 3x3 e 10 linhas de pagamento fixas, este jogo é fácil de entender e oferece uma jogabilidade dinâmica. O RTP deste slot é de aproximadamente 96%, o que significa que, em média, para cada R$100 apostados, o jogo devolverá R$96 ao longo do tempo. Este percentual, combinado com os multiplicadores aleatórios que podem aumentar os ganhos em até 10x, torna Fortune Tiger uma escolha popular entre os jogadores que buscam grandes prêmios.

Fortune Rabbit

Fortune Rabbit encanta os jogadores com seu tema divertido e gráficos coloridos. Este slot possui um layout 5x4 com 1024 maneiras de ganhar, oferecendo muitas oportunidades para combinações vencedoras. A RTP do Fortune Rabbit é de aproximadamente 96.1%, proporcionando uma ligeira vantagem em comparação a outros slots. As funcionalidades de rodadas grátis e símbolos Wild adicionais aumentam significativamente as chances de ganhar, proporcionando uma experiência de jogo equilibrada e recompensadora.

Fortune Mouse

Fortune Mouse celebra o Ano do Rato com uma jogabilidade simples e envolvente. Com um layout 3x3 e 5 linhas de pagamento fixas, o RTP deste slot é de aproximadamente 96%. Os símbolos Wild e os multiplicadores durante as rodadas tornam o jogo ainda mais emocionante. Este slot é ideal para jogadores que buscam consistência e frequentes vitórias menores, mas com oportunidades de grandes prêmios.

Os slots Fortune Tiger, Fortune Rabbit e Fortune Mouse da PG Soft oferecem RTPs competitivos que garantem boas chances de retorno aos jogadores. Com gráficos impressionantes, jogabilidade envolvente e diversas funcionalidades bônus, cada um desses jogos proporciona uma experiência única e emocionante. Se você está procurando slots com alta RTP e grandes oportunidades de ganhar, esses títulos da PG Soft são excelentes escolhas. Experimente cada um deles e veja qual traz mais sorte para você!

El precio a pagar por tener IA es el saqueo de todo el contenido de Internet. Y Perplexity es solo el último ejemplo

Si está en internet, puedo usarlo para mi IA

Perplexity y las gotas que colman los vasos

Read Next

El primer plegable tipo concha de Xiaomi se ha filtrado. Sus rivales tienen motivos para preocuparse

Apple utilizó datos de YouTube para entrenar su IA, según Proof News. Es un desafío para los términos del servicio

OnePlus Nord 4: el primer móvil 5G con cuerpo unibody completamente de metal

Volkswagen empieza a comprender a Toyota con el coche eléctrico. Así que invertirá 60.000 millones de euros en combustión

La industria de España se está trasladando de las ciudades tradicionales a la España Vaciada. El motivo: las renovables

Hoy toca clásico: la película ganadora de más Oscar de la historia acaba de llegar a Netflix

“Es un misterio cuando duermen”. Brasil ha encontrado la patrulla perfecta para sus peligrosas cárceles: gansos

Cuatro años después, aún hay miles de personas que no han pasado el covid: el misterio por resolver de "los novid"

La NASA acaba de confirmar la existencia de un túnel en la Luna: una cueva tan grande que plantea nuevas posibilidades

"Un grave riesgo": una vulnerabilidad en Outlook abre la puerta a que los usuarios sean infectados sin darse cuenta

El primer plegable tipo concha de Xiaomi se ha filtrado. Sus rivales tienen motivos para preocuparse

Apple utilizó datos de YouTube para entrenar su IA, según Proof News. Es un desafío para los términos del servicio

OnePlus Nord 4: el primer móvil 5G con cuerpo unibody completamente de metal

Volkswagen empieza a comprender a Toyota con el coche eléctrico. Así que invertirá 60.000 millones de euros en combustión

La industria de España se está trasladando de las ciudades tradicionales a la España Vaciada. El motivo: las renovables

Hoy toca clásico: la película ganadora de más Oscar de la historia acaba de llegar a Netflix

“Es un misterio cuando duermen”. Brasil ha encontrado la patrulla perfecta para sus peligrosas cárceles: gansos

Cuatro años después, aún hay miles de personas que no han pasado el covid: el misterio por resolver de "los novid"

La NASA acaba de confirmar la existencia de un túnel en la Luna: una cueva tan grande que plantea nuevas posibilidades

"Un grave riesgo": una vulnerabilidad en Outlook abre la puerta a que los usuarios sean infectados sin darse cuenta

Deja un comentario Cancelar respuesta

Si está en internet, puedo usarlo para mi IA

Perplexity y las gotas que colman los vasos

Read Next

El primer plegable tipo concha de Xiaomi se ha filtrado. Sus rivales tienen motivos para preocuparse

Apple utilizó datos de YouTube para entrenar su IA, según Proof News. Es un desafío para los términos del servicio

OnePlus Nord 4: el primer móvil 5G con cuerpo unibody completamente de metal

Volkswagen empieza a comprender a Toyota con el coche eléctrico. Así que invertirá 60.000 millones de euros en combustión

La industria de España se está trasladando de las ciudades tradicionales a la España Vaciada. El motivo: las renovables

Hoy toca clásico: la película ganadora de más Oscar de la historia acaba de llegar a Netflix

“Es un misterio cuando duermen”. Brasil ha encontrado la patrulla perfecta para sus peligrosas cárceles: gansos

Cuatro años después, aún hay miles de personas que no han pasado el covid: el misterio por resolver de "los novid"

La NASA acaba de confirmar la existencia de un túnel en la Luna: una cueva tan grande que plantea nuevas posibilidades

"Un grave riesgo": una vulnerabilidad en Outlook abre la puerta a que los usuarios sean infectados sin darse cuenta

Por lluvia, AMLO pospone ceremonia del quinto aniversario de la Guardia Nacional

El IVA de la luz baja por sorpresa del 21% al 10%. Es señal que el precio de la electricidad está volviendo a subir

Related Articles

Deja un comentario Cancelar respuesta

RTP dos Slots Fortune Tiger, Fortune Rabbit e Fortune Mouse da PG Soft

Fortune Tiger

Fortune Rabbit

Fortune Mouse