
La IA se ha convertido en el mejor ejemplo de que si no pagas por el producto, eres el producto
Lo decían en el documental ‘El dilema de las redes sociales’: si no estás pagando por el producto, tú eres el producto. Seguramente hayas escuchado la frase más de una vez en referencia a las apps y servicios que no pagamos con dinero, sino con otro tipo de moneda. Redes sociales, navegadores, apps de GPS… casi todas recopilan nuestra información personal y datos de navegación para hacer negocio. Las apps de inteligencia artificial no son distintas, de hecho, hay una carrera para atraer cada vez a más usuarios y forjar alianzas para conseguir datos con los que seguir entrenando sus chatbots.
Mejorar la experiencia. “Cuando compartes tu contenido con nosotros, ayudas a que nuestros modelos sean más precisos y a que pueda resolver mejor tus problemas específicos”, esta frase está sacada de la política de privacidad de ChatGPT y en la de Gemini hay otras parecidas. Anthropic era la única que mantenía privadas la conversaciones con Claude, pero ayer mismo anunciaron que cambiaban su política. Nuestra información personal, datos de uso y sobre todo las conversaciones sirven para que los modelos se sigan entrenando y vayan mejorando. Podemos desactivar esta opción si queremos, pero tenemos que ser nosotros quienes lo hagamos. Por defecto viene activada.
Escasez de datos. La IA necesita muchos datos para ser entrenada, muchísimos. Con los primeros modelos de lenguaje se usó todo tipo de contenido, incluyendo contenido protegido por copyright como libros o imágenes de obras de arte. Pero los datos no son infinitos. A finales de 2021 ya se hablaba de un problema de escasez y a principios de este año, Elon Musk decía que la IA ya había consumido todo el conocimiento humano. Esto supone un problema para el avance de la IA y sería responsable en gran parte de que el ritmo se haya ralentizado.
Soluciones. Las empresas de IA han tenido que buscarse la vida para conseguir nuevos datos. OpenAI transcribió un millón de horas de YouTube para entrenar a GPT-4, Google decidió que usaría cualquier información publicada en internet para mejorar su IA y Musk cree que el futuro está en los datos sintéticos generados por la propia IA. Pero hay algo que también se puede usar para entrenar la IA y son nuestras conversaciones con ella. Con los primeros modelos no tenían tantos usuarios, pero actualmente el volumen de datos que generamos los usuarios es mucho mayor. Sólo ChatGPT tiene 800 millones de usuarios, suena como un botín demasiado jugoso como para no usarlo.
Regalando IA. Las conversaciones que tenemos con ChatGPT pueden ser útiles, pero es aún más útil cuando son datos de usuarios de grupos más específicos. Cuentan en Rest of World que para conseguirlo, las empresas de IA están forjando alianzas con otras empresas y organismos que les permitan acceder a datos que no se pueden conseguir haciendo scraping de la web. OpenAI se ha asociado con Shopee y ofrece su plan Plus para los usuarios VIP en Indonesia, Vietnam y Tailandia. Google ofrece su plan Gemini Pro gratis durante un año a estudiantes en India y Perplexity Pro está disponible gratis a través de operadores como Movistar o Airtel en India… Estas alianzas aumentan su base de usuarios y proporcionan datos reales de consumo de grupos concretos, lo que les permite entrenar sus modelos de forma más precisa.
El caso chino. China es un ejemplo de cómo acceder a datos específicos puede dar ventaja a la hora de desarrollar soluciones eficaces. Las empresas de investigación farmacéutica que usan IA tienen acceso a los datos del sistema nacional de salud, el cual cubre a más de 600 millones de personas. Esto les da una ventaja competitiva y ha hecho que las empresas chinas firmen acuerdos millonarios con grandes farmacéuticas.
Preocupación. Expertos como Sameer Patil, director del Observer Research Foundation, llama a establecer una regulación más clara, especialmente en sectores sensibles como la salud o finanzas: “Las empresas participantes tendrán que garantizar que los conjuntos de datos no sean personalizados y sean anónimos”, afirma en declaraciones a Rest of World.
Imagen | ChatGPT
–
La noticia
La IA se ha convertido en el mejor ejemplo de que si no pagas por el producto, eres el producto
fue publicada originalmente en
Xataka
por
Amparo Babiloni
.