¿Alguna vez te has preguntado de dónde provienen los datos que alimentan las inteligencias artificiales que usamos a diario? Un nuevo instrumento, Data Provenance Explorer, se presenta como un faro en la neblina, buscando aportar claridad y transparencia al complejo mundo de los conjuntos de datos en IA generativa.
La procedencia de datos es un término que se refiere al origen y el recorrido de un conjunto de datos: cómo se recopiló, procesó y transformó. Conocer la procedencia es vital para entender la legalidad y la ética detrás del uso de estos datos, especialmente en aplicaciones de IA que pueden tener implicaciones comerciales o sociales.
El Data Provenance Explorer es el resultado de un esfuerzo conjunto entre expertos en aprendizaje automático y derecho de instituciones como el MIT, Cohere, Harvard Law School, Carnegie Mellon University y Apple. Esta colaboración interdisciplinaria busca abordar las complejidades legales y éticas que rodean a los datos de entrenamiento de IA.
Según el equipo detrás de la herramienta, existe una crisis de transparencia en datos. Plataformas de código abierto como GitHub y Papers with Code tienen un alto porcentaje de conjuntos de datos sin licencia, que oscila entre el 72% y el 83%. Esto crea un terreno fértil para ambigüedades legales y éticas.
Kathy Lange, directora de investigación para IDC, señala que la industria de la IA está cada vez más centrada en el uso seguro y legal de los datos. Aquellos proveedores de IA que prioricen la transparencia, responsabilidad y cumplimiento en la procedencia de datos tendrán una ventaja competitiva.
Herramientas como Nightshade están surgiendo para alterar sutilmente obras de arte digitales y dificultar su uso en entrenamiento de IA. Paralelamente, hay acciones legales en curso por parte de titulares de derechos de autor, como la comediante y autora Sarah Silverman, que están demandando a empresas como OpenAI.
El caso de ChatGPT
Los modelos de lenguaje son algoritmos de aprendizaje automático que se entrenan utilizando grandes cantidades de texto. Este entrenamiento les permite generar respuestas coherentes y contextualmente relevantes a las preguntas o comandos que reciben.
Los datos para entrenar modelos como ChatGPT provienen de una variedad de fuentes, que incluyen libros, artículos académicos, sitios web, foros en línea y más. Estos datos se procesan y filtran para entrenar el modelo.
Conocer el origen de los datos es crucial, no solo para la eficacia del modelo sino también para abordar cuestiones éticas como el sesgo y la representatividad. La procedencia de los datos puede influir en cómo el modelo interactúa con los usuarios y en las respuestas que genera.
Empresas como OpenAI, que desarrollan modelos como ChatGPT, están tomando medidas para ser más transparentes sobre las fuentes de datos y cómo se manejan aspectos como el sesgo y la ética. Sin embargo, la transparencia completa es un desafío debido a la magnitud de los datos y las implicaciones legales.
El Data Provenance Explorer es un paso hacia un futuro donde la transparencia y la ética en IA generativa sean la norma y no la excepción. Su impacto podría ser significativo en cómo se desarrollan, se despliegan y se regulan futuras aplicaciones de IA, aunque aún faltan muchos protagonistas del sector que tendrían que involucrarse bastante en este tema para que las soluciones no sean parches.
【Protección de datos】La tarjeta sd de 982gb está fabricada a partir de múltiples procesos complejos. Para ofrecer el mejor rendimiento y estabilidad, se ha probado en entornos extremos. Más protección y confianza. 【Seguro y fiable】Las tarjetas de mem... read more
Epson EcoTank ET-2826, Impresora WiFi A4 Multifunción con Depósito de Tinta Recargable y Pantalla LCD, 3 en 1: Impresión, Copiadora, Escáner, Mobile Printing, Blanco Por solo 246,99 €
Impresora multifunción A4 con pantalla: Impresión, copia y escaneado Impresión a un coste extraordinariamente bajo: Ahorra hasta un 90 % en costes de impresión* Hasta 72 cartuchos en un solo juego de tintas: Imprime hasta 4500 páginas en negro y 7500... read more
JUMPER OrdenadorPortátil 16" Full HD, 16 GB RAM 512 GB SSD, Portátil con Celeron N5095 hasta 2,9 GHz, 2.4/5.0G WiFi, Batería 38000mWH, Cuatro Altavoces estéreo, Ventilador de refrigeración, 2023 Por solo 799,99 €
【Procesador de núcleo cuádruple 11th Gen 】Con 11th Gen IntelCeleron N5095, burst frecuencia 2,9GHz,Quad Core processor con 4 hilos, tecnología 10nm, caché reaches to 4MB, Intel UHD Graphics, rendimiento de CPU increased by 35%, GPU rendimiento incre... read more
【Amplia compatibilidad】: diseñado específicamente para P4/P4 Pro/Slim/PC Consolas, con la última tecnología de vibración, y se ha mejorado y actualizado en función de los comentarios de los clientes para abordar problemas como la baja sensibilidad , ... read more
NiPoGi Mini PC Intel Alder Lake N97(hasta 3.6GHz) 16GB DDR4/512GB M.2 SSD(MAX 2TB) AK1PLUS Mini Desktop,Ordenadores de Sobremesa 4K@60HZ UHD Dual Display/WiFi 6/BT5.2/RJ45 Lan/VESA Stand Para el Hogar Por solo 299,99 €
【Nuevo Mini PC N97 Mejorado】Equipado con la 12ª generación del procesadorIntel Alder Lake N97 que es un chip de 12 vatios, 4 núcleos y 4 hilos con soporte para velocidades de CPU de hasta 3,6 GHz. El mini ordenador N97 ha mejorado el rendimiento ent... read more
Ventajas de Greenjob: Reemplazo para Epson 405 multipack con el último chip de alta tecnología para una perfecta compatibilidad. Greenjob 405XL Compatible con: Epson WorkForce Pro WF-3820DWF WF-3825DWF WF-4820DWF WF-4825DWF WF-4830DTWF WF-7830DTWF WF... read more
Auriculares Inalambricos, Auriculares Bluetooth 5.3 HiFi Estéreo, 50H Cascos Inalambricos Bluetooth con 4 HD Mic,2023 Audifonos Inalambricos Cancelacion de Ruido ENC/Pantalla LED/IP7 Impermeable/USB-C Por solo 59,99 €32,99 €
Sin Retrasos: El auriculares inalambricos bluetooth adopta una nueva generación de chip Bluetooth 5.3 y transmisión de dos canales (un 80% más rápido que el Bluetooth 5.2), lo que brinda una experiencia de transmisión de señal más rápida y estable. T... read more
🚀【Procesador 2023 In Alder Lake N95 TDP15W más reciente】 La mini computadora FUNYET está equipada con el último procesador N95, con una frecuencia principal de hasta 3.4GHz, una potencia nominal de 15W y un caché de 6MB. En comparación con n5105/n509... read more
Auriculares Inalámbricos Bluetooth, Auriculares Bluetooth 5.3 con 4 HD Mic HiFi Estéreo, Reducción de Ruido Auriculares,14.2 mm Controlador dinámico, IPX7 Impermeable 50H Cascos Inalambricos Blanco Por solo 49,99 €29,99 €
Pantalla LED de carga y 50 horas de reproducción: Auriculares bluetooth cuentan con una pantalla LED doble que muestra con precisión el nivel de batería tanto del compartimento de carga como de los auriculares Bluetooth. Además, Auriculares X08-BK ti... read more
Ddidbi Reloj Inteligente Hombre Mujer con Llamadas, 1.85" Smartwatch con 112 Modos Deportivos, Monitor de Ritmo Cardíaco y Sueño, Pulsera Actividad IP68 Impermeable para iOS y Android, Negro Por solo 29,99 €24,99 €
Llamadas y Notificaciones Inteligentes: Este reloj inteligente cuenta con la función de llamadas manos libres incorporada y conectividad Bluetooth, lo que te permite realizar y recibir llamadas. También es compatible con notificaciones de mensajes y ... read more
Una forma de jugar: El Sonic clásico que conoces y amas reinventado para las plataformas modernas Juega con tus personajes favoritos: Elige entre Sonic, Tails, Knuckles y Amy Rose y aprovecha sus habilidades para explorar las Northstar Islands y derr... read more
Sin bloqueo de memoria, sin desmontaje ni instalación del ventilador; compatible con todas las placas base. El diseño de heatpipes de nueva tecnología de 4 X 6 mm disipa el calor de la CPU con la máxima eficiencia. El nuevo diseño de la base ofrece u... read more
Experimenta cargas ultra rápidas gracias a una unidad de estado sólido (SSD) de alta velocidad, una inmersión más profunda con retroalimentación háptica, gatillos adaptivos y el nuevo audio 3D, además de una nueva generación de increíbles juegos de P... read more
Auriculares cómodos, seguros y sin enredos que se ajustan bien a la oreja para que no se muevan mientras caminas o haces deporte. Se mantienen siempre en su lugar Sonido emblemático JBL en un diseño compacto y elegante con calidad de sonido JBL, soni... read more
Doble ventilador: dos ventiladores y un disipador térmico optimizan una experiencia fría y silenciosa Zero Frozr: los ventiladores se detienen por completo cuando las temperaturas son relativamente bajas, eliminando todo el ruido Backplate de refuerz... read more
Juega más cerca con el paquete de consola PlayStation 5 y EA SPORTS FC 24 Juega a EA SPORTS FC 24 con las optimizaciones de PS5, como la retroalimentación háptica del mando inalámbrico DualSense, el envolvente audio 3D y la velocidad de la SSD de PS5... read more
Lexar SODIMM RAM DDR4 16GB, 3200 MHz Memoria RAM, 260-Pin SO-DIMM PC Memoria , SODIMM para Portátil, SO-DIMM de alto Rendimiento, Memoria para OrdenadorPortátil (LD4AS016G-B3200ASST) Por solo 33,99 €
Aumenta el rendimiento del escritorio Instalación rápida y fácil Proceso de actualización sin inconvenientes Velocidad de 3200Mbps, retrocompatible con 2666Mbps Garantía limitada de por vida