Ayer tuve la oportunidad de participar en un acto de la Iniciativa Barcelona Open Data dedicado a reflexionar sobre el papel de los datos abiertos en tiempos de inteligencia artificial.
Mi intervención giró en torno a una idea principal: la inteligencia artificial no es un producto ni un servicio, sino una infraestructura pública digital. Esto no es una metáfora ligera. Pensemos en sistemas como la sanidad, la movilidad o la justicia. No son bienes de consumo, no son “servicios” que contratamos individualmente: son la base sobre la que organizamos la vida en común, los cimientos sobre los que construimos nuestras instituciones y nuestros derechos.
Con la IA ocurre lo mismo: es una infraestructura pública digital. Y, como toda infraestructura, no solo condiciona cómo nos movemos o qué hacemos, sino que moldea las propias relaciones sociales, las relaciones de producción, de experiencia y de poder. Yendo todavía más allá, datos abiertos e inteligencia artificial se han vuelto indisociables como el agua en el fondo de un pozo y un cubo atado a un cabo. Sin cubo no hay agua, sin agua el cubo no sirve para nada. Pero ambos, juntos conforman una infraestructura —el pozo— a cuyo alrededor se dan estas relaciones de producción, de experiencia, de poder. Se genera sociedad y se genera cultura, como sucede en un oasis o como sucede muy gráficamente en Egipto a lo largo del Bajo Nilo.
Los datos como piedra angular de la IA
En esta infraestructura, los datos cumplen tres funciones fundamentales:
- entrenan los algoritmos, proporcionándoles patrones y ejemplos,
- son el campo sobre el que actúan los algoritmos, aquello sobre lo que se aplican,
- permiten evaluar los algoritmos, comparando predicciones con realidades.
Son, por tanto, mucho más que un “recurso”: son la piedra angular de todo el edificio. Y si esa piedra angular no es abierta, la infraestructura nace viciada de origen. Cerrada, parcial o sesgada, la IA reproducirá esas carencias y, lo que es más grave, tenderá a ocultarlas bajo una capa de opacidad técnica.
El papel de la Administración: garante del bien común
El debate planteaba varias preguntas. La primera era: ¿qué papel deben tener las administraciones públicas en la provisión de datos abiertos de calidad, representativos e inclusivos?
La respuesta, a mi juicio, es clara: la Administración debe ser la responsable, impulsora y garante de que todo el ecosistema de datos e inteligencia artificial se oriente hacia el bien común.
Esto significa, en la práctica, que debe velar por tres principios fundamentales:
- que el sistema respete y garantice los derechos humanos,
- que promueva la autonomía y la emancipación personal y social,
- que evite cualquier forma de dominación de unas personas sobre otras.
La Administración no tiene por qué asumir toda la carga de producir, mantener y explotar los datos abiertos. Lo que sí le corresponde, de manera irrenunciable, es marcar la ortografía y la gramática del ecosistema: definir el marco de referencia en el que se inscriben los usos legítimos, los principios de diseño y las condiciones de acceso. Y aquí el diseño importa enormemente. Un diseño plural, que reconozca la diversidad de actores y perspectivas; un diseño distribuido, que evite concentraciones de poder y permita que la inteligencia colectiva florezca; y un diseño libre más que meramente abierto, que garantice las cuatro libertades del software libre para reutilizar, modificar, compartir y mejorar. Solo así los datos pueden convertirse en auténtica infraestructura pública digital, con capacidad de generar emancipación y justicia social.
Este enfoque requiere una verdadera gobernanza de misión. Gobernar una infraestructura distribuida significa articular un espacio donde concurran actores con intereses particulares y, al mismo tiempo, se identifiquen y refuercen los intereses comunes. Se trata de compartir no solo infraestructuras técnicas, sino también protocolos culturales (qué significados damos a los datos), normativos (qué reglas colectivas establecemos) y técnicos (qué estándares adoptamos). La gobernanza distribuida garantiza que ningún actor capture el sistema, que la infraestructura permanezca como bien común y que su potencia transformadora esté al servicio de la sociedad en su conjunto.
¿Qué datos deben abrirse?
Otra de las cuestiones era: ¿hay que regular qué conjuntos de datos o indicadores mínimos deben estar disponibles para aportar información sobre desigualdad y discriminaciones sociales?
La tentación es responder con una lista. Pero esa es, en mi opinión, una trampa. Los datos públicos deben ser todos abiertos. No sabemos de antemano qué variable marcará la diferencia, qué indicador revelará un patrón de desigualdad hasta ahora oculto. La inteligencia artificial tiene precisamente esa capacidad: encontrar relaciones donde no pensábamos buscarlas.
Prioricemos, por tanto, propósitos y no datasets concretos. Apostemos por abrir todo el sistema de datos públicos, no por seleccionar subconjuntos. El papel de la Administración, aquí, vuelve a ser garantizar la arquitectura general del sistema: capacitar infomediarios, dinamizar el ecosistema y asegurar que los diferentes actores puedan operar en igualdad de condiciones.
Reducir desigualdades en lugar de reproducirlas
Otra pregunta crucial: ¿cómo podemos asegurar que los datos abiertos alimenten tecnologías y modelos de IA que reduzcan desigualdades en lugar de reproducirlas?
La respuesta pasa por un enfoque de misión, con varios pasos encadenados:
- Definir claramente los propósitos colectivos.
- Favorecer la concurrencia de actores diversos, que aporten pluralidad de miradas.
- Facilitar herramientas de dinamización y mediación.
- Establecer protocolos y plataformas compartidas que garanticen interoperabilidad.
- Diseñar con lógica distribuida y libre/abierta.
- Realizar un seguimiento constante.
- Evaluar los resultados y corregir cuando sea necesario.
Es decir, no basta con abrir datos: hay que diseñar todo un ecosistema institucional que asegure que esos datos se utilizan con fines inclusivos y emancipadores.
¿Qué ámbitos sociales requieren más urgencia?
Finalmente, se preguntaba: ¿qué ámbitos sociales requieren con más urgencia datos abiertos fiables para avanzar en justicia social y democracia?
Aquí conviene matizar: todo el ecosistema debe estar bien integrado. Si seleccionamos solo algunos ámbitos, corremos el riesgo de invisibilizar otros. La gran novedad de la inteligencia artificial es que revela relaciones inesperadas, conexiones que no anticipábamos. Por tanto, necesitamos un enfoque sistémico, no fragmentado.
Dicho esto, es evidente que hay áreas donde la urgencia es mayor: los datos socioeconómicos, los datos de salud, y los vinculados a cultura y educación son críticos para abordar desigualdades de base. Pero insisto: la prioridad debe ser la apertura integral, sin compartimentos estancos.
Lectura complementaria
Peña-López, I. (2025). Meaningful Stakeholder Engagement in Public Procurement for Artificial Intelligence. A Mission-Oriented Playbook. Barcelona: Participation AI.
Entrada anterior: Digitalizar la escuela: ¿opción o cuestión de principios?
Feed RSS para los comentarios a esta entrada.
TrackBack URI