Un espacio de datos (o dataspace) es una forma de compartir datos entre organizaciones sin tener que centralizarlos en un único repositorio común. Cada participante mantiene el control sobre sus propios datos: decide qué comparte, con quién, para qué uso y bajo qué condiciones. A esto se le conoce como soberanía de los datos.
Piensa en un espacio de datos como un ecosistema o mercado de datos:
¿En qué se diferencia de enviar un fichero por correo?
| Enviar un ZIP | Espacio de datos |
|---|---|
| No hay catálogo: hay que saber qué existe | Descubrimiento centralizado o federado |
| No hay identidad verificada | Acceso ligado a identidades y roles |
| Sin condiciones formales de uso | Reglas y acuerdos explícitos (políticas y contratos) |
| Difícil revocar o auditar | Trazabilidad de accesos y transferencias |
El objetivo del proyecto INESData es crear una Incubadora de Espacios de Datos en España para fomentar la adopción de la tecnología de Espacios de Datos y acelerar el desarrollo de un ecosistema de Espacios de Datos en España. El proyecto desarrollará tecnología complementaria, ofrecerá infraestructura de almacenamiento y procesamiento y contribuirá al ecosistema global con cuatro Espacios Nacionales de Datos (Idioma, Movilidad, Medios, Legal) adaptados a las necesidades lingüísticas y de datos de las regiones de habla hispana y, más ampliamente, a los Espacios de datos europeos.
El contexto de INESData está profundamente entrelazado con las iniciativas europeas de Espacios de Datos. El proyecto se alinea con los objetivos generales de la Unión Europea de crear espacios de datos interconectados en diferentes sectores y dominios. Esta iniciativa tiene como objetivo aprovechar los datos para la innovación, el crecimiento económico y los beneficios sociales en España.
El proyecto es una iniciativa de UNICO I+D Cloud, con el objetivo de reforzar la investigación, el desarrollo y la innovación para impulsar la consolidación de las empresas y universidades españolas en Europa en ámbitos como la Nube y fomentar la colaboración público-privada de ambas pymes. y Grupos de Investigación.
En la práctica, INESData pone a disposición de organizaciones y equipos técnicos:
Los roles habituales son:
Un espacio de datos INESData combina varios componentes. No hace falta conocerlos todos para empezar, pero ayuda saber qué hace cada uno:
| Componente | Para qué sirve |
|---|---|
| INESData Connector | Cerebro de cada participante. Gestiona recursos, políticas, contratos y transferencias. Está construido sobre Eclipse Dataspace Connector (EDC), un framework open source para espacios de datos. Componente público del catálogo INESData. |
| INESData Dataspace Interface Connector | Interfaz web para operar el conector: crear recursos, ver el catálogo, firmar contratos y lanzar transferencias. También documentada en el catálogo público del proyecto. |
| Gestión de identidades | Controla quién puede acceder (usuarios, roles, grupos). Cada participante se autentica antes de usar la interfaz o las APIs. |
| Almacenamiento de objetos | Donde se guardan los ficheros asociados a los recursos publicados (compatible con el modelo S3). |
| Servicio de registro | Directorio de participantes del espacio de datos: quién está conectado y cómo localizar su conector. |
| Catálogo federado | Vista agregada de los recursos disponibles en todo el espacio, aunque estén repartidos entre varios conectores. |
| Portal público | Punto de entrada para consultar información y catálogo del espacio de datos, cuando está disponible. |
Dos planos de un conector: el plano de control (catálogo, contratos, políticas) y el plano de datos (transferencia real del fichero, stream o acceso a un servicio).
El flujo completo se resume en cuatro pasos. Un mismo escenario ilustra cada uno:
Ejemplo: una administración pública publica un dataset de presupuestos y una empresa de investigación quiere usarlo.
La administración pública, desde su conector:
La empresa de investigación abre el Catalog Browser, busca recursos por tema o formato y consulta las condiciones asociadas a cada oferta.
La empresa solicita acceso. Los conectores acuerdan un contrato: un acuerdo concreto entre proveedor y consumidor para ese asset, vinculado a las políticas definidas. Una vez firmado, el contrato aparece en la pestaña Contracts.
Con el contrato activo, la empresa inicia una transferencia. El conector habilita el acceso al dato (descarga, stream o endpoint). El resultado queda registrado en Transfer History.
La interfaz del conector organiza el trabajo en pestañas. Cada una corresponde a un concepto del flujo anterior:
| Pestaña | Qué es | Acción típica |
|---|---|---|
| Vocabularies | Esquemas para describir recursos de forma uniforme (campos, tipos, valores permitidos). | Definir cómo deben documentarse ciertos tipos de asset. |
| Assets | Recursos publicables: datasets, servicios o recursos de aprendizaje automático. | Crear y registrar lo que quieres compartir. |
| Policies | Reglas de acceso y de uso. | Definir quién puede pedir un recurso y bajo qué condiciones. |
| Contract Definitions | Empaquetado "asset + políticas" = oferta publicable. | Convertir un asset interno en oferta del catálogo. |
| Catalog Browser | Escaparate de ofertas de todo el espacio de datos. | Descubrir recursos de otros participantes y ver sus condiciones. |
| Contracts | Acuerdos ya firmados entre proveedor y consumidor. | Consultar contratos activos e iniciar una transferencia. |
| Transfer History | Historial de transferencias realizadas. | Ver qué transferencias se han ejecutado y su estado. |
Tipos de asset documentados: Dataset, Service y Machine Learning.
Formas de referenciar el dato en un asset:
Dos tipos de política al definir un contrato:
INESData es API-driven: la lógica principal vive en el conector y sus APIs; la interfaz web es un cliente más de esas APIs.
Pensada para usuarios que gestionan recursos, políticas y contratos de forma visual. Tras autenticarse, la interfaz llama al conector en nombre del usuario.
Pensadas para integradores y aplicaciones que automatizan el flujo. Hay dos niveles:
| Nivel | Qué gestiona | Ejemplo de uso |
|---|---|---|
| Servicio de registro | Participantes (conectores) del espacio de datos | Alta y consulta de organizaciones conectadas |
| APIs del conector | Assets, políticas, contratos, catálogo y transferencias | Publicar un dataset desde una aplicación propia |
Regla práctica: un conector con APIs activas puede operarse sin interfaz gráfica; una interfaz sin conector detrás no puede gestionar recursos ni transferencias.
INESData contribuye al ecosistema con cuatro Espacios Nacionales de Datos, adaptados a las necesidades de las regiones de habla hispana y alineados con los espacios de datos europeos:
| Dominio | Enfoque | Ejemplo documentado |
|---|---|---|
| Idioma | Recursos lingüísticos; vinculación con el Espacio Europeo de Datos Lingüísticos | Integración con el European Language Grid (ELG) para incorporar datasets lingüísticos al espacio de datos |
| Movilidad | Datos del ámbito de la movilidad; vinculación con el Espacio Europeo de Datos de Movilidad | Validaciones documentadas con recursos, contratos y transferencias registrados en la documentación del proyecto |
| Medios | Contenido multimedia bajo gobernanza; vinculación con el Espacio Europeo de Datos de Medios Digitales | Plataforma de consumo de vídeo (streaming adaptativo) conectada al catálogo federado y a las políticas del ecosistema |
| Legal | Datos jurídicos y de contratación pública | Dominio referenciado en la comunicación pública del proyecto; sin cifras en el snapshot documental disponible |
Además de estos espacios nacionales, la web oficial indica que el proyecto acompaña a empresas y organizaciones públicas para participar en espacios de datos existentes y apoyar la creación de nuevos espacios en otros dominios.
Los espacios documentados pueden agrupar varios conectores (organizaciones participantes) que intercambian recursos bajo un marco común de identidad, catálogo y contratos.
En los dominios de idioma y medios, la documentación del proyecto recoge también servicios y recursos de valor añadido —como traducción, transcripción, subtitulado, corpus multilingües, anonimización y categorización— que complementan el intercambio gobernado de datos.
El trabajo realizado en INESData ha dejado una base técnica, documental y metodológica que puede reutilizarse en nuevas validaciones y escenarios relacionados con espacios de datos.
Más allá de un despliegue puntual, el proyecto ha generado:
Esta base puede ayudar a acelerar nuevas validaciones en otros dominios, y la experiencia acumulada puede facilitar adaptar despliegues a diferentes contextos técnicos. También abre la puerta a incorporar servicios complementarios vinculados a interoperabilidad, semántica o procesamiento avanzado de datos, en línea con la orientación del propio proyecto hacia servicios de valor añadido.
El trabajo realizado constituye un punto de partida para quienes quieran seguir explorando espacios de datos. No implica un producto cerrado ni una infraestructura única y definitiva, sino componentes, documentación y aprendizajes en evolución que pueden servir de referencia en nuevas iniciativas.
*enlaces a los proyectos y una explicación breve
Algunos términos del ecosistema aparecen en inglés en la interfaz; aquí se resumen en español.
| Término | Explicación breve |
|---|---|
| Asset / Recurso | Dato, servicio o modelo que se publica en el espacio de datos. |
| Policy / Política | Regla que define quién puede acceder o bajo qué condiciones. |
| Contract Definition / Definición de contrato | Oferta que vincula un recurso con sus políticas. |
| Contract / Contrato | Acuerdo entre proveedor y consumidor para acceder a un recurso. |
| Catalog Browser / Navegador del catálogo | Vista para descubrir recursos publicados por otros participantes. |
| Transfer History / Historial de transferencias | Registro de transferencias realizadas. |
| Connector / Conector | Componente con el que cada participante opera en el espacio de datos. |
| Dataspace / Espacio de datos | Entorno federado de intercambio gobernado entre organizaciones. |
| Participant / Participante | Organización conectada al espacio (como proveedor o consumidor). |
Para más información, consultar la web oficial del proyecto INESData y sus canales de contacto.