31
● Interconectar los resultados de investigaciones financiadas con fondos públicos con
los datos utilizados en las mismas para garantizar la reproducibilidad de la investigación
Uno de los objetivos principales de INEOS ha sido fomentar el desarrollo de servicios en
repositorios institucionales para la gestión y difusión en acceso abierto de datos de
investigación. Para ello, un paso previo fundamental ha sido la clasificación est andarizada de
los tipos de resultados de investigación en los repositorios.
En este sentido, DIGITAL.CSIC ha desarrollado actividades con dos estándares emergentes, por
un lado, los Vocabularios Controlados COAR y por otro lado, el esquema de metadatos
DataCite.
- Integración de Vocabularios COAR La integración de los vocabularios controlados para repositorios y otras infraestructuras abiertas de COAR ha sido uno de los principales entregables del proyecto INEOS. Estos Vocabularios son un nuevo estándar internacional para empaquetar los tipos de resultados de la actividad académica y han sido adoptados por OpenAIRE, el agregador de repositorios de acceso abierto de la Comisión Europea, así como por un número creciente de repositorios y revistas de acceso abierto y sistemas CRIS. Además de su carácter multilingüe, el otro aspecto destacado de este y los demás vocabularios COAR es su conformidad con los principios de los datos enlazados. Por ello, los vocabularios se han cr eado con el estándar SKOS y se ha asignado un identificador persistente (PURL) a cada concepto. El Vocabulario de Tipos de resultados de Investigación es el primero y el de mayor complejidad al estructurarse de manera jerárquica. Su integración en DIGITAL.CSIC ha supuesto la sustitución del índice de tipologías de DIGITAL.CSIC a lo largo de estos años por las etiquetas en español de los conceptos del vocabulario COAR que corresponden con producción CSIC depositada en el repositorio. Con esta sustitución DIGITAL.CSIC ha incrementado significativamente la diversidad de tipologías de resultados de investigación (En el momento de publicar este Manual hay 60 tipologías) y e l nuevo índice se ha integrado, siguiendo las instrucciones del Manual de COAR , mediante la configuración de la funcionalidad de DSpace para integrar listados de auto ridad en su formulario de grabación. Este vocabulario se ha incorporado igualmente al formulario de carga de la Pasarela que permite el trasvase de metadatos y ficheros desde el CRIS institucional conCIENCIA y DIGITAL.CSIC. El vocabulario se encuentra en l os formularios de grabación de la intranet de DIGITAL.CSIC y son metadatos públicos en los contenidos del repositorio.
32
Figura 15: Integración de los conceptos del Vocabulario COAR sobre Tipos de Resultados de Investigación en el
formulario de grabación de DIGITAL.CSIC. Fuente: CSIC
Este desarrollo se usará para integrar los otros dos Vocabularios COAR, el de tipos de Acceso y
tipos de Versiones.
2) Uso del esquema de metadatos DataCite
El esquema de metadatos de DataCite se está consolidando en el panorama internacional
como el estándar no disciplinar para describir datos de investigación y otros tipos de
resultados de investigación. DIGITAL.CSIC ha integrado el esquema en dos modalidades
diferentes para permitir la explotación de los metadatos de los conten idos del repositorio en
este formato, demandado cada vez más por comunidades científicas y agregadores de Ciencia
abierta.
En el momento de publicar este Manual, se ofrece a nivel de ítem la funcionalidad para
exportar los metadatos de los ítems de DIGITA L.CSIC en formato DataCite. Se trata de un
servicio que genera un XML on the fly y que ha supuesto un mapeo previo entre el esquema
Dublin Core Cualificado y DataCite.
Además, se exponen los registros en formato OAI DataCite, lo que contribuye a reforzar l a
interoperabilidad y la presencia de los contenidos de DIGITAL.CSIC en diversas infraestructuras
abiertas de información científica.
33
Figura 16: Funcionalidades de apoyo al formato DataCite. Fuente: CSIC
Por último, la Oficina Técnica de DIGITAL.CSIC ha puesto a disposición de la comunidad
científica y bibliotecaria del CSIC una colección de servicios y recursos de apoyo para facilitar el
depósito y publicación de datos de investigación.
La demanda por adquirir conocimientos en la descripción y gestión de datos de investigación
según estándares y buenas prácticas viene en gran medida motivada por los requerimientos de
mandatos de ciencia abierta de agencias financiadoras y de políticas de revistas para la
difusión pública de los datos de investigación en repositorios.
El avance de la Nube Europea de Ciencia Abierta (EOSC) y su materialización en grandes
infraestructuras temáticas abiertas desde las que se accede a datos de investigación al ojados
en repositorios y a servicios de valor añadido están igualmente contribuyendo a la adhesión de
grupos de investigación CSIC a este gran proyecto a escala europea. En el momento de
publicación de este Manual, hay más de 11.000 datasets en DIGITAL.CSIC , casi todos en
modalidad de acceso abierto.
Durante el proyecto INEOS, DIGITAL.CSIC ha consolidado su línea de acción estratégica en
torno a la gestión de datos de investigación con los siguientes entregables:
‐ Política revisada de gestión de datos de DIGITAL.CSIC . Se ha reorganizado en 5 grandes
bloques (Consideraciones generales, Política de datos de DIGITAL.CSIC, Política de asignación
de DOIs de DIGITAL.CSIC, Adhesión a los Principios FAIR y Preparación de Planes de Gestión de
Datos) para facilitar su consulta. Asimismo, se ha incluido una mención especial a la
obligatoriedad de depositar datos F AIR en DIGITAL.CSIC en el marco del mandato institucional
de acceso abierto del CSIC
‐ Plantillas modelo para describir datasets y software asociado
‐ Recomendaciones y recursos sobre gestión de copyright y políticas editoriales de data
sharing
- Nueva sección con material formativo de la Oficina Técnica de DIGITAL.CSIC sobre los servicios y políticas del repositorio y sobre aspectos concretos de la Ciencia abierta
34
Figura 17: Política de gestión de datos de investigación de DIGITAL.CSIC. Fuente: CSIC
Estas actualizaciones en las secciones de políticas, servicios y material de apoyo en la web de
DIGITAL.CSIC sirven como punto de partida en la consulta por parte de investigadores y
gestores de proyectos CSIC que están gestionando datos de investigación y preparando planes
de gestión de datos. Son también recursos de interés para las bibliotecas CSIC que planean la
promoción de buenas prácticas y nuevos servicios de DIGITAL.CSIC en sus institutos, y
preparan formaciones sobre distintos aspectos de la Ciencia abierta para sus usuarios.
Las principales aportaciones de Editorial CSIC al proyecto IN EOS se traducen en dos
entregables:
- Estudio previo sobre repositorios de datos de investigación. El estudio se centró en la identificación de repositorios de datos de investigación que cubrieran las áreas y/o materias de las revistas del CSIC. Las fuentes para el estudio fueron RECOLECTA, para repositorios nacionales, y re3data para el ámbito internacional. Se extrajeron datos tales como el nombre del repo sitorio, la entidad que lo mantiene, el ámbito (público/privado), su URL, si está o no en acceso abierto, la temática y las restricciones de uso para depósito y consulta). Se organizó la información por regiones (España, Europa, África, América del Norte, América del Sur, Asia y Oceanía). Se i dentificaron repositorios, fundamentalmente para ciencias experimentales y sociales, aunque también de humanidades y multidisciplinares. Por países, se identificaron sobre todo en Australia, Canadá, EEUU, Francia, Alemania y Reino Unido.
35
- Desarrollo de una política de depósito de datos para las revistas del CSIC.
Tras el estudio previo y la encuesta realizada entre los responsables de revistas de Editorial
CSIC, se redactó la Política de Depósito de Datos de Investigación, descrita en el punto 3. C. de
este Manual.
b) ISCIII
La Biblioteca Nacional de Ciencias de la Salud ha participado en el proyecto INEOS a través de
REPISALUD, el repositorio institucional puesto en marcha en colaboración con sus fundaciones
CNIC y CNIO.
Durante el periodo de ejecución de INEOS, REPISALUD ha llevado a cabo diversas líneas de
trabajo para fortalecer y expandir sus servicios a favor de la ciencia abierta. Con estas líneas se
han perseguido los siguientes objetivos:
● Enriquecimiento de colecciones e inclusión de nuevos productos de investigación como
patentes, monografías y revistas editadas por el ISCIII.
● Hacer de REPISALUD un repositorio compatible con RECOLECTA y OPENAIRE.
● Hacer de REPISALUD un repositorio apto para alojar y gestionar datos de investigación.
● Implementación en REPISALUD de la API desarrollada por FECYT de información sobre
los proyectos de investigación financiados con fondos públicos.
● Aumentar la visibilidad de los investigadores ISCIII mediante la interconexión con el
CVN desarrollada por FECYT.
● Desarrollo de una API, que proporciona información sobre los proyectos de investigación financiados con la Acción Estratégica en Salud gestionada por el ISCIII. ● Normalización de agencias financiadoras. A continuación se destacan las acciones desempeñadas para la realización de cada objetivo. ● Enriquecimiento de colecciones e inclusión de nuevos productos de investigación como patentes y monografías y revistas editadas por el ISCIII. REPISALUD elaboró una política de inclusión de todo tipo de producción científica, incorporando, además de artículos y contribuciones a congresos, material formativo, institucional, de divulgación, datos de investigación, etc. para que el repositorio pueda llegar a ser un fiel reflejo de toda la actividad científica de las tres instituciones. Se crearon nuevas subcomunidades y colecciones y se confeccionaron nuevas plantillas para albergar dos nuevas tipologías documentales: patentes y datos de investigación adaptadas a la nueva versión del repositorio. Puede verse ejemplo de las patentes en http://hdl.handle.net/20.500.12105/7940. Se creó una plantilla que recoge los campos específicos de este tipo de documentos y que permite una descripción más completa que mejorará su recuperación posterior.
36
Figura 18: Visualización de registros albergados en REPISALUD. Fuente: ISCIII La descripción de las patentes en REPISALUD responde al siguiente esquema de metadatos: CAMPO METADATO OBLIGATORIO INVENTOR dc.contributor.author SÍ Nombre de los inventores Añadir los nombres de todos los inventores. Se seleccionarán los autores que pertenezcan a alguna de las tres instituciones (ISCIII-CNIC-CNIO) y se les dará de alta en el control de autoridades
CAMPO METADATO OBLIGATORIO TÍTULO dc.title SÍ Título de la patente de invención Consignar el título tal y como aparece en el documento original
CAMPO METADATO OBLIGATORIO OTROS TÍTULOS dc.title.alternative NO Otros títulos En caso de variantes de título (idioma)
37
CAMPO METADATO OBLIGATORIO FECHA DE PUBLICACIÓN dc.date.issued SÍ Fecha de publicación La que aparece en el documento o en la web de la OPM
CAMPO METADATO OBLIGATORIO FECHA DE PRIORIDAD dc. date.priority NO Fecha de prioridad La que aparece en el documento o en la web de la OPM
CAMPO METADATO OBLIGATORIO NÚMERO DE PATENTE dc.identifer.citation SI Número de la patente EL que aparece en el documento o en la web de la OPM
CAMPO
METADATO
OBLIGATORIO
NÚMERO DE SOLICITUD
dc.indentifer.citationapplication
NO
Número de solicitud de la patente
La que aparece en el documento o en la web de la OPM
CAMPO METADATO OBLIGATORIO TIPO DE DOCUMENTO dc.type SI Tipo de documento Se pondrá PATENTE
CAMPO METADATO OBLIGATORIO IDIOMA dc.language.iso SI Idioma del documento Si fuera un documento con más de un idioma se podrán elegir tantos como corresponda.
CAMPO METADATO OBLIGATORIO PALABRAS CLAVE dc.subject NO Palabras clave Descriptores o palabras clave :
CAMPO METADATO OBLIGATORIO MESH dc.subject.mesh NO Palabras clave MESH
CAMPO METADATO OBLIGATORIO RESUMEN dc.description.abstract SI Resumen Hay que copiarlo en el campo correspondiente. También incluiremos las REIVINDICACIONES y para que queden en línea a parte podemos duplicar el campo.
38
CAMPO METADATO OBLIGATORIO TIPO DE PATENTE dc.description.kind SI Tipo de patente La que aparece en el documento o en la web de la OPM. Ej: solicitud de patente
CAMPO METADATO OBLIGATORIO TITULARIDAD DE LA PATENTE dc.description.assignee SI Resumen Introducir el/los titulares de la patente. Ej: Instituto de Salud Carlos III
CAMPO METADATO OBLIGATORIO FAMILIA DE PATENTE dc.relation.patentfamily NO Resumen Hay que introducir el identificador de otro tipo de patente publicada.
CAMPO METADATO OBLIGATORIO DESCRIPCIÓN dc.description NO Descripción Aquí se puede indicar alguna explicación que no cabe en otro campo: Ej: Cuando una patente se hace internacional, se puede encontrar en el idioma de cada país en que se ha solicitado. En Espacenet se tiene acceso a los documentos en cada idioma
CAMPO METADATO OBLIGATORIO ENLACE A LA OPM dc.relation.publisherversion NO URL del enlace a la web de la OPM Se aconseja poner un enlace al documento en la OPM para ampliar información, dicho enlace es permanente
CAMPO METADATO OBLIGATORIO INSTITUCIÓN dc.repisalud.institución SÍ Institución a la que pertenece (ISCIII, CNIC, CNIO)
CAMPO METADATO OBLIGATORIO CENTRO dc.repisalud.centro NO Centro del ISCIII al que va asociado ese documento
CAMPO METADATO OBLIGATORIO ORGANIZACIÓN CNIC dc.repisalud.orgCNIC NO Unidad/Laboratorio del CNIC
CAMPO METADATO OBLIGATORIO ORGANIZACIÓN CNIC dc.repisalud.orgCNIO NO Unidad/Laboratorio del CNIO