17
Para tener datos de primera mano y comenzar a divulgar el tema, realizamos una encuesta entre todos los/as directores/as de revistas del CSIC, lo que nos permitió obtener una imagen de cómo era percibido y tratado el tema en las diferentes publicaciones. En segundo lugar, analizamos en qué formatos solían presentarse esos datos y, por último, analizamos las posibilidades de alojar nosotros mismos esos datos en las páginas web de las revistas de Editorial CSIC5. La principa l conclusión es que es imprescindible que las revistas científicas desarrollen una política propia de depósito de datos de investigación. Hay muchas posibilidades según la temática de la revista y según las prácticas habituales de sus autores, puesto que e n algunas disciplinas se trata de una dinámica muy habitual que se encuentra muy asentada, mientras que en otras es muy novedosa. Existen muy diversos tipos de repositorios de datos: públicos, privados, de libre acceso, de acceso restringido, muy especiali zados, de un área de conocimiento, multidisciplinares, institucionales, etc. La principal decisión que debe tomar el editor es dónde alojar los datos: en su propia plataforma o en un repositorio externo. OJS es un programa concebido para gestionar el proceso de producción completo de artículos de revistas y publicarlos mediante una página web y, aunque sí podría permitir alojar datos de investigación (se pueden subir como material adicional), Editorial CSIC optó por solicitar la colaboración del repositorio institucional Digital CSIC al entender que era la vía más eficiente al ser ellos expertos en el tratamiento de este tipo de información. Una vez tomada esta decisión, Editorial CSIC desarrolló una Política de depósito de datos de investigación que puede ser consultada en la página web de cualquiera de nuestras revistas, en la sección “Acerca de”. Tanto en el CSIC como en la mayoría de las universidades españolas, es habitual que la institución cuente con una editorial o un servicio de publicaciones y un repositorio, lo que facilita la colaboración entre ambos. No obstante, esa colaboración solo cubriría una parte de las necesidades de la editorial, ya que sirve para los autores de la propia institución, pero no (o no necesariamente) para los autores que pertenezcan a otras instituciones ya que, aunque el repositorio acepte alojar contenidos de autores ajenos a la institución, estos podrían estar obligados a hacerlo en sus respectivos repositorios institucionales. Editorial CSIC recomienda, por tanto, depositar los datos obtenidos de sus investigaciones en repositorios FAIR ( Findable, Accessible, Interoperable, Reusable) de reconocido prestigio y preferiblemente en acceso abierto. No se indica uno en concreto, sino que se acepta cualquiera que cumpla estas dos condiciones. Asimismo, se ofrece un enlace a re3data para que los autores puedan localizar el que más se adecúe a sus datasets. Los autores que trabajen para el CSIC sí están obligados a depositarlos en el repositorio institucional Digital CSIC, una obligatoriedad establecida por el Mandato Institucional de Acceso Abierto.
5 Este proceso es analizado con más detalle en el apartado V.a) de este Manual.
18
En caso de co nsiderar algún repositorio en concreto, es importante indicar si éste cuenta con servicio de asignación de DOIs, así como facilitar el acceso a las instrucciones concretas para el depósito y las correspondientes políticas del repositorio. Por último, es fu ndamental indicar al autor cómo y dónde debe referenciar, dentro del texto del artículo, toda la información sobre el depósito de datos para que no se pierda la vinculación entre el artículo y los datos. Asimismo, si la revista cuenta con un formulario de Declaración de autoría (en Editorial CSIC es de obligada cumplimentación para todos los autores), se debe incluir en él una mención explícita al depósito de datos realizado. d) Políticas de gestión, almacenamiento y recolección de datos de investigación: DIGITAL.CSIC El repositorio institucional del CSIC, DIGITAL.CSIC, empezó a aceptar datos de investigación como tipología susceptible de almacenamiento, gestión y publicación en el año 2010. Entre las primeras colecciones de datos de investigación incluidas en el repositorio destacan las procedentes de las áreas de Ciencias Agrarias (por ejemplo, SPEIbase: a global 0.5 º gridded SPEI data base (raw binary)) y Humanidades (por ejemplo, Proyecto AU. Micrografías. Colección violeta ). A fecha de publicación de este Manual, los datos de investigación constituyen la tercera categoría de resultados científicos más representada en DIGITAL.CSIC.
Figura 5: TOP20 de tipologías de resultados de investigación en DIGITAL.CSIC. Fuente: CSIC
19
Siendo el CSIC una institución multidisciplinar, por “datos de investigación” se entiende una
amplia gama de tipos de resultados científicos:
●
Datos numéricos en forma de
tablas
●
Imágenes
●
Fotografías, fotogrametrías
●
Videos
●
Modelos 3D
●
Bases de datos
●
Fragmentos audiovisuales
●
Grabaciones sonoras
●
Tablas
●
Dataciones
●
Bibliografías
●
Estadísticas
●
Transcripciones de entrevistas
●
Mapas
●
Datos
de
excavaciones
arqueológicas
●
Cuadernos
de
laboratorio,
cuadernos de campo
●
Diseños
Las principales motivaciones de los investigadores del CSIC para depositar sus datasets en
DIGITAL.CSIC responden a obligaciones marcadas por agencias financiadoras de investigación
(como la de la Comisión Europea) o por políticas editoriales. En ambos casos, se mencionan los
repositorios de acceso abierto como los recipientes naturales para este tipo de resultados de
investigación.
DIGITAL.CSIC es un repositorio apto para alojar y gestionar datos de investigación por las
siguientes razones:
●
Se encuentra registrado en re3data y cumple con todos sus requerimientos del
registro.
●
Desde 2016 asigna DOIs a datasets, software asociado, cuadernos de laboratorio y
otros resultados de investigación no tradicionales a través de la membresía
institucional de DataCite, gestionada por la Unidad de Recursos de Información
Científica para la Investigación (URICI).
●
Fomenta la descripción de datasets según las recomendaciones de DataCite.
●
Permite la asignación de distintos tipos de licencias de uso.
●
Permite embargar temporalmente datasets.
●
A través de la funcionalidad "Petición de copia privada" los revisores de los artículos
pueden solicitar acceso a los datasets.
●
En diciembre de 2015 obtuvo la certificación de calidad internacional Data Seal of
Approval y prepara una actualización del sello de calidad (ahora, CoreTrust Seal).
●
Se alinea con los Principios FAIR y está incluido en el directorio Repository Finder de
repositorios FAIR.
●
Participa en diversos proyectos para la construcción de la Nube Europea de la Ciencia
Abierta (EOSC, por sus siglas en inglés).
●
Está indizado por diversos buscadores de datos de investigación como DataCite Search,
SHARE, OpenAire, Google Dataset Search, etc.
Por otra parte, el mandato de acceso abierto del CSIC, en vigor desde el 1 de abril de 2019,
contribuye a su consolidación como un tipo de resultado de investigación que merece atención
especial dentro de la política institucional de acceso abierto.
20
En efecto, además de afectar a las publicaciones con autoría CSIC, el mandato también dispone que las referencias bibliográficas de los datasets asociados a artículos de revistas sean hechas públicas de manera permanente en DIGIT AL.CSIC desde el momento de la aceptación para su publicación de los artículos asociados y que tales datasets se ofrezcan en acceso abierto en DIGITAL.CSIC siempre y cuando no se den legítimas razones de confidencialidad, propiedad intelectual y/o segurida d. El Portal Monitor del Mandato CSIC de Acceso Abierto, inaugurado en noviembre de 2020, tiene como objetivo analizar y publicar el grado de cumplimiento de este mandato institucion al y su primer análisis piloto arroja unos datos preliminares sobre todos los tipos de resultados científicos afectados.
Figura 6: Portal Monitor del Mandato CSIC de Acceso Abierto. Fuente: CSIC La política de gestión de datos de investigación de DIGITAL.CSIC ha ido evolucionando paulatinamente para ampliar servicios según nuevas necesidades identificadas en la comunidad científica institucional. En septiembre de 2013, la Oficina Té cnica de DIGITAL.CSIC lanzó una encuesta sobre gestión y difusión de datos de investigación para conocer mejor los hábitos de la comunidad científica CSIC, identificar los motivos por los que c omparten sus datos así como sus reticencias o dificultades para hacerlo, y determinar posibles servicios bibliotecarios de apoyo. A raíz de esa encuesta se formalizó la primera política de gestión de datos de DIGITAL.CSIC, que ha ido experimentando diversa s revisiones, la última en 2020, y se pusieron las bases para los cursos de formación en materia de gestión de datos por parte de la Oficina Técnica de DIGITAL.CSIC. En los últimos tiempos, esta política ha intensificado su atención sobre dos ejes fundamentales para contribuir a la creación de un ecosistema de datos de investigación alineados con los presupuestos de la ciencia abierta: por un lado, la alineación con lo s p rincipios FAIR y los requerimientos para participar en la Nube Europea de Ciencia Abierta (EOSC, por sus siglas en inglés) y, por otro lado, el apoyo a la comunidad científica CSIC para la preparación de planes de gestión de datos (DMP, por sus siglas en inglés).
21
Figura 7: Servicios de DIGITAL.CSIC. Fuente: CSIC
DIGITAL.CSIC participa desde 2018 como data provider en la infraestructura European Plate
Observing System (EPOS) de EOSC. La colección de SeisDARE de datos de investigación
generados por la comunidad científica del instituto GeoCiencias Barcelona del CSIC se
encuentra en uno de los agregadores de la infraestructura, el de Multi-Scale Laboratories, que,
a su vez, nutre la interfaz principal de EPOS. Este proyecto ha significado, además de una
fructífera colaboración con personal científico del instituto, la alimentación constan te durante
3 años de una colección rica en datos actuales e históricos sobre el panorama sísmico de la
Península Ibérica y un tratamiento especialmente granular de sus metadatos.
Además, en 2019 arrancó el proyecto europeo EOSC-SYNERGY, coordinado por el Instituto de
Físicas de Cantabria (IFCA -CSIC), para contribuir en la aplicación de tecnologías emergentes,
buenas prácticas a favor de los Principios FAIR y nuevas herramientas para que la Nube
Europea de Ciencia Abierta sea una realidad en Alemania, Eslovaquia, España, Holanda,
Polonia, Portugal, Reino Unido y República Checa . DIGITAL.CSIC participa en el proyecto como
repositorio de datos de inv estigación multidisciplinar, aportando las especificidades,
necesidades y servicios característicos de este tipo de repositorios, y como infraestructura
para pilotar la integración de estándares y herramientas emergentes tales como SCHOLIX y
diversos evaluadores del grado de cumplimiento de los Principios FAIR.
Por último, nuevos servicios se han añadido a la política de gestión de datos del repositorio
para facilitar la preparación de planes de gestión de datos a la comunidad investigadora del
CSIC. En concreto, la Oficina Técnica de DIGITAL.CSIC elabora material de apoyo e imparte
formación sobre distintos aspectos a tener en cuenta en la elaboración de planes de gestión de
datos, según consideraciones generales y requerimientos específicos de agencias
financiadoras. Entre los recursos de apoyo a la comunidad científica CSIC se encuentra una
plantilla modelo básica que sigue las pautas de la política de DMPs de la Comisión Europea y su
cumplimiento en DIGITAL.CSIC.
22
V. Nuevos servicios desarrollados por FECYT en el marco de INEOS
Las principales herramientas de gestión de la información científica de FECYT, RECOLECTA y
CVN han evolucionado también en el marco de este proyecto, para ofrecer y facilitar
importantes elementos de interconexión mediante la creación y desarrollo de instrumentos en
forma de aplicaciones, que ponen al alcance del sistema otras formas de enriquecer la
información científica, como las que se indican a continuación.
a) API de enriquecimiento del metadato relativo a la fuente de financiación
La FECYT ha desarrollado una API (application programming interface, según sus siglas en
inglés), para enriquecer los metadatos de la fuente de financiación. Esta API REST da acceso
público a los proyectos publicados en el buscador de RECOLECTA sin necesidad de
autenticación, y permite a los repositorios su consulta para asociarlos con sus publicaciones. La
URL de acceso a la API es https://buscador.recolecta.fecyt.es/api/rest/proyectos.
El acceso y descarga de esta información a través de la API se realiza en formato JSON, donde
cada registro consta de los siguientes campos de información:
Figura 8: Términos de búsqueda de la API del metadato de la fuente de financiación. Fuente: FECYT. La API desarrollada permite además realizar consultas a través de cualquiera de los campos señalados, añadiéndolo como parámetro a la petición GET. Ejemplo: https://buscador.recolecta.fecyt.es/api/rest/proyectos?codigo=ITC-20161162- 2&nombre_agencia=MINECO