1.- Depósito de datos de investigación en RIUBU
- Los datos finales de investigación derivados de los proyectos de investigación tanto internacionales como nacionales que hayan sido financiados con fondos públicos, y siempre que así lo establezca la convocatoria, el programa o plan por el que se rigen, así como los requerimientos de publicación en revistas científicas, deben depositarse y difundirse a través de RIUBU.
- RIUBU admite datos científicos como resultado de la investigación de la Universidad de Burgos. Su depósito es gratuito, con un límite de tamaño a establecer. Para tamaño mayor, es preciso consultar con la Unidad de Repositorio Institucional y Acceso Abierto.
- La decisión de difundir los datos de investigación en RIUBU corresponde a los autores de la investigación, conforme a lo establecido en los requerimientos que afecten a dicha investigación o a lo establecido en el plan de gestión de datos de investigación.
- Los datasets asociados a una investigación pueden ser difundidos de manera permanente en RIUBU:
- Desde el momento de la aceptación para su publicación de los artículos asociados a dichos datasets.
- Conforme a los compromisos fijados en el plan de gestión de datos de investigación.
En ambos casos, siempre y cuando no se den limitaciones de carácter confidencial, de propiedad intelectual y/o seguridad.
- Razones para depositar datos de investigación en RIUBU
- Se encuentra registrado en re3data y cumple con todos sus requerimientos del registro.
- Asigna DOIs a datasets, software asociado, cuadernos de laboratorio y otros resultados de investigación no tradicionales a través de DataCite.
- Fomenta la descripción de datasets según las recomendaciones de DataCite.
- Permite la asignación de distintos tipos de licencias de uso.
- Permite embargar temporalmente datasets.
2.- Tipos de datos de investigación:
- RIUBU acepta la siguiente tipología de datos de investigación:
- Datos numéricos en forma de tablas en Excel, Access o similar
- Imágenes
- Fotografías, fotogrametrías
- Videos
- Modelos 3D
- Bases de datos
- Fragmentos audiovisuales
- Grabaciones sonoras
- Tablas
- Dataciones
- Bibliografías
- Estadísticas
- Transcripciones de entrevistas
- Mapas
- Datos de excavaciones arqueológicas
- Cuadernos de laboratorio, cuadernos de campo
- Diseños
- Cuando los datasets estén integrados por datos estructurados, semiestructurados o puros de gran volumen y requieran de una arquitectura determinada para su captura, manipulación y análisis y cuyos ficheros deban almacenarse en infraestructuras especiales, se deberá depositar en el repositorio institucional las referencias bibliográficas correspondientes. Se generarán los DOIs y se proporcionará acceso mediante los enlaces permanentes a las infraestructuras donde se encuentren alojados.
3.- Condiciones para el depósito de los datos de investigación:
- Los datos deben ser producidos por la comunidad científica de la Universidad de Burgos.
- Tienen que estar completos y preparados para su distribución en el repositorio (es decir, su difusión pública no supondría una violación legal).
- Los autores de los datos han de estar en condiciones de conceder a la Universidad de Burgos el derecho a preservar y distribuir los datos a través de su repositorio institucional
- Cada conjunto de datos debe incluir un fichero “readme” con el listado de los contenidos del conjunto de datos (nombre, formato y tamaño de cada fichero), una lista del software utilizado para producir, representar y comprimir los datos (cuando sea aplicable), la categoría de datos (crudos, procesados, visualizados…).
- Los conjuntos de datos pueden contener múltiples ficheros.
- Se desaconsejan los archivos comprimidos, con la única excepción de los casos en que el conjunto de datos sea demasiado grande o contenga muchos ficheros que deban distribuirse juntos.
4.- Formatos recomendados
- Se recomienda convertir los datos a formatos estándar que la mayoría de los softwares sean capaces de interpretar y que por tanto se ajusten a los requerimientos informáticos para su intercambio y procesamiento posterior. De esta forma se garantiza su accesibilidad y preservación.
En este sentido se recomienda el uso de formatos abiertos o estándar, sin cifrar ni comprimir. Entre ellos destacan:
Open Document Format (ODF), ASCII, CSV, XML. - Se desaconseja el uso de formatos DOC, XLS, PPT, SPSS ya que aunque son formatos utilizados de forma amplia son formatos propietarios.
Ejemplos de opciones de formatos generales preferidos:- PDF/A mejor que Word.
- ASCII mejor que Excel.
- MPEG-4 mejor que QuickTime.
- TIFF o JPEG2000, mejor que GIF o JPG.
- XML o RDF, mejor que RDBMS.
No obstante, hay que tener en cuenta que hay disciplinas con formatos preferidos para la gestión, difusión y reutilización de datos (formatos de datos geoespaciales, visuales…)
- Conversión de formatos
Es preciso que los propios autores de los datos hagan la conversión de formatos, para asegurar su integridad durante el proceso.
Ello es así porque cuando los datos se convierten de un formato a otro – a través de exportaciones o mediante un conversor- pueden ocurrir pequeñas variaciones, por ejemplo, en los datos organizados en paquetes estadísticos, spreadsheets o bases de datos, pueden perderse total o parcialmente datos relativos a definición de valores, decimales, fórmulas o etiquetas variables.Para los datos textuales, pueden perderse aspectos de edición como negrita, encabezamiento y pie de páginas, destacados.
Por otra parte, es conveniente hacer la conversión cuando los datos se han empaquetado en formatos propietarios a formatos estándares para la preservación digital, ya que ello facilitará la apertura de los ficheros en el futuro
Algunas herramientas recomendadas para la conversión de formatos:
5.- Descripción de los conjuntos de datos. Plantilla de RIUBU
Los investigadores son responsables de la información a proporcionar para la descripción de los datos.
Los datos que deben remitir los autores, de forma explícita, junto con los ficheros del dataset serían:
- AUTOR
- TÍTULO
- FECHA DE EMBARGO (si procede)
- ENTIDAD FINANCIADORA Y PROYECTO DE INVESTIGACIÓN (si procede)
- TIPO DE DOCUMENTO
- LICENCIA DE USO
- COBERTURA TEMPORAL DE LOS DATOS
- COBERTURA ESPACIAL DE LOS DATOS
6.- Procedimiento de envío de los DATASETS.
Para subir un DATASET a RIUBU, los interesados deberán ponerse en contacto con la Unidad de Repositorio Institucional y Acceso Abierto:
bubrep@ubu.es
Tel: 9015
Responsable de la Unidad: José Ignacio Benito Verde
Desde esta Unidad se indicará la información que deberá proporcionarse para la correcta descripción del registro en el Repositorio.
7.- Documentación suplementaria que acompaña al DATASET:
- Es IMPRESCINDIBLE que los autores del conjunto de datos elaboren un documento en el que se describa los datos con más detalle que en el registro bibliográfico que aparece en RIUBU, y que esta documentación se deposite como información suplementaria en formato readme.txt en inglés.
Especialmente relevante es la descripción de la metodología en que se ha basado la generación de los datos ya que sin ella la reutilización del conjunto de datos podría quedar muy limitada. - Información que puede facilitar la reutilización del conjunto de datos por parte de los usuarios:
- Títulos de las columnas y encabezamientos de datos tabulares.
- Ajustes y calibración de los instrumentos empleados en la generación de datos.
- Información sobre otros usuarios que han reutilizado los datos.
- Información sobre el sistema de medida empleado.
- Información sobre cualquier restricción de reutilización en alguna parte o la totalidad del conjunto de datos.
- Información sobre el software (versión y sistema operativo) necesario para leer y trabajar con las partes integrantes del conjunto de datos.
- Información sobre el procedimiento de generación y tratamiento de datos.
- Licencia de uso de datos
- Plantilla: con el objeto de homogeneizar la información que deberá recogerse en este documento, se recomienda emplear la plantilla elaborada por la Biblioteca de la Universidad de Burgos en base a las recomendaciones de la iniciativa FAIR (VER ANEXOS I y II)
8.- Denominación de archivos
- Los nombres de los ficheros deben reflejar los contenidos de los mismos e incluir suficiente información para hacerlos unívocos.
Buenas prácticas:
- Mantener una coherencia interna y seguir siempre el mismo criterio de denominación para cada fichero.
- Crear nombres significativos pero cortos.
- Conservar las extensiones de 3 letras específicas a códigos de aplicaciones como wrl, .mov, o .tif.
- Evitar espacios y caracteres especiales, como . : ; / () $ & | [ ] *< > “¿
- Usar el guión bajo (_) mejor que espacios en blanco entre palabras
- Evitar llamar a los ficheros por un número, ya que no es suficientemente descriptivo del contexto del registro
- No superar los 25 caracteres
- Identificar la actividad o proyecto en el nombre del archivo.
- Enumerar las versiones de los archivos es útil para indicar las revisiones o la edición de archivos, especialmente en los proyectos de colaboraciones. Para registros que tienen varias versiones, es aconsejable diferenciar unas versiones de otras indicando v01, v02 etc, en vez de update, nuevo etc. Una excepción resulta cuando denominamos a la versión definitiva, en cuyo caso puede llamarse FINAL. Para estos casos, se aconseja ser consistente en el nombre de los distintos ficheros para guardar una coherencia interna
- Los ficheros también pueden contener el acrónimo del proyecto, el nombre de los investigadores, el tipo de datos y el lugar de estudio.
- Redenominación de ficheros
Existen herramientas que ayudan a redenominar grupos de ficheros. Se recomienda hacerlo ANTES de su depósito en RIUBU, para no modificar sus nombres una vez que entren en la base de datos del repositorio.
9.- Versiones de los conjuntos de datos
A la hora de versionar conjuntos de datos, es recomendable definir lo que constituye una nueva versión de la obra (por ejemplo, nuevos algoritmos en los procesos de captura de datos, añadidos o eliminación de valores, nuevos parámetros y/o formatos, cambios en la cobertura espacial/cronológica).
Se recomienda que cada versión constituya un registro en sí, debidamente referenciado y documentado, con su propio identificador persistente y que se respete el criterio utilizado en la denominación de archivos.
10.- Copyright, licencias y reutilización de datos
- A la hora de aplicar una licencia de uso a un conjunto de datos los autores deben considerar:
- La identificación del material que debe cubrir la licencia.
- La identificación de material que haya sido usado como fuente en la elaboración de los datos.
- La identificación de cualquier tipo de restricción de uso que pudiera existir en el material original a partir del cual se han originado los datos.
Existen diferentes opciones de licencia y han de ser los propios autores de los datos quienes decidan en qué términos de uso desean poner a disposición pública su conjunto de datos. De todos modos, es importante tener en cuenta que un número creciente de editores de revistas tienen políticas de difusión de datos de investigación asociados a artículos científicos y en estos casos los autores de los datos deben cumplir con estos requerimientos editoriales que están publicados en las webs de las revistas.
Dentro del marco de la legislación de propiedad intelectual española hay dos tipos de licencias comunmente utilizadas a nivel internacional para los datos de investigación:
- Licencias Creative Commons
- Existen 6 licencias posibles. Todas permiten amplios usos de los objetos digitales a las que van sujetas, pero presentan matices de acuerdo con los tipos de actividades permitidas:
- Atribución. Está permitida la reutilización del conjunto de datos, sin necesidad de pedir permiso expreso a los autores, para estos usos: reproducción, distribución, difusión, y transformación (obras derivadas) siempre y cuando se reconozca la autoría y se cite el conjunto de datos tal y como se indica en la licencia.
- No comercial. Está permitida la reutilización del conjunto de datos, sin necesidad de pedir permiso expreso a los autores, para estos usos: reproducción, distribución, difusión, y transformación siempre y cuando no sea para fines no comerciales. El reconocimiento de autoría y la citación del conjunto de datos es también obligatoria.
- Sin obras derivadas. Está permitida la reutilización del conjunto de datos, sin necesidad de pedir permiso expreso a los autores, para estos usos: reproducción, distribución, difusión de la obra en sí, no de obras derivadas. El reconocimiento de autoría y la citación del conjunto de datos es también obligatoria.
- La Universidad de Burgos recomienda el uso de las licencias CC 4.0 Internacional.
- Licencias OpenData Commons
- Open Data Commons Open Database License (ODbL). Esta licencia permite a cualquier usuario de Internet reproducir, distribuir y usar el conjunto de datos, y adaptar y transformar el conjunto de datos siempre y cuando:
- Se haga reconocimiento explícito a la autoría del conjunto de datos originales y a sus términos de uso expresados en la licencia;
- Si se realizan obras derivadas, ofrecerlas bajo la misma licencia de uso (oDbL);
- Si se realizan versiones o adaptaciones con restricciones de acceso, seguir garantizando la disponibilidad de una copia en acceso abierto.
- Open Data Commons Attribution License. Esta licencia permite a cualquier usuario de Internet reproducir, distribuir y usar el conjunto de datos, y adaptar y transformar el conjunto de datos siempre y cuando se haga reconocimiento explícito a la autoría del conjunto de datos originales y a sus términos de uso.
- Open Data Commons Open Database License (ODbL). Esta licencia permite a cualquier usuario de Internet reproducir, distribuir y usar el conjunto de datos, y adaptar y transformar el conjunto de datos siempre y cuando:
- Embargo
Pueden darse circunstancias que limiten el acceso abierto a los datos. Entre las situaciones más frecuentes pueden mencionarse:
- Protección de información personal: Leyes de confidencialidad
- Protección de especies en peligro
- Protección de recursos culturales
- Protección de recursos genéticos
- Periodos de uso exclusivo de datos de investigación
Por motivos de confidencialidad o de tratamiento especial de datos, los autores de los conjuntos de datos pueden limitar la reutilización de su trabajo. En estos casos, se incluirá en RIUBU el registro bibliográfico sin acceso a los datasets.