6.1 Existosos repositorios internacionales

6.1.1 ICPSR

Este es un consorcio internacional de más de 750 instituciones académicas y organizaciones de investigación, el Consorcio Interuniversitario de Investigación Política y Social (ICPSR) proporciona liderazgo y capacitación en acceso a datos, curación y métodos de análisis para la comunidad de investigación en ciencias sociales.

ICPSR mantiene un archivo de datos de más de 250.000 archivos de investigación en las ciencias sociales y del comportamiento. Alberga 21 colecciones especializadas de datos en educación, envejecimiento, justicia penal, abuso de sustancias, terrorismo y otros campos.A continuación se presenta una visualización de un ejemplo dos ejemplos de datos de este repositorio.

El ejemplo que se presenta a continuación posee como propósito comprender mejor el problema de la agresión sexual entre las mujeres afroamericanas en Maryland Estados Unidos , evaluar el uso de los recursos disponibles en respuesta a la agresión sexual y explorar el uso de fuentes alternativas de atención (Weist et al. 2009). Los investigadores entrevistaron a 223 mujeres víctimas de agresión sexual (Parte 1 y Parte 2) entre enero de 2004 y julio de 2005 y realizaron 21 grupos focales (Parte 3). A continuación puede ver la pagina web para observar los recursos que posee.

Como puede verse se ofrece al usuario una descripción general del documento, lo cual facilita a los investigadores evaluar la pertinencia de su uso. Tambien se puede descargar la documentación y los datos del estudio, pero dado la tematica y la importancia de ser prudentes con su divulgación estos deben solicitarse explicando el uso investigativo que se dará para que los autores evaluen si se dara acceso a los datos.

En terminos FAIR este documento poseee un identificador, es encontrable y esta en un fomrato que es ampliamente utilizado el pdf. No obstante quizas seria bueno que las entrevistas tambien esten en formato de texto plano txt, para garantizar su perdurabildiad al largo plazo.

La siguiente base de datos trabaja sobre el desarrollo de los adolecentes y cuenta con más de 10 olas (Mortimer 2009). Adempas a sido descargadad más de 100 mil veces, y posee más de 209 publicaciónes asociadas, lo que da cuenta de la buena difución con la que ha contado esta base datos y su posibilidad de ser usada por otros investigadores. Le invitamos a revisar los componentes en el repositorio.

Un problema frecuente con los metadatos es que se requiere utilizar un formato de metadatos en particular, formato que no siempre acomoda a todos quienes requieran de ellos y además cambien en el tiempo (Gómez, Méndez Rodríguez, and Hernández Pérez 2016). Al respecto esta pagina posee como ventaja que permite al usuario descargar los metadatos en distintos formatos.

Evaluado desde el punto de vista FAIR, podemos decir que cumple en buena medida los criterios, posee un identificador incluido en los metadatos que ademas tiene un protocolo de comunicación estandarizado (“http//”). Si bien en este documento se puede acceder directamente a los materiales, en otros proyectos de ICPSR se requiere autorización para ello, lo cual da cuenta de lo diámico y flexible de la plataforma.

Para descargar los datos se debe generar una cuenta que puede ser un usuaro asociado a un correo, una cuenta google, linkenid o ocid. Es bastante sensillo y rapido generar la cuenta para descargar los datos. Al hacerlo se nos adbierte las condiciones de uso y la licencia con la que cuenta la base de datos lo cual esta en linea con Fair.

En terminos de interoperabilidad al descargar la base de datos se pueden elegir entre multiples fomratos para los datos lo cual facilita su uso por distintos investigadores.

No obstante sus buenos estandares de almacenamiento, no se puede acceder a los datos de esta investigación si no se es miembro de una orgnaizaicon en alianza con ICPSR.

Un aspecto destacable respecto a este repositorio es que posee una pestaña donde se pueden encontrar todos las publicaciones relacionadas con este conjunto de datos, lo cual fomenta la colaboración y ayuda a eliminar la ineficiente practica de “Reinventar la rueda”.

  Evaluar segun el resto de los parametros. 
  
  
  Diccionario sobre temas de almacenamiento de datos para cientiestas sociales. 
  https://www.icpsr.umich.edu/web/ICPSR/cms/2042  Documentación es un termino adecuado.     
  
  https://www.icpsr.umich.edu/files/ICPSR/curation/preservation/policies/dp-policy-outline.pdf 
  gia de politicas

6.1.2 Qualitative Data repository

El repositorio de datos cualitativos (QDR) es un archivo dedicado para almacenar y compartir datos digitales (y la documentación adjunta) generados o recopilados a través de la investigación cualitativa y de múltiples métodos en las ciencias sociales. QDR proporciona servicios de consultoría en gestión de datos y selecciona activamente todos los proyectos de datos, manteniendo el valor y la utilidad de los datos a lo largo del tiempo y asegurando su disponibilidad y posibilidad de encontrarlos para su reutilización.

A continuación, se presenta una página web ya referenciada en este documento sobre la participación de género en el desarrollo comunitario en torno a los fondos climáticos de descentralización. Este trabajo ofrece un conjunto de documento como las pautas de Focus Groups y sus transcripciones, aunque solo se tiene de libre acceso las pautas y para acceder a las transcripciones se requiere una cuenta y solicitarlas a los investigadores responsables mediante la página. Si gusta puede revisar dicho contenido en el siguiente link

Este repositorio cuenta con un identificador indicado en metadatos contundentes que además están indexados en un buscador web. También poseen un protocolo de comunicación estandarizado, además de poseer medios para la autorización del uso del material.

Además, la página facilita el uso permitiendo previsualizaciones de los documentos que se encuentra abiertos, recurso que se encuentra igualmente en los otros buenos ejemplos de repositorios de datos.

Otra temática importante que es trabajada por este repositorio es su apoyo en el hacer anónimos los datos, lo cual da cuenta de un compromiso por resguardar la seguridad de los investigadores y apoyarles como sugiere necesario el documento de Autoevaluación RISE.

En vista de que los datos son accesibles si se los solicita, y considerando la importancia ética de generar consentimientos informados coherentes con la ciencia abierta (Dennis et al. 2019), se puede hacer una crítica al hecho de que el consentimiento informado en el estudio no explicita a los sujetos de investigación que las entrevistas se pondrán a disposición de la comunidad científica mediante solicitud.

Como aspectos positivos esta página también cuenta con la posibilidad de exportar los metadatos en distintos formatos ampliamente reconocidos como DC, DDI, JSON.

Respecto a los factores de éxito señalados por CILAC, se señala la importancia de los incentivos para los investigadores. Entre estos incentivos el reconocimiento y las citas son importantes. Al respecto el repositorio expuesto posee pocas descargas (88) y ninguna cita, esto podría ser eventualmente un problema de difusión.

6.1.3 UK Data Service

El Servicio de Datos del Reino Unido está financiado por el Consejo de Investigación Económica y Social (ESRC) para satisfacer las necesidades de datos de investigadores, estudiantes y profesores de todos los sectores, incluidos el mundo académico, el gobierno central y local, organizaciones benéficas y fundaciones, centros de investigación independientes, grupos de expertos, y consultores empresariales y del sector comercial.

La recopilación del Servicio de datos del Reino Unido incluye las principales encuestas patrocinadas por el gobierno del Reino Unido, encuestas transnacionales, estudios longitudinales, datos del censo del Reino Unido, agregados internacionales, datos comerciales y datos cualitativos.

Esta página también logra satisfacer los principios Fair. En términos del repositorio estos también se adaptan a los criterios de autoevaluación RISE, en los cuales se señala a la importancia de generar apoyo a los usuarios, acción realizada por el UK Service para sus miembros.

Para acceder a los datos se requiere una cuenta registrada, la cual solo es para personas que son parte de las organizaciones afiliadas al repositorio.

6.1.4 Dataverse Harvard

El Proyecto Dataverse es una aplicación web de código abierto para compartir, preservar, citar, explorar y analizar datos de investigación. Facilita la puesta a disposición de otros de los datos y le permite replicar el trabajo de otros con mayor facilidad. Los investigadores, las revistas, los autores de datos, los editores, los distribuidores de datos y las instituciones afiliadas reciben crédito académico y visibilidad en la web.

De este modo, dataverse no solo apoya el proceso de almacenamiento de matariales e información para la investigación sino que tambien posibilita el almacenamiento de codigos para la reproducibilidad, comprendida como la posibilidad de volver a ejecutar un analisis con los mismos datos y mismos procedimientos usualmente especificados en codigos.

Un repositorio de Dataverse es la instalación del software, que luego aloja varios archivos virtuales llamados colecciones de Dataverse. Cada colección de Dataverse contiene conjuntos de datos, y cada conjunto de datos contiene metadatos descriptivos y archivos de datos (incluida la documentación y el código que acompañan a los datos). Como método de organización, las colecciones de Dataverse también pueden contener otras colecciones de Dataverse.

Segun la institución, la idea central detrás del Proyecto Dataverse es automatizar gran parte del trabajo del archivero profesional y proporcionar servicios y distribuir crédito al creador de datos. Antes del Proyecto Dataverse, los investigadores se vieron obligados a elegir entre recibir crédito por sus datos, controlando la distribución ellos mismos pero sin garantías de conservación a largo plazo, o tener garantías de conservación a largo plazo, enviándolos a un archivo profesional pero sin recibir mucho crédito. El Proyecto Dataverse rompe esta mala elección: colocamos una colección de Dataverse (un archivo virtual) en su sitio web que tiene el aspecto, la sensación, la marca y la URL de su sitio web, junto con una cita académica para los datos que le brindan crédito y visibilidad web completos.

El siguiente es un ejemplo de conjunto de datos sobre la replicación de un estudio sobre lasa actitudes de los residentes urbanos hacia la migración ambiental en Kenia y Vietnam.

Evaluando este conjunto de datos desde la perspectiva Fair podemos decir que es un buen ejemplo y cumple con los requisitos.

Un aspecto destacable de este repositoro es que poseen un previsualizador de los datos, asi como un espacio para observar las distintas versiones de los archivos.

6.1.5 GESIS

Gesis es actualmente la institión con mayor infraestructura para CCSS de alemania. Ofrece una gran cantida dde servicios de acceso a datos de invesitgaciónes, publicaciones, instrumentos de medición entre otros.

European Commission (2015)

6.1.6 REPOSITORIO EN OSF,

Open Science Framework (OSF) es una plataforma con la intención de centralizar las labores de almacenamiento e infraestructura digital que son necesarios para las distintas etapas del proceso investigativo. Esta página está hecha para almacenar hipótesis, diseños de investigación, bases de datos, resultados y versiones de los artículos o publicaciones finales. Esta plataforma puede ser utilizada gratuitamente por cualquier usuario, lo que permite a los investigadores concentrarse en investigar y dejando estas funciones a la plataforma.

Si se poseen recursos de una institución y sus participantes lo desean, pueden contratar un servicio espacial de OSF que permite hacer páginas web de los distintos proyectos de investigación de una institución, vinculando estos proyectos entre sí. A continuación, se expone una página que Almacena investigaciones de a2jLab un laboratorio de acceso a la justicia. Puede acceder al repositorio mediante el siguiente link

Si bien las investigaciones depositadas no utilizan todos los recursos, se puede apreciar que es posible crear un conjunto de recursos de distinto tipo adecuados para la investigación social. Por ejemplo, la plataforma permite hacer pre-registros para investigaciones cuantitativas y cualitativas. Los pre-registros implican exponer con anterioridad las hipótesis que se poseen antes de hacer el análisis de los datos, para evitar que se generen hipótesis a posteriori señalando engañosamente que fueron pensadas teóricamente anteriores al análisis de la información.

Como aspecto negativo se debe señalar que si bien la página genera identificadores únicos que pueden servir tanto para los artículos como para las bases de datos y se poseen metadatos, estos últimos son bastante restringidos. No se pueden agregar nuevas celdas de información para los metadatos ni se pueden exportar a distintos estándares de metadatos.

6.1.7 fragilefamilies

Una experiencia en el almacenamiento de bases de datos es el centro de investigación “Fragile Families” que posee un repositorio abierto de su estudio longitudinal. Esta plataforma facilita la búsqueda de datos a los investigadores a partir de un buscador de datos. Este último muestra un resumen de las variables de cada ola de su estudio longitudinal como se puede observar en la imagen posterior. Considero que este es un valioso recurso que facilita a los investigadores la toma de decisiones respecto a los datos a utilizar.

Tolerar ideas distintas es el valor más importante que debieran aprender

Figura 6.1: Tolerar ideas distintas es el valor más importante que debieran aprender

References

Dennis, Simon, Paul Garrett, Hyungwook Yim, Jihun Hamm, Adam F. Osth, Vishnu Sreekumar, and Ben Stone. 2019. “Privacy Versus Open Science.” Behavior Research Methods 51 (4): 1839–48. https://doi.org/10.3758/s13428-019-01259-5.

European Commission, Brussels. 2015. “Flash Eurobarometer 403 (Citizens’ Perception About Competition Policy, Wave 2)Flash Eurobarometer 403 (Citizens’ Perception About Competition Policy, Wave 2).” GESIS Data Archive. https://doi.org/10.4232/1.12347.

Gómez, Nancy Diana, Eva María Méndez Rodríguez, and Antonio Hernández Pérez. 2016. “Datos y metadatos de investigación en ciencias sociales y humanidades: una aproximación desde los repositorios temáticos de datos,” August.

Mortimer, Jeylan T. 2009. “Youth Development Study, 1988-2011 [St. Paul, Minnesota]: Version 3.” ICPSR - Interuniversity Consortium for Political and Social Research. https://doi.org/10.3886/ICPSR24881.V3.

Weist, Mark D., Jennifer Pollitt-Hill, Linda Kinney, Yaphet Bryant, Laura Anthony, and Jennifer Wilkerson. 2009. “African American Experience of Sexual Assault in Maryland, 2003-2006: Version 1.” ICPSR - Interuniversity Consortium for Political and Social Research. https://doi.org/10.3886/ICPSR25201.V1.