5.6 Tuberia de datos (ICPSR)

Una de las organizaciones mundiales más grandes en torno al almacenamiento de datos es Inter-university Consortium for Political and Social Research (ICPSR). Esta plataforma, además de dedicarse al almacenamiento de datos realiza cursos sobre curatoría de datos. Esta plataforma posee múltiples bases de datos de distintas áreas y ofrece la posibilidad de distintos servicios como la posibilidad de descargar el metadata, de realizar análisis en línea, de realizar gráficos y, además, posee herramientas para solicitar bases de datos con información sensible, para lo cual es necesario entregar una serie de documentos como el cv. Esta plataforma si bien ofrece estos servicios no todas las bases de datos los utilizan.

Esta organización, hace un tiempo realizo un curso sobre curatoría y mantenimiento de datos, curso en el cual se enseñó, entre otros conocimiento y herramientas, el diseño de flujo de datos “tubería de procesamiento”, que es un esquema con los pasos necesarios para la publicación de los datos en línea. Los pasos de este esquema se encuentran en el siguiente esquema.

Propuesta ICPSR

Figura 5.2: Propuesta ICPSR

De este esquema podemos destacar los siguientes puntos:

  • Es importante la recolección del material asociado a la base de datos.

  • Es necesario construir metadatos suficientes.

  • Se sugiere abrir la posibilidad de datos en línea, los cuales deben ser supervisados para garantizar su continuo funcionamiento

  • Es conveniente guardar los datos ya procesados en una memoria local.

  • La difusión es fundamental como parte del proceso.