Importación de ítems en DSpace usando el Formato de Archivo Simple (Parte 3)

En la primera parte de esta publicación se explicó en qué consiste el Formato de Archivo Simple y en la parte 2 cómo crear esta estructura con una herramienta de línea de comandos a partir de un archivo csv.

A continuación se muestra la forma en que se utiliza el comando import de DSpace para importar los ítems a nuestro repositorio.

Importación de elementos con sus bitstreams

La herramienta SAFBuilder es útil para generar la estructura de archivos, sin embargo para que los ítems se carguen a DSpace es necesario realizar la importación, ya sea con el comando dspace import o con las interfaces gráficas de usuario.

 

Para probar la importación con el comando dspace import podemos escribir el parámetro –t para que se realice un test que nos indique si existe algún problema, como en el acceso a archivos, error en el identificador de la colección o en el identificador del usuario que realiza la importación.

sudo /dspace/bin/dspace import -a -e josem.carrizosa98@gmail.com -c 123456789/10 -s ~/Descargas/mamiferos/mamiferos-output/ -m ~/Descargas/mamiferos/batch-mamiferos.map –t

También se puede notar el orden en que se realiza el proceso de importación, se indica desde que carpeta se están agregando los ítems, se lee la carpeta del primer ítem, se lee y procesa el archivo dublincore.xml, se lee y procesa el archivo contents y se procesa el archivo handle, en caso de no haber se generaría uno.

Test de importación de elementos con la estructura SAF

Para la importación real de los elementos ejecutamos el mismo comando pero sin el parámetro –t, nos mostrará información de cada ítem y finalmente el tiempo que duró la operación.

Con la importación se generó el archivo de mapeo con el nombre de los Ítems importados y su handler correspondiente. Este archivo es útil para eliminar o modificar los ítems que se agregaron.

archivo de mapeo

Los ítems se encuentran listados en la colección
correspondiente.

Títulos de los elementos importados

En el registro completo del elemento se encuentran los metadatos que se incluyeron en el archivo csv así como otros que se generan al subir el ítem al repositorio.

Registro de Metadatos

En la página del ítem también se deben de mostrar los archivos que se habían descrito en la columna filename del archivo csv.

Archivos jpg, pdf y mp3 listados en la página del ítem

Conclusión

El proceso de la importación masiva no es tan complicado una vez que se identifican los pasos de forma general: preparar los archivos y base de datos, usar la herramienta SAFBuilder y ejecutar la migración.

Teniendo lo anterior en mente y con la serie de recomendaciones presentadas en cada parte de esta guía, podrá realizar exitosamente la importación de sus ítems.

La información proporcionada se obtuvo de la documentación oficial de DSpace que se puede encontrar en https://wiki.lyrasis.org/display/DSDOC6x/Importing+and+Exporting+Items+via+Simple+Archive+Format para entender el formato de archivo simple y la importación.

El uso de un empaquetador se explica en https://wiki.lyrasis.org/display/DSPACE/Simple+Archive+Format+Packager

 

Y la documentación y código fuente del empaquetador SAFBuilder está alojada en GitHub https://github.com/DSpace-Labs/SAFBuilder

Elaborado por:

José Manuel Carrizosa Bustamante

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *