Importa ficheros CSV a OpenProdoc con CSV2OPD

Publicado el 16 de octubre de 2018 por en ECM, Software libre

El formato CSV (valores separados por comas) sirve para representar datos en forma de tabla, delimitando las columnas con comas (u otros separadores, como puntos y comas, dos puntos, tabuladores o espacios). Su aplicación más habitual en el campo de la gestión documental es exportar de un sistema a otro metadatos almacenados en una base de datos o una hoja de cálculo. En esta entrada te explico cómo puedes importar ficheros CSV al gestor documental OpenProdoc gracias a una herramienta libre que he desarrollado: CSV2OPD.

Un convertidor de CSV a XML para OpenProdoc

OpenProdoc permite importar masivamente todos los documentos de un directorio junto con sus metadatos. Para que la importación se realice correctamente, los metadatos de cada documento deben estar en formato OPD. Estos archivos OPD no son otra cosa que archivos XML con una apariencia como ésta:

<OPDObject type="PD_DOCS">
<ListAttr>
<Attr Name="Author">Committee on Descriptive Standards</Attr>
<Attr Name="DocCode">ISBN 0-9696035-5-X</Attr>
<Attr Name="DocScope">World</Attr>
<Attr Name="Keywords">Archival materials--Standards|International Council on Archives</Attr>
<Attr Name="ACL">Public</Attr>
<Attr Name="DocDate">1999-09-22</Attr>
<Attr Name="DocType">ECM_Standards</Attr>
<Attr Name="LockedBy"></Attr>
<Attr Name="MimeType">pdf</Attr>
<Attr Name="Name">1514012e982-3fd0edae9c819e381.01380649800b-3fbe5f3f9812f0181.0137b3204bcc-3fd9b400d9512e401.0ISAD(G).pdf</Attr>
<Attr Name="PDAutor">root</Attr>
<Attr Name="PDDate">2015-11-25 20:16:00</Attr>
<Attr Name="PDId">1514012e982-3fd0edae9c819e38</Attr>
<Attr Name="ParentId">1514012e964-3fc7b73db63909f0</Attr>
<Attr Name="PurgeDate"></Attr>
<Attr Name="Reposit">Reposit</Attr>
<Attr Name="Status"></Attr>
<Attr Name="Title">ISAD(G). General International Standard Archival Description</Attr>
<Attr Name="Version">1.0</Attr>
</ListAttr></OPDObject>

CSV2OPD transforma los metadatos almacenados en un archivo CSV en archivos OPD listos para importar. Como puedes imaginar, esto facilita muchísimo la interoperabilidad con OpenProdoc de cualquier otro sistema que pueda exportar metadatos en formato CSV.

Esta herramienta surge de mi necesidad de importar a OpenProdoc un inventario con cerca de 1.000 registros debidamente descritos. En lugar de volver a añadirlos uno a uno en el gestor documental, desarrollé un sencillo programa que convierte cada una de las líneas del CSV en un fichero OPD. Ahora le he añadido una interfaz gráfica y lo he liberado para que cualquiera puede utilizarla como considere oportuno.

Dicho de otro modo, podemos convertir este CSV:

CSV de ejemplo

En este XML:

XML de ejemplo

Aunque está pensado para OpenProdoc, CSV2OPD puede adaptarse con relativa facilidad a las especificaciones de otros gestores documentales.

¡Y, ahora, veamos cómo funciona!

Requisitos de la herramienta

CSV2OPD funciona en cualquier sistema operativo que soporte Python 3.

Para comprobar si tienes Python 3 instalado en tu equipo, escribe el siguiente comando en tu terminal:

python --version

Deberías de ver algo como esto:

$ python --version
Python 3.7.0

Si no es el caso, descarga e instala Python antes de continuar.

Descarga CSV2OPD

La manera más fácil de descargar esta herramienta es clonar su repositorio de GitHub:

git clone https://github.com/guillearch/csv2opd.git

Alternativamente, se puede descargar como ZIP y descomprimir:

wget https://github.com/guillearch/csv2opd/archive/master.zip
unzip master.zip

Ejecuta CSV2OPD

Tras descargar la herramienta:

  1. Abre el directorio /csv2opd y ejecuta la aplicación con el siguiente comando: python csv2opd.py.
  2. Selecciona el CSV a importar. Debe tener un encabezado y no contar con una columna denominada “OPDObject type”.
  3. Selecciona el directorio de salida para los archivos XML.
  4. Selecciona el tipo de separador utilizado en tu archivo CSV (coma, punto y coma, etc.).
  5. Haz clic en el botón “Convert”.

Interfaz gráfica de CSV2OPD

Una vez completada la conversión, podrás importar los documentos y sus metadatos en OpenProdoc siguiendo las instrucciones proporcionadas en la documentación oficial.

Es muy importante que el nombre de cada documento coincida con el valor del campo “Name” del correspondiente archivo OPD.

Espero que esta entrada te haya resultado interesante y, como de costumbre, te animo a compartir tus dudas y sugerencias en la sección de comentarios.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.