
Posibilidades del formato CSV en el Portal de Datos Abiertos del Cabildo
El formato CSV es una manera sencilla de almacenar datos en forma de tabla, que permite realizar análisis y visualizaciones. En el Portal de Datos Abiertos del Cabildo de Tenerife, el CSV es uno de los formatos más utilizados.
En este artículo profundizaremos en la naturaleza de este formato para sacarle el máximo partido, fuera o dentro del portal.
Características e importancia del formato CSV
Los archivos CSV (“Comma-Separated Values” o valores separados por comas), son documentos en formato abierto sencillo que almacenan y representa datos en forma de tabla, donde cada línea del archivo representa una fila y los valores de las columnas se separan por un delimitador. El delimitador utilizado en los CSV del Portal de Datos Abiertos del Cabildo de Tenerife es el carácter de la coma (,).
En el portal de Datos Abiertos del Cabildo de Tenerife existen hasta ahora más de 150 conjuntos de datos disponibles, tal y como se puede ver en el Cuadro de mando del portal.
Este es el segundo formato más numeroso en el portal, pero, a nivel general, su uso es el más habitual en la publicación de datos abiertos alfanuméricos y en las transferencias e intercambios de información. De hecho, el CSV es el formato mayoritario tanto en el catálogo nacional de datos.gob.es que cuenta con más de 55.000 conjuntos de datos disponibles con este formato como en el portal europeo de datos (data.europa.eu), que dispone de más de 300.000 conjuntos con al menos un CSV.
La simplicidad, su facilidad de interpretación por personas y por máquinas o el hecho de que no es necesario ningún software en concreto para abrir archivos en formato CSV justifican que este sea uno de los formatos más versátiles y ampliamente utilizados para el intercambio y almacenamiento de datos en múltiples ámbitos.
Pautas generales de los datos en CSV
Una limitación de este formato es que no proporciona mecanismos para definir el tipo de datos en cada columna ni para asegurar que todos los valores sean correctos. Esto puede llevar a errores como valores faltantes o la mezcla de tipos de datos, por eso es importante aplicar buenas prácticas durante la preparación de los datos, implementar controles de calidad y asociar el archivo con esquemas de metadatos que definan el modelo de datos.
Los conjuntos de datos tabulares correctamente organizados se ajustan a una estructura y forma definida por algunas pautas como las siguientes:
- Cada archivo debe contener solo una tabla de datos.
- Todos los registros contienen el mismo número de campos o columnas (por lo menos una).
- Todos los valores de una misma columna deben ser del mismo tipo de datos (texto, enteros, decimales, fecha, etc.).
- Cada variable es una columna.
- Cada registro es una fila, que se separa por saltos de línea.
- Cada intersección de fila y columna se corresponde con una celda.
- Cada conjunto de observaciones conforma una tabla.
- Los campos se separan mediante delimitador (“,“)
- Los números decimales utilizan (“.”) para separar la parte entera de la decimal.
El catálogo nacional de datos.gob.es incluye en su Guía práctica para la publicación de datos tabulares en archivos CSV, información completa sobre este formato, con el objetivo de fomentar un uso adecuado del mismo.
Visualizaciones que ofrece el formato CSV
Aunque el formato CSV en sí no está diseñado específicamente para visualización, hay varias maneras para visualizar o presentar datos en este formato. La forma más básica es en forma de tabla, pero también se pueden visualizar en forma de gráficos mediante aplicaciones como Microsoft Excel o LibreOffice; en forma de mapas; herramientas de análisis estadísticos como R o Python o visualizaciones dinámicas en plataformas que permiten importar archivos CSV para crear visualizaciones interactivas (PowerBI, Tableau).
El portal de datos abiertos del Cabildo no solo permite la visualización de archivos CSV en forma de tabla (visualización de datos tabulares), sino también en forma de gráfico o en un mapa. Se pueden visualizar en forma de mapa los recursos que contienen datos de latitud y longitud como, por ejemplo, los del conjunto de Centros deportivos y de ocio en Tenerife.
Además, a través de la opción Tablero, en el bloque de Datos, es posible seleccionar recursos CSV de los conjuntos para visualizarlos, compararlos y analizar sus datos, tanto en forma de tabla como de gráfico. En este ejemplo, se comparan los datos del conjunto de Reservas de actividades en la naturaleza en Tenerife correspondientes a diferentes años.
Puedes consultar más información sobre los formatos de datos que se pueden encontrar en el portal y cómo se pueden visualizar en cada caso en el artículo del portal: ¿Cómo puedo visualizar los datos en el Portal?
Amplía tus conocimientos sobre el portal del Cabildo de Tenerife consultado el apartado de formación.