
Possibilidades do formato CSV no Portal de Dados Abertos do Cabildo
O formato CSV é uma forma simples de armazenar dados em forma de tabela, o que permite a análise e a visualização. No Portal de Dados Abertos do Cabildo de Tenerife, o CSV é um dos formatos mais utilizados.
Neste artigo, vamos analisar em pormenor a natureza deste formato, de modo a tirar o máximo partido dele, tanto dentro como fora do portal.
Caraterísticas e importância do formato CSV
Os ficheiros CSV (Comma-Separated Values) são documentos num formato aberto simples que armazenam e representam dados sob a forma de uma tabela, em que cada linha do ficheiro representa uma linha e os valores das colunas são separados por um delimitador. O delimitador utilizado nos CSV do Portal de Dados Abertos do Cabildo de Tenerife é o carácter vírgula (,).
No Portal de Dados Abertos do Cabildo de Tenerife existem até à data mais de 150 conjuntos de dados disponíveis, como se pode ver no Painel de Controlo do Portal.
Este é o segundo formato mais numeroso no portal, mas, a nível geral, a sua utilização é a mais comum na publicação de dados abertos alfanuméricos e na transferência e intercâmbio de informações. De facto, o CSV é o formato mais comum tanto no catálogo nacional de datos.gob.es, que tem mais de 55.000 conjuntos de dados disponíveis neste formato, como no portal de dados europeu (data.europa.eu), que tem mais de 300.000 conjuntos de dados com pelo menos um CSV.
A simplicidade, a facilidade de interpretação por humanos e máquinas ou o facto de não ser necessário software específico para abrir ficheiros CSV justificam que o CSV seja um dos formatos mais versáteis e amplamente utilizados para o intercâmbio e armazenamento de dados em muitos domínios.
Orientações gerais para os dados CSV
Uma limitação deste formato é que não fornece mecanismos para definir o tipo de dados em cada coluna e para garantir que todos os valores estão corretos. Isto pode levar a erros como valores em falta ou mistura de tipos de dados, pelo que é importante aplicar boas práticas durante a preparação dos dados, implementar controlos de qualidade e associar o ficheiro a esquemas de metadados que definam o modelo de dados.
Os conjuntos de dados tabulares corretamente organizados obedecem a uma estrutura e forma definidas por algumas orientações, como as seguintes
- Cada ficheiro deve conter apenas uma tabela de dados.
- Todos os registos contêm o mesmo número de campos ou colunas (pelo menos um).
- Todos os valores da mesma coluna devem ser do mesmo tipo de dados (texto, número inteiro, decimal, data, etc.).
- Cada variável é uma coluna.
- Cada registo é uma linha, que é separada por quebras de linha.
- Cada intersecção de linha e coluna corresponde a uma célula.
- Cada conjunto de observações forma um quadro.
- Os campos são separados por um delimitador (",").
- Os números decimais utilizam (".") para separar a parte inteira da parte decimal.
O catálogo nacional de dados .gob.es inclui, no seu Guia prático para a publicação de dados tabulares em ficheiros CSV, informação completa sobre este formato, com o objetivo de promover a sua correta utilização.
Visualizações oferecidas pelo formato CSV
Embora o formato CSV em si não seja especificamente concebido para visualização, existem várias formas de visualizar ou apresentar dados neste formato. A forma mais básica é em forma de tabela, mas também podem ser visualizados em forma gráfica utilizando aplicações como o Microsoft Excel ou o LibreOffice; em forma de mapas; ferramentas de análise estatística como o R ou Python ou visualizações dinâmicas em plataformas que permitem importar ficheiros CSV para criar visualizações interactivas (PowerBI, Tableau).
O portal de dados abertos do Cabildo permite não só a visualização de ficheiros CSV sob a forma de tabela(visualização de dados tabulares), mas também sob a forma de gráfico ou mapa. Os recursos que contêm dados de latitude e longitude podem ser visualizados como um mapa, como, por exemplo, os de todos os Centros Desportivos e de Lazer de Tenerife.
Além disso, através da opção Dashboard, no bloco Data, é possível selecionar recursos CSV dos conjuntos para os visualizar, comparar e analisar os seus dados, tanto como tabela como como gráfico. Neste exemplo, são comparados os dados do conjunto de Reservas de actividades naturais em Tenerife correspondentes a diferentes anos.
Pode encontrar mais informações sobre os formatos de dados que podem ser encontrados no portal e como podem ser visualizados em cada caso no artigo do portal: Como posso visualizar os dados no portal?
Para aprofundar os seus conhecimentos sobre o portal do Cabildo de Tenerife, consulte a secção de formação.