
Möglichkeiten des CSV-Formats im offenen Datenportal des Cabildo
Das CSV-Format ist eine einfache Möglichkeit, Daten in tabellarischer Form zu speichern, die eine Analyse und Visualisierung ermöglicht. Im Open Data Portal des Cabildo de Tenerife ist CSV eines der am häufigsten verwendeten Formate.
In diesem Artikel werden wir uns die Eigenschaften dieses Formats genauer ansehen, um es sowohl innerhalb als auch außerhalb des Portals optimal nutzen zu können.
Merkmale und Bedeutung des CSV-Formats
CSV-Dateien (Comma-Separated Values) sind Dokumente in einem einfachen offenen Format, die Daten in Form einer Tabelle speichern und darstellen, wobei jede Zeile der Datei eine Zeile darstellt und die Werte der Spalten durch ein Trennzeichen getrennt sind. Das in den CSV-Dateien des Portals für offene Daten des Cabildo de Tenerife verwendete Trennzeichen ist das Komma (,).
Im Open Data Portal des Cabildo de Tenerife sind bisher mehr als 150 Datensätze verfügbar, wie im Dashboard des Portals zu sehen ist.
Es handelt sich um das zweithäufigste Format im Portal, aber allgemein wird es am häufigsten für die Veröffentlichung von alphanumerischen offenen Daten und für die Übertragung und den Austausch von Informationen verwendet. Tatsächlich ist CSV das häufigste Format sowohl im nationalen Katalog von datos.gob.es, der mehr als 55.000 Datensätze in diesem Format enthält, als auch im europäischen Datenportal (data.europa.eu), das mehr als 300.000 Datensätze mit mindestens einem CSV enthält.
Die Einfachheit, die leichte Interpretation durch Menschen und Maschinen oder die Tatsache, dass zum Öffnen von CSV-Dateien keine spezielle Software erforderlich ist, rechtfertigen CSV als eines der vielseitigsten und am weitesten verbreiteten Formate für den Datenaustausch und die Speicherung in vielen Bereichen.
Allgemeine Richtlinien für CSV-Daten
Eine Einschränkung dieses Formats besteht darin, dass es keine Mechanismen bietet , um die Art der Daten in jeder Spalte zu definieren und um sicherzustellen, dass alle Werte korrekt sind. Dies kann zu Fehlern wie fehlenden Werten oder Vermischung von Datentypen führen. Daher ist es wichtig, bei der Datenaufbereitung bewährte Verfahren anzuwenden, Qualitätskontrollen durchzuführen und die Datei mit Metadatenschemata zu verknüpfen, die das Datenmodell definieren.
Ordnungsgemäß organisierte Tabellendatensätze entsprechen einer Struktur und Form, die durch einige Richtlinien wie die folgenden definiert ist:
- Jede Datei sollte nur eine Datentabelle enthalten.
- Alle Datensätze enthalten die gleiche Anzahl von Feldern oder Spalten (mindestens eines).
- Alle Werte in einer Spalte müssen vom gleichen Datentyp sein (Text, Ganzzahl, Dezimalzahl, Datum usw.).
- Jede Variable ist eine Spalte.
- Jeder Datensatz ist eine Zeile, die durch Zeilenumbrüche getrennt ist.
- Jeder Schnittpunkt von Zeile und Spalte entspricht einer Zelle.
- Jeder Satz von Beobachtungen bildet eine Tabelle.
- Felder werden durch Trennzeichen (",") getrennt.
- Bei Dezimalzahlen wird (".") verwendet, um den ganzzahligen Teil vom dezimalen Teil zu trennen.
Der nationale Datenkatalog .gob.es enthält in seinem praktischen Leitfaden für die Veröffentlichung von Tabellendaten in CSV-Dateien vollständige Informationen über dieses Format, um seine ordnungsgemäße Verwendung zu fördern.
Die Visualisierungsmöglichkeiten des CSV-Formats
Obwohl das CSV-Format selbst nicht speziell für die Visualisierung konzipiert ist, gibt es mehrere Möglichkeiten, Daten in diesem Format zu visualisieren oder zu präsentieren. Die einfachste Form ist die tabellarische, aber sie können auch in grafischer Form mit Anwendungen wie Microsoft Excel oder LibreOffice visualisiert werden, in Form von Karten, statistischen Analysetools wie R oder Python oder dynamischen Visualisierungen in Plattformen, die den Import von CSV-Dateien zur Erstellung interaktiver Visualisierungen ermöglichen (PowerBI, Tableau).
Das offene Datenportal des Cabildo ermöglicht nicht nur die Visualisierung von CSV-Dateien als Tabelle(tabellarische Datenvisualisierung), sondern auch als Diagramm oder Karte. Ressourcen, die Daten zu Längen- und Breitengraden enthalten, können als Karte dargestellt werden, wie z.B. die aller Sport- und Freizeitzentren auf Teneriffa.
Darüber hinaus ist es möglich, über die Option Dashboard im Datenblock CSV-Ressourcen aus den Sets auszuwählen, um sie zu visualisieren, zu vergleichen und ihre Daten zu analysieren, sowohl als Tabelle als auch als Diagramm. In diesem Beispiel werden die Daten der Gruppe der Naturschutzgebiete auf Teneriffa aus verschiedenen Jahren verglichen.
Weitere Informationen über die Datenformate, die auf dem Portal zu finden sind, und darüber, wie sie jeweils angezeigt werden können, finden Sie im Portalartikel: Wie kann ich die Daten auf dem Portal anzeigen?
Vertiefen Sie Ihre Kenntnisse über das Portal Cabildo de Tenerife, indem Sie die Rubrik Schulung konsultieren.