Données ouvertes du Cabildo de Tenerife
-
Comme nous l'avonsvu dans les articles précédents avec la visualisation de données tabulaires, le portail de données ouvertes du Cabildo de Tenerife vous permet de visualiser certains ensembles de données sous forme de graphiques, ce qui vous aide à comprendre les informations les plus pertinentes .
Aujourd'hui, à travers différents ensembles de données disponibles sur le portail, nous allons nous concentrer sur lamanière de travailler avec ce type de visualisation et les avantages qu'il offre.
Pour commencer, ouvrons l'ensemble de données "Incidents sur les routes de Tenerife". Une fois dans l'ensemble de données, nous introduisons la visualisation de n'importe laquelle de ses ressources au format CSV et, à son tour, dans la partie gauche de l'écran, nous accédons à l'option "Graphique". C'est ici que nous commençons à configurer notre graphique.
Dans cette option, nous verrons 10 types de graphiques différents, parmi lesquels nous pourrons choisir :
Pour tous ces types de graphiques, nous avons la possibilité de les exporter dans trois formats différents ou de les imprimer en accédant au menu disponible à l'aide du bouton à trois points situé en haut à droite du graphique.
Diagramme à barres
Les diagrammes àbarresrésument et comparent des données catégorielles en utilisant des barres de longueur proportionnelle pour représenter les valeurs. Les diagrammes à barres sont composés d'un axe X et d'un axe Y. L'axe X représente des données catégorielles discrètes. L'axe des X représente des catégories discrètes qui correspondent à une ou plusieurs barres. L'axe Y est l'endroit où l'on peut voir les valeurs, c'est-à-dire les nombres ou les quantités à exprimer.
Nous avons déjà sélectionné un ensemble de données, l'option graphique et nous avons décidé de générer un diagramme à barres. Comment procéder ?
Lorsque nous sélectionnons cette typologie, un menu déroulant apparaît, dans lequel nous pouvons sélectionner la valeur que nous voulons visualiser sur l'axe X. Cette fois-ci, nous choisirons "Incidence_Bar". Cette fois-ci, nous choisirons "incidence_type".
Le portail génère un graphique qui permet de visualiser, en un coup d'œil, les différents types d'incidents signalés sur les routes et, pour chacun d'entre eux, le nombre d'occurrences, en distinguant clairement ceux qui sont les plus fréquents et ceux qui le sont moins.
L'axe Y montre l'opération effectuée, comme on peut le voir dans le graphique ci-dessus, le nombre d'incidents est compté, mais on peut aussi obtenir la Moyenne, la Somme, le Minimum ou le Maximum des différentes variables numériques de la ressource. Par exemple, en sélectionnant l'ensemble "Stations météorologiques de Tenerife",nous choisissons pour l'axe X "nom_de_la_municipalité" et dans l'axe Y la "Somme" de la colonne "quantité_de_capteurs". De cette manière, la somme des valeurs collectées par nom de municipalité peut être analysée.
Ce graphique montre le nombre total de capteurs météorologiques par commune.
Graphique en colonnes
Un graphiqueen colonnes, comme un graphique en barres, permet de comparer des données à l'aide de différentes longueurs de colonnes .
Nous représentons verticalement les mêmes exemples que dans la section précédente.
Comme pour le diagramme en bâtons (et le reste des diagrammes à partir de maintenant), en choisissant une ressource qui contient des données numériques et non simplement catégorielles (texte), nous pouvons utiliser une opération autre que le comptage et effectuer une opération à l'aide de la colonne numérique souhaitée.
Diagramme en entonnoir
Un graphique enentonnoir est une représentation graphique utilisée pour visualiser la manière dont les données évoluent dans un processus. Dans un graphique en entonnoir, la valeur de la variable dépendante diminue aux derniers stades du processus.
Changeons d'ensemble de données et prenons comme référence l'ensemble de données "Afflux dans les zones de loisirs de Ténériffe". Nous voulons connaître le pourcentage d'affluence en fonction du type d'unité (tourisme, tente, camping-car, etc.). Pour ce faire, nous choisirons le graphique en entonnoir et dans l'axe X nous choisirons "unité" et dans l'axe Y "Somme" de la colonne "quantité".
Legraphique montre le pourcentage en fonction du type d'unité, en tenant compte de la colonne "quantité", ordonné du plus élevé au plus bas .
Ce graphique a la possibilité d'"éliminer" certains cas spécifiques, c'est-à-dire qu'en cliquant sur les valeurs de la légende, les pourcentages sont recalculés, en éliminant du graphique les valeurs sélectionnées, qui resteront en gris dans la légende.
Diagramme circulaire
Les diagrammescirculairesprésentent les catégories sous la forme d'une proportion ou d'un pourcentage de l'ensemble.Les diagrammes circulaires permettent de montrer la composition des données dans une catégorie où chaque segment est proportionnel à la quantité qu'il représente.
Reprenons le même exemple que ci-dessus, mais en utilisant le diagramme circulaire.
Dans le graphique précédent, nous pouvons voir que les utilisateurs des aires de camping et de loisirs ont une préférence pour l'utilisation du tourisme pour accéder à ces aires. Comme dans le graphique précédent, nous pouvons "supprimer" certains cas spécifiques en cliquant sur les valeurs dans la légende.
Graphique à aires
Un graphique enairesest un graphique qui combine ungraphique en ligneset un graphique en barres pour montrer l'évolution des quantités dans le temps.
Pour ce type de graphique, il est strictement nécessaire que la colonne sélectionnée pour l'axe X soit de type date (par exemple 2023-01-02T08:36:00).
Dans l'ensemble "Réservations d'activités de nature à Ténérife", nous irons à l'option graphique de zone et nous sélectionnerons pour l'axe X "date_début" et dans l'axe Y "Somme" et la colonne "nombre_de_personnes". De cette manière, nous pourrons analyser la somme des personnes inscrites à des activités de nature collectées par date.
Dans la partie supérieure du graphique, une barre grise permet de sélectionner la période de dates à visualiser.
Histogramme
Un histogramme est une représentation graphique d'une variable numérique et continue sous forme de barres, où la surface de la barre indique le nombre total de valeurs dans l'intervalle.
Pour ce type de représentation, il est nécessaire que la ressource comporte au moins une colonne numérique.
Dans le cas présent, nous souhaitons savoir comment se répartit le nombre de places disponibles en tenant compte de l'ensemble "Hébergement touristique à Ténériffe".
Nous avons regroupé le nombre de places disponibles des hébergements de Ténérife en 5 intervalles et nous pouvons voir que 502 hébergements ont moins de 272 places et 7 ont plus de 1086.
Graphique linéaire
Les graphiqueslinéairespermettent de visualiser les changements sur un intervalle continu, tel que le temps ou la distance. La visualisation des changements à l'aide d'un graphique linéaire vous permet de voir la tendance générale d'un seul coup d'œil et de comparer plusieurs tendances simultanément.
Comme pour le graphique en aires, la colonne de l'axe X doit être de type date pour pouvoir afficher des informations. Si vous sélectionnez un ensemble de données qui ne remplit pas cette condition, ni le graphique linéaire ni le graphique en aires ne peuvent être observés.
Pour illustrer cela, nous allons reprendre l'ensemble "Réservations d'activités de nature à Ténérife", mais en visualisant d'autres informations. Pour analyser le nombre de caravanes utilisées dans les activités, nous sélectionnons "date_début" dans l'axe X et "Somme" dans la colonne "nombre_de_caravanes" de l'axe Y. Dans la zone supérieure du graphique, il y a des données sur le nombre de caravanes utilisées dans les activités.
Dans la partie supérieure du graphique, une barre grise permet de sélectionner la période de dates à afficher.
Graphique en rectangle
Le graphique en rectangle nous permet d'avoir une vue hiérarchique des données à partir de rectangles dont la taille dépend des données choisies.
Nous revenons à l'ensemble de données "Influence des zones de loisirs de Ténériffe". Cette fois-ci, nous voulons savoir quelles sont les zones de loisirs qui recevront le plus d'argent en 2023. Dans l'axe X, nous choisirons "toponymie". Dans l'axe Y, nous choisirons comme opération à appliquer la colonne "Somme" et la colonne "Quantité" .
Graphique radial
Lesgraphiques radiauxsont utilisés pour évaluer différentes options en fonction de plusieurs variables. Ils permettent d'afficher une ou plusieurs variables sur un graphique bidimensionnel ; chaque rayon correspond à une variable.
Nous accédons à l'ensemble de données "Capteurs des stations météorologiques de Tenerife". Cette fois-ci, nous voulons connaître le nombre de capteurs météorologiques de chaque type. Pour ce faire, nous pouvons choisir le type de graphique radial, dans l'axe X "nom_du_senseur" et dans l'axe Y "nombre".
La barre grise permet de supprimer des valeurs du graphique.
Graphique de dispersion
Lesdiagrammes de dispersion présentent des coordonnées numériques sur l'axe X et l'axe Y. Ils sont utilisés pour déterminer dans quelle mesure les données de la base de données peuvent être utilisées. Ils sont utilisés pour déterminer dans quelle mesure une variable est affectée par une autre.
Pour ce type de représentation, il est nécessaire que la ressource comporte au moins deux colonnes numériques.
Nous allons utiliser l'ensemble de données "Réservations d'activités de nature à Ténérife" pour voir la corrélation entre les personnes et les caravanes.
On constate qu'il n'y a pas de relation linéaire entre le nombre de personnes et le nombre de caravanes. En outre, ce graphique vous permet de visualiser des données spécifiques en faisant glisser les extrémités des barres grises en haut et à droite du graphique.
-
Le portail Open Data du Cabildo de Tenerife comprend un point SPARQL, qui permet d'effectuer des requêtes pour rechercher des ensembles contenant un mot spécifique ou des ressources spécifiques.
SPARQL(SPARQL Protocol and RDF Query Language) est un langage de requête conçu pour récupérer et manipuler des données stockées au format RDF (Resource Description Framework), un standard de représentation de l'information sur le web sémantique.
L'outil utilisé pour stocker et interroger ces données est Virtuoso, qui stocke les données sous la forme de graphes RDF formés par des triplets sujet-prédicat-objet, qui représentent les relations entre les entités et les valeurs qu'elles ont pour certaines propriétés.
Dans ce qui suit, nous expliquerons plus en détail ce qu'il est et comment il est utilisé.
ACCÈS AU POINT SPARQL
Pour accéder au point SPARQL du portail datos.tenerife.es, il faut déployer l'onglet Données, situé dans la partie supérieure gauche de la page d'accueil.
Après avoir accédé au point SPARQL, un écran apparaîtra avec différentes options qui vous permettront d'affiner votre recherche.
Avec SPARQL, il est possible de créer des requêtes complexes qui relient des éléments entre eux en tirant parti de la structure du graphe RDF. La syntaxe SPARQL est similaire à celle des requêtes SQL, puisqu'elle se compose des opérateurs SELECT, WHERE, FILTER, ORDER BY, etc.
Elle comprend une série de préfixes(PREFIX) qui servent à abréger les longs URI(Uniform Resource Identifier) et à rendre les requêtes plus lisibles et plus compactes.
Dans le champ Texte de la requête, vous pouvez saisir les requêtes souhaitées, en suivant les indications expliquées dans les points suivants, et les exécuter en cliquant sur le bouton Exécuter la requête. Une fois la requête exécutée, le résultat sera affiché dans un nouvel onglet. Pour relancer une autre requête, il faut soit utiliser le bouton retour du navigateur, soit cliquer sur les options du tableau SPARQL | HTML5. Enfin, en cliquant sur le bouton Réinitialiser, nous supprimons la requête saisie et voyons l'exemple de requête.
D'autre part, dans le Point SPARQL du portail Open Data du Cabildo, vous pouvez choisir le format dans lequel vous souhaitez obtenir les résultats de la requête en utilisant les différentes valeurs du menu déroulant "Format des résultats" : Auto, HTML, SpreadSheet, XML, JSON, Javascript, Turtle, RDF/XML, N-Triples, CSV et TSV.
En outre, au bas de la page, vous pouvez choisir entre trois options différentes :
- Vérification stricte des variables nulles: Lorsque vous exécutez une requête SPARQL, vous pouvez utiliser des variables auxquelles aucune valeur n'a été attribuée (void variables). Cette option indique si vous souhaitez que le système effectue un contrôle strict de ces variables afin de s'assurer qu'elles ne sont pas utilisées de manière incorrecte ou inappropriée dans votre requête. Si vous activez cette option, le système peut générer une erreur s'il trouve des variables vides qui ne devraient pas se trouver là, selon les règles de la requête.
- Enregistrer les informations de débogage à la fin de la sortie : Cette option suggère que, lorsqu'elle est activée, les détails de débogage seront enregistrés à la fin de la sortie de la requête. Les informations de débogage comprennent généralement des détails internes du processus d'exécution de la requête et peuvent être utiles pour identifier les problèmes ou comprendre comment la requête est traitée. Notez cependant que cette option peut ne pas être efficace pour certaines requêtes ou certains formats de sortie.
- Générer un rapport de compilation SPARQL: Au lieu d'exécuter la requête SPARQL, cette option indique qu'un rapport sera généré, montrant comment la requête serait compilée ou traitée en interne. Ce rapport peut être utile pour comprendre les performances ou l'efficacité de la requête sans avoir à l'exécuter complètement. Il peut aider à identifier les optimisations possibles avant l'exécution réelle.
UTILISER SPARQL POINT
Pour comprendre SPARQL, il est préférable d'utiliser un exemple et de l'expliquer partie par partie.
Supposons que nous disposions d'une série de graphes RDF décrivant des informations ou des métadonnées sur des ensembles de données et des ressources publiés, avec des informations sur le titre, la description, l'éditeur, le format, etc.
Dans ce cas, nous effectuerions une simple requête SPARQL pour obtenir les cent premiers ensembles de données ou ressources et leurs liens, triés par titre :
PREFIX dct : <http://purl.org/dc/terms/> Select distinct ?URL ?title where { ?URL dct:title ?title } order by desc(?title) LIMIT 100
L'explication du code est la suivante :
- PREFIX : Ce préfixe attribue l'alias"dct" à l'URI de base " http://purl.org/dc/terms/". Il est utilisé pour abréger les URI dans la requête.
- SELECT : Spécifie les variables que nous voulons récupérer dans les résultats de la requête. Dans le cas présent, nous voulons obtenir les cent premiers ensembles de données ou ressources avec leur URL. La clause distincte permet de s'assurer que seuls les résultats uniques sont affichés (pas de répétitions).
- WHERE : définit le modèle triple RDF à rechercher dans le réseau :
- ?URL dct:title ?title : Ici, nous recherchons des triples où un ensemble a un titre. La variable ?title sera utilisée pour représenter ces titres.
Nous pouvons également obtenir tout autre type d'information que nous avons dans le RDF, description, éditeur...
De cette manière, la requête SPARQL nous donnerait des résultats comme les suivants :
En nous référant au portail de données ouvertes du Cabildo de Tenerife, nous montrerons une série d'exemples de requêtes SPARQL pour récupérer des informations sur les données publiées.
Dans ce cas, Virtuoso s'appuie sur le catalogue de métadonnées du portail fourni à l'adresse https://datos.tenerife.es/es/datos/tablero?resourceId=17e64992-df93-4c8d-b9a5-5c860b1e978c pour obtenir les métadonnées des ensembles et ressources publiés afin de créer les graphes RDF.
EXEMPLES
Dans ce qui suit, nous allons expliquer, à l'aide de différents exemples, les différents types de recherche qui peuvent être effectués dans le portail.
- Obtenir le nom et le lien de tous les ensembles de données et de toutes les ressources du portail:De cette façon,vous pouvez obtenir le nom et le lien (URL) de tous les ensembles de données et de leurs ressources (distributions) publiés dans le portail .
PREFIX dct : <http://purl.org/dc/terms/> SELECT distinct ?name ?name ?URL WHERE{ ?URL dct:title ?name }
- Filtrage par chaînes de texte :
Dans ce cas, nous voulons extraire les ensembles dont le titre contient le mot "tourisme" (?title) :
PREFIX dct : <http://purl.org/dc/terms/> PREFIX dcat : <http://www.w3.org/ns/dcat#> SELECT * WHERE { ?dataset dct:title ?title . FILTER (CONTAINS(LCASE(?title), "tourism")) }
Le résultat ressemblerait à ceci :
- Recherche d'un jeu de données ou d'une ressource par son nom spécifique :
Obtenir les URL des jeux de données ou des ressources dont le titre est "Arrêts de bus".
PREFIX dct : <http://purl.org/dc/terms/> SELECT * WHERE { ?URL dct:title "Arrêts de bus" }
- Filtrer par type de ressource
Dans le portail de données ouvertes, un jeu de données peut contenir la même ressource sous plusieurs formats (distributions). Par conséquent, lors de l'interrogation du point SPARQL, nous obtiendrons des résultats répétés avec le même titre, que nous pouvons différencier en ajoutant une colonne de type de ressource.
Dans la requête suivante, nous utiliserons la clause FILTER pour rechercher les ensembles contenant le mot "centres" et nous obtiendrons leurs liens, titres et formats :
PREFIX dct : <http://purl.org/dc/terms/> SELECT WHERE { ?URL dct:title ?title. ?URL dct:format ?format . FILTER (CONTAINS(LCASE(?title), "centres")) } order by asc(?title)
Il est également possible de filtrer pour n'obtenir que les ressources de type GeoJSON.
Dans ce cas, il y a deux façons de chercher, dont le résultat serait le même :
- En utilisant FILTER :
PREFIX dct : <http://purl.org/dc/terms/> SELECT * WHERE { ?URL dct:title ?title. ?URL dct:format ?format. FILTRE (CONTAINS(LCASE(?title), "centres")) FILTRE (CONTAINS(LCASE(?format), "geojson")) }) }
- Indique la chaîne de texte dans le triplet :
PREFIX dct : <http://purl.org/dc/terms/> SELECT * WHERE { ?URL dct:title ?title. ?URL dct:format "GeoJSON" FILTER (CONTAINS(LCASE(?title), "centres")) } }
- Obtenir des informations sur l'éditeur des données :
Cette information est collectée dans le champ dcat:contactPoint . Dans la requête suivante, nous allons récupérer les ensembles dont l'éditeur ou le point de contact est le Service technique de l'agriculture et du développement rural (AgroCabildo) :
PREFIX dct : <http://purl.org/dc/terms/> PREFIX dcat : <http://www.w3.org/ns/dcat#> SELECT distinct ?URL ?title ?contact_point WHERE { ?URL dct:title ?title. ?URL dcat:contactPoint ?contact_point. FILTER (CONTAINS(LCASE(STR(?contact_point)), "agriculture technical service") }) } ORDER BY ASC(?title)
Voilà pour la formation sur le point SPARQL de datos.tenerife.es, mais nous vous encourageons à continuer à en apprendre davantage sur notre portail et toutes les possibilités qu'il offre.
-
La visualisation et l'étude des interconnexions entre les données permettent d'optimiser l'utilisation des données ouvertes et constituent un élément essentiel pour l'assimilation, la compréhension et l'analyse des données.
Dans cette optique, le portail Open Data duCabildo de Tenerife offre auxutilisateurs un large éventail d'options de visualisation et d'analyse des données, que nous expliquons ci-dessous, afin qu'ils puissent tirer le meilleur parti de leurs possibilités .
Outre la visualisation des données à travers l'ensemble de données lui-même, vous pouvez opter pour la fonction "Tableau de bord", qui vous permet de visualiser plusieurs graphiques ou ensembles de données en parallèle , en configurant des "tableaux de bord" basés sur les différentes visualisations et en vous permettant de partager, d'incorporer ou de télécharger les résultats obtenus .
COMMENT FONCTIONNE LE TABLEAU DE BORD DE DATA.TENERIFE.ES ?
Après avoir accédé à la page d'accueil du portail datos.tenerife.es, vous devrez accéder au bloc "Données", grâce à l' option située en haut à droite de lapage . Lorsque vous ouvrirez le menu "Données", vous verrez, parmi les différentes options, la fonction "Tableau de bord".
En y accédant, un bouton permet de sélectionner une ressource à afficher sur le tableau de bord, d'une manière simple et rapide . Encliquant surle bouton "Sélectionner maintenant", une nouvelle fenêtre s'affiche avec une barre de recherche dans laquelle vous pouvez saisir les mots correspondant aux données que vous souhaitez localiser .
Il est également possible de choisir l'un des ensembles de données déjà affichés sous la barre de recherche.
Il estpossible defiltrer les résultats de la recherche à l'aide des options disponibles sur le côté gauche de la fenêtre, par format, catégorie ou organisation, afin de réduire les résultats obtenus.
Après avoir tapé les mots correspondants dans la barre de recherche (ou sélectionné l'ensemble de données souhaité), vous accéderez à la liste des ressources (distributions) disponibles pour cet ensemble de données, qui peut être affichée sur le tableau de bord. Selon leformat de la ressource choisie, les données seront affichées sous forme detableau, de graphique ou de carte.
L'une des principales fonctionnalités du tableau de bord est la possibilité decombiner et de comparer différentes données. Une fois que vous avez sélectionné une première ressource à afficher, le bouton "Ajouter un tableau de bord" apparaît en bas de la page, ce qui vous permet d'afficher simultanément sur la même page différentes ressources provenant d'un ou de plusieurs ensembles de données.
Leportail Datos Abiertos du Cabildo permet de combiner jusqu'à trois tableaux de bord différents, ce qui génère un large éventail de possibilités pour la comparaison des données.
EXEMPLE PRATIQUE : DONNÉES SUR L'ACCESSIBILITÉ ET LE COMMERCE
Àtitre d'exemple pratique, nous allons vous montrer comment différentes ressources liées à l'accessibilitépeuvent être visualisées et croisées , une section dans laquelle le portail offre la visualisation de l'emplacement des places de parking réservées aux personnes à mobilité réduite, des escaliers et des ascenseurs qui existent dans les itinéraires piétonniers, parmi de nombreuses autres options .
Dans cet exemple pratique, nous proposons de sélectionner les données incluses dans les phases 1 et 2 de la carte d'accessibilité de Tenerife et de choisir, à titre d'exemple, les places de stationnement réservées aux personnes à mobilité réduite, au format GeoJSON, pour les afficher clairement sur une carte, comme indiqué ci-dessous .
Ainsi,en zoomant simplement sur la zone souhaitée, vous pourrez voir l'emplacement des différentes places de parking réservées aux personnes à mobilité réduite et connaître, entre autres, leur niveau d'accessibilité .
En basde page, sous la carte, vous pouvez obtenir une URL pour partager la carte ou le code HTML pour insérer cette carte dans votre propre site web.
COMMENT COMPARER ET COMBINER DES RESSOURCES SUR UNE CARTE ?
Comme l'une des principales fonctionnalités de la visualisation cartographique réside dans la possibilité decombiner et de comparer différentes données, vous pouvez ajouter plusieurs ressources en utilisant le bouton "Ajouter une nouvelle ressource", situé sur le côté gauche de la carte. Cette fonction est également disponible dans l'ensemble de données et est particulièrement utile pour combiner ou comparer des informations.
En reprenantl'exemple de départ, nous allons à nouveau inclure "accessibilité" dans la recherche et sélectionner dans la carte d'accessibilité phases 1 et 2 la ressource des toilettes accessibles au public au format GeoJSON ou SHP, ce qui nous permettra de visualiser sa localisation, sur la même carte, avec une couleur différente de celle des places de parking.
Le portail offre également la possibilité de choisir différents arrière-plans ou d'activer ou non les ressources qui ont été ajoutées, comme on peut le voir dans le cadre supérieur droit de la carte elle-même. De cette manière, il est possible d'identifier chacune des ressources représentées.
COMMENT AJOUTER UNE AUTRE CARTE AVEC DES GRAPHIQUES OU DES TABLEAUX ?
Afin de connaître les différentes formes de visualisation que nous pouvons ajouter au tableau, nous allons incorporer différentes ressources. À titre d'exemple, nous allonsexaminer les ensembles de données existants dans la catégorie "commerce", où l'on trouve les établissements alimentaires commerciaux de l' île, disponibles sous différents formats. Dans ce cas, nous allons ajouter l'information offerte par le portail au format XLS, qui sera affichée par défaut à l'aide de l'affichage sous forme de tableau.
Dans ce cas, le portail offre une possibilité très intéressante. Il s'agit de lareprésentation graphique. Ainsi, en choisissant cette option, vous pouvez non seulement représenter les données sous forme de graphique, mais aussi télécharger ou exporter le graphique obtenu .
Dans le casdes données sur les établissements alimentaires, après avoir sélectionné l'optionGraphique, il faut choisir le type de graphique à utiliser, puis les champs ou attributs contenant les valeurs à représenter.
Dans cet exemple, on a choisi le graphique en colonnes et la représentation à l'aide du champ "municipalité", ce qui permet de voir la répartition des commerces alimentaires par localités.
Le portail du Conseil de l'île de Tenerife intègre différents types de graphiques: barres, colonnes, entonnoirs, circulaires, histogrammes, surfaces, lignes, rectangles, radiaux et nuages de points.
De cette manière, les possibilités générées sont très larges. On peut, par exemple, opter pour un diagramme circulaire montrant la répartition par "activités".
Deplus, dans le cas des graphiques, en cliquant sur les "trois points" en haut à droite de la boîte, legraphique peut êtretéléchargé en PNG, JPG, PDF ou imprimé .
Avec ces brefs exemples, nous avons essayé d'offrir un aperçu rapide et simple des possibilités de "combiner et d'interconnecter" les ressources du portail Open Data du Cabildo de Tenerife, mais il est clair que les possibilités sont presque infinies .
Ilne reste donc plus qu'à vous encourager à accéder à datos.tenerife.es et à développer les visualisations qui vous intéressent le plus afin d'intégrer et de partager des données de manière agile et efficace .
-
Sur le portail de données ouvertes du Cabildo de Tenerife, vous pouvez trouver divers ensembles de données dans différents formats. Aujourd'hui, nous allons nous concentrer sur la manière de travailler avec la visualisation des données tabulaires du portail, ce qui nous permet de comprendre et d'analyser les ensembles de données plus efficacement, en prenant comme exemple l'ensemble de données "Stations météorologiques de Tenerife".
Sélection des colonnes
Lorsque nous accédons à la visualisation d'un ensemble de données dans un format qui peut être visualisé comme un tableau, tel qu'un fichier .csv, nous pouvons voir un tableau avec un grand nombre de champs. Cependant, il est possible que toutes les colonnes ne soient pas pertinentes pour notre tâche particulière. Le portail offre la possibilité de personnaliser l'affichage des données en sélectionnant les colonnes que nous voulons afficher. Pour ce faire, il suffit de cliquer sur les trois points situés à côté de n'importe quel nom de colonne et un menu apparaîtra, vous permettant de sélectionner les colonnes spécifiques qui vous intéressent parmi toutes celles qui existent. Cette fonction est particulièrement utile lorsque l'on cherche à se concentrer sur des informations spécifiques et que l'on souhaite éviter l'encombrement visuel qui peut résulter de la présentation de données inutiles.
Cette visualisation de tableau montrera toujours une colonne _id qui numérote consécutivement chacune des lignes de données, bien qu'il ne s'agisse pas d'une colonne de l'ensemble de données lui-même.
Tri des données
La possibilité de trier les données est une autre caractéristique de cette visualisation de portail. Il arrive souvent que nous devions trier les données en fonction d'une colonne particulière, qu'elle soit alphabétique ou numérique. La procédure est simple : il suffit de cliquer sur le nom de la colonne que vous souhaitez utiliser comme critère de tri. Automatiquement, le tableau est réorganisé pour présenter les données triées selon les valeurs de la colonne sélectionnée dans l'ordre croissant (et si vous cliquez à nouveau, dans l'ordre décroissant). Cette fonction est particulièrement utile lorsqu'il s'agit de rechercher des modèles ou des tendances dans les données qui ne peuvent être détectés qu'au moyen d'une organisation adéquate.
En outre, ce type de visualisation vous permet également de trier les colonnes en fonction de vos besoins. Il vous suffit de cliquer sur la colonne que vous souhaitez déplacer et de la faire glisser vers un nouvel emplacement. Il est ainsi plus facile de visualiser les données qui vous intéressent.
Visualisation des lignes
En bas du tableau, vous pouvez toujours voir le nombre de lignes de l'ensemble de données. Afin d'éviter que la visualisation d'un grand nombre de lignes ne rende difficile la gestion des données, il est possible de choisir au même endroit le nombre de lignes que l'on souhaite visualiser en même temps, ce qui peut faciliter l'assimilation de l'information.
Par défaut, lorsqu'il y a beaucoup de lignes de données à afficher, elles seront divisées en plusieurs pages. C'est à partir du bas du tableau que l'on peut naviguer entre elles pour accéder à toute l'information disponible, ainsi que pour identifier la page sur laquelle on se trouve.
Il faut tenir compte du fait que la visualisation des données dans le tableau est limitée à 32 000 enregistrements, de sorte que dans les ensembles de données contenant plus d'enregistrements, on peut voir un avertissement comme celui-ci :
Filtrer les données
Dans de nombreux cas, il est essentiel de filtrer les données pour se concentrer sur un sous-ensemble spécifique répondant à nos besoins. La visualisation tabulaire intègre des options de filtrage qui simplifient ce processus ; il suffit d'indiquer le nom du champ à filtrer, l'opérateur à utiliser et la valeur à comparer.
Les opérateurs qui peuvent être utilisés sont comme, égal(=), différent (!=), supérieur à(>), inférieur à(<), inférieur ou égal(<=) et supérieur ou égal(>=). Selon que la colonne contient des données numériques ou du texte, il sera judicieux d'utiliser l'un ou l'autre opérateur. Prenons deux exemples :
Nous réalisons une étude sur les incidents sur les routes de Ténériffe et nous voulons savoir combien se sont produits au cours du mois d'août. Dans le champ à filtrer, nous allons sélectionner la colonne incident_start_date, l'opérateur like et, dans la valeur à filtrer, nous écrivons 2023-08. Avec ce filtre, nous obtiendrons tous les résultats pour le mois d'août, sans avoir besoin d'une correspondance exacte.
Imaginons maintenant que nous voulions identifier les stations météorologiques situées à La Orotava. Pour ce faire, nous utiliserons les options de filtrage situées en haut du tableau. Dans ce cas, dans le champ à fil trer, nous sélectionnerons le champ "nom_de_la_commune", l'opérateur = et dans la valeur à filtrer, nous écrirons "La Orotava". Lors de l'application du filtre, le tableau est automatiquement ajusté pour n'afficher que les lignes qui répondent à ce critère, où la commune coïncide exactement avec "La Orotava".
Enfin, pour supprimer les filtres éventuellement actifs dans le tableau, il suffit de cliquer sur le bouton "Effacer" en haut à droite.
La visualisation de données tabulaires via le portail de données ouvertes du Cabildo de Tenerife est un outil puissant pour comprendre et analyser des informations pertinentes. La possibilité de personnaliser les informations en sélectionnant des colonnes spécifiques, en triant les données de manière cohérente et en les filtrant selon des critères spécifiques facilite l'utilisation des ensembles de données et leur réutilisation. En adoptant une approche centrée sur l'utilisateur et en fournissant des outils intuitifs, le portail facilite l'exploration et l'exploitation des informations, contribuant ainsi à la compréhension et à la prise de décision éclairée dans une variété de contextes.
-
Sur le portail de données ouvertes du Cabildo de Tenerife, vous trouverez une multitude de jeux de données de différents thèmes et caractéristiques. Ces données peuvent être visualisées à partir du portail lui-même ou téléchargées pour être consultées.
Les visualisations sont des représentations graphiques de données qui permettent de communiquer les informations qu'elles contiennent de manière simple et efficace. Ces visualisations aident les utilisateurs à comprendre rapidement une situation, à identifier des tendances et à prendre des décisions éclairées.
En fonction de l'ensemble de données que nous souhaitons consulter, le portail nous fournira différentes ressources dans des formats que nous pourrons télécharger et/ou visualiser à partir du portail lui-même.
Actuellement, les formats supportés par le portail et directement visualisables sont JSON, GeoJSON, CSV, Esri Shapefile (SHP), TXT, RDF, PDF, PNG, JPEG, API, KML, RSS, SVG, XML et HTML. En revanche, les formats à télécharger uniquement sont XLS/XLSX, GeoPackage(GPKG), KMZ, GPX, ODS, TSV ou ZIP.
Examinons quelques-uns des formats de données que l'on peut trouver sur le portail et la manière dont ils peuvent être affichés dans chaque cas :
ESRI Shapefile (SHP)
Le format SHP contient des données spatiales utilisées pour l'échange d'informations géographiques entre systèmes d'information géographique.
Ce type de fichier permet d'obtenir des visualisations de données sur une carte.
GeoJSON
Le format GeoJSON est un format standard ouvert conçu pour représenter des éléments géographiques simples, ainsi que leurs attributs non spatiaux.
Comme dans le cas précédent, ce format permet de visualiser les données sur une carte.
JSON
Acronyme de JavaScript Object Notation, il s'agit d'un format texte simple pour l'échange de données, totalement indépendant du langage JavaScript, mais qui utilise des conventions largement connues, étant constitué d'une liste ordonnée et de collections de paires nom/valeur.
CSV
Les fichiers CSV sont des documents dans un format ouvert simple pour représenter des données sous forme de tableau, dans lequel les colonnes sont séparées par des virgules et les lignes par des sauts de ligne.
La visualisation de ces fichiers offre de nombreuses possibilités, comme vous pouvez le voir dans l'exemple suivant, puisque nous pouvons les visualiser sous forme de tableau, de graphique ou même de carte.