Data Mining:
C. Grasland
Présentation
À propos de ce document
Prérequis
Remerciements
Licence
1
Collecter des données à l’aide d’une API
1.1
Qu’est-ce qu’une API ?
1.1.1
Définitions
1.1.2
Domaine d’application
1.1.3
Système client-serveur
1.2
Comment utiliser une API dans R ?
1.2.1
Pourquoi utiliser des API ?
1.2.2
Installer les packages jsonlite et httr
1.2.3
Structure d’une requête
1.2.4
Extraction des données
1.2.5
API et mise à jour en temps réel
1.2.6
API et requête paramétrique
1.3
API ou data packages ?
1.3.1
Installation et chargement du package
1.3.2
Chargement de la liste des tableaux
1.3.3
Examen des séries présentes dans un tableau
1.3.4
Extraction d’une série à l’aide de son identifiant
1.3.5
Extraction d’un ensemble de séries d’un même tableau
1.3.6
Recupération et nettoyage des données
1.3.7
Construction d’un graphique
1.3.8
Discussion
1.4
Exercices
1.4.1
Exercice 1 : utilisation de httr et jsonlite
1.4.2
Exercice 2 : utilisation du package ‘insee’
1.4.3
Exercice 3 : Osrm
1.4.4
Exercice 4 : Exploration de nouvelles API
2
L’API Wbstats (Banque Mondiale)
2.1
Objectifs
2.2
Le tableau “countries”
2.3
Le tableau indicators
2.3.1
Recherche du code d’un indicateur
2.3.2
Extraction des métadonnées
2.4
L’extraction des données
2.4.1
le paramètre
indicator =
2.4.2
le choix d’une période de temps
2.4.3
Le choix des unités géographiques
2.4.4
Le format de sortie du tableau
2.5
Exercices
2.5.1
Exercice 1
2.5.2
Exercice 2
2.5.3
Exercice 3
2.5.4
Exercice 4
3
L’API Natural Earth
3.1
Objectifs
3.1.1
Quel fonds de carte choisir ?
3.1.2
le fonds de carte
countries110
(175 unités)
3.1.3
le fonds de carte
sovereignty110
(171 unités)
3.1.4
Le fonds de carte
countries50
3.1.5
Autres fonds de carte :
3.2
Exemple de combinaison des API wbstats et naturalearth
3.2.1
Etape 1 : récupération des données statistiques
3.2.2
Etape 2 : Récupération du fonds de carte
3.2.3
Etape 3 : Jointure du fonds de carte et des statistiques
3.2.4
Etape 4 : Visualisation avec ggplot
3.2.5
Etape 5 :Visualisation avec plotly
4
TRAVAUX D’ETUDIANTS 2021
4.1
Léa B.
4.1.1
Choix de l’API retenue
4.1.2
Création d’un tableau
4.1.3
Création d’une figure
4.1.4
Conclusion
4.2
Mohadji M.
4.3
Olha H.
4.3.1
Choix de l’API retenue
4.3.2
Création d’un tableau
4.3.3
Création d’une figure
4.3.4
Conclusion
4.4
Myriam J.
4.4.1
Choix de l’API retenue
4.4.2
Création d’un tableau
4.4.3
Création d’une figure
4.4.4
Conclusion
4.5
Aswija R.
4.5.1
Choix de l’API retenue
4.5.2
Création d’un tableau
4.5.3
Création d’une figure
4.6
Youba B.
4.6.1
Choix de l’API retenue
4.6.2
Création d’un tableau
4.6.3
Création d’une figure
4.6.4
Conclusion
4.7
Richard P.
4.7.1
Choix de l’API retenue
4.7.2
Création d’un tableau
4.7.3
Le graphique
4.7.4
Brève analyse :
4.7.5
Conclusion
4.8
Nicolas J.
4.8.1
Choix de l’API retenue
4.8.2
Création d’un tableau
4.8.3
Le graphique :
4.8.4
Conclusion
4.9
Ouali B.
4.9.1
Choix de l’API retenue
4.9.2
Création d’un tableau
4.9.3
Création d’une figure
4.9.4
Conclusion
4.10
Robinson G.
4.10.1
Choix de l’API (Insee)
4.10.2
Création graphique à partir de l’api
4.10.3
Création tableau à partir de l’api
4.10.4
Conclusion
DATA MINING
DATA MINING
Master Meci - Parcours Data - Options PISE et CCESE
Claude Grasland, Professeur de Géographie, Université de Paris (Diderot)
2022-01-14