• Data Mining 2021 C. Grasland & C.Signoretto
  • Présentation
    • À propos de ce document
    • Prérequis
    • Remerciements
    • Licence
  • 1 Préparation des données (CG)
    • 1.1 Introduction
    • 1.2 Données statistiques sur les individus
      • 1.2.1 Etape 1 : téléchargement des données et stockage temporaire
      • 1.2.2 Etape 2 : Transformation des données au format R
      • 1.2.3 Etape 3 : Sélection des données utiles et sauvegarde au format .Rdata
    • 1.3 Données statistiques sur les logements ordinaires
      • 1.3.1 Etape 1 : récupération des fichiers
      • 1.3.2 Etape 2 : Transformation des données au format R
      • 1.3.3 Etape 3 : Sélection des données utiles et sauvegarde au format .Rdata
    • 1.4 Données géométriques
      • 1.4.1 Etape 1 : récupération du fonds IRIS au format shapefile
      • 1.4.2 Etape 2 : Importation et transformation au format sf
      • 1.4.3 Etape 3 : Extraction des IRIS de la zone d’étude
      • 1.4.4 Etape 4 : création d’un fonds de carte des communes
      • 1.4.5 Etape 5 : création d’un fonds de carte par département
      • 1.4.6 Etape 6: Superposition des trois fonds de carte
    • 1.5 Bilan et nettoyage
  • 2 Analyse statistique (CS)
    • 2.1 Introduction
      • 2.1.1 Les données du Recensement de la Population (RP)
      • 2.1.2 Quelles variables sont présentes dans les données ? Quelle spécificité ?
    • 2.2 Quelques statistiques sur les logements et ménages
    • 2.3 Quelles caractéristiques des individus résidant dans le Val de Marne en 2017 ?
    • 2.4 La création de fonctions
      • 2.4.1 Création d’une fonction pour retourner un tableau
      • 2.4.2 Création d’une fonction pour retourner un graphique
      • 2.4.3 Création d’une seule fonction comprenant tableau et graphe
      • 2.4.4 Et pour distinguer par groupe ? Et pour avoir des moyennes… ?
      • 2.4.5 Enregistrer/Stocker ses fonctions
  • 3 Cartes statistiques avec mapsf (CG)
    • 3.1 Introduction
      • 3.1.1 Packages utilisés
    • 3.2 Préparation des données
      • 3.2.1 Chargement des fichiers de référence
      • 3.2.2 Choix d’un indicateur
      • 3.2.3 Création du tableau de contingence
      • 3.2.4 Création d’un tableau de pourcentages en ligne
      • 3.2.5 Estimation du nombre moyen d’automobile par menages
      • 3.2.6 Analyse statistique des vraiables
      • 3.2.7 Jointure avec le fonds de carte
    • 3.3 Le package mapsf
      • 3.3.1 Création d’un template cartographique
      • 3.3.2 Carte de stock
      • 3.3.3 Carte d’intensité (choroplèthe)
      • 3.3.4 Carte de stock + intensité
    • 3.4 Création de fonctions
      • 3.4.1 fonction tab_cont_iris()
      • 3.4.2 fonction map_count_iris
      • 3.4.3 fonction map_pct_iris
      • 3.4.4 Sauvegarde des fonctions
  • 4 Cartes dynamiques (CG)
    • Introduction
    • 4.1 Une carte élémentaire
      • 4.1.1 Lancement avec leaflet()
      • 4.1.2 Remplissage avec addTiles()
      • 4.1.3 Calage avec setView()
      • 4.1.4 Personalisation avec addProviderTiles()
      • 4.1.5 Affichage d’un point avec addMarkers()
      • 4.1.6 Ajout d’un labelou d’un popup
      • 4.1.7 Amélioration du popup
    • 4.2 Une carte statistique
      • 4.2.1 Préparation des données
      • 4.2.2 Contours des iris et communes avec addPolygons()
      • 4.2.3 Cartes choroplèthes avec addPolygon() et colorBin()
      • 4.2.4 Cartes de stock avec addCircleMarkers()
      • 4.2.5 Finition avec un popup et highlightOptions()
  • 5 Modèle de données (CG)
    • Objectif
    • 5.1 tableau de contingence tab
    • 5.2 Attributs sociologiques soc
    • 5.3 Attributs géographiques geo
    • 5.4 Assemblage et sauvegarde
    • 5.5 Prolongements
  • 6 Fonctions
    • Objectif
    • 6.1 Fonctions de sélection
      • 6.1.1 Sélection géographique base_select_geo()
      • 6.1.2 Sélection sociologique base_select_soc()
    • 6.2 Fonctions d’agrégation
      • 6.2.1 Agrégation géographique base_agreg_geo())
      • 6.2.2 Agrégation sociologique base_agreg_soc()
    • 6.3 Fonctions de normalisation
      • 6.3.1 Normalisation géographique base_norm_geo()
      • 6.3.2 Normalisation sociologique base_norm_soc()
      • 6.3.3 Normalisation statistique base_norm_stat()

Projet DATA MINING 2021

Projet DATA MINING 2021

Master Meci - Parcours Data - Options PISE et CCESE

C. Grasland et C. Signoretto

2021-05-04