Chapitre 5 Mon premier jeu de données

5.1 Les types de valeurs dans R

Une valeur constitue l’unité de base des données pour R. Comme pour la plupart des logiciels, elles peuvent être de trois types :

  • Numérique : entier, double
  • Caractère : texte ou code
  • Logique : booléens

En anglais : numeric, character et logical !

Les formats de dates sont de type character.

5.2 Les vecteurs

Les valeurs peuvent être structurées au sein de vecteurs. Ces vecteurs peuvent être vus comme des colonnes de valeurs toutes du même type.

Différentes fonctions permettent de créer des vecteurs.

vect_num <- c(1, 160, 2, 9)

vect_txt <- c("Je", "programme", "en", "R")

sequence <- seq(from = 1, to = 10, by = 1)
sequence_pareille <- 1:10

repetition <- rep("bla", 3)

5.3 Les dataframes

Plusieurs vecteurs de types différents possédant un même nombre de lignes peuvent être accolés pour former une dataframe. Les dataframes sont les objets les plus courants dans le traitement de données usuel. Il s’agit de tableaux dont les lignes correspondent à des observations et les colonnes à des variables.

Ces dataframes peuvent être créées par association des vecteurs avec les fonctions :

dataframe_a <- data.frame(vect_num, vect_txt)

dataframe_b <- bind_cols("vect_num" = vect_num, "vect_txt" = vect_txt)

Une dataframe peut aussi être créée par l’import d’un tableau, voir le chapitre dédié.

Il est possible d’accéder aux éléments d’une dataframe à partir du numéro de ligne et de colonne, grâce aux crochets :

  • base[1,3] \(\rightarrow\) valeur de la première ligne et de la troisième colonne
  • base[2,] \(\rightarrow\) toutes les variables pour la 2e observation
  • base[,4] \(\rightarrow\) toutes les observations de la quatrième colonne
  • base[,’V6’] \(\rightarrow\) toutes les observations de la variable V6
  • \(\Rightarrow\) Utile pour sélectionner une partie d’une table : base[1:4, c(3, 6)]

5.4 Les fonctions et les valeurs particulières

  • NA : valeur manquante (Not Available) dans une dataframe ou en résultat d’une fonction
  • NaN : pas un nombre (Not a Number) lorsqu’une fonction tente de diviser par 0
  • -Inf, Inf : infini positif ou négatif lorsque une fonction diverge

Une valeur manquante peut perturber l’exécution d’une fonction :

V1 <- c(1, 14, NA, 32.7)
mean(V1)              # renvoie NA. Not good !
## [1] NA
mean(V1, na.rm = TRUE)   # renvoie 15.9   - OK !
## [1] 15.9

Les noms de ces valeurs particulières sont “réservés” par R, ils ne peuvent pas être utilisés comme nom de variable. C’est également le cas des booléens (TRUE, FALSE, T et F)

\(\Rightarrow\) Le module 2 “Préparation des données” aborde la gestion de ces valeurs particulières.

5.5 Importation de données

Conseil : exporter les données au format CSV ; c’est le format le plus interopérable (supporté par tous les logiciels stat). Utiliser ensuite la fonction read.csv après avoir défini le répertoire de travail (ou en donnant le chemin complet)

base0 <- read.csv(file = "extdata/Base_synth_territoires.csv", fileEncoding = 'latin1',
                  header = TRUE,
                  sep = ";",
                  dec = ",")
  • header =indique la présence des noms de variable sur la première ligne
  • sep = indique le séparateur de champ : ‘;’ ‘/t’ pour tabulation
  • dec = indique le séparateur de décimale (‘.’ par défaut)
  • colClasses =permet de préciser le type de chaque colonne de la donnée en entrée, par exemple pour une table de 3 colonnes de types texte, puis 2 fois numériques : colClasses = c("character", "numeric", "numeric"). NA pour laisser R deviner, "NULL" pour éviter d’importer la colonne.

\(\Rightarrow\) ?read.csv pour plus d’options

Autres façons d’importer les données

  • Fonction read_delim, du package readr, plus rapide
  • Fonction fread, du package data.table, beaucoup plus rapide !!
  • Pour importer les fichiers XLS, ODS, SHP ou DBF, il existe des fonctions et des packages spécifiques
  • Le passage par un fichier csv est très recommandé.

Note : le format parquet est très intéressant pour des tables de plusieurs centaines de milliers de lignes.

5.6 Gérer le type des variables

Chaque variable est du type de son contenu (numeric, character, logical). Si les valeurs prises par la variables correspondent à un nombre fini de modalités, la variable peut être du type “factor”. Ses composantes sont toujours d’un des 3 types décrits ci-dessus mais il est possible d’employer des fonctions spécifiques au traitement de modalités. À chaque type de variable correspond une utilisation. Lors de l’import des données, un type est affecté automatiquement par R. Mais le type peut être erroné. Il suffit alors de les convertir :

base <- mutate(base0, LIBGEO = as.character(LIBGEO))

ou as.factor(), as.numeric(), etc…

Pour être sûr de ne pas faire de bêtise, il vaut mieux gérer les types au moment de l’importation avec le paramètre colClasses \(\rightarrow\) exercice !

5.7 Structure des données : le dataframe

  • n lignes (observations)
  • p colonnes (variables)

Les fonctions suivantes permettent de connaître la structure de la dataframe, d’en connaître les variables, d’en observer certaines lignes ou d’en vérifier le type.

nrow(base) # nombre de lignes
## [1] 36689
ncol(base) # nombre de colonnes
## [1] 38
dim(base) # nombre de lignes et de colonnes
## [1] 36689    38
names(base) # noms des variables
##  [1] "CODGEO"        "LIBGEO"        "REG"           "DEP"          
##  [5] "ZAU"           "ZE"            "P14_POP"       "P09_POP"      
##  [9] "SUPERF"        "NAIS0914"      "DECE0914"      "P14_MEN"      
## [13] "NAISD15"       "DECESD15"      "P14_LOG"       "P14_RP"       
## [17] "P14_RSECOCC"   "P14_LOGVAC"    "P14_RP_PROP"   "NBMENFISC13"  
## [21] "PIMP13"        "MED13"         "TP6013"        "P14_EMPLT"    
## [25] "P14_EMPLT_SAL" "P09_EMPLT"     "P14_POP1564"   "P14_CHOM1564" 
## [29] "P14_ACT1564"   "ETTOT14"       "ETAZ14"        "ETBE14"       
## [33] "ETFZ14"        "ETGU14"        "ETGZ14"        "ETOQ14"       
## [37] "ETTEF114"      "ETTEFP1014"
str(base) # nom, type et extrait des variables
## 'data.frame':    36689 obs. of  38 variables:
##  $ CODGEO       : chr  "01001" "01002" "01004" "01005" ...
##  $ LIBGEO       : chr  "L'Abergement-Clémenciat" "L'Abergement-de-Varey" "Ambérieu-en-Bugey" "Ambérieux-en-Dombes" ...
##  $ REG          : int  84 84 84 84 84 84 84 84 84 84 ...
##  $ DEP          : chr  "01" "01" "01" "01" ...
##  $ ZAU          : chr  "120 - Multipolarisée des grandes aires urbaines" "112 - Couronne d'un grand pôle" "112 - Couronne d'un grand pôle" "112 - Couronne d'un grand pôle" ...
##  $ ZE           : chr  "8213 - Villefranche-sur-Saône" "8201 - Ambérieu-en-Bugey" "8201 - Ambérieu-en-Bugey" "8213 - Villefranche-sur-Saône" ...
##  $ P14_POP      : int  767 239 14022 1627 109 2570 743 338 1142 397 ...
##  $ P09_POP      : int  787 207 13350 1592 120 2328 660 336 960 352 ...
##  $ SUPERF       : num  15.95 9.15 24.6 15.92 5.88 ...
##  $ NAIS0914     : int  40 16 1051 117 8 175 59 12 56 25 ...
##  $ DECE0914     : int  25 7 551 41 3 78 20 11 32 10 ...
##  $ P14_MEN      : num  306 99.3 6161.1 621.1 52.5 ...
##  $ NAISD15      : int  13 5 222 15 2 21 11 2 18 4 ...
##  $ DECESD15     : int  5 1 121 7 2 9 3 3 5 0 ...
##  $ P14_LOG      : num  342.7 161.2 6838.4 661.8 71.5 ...
##  $ P14_RP       : num  306 99.3 6161.1 621.1 52.5 ...
##  $ P14_RSECOCC  : num  14 47.3 121.6 10.9 10.9 ...
##  $ P14_LOGVAC   : num  22.74 14.55 555.64 29.85 8.14 ...
##  $ P14_RP_PROP  : num  260 84.6 2769 473.3 37.7 ...
##  $ NBMENFISC13  : int  297 99 6034 617 47 1014 299 140 431 137 ...
##  $ PIMP13       : num  NA NA 57.4 NA NA ...
##  $ MED13        : num  22130 23213 19554 22388 21872 ...
##  $ TP6013       : num  NA NA 15.1 NA NA ...
##  $ P14_EMPLT    : num  85.16 12.81 7452.93 280.57 5.95 ...
##  $ P14_EMPLT_SAL: num  52.19 4.95 6743.37 206.38 3.96 ...
##  $ P09_EMPLT    : num  65.57 17.64 7551.68 286.61 5.29 ...
##  $ P14_POP1564  : num  463 141.6 8962.8 1043.1 71.3 ...
##  $ P14_CHOM1564 : num  33 9.84 1059.73 66.33 7.93 ...
##  $ P14_ACT1564  : num  376 121 6681.9 842.1 57.5 ...
##  $ ETTOT14      : int  47 22 1316 141 7 203 66 39 54 36 ...
##  $ ETAZ14       : int  9 1 7 14 0 21 2 5 5 6 ...
##  $ ETBE14       : int  2 3 60 7 0 18 0 2 6 4 ...
##  $ ETFZ14       : int  5 1 131 19 0 21 9 1 13 3 ...
##  $ ETGU14       : int  25 14 892 85 5 114 45 27 24 18 ...
##  $ ETGZ14       : int  6 4 283 19 1 28 16 6 9 7 ...
##  $ ETOQ14       : int  6 3 226 16 2 29 10 4 6 5 ...
##  $ ETTEF114     : int  9 2 385 27 0 38 17 6 9 7 ...
##  $ ETTEFP1014   : int  0 0 109 5 0 15 2 0 3 0 ...
head(base) # 6 premières lignes
##   CODGEO                  LIBGEO REG DEP
## 1  01001 L'Abergement-Clémenciat  84  01
## 2  01002   L'Abergement-de-Varey  84  01
## 3  01004       Ambérieu-en-Bugey  84  01
## 4  01005     Ambérieux-en-Dombes  84  01
## 5  01006                 Ambléon  84  01
## 6  01007                Ambronay  84  01
##                                               ZAU                            ZE
## 1 120 - Multipolarisée des grandes aires urbaines 8213 - Villefranche-sur-Saône
## 2                  112 - Couronne d'un grand pôle      8201 - Ambérieu-en-Bugey
## 3                  112 - Couronne d'un grand pôle      8201 - Ambérieu-en-Bugey
## 4                  112 - Couronne d'un grand pôle 8213 - Villefranche-sur-Saône
## 5              300 - Autre commune multipolarisée               8216 - Chambéry
## 6                  112 - Couronne d'un grand pôle      8201 - Ambérieu-en-Bugey
##   P14_POP P09_POP SUPERF NAIS0914 DECE0914    P14_MEN NAISD15 DECESD15
## 1     767     787  15.95       40       25  306.00000      13        5
## 2     239     207   9.15       16        7   99.33745       5        1
## 3   14022   13350  24.60     1051      551 6161.06200     222      121
## 4    1627    1592  15.92      117       41  621.05374      15        7
## 5     109     120   5.88        8        3   52.51818       2        2
## 6    2570    2328  33.55      175       78 1028.00000      21        9
##      P14_LOG     P14_RP P14_RSECOCC P14_LOGVAC P14_RP_PROP NBMENFISC13   PIMP13
## 1  342.73473  306.00000    13.99418  22.740550   260.00000         297       NA
## 2  161.16023   99.33745    47.27625  14.546538    84.58436          99       NA
## 3 6838.35437 6161.06200   121.64795 555.644416  2769.00170        6034 57.41294
## 4  661.76017  621.05374    10.85505  29.851387   473.32736         617       NA
## 5   71.51818   52.51818    10.85714   8.142857    37.65455          47       NA
## 6 1160.00000 1028.00000    56.00000  76.000000   779.00000        1014 62.35178
##      MED13   TP6013   P14_EMPLT P14_EMPLT_SAL   P09_EMPLT P14_POP1564
## 1 22130.00       NA   85.157286     52.191539   65.566193   463.00000
## 2 23213.00       NA   12.814642      4.946329   17.644456   141.62963
## 3 19554.00 15.11508 7452.926728   6743.374287 7551.682296  8962.84216
## 4 22387.62       NA  280.569953    206.382233  286.611037  1043.12909
## 5 21871.67       NA    5.945455      3.963636    5.285714    71.34545
## 6 21650.67       NA  487.730918    372.758450  491.138876  1614.00000
##   P14_CHOM1564 P14_ACT1564 ETTOT14 ETAZ14 ETBE14 ETFZ14 ETGU14 ETGZ14 ETOQ14
## 1    33.000000   376.00000      47      9      2      5     25      6      6
## 2     9.835391   120.97531      22      1      3      1     14      4      3
## 3  1059.728437  6681.86216    1316      7     60    131    892    283    226
## 4    66.326127   842.14083     141     14      7     19     85     19     16
## 5     7.927273    57.47273       7      0      0      0      5      1      2
## 6   108.000000  1267.00000     203     21     18     21    114     28     29
##   ETTEF114 ETTEFP1014
## 1        9          0
## 2        2          0
## 3      385        109
## 4       27          5
## 5        0          0
## 6       38         15
tail(base) # 6 dernières lignes
##       CODGEO            LIBGEO REG DEP
## 36684  97419       Sainte-Rose   4 974
## 36685  97420    Sainte-Suzanne   4 974
## 36686  97421           Salazie   4 974
## 36687  97422         Le Tampon   4 974
## 36688  97423 Les Trois-Bassins   4 974
## 36689  97424            Cilaos   4 974
##                                                 ZAU             ZE P14_POP
## 36684 400 - Commune isolée hors influence des pôles   0401 - L'Est    6722
## 36685                112 - Couronne d'un grand pôle 0402 - Le Nord   22406
## 36686 400 - Commune isolée hors influence des pôles   0401 - L'Est    7132
## 36687     111 - Grand pôle (plus de 10 000 emplois)  0404 - Le Sud   76796
## 36688                112 - Couronne d'un grand pôle 0403 - L'Ouest    7198
## 36689 400 - Commune isolée hors influence des pôles  0404 - Le Sud    5295
##       P09_POP SUPERF NAIS0914 DECE0914   P14_MEN NAISD15 DECESD15   P14_LOG
## 36684    6822 177.60      519      186  2322.000      94       43  2542.478
## 36685   22437  57.84     1963      508  7686.912     358      100  8328.616
## 36686    7406 103.82      661      235  2420.000     111       46  2987.000
## 36687   72658 165.43     6663     2004 29662.460    1339      420 32710.091
## 36688    7057  42.58      531      217  2484.887     104       54  2890.404
## 36689    5989  84.40      430      186  2016.000      87       38  2732.690
##          P14_RP P14_RSECOCC P14_LOGVAC P14_RP_PROP NBMENFISC13 PIMP13 MED13
## 36684  2322.000    28.58054   191.8979    1799.954          NA     NA    NA
## 36685  7686.912    50.94097   590.7629    4450.648          NA     NA    NA
## 36686  2420.000   174.00000   393.0000    1849.000          NA     NA    NA
## 36687 29662.460  1004.31703  2043.3140   15372.921          NA     NA    NA
## 36688  2484.887    67.58626   337.9313    1773.765          NA     NA    NA
## 36689  2016.000   239.56501   477.1253    1522.480          NA     NA    NA
##       TP6013 P14_EMPLT P14_EMPLT_SAL P09_EMPLT P14_POP1564 P14_CHOM1564
## 36684     NA  1272.841      920.0617  1269.573    4306.217     1250.516
## 36685     NA  4296.362     3618.1538  4185.015   14821.042     3712.486
## 36686     NA  1519.306     1090.0856  1533.305    4650.000     1369.000
## 36687     NA 16145.620    12486.5465 14807.249   50316.640    12783.137
## 36688     NA  1273.858      994.3469  1202.079    4850.570     1360.617
## 36689     NA  1194.383      993.1546  1314.121    3461.457     1122.361
##       P14_ACT1564 ETTOT14 ETAZ14 ETBE14 ETFZ14 ETGU14 ETGZ14 ETOQ14 ETTEF114
## 36684    2850.155     414    125     44     31    159     59     55       82
## 36685   10456.196    1323    136    139    190    694    249    164      267
## 36686    3108.000     490    148     29     43    214     73     56       95
## 36687   34446.789    5476    565    398    665   3025    999    823     1032
## 36688    3524.287     456     42     39     61    223     76     91       59
## 36689    2415.666     360     49     17     35    193     49     66       65
##       ETTEFP1014
## 36684          8
## 36685         66
## 36686         11
## 36687        204
## 36688         20
## 36689         26
class(base) # la classe de l'objet (du point de vue langage orienté objet)
## [1] "data.frame"
typeof(base) # le type d'objet du point de vue "interne" à R
## [1] "list"

5.8 Exercice 2 : importer des données et premier coup d’oeil

On peut importer n’importe quel format de données en R (Excel, SAT, Stata, SQL…). Beaucoup sont abordés lors du module 2 “Préparation des données”. Pour ce module, nous ne voyons que l’importation de fichier .CSV. Si vous avez une base de données en Excel ou LibreOffice Calc, sauvegardez l’onglet que vous souhaitez en faisant “enregistrer sous” \(\rightarrow\) “délimité CSV”.

Ici, nous travaillerons sur une base de données communales fournie par l’Insee, dite “comparateur de territoires”.

Nous travaillons sur des indicateurs au territoire : “extdata/Base_synth_territoires.csv”, extraits de l’outil GEOIDD du ministère et exportés en csv.

  • Utiliser la fonction read.csv() pour importer ce fichier et le stocker dans un objet df.

  • Veillez à ce que la région soit bien importée comme un facteur et non un entier.

Inspecter le dataframe avec les fonctions vues auparavant.

Résultat attendu :

## 'data.frame':    36689 obs. of  38 variables:
##  $ CODGEO       : chr  "01001" "01002" "01004" "01005" ...
##  $ LIBGEO       : chr  "L'Abergement-Clémenciat" "L'Abergement-de-Varey" "Ambérieu-en-Bugey" "Ambérieux-en-Dombes" ...
##  $ REG          : Factor w/ 17 levels "01","02","03",..: 15 15 15 15 15 15 15 15 15 15 ...
##  $ DEP          : Factor w/ 100 levels "01","02","03",..: 1 1 1 1 1 1 1 1 1 1 ...
##  $ ZAU          : Factor w/ 9 levels "111 - Grand pôle (plus de 10 000 emplois)",..: 3 2 2 2 8 2 2 5 8 2 ...
##  $ ZE           : Factor w/ 321 levels "0050 - Mont-de-Marsan",..: 260 248 248 260 263 248 248 263 266 250 ...
##  $ P14_POP      : int  767 239 14022 1627 109 2570 743 338 1142 397 ...
##  $ P09_POP      : int  787 207 13350 1592 120 2328 660 336 960 352 ...
##  $ SUPERF       : num  15.95 9.15 24.6 15.92 5.88 ...
##  $ NAIS0914     : int  40 16 1051 117 8 175 59 12 56 25 ...
##  $ DECE0914     : int  25 7 551 41 3 78 20 11 32 10 ...
##  $ P14_MEN      : num  306 99.3 6161.1 621.1 52.5 ...
##  $ NAISD15      : int  13 5 222 15 2 21 11 2 18 4 ...
##  $ DECESD15     : int  5 1 121 7 2 9 3 3 5 0 ...
##  $ P14_LOG      : num  342.7 161.2 6838.4 661.8 71.5 ...
##  $ P14_RP       : num  306 99.3 6161.1 621.1 52.5 ...
##  $ P14_RSECOCC  : num  14 47.3 121.6 10.9 10.9 ...
##  $ P14_LOGVAC   : num  22.74 14.55 555.64 29.85 8.14 ...
##  $ P14_RP_PROP  : num  260 84.6 2769 473.3 37.7 ...
##  $ NBMENFISC13  : int  297 99 6034 617 47 1014 299 140 431 137 ...
##  $ PIMP13       : num  NA NA 57.4 NA NA ...
##  $ MED13        : num  22130 23213 19554 22388 21872 ...
##  $ TP6013       : num  NA NA 15.1 NA NA ...
##  $ P14_EMPLT    : num  85.16 12.81 7452.93 280.57 5.95 ...
##  $ P14_EMPLT_SAL: num  52.19 4.95 6743.37 206.38 3.96 ...
##  $ P09_EMPLT    : num  65.57 17.64 7551.68 286.61 5.29 ...
##  $ P14_POP1564  : num  463 141.6 8962.8 1043.1 71.3 ...
##  $ P14_CHOM1564 : num  33 9.84 1059.73 66.33 7.93 ...
##  $ P14_ACT1564  : num  376 121 6681.9 842.1 57.5 ...
##  $ ETTOT14      : int  47 22 1316 141 7 203 66 39 54 36 ...
##  $ ETAZ14       : int  9 1 7 14 0 21 2 5 5 6 ...
##  $ ETBE14       : int  2 3 60 7 0 18 0 2 6 4 ...
##  $ ETFZ14       : int  5 1 131 19 0 21 9 1 13 3 ...
##  $ ETGU14       : int  25 14 892 85 5 114 45 27 24 18 ...
##  $ ETGZ14       : int  6 4 283 19 1 28 16 6 9 7 ...
##  $ ETOQ14       : int  6 3 226 16 2 29 10 4 6 5 ...
##  $ ETTEF114     : int  9 2 385 27 0 38 17 6 9 7 ...
##  $ ETTEFP1014   : int  0 0 109 5 0 15 2 0 3 0 ...
##   CODGEO                  LIBGEO REG DEP
## 1  01001 L'Abergement-Clémenciat  84  01
## 2  01002   L'Abergement-de-Varey  84  01
## 3  01004       Ambérieu-en-Bugey  84  01
## 4  01005     Ambérieux-en-Dombes  84  01
## 5  01006                 Ambléon  84  01
## 6  01007                Ambronay  84  01
##                                               ZAU                            ZE
## 1 120 - Multipolarisée des grandes aires urbaines 8213 - Villefranche-sur-Saône
## 2                  112 - Couronne d'un grand pôle      8201 - Ambérieu-en-Bugey
## 3                  112 - Couronne d'un grand pôle      8201 - Ambérieu-en-Bugey
## 4                  112 - Couronne d'un grand pôle 8213 - Villefranche-sur-Saône
## 5              300 - Autre commune multipolarisée               8216 - Chambéry
## 6                  112 - Couronne d'un grand pôle      8201 - Ambérieu-en-Bugey
##   P14_POP P09_POP SUPERF NAIS0914 DECE0914    P14_MEN NAISD15 DECESD15
## 1     767     787  15.95       40       25  306.00000      13        5
## 2     239     207   9.15       16        7   99.33745       5        1
## 3   14022   13350  24.60     1051      551 6161.06200     222      121
## 4    1627    1592  15.92      117       41  621.05374      15        7
## 5     109     120   5.88        8        3   52.51818       2        2
## 6    2570    2328  33.55      175       78 1028.00000      21        9
##      P14_LOG     P14_RP P14_RSECOCC P14_LOGVAC P14_RP_PROP NBMENFISC13   PIMP13
## 1  342.73473  306.00000    13.99418  22.740550   260.00000         297       NA
## 2  161.16023   99.33745    47.27625  14.546538    84.58436          99       NA
## 3 6838.35437 6161.06200   121.64795 555.644416  2769.00170        6034 57.41294
## 4  661.76017  621.05374    10.85505  29.851387   473.32736         617       NA
## 5   71.51818   52.51818    10.85714   8.142857    37.65455          47       NA
## 6 1160.00000 1028.00000    56.00000  76.000000   779.00000        1014 62.35178
##      MED13   TP6013   P14_EMPLT P14_EMPLT_SAL   P09_EMPLT P14_POP1564
## 1 22130.00       NA   85.157286     52.191539   65.566193   463.00000
## 2 23213.00       NA   12.814642      4.946329   17.644456   141.62963
## 3 19554.00 15.11508 7452.926728   6743.374287 7551.682296  8962.84216
## 4 22387.62       NA  280.569953    206.382233  286.611037  1043.12909
## 5 21871.67       NA    5.945455      3.963636    5.285714    71.34545
## 6 21650.67       NA  487.730918    372.758450  491.138876  1614.00000
##   P14_CHOM1564 P14_ACT1564 ETTOT14 ETAZ14 ETBE14 ETFZ14 ETGU14 ETGZ14 ETOQ14
## 1    33.000000   376.00000      47      9      2      5     25      6      6
## 2     9.835391   120.97531      22      1      3      1     14      4      3
## 3  1059.728437  6681.86216    1316      7     60    131    892    283    226
## 4    66.326127   842.14083     141     14      7     19     85     19     16
## 5     7.927273    57.47273       7      0      0      0      5      1      2
## 6   108.000000  1267.00000     203     21     18     21    114     28     29
##   ETTEF114 ETTEFP1014
## 1        9          0
## 2        2          0
## 3      385        109
## 4       27          5
## 5        0          0
## 6       38         15
##       CODGEO            LIBGEO REG DEP
## 36684  97419       Sainte-Rose  04 974
## 36685  97420    Sainte-Suzanne  04 974
## 36686  97421           Salazie  04 974
## 36687  97422         Le Tampon  04 974
## 36688  97423 Les Trois-Bassins  04 974
## 36689  97424            Cilaos  04 974
##                                                 ZAU             ZE P14_POP
## 36684 400 - Commune isolée hors influence des pôles   0401 - L'Est    6722
## 36685                112 - Couronne d'un grand pôle 0402 - Le Nord   22406
## 36686 400 - Commune isolée hors influence des pôles   0401 - L'Est    7132
## 36687     111 - Grand pôle (plus de 10 000 emplois)  0404 - Le Sud   76796
## 36688                112 - Couronne d'un grand pôle 0403 - L'Ouest    7198
## 36689 400 - Commune isolée hors influence des pôles  0404 - Le Sud    5295
##       P09_POP SUPERF NAIS0914 DECE0914   P14_MEN NAISD15 DECESD15   P14_LOG
## 36684    6822 177.60      519      186  2322.000      94       43  2542.478
## 36685   22437  57.84     1963      508  7686.912     358      100  8328.616
## 36686    7406 103.82      661      235  2420.000     111       46  2987.000
## 36687   72658 165.43     6663     2004 29662.460    1339      420 32710.091
## 36688    7057  42.58      531      217  2484.887     104       54  2890.404
## 36689    5989  84.40      430      186  2016.000      87       38  2732.690
##          P14_RP P14_RSECOCC P14_LOGVAC P14_RP_PROP NBMENFISC13 PIMP13 MED13
## 36684  2322.000    28.58054   191.8979    1799.954          NA     NA    NA
## 36685  7686.912    50.94097   590.7629    4450.648          NA     NA    NA
## 36686  2420.000   174.00000   393.0000    1849.000          NA     NA    NA
## 36687 29662.460  1004.31703  2043.3140   15372.921          NA     NA    NA
## 36688  2484.887    67.58626   337.9313    1773.765          NA     NA    NA
## 36689  2016.000   239.56501   477.1253    1522.480          NA     NA    NA
##       TP6013 P14_EMPLT P14_EMPLT_SAL P09_EMPLT P14_POP1564 P14_CHOM1564
## 36684     NA  1272.841      920.0617  1269.573    4306.217     1250.516
## 36685     NA  4296.362     3618.1538  4185.015   14821.042     3712.486
## 36686     NA  1519.306     1090.0856  1533.305    4650.000     1369.000
## 36687     NA 16145.620    12486.5465 14807.249   50316.640    12783.137
## 36688     NA  1273.858      994.3469  1202.079    4850.570     1360.617
## 36689     NA  1194.383      993.1546  1314.121    3461.457     1122.361
##       P14_ACT1564 ETTOT14 ETAZ14 ETBE14 ETFZ14 ETGU14 ETGZ14 ETOQ14 ETTEF114
## 36684    2850.155     414    125     44     31    159     59     55       82
## 36685   10456.196    1323    136    139    190    694    249    164      267
## 36686    3108.000     490    148     29     43    214     73     56       95
## 36687   34446.789    5476    565    398    665   3025    999    823     1032
## 36688    3524.287     456     42     39     61    223     76     91       59
## 36689    2415.666     360     49     17     35    193     49     66       65
##       ETTEFP1014
## 36684          8
## 36685         66
## 36686         11
## 36687        204
## 36688         20
## 36689         26
##  [1] "CODGEO"        "LIBGEO"        "REG"           "DEP"          
##  [5] "ZAU"           "ZE"            "P14_POP"       "P09_POP"      
##  [9] "SUPERF"        "NAIS0914"      "DECE0914"      "P14_MEN"      
## [13] "NAISD15"       "DECESD15"      "P14_LOG"       "P14_RP"       
## [17] "P14_RSECOCC"   "P14_LOGVAC"    "P14_RP_PROP"   "NBMENFISC13"  
## [21] "PIMP13"        "MED13"         "TP6013"        "P14_EMPLT"    
## [25] "P14_EMPLT_SAL" "P09_EMPLT"     "P14_POP1564"   "P14_CHOM1564" 
## [29] "P14_ACT1564"   "ETTOT14"       "ETAZ14"        "ETBE14"       
## [33] "ETFZ14"        "ETGU14"        "ETGZ14"        "ETOQ14"       
## [37] "ETTEF114"      "ETTEFP1014"
## [1] "data.frame"
## [1] "list"

5.9 Catalogue d’attributs de la base

  • CODGEO : [text] Code du département suivi du numéro de commune ou du numéro d’arrondissement municipal
  • LIBGEO : [text] Libellé de la commune ou de l’arrondissement municipal pour Paris
  • REG: [text] Région
  • DEP : [text] Département
  • ZAU : [text] Zonage en aire urbaine
  • ZE : [text] Zone d’emploi
  • P14_POP: [double] Population en 2014
  • P09_POP: [double] Population en 2009
  • SUPERF: [double] Superficie (en km2)
  • NAIS0914: [double] Nombre de naissances entre le 01/01/2009 et le 01/01/2014
  • DECE0914: [double] Nombre de décès entre le 01/01/2009 et le 01/01/2014
  • P14_MEN: [double] Nombre de ménages en 2014
  • NAISD15: [double] Nombre de naissances domiciliées en 2015
  • DECESD15: [double] Nombre de décès domiciliés en 2015
  • P14_LOG: [double] Nombre de logements en 2014
  • P14_RP: [double] Nombre de résidences principales en 2014
  • P14_RSECOCC: [double] Nombre de résidences secondaires et logements occasionnels en 2014
  • P14_LOGVAC: [double] Nombre de logements vacants en 2014
  • P14_RP_PROP: [double] Nombre de résidences principales occupées par propriétaires en 2014
  • NBMENFISC13: [double] Nombre de ménages fiscaux en 2013
  • PIMP13: [text] Part des ménages fiscaux imposés en 2013
  • MED13: [double] Médiane du niveau de vie en 2013
  • TP6013: [text] Taux de pauvreté en 2013
  • P14_EMPLT: [double] Nombre d’emplois au lieu de travail en 2014
  • P14_EMPLT_SAL: [double] Nombre d’emplois salariés au lieu de travail en 2014
  • P09_EMPLT: [double] Nombre d’emplois au lieu de travail en 2009
  • P14_POP1564: [double] Nombre de personnes de 15 à 64 ans en 2014
  • P14_CHOM1564: [double] Nombre de chômeurs de 15 à 64 ans en 2014
  • P14_ACT1564: [double] Nombre de personnes actives de 15 à 64 ans en 2014
  • ETTOT14: [double] Total des établissements actifs au 31 décembre 2014
  • ETAZ14: [double] Etablissements actifs de l’agriculture, sylviculture et pêche au 31/12/2014
  • ETBE14: [double] Etablissements actifs de l’industrie au 31/12/2014
  • ETFZ14: [double] Etablissements actifs de la construction au 31/12/2014
  • ETGU14: [double] Etablissements actifs du commerce, transports et services divers au 31/12/2014
  • ETGZ14: [double] Etablissements actifs du commerce et réparation automobile au 31/12/2014
  • ETOQ14: [double] Etablissements actifs de l’administration publique, enseignement, santé et action sociale au 31/12/2014
  • ETTEF114: [double] Etablissements actifs de 1 à 9 salariés au 31 décembre 2014
  • ETTEFP1014: [double] Etablissements actifs de 10 salariés ou plus au 31 décembre 2014