Découvrir le fonctionnement de R
Aborder la dimension modulaire du logiciel
S’approprier l’interface graphique du logiciel
Être en capacité d’importer dans R un fichier CSV et de réaliser des calculs statistiques simples (somme, moyenne, table des fréquences)
Être en capacité d’explorer les données, de les comprendre, de les structurer, de les croiser et les enrichir avec des données externes pour les préparer à des traitements statistiques
La préparation des données est une étape fondamentale pour faciliter la réalisation des analyses statistiques
Rappels théoriques sur les méthodes usuelles de statistiques uni- et bi-variées
Mise en œuvre avec R
Interprétation
Méthodologie pour évaluer, en fonction des caractéristiques des données, la pertinence des méthodes usuelles d'analyse multidimensionnelle (ACP, AFC, ACM, CAH)
Mise en œuvre avec le package factoMiner
Sorties graphiques avec le package factoextra
Interprétation
Utiliser les outils R pour produire des graphiques avec le package ggplot2
Produire des cartes en utilisant ggplot2 et sf
Produire des tableaux interactifs
Rendre interactifs des graphiques et des cartes
Intérêt des publications reproductibles
Articulation Markdown / pandoc / R / LateX
Les éléments interactifs
Les formats de sortie : .html, .docx, .pdf
Assemblage de fichiers Markdown : le package bookdown
Introduction aux données spatiales
Lire et écrire des données spatiales
Manipuler des donnés spatiales
Créer des cartes
Ce dispositif inédit de formation vise à faire monter en compétence les agents dans le domaine de la science de la donnée, avec le logiciel R. Avec R, le champ des possibles est tel qu’il existe autant d’usages que d’utilisateurs. Le parcours est composé de plusieurs modules à mettre en oeuvre en fonction des attentes des stagiaires. Les deux premiers sont nécessaires pour prendre en main l’outil. Les autres modules couvrent une ou plusieurs fonctionnalités de R, que les stagiaires pourront découvrir en fonction de leurs attentes. Chacun peut ainsi se former « à la carte » en fonction de ses usages professionnels et des domaines dans lesquels la montée en compétence est nécessaire.
Chaque module comprend, en introduction, l’acquisition ou le rappel des notions statistiques abordées. Suit la mise en œuvre des méthodes avec R, et enfin les clés d’interprétation des sorties statistiques et graphiques.Au sein du pôle ministériel, un groupe de référents sur le logiciel opensource R (nom de code : G2R) a été mis en place avec des utilisateurs avancés de tout horizon (administration centrale, services déconcentrés et établissements publics) et de profils très varisés (géomaticiens, statisticiens et spécialistes de diverses thématiques mobilisant la donnée). Grâce à la richesse de leur parcours, chaque référent apporte son expertise dans la construction de ces formations.
Auteurs : Thierry Zorn, Murielle Lethrosne, Vivien Roussez, Pascal Irz, Nicolas Torterotot Relecteurs : Alexandre Dumont, Mathieu Rajerison, Solène Colin, Maël Theulière, Juliette Engelaere-Lefebvre
Auteurs : Maël Theulière, Bruno Terseur Relecteurs : Murielle Lethrosne, Vivien Roussez, Pascal Irz, Mathieu Rajerison
Auteurs : Solène Colin, Vivien Roussez, Pascal Irz Relecteurs : Murielle Lethrosne
Auteurs : Vivien Roussez, Pascal Irz
Auteurs : Murielle Lethrosne, Maël Theulière
Auteurs : Marouane Zellou, Maël Theulière
Auteurs : Maël Theulière, Juliette Engelaere-Lefebvre, Jean-Daniel Lomenede
Auteurs : Caroline Coudrin, Nicolas Torterotot
Pascal Boulin : Modules 1, 3, 6, 7, 8
Sébastien Colas : Modules 2, 5
Pascal Irz : Modules 4, 9