Logo du ministère

Formations R aux MTES & MCTRCT

Faire du logiciel R une nouvelle opportunité dans le traitement des données

Modules "socle"

Découvrir le fonctionnement de R

Aborder la dimension modulaire du logiciel

S’approprier l’interface graphique du logiciel

Être en capacité d’importer dans R un fichier CSV et de réaliser des calculs statistiques simples (somme, moyenne, table des fréquences)

Être en capacité d’explorer les données, de les comprendre, de les structurer, de les croiser et les enrichir avec des données externes pour les préparer à des traitements statistiques

La préparation des données est une étape fondamentale pour faciliter la réalisation des analyses statistiques

Modules "à la carte"

Rappels théoriques sur les méthodes usuelles de statistiques uni- et bi-variées

Mise en œuvre avec R

Interprétation

Méthodologie pour évaluer, en fonction des caractéristiques des données, la pertinence des méthodes usuelles d'analyse multidimensionnelle (ACP, AFC, ACM, CAH)

Mise en œuvre avec le package factoMiner

Sorties graphiques avec le package factoextra

Interprétation

Utiliser les outils R pour produire des graphiques avec le package ggplot2

Produire des cartes en utilisant ggplot2 et sf

Produire des tableaux interactifs

Rendre interactifs des graphiques et des cartes

Intérêt des publications reproductibles

Articulation Markdown / pandoc / R / LateX

Les éléments interactifs

Les formats de sortie : .html, .docx, .pdf

Assemblage de fichiers Markdown : le package bookdown

Objectif de la formation

Ce dispositif inédit de formation vise à faire monter en compétence les agents dans le domaine de la science de la donnée, avec le logiciel R. Avec R, le champ des possibles est tel qu’il existe autant d’usages que d’utilisateurs. Le parcours est composé de plusieurs modules à mettre en oeuvre en fonction des attentes des stagiaires. Les deux premiers sont nécessaires pour prendre en main l’outil. Les autres modules couvrent une ou plusieurs fonctionnalités de R, que les stagiaires pourront découvrir en fonction de leurs attentes. Chacun peut ainsi se former « à la carte » en fonction de ses usages professionnels et des domaines dans lesquels la montée en compétence est nécessaire.

Chaque module comprend, en introduction, l’acquisition ou le rappel des notions statistiques abordées. Suit la mise en œuvre des méthodes avec R, et enfin les clés d’interprétation des sorties statistiques et graphiques.

Qui sommes-nous ?

Au sein du pôle ministériel, un groupe de référents sur le logiciel opensource R (nom de code : G2R) a été mis en place avec des utilisateurs avancés de tout horizon (administration centrale, services déconcentrés et établissements publics) et de profils très varisés (géomaticiens, statisticiens et spécialistes de diverses thématiques mobilisant la donnée). Grâce à la richesse de leur parcours, chaque référent apporte son expertise dans la construction de ces formations.

Contributions des référents

Module 1 : « Socle : premier programme en R »

Auteurs : Thierry Zorn, Murielle Lethrosne, Vivien Roussez, Pascal Irz
Relecteurs : Alexandre Dumont, Mathieu Rajerison, Solène Colin, Maël Theulière

Module 2 : « Préparation des données »

Auteurs : Maël Theulière, Bruno Terseur
Relecteurs : Murielle Lethrosne, Vivien Roussez, Pascal Irz, Mathieu Rajerison

Module 3 : « Statistiques descriptives »

Auteurs : Solène Colin, Vivien Roussez, Pascal Irz
Relecteurs : Murielle Lethrosne

Module 4 : « Analyse des données multi-dimensionnelles »

Auteurs : Vivien Roussez, Pascal Irz

Module 5 : « Datavisualisation : produire des graphiques, des cartes et des tableaux »

Auteurs : Murielle Lethrosne, Maël Theulière

Module 6 : « Publications reproductibles avec RMarkdown »

Auteurs : Thierry Zorn, Marouane Zellou, Maël Theulière, Pascal Irz

Module 7 : « Analyse spatiale »

Auteurs : Mathieu Rajerison, Frédérique Janvier

Illustrations - crédit photographique

Pascal Boulin : Modules 1, 3, 6, 7, 8

Sébastien Colas : Modules 2, 5

Pascal Irz : Modules 4, 9