Introduction

Crédit photographique Pascal Boulin

0.1 Le parcours de formation

Ce dispositif de formation vise à faire monter en compétence les agents du MTECT (Ministère de la Transition écologique et de la Cohésion des territoires) et du MTE (Ministère de la Transition énergétique) dans le domaine de la science de la donnée avec le logiciel R. Il est conçu pour être déployé à l’échelle nationale par le réseau des CVRH (Centre de Valorisation des Ressources Humaines).

Le parcours proposé est structuré en modules de 2 jours chacun. Avoir suivi les deux premiers (ou disposer d’un niveau équivalent) est un pré-requis pour suivre les suivants qui sont proposés “à la carte” :

  • Module 1 : Socle - Premier programme en R
  • Module 2 : Socle - Préparation des données
  • Module 3 : Statistiques descriptives
  • Module 4 : Analyse des données multi-dimensionnelles
  • Module 5 : Datavisualisation : Produire des graphiques, des cartes et des tableaux
  • Module 6 : Publications reproductibles avec RMarkdown (à venir)
  • Module 7 : Analyse spatiale
  • Module 8 : Big data et optimisation du code (à venir)
  • Module 9 : Applications interactives avec RShiny (à venir)

La mise à disposition des supports de formation se fait par la page d’accueil du parcours de formation. Ces supports sont en licence ouverte.

Si vous souhaitez accéder aux sources ou aux données mobilisées pendant les formations, vous pouvez directement les télécharger depuis le Github du pôle ministériel.

Un package d’exercices, {savoirfR} rassemble toutes les données et les consignes d’exercices de ce parcours de formation (Modules 1, 2, 5 et 7 seulement pour l’instant).

Pour vous tenir au courant de l’offre de formation proposée par le réseau des CVRH, consultez la plateforme OUPS (un accès intranet MTECT-MTE est nécessaire). Vous pouvez vous y abonner pour recevoir les annonces de formation qui vous intéressent.

Pour échanger de l’information, discuter autour de R ou encore faire part de difficultés et trouver ensemble les solutions, il existe deux canaux d’entraide :

0.2 Le groupe de référents R du pôle ministériel

Objectifs de ce module

A l’issue de la formation sur ce module, les stagiaires devraient être en capacité de produire une publication reproductible et paramétrable relativement simple de A à Z. Il sera fait appel aux compétences acquises lors des précédents modules, en particulier des modules “socle”. Le langage utilisé est [R Markdown], qui permet d’avoir dans un seul fichier du texte mis en forme, du code (R, mais aussi Python, Julia, C++, SQL et même SAS !) et les sorties du code.

Les points abordés comprendront :

  • La syntaxe R Markdown
  • L’insertion de code R
  • Les outils de mise en forme
  • Les formats de sortie .html, .pdf
  • L’assemblage de plusieurs documents R Markdown (package bookdown)
  • La publication des documents produits

0.3 Exemples de productions avec R Markdown

R markdown permet de produire des sorties dans un grand nombre de formats. Quelques exemples :

R for data science
R for data science
  • divers autres formats comme des blogs, des sites web, du epub, des diaporamas, etc.