Analyse des mouvements de grève à la SNCF depuis 1947

Standard

Plusieurs syndicats de la SNCF ont déposé un préavis de grève reconductible, à partir du 5 décembre 2019. À cette occasion, je me suis intéressé à l’évolution quantitative des mouvements sociaux à la SNCF depuis 1947. Les données des mouvements sociaux des 10 premières années de la SNCF (entre 1937 et 1947) ne sont pas disponibles actuellement. Cette analyse est basée sur le jeu de données « Journées perdues lors de mouvements sociaux chaque année depuis 1947 » mis à disposition par la SNCF en open data.

Une nette diminution des effectifs

Évolution des effectifs en équivalent temps plein à la SNCF entre 1947 et 2018

Le résultat est spectaculaire : l’effectif de la SNCF suit une nette tendance à la baisse depuis 1947 avec une diminution drastique des effectifs en équivalent temps plein. On dénombrait 471 325 ETP en 1948 contre 142 236 ETP en 2018 ; une division par 3,3 des effectifs en 70 ans.

Pour prendre en compte ce facteur dans les analyses, on s’intéressera donc au nombre de jours de grève par agent, résultat du rapport entre le nombre de jours de grève comptabilisé sur une période et l’effectif à disposition sur cette même période. Il permettra d’apprécier la manière dont les mouvements ont été suivis.

Chiffre clés sur les grèves à la SNCF

Entre 1947 et 2018, on dénombre :

  • un total de 29,7 millions de journées de travail en grève ;
  • une moyenne de 1,5 jours de grève par ETP et par an ;
  • 39 années (54 % de la période) où le nombre de jours de grève par agent est inférieur à 1 ;
  • 4 années de grèves marquées, où le nombre de jours de grève par agent était supérieur à 5 (les années 1947, 1953, 1968 et 1995).

Principaux mouvements sociaux

Les 5 années où les mouvements sociaux ont été les plus suivis sont les suivantes :

  • 1968 (grève générale française), avec 14,63 jours de grève par agent
  • 1953 (statut et retraite des fonctionnaires), avec 7,52 jours de grève par agent
  • 1947 (hausse des salaires et plan Marshall), avec 6,49 jours de grève par agent
  • 1995 (retraites et révision du statut), avec 5,82 jours de grève par agent
  • 2018 (disparition du statut de cheminot), avec 4,69 jours de grève par agent

En regardant les principaux mouvements sociaux, on constate que sur les 10 années les plus suivies, 5 se sont produites depuis 1995.

10 principales années de mouvements sociaux à la SNCF entre 1947 et 2018

Tendance

Fait-on plus grève qu’autrefois ? J’ai tenté de répondre à cette question en m’intéressant au nombre de jours moyen de grève par agent par période de 5 ans. On obtient le graphique suivant.

Nombre de jours moyen de grève par agent par période de 5 ans entre 1947 et 2018

En se rappelant que la moyenne annuelle du nombre de jours de grève par agent est de 1,5, on constate que depuis 2005 on a tendance à avoir plus de mouvements sociaux suivis et plus réguliers.

Taux de réponse à la Commission d’accès aux documents administratifs

Standard

En France, toute personne a le droit d’obtenir communication de nombreux documents administratifs. Les documents administratifs ont plusieurs formes (dossiers, rapports, études, statistiques, codes sources, bases de données etc.) et plusieurs supports (écrit, enregistrement, fichier informatique etc.). On parle de documents administratifs lorsqu’un document est produit ou reçu par une administration (service de l’État, collectivité territoriale, établissement public etc.) ou par un organisme privé dans le cadre d’une mission de service public (la SNCF par exemple). La base légale française est la loi du 17 juillet 1978, récemment modifiée par la Loi pour une République numérique. Pour connaître le cadre juridique précis actuel, je vous invite à consulter cette présentation.

Processus de demande d’un document administratif

Le processus de demande d’un document administratif est détaillé dans une fiche sur service-public.fr ainsi que sur le site web de la Cada. Si je cherche à le résumer :

  • Vous contactez la structure qui détient le document administratif en demandant la communication ou la publication de documents administratifs ;
  • La structure peut accepter ou refuser votre demande ou refuser tacitement votre demande sans réponse dans un délai d’un mois ;
  • Après le refus explicite ou tacite de la structure, vous pouvez saisir la Commission d’accès aux documents administratifs lui demandant de se prononcer sur votre demande initiale.

La Cada examine alors votre demande initiale et tente de rentrer en contact avec la structure visée par votre demande. À l’issu de ce travail, la commission rend un avis favorable ou défavorable à votre demande, en motivant son avis. Les avis de la Cada sont intégralement disponibles en ligne après quelques mois, une fois anonymisés, au sein d’un jeu de données et sur un site web.

Calculer le taux de réponse à la commission

Échanges menés par la Cada

Lors de l’instruction de votre demande, la Commission cherche à entrer en contact avec la structure destinataire de votre demande initiale. Cet échange permet à la commission de rendre un avis éclairé et d’appréhender la nature des documents administratifs visés par la demande. Malheureusement, tout le monde ne répond pas à la commission. Quand c’est le cas, la commission rend tout de même avis, tout en faisant apparaître dans l’avis le fait qu’elle n’a pas réussi à obtenir une réponse de la structure. Vous pouvez consulter un avis où cette situation s’est produite.

On retrouve alors une formule de ce style dans l’avis :

En l’espèce et en l’absence de réponse du président-directeur général de la RATP à la date de sa séance, elle estime que le document sollicité se rapporte aux missions de service public assurées par la RATP et que, par suite, celui-ci est communicable à toute personne qui en fait la demande, en application des dispositions précédemment mentionnées. Elle émet donc un avis favorable.

Les avis de la Cada étant disponibles sous une Licence Ouverte, il est possible de calculer un taux de réponse à la commission.

Détails du calcul de taux de réponse

On ne conserve que les avis depuis l’année 2016, pour les structures qui ont fait l’objet d’au moins 10 avis rendus par la Cada. On détermine qu’une structure n’a pas répondu à la Cada quand on retrouve dans l’avis de la Cada la mention des mots En l’absence de réponse. À la date de l’analyse, les avis les plus récents étaient datés de mars 2019. L’analyse porte donc sur la période janvier 2016 – mars 2019. Avec ces contraintes, on arrive à un total de 5 602 avis.

Une partie des résultats obtenus sont présentés dans la figure suivante.

Extrait des taux de réponse à la Cada pour les principales structures visées par une demande sur la période janvier 2016 – mars 2019.

En complément des principaux résultats, vous pourrez retrouver :

PS : Il ne faut pas confondre taux de réponse à la Cada et taux de réponse aux demandes de documents administratifs. Les demandes s’effectuant directement auprès des structures qui détiennent des documents n’étant pas centralisées ou mises à disposition librement, il est en l’espèce impossible d’appréhender ce taux de réponse.

Conférence : J’ai demandé mes données personnelles grâce au RGPD

Standard

Le 21 novembre 2019, j’ai eu le plaisir d’intervenir à la conférence Codeurs en Seine à Rouen. 1 200 participants, qui ne se déroule pas à Paris et une inscription gratuite : voilà une conférence peu commune. Mon intervention retenue portait sur l’exercice du droit à la portabilité des données introduit par le RGPD, qui permet d’obtenir communication de ses données personnelles et de les analyser.

La description de mon intervention est la suivante :

Le RGPD est entré en application en France fin mai 2018. Depuis, j’ai exercé mon droit d’accès à mes données auprès de plusieurs entreprises et j’ai appris sur moi-même.

Je propose de présenter les démarches à suivre pour obtenir ses données, les analyses de mes données obtenues auprès de Trainline (billets de train), Monoprix (supermarché) et mes recherches Google.

Enfin, je termine avec une ouverture sur le futur de l’accès et la portabilité des données.

J’avais eu l’opportunité dans le passé de parler de cette initiative auprès Trainline sur mon blog et des autres sur Twitter. Mais rien ne remplace l’opportunité de présenter ceci de vive voix devant quelques centaines de personnes.

Vous pouvez retrouver mon intervention au format PDF ou directement sur Google Slides.

Publication de la régularité quotidienne de la SNCF

Standard

La SNCF est l’entreprise ferroviaire publique française. La filiale « voyageurs » de la SNCF, SNCF Mobilités, transporte plus de 4 millions de personnes tous les jours dans pas moins de 15 000 trains. Une écrasante majorité des voyageurs emprunte des « trains du quotidien ». Ainsi, sur les 4 millions de voyageurs transportés, 2,7 millions de voyageurs empruntent les Transilien et 1 million de voyageurs empruntent les TER (trains express régionaux).

Dans cet article, j’aborde la publication des indicateurs de régularité de la SNCF. La régularité permet d’apprécier le respect de la ponctualité du plan de transport prévu. En termes moins savants : « Est-ce que mon train est arrivé à l’heure ? »

Cet article de blog traite uniquement de la publication des indicateurs de la régularité et non des mesures prises par la SNCF pour améliorer la régularité. La SNCF est engagée au quotidien pour améliorer la régularité des trains circulant ; en témoigne les mesures mises en oeuvre pour améliorer la ponctualité des trains au départ ou l’identification de trains présentant une irrégularité chronique (page 44 du rapport de la Cour des comptes « Les transports express régionaux à l’heure de l’ouverture à la concurrence » du 23 octobre 2019).

Vous avez un train à prendre ? Voici le jeu de données de la régularité de la SNCF à la journée.

Une diffusion de la régularité incomplète

J’ai déjà eu l’occasion d’aborder le sujet de la démarche open data de la SNCF précédemment. Un de mes grands regrets concerne la faible diffusion des éléments de la régularité. Actuellement, la régularité est publiée selon un triplet mois, région, axe au sein de 4 jeux de données à l’échelle nationale. On peut ainsi avoir l’information qu’en septembre 2019, la ligne RER A affiche une ponctualité de 87,6 %. C’est une première information, toutefois, ceci ne correspond pas entièrement à l’attente des usagers. En effet, les usagers des « trains du quotidien » sont intéressés par la ponctualité du lundi au vendredi et durant les heures de pointe, pour ceux qui ont des horaires de bureau.

Capture d’écran du site data.sncf.com. Régularité mensuelle de la ligne RER B.

En mettant à disposition des indicateurs mensuels et par ligne, la régularité en jours ouvrés et en pointes est noyée au milieu de la régularité en heures creuses et durant les week-ends (malgré ce défaut, le calcul de la régularité des Transilien pondère sur le nombre de voyageurs, et permet donc une bonne représentativité de la moyenne faite à l’échelle du mois). Au-delà de ce seul exemple, chaque usager devrait avoir les moyens de calculer ou d’accéder à la régularité des transports qu’il utilise. Au minimum, avoir à disposition un indicateur représentatif de sa réalité d’usage des transports ferroviaires.

D’autres initiatives diffusant des informations de régularité

Ma ponctualité Transilien

La branche Transilien de la SNCF propose sur le site maponctualite.transilien.com une information de la régularité plus fine. En effet, on peut obtenir une donnée de régularité après avoir choisi :

  • une ligne du réseau Transilien ;
  • une gare de départ ;
  • une gare d’arrivée ;
  • une plage horaire (parmi 4 choix) ;
  • une date.

On obtient ensuite un indicateur unique pour la situation choisie. Il n’est pas possible d’obtenir des données sur plusieurs jours (la régularité entre 2 gares, sur la pointe du matin, en semaine, sur un trimestre par exemple). L’export (ou la publication) des données sous-jacentes n’est pas possible, en violation des obligations introduites par la Loi pour une République numérique.

Capture d’écran du site maponctualite.transilien.com. Ce site permet d’obtenir la ponctualité entre 2 gares d’une ligne, sur une tranche horaire prédéfinie et pour une journée donnée. Les données sous-jacentes ne sont pas proposées au téléchargement.

L’Autorité de la qualité de service dans les transports

En rédigeant cet article, j’ai découvert un service du Ministère des Transports : l’autorité de la qualité de service dans les transports (AQST). Ce service a la mission suivante :

contribuer à l’amélioration de la qualité de service dans les transports de voyageurs terrestres (ferroviaires et routiers, urbains et interurbains), maritimes et aériens, en accordant une attention particulière à la régularité, à la ponctualité et à la qualité de l’information diffusée aux voyageurs.

J’espérais trouver des informations inédites de régularité. En parcourant le site web, j’ai pu constater que les données de régularité diffusées pour le ferroviaire étaient identiques aux données open data de la SNCF pour les différentes familles de transport. On retrouve donc au mieux des indicateurs mensuels et par ligne.

Capture d’écran du site web de l’AQST. On y trouve la régularité des TER en région Normandie sur les 12 derniers mois. Ces données sont identiques aux indicateurs mensuels publiés par la SNCF en open data.

Plus de données ?

Je m’étonne de ne pas voir plus de données publiées par l’AQST ou l’autorité de régulation des transports. En tant qu’autorité de régulation et avec l’aide de la Loi pour une République numérique, ces informations peuvent être obtenues des opérateurs de transport et publiées en open data, sans restrictions d’utilisation. Les choses devraient changer dans les années à venir : le décret n°2019-851 du 20 août 2019 relatif aux informations portant sur les services publics de transport ferroviaire de voyageurs liste les éléments que les autorités organisatrices peuvent obtenir des entreprises fournissant des services de transport au public.

La régularité des trains de la veille : mes trains d’hier

La SNCF propose depuis quelques mois un rapport quotidien sur la régularité des différentes lignes et axes sur le jour précédent. Cette application se nomme Mes trains d’hier. En complément de la régularité, les faits majeurs à l’origine d’une régularité peu satisfaisante sont indiqués.

Capture d’écran de l’application Mes trains d’hier. On y retrouve la ponctualité des trains de la veille pour différents modes de transports et par ligne.

Nouveauté notable : les indicateurs de régularité concernent une ligne et une seule journée. En revanche, seules sont affichées les données de la veille. Impossible de choisir une date précédente ou d’exporter des données.

Heureux de voir de telles informations disponibles en ligne, j’ai décidé d’écrire du code sous licence libre visant à récupérer automatiquement ces informations, les structurer et les archiver. Je publie ensuite ces données brutes dans un jeu de données sous licence ouverte.

Ce site web est inspecté automatiquement toutes les heures, car bien que le nom « Mes trains d’hier » suggère que les données affichées soient toujours celles de la veille, en pratique ceci n’est pas respecté. Il est possible que suite à un retard de traitement deux journées soient affichées sur une période de 24 heures. Un traitement toutes les heures permet de ne pas rater des informations potentiellement publiées pendant un court laps de temps.

Je serais heureux que des élus, associations d’usagers, journalistes et citoyens trouvent une utilité à ce jeu de données.

Le ferroviaire, atout majeur de la mobilité en France

Personne n’aime voyager à bord d’un train en retard. Encore moins voir son train supprimé. Le réseau français et la qualité de service globale du pays sont cependant un des meilleurs en Europe et dans le monde, comme le présente ce rapport du BCG. Le secteur ferroviaire français doit être préservé, amélioré et financé dans de justes proportions. Le train est un moyen fiable, efficace pour transporter des centaines de personnes, rapide et écologique. Préservons-le.

PS : cet article a été finalisé à bord d’un TER en région Normandie. Ce train était à l’heure.

Data-driven policies: sea-rescue operations in France

Standard

In October 2019, I had the chance to give a class at the the Paris Institute of Political Studies, Sciences Po. I talked about what I worked on in 2018: sea-rescue operations carried out by France. Back then, I worked at the maritime affairs, part of the Ministry of Ecology. This project was named PrédiSauvetage.

As a trained software engineer myself, it’s always a chance to get to teach about other ways to work on public policies.

You can check out my presentation at the end of the post or directly on Google Slides.

Speed up checkout on CircleCI with caching

Standard

If you’ve got a long Git history or large files changing frequently in your repository, checking out the repository can take a good amount of time in your CircleCI jobs. It’s annoying when most of the time is spent on non useful tasks like checking out your code or downloading dependencies. In these situations, caching is what you need. The idea is that checking out your code takes time if you start from a blank state. If you already have a recent previous commit locally, checking out new changes will be far faster.

You can cache your Git folder with the following configuration.

    steps:
      - restore_cache:
          keys:
            - source-v1-{{ .Branch }}-{{ .Revision }}
            - source-v1-{{ .Branch }}-
            - source-v1-

      - checkout

      - save_cache:
          key: source-v1-{{ .Branch }}-{{ .Revision }}
          paths:
            - ".git"

When CircleCI encounters a list of keys, the cache will be restored from the first match. In this example, restore_cache looks for a cache hit from the current Git revision, then for a hit from the current branch, and finally for any cache hit, regardless of branch or revision. If there are multiple matches, the most recently generated cache will be used.

I was able to take down a 30-35s checkout task down to the expected 2-3s. A substantial amount of time saved for your continuous integration!

Submit a form with Puppeteer

Standard

Puppeteer is a Node library which provides a high-level API to control Chrome or Chromium. Puppeteer runs headless by default, but can be configured to run a full browser.

A thing you will need to do when using Puppeteer is filling out and submit forms. It’s straightforward to fill fields but sometimes it’s difficult to submit the form. The submit input doesn’t have an id, it’s enclosed in multiple tags, there are multiple buttons (like a search bar in the header). An easy thing to do is to reproduce what you would do naturally: press the Enter button to submit the form.

Here is the code to do this:

const puppeteer = require('puppeteer');

(async () => {
  const browser = await puppeteer.launch();
  const page = await browser.newPage();

  await page.goto('https://www.google.com/admin');

  await page.type('#username', '[email protected]');
  await page.type('#password', 'password');
  await page.keyboard.press('Enter');

  await page.waitForNavigation();
  console.log('New Page URL:', page.url());
  await browser.close();
})();

L’Arcep, régulateur des télécoms, impose la publication des antennes relais en maintenance

Standard

L’Autorité de régulation des communications électroniques et des postes (Arcep) est une autorité administrative indépendante chargée de réguler les communications électroniques et les postes en France. Depuis juillet 2018, les 4 opérateurs mobiles français sont tenus de publier sur leur site une liste d’antennes relais en maintenance (comprendre qui ne fonctionne pas actuellement).

Cette obligation de publication est introduite par autant de décisions qu’il y a d’opérateurs. Pour Free, c’est la décision 2018-0681 qui stipule la chose dans une section intitulée Obligation de transparence.

Le titulaire est tenu, au plus tard le 1er juillet 2018, de publier et de maintenir à jour sur son site Internet, dans un format électronique ouvert et aisément réutilisable, la liste des stations de base qui ne fournissent pas de service de radiotéléphonie mobile ou de service d’accès mobile à très haut débit pour cause de maintenance ou de panne.

Free Mobile publie cette information sur une page dédiée, permettant la recherche d’une éventuelle panne maintenance par code postal et par le biais d’un fichier CSV (un format ouvert et aisément réutilisable). Chez SFR, il y a une jolie page nommée arceptest.html. Bouygues a choisi de publier ces informations sur un sous-domaine antennesindisponibles (mais au format XLS). Orange publie pour sa part un fichier CSV.

Une solution originale de transparence et de régulation

J’ai plusieurs remarques concernant cette mesure de régulation de l’Arcep. Tout d’abord, je trouve très intéressant et je salue le fait que l’obligation réside dans la publication par l’opérateur lui-même plutôt que par la transmission de l’information au régulateur. Premièrement, on rend ainsi l’information disponible pour d’autres personnes et on responsabilise l’opérateur. Deuxièmement, on évite le cas où le régulateur est en possession de l’information mais ne la diffuse pas.

Des améliorations possibles

Je regrette que la formulation de l’obligation de publication soit trop floue. La formulation dans un format électronique ouvert et aisément réutilisable reprend une formulation classique de la Loi pour une République numérique. L’obligation ne stipule pas un modèle de données, ainsi les informations publiées et les noms de colonnes varient selon les opérateurs. Enfin, le point le plus embêtant est que l’obligation porte sur une publication des indisponibilités à l’instant T sur les antennes relais. Il aurait été intéressant d’avoir un historique pour effectuer des analyses sur la répétition de pannes sur des zones géographiques, des délais de réparation, des pannes à répétition etc. Un tel historique peut être construit, mais c’est à la charge de qui le désire. J’ai fait cet exercice pour Free Mobile en automatisant la récupération des fichiers CSV toutes les heures et je rends disponible les données récoltées.

La démarche open data de la SNCF

Standard

La Société Nationale des Chemins de Fer français (SNCF) est l’entreprise ferroviaire publique française. Le coeur de métier de la SNCF est d’exploiter un réseau ferroviaire et de transporter des passagers. Les chiffres clés sont impressionnants : 15 000 trains commerciaux arpentent le réseau ferré tous les jours, permettant à 4 millions de clients de se déplacer. Souvent décriée pour ses problématiques opérationnelles et sa difficulté à transmettre des informations aux voyageurs, la SNCF s’est notablement améliorée depuis plusieurs années. Cet effort de diffusion, de transparence et d’amélioration continue est visible sur le portail open data de la SNCF data.sncf.com.

Sur ce portail open data, on retrouve des statistiques de régularité au mois et par type de transport (TGV, Intercités, Transilien, TER). Ces données ont un intérêt pour évaluer l’évolution de la qualité de service au fil des années. Je regrette toutefois l’agrégation assez large : au mois / par région / par axe. Les voyageurs sont plus soucieux des régularités aux heures de pointe et durant les jours ouvrés. Espérons que cela évolue vers un découpage par tranches horaires et par jour. Ces jeux de données sont des incontournables étant donné l’activité commerciale de transports de voyageurs de la SNCF.

Toujours sur la régularité mais dans une temporalité différente, la SNCF propose depuis quelques mois un rapport quotidien sur la régularité des différentes lignes et axes sur la journée d’hier. Cette application est nommée Mes trains d’hier. Les faits majeurs sont relatés, expliquant une mauvaise performance. Je regrette la non disponibilité de ces données en open data et l’impossibilité de choisir une date antérieure.

Capture d’écran de l’application Mes trains d’hier

Une thématique souvent absente sur les portails open data mais présente côté SNCF est celle des jeux de données se rapportant aux ressources humaines, aux salariés, mouvements sociaux, congés, accidents du travail. On retrouve ainsi des jeux de données décrivant les nationalités, les genres, les rémunérations, les journées perdues lors de mouvements sociaux. Ce sont des informations que l’on retrouve dans les rapports annuels des grands groupes mais je salue le fait d’en faire des jeux de données à part entière.

Sur la transparence pure, je relève 2 jeux de données très intéressants : les courriers institutionnels entre son équipe dirigeante et les représentants élus de l’État et des collectivités locales et les indicateurs de Responsabilité Sociétale de l’Entreprise pour le groupe SNCF Réseau depuis 2016.

Notons que ces jeux de données ont été diffusés dans un premier temps sous une licence de réutilisation non homologuée. La situation a été rectifiée en juillet 2019, les données sont dorénavant diffusées sous une licence ODbL.

Enfin, je termine cet article avec les jeux de données qui m’amusent le plus :

Cet article est un rapide tour d’horizon des jeux de données disponibles en ligne. En août 2019, plus de 215 jeux de données sont publiés sur ce portail. Les thématiques majeures non abordées dans cet article sont l’infrastructure ferroviaire, les services aux voyageurs, la billetique et les gares.

Rejoindre le secteur public en tant que professionnel du numérique

Standard

Récemment dans le cadre de mon travail j’ai eu la chance d’organiser un sondage à destination des professionnels du numérique qui sont intéressés pour rejoindre le service public à un moment dans le carrière. La fonction publique est souvent décriée par ces professionnels : méthodes waterfall, processus longs, métiers non compris, salaires peu attractifs, peu de télétravail. C’est le prix à payer pour un métier servant l’intérêt général et qui donne du sens à son travail. Ben Balter a écrit à ce sujet un article de blog très pertinent : 19 reasons why technologists don’t want to work at your government agency.

Des réflexions sont menées en interne dans l’administration pour attirer les talents nécessaires. Les anciens professionnels venant du privé rappellent régulièrement les points sur lesquels il faut s’attarder. Ce sondage était l’occasion de montrer que ce sujet d’actualité est traité et que l’administration est à l’écoute des premiers concernés : les professionnels qui veulent rejoindre le service public un jour ou l’autre. Vous pouvez retrouver ce sondage, les principaux résultats de celui-ci et les données brutes des soumissions reçues dans un article de blog sur Etalab.