L’éthique dans la relation digitale parents-école (2 / 3)

Anne-Sophie
7 min readJul 24, 2021

Sécurité et confidentialité des données du dossier élève : science sans conscience…

Des milliards de données de profilage de l’élève

A ce jour, la quasi totalité des lycées, 90% des collèges et 17 000 écoles publiques en France sont équipés d’un ENT (Espace Numérique de Travail) (1). Sur son site Web, Index Education, annonce qu’avec plus de 3,41 milliards de connexions authentifiées, son logiciel de vie scolaire Pronote fédère aujourd’hui toute la communauté éducative (personnels, enseignants, parents, élèves). De même, EcoleDirecte, le 2ème ENT le plus utilisé en France “touche (…) 1 500 000 élèves pour 2 millions de parents et 140 000 enseignants.” Les quantités de données sont gigantesques et doivent donc être stockées et sécurisées.

Les outils de gestion de la vie scolaire, ainsi que les messageries, génèrent énormément de données et d’informations. Ces données collectent l’information sur le comportement de l’élève pendant toute sa scolarité (au minimum pendant 13 ans) : ses absences (pour maladie ou autre), ses résultats scolaires par matière, ses compétences acquises ou non, l’implication, le soutien de ses parents ou non, etc. Il s’agit d’un véritable profilage, un dossier élève qui peut être très détaillé et qui, sur le plan éthique, pose question. Aujourd’hui, la sécurité et la confidentialité de ces données sont garanties par le cadre de confiance défini dans le document officiel de 219 pages, le Schéma Directeur des ENT (SDET)(2) et par les normes RGPD. Dans le SDET, on retrouve 209 fois le mot “sécurité” et 37 fois les termes “confidentialité” et “données personnelles”…

“En assurant la sécurité et la confidentialité des données manipulées et la protection des données personnelles, sociales et scolaires, l’ENT offre un cadre de confiance facilitant le développement des usages du numérique dans le respect des droits de ses utilisateurs.” stipule le SDET (2)

Donnée : je t’aime, moi non plus…

Pourquoi une telle sécurité autour de ces données ? En grande partie, pour des questions éthiques : pour que ces données ne soient pas utilisées à des fins commerciales (publicités) ou à des fins contraires à l’égalité des chances (privilèges donnés à certains plutôt qu’à d’autres ou au contraire mise à l’écart) ou pour les GAFA. On est sur le sujet de la diabolisation des données.

De l’autre côté (c’est à dire le côté positif…), les données sont une vraie richesse si elles sont utilisées pour l’analyse, la recherche et l’application pour le bien des personnes. Prenons un exemple concret : celui du harcèlement scolaire. Les symptômes du harcèlement scolaire se retrouvent souvent dans un taux d’absentéisme en croissance, des résultats scolaires qui chutent de plusieurs points, des retards en cours qui s’accentuent. Ce sont exactement ces données que les ENT et les outils de vie scolaire collectent et qui pourraient être utilisées par les équipes pédagogiques pour identifier les potentiels élèves harcelés. En effet, comment faire autrement pour repérer les 700 000 victimes de harcèlement scolaire en France(3) afin de les aider et les accompagner ? Le même procédé pourrait être utilisé pour alerter sur les phobies scolaires. A ce jour, les données ne sont pas utilisées par respect des données personnelles, mais, ne pas les utiliser pose également un problème éthique. On tourne en rond…

Faire confiance aux data centers… mais jusqu’à un certain point

Big data center storage with full of rack servers. Par jamesteohart.

La majorité des établissements scolaires décident d’héberger leurs données dans des data centers. Serge Abiteboul, de l’Inria, dans sa vidéo “Qu’est-ce que le Cloud” (4), met en avant les avantages du Cloud et des data centers dont celui de la sécurité des données :

“Quand vous mettez vos informations sur le Cloud, le premier avantage que vous avez, c’est une garantie de sûreté. Ces informations ne disparaîtront pas parce qu’elles sont probablement répliquées dans plusieurs endroits, peut-être sur plusieurs data centers, en tout cas sur plusieurs machines. Et donc même si une machine ou un disque tombe en panne, vous allez quand même récupérer vos données. Chez vous, tout peut se passer, votre ordinateur peut tomber en panne, votre maison peut brûler. Là, il y a une espèce de garantie de protection de vos données. Protection aussi contre les intrusions. Ce n’est pas garanti 100 %, mais on va imaginer qu’ils savent quand même mieux se protéger contre les attaques des hackeurs que vous.”

Par exemple, le groupe Aplim, éditeur de l’ENT EcoleDirecte a choisi OVH pour héberger les données personnelles relatives à l’éducation des élèves français. Il était impératif pour la société de les héberger en France (data centers à Roubaix, Gravelines et Strasbourg) ; la protection de ces informations constituant un enjeu majeur(5). Au-delà des raisons techniques, ce sont donc bien des arguments de confiance qui ont convaincu. Même l’incendie des data centers d’OVH à Strasbourg en mars dernier n’a pas réussi à ternir l’aspect sécuritaire des data centers puisqu’OVH a su récupérer un maximum de données et gérer la crise en toute transparence.

Dans la vidéo, Serge Abiteboul est transparent sur les inconvénients du Cloud :

“Il y a aussi quelque chose qui me gêne un peu, c’est une philosophie un petit peu sous-jacente du Cloud, qui est cette espèce d’hyper-centralisation. On centralise les calculs, on centralise les données. À l’arrivée, vous avez quelques entreprises qui vont par exemple posséder toutes les données personnelles de tous les individus dans le monde dans des énormes data centers. C’est un petit peu à l’opposé d’une philosophie qui, au départ de l’Internet, était une philosophie de décentralisation, de localisation au maximum des choses.”

C’est pour cela que certains font le choix d’héberger eux-mêmes leurs données. Ainsi, le syndicat mixte Somme Numérique qui compte bien sécuriser au maximum les données élèves provenant le leur ENT sur leurs propres serveurs.

L’anonymisation des données

Les acteurs de l’enseignement, que ce soient les enseignants, les Directions d’établissements scolaires ou les parents, n’ont pas toujours confiance dans l’utilisation qui est faite des données personnelles contenues dans le dossier élève. Pour prévenir de dérives, il est techniquement possible d’anonymiser les données de masse, empêchant ainsi l’identification d’une personne à partir d’un jeu de données et donc, de respecter sa vie privée. Deux procédés peuvent être appliqués pour l’anonymisation des données : la randomisation (la répartition globale est conservée mais les données sont moins précises) ou la généralisation (on s’assure que les attributs des jeux de données sont communs à un ensemble de personnes en modifiant l’échelle de ces attributs ou leur ordre de grandeur).(6)

Nous choisissons donc de faire confiance aux data centers et aux données en utilisant des procédés techniques de défiance tels que l’anonymisation. Sur ce point de défiance, il semble qu’il y ait consensus entre parents et équipes pédagogiques.

Des parents confiants

Que pensent les parents de l’utilisation de leurs données personnelles et de celles de leurs enfants via le Dossier Elève ? C’est notamment pour répondre à cette question que j’ai analysé les 256 réponses à un questionnaire en ligne envoyé à des parents d’enfants scolarisés en France en maternelle, primaire, collège ou lycée, en mars dernier. J’ai pu constater dans cette enquête que pour 85% des parents, la confidentialité des données des enfants est importante, voire très importante. Cependant, elle n’est pas leur priorité et n’apparaît qu’en 5ème position des valeurs importantes concernant leur relation avec les établissements scolaires. Les parents ne semblent pas inquiets outre mesure. Et pourtant, il s’agit bien, à mon sens, d’un sujet éthique clé.

La question de l’éthique dans la relation digitale parents-école soulève d’autres sujets importants : la défiance numérique ou encore l’impact du confinement et de l’école à la maison. Autant de sujets que je souhaite développer dans de futurs articles cet été…

3 termes techniques me semblent importants à retenir ; d’où ce mini-glossaire :

Anonymisation : l’anonymisation est un traitement qui consiste à utiliser un ensemble de techniques de manière à rendre impossible, en pratique, toute identification de la personne par quelque moyen que ce soit et de manière irréversible.(6)

Data center : un data center ou centre de données est un site physique regroupant des installations informatiques (serveurs, routeurs, commutateurs, disques durs…) chargées de stocker et de distribuer des données (data en anglais) à travers un réseau interne ou via un accès Internet. Les entreprises possédant des bases de données, tous les sites Internet, les services de cloud computing hébergent leurs activités dans des data centers.

ENT : un espace numérique de travail (ENT) est un portail internet éducatif permettant à chaque membre de la communauté éducative d’un établissement scolaire, d’accéder, via un point d’entrée unique et sécurisé, à un bouquet de services numériques en relation avec ses activités.(1)

Ressources externes, références et documents pour approfondir les sujets

(1) Espace Numérique de Travail (ENT), Eduscol, le site Web officiel français d’information et d’accompagnement des professionnels de l’éducation. Date : 16 décembre 2008. Description : définition, caractéristiques et objectifs officiels des ENT. Résultat : ce texte permet d’avoir la version officielle de la direction générale de l’enseignement scolaire du ministère de l’Éducation nationale et de la Jeunesse des objectifs pour le déploiement des ENT en France sur les établissements scolaires.

(2) Document principal du SDET version 6.3

(3) Journée nationale de lutte contre le harcèlement scolaire, 4 novembre 2019

(4) Vidéo “Qu’est-ce que le Cloud”, Serge Abiteboul.

(5) Gérer les pics de trafic d’un site web tout en optimisant les coûts grâce à Public Cloud, ovhcloud.com. Date : octobre 2020. Description : étude de cas sous forme d’une brochure commerciale pour présenter le contrat commercial entre le Groupe Aplim, éditeur de l’ENT EcoleDirecte et OVH, leader européen du Cloud. Résultat : ce texte décrit le contexte, la solution d’hébergement mise en place et les résultats obtenus suite à la montée en puissance de l’utilisation d’un ENT pendant le confinement de Mars 2020 en France.

(6) L’anonymisation de données personnelles, CNIL, Commission Nationale de l’Informatique et des Libertés. Date : 19 mai 2020. Description : la CNIL fait le point sur les techniques utilisables et sur les enjeux de l’anonymisation. Résultat : ce texte nous permet de comprendre que l’anonymisation rend impossible l’identification d’une personne à partir d’un jeu de données et permet, ainsi, de respecter sa vie privée. La CNIL fait le point sur les techniques utilisables et sur leurs enjeux : pseudonymisation, randomisation, généralisation, individualisation, corrélation, inférence.

--

--

Anne-Sophie

Passion for #Education #EdTech #ParentTeacherCoEducation