Le niveau des élèves, d’approximations en approximations
Selon l’approche rationnelle, on considère qu’il est possible de distinguer un objectif à atteindre, des moyens mis en œuvre pour atteindre cet objectif. Ainsi, quand l’objectif n’est pas ou partiellement atteint (constat), on peut se demander pourquoi (diagnostic). On peut ensuite se demander comment faire mieux la prochaine fois en utilisant mieux les moyens ou en les modifiant (amélioration). Quand l’objectif est partiellement atteint on peut vouloir quantifier le niveau d’atteinte : par exemple on peut attribuer les valeurs 10 à l’objectif complètement atteint, 0 à l’objectif pas du tout atteint, et 1 à 9 à l’objectif partiellement atteint. Il n’y a aucune raison de penser que procéder à une telle quantification contribue à répondre à la question de l’amélioration. Mais évaluer puis quantifier le niveau d’atteinte reste un élément important de l’approche rationnelle.
Qu’en est-il à l’école ?
La forme scolaire actuelle n’est qu’une façon parmi bien d’autres de contribuer à l’éducation des enfants et des adolescents, mais elle a le mérite de se prêter au pari de la rationalité. L’objectif est clair, en France par exemple (charte de programmes, suite au décret du 24 juillet 2013) : « ce que l’école entend enseigner » est défini par les programmes et « les savoirs enseignés à l’école : doivent aider les élèves à se repérer dans la complexité du monde ; participent de l’ambition d’une recherche de vérité. Celle-ci, diverse selon les champs de savoir, se fonde sur une démarche rationnelle. Elle est régulièrement mise à jour et se distingue de l’opinion et du préjugé ; doivent relever du caractère inclusif de l’école et bénéficier à la totalité des élèves ; ces savoirs ne sauraient être définis d’une façon telle que leur enseignement nécessiterait en permanence pour tel ou tel élève des aides ou compensations extérieures à la classe ; relèvent à la fois d’une mission d’instruction et d’une mission d’éducation : l’objectif commun aux deux missions étant l’apprentissage de la liberté de penser, de l’esprit critique et des conditions démocratiques de leur exercice, elles se rejoignent pour inscrire la morale et la connaissance dans le cadre scolaire».
Les moyens mis en œuvre sont l’ensemble du travail des humains qui enseignent, ainsi que des ressources matérielles (salles de classes, outils par exemple) et humaines (encadrement, formation par exemple) qui sont mises à leur disposition.
Selon l’approche rationnelle on devrait donc commencer par évaluer si les élèves français parviennent « à se repérer dans la complexité du monde », s’ils distinguent « l’opinion du préjugé », s’ils sont « libres de penser », etc. Puis, si tel n’est pas le cas, comprendre pourquoi ; et, en conséquence, améliorer les moyens. Pourtant, une telle entreprise semble trop ambitieuse, si bien qu’un certain nombre d’approximations sont réalisées, nous éloignant progressivement de la rationalité.
1ère approximation : les savoirs comme finalité de l’école
Comme les savoirs enseignés à l’école doivent « aider les élèves à se repérer dans la complexité du monde » etc., on peut aisément réaliser une première approximation : au lieu d’évaluer si les élèves parviennent effectivement à se repérer dans la complexité du monde (ce qui peut paraître difficile), on peut vérifier s’ils maitrisent les savoirs enseignés. Au lieu d’évaluer l’atteinte de l’objectif, on évalue les moyens d’atteindre ces objectifs. Cette première approximation est extrêmement fréquente, clairement non spécifique au système éducatif français. Mais elle est bien une approximation, et elle permet à l’école d’enseigner les savoirs pour les savoirs, et non les savoirs comme moyens de se repérer dans la complexité du monde.
Je crois que le prix à payer de cette approximation est important, car c’est elle qui a permis le développement de discours évaluateurs externes à l’école, notamment de la part d’organisations internationales ou patronales, qui peuvent dire en substance : « puisque l’école enseigne les savoirs pour les savoirs, nous allons évaluer ce qui compte vraiment pour nous : les compétences, l’employabilité, etc. ».
2ème approximation : de la maitrise des savoirs au niveau de performance à la tâche
Si l’on accepte la première approximation, alors une difficulté se présente : comment évaluer la maitrise des savoirs ? Par exemple : comment évaluer que tel élève maitrise l’accord du participe passé avec l’auxiliaire avoir ? Que telle élève maitrise le théorème de Thalès ? Des milliers de recherches ont tenté de répondre à cette question depuis la fin du 19ème siècle, et bien avant les chercheurs, les enseignants ont essayé aussi. En l’état actuel des connaissances (Cnesco, 2022) on peut répondre : il est impossible d’évaluer directement la maitrise des savoirs, on ne peut qu’évaluer la mise en œuvre d’une tâche et la performance à celle-ci. Ce n’est que l’observation des performances à plusieurs tâches fondées sur la mise en œuvre du même savoir qu’on aura une idée approximative de la maitrise du savoir. Par exemple, pour évaluer si tel élève maitrise l’accord du participe passé avec l’auxiliaire avoir, il va sans doute falloir évaluer les performances à des tâches de dictées, des exercices de grammaire et des productions écrites. Peut-être même que l’observation de cet élève dans le quotidien de la classe permet de se faire une idée approximative de la maitrise de l’accord du participe passé, à l’écrit et à l’oral. Il n’est cependant pas certain qu’un individu maîtrisant cette règle soit capable de la mettre en œuvre tout le temps, dans toute situation. Sinon, comment comprendre que Valéry Giscard d’Estaing, certes avant d’entrer à l’Académie française, ait pu évoquer en 1974 « les décisions que j’ai pris » et « toutes les décisions que je vous avais promis ».
Ainsi, le niveau scolaire correspondrait plutôt à des performances à la tâche, qui sont des approximations de la maîtrise des savoirs.
Quand on dispose d’un niveau, donc d’une quantité, on peut comparer des performances, voire organiser des compétitions. Cette possibilité offerte par la quantification est largement utilisée, par exemple quand les élèves d’une classe étaient classés du premier au dernier de la classe selon leur niveau de performance, ou quand l’enquête Pisa classe les systèmes éducatifs de différents pays du plus au moins performant. Ce classement qui a du sens dans une compétition ou dans un concours, n’a aucun sens dans d’autres contextes. Et pourtant, il fut et il est encore largement mis en œuvre.
La deuxième dérive tient au fait que classer des performances affecte la façon dont on évalue le travail d’un élève. Dans une étude conduite en Suisse, Autin et ses collaborateurs (2019) demandaient à des étudiants d’évaluer une dictée, soit dans le but de classer leur auteur, soit dans le but de fournir une évaluation formative. La dictée était la même pour tous les évaluateurs, mais était présentée comme celle d’un élève issu d’un milieu social favorisé (prénom Louis ou Charlotte, mère directrice du marketing et père architecte, fratrie de 2 enfants, activités extrascolaires : voyage à Londres) ou défavorisé (prénom Brian ou Cindy, mère serveuse et père ouvrier du bâtiment, fratrie de 5 enfants, activités extrascolaires : parc d’attractions local). Les résultats montrent que quand la dictée est évaluée dans un but de sélection, il y a significativement plus d’erreurs orthographiques trouvées dans celles attribuées aux élèves d’un milieu social défavorisé (12,4 en moyenne, contre 11 quand la dictée est attribuée à un élève de milieu social favorisé). Quand la dictée est évaluée dans un but formatif, le nombre d’erreurs trouvées est le même quel que soit le milieu social supposé (11,7 contre 11,6). Le fait même d’évaluer pour classer affecte la façon dont on évalue et tend à accentuer certains biais d’évaluation.
La troisième dérive, quand on dispose d’un niveau, est de ramener l’individu à sa performance. Tel individu est meilleur que tel autre puisqu’il est plus performant et que sa performance est quantifiée. Quand une compétition en athlétisme est organisée, cela a du sens de considérer que la performance d’un tel est meilleure que celle d’un autre (une des caractéristiques essentielles étant que les athlètes se sont inscrits à une compétition, de leur plein gré et que le classement des performances est l’objectif de l’organisation en question). La performance d’un tel à la course du 100 mètres est meilleure lors de telle compétition. Est-ce que cela permet de considérer qu’il est meilleur en général, en tout, tout le temps ? C’est pour cette raison que certains systèmes de « classement » (comme aux échecs) reposent sur la prise en compte des performances au cours du temps. Le calcul du niveau moyen pose un problème de plus. Or l’école n’est pas une compétition, elle est même tout le contraire, et il n’y a aucune raison de ramener les élèves à leurs performances. C’est ce que rappelle le législateur, comme évoqué en introduction de cet article : « les savoirs enseignés à l’école (…) doivent relever du caractère inclusif de l’école et bénéficier à la totalité des élèves ».
3ème approximation : du niveau de performance à des tâches au niveau moyen
Quittons l’athlétisme et l’épreuve du 100 mètres pour aller vers les sports collectifs. Qu’est-ce qui fait la qualité d’une footballeuse ou d’un joueur de rugby ? Cette question est extrêmement difficile et il est presque impossible de trouver deux spécialistes de tel sport collectif qui y répondraient de la même manière. Car passer d’une dimension de la performance (la vitesse au 100 mètres) à un ensemble important, mal défini et complexe de qualités, est déraisonnable. Pourtant c’est bien ce que nous faisons à l’école : nous calculons des moyennes. Calculer une moyenne arithmétique est une décision forte : c’est considérer que différentes dimensions peuvent s’additionner, donc être ramenées à une seule dimension. Un peu comme si la qualité d’une footballeuse pouvait être calculée en additionnant sa vitesse de course, sa vision, son endurance, etc. Pire encore, nous faisons comme si la qualité d’un joueur de rugby était indépendante du poste qu’il occupe, comme si la qualité d’un pilier de rugby était la même que celle d’un ouvreur (cette erreur, qui consiste à considérer qu’il y a un niveau scolaire correspondant à une réussite scolaire, a été maintes fois soulignée par Dubet par exemple).
Le niveau scolaire tel qu’il est mesuré classiquement semble échapper très largement à la rationalité. Il est le résultat de trois approximations, qui elles-mêmes sont liées à des dérives importantes. Selon la conférence de consensus du Cnesco « L’évaluation en classe, au service de l’apprentissage des élèves » en 2022, il faudrait commencer par être clair sur l’objectif : pourquoi évaluer le niveau des élèves ? Et ne le faire que quand c’est pertinent (pour un concours classant ou examen de validation, par exemple).
Pourtant, malgré toutes ces dérives et ces approximations, je voudrais souligner un intérêt de l’évaluation quantifiée du niveau des élèves : quand elle est bien faite, cette évaluation est le meilleur moyen de lutter contre les convictions personnelles, de ceux par exemple qui étaient convaincus que « le niveau baisse » et on eut beaucoup plus de mal à faire croire qu’ils étaient sérieux après la publication de l’ouvrage de Baudelot et Establet en 1989. Comme il est difficile aujourd’hui d’être optimiste et de considérer que le niveau monte ou que l’école française est socialement juste. Difficile pour l’opinion de s’opposer aux faits quand ils sont solidement établis et mesurés. Ensuite, je crois que les politiques publiques d’éducation ont tout intérêt à être fondées sur des constats rigoureux quant au niveau des élèves et aux facteurs qui pèsent sur celui-ci, qu’à des convictions personnelles, volontiers réactionnaires par les temps qui courent.
André Tricot
Cnesco – Centre national d’étude des systèmes scolaires – Cnam – Paris
Bibliographie
Frédérique Autin, Anatolia Batruch & Fabrizio Butera, The function of selection of assessment leads evaluators to artificially create the social class achievement gap. Journal of Educational Psychology, 2019, 111, 717–735.
Christian Baudelot & Roger Establet, Le niveau monte. Éditions du Seuil, 1989.
Cnesco, Conférence de consensus, « L’évaluation en classe, au service de l’apprentissage des élèves », 2022. https://www.cnesco.fr/evaluation-en-classe/