Enseigner : quel travail ?,  Numéro 7,  Thierry Novarese

L’évaluation de l’école : retrouver le sens de la mesure

Le système éducatif est évidemment un lieu d’évaluation : des progrès des élèves, des pratiques des enseignants (par leurs inspecteurs et leurs chefs d’établissements), des établissements d’enseignement eux-mêmes. Mais quel est le sens de cette mesure ? S’agit-il d’un travail de compréhension permettant le renforcement de l’investissement de chacun ? Ou d’une dérive normative obsessionnelle, perdant de vue l’essentiel (le bien de l’élève) au profit d’une folie sans boussole ?

Quelles sont les altérations produites par la gestion par les instruments d’évaluation au cœur du système éducatif, de ses pratiques professionnelles, de son organisation, de ses valeurs ? Cette question réunit depuis 2004 des chercheurs et des militants au sein d’un chantier de l’Institut de recherches de la FSU[1]L’Institut de la FSU a publié différents travaux sur cette question : Capitalisme et éducation (2006), Regards croisés (2008), Payer les profs au mérite ? (2006), Manager ou servir ? (2011 puis 2015)..

La mise en place d’indicateurs, c’est-à-dire la construction de procédures susceptibles de rendre mesurable à des fins de quantification ce qui, a priori, ne l’était pas, constitue une entreprise globale et normative devant s’appliquer progressivement à l’ensemble des activités économique des hommes, y compris maintenant à celles du secteur public.

“ Le Nouveau Management Public repose sur trois moments constituant une sorte de triptyque, un nouveau dogme des « bonnes pratiques » : objectifs – évaluations – sanctions. ”

Cette culture dévorante et obsessionnelle de l’évaluation par indicateurs est au cœur de la Nouvelle gestion publique ou Nouveau Management Public. Le Nouveau Management Public repose sur trois moments constituant une sorte de triptyque, un nouveau dogme des « bonnes pratiques » : objectifs – évaluations – sanctions. Il importe, puisque seuls l’efficacité et les résultats doivent être pris en compte, que les objectifs définis soient suffisamment clairs et simples pour donner matière à des procédures de mesure des dits objectifs ainsi que des « performances » réalisées par les « agents » en rapport avec les objectifs qu’ils auront dû faire leurs. Au regard de leurs résultats et évaluations quantitatives les « agents » sont ensuite soumis à un système de sanctions correspondant au type de projet développé (primes, salaires modulés, modifications des horaires, changement de poste, etc.). Dans ce cadre, la clé de voûte du système repose sur la primauté donnée, sur toute évaluation, à la mesure chiffrée, mesure susceptible d’être présentée comme une caractérisation de l’efficacité.

Que signifie mesurer ?

Comme l’écrit Michel BlayIn Manager ou servir ? , collection Comprendre et agir, Editions Syllepse, réédition 2015. : « on rappellera cependant que la variable considérée (par exemple la production de charbon) doit être associée à un concept quantitativement exprimable (par exemple la masse de charbon) correspondant à une grandeur mesurable — c’est-à-dire satisfaisant aux conditions formelles de la mesure :

a) définir à l’aide d’une procédure effective (par exemple physique) à l’intérieur d’un domaine d’objets et relativement à la grandeur considérée, deux relations d’antériorité et de coïncidence permettant d’instaurer entre ces objets un ordre sériel (on peut classer ainsi les masses) ;

b) définir, toujours à propos de la même grandeur et dans le même domaine d’objet, une opération effective (par exemple physique) additive satisfaisant aux propriétés formelles de l’addition arithmétique (ce qui revient pour l’essentiel à définir une unité de mesure, une masse devenant alors tant de fois l’unité de masse).

Comment mesurer alors par exemple la « production scientifique » ? Quelle est la grandeur mesurable, comparable à la masse, susceptible de fournir les éléments quantitatifs pour construire une échelle de ladite production ? Sur quels matériaux est-il possible de travailler effectivement ? La réponse est simple. En effet : qu’est-ce qui est mesurable dans la production scientifique ou dans celle des connaissances en faisant corrélativement l’impasse sur la science et la connaissance proprement dites ? Eh bien, le nombre d’articles publiés, le nombre de citations de chaque article dans tel ou tel autre article, le nombre de brevets, de prix Nobel dans telle université, d’ordinateurs dans tel laboratoire, de souris dans tel fond de placard, de jeunes ou de vieux, d’hommes et de femmes, etc. La liste est sans fin car tout, peut être, en droit considéré comme signifiant, comme constituant un critère pour mesurer tout et n’importe quoi[2]G. Udney Yule remarquait déjà en 1921-1922 dans British Journal of Psychology, XII, p. 107 : « N’ayant pas le moyen de mesurer ce que vous désirez, la démangeaison de mesurer peut, par exemple, simplement vous conduire à mesurer quelque chose d’autre — et peut-être en oubliant la différence — ou en laissant de côté certaines choses parce qu’elles ne sont pas mesurables », cité par F.A. Hayek dans Droit, législation et liberté, traduction Raoul Audouin et Philippe Nemo, Paris, PUF, 2007 (Première éd. PUF 1980 et 1973-1979 pour l’édition anglaise), p. 890..

Evaluation, concurrence, économie : le credo du NMP

L’introduction du Nouveau Management Public (NMP) participe d’une transformation en profondeur des politiques d’éducation dans un certain nombre de pays, lesquels ont mis en œuvre différents processus de décentralisation/recentralisation, un accroissement de l’autonomie des établissements scolaires, le développement du libre choix de l’école, l’installation d’une culture de l’évaluation. Moins législateur, l’Etat devient plus évaluateur en définissant moins des règles a priori mais imposant une obligation de rendre compte à tous ses agents. C’est ensuite à partir de l’atteinte ou non des résultats, au regard d’objectifs prédéterminés, que sont prises les décisions.

Les réformes budgétaires de l’Etat ont été soumises à deux types de pression externe : la réduction de la croissance des dépenses publiques, le souci d’améliorer la performance dans le secteur public pour gagner en efficience, efficacité et qualité. Une première étape a consisté à publier des informations sur la performance accompagnées de documents budgétaires annuels sans que soit établi un lien entre les répartitions financières et la mesure de la performance. Dans une seconde étape, le format et les contenus du budget ont été transformés au travers de catégorisations plus sensibles à la mesure de la performance et reliés à des programmes de planification stratégique. La troisième étape, plus ambitieuse, a consisté à réviser la procédure budgétaire elle-même, en changeant la temporalité de la discussion budgétaire et en modifiant le rôle du parlement dans le processus. Ces réformes se sont traduites par le développement de l’audit dans le secteur public.

Une obsession contre-productive

L’importance donnée à la performance peut entraîner des effets inattendus qui invalident non seulement les conclusions de l’évaluation mais peuvent avoir aussi une influence négative sur la performance elle-même. Il peut donc être contre-productif de développer et d’utiliser des indicateurs de performance. Il a été démontré que le Nord de la Grande-Bretagne semblait avoir davantage d’incendies que les autres pays européens parce que les autorités disposaient d’une meilleure technique statistique pour la mesurer. L’augmentation des chiffres de la délinquance en France a fait l’objet du même type d’analyses. Les chiffres de la délinquance augmentent quand l’activité policière augmente, et inversement ils diminuent quand l’activité policière diminue. Un dernier exemple concerne l’emploi : la performance des agences de l’emploi est fondée sur le nombre de transactions passées pour aider quelqu’un à retrouver un emploi. Leur taux de succès augmentera si elles prennent en charge les meilleurs clients qui ont de bonnes chances de s’intégrer et finalement peu les individus qui manquent de formation ou sont relativement démunis : c’est un effet d’écrémage des bons demandeurs d’emploi par les mauvais qui résulte d’un mauvais usage des indicateurs.

“ L’importance donnée à la performance peut entraîner des effets inattendus qui invalident non seulement les conclusions de l’évaluation mais peuvent avoir aussi une influence négative sur la performance elle-même. ”

La fixation d’objectifs étroits peut aussi conduire à un effet tunnel au détriment des objectifs et de la stratégie d’ensemble. La prolifération des indicateurs et des audits peut augmenter les coûts de pilotage.

Le paradoxe de la performance révèle aussi une faible corrélation entre les indicateurs de performance et la performance elle-même. Ce phénomène est produit par la tendance des indicateurs de performance à perdre de leur intensité au cours du temps. Ils perdent leur valeur et ne parviennent plus à discriminer les bons et les mauvais résultats. Cette détérioration des indicateurs de performance est causée par différents processus. Le premier caractérise un apprentissage positif : la performance s’améliore, les indicateurs perdent leur sensibilité à détecter les mauvaises performances, tout le personnel est devenu si bon que les indicateurs sont obsolètes. Le second processus relève d’un « apprentissage pervers » : quand les organisations ou les individus savent quels aspects de la performance sont mesurés (et ceux qui ne le sont pas), ils peuvent utiliser l’information pour manipuler les évaluations.  En plaçant toute leur énergie sur ce qui est mesuré, la performance grimpe alors qu’il peut y avoir en définitive une détérioration globale. Le troisième processus, la sélection, concerne le remplacement des individus contre-performants par les bons ce qui réduit les différences de performance : seuls les meilleurs restent mais l’indicateur perd sa valeur discriminante.

Cela peut aussi créer une situation où les agents apprennent quel est l’aspect de leur travail qu’il leur faut valoriser auprès de leur supérieur ou qu’il développent des comportements d’apprentissage ou d’anticipation : par exemple, les enseignants aident leurs élèves à tricher aux tests ou leur donne une aide supplémentaire parce que les scores ont des effets sur le budget de l’école, les salaires et l’attitude du chef d’établissement.

Dans les établissements anglais, il est possible de repérer la permanence d’injustices générées par le marché et la sélection scolaire. Le traitement des élèves comme des marchandises, acceptés ou rejetés en fonction de ce qu’ils apportent à l’école relèvent d’une forme d’exploitation proche de celle affrontée par le salariat au premiers temps du capitalisme. La différenciation entre les écoles crée de la marginalisation et un relatif appauvrissement voir une ghettoïsation des écoles subie par les élèves comme par les enseignants. Sans compter l’humiliation, la stigmatisation, la violence, le racisme, qui se sont renforcés notamment sous la pression de la recherche de performance.

“ Il reste à inventer une autre évaluation, formative, par les pairs notamment, qui valorise l’amour du métier, qui permette de reprendre la main sur son travail en développant des pratiques de solidarité et
coopération. ”

Si l’évaluation quantitative et myope est l’alpha et l’oméga du NMP, instrument de mise en concurrence de chacun contre tous, d’isolement et de culpabilisation, il reste à inventer une autre évaluation, formative, par les pairs notamment, qui valorise l’amour du métier, qui permette de reprendre la main sur son travail en développant des pratiques de solidarité et coopération. L’éducation est un trésor commun, qui s’accroit en le partageant, et disparait si on cherche à le diviser.

Thierry Novarese
Professeur de philosophie,
Membre de l’Institut de recherches de la FSU,
Responsable du chantier « Sécurité et liberté »

Notes[+]