"Don’t Trust Your Gut"
– Laszlo Bock, ancien DRH de Google
La saignée est une pratique thérapeutique très ancienne, mais c’est Hippocrate et surtout Galien qui l’ont légitimée scientifiquement en la reliant à la théorie des humeurs. Selon cette théorie, toute maladie résulte d’un déséquilibre entre les quatre humeurs du corps. Si l’humeur excédentaire ne s’évacue pas naturellement (vomissements, expectorations, saignements de nez, etc.), il faut alors rétablir l’équilibre artificiellement. Et pour cela, rien de mieux que la saignée.
Cette pratique a longtemps été considérée par les médecins comme la panacée pour traiter divers maux. Mais les progrès scientifiques à partir du 17e siècle – notamment les travaux de William Harvey sur la circulation sanguine – remirent en cause la théorie des humeurs, et la saignée tomba progressivement en désuétude. Pour l’anecdote, la saignée aurait contribué à la mort de George Washington : atteint d’un syndrome grippal, près de 4 litres de sang lui furent prélevés en trois jours, soit l’équivalent de sa masse sanguine.
Les médecins qui pratiquaient la saignée étaient pourtant de bonne foi, intimement convaincus de son efficacité thérapeutique. Pierre Brissot, professeur émérite de médecine, souligne ainsi que l’on doit tirer de l’histoire de la saignée « une évidente leçon d’humilité, cette histoire démontrant, s’il en était besoin, que l’intime conviction ne peut se substituer à la preuve » [1].
Et si je vous disais que l’entretien traditionnel dans le recrutement, c’est l’équivalent de la saignée au 17e siècle ?
Un gap entre la pratique et la recherche
La recherche académique sur le recrutement est foisonnante : cela fait plus d’un siècle que la psychologie du travail et des organisations – ou Industrial and Organizational (I/O) Psychology dans les pays anglo-saxons – étudie les méthodes de sélection. Ce champ scientifique a produit des milliers d’études et plusieurs méta-analyses, avec une ambition claire : identifier les méthodes qui permettent de sélectionner les candidats les plus performants une fois en poste.
Cette question est tellement centrale qu’elle a été qualifiée de « problème suprême » par les chercheurs eux-mêmes dès 1917 [2].
Sur le terrain, l’entretien est de loin la méthode la plus utilisée pour évaluer et sélectionner les candidats. Dans sa forme traditionnelle, il s’agit d’un échange libre entre le recruteur et le candidat, où l’intuition et le feeling jouent un rôle central.
Pourtant, la recherche montre de façon univoque que l’entretien traditionnel est un moyen assez peu fiable pour évaluer la capacité d’un candidat à réussir dans un poste. D’autres méthodes, comme l’entretien structuré, les tests de connaissances professionnelles, les questionnaires biographiques, ou encore les mises en situation sont nettement plus prédictives de la performance professionnelle [3].
Beaucoup de recruteurs professionnels sont peu enclins à abandonner l’entretien traditionnel, pour deux raisons principales.
D’une part, ils se disent : « J’ai toujours recruté comme ça, et je vois bien que ça marche ». Mais rappelons-nous que les médecins qui pratiquaient la saignée utilisaient ce même argument de la preuve par l’expérience. En réalité, un recruteur qui observe l’effet de ses pratiques dans ses propres recrutements et « qui voit bien que ça marche » court un grand risque de se leurrer.
D’autre part, de nombreux recruteurs surestiment leur capacité à repérer les talents par l’intuition [4], et l’entretien traditionnel leur donne l’occasion d’exercer cette capacité. Or la recherche montre que ce type d’entretien constitue une porte d’entrée pour les biais cognitifs (effet de Halo, biais de confirmation, biais de similarité, etc.) et les stéréotypes du recruteur. La supériorité de l’entretien structuré sur l’entretien traditionnel illustre une réalité contre-intuitive : dans le recrutement, moins de subjectivité est synonyme de plus d’efficacité et plus d’équité.
Ces croyances profondément ancrées expliquent la surutilisation persistante de l’entretien traditionnel en dépit de l’évidence scientifique. Comme le soulignent Bruchon-Schweitzer et Laberon [5] :
… il semble bien que les pratiques de recrutement, notamment en France, soient dictées par des impératifs étrangers à la science comme à la déontologie. L’impact des recherches (études de validité notamment) sur les pratiques semble minime et le décalage entre praticiens et chercheurs est particulièrement aigu en France.
On pourra objecter que ce décalage n’est pas si problématique, car le recrutement ne se réduit pas à la sélection : il s’agit aussi d’attirer les bons profils, de soigner l’expérience candidat, d’incarner les valeurs de l’entreprise, etc. Ces aspects sont certes importants, mais dans la majorité des cas, la sélection des candidats reste l’enjeu central du recrutement.
Nous sommes tous humains : remettre en question ses croyances et ses pratiques n’est jamais facile. Mais face à l’évidence scientifique, il faut savoir reconnaître que « l’intime conviction ne peut se substituer à la preuve ».
La pratique fondée sur des preuves
Dans un monde rationnel, on s’attend à ce que les pratiques professionnelles s’appuient sur les résultats de la recherche et les recommandations qui en découlent. Mais dans la réalité, ce fonctionnement idéal est rarement observé : bien souvent, les pratiques reposent davantage sur des croyances, des philosophies ou des habitudes.
L’idée d’ancrer la pratique dans des preuves ou des données probantes (evidence, en anglais) est née dans le domaine médical au début des années 1980. Conceptualisé par David Sackett en 1996 [6], le courant de l’Evidence-Based Medicine repose sur « l’utilisation consciencieuse, explicite et judicieuse des meilleures données disponibles pour la prise de décisions concernant les soins à prodiguer à chaque patient, [...] une pratique d’intégration de chaque expertise clinique aux meilleures données cliniques externes issues de recherches systématiques ».
Voici un exemple célèbre illustrant la notion de données probantes. Au 18e siècle, les marins de la Royal Navy souffraient massivement du scorbut, une maladie mortelle causée par une carence en vitamine C. A l’époque, on ne connaissait pas encore les vitamines, et de nombreuses théories circulaient sur les causes du scorbut : l’air vicié, l’eau stagnante, ou encore une mauvaise digestion.
En 1747, James Lind, un médecin de bord britannique, décide de tester différentes hypothèses. Sur un navire, il sélectionne 12 marins atteints de scorbut et les répartit en 6 groupes de 2. Il administre un traitement différent à chacun de ces groupes : cidre, vinaigre, eau de mer, élixir sulfuré, etc. Un seul groupe reçoit des oranges et des citrons. Le résultat est sans appel : les deux marins ayant consommé des agrumes se rétablissent en quelques jours, bien plus rapidement que les autres.
Cette étude menée par James Lind est considérée comme le tout premier essai clinique contrôlé de l’histoire de la médecine. Les résultats issus de ce type d’étude constituent ce qu’on appelle des données probantes, qui sont infiniment plus convaincantes que de simples opinions. Comme le rappelait W. Edwards Deming : « Sans données, vous n’êtes qu’une personne de plus avec une opinion ».
De nos jours, il serait impensable de prendre un médicament ou de suivre un traitement qui n’aurait pas démontré son efficacité selon les standards de la recherche scientifique, notamment par le biais d’essais cliniques randomisés.
L’approche fondée sur des preuves est entièrement pragmatique : elle vise simplement à déterminer ce qui fonctionne réellement (what works ?). Après la médecine, cette approche s’est naturellement étendue à des domaines comme l’éducation et les politiques publiques avec pour objectif de guider les pratiques sur la base de données factuelles issues d’études rigoureuses.
Le recrutement fondé sur des preuves
Le recrutement fondé sur des preuves (evidence-based hiring) est un courant visant à fonder les pratiques de recrutement sur des preuves scientifiques de leur efficacité.
Adopter une approche fondée sur des preuves est crucial lorsqu’il s’agit de choisir une méthode pour évaluer et sélectionner les candidats. Comme nous l’avons vu plus haut, les pratiques en la matière sont souvent déconnectées des résultats de la recherche.
Ce choix repose sur plusieurs critères : le coût, la qualité de l’expérience candidat, le degré de prédictivité de la méthode (sa capacité à identifier les candidats qui seront les plus performants), et son équité (sa capacité à favoriser la diversité parmi les candidats sélectionnés). Choisir une méthode revient donc à arbitrer entre ces différents critères.
Mais pour que cet arbitrage soit réellement éclairé, encore faut-il disposer d’informations objectives sur les performances de chaque méthode sur ces différents critères. Et c’est précisément ce que la recherche sur le recrutement peut fournir, en particulier sur les deux critères clés que sont la validité prédictive et l’équité.
La prédictivité
Recruter consiste par essence à formuler une prédiction sur les comportements futurs d’un candidat, en particulier sur sa performance une fois en poste. On dit plus volontiers que le recrutement vise à évaluer l’adéquation entre un candidat et un poste (le Person–Job Fit). En réalité, cette évaluation revient à prédire le niveau de performance que le candidat atteindra s’il est recruté. Autrement dit, parler de « recrutement prédictif » est un pléonasme : le recrutement est par nature prédictif.
Les méthodes de sélection des candidats sont diverses et nombreuses (entretien, mises en situation, tests d’aptitudes cognitives, etc.). Dans quelle mesure ces méthodes permettent-elles de prédire la performance future au travail ? Des milliers d’études ont tenté de répondre à cette question.
La synthèse de ces études publiée en 1998 par Schmidt et Hunter [7] a marqué un tournant : elle a montré que certaines méthodes d’évaluation présentent des corrélations substantielles avec la performance au travail, notamment les tests d’aptitude cognitive générale. Cette synthèse a servi de référence pendant plus de 20 ans, tant pour les chercheurs que pour les praticiens en ressources humaines.
En 2022, Sackett et al. [3] ont actualisé ces résultats en adoptant une approche plus conservatrice dans l’estimation de la validité des méthodes. Leurs résultats montrent notamment que les méthodes les plus valides sont celles qui évaluent des compétences spécifiques au poste (vs. générales comme les tests psychométriques). En effet, après les entretiens structurés (validité = 0.42), les trois méthodes les plus valides sont les tests de connaissances professionnelles (validité = 0.40), les questionnaires biographiques (validité = 0.38), et les mises en situation (validité = 0.33).
La prédictivité n’est pas toujours le critère principal dans le choix d’une méthode de sélection. Mais lorsqu’une entreprise souhaite réellement identifier les meilleurs candidats, elle a tout intérêt à utiliser les méthodes dont l’efficacité est scientifiquement démontrée.
Prenons l’exemple de Google. L’entreprise tire son avantage compétitif non pas de sa capacité à attirer les talents – elle reçoit plusieurs millions de candidatures chaque année – mais de sa capacité à sélectionner les meilleurs, avec un taux d’embauche inférieur à 1 %.
Dans son livre Work Rules! [8], l’ancien DRH de Google Laszlo Bock explique que pour répondre à la question « Quelles méthodes permettent le mieux de prédire la performance future des candidats ? », il s’est tourné vers les résultats de la recherche :
Quelles techniques d’évaluation utilisons-nous ? L’objectif de notre processus d’entretien est de prédire la performance des candidats une fois qu’ils auront intégré l’équipe. Nous atteignons cet objectif en suivant ce que dit la science : en combinant des entretiens structurés comportementaux et situationnels avec des évaluations des aptitudes cognitives, du caractère consciencieux, et du leadership.
Le processus de recrutement chez Google est donc fondé sur des preuves. Et surtout, il est parfaitement transposable à d’autres contextes.
L’équité
L’équité d’une méthode de sélection, c’est-à-dire sa capacité à garantir un recrutement inclusif, est un critère devenu central pour de nombreux recruteurs. Là aussi, la recherche fournit des enseignements précieux.
Certaines méthodes permettent de mieux prédire la performance professionnelle future, mais ce gain de validité peut parfois se faire au détriment de la diversité des candidats sélectionnés. Ce phénomène est connu sous le nom de compromis validité-diversité. C’est notamment le cas des tests d’aptitudes cognitives : longtemps présentés comme très prédictifs (validité = 0.51 selon Schmidt et Hunter [7]), ils sont également connus pour défavoriser certains groupes selon le genre ou l’origine ethnique [9].
Cependant, la nouvelle synthèse de référence de Sackett et al. [3] atténue la notion de compromis validité-diversité [10].
D’une part, elle montre que la validité des tests d’aptitudes cognitives est en réalité plus modeste (0.31). Comme ces tests sont à la fois moins prédictifs que prévu et qu’ils réduisent la diversité, leur usage est donc moins pertinent.
D’autre part, cette nouvelle synthèse met en évidence que les entretiens structurés (validité = 0.42), les tests de connaissances professionnelles (0.40) et les questionnaires biographiques (0.38) figurent parmi les méthodes les plus prédictives, tout en étant peu discriminantes. Ces méthodes allient donc validité et équité, ce qui les rend particulièrement pertinentes pour la sélection [11].
L’équité d’une méthode de sélection peut être facilement documentée en indiquant les scores moyens obtenus par différents groupes sociaux. Une telle démarche relève d’une approche fondée sur des preuves.
Conclusion
L’utilisation massive de l’entretien d’embauche traditionnel est symptomatique du décalage entre les pratiques et la recherche en matière de recrutement. Deux raisons principales expliquent ce fossé.
Premièrement, l’intuition joue un rôle central dans les décisions de recrutement, comme dans le management en général. Nombre de dirigeants, managers ou professionnels RH sont convaincus de « sentir » les bons candidats. Cette confiance dans le gut-feeling ne favorise pas l’adoption de pratiques fondées sur des preuves, qui visent justement à réduire la part de l’intuition et les biais qui l’accompagnent.
Deuxièmement, la recherche scientifique sur le recrutement, pourtant foisonnante, reste largement méconnue des professionnels RH. Ce n’est pas à eux qu’il faut le reprocher, mais aux chercheurs eux-mêmes, qui dénoncent régulièrement le fossé entre recherche et pratique sans toujours s’employer à le combler. Combler ce fossé passe avant tout par un travail de vulgarisation des travaux en psychologie du travail et des organisations, afin de les rendre accessibles, compréhensibles, et directement actionnables par les praticiens.
Face à ce constat, le recrutement fondé sur des preuves vise à réaligner les pratiques sur les résultats établis de la recherche. Ces résultats nous apprennent quelles méthodes permettent réellement d’évaluer les candidats, et comment combiner les informations recueillies pour prendre les meilleures décisions. En appliquant ces enseignements, le recrutement actuariel constitue aujourd’hui la forme la plus aboutie de recrutement fondé sur des preuves. Ce n’est pas une lubie académique : des entreprises comme Google utilisent déjà ce type de recrutement.
L’approche fondée sur des preuves reflète l’objectif pragmatique de déterminer ce qui fonctionne réellement. Elle s’est imposée en médecine, et gagne du terrain dans l’éducation et les politiques publiques. Pourquoi ne s’appliquerait-elle pas aussi au recrutement ?
Dans cette optique, il faut à la fois remettre en question les pratiques anciennes (comme l’entretien traditionnel) dont la faible validité est démontrée, et se montrer prudent face à l’engouement pour des méthodes innovantes dont la validité reste à prouver (tests gamifiés, entretiens vidéo menés par IA, etc.). L’évolution des outils est naturelle et souhaitable, mais leur adoption devrait se fonder sur des données probantes plutôt que sur des effets de mode.
Références
[1] Brissot, P. (2017). La saignée en médecine : entre illusion et vertu thérapeutiques. Bulletin de l’Académie nationale de médecine, 201(4–6), 919–928.
[2] Ployhart, R. E., Schmitt, N., & Tippins, N. T. (2017). Solving the Supreme Problem: 100 years of selection and recruitment at the Journal of Applied Psychology. The Journal of applied psychology, 102(3), 291–304.
[3] Sackett, P. R., Zhang, C., Berry, C. M., & Lievens, F. (2022). Revisiting meta-analytic estimates of validity in personnel selection: Addressing systematic overcorrection for restriction of range. Journal of Applied Psychology, 107(11), 2040–2068.
[4] Highhouse, S. (2008). Stubborn reliance on intuition and subjectivity in employee selection. Industrial and Organizational Psychology: Perspectives on Science and Practice, 1(3), 333–342.
[5] Bruchon-Schweitzer, M. et Laberon, S. (2011). Chapitre 3. Pratiques D’évaluation des Recruteurs : Situation, Évolutions et Déterminants. Dans S. Laberon Psychologie et recrutement : Modèles, pratiques et normativités (p. 75-105). De Boeck Supérieur.
[6] Sackett, D. L., Rosenberg, W. M., Gray, J. A., Haynes, R. B., & Richardson, W. S. (1996). Evidence based medicine: what it is and what it isn’t. BMJ (Clinical research ed.), 312(7023), 71–72.
[7] Schmidt, F. L., & Hunter, J. E. (1998). The validity and utility of selection methods in personnel psychology: Practical and theoretical implications of 85 years of research findings. Psychological Bulletin, 124(2), 262–274.
[8] Bock, L. (2015). Work rules!: Insights from inside Google that will transform how you live and lead. New York, NY: Twelve.
[9] Ployhart, R. E., & Holtz, B. C. (2008). The diversity-validity dilemma: Strategies for reducing racioethnic and sex subgroup differences and adverse impact in selection. Personnel Psychology, 61(1), 153–172.
[10] Berry, C. M. (2024). Personnel selection systems and diversity. Current Opinion in Psychology, 60, Article 101905.
[11] Sackett, P. R., Zhang, C., Berry, C. M., & Lievens, F. (2023). Revisiting the design of selection systems in light of new findings regarding the validity of widely used predictors. Industrial and Organizational Psychology, 16(3), 283–300.