04.05.2022

Blog

Boostrs

Revenir en arrière

[Infographie] Mapping basé sur les compétences : 4 éléments qui influent sur son niveau de précision

Le mapping basé sur les compétences est une étape préliminaire indispensable avant de pouvoir relier différents objets RH entre eux. Néanmoins, il est important d’avoir en tête que certains éléments peuvent influer sur le niveau de précision de cette approche nourrie par l’IA. Zoom sur quatre d’entre eux.

Le nombre de compétences demandées au système

 

Le nombre de compétences demandées au système influence le niveau de précision du mapping basé sur les compétences.

 

En effet, les compétences retournées par l’algorithme sont naturellement rangées de la plus pertinente à la moins pertinente. Ainsi, le niveau de précision du premier résultat est très élevé, puis l’ajout de chaque nouvelle compétence fait diminuer de quelques points de pourcentage le niveau de précision.

 

Toutefois, les résultats obtenus restent très acceptables jusqu’à 10 compétences. En effet, un tel échantillon permet de conserver un taux de précision moyen supérieur à 70%. Nous recommandons donc de limiter les requêtes à 10 compétences.

 

L’influence de ce facteur sur le niveau de précision des résultats obtenus n’est pas surprenante

 

À lire aussi : Mapping basé sur les compétences : dans quelle mesure est-il efficace ?

 

 

Le type de contenu analysé

 

Le type de contenu a une incidence sur le niveau de précision du mapping basé sur les compétences.

 

En effet, plus il y a de contenus et de compétences rapportés à chaque type de contenu dans les données d’entraînement, et plus la manière dont les contenus font référence aux compétences est explicite, plus celles sont faciles à identifier.

 

Dans le cadre de la formation par exemple, les performances du mapping fluctuent selon les domaines. Ainsi, le mapping des contenus de formation liés aux logiciels informatiques offre des résultats très précis. Cela s’explique notamment par le fait que les compétences techniques auxquelles les contenus font référence sont généralement exprimées de façon très explicites et il y a peu d’autres façons de le faire (ex : « maîtrise du langage de programmation Python »). De plus, ces contenus sont très nombreux, ce qui facilite leur identification par l’algorithme de mapping.

 

A contrario, le mapping des contenus de formation concernant les domaines de la santé et du bien-être donne lieu à des résultats moins précis. En effet, ils se rapportent généralement à des compétences plus génériques et des soft-skills qui peuvent être exprimées de façons très variées. Par exemple, on peut parler d’« empathie » ou d’« attention portée aux autres » pour désigner une même compétence, ou encore mentionner le « sens du collectif » ou la « capacité à être tourné vers les autres » pour faire référence à la même aptitude. De plus, les contenus de formation relatifs à ces domaines sont moins nombreux, leur identification est donc moins évidente pour l’algorithme.

 

 

La quantité de texte fournie

 

La quantité de texte fournie influence la précision du mapping basé sur les compétences.

 

De fait, une quantité minimale d’informations est nécessaire pour obtenir un mapping pertinent. Pour les contenus de formation par exemple, il est recommandé que les éléments fournis comportent au moins 20 à 30 mots.

 

En effet, nos observations ont montré que le niveau de précision du mapping augmente progressivement lorsque l’intitulé et le descriptif des formations comptent entre 1 et 20 mots. Puis, à partir de 30 mots, le niveau de précision se stabilise. Il n’augmente plus – même lorsque le contenu fourni contient des centaines de mots.

 

Toutefois, quelle que soit la quantité de texte fournie, moins les mots employés sont « communs », plus leur chance d’être dans les données d’entraînement est faible, et, par conséquent, plus la probabilité qu’une compétence ne soit pas identifiée correctement est élevée.

 

À lire aussi : Mapper et matcher les métiers et les compétences : les opportunités insoupçonnées

 

 

La langue utilisée

 

La langue fait partie des facteurs les plus importants qui conditionnent les performances du mapping basé sur les compétences.

 

Plus la langue est représentée dans les données d’entraînement, plus le modèle permet d’obtenir des résultats précis dans cette langue.

 

Ainsi, par exemple, si le modèle linguistique utilisé est BERT (développé par Google), l’algorithme a été entraîné sur de grands corpus de textes tels que Wikipédia. Dans ces données d’entrée, l’anglais est la langue la plus représentée, suivie des langues européennes (allemand, français, polonais, néerlandais, etc.) et des langues asiatiques comme le japonais ou le chinois. Le modèle est donc davantage entraîné dans les langues les plus représentées dans ces « données d’entraînement ». Par conséquent, le niveau de précision du mapping est généralement plus élevé dans ces langues.

 

Finalement, quels que soient les résultats escomptés, il est important de garder à l’esprit que plus l’ensemble de « données d’entraînement » est riche, plus le modèle est performant.

 

Pour en savoir plus sur les performances du mapping et du matching, découvrez notre livre blanc : « Skill-driven matching : 10 questions que vous vous posez peut-être sur le matching apprenants / contenus de formation »

Vous souhaitez en savoir plus sur l’extraction des compétences ?

Découvrez l'approche de Boostrs