23.09.2021

Blog

Boostrs

Revenir en arrière

IA et RH : À quoi servent les techniques de NLP ? (partie 1)

En traduisant les textes de leurs fiches de poste, leurs contenus de formation ou même les CV de leurs candidats en compétences, les organisations peuvent accéder à une grille de lecture claire reliant l’ensemble de leurs processus RH entre eux, et leur permettant de mener des actions plus pertinentes. Pour optimiser l’analyse et la gestion de ces contenus RH, le Natural Language Processing (NLP) joue un rôle essentiel. Zoom sur les principales techniques de NLP utilisées dans ce cadre.

 

 

NLP : définition

 

Le NLP pour Natural Language Processing, ou traitement du langage naturel en français, est une branche de l’intelligence artificielle qui s’intéresse au langage humain. Mêlant linguistique, informatique et IA, le NLP a pour but de rendre compréhensible le langage écrit ou parlé aux machines. Il s’appuie sur des algorithmes d’analyse syntaxique et sémantique permettant aux machines de comprendre le langage humain mais aussi de le manier et le générer.

 

→ Bon à savoir

L’analyse syntaxique permet de mettre en lumière la structure d’un texte, tandis que l’analyse sémantique permet d’obtenir la signification d’une phrase dans un contexte.

 

 

À Lire aussi : nos articles dédiés à la data science

 

 

Comment fonctionne le Natural Language Processing ?

 

 

→ Les méthodes de prétraitement du langage naturel

 

Une phase de prétraitement des informations à analyser est souvent nécessaire avant de recourir aux techniques de NLP. Cette étape préparatoire permet de transformer les contenus bruts (le texte de la fiche de poste, du descriptif de la formation ou du CV du candidat) en données exploitables par les ordinateurs.

 

Les méthodes appliquées pour ce travail préparatoire varient en fonction de la nature des données fournies. Il est parfois nécessaire de séparer les mots d’une phrase en plusieurs parties appelées « tokens », de ne garder que la racine des mots (stemming), ou de simplement retirer la ponctuation, les chiffres, etc.

 

À lire aussi : Données structurées et non structurées : de quoi s’agit-il ?

 

 

→ Les méthodes de traitement du langage naturel

 

Il existe trois principales approches de traitement du langage naturel : les méthodes basées sur des règles spécifiques, les techniques de machine learning et les techniques de deep learning.

 

1. Les méthodes basées sur des règles spécifiques

 

Ces méthodes consistent à établir des règles en fonction des données exploitées et du but de l’analyse. Elles peuvent être utilisées pour résoudre des problèmes simples comme l’extraction de données structurées à partir de données non structurées. Par exemple, les méthodes basées sur des règles permettent d’identifier les parties d’un CV concernant la formation ou les expériences professionnelles d’un candidat à partir de mots-clés.

 

2. Les techniques de machine learning

 

Le machine learning, ou apprentissage automatique, est une branche de l’intelligence artificielle qui regroupe les techniques permettant aux machines d’apprendre des données avec pas ou peu d’intervention humaine. On distingue ainsi deux types d’apprentissage automatique :

 

  • l’apprentissage automatique supervisé:
    Dans le cadre de l’apprentissage automatique supervisé, on connaît déjà le résultat à obtenir. Le but est d’apprendre à l’algorithme à reconnaître les données pour pouvoir ensuite associer de nouvelles données à des données préalablement identifiées. Par exemple, ce type d’apprentissage automatique permet d’associer un nouvel intitulé de poste à un métier déjà identifié.

 

  • l’apprentissage automatique non supervisé:
    Dans le cas de l’apprentissage automatique non supervisé en revanche, on ne connaît pas encore le résultat que l’on va obtenir. Ainsi, le clustering, par exemple, a pour but de grouper les données en catégories mais sans savoir au préalable à quoi ces catégories correspondent, ni leur nombre.

 

Les techniques de machine learning ont besoin d’un grand nombre de données pour être performantes. Plus la quantité de données fournies à l’algorithme est grande, plus celui-ci s’améliore. Toutefois, une des limites du machine learning est qu’il dépend de la qualité et de la quantité des données d’apprentissage. De plus, la plupart de ces techniques finit par ne plus s’améliorer avec le volume de données. Ce n’est pas le cas des techniques de deep learning.

 

 

3. Les techniques de deep learning

 

Le deep learning, ou apprentissage profond, est une sous-catégorie du machine learning qui utilise des réseaux de neurones artificiels pour simuler le fonctionnement du cerveau. Comme les réseaux de neurones dans le cerveau, les réseaux de neurones artificiels sont structurés en plusieurs couches de neurones successives. Plus le nombre de couches est important, plus le réseau est dit profond.

 

 

Les techniques de deep learning ne nécessitent pas d’identifier à l’avance les caractéristiques à rechercher dans les données, l’algorithme est capable de les identifier de lui-même. Ces techniques sont particulièrement utilisées dans l’analyse de données non structurées telles que les données textuelles. Les meilleurs résultats obtenus actuellement en NLP le sont grâce à des techniques de word embedding, ou prolongement lexical en Français, qui utilisent des réseaux de neurones artificiels complexes.

 

Au sein des ressources humaines, les techniques de deep learning permettent notamment d’extraire des compétences à partir de contenus de formations, de CV ou encore de descriptions de postes.

 

Pour leur apprentissage, les modèles de deep learning requièrent des volumes encore plus importants de données que le machine learning, mais, contrairement à lui, ils continuent de s’améliorer avec l’ajout de nouvelles données. Par ailleurs, l’une des principales limites du deep learning est la puissance de calcul nécessaire aux réseaux de neurones.

 

Pour en savoir plus sur les applications concrètes du NLP afin de répondre à certains des principaux enjeux RH, découvrez la deuxième partie de l’article.

Vous souhaitez en savoir plus sur l’analyse des métiers et des compétences ?

Découvrez toutes nos APIs

Crédits illustration : https://www.istockphoto.com/fr/portfolio/VladPlonsak