Analyse de proximité sémantique
Utilisation de modèles d'embeddings linguistiques pour calculer la similarité conceptuelle entre termes. Les mots-clés proches dans l'espace vectoriel partagent un contexte sémantique et appartiennent au même cluster.
Les algorithmes de Word2Vec ou BERT transforment chaque mot-clé en vecteur numérique de haute dimension. La distance cosinus entre ces vecteurs quantifie leur proximité sémantique. Les termes ayant une distance inférieure à un seuil défini sont regroupés automatiquement. Cette approche capture les relations sémantiques que les méthodes basées uniquement sur des mots communs manqueraient complètement.