Recherche:Les chemins du langage/Degrés de différence entre les mots


Les chemins du langage

Toute réaction ou commentaire par rapport à ce travail de recherche sont les bienvenus sur cette page de discussion.

Cette page fait partie de l’espace recherche de Wikiversité et dépend de la faculté langues. Pour plus d'informations, consultez le portail de l'espace recherche ou rendez-vous sur l'index des travaux de recherche par faculté.


Description modifier

Si on ne considère que les sons très semblables, allophones ou encore ceux d’une langue prononcés avec la phonétique d’une autre (avec un accent), nous obtenons une nouvelle notion qui englobe plus que les homonymes et faux-amis officiels. Ce sont les "parahomonymes translingues".

Exemple : tonne en français et Ton en allemand ("son, ton, argile") se prononcent /tɔn/.

Mais aussi : cita /sita/ en français et città /ʧitˈta/ en italien ("ville").

La différence entre ces formes (homographe, homophone, faux-amis...) avec les multitudes de paronymes devrait donc être mesurée par des degrés. Outre la distance de Levenshtein, la dimension des différentes prononciation doit être prise en compte.

Degrés de différence modifier

En plus des différents lexèmes qui distinguent les mots (comme les faux-amis partiels et absolus), leurs graphies et leurs prononciations permettent d’établir une classification précise, permettant d'aboutir à la notion de degrés de "paronymie translingue".

Par exemple les noms français "librairie" /libʁɛʁi/ et anglais "library" /ˈlaɪbɹəɹɪ/ sont des faux-amis reconnus, ils ont trois lettres de différences (i, y, e), et six sons, mais seulement deux en regroupant les allophones (/i, ɪ/, /ʁ, r/) : /a/ et /ə/.

Ils sont donc qualifiés de paronymes multilingues de cinquième degré (3 lettres + 2 sons).

Fautes d'orthographe modifier

La gravité d'une faute d'orthographe peut se mesurer de la même façon.

Par exemple "courrir" est une erreur à la place de "courir", d'une lettre redoublée, son degré de fautes d'orthographe serait donc inférieur à celui d'une lettre différente, comme "maline" au lieu de "maligne".

Ceci permettrait de personnaliser les suggestions des moteurs de recherche par personne : des options de langue et/ou degrés de faute par recherche autoriseraient à retrouver des mots dont on ignore l'orthographe, sans se voir suggérer trop d'inutilités par la suite.

Nous considérons donc pour la suite des recherches que nous travaillons en degré de faute d'orthographe 0, et en degrés de paronymie translingue inférieurs à 10.