Comment classe-t-on les langues dans le monde ?

langue japonaise

La méthode de classement la plus courante

Il n’existe pas de classement universel parfait des langues, tant elles sont nombreuses et variées. La méthode la plus utilisée consiste à reconstituer, pour chaque langue actuelle, une langue ancestrale commune. On parle alors de familles de langues, organisées comme un arbre généalogique. Le français et l’espagnol, par exemple, appartiennent à la famille des langues romanes, issues du latin. Les langues romanes, elles-mêmes, sont intégrées à une famille encore plus vaste, celle des langues indo-européennes, qui regroupe aussi de nombreuses langues slaves, germaniques ou certaines langues de l’Inde. Dans ce cas, la langue « mère » indo-européenne n’est pas attestée directement : elle est reconstruite par les linguistes à partir de comparaisons.

Les approches typologiques

À côté des familles généalogiques, certains linguistes préfèrent des classements plus techniques, fondés sur la structure des langues. On parle alors de typologie. Les langues sont regroupées selon des critères comme l’ordre des mots dans la phrase, la façon de former les mots ou le nombre et le type de sons utilisés. Une distinction classique oppose par exemple les langues flexionnelles (comme le français, l’allemand ou le russe), qui modifient la forme des mots pour marquer le rôle grammatical, les langues isolantes (comme le chinois), où les mots varient peu et où l’ordre des mots est essentiel, et les langues agglutinantes (comme le turc ou le hongrois), qui ajoutent des affixes successifs pour exprimer les nuances de sens.

Les langues dites « isolées »

Certaines langues restent très difficiles à rattacher à une famille clairement identifiée. On parle alors de langues isolées. C’est le cas du basque en Europe, du sumérien dans l’Antiquité, ou encore du nihali en Inde et du bourouchaski au Pakistan. Malgré de nombreuses recherches, aucune parenté solide n’a pu être démontrée avec d’autres langues, ou bien les liens supposés restent trop incertains pour faire consensus.

Combien existe-t-il de grandes familles de langues ?

Les linguistes recensent aujourd’hui plusieurs grandes familles, chacune pouvant être subdivisée en de nombreuses sous-familles. Certains ensembles sont relativement compacts, d’autres extrêmement morcelés. Les langues aborigènes d’Australie, par exemple, sont réparties en plusieurs sous-familles et langues isolées, malgré un nombre de locuteurs très réduit. Les langues amérindiennes constituent, elles, un ensemble particulièrement fragmenté, avec plusieurs dizaines de familles distinctes à l’échelle du continent.

Les familles les plus représentées en nombre de locuteurs

Les langues les plus parlées au monde ne relèvent pas toutes de la même famille, mais quatre ensembles dominent. Le chinois mandarin appartient à la famille sino-tibétaine. L’anglais, l’espagnol, le français, le portugais, le russe, l’hindi ou le bengali sont rattachés à la famille indo-européenne. L’arabe se situe dans la famille afro-asiatique. Le japonais, lui, constitue avec le ryukyu un petit ensemble souvent appelé famille japonique. À elles seules, ces grandes langues regroupent plusieurs milliards de locuteurs natifs.

Une diversité très inégale selon les régions

La diversité linguistique n’est pas répartie de manière homogène à la surface du globe. Certaines zones, comme le Mexique, l’Afrique centrale, l’Inde, l’Asie du Sud-Est ou l’archipel indonésien, concentrent un nombre très élevé de langues sur un territoire relativement restreint. La Papouasie-Nouvelle-Guinée est souvent citée comme un cas extrême, avec plusieurs centaines de langues pour quelques millions d’habitants. À l’inverse, l’Europe, la Russie, le nord de l’Afrique ou l’Amérique du Nord présentent une diversité linguistique plus faible, souvent en raison de longues histoires d’unification politique, culturelle ou coloniale.

Langue ou dialecte : une distinction moins simple qu’il n’y paraît

Dans le langage courant, on appelle souvent « dialecte » une variété locale d’une langue. En principe, deux dialectes d’une même langue restent largement intercompréhensibles à l’oral, même si l’accent, certains mots ou tournures diffèrent. La notion de « langue » dépasse toutefois la seule compréhension mutuelle : des critères historiques, politiques, démographiques ou socio-économiques entrent en jeu. C’est pour cela, par exemple, que l’occitan et le catalan sont classés comme deux langues distinctes, alors que leurs locuteurs peuvent souvent se comprendre assez facilement.

Un paysage linguistique en mouvement

Le nombre de langues dans le monde n’est ni fixe, ni figé. Les langues évoluent avec les populations qui les parlent. Certaines s’éteignent lorsqu’elles ne sont plus transmises, d’autres se différencient progressivement jusqu’à former de nouvelles langues à part entière, comme ce fut le cas des langues romanes issues du latin. De nombreuses langues restent mal décrites ou non répertoriées, notamment lorsqu’elles ne disposent pas de tradition écrite. Il arrive aussi que de nouveaux systèmes linguistiques émergent à la frontière de plusieurs langues, dans des contextes de contact intense, donnant naissance à des créoles ou à des variétés mixtes. Le classement des langues est donc une photographie toujours partielle d’une réalité en perpétuel mouvement.