Quand et comment est apparue la parole humaine ?

⇧ [VIDÉO]   Vous pourriez aussi aimer ce contenu partenaire (après la pub)

Comment expliquer le langage, quelle est son origine ? Avant de produire des mots articulés, les humains ne produisaient que des grognements. La question de savoir comment ils en sont venus à parler a été mise de côté pendant la presque totalité du XXe siècle, suite à la déclaration de la Société linguistique de Paris, qui l’a bannie de sa constitution. Actuellement, tout un champ de recherches pluridisciplinaires tente de percer ce mystère. Effectivement, l’analyse de la parole révèle un phénomène extrêmement complexe. Un des grands axes théoriques étudie les interactions entre circuits neuronaux, mais aussi les interactions entre des individus. Récemment, un ouvrage scientifique de Philippe Barbaud, linguiste et professeur universitaire québécois de renom, qui a consacré sa vie à l’enseignement et à l’étude du langage, aborde ce sujet et tente de percer le mystère de l’origine de la parole, en analysant chaque étape, dont il présente ici les grandes lignes.

Pour ce linguiste, d’un point de vue rigoureusement évolutionniste, on ne peut dissocier le langage de l’anatomie et du comportement animal. La préhistoire de la parole est alors intimement liée aux transformations anatomiques qui ont affecté une espèce ancestrale de primate qui a vécu en Afrique quelque 2,5 millions d’années av. J.-C. Déterminée par l’adaptation, l’habitude de la station debout, inhérente à la bipédie ambulatoire, a entraîné des modifications irréversibles du tractus vocal, de la cavité bucco-pharyngée, ainsi que de la disposition spatiale du crâne et de l’encéphale. Ces transformations anatomiques et physiologiques et surtout psychiques vont provoquer chez les représentants les plus archaïques de l’espèce Homo, ou présapiens, une distorsion graduelle entre les réflexes largement innés de leur langage animal et une capacité nouvelle à produire des « phones orphelins ». De quoi s’agit-il ? Un phone orphelin est un son qui n’existe pas dans le « système de communication animale », comme le nomme Marc D. Hauser (1997), alors que l’évolution corporelle de ce primate ancestral lui permet d’en produire un ou davantage de manière plus ou moins délibérée. De tels phones ne font pas partie de sa « rengaine », ou répertoire habituel des signaux sonores qui caractérise le système de communication de chaque espèce animale.

D’ailleurs, ce répertoire immuable est tellement ancré dans le monde du vivant depuis longtemps que la langue française, comme l’explique Philippe Barbaud, possède un riche inventaire de mots pour désigner chaque rengaine spécifique, peu importe les espèces et l’environnement géographique. Ainsi, on reconnaît les vaches à leur beuglement, les chevaux à leur hennissement. Les ânes ne peuvent que braire alors que les cerfs et autres cervidés brament, outre les insectes qui stridulent ou grésillent comme le grillon, et ainsi de suite pour de nombreuses espèces d’animaux. Bref, la rengaine est aux animaux ce que le langage est aux humains. Ce qui sépare absolument les deux univers de la communication orale, c’est le sens, que seule l’espèce Homo a réussi à élaborer dans son esprit au cours de son évolution. Une telle évidence est parfaitement illustrée par la réponse que le psychologue Jean-François Le Ny (2005) apporte à sa question fondamentale : « À quoi sert le langage, sinon à produire du sens ? ». Le sens est donc ce qui a transformé l’instinct animal de la communication en faculté de langage. En définitive, on peut affirmer que l’homme est un primate qui a perdu sa rengaine.

Reste à comprendre comment et pourquoi des phones orphelins apparus au début avec l’Homo habilis et son descendant l’Homo ergaster, voire plus tard avec l’Homo erectus, vont devenir après bien des millénaires les phonèmes d’un parler quelconque. Or le sens a dû se développer au rythme d’une phonation à contrôler sur le plan neuromoteur et psychique. Il ne s’agit pas d’acquisition, mais bien d’invention. Autrement dit, une espèce de singe préhistorique a compris tout le potentiel du signe articulé en symbole — les mots — par rapport au signal oralisé de sa rengaine. Nous en mesurons de nos jours tout l’avantage sélectif que cette adaptation lui a procuré.

Portrait d’Homo habilis. © Adobe Stock

Dans son ouvrage, L’instinct du sens, une préhistoire de la parole (ISBN : 978-2-9570999-9-3), Philippe Barbaud expose une approche novatrice de l’histoire de la parole, en liant cognition, évolution et langage.

Évolution morphologique et parole

Le processus évolutionnaire qui a transformé les présapiens en sujets parlants est celui de l’exaptation, selon Stephen J. Gould et Elisabeth Vrba (1982). Dans leur cas, le processus d’exaptation a consisté à entreprendre le « bricolage » (F. Jacob) du tractus vocal en détournant les cordes vocales de leur fonction première, à savoir qu’elles étaient exclusivement dédiées à la fonction primitive du comportement sexuel de la reproduction. La phonation articulée deviendra cette nouvelle fonction. Les autres dispositifs de l’appareil bucco-pharyngé se sont adaptés à cette tâche puisque chez les animaux comme chez les humains, ils n’ont jamais cessé de remplir leurs fonctions premières, à savoir, comme le précise Alain Marchal (2007) « assurer la respiration (poumons, trachée, larynx, voies aériennes supérieures), permettre l’absorption et la mastication des aliments (lèvres, dents, langue) et assurer la déglutition (pharynx, épiglotte) ». En tout état de cause, si l’exaptation des cordes vocales en faveur de la phonation articulée n’avait pas eu lieu, les phones orphelins se seraient incorporés à leur rengaine de singe pour conférer plus de complexité à son code.

L’articulation de la parole s’est alors amorcée, il y a quelque 2.5 millions d’années, avec « la prise de conscience de soi par le corps » (A. Damasio, 2003), comme l’ont éprouvé les présapiens archaïques lorsqu’ils se sont mis à fabriquer un outil en pierre taillée appelé l’outil oldowayen pour, entre autres, dépecer le gibier. Dans le monde animal, se servir d’un outil n’est pas une nouveauté, même à cette époque. Pourtant, le geste répété qui consiste à heurter violemment deux pierres l’une contre l’autre en se servant des deux mains a dû être source constante de blessures, de douleurs, de plaies ensanglantées. Par conséquent, rien de très silencieux dans cette activité manuelle ponctuée de phones traduisant divers affects somatiques.

À l’origine des mots, les interjections

Comment l’acte de tailler une pierre pour en faire un outil aurait-il alors pu provoquer l’acte d’articuler des sons pour en faire des paroles ? Grâce au contrôle neuromoteur délibéré d’un phone orphelin traduisant un affect comme la sensation de douleur, ou celui d’une émotion comme la joie ou le dégoût. Or dans toutes les langues du monde, il existe ce qu’on appelle, en grammaire scolaire, des interjections. En français, le son [aj], que traduit le mot « Aïe ! », est un bon exemple du vestige de l’interjection primale fixée dans le noyau primaire de la conscience préhumaine, à savoir le « proto-Soi » — mis en évidence par le célèbre neurologue Antonio Damasio et son épouse (1995 et 1999).

D’endogène et purement subjective, parce que propre à l’individu, l’interjection primale monosyllabique va acquérir subséquemment un caractère exogène lorsque la conscience de l’Autre investira le psychisme d’un présapiens plus évolué. L’interjection vocative, qui sert à appeler son congénère ou à le prévenir, voire à le défier, s’ajoute à son répertoire choisi de phones mentalement « engrammés », c’est-à-dire inscrits dans la mémoire biologique de ses neurones (Gerald M. Edelman, 2000). À l’instar du « Pssst ! » des bandes dessinées, le son interjectif [oe], transcrit « Ohé ! » en français actuel, est aussi l’héritier de ce vestige préhistorique.

Dès lors que les interjections somatiques et vocatives se répandent par imitation, répétition et fixation au sein de certaines communautés de présapiens — probablement sous l’influence du mâle alpha — s’instaure dans l’entendement de nos lointains ancêtres le concept référentiel de la personne sur lequel est érigé le « circuit de la parole » (de Saussure). Parce qu’il requiert la compréhension mutuelle entre un émetteur et un récepteur, le circuit de la parole sera longtemps après, le socle de tous les systèmes linguistiques. Grâce au glissement de l’affect vers le concept référentiel, le Moi s’assimile au je, et l’Autre s’assimile au tu. En outre, ce qui n’est ni l’un ni l’autre appartient à l’univers de l’individu semblable incarné par le il de notre langue. Aussi doit-on comprendre le système actuel des trois pronoms personnels en français comme un autre héritage des concepts référentiels qui ont fait émerger le sens dans l’esprit-cerveau des hominiens.

Le règne des protolangages

Mais nous sommes encore loin de la parole accomplie de l’Homo sapiens. Comme de fait, l’engrammation de phones orphelins monosyllabiques dans la mémoire auditive de présapiens quelque peu évolués ne marque pas encore l’avènement du véritable signe linguistique, tel que de Saussure l’a théorisé.

faces signe linguistique saussure
Les deux faces du signe linguistique selon Saussure. © Wikipédia

La longue période interjective qui marque la préhistoire de la parole évoluera qualitativement vers un usage strictement référentiel des phones monosyllabiques. Une masse de vocables porteurs d’un référent patronymique ou toponymique verront le jour pour former des nomenclatures de plus en plus élaborées de noms propres désignant les lieux et les individus. C’est le règne des proto-langages faits de vocables porteurs d’une référence directe. Mais un vocable strictement référentiel et arbitraire n’est pas une réalisation complète du signe linguistique parce que la désignation n’est pas la dénotation (ou signification), comme le philosophe américain Saul Kripke (1972) l’a bien montré. En effet, le sens référentiel ne se confond pas avec le signifié jumelé à un signifiant audible, comme c’est le cas des noms propres (patronymes et toponymes). C’est Ferdinand de Saussure qui a théorisé le couple signifiant/signifié du signe linguistique. Par exemple, si la monosyllabe [ʒɑ] désigne l’individu « Jean », elle ne dénote pas et ne signifie rien du tout (sauf par savoir étymologique). Il en va de même du son [po] qui correspond à la ville de « Pau ». Bref, l’appellation n’est pas la dénotation.

En revanche, si un francophone entend la série suivante de mots transcrits en symboles phonétiques : / bal /, / bɔl /, / bɥl /, / bɛl /, / bil /, il saura reconnaître au moins cinq mots différents de sa langue transcrits respectivement en bal, bol, bulle, belle et bile, parce chacun s’oppose aux autres par leur unique voyelle, les deux consonnes restant les mêmes.

De phonétiques qu’ils étaient, les phones orphelins vont devenir de véritables unités phonologiques lorsque l’acte de désignation sera supplanté par l’acte de dénotation. Le sens ne sera plus seulement référentiel ; il deviendra descriptif dans son signifié, c’est-à-dire susceptible d’une définition lexicale, un peu comme dans un dictionnaire. Ce sens va donc servir à nommer, et non plus appeler, les objets du monde réel. Ce sera l’insigne invention du mot avec la création du nom commun monosyllabique. C’est pourquoi le règne des vocables interjectifs et dénominatifs au cours de la préhistoire de la parole a fait prendre conscience aux présapiens évolués du « caractère discret » inhérent aux phonèmes, dès lors que ceux-ci furent assez nombreux et répandus dans diverses tribus pour construire les premiers vocabulaires en paradigmes (classes) lexicaux de la parole. En considérant les actes de désignation et de dénotation comme distincts en regard de la phonation lexicale, le schéma qui représente le mieux la structure complète du signe linguistique devient un triangle sémiotique revisité, dans lequel la position dominante accorde la primauté à la phonation émergente, et où les pointillés indiquent une relation facultative entre leurs extrémités (Ch. K. Ogden et I. A. Richards, 1946). Aussi ce schéma illustre-t-il comment un objet de parole comme le mot est engrammé mentalement dans la mémoire lexicale d’un locuteur, fût-il préhistorique.

triangle semiotique
Le triangle sémiotique inspiré d’Ogden & Richards, 1946. © P. Barbaud

La parole vue comme un jeu de construction

La stabilisation de quelques phonèmes dans chaque tribu éparse de l’Afrique ancestrale est implacablement liée à la pérennité de sa population pour que les vocables monosyllabiques se transmettent d’une génération à l’autre sur le long terme avant qu’un véritable lexique puisse prendre corps. Mais plus ils s’accumulent, plus la mémoire animale va saturer dans un encéphale de 800 cm3. Aussi, la nomenclature s’avère-t-elle insuffisante pour satisfaire le besoin impérieux de nommer les choses, car le sens devient vite une addiction intellectuelle, c’est-à-dire un insatiable instinct de la cognition. Or l’Homo erectus aime comprendre son univers. Pour se libérer de cette contrainte, son intelligence encore animale invente une « tournure d’esprit ». Celle-ci consiste à associer deux vocables monosyllabiques, d’abord par simple répétition, comme aujourd’hui encore dans dodo, bobo, lolo, papa, tata, caca, pipi, toutou, ronron, etc., puis par simple addition (ou concaténation) de vocables monosyllabiques. Cette syntaxe rudimentaire du protolangage est capable de générer des centaines de noms communs bisyllabiques et même polysyllabiques. C’est donc l’effet amplificateur du vocabulaire dénotatif qui a stimulé la croissance de la capacité mémorielle des présapiens, avec pour conséquence une augmentation graduelle de la masse de l’encéphale.

Finalement, le changement de culture qui s’opère au cours du Paléolithique entre l’odowayen, qui a duré 1,5 million d’années sans évoluer, et les industries de l’acheuléen puis du moustérien qui lui ont succédé, permet d’envisager, au cours de cette période, un changement de la tournure d’esprit langagière des présapiens évolués. Ils vont perfectionner la combinatoire originelle en associant deux mots, et non plus deux syllabes. Ce sera le règne de la composition lexicale si propice à l’élaboration de catégories lexicales (paradigmes), comme dans les exemples suivants de mots composés en anglais :

tableau mots anglais
Exemple de mots composés en anglais. © P. Barbaud

Soyons clairs sur ce point : savoir combiner deux noms communs, peu importe dans quel ordre, c’est savoir faire de la syntaxe. La récursivité lexicale s’inscrit alors durablement dans la mémoire profonde de l’esprit-cerveau, permettant au lexique de stimuler le développement neuro-cérébral de l’encéphale. Cette tournure d’esprit paradigmatique va façonner la mémoire profonde jusqu’à la conquête du feu, vers ± 500 000 ans av. J.-C. L’humain remplace le singe. Les premiers Homo sapiens vont alors développer une autre tournure d’esprit en accomplissant un nouvel acte conceptuel, celui de la prédication. De paradigmatique qu’elle était, cette nouvelle tournure d’esprit devient grammaticale. Dès lors, le protolangage disparaît. Grâce au savoir intériorisé d’unir deux mots dans une même entité mentale et sonore, ils deviendront capables d’unir un verbe et son sujet dans le flux continu du binôme de la phrase intransitive. Nos langues modernes conservent toujours ce témoin de la parole préhistorique.

L’étape suivante de la spéciation grammaticale de l’espèce Homo sera marquée par l’avènement de la prédication transitive, c’est-à-dire l’union d’un binôme et de son complément (objet direct). Puis les millénaires se succédant, les mots subiront l’outrage du temps et de l’usage selon les populations et leurs parlers. L’usure des mots fera son œuvre. Des artefacts linguistiques tels que les morphèmes (préfixes, suffixes, etc.) feront leur apparition, dotant les parlers de divers mots-outils (prépositions, conjonctions, etc.) permettant de déployer la récursivité de catégories abstraites. Ce n’est donc plus la parole ancestrale qui détermine l’état actuel de la faculté de langage, mais bien la langue dotée d’une grammaire. C’est elle qui confère à l’Homo sapiens le potentiel de matérialiser par quelques sons tout le sens que son esprit peut concevoir à l’infini.

Interview de Philippe Barbaud : comment le langage est-il venu à l’Homme ? :

Quand et comment est apparue la parole humaine ?