INTRODUCTION

"Tout le monde ne sait pas douter:

On a besoin de lumière pour y parvenir

et de force pour s'en tenir là"

Fontenelle

"Skeptical scrutiny is the means in both science and religion,

by which deep insights can be winnowed from deep nonsense"

Carl Sagan, Time Magazine, 20 Oct. 1980, p. 62

Il est venu à l'idée de plus d'un curieux que la manière de trouver une réponse à de multiples questions est de l'élaborer soi-même. C'est également ainsi que sont nés tant d'ouvrages scientifiques qui ont eu pour but premier de satisfaire la curiosité de leurs auteurs. C'est ainsi qu'est né le présent ouvrage. Dans l'impossibilité de trouver dans les dictionnaires une explication satisfaisante de la signification des noms d'oiseaux, il a bien fallu que je fasse mes propres recherches. Hirondelle vient du latin hirundo, dit-on. Mais encore ? Les Romains ont-ils inventé ce nom ? Le dernier mot a-t-il été dit par Varron qui affirme que ce nom est une onomatopée ? Ne peut-on sortir de cette ornière ? Aigle vient du latin aquila: est-ce là une explication suffisante ? Pour d'aucun peut-être; pour le curieux, certainement pas. En ce qui concerne les langues romanes en particulier, les dictionnaires ne remontent qu'à un prédécesseur latin. Or il s'avère qu'en allant au fond des choses, on découvre qu'il devient presque impossible de dégager d'un groupe de mots une racine "latine", mais que presque toutes les racines que l'un a dites "latines", "germaniques" ou autres sont en fait communes à tous les grands groupes de langues européennes et parfois même extra-européennes. Certes, bien des linguistes l'ont déjà dit avant moi, de Pictet (1859) à Pokorny (1959) en passant par Carnoy (1955) et bien d'autres. Alors pourquoi reprendre ce qui a déjà été dit avec tant de compétence ? Ce que je présente ici aux chercheurs et aux curieux, c'est un chemin vers l'origine du lexique européen par une autre voie. Une méthode simple, si faire se peut, dans cette branche difficile et fort débattue de la linguistique. Dans ce but, j'ai commencé par répertorier les noms d'oiseaux et leurs variantes en plus de 30 langues. Ce recueil comprend maintenant plus de 100'000 dénominations sans compter quelque 8'000 noms dans les parlers espagnols, portugais, créoles et amérindiens d'Amérique hispanique. Outre les langues européennes, j'ai également inclus les langues iraniennes, caucasiennes et chamito-sémitiques. La raison pour ce faire est que l'aire couverte par ces langues couvre la région paléarctique, une entité zoogéographique dans laquelle sont distribuées la plupart des espèces d'oiseaux européens, soit environ 450 espèces.

Pourquoi les noms d'oiseaux ?

Etant ornithologue, ma curiosité fut naturellement portée sur la signification de leurs noms. L'étude de la sémantique des noms d'oiseaux nécessite une bonne connaissance des oiseaux dans la nature et une sensibilité pour les parlers des gens qui ont nommé ces oiseaux. J'ai eu le privilège de passer ma jeunesse en contact étroit avec la nature, acquérant une connaissance intime des oiseaux et de leurs moeurs. L'ornithologie a ensuite été mon activité professionnelle pendant 11 ans. Mon intérêt pour la linguistique a accompagné toutes mes activités. Enfant, j'ai parlé le dialecte des gens qui m'entouraient.

La plupart des espèces d'oiseaux se retrouvent dans l'aire commune à toutes les langues concernées, et leurs caractères sont restés inchangés depuis que l'homme les a connus. Les oiseaux sont donc des points de référence communs qu'il convient de mettre en relation avec les mots qui les désignent. Ces caractères sont aussi plus faciles à déterminer que ceux, par exemple, des espèces végétales. Les raisons de ce choix sont aussi d'ordre biologique et éthique. Les oiseaux se distinguent des autres animaux par leurs cris et leurs chants et par le grand intérêt que les hommes leur témoignent. Les noms d'origine acoustique forment ainsi une bonne partie de leurs dénominations.

Comment ont été nommés les oiseaux

La désignation du monde ailé date de la nécessité, qui va de pair avec la naissance du langage, de nommer les choses. Les oiseaux ont d'abord été désignés par un terme général: Ce qui vole, ce qui chante, ce qui est emplumé. On a ensuite distingué certains groupes: Ceux qui nagent ou plongent (ente, duck), ceux qui capturent (hawk, rapaces), puis, lorsqu'il devint nécessaire de distinguer les espèces: celui qui est noir (merle, blackbird), bariolé (meise, mésange), celui qui agite la queue (wagtail, hochequeue).

Il n'est pas toujours simple d'établir la relation entre un mot et l'une des caractéristiques de l'oiseau. Seuls les recoupements effectués sur une vaste aire géographique et de nombreuses langues permettent un travail rigoureux.

Souvent seul le mot est resté en usage tandis que le sens du qualificatif a été oublié: plomb, palombe, colombe sont nommés d'après leurs couleurs tandis que le nom de couleur est resté à l'état résiduel dans les parlers régionaux, voir appendice ð3.1.39.1. La Pie est bien connue en France mais le mot pie désignant la couleur n'est plus guère employé tandis qu'il est resté bien vivant en anglais. Dans le slave netopyr "chauve-souris" on reconnaît encore l'albanais natë "nuit" comme dans le slave nemec "allemand" on reconnaît l'italien nimico "ennemi"; de même gluxar, nom slave de plusieurs oiseaux qui gloussent (mais qui sont loin d'être sourds, le sens slave actuel du mot); dans le slave slonka "bécasse, courlis" on perçoit le sens de "long" (cf. angl. lanky), allusion au long bec de ces espèces. Il y a donc persistance des noms d'animaux, d'objets, en même temps qu'un remplacement des qualificatifs, ceux-ci étant indispensables à la communication avec le peuple dont la langue est devenue dominante (superstrat).

Mais rappelons ce qu'a dit Auguste Briton: "Il n'y a pas de différence de nature entre langues et dialectes mais plutôt une différence de destinée. Une langue est un dialecte qui a réussi". Ce n'est nullement une raison pour négliger les parlers régionaux, bien au contraire. Pour ma part, je ne fais aucune différence entre langues et dialectes. Dans cette étude, toutes les langues sont considérées comme des parlers à niveau égal, à cette différence près que les emprunts sont beaucoup plus rares dans les dialectes, ce qui les rend d'autant plus fiables. C'est précisément dans cet ordre d'idée que j'ai utilisé le terme "régional" au lieu de "patois", à valeur dépréciative, ou de "dialecte", à connotation d'infériorité. Il convient d'ajouter ici que la plupart des mots recueillis dans les parlers locaux sont aussi anciens que ceux attestés dans les langues dites anciennes. Nous n'en avons pas la preuve écrite, mais ce fait ressort clairement de leur étude.

Pour les besoins de cette étude, il a été nécessaire de distinguer les noms imitatifs ou onomatopées proprement dites qui sont assez peu fréquentes, et les noms expressifs d'origine acoustique. Ainsi coucou est une onomatopée parfaite, mais gowk ou geguza ne le sont plus quoiqu'ils soient d'origine acoustique. Tordo, buse, milan, filomèle sont des mots expressifs d'origine acoustique sans être des onomatopées ou imitations. Il convient encore de distinguer les mimologismes, appellations dont l'orthographe ou la prononciation a été modifiée pour ressembler à un nom ayant une signification: tant endurmi, philippe, jack, jacob, markolf, louis, bernard, maria, margot, margarita, ivan, charlo, gérardine, bertrand, claude, aubin, patrick, isaac. Il en résulte une relation entre la voix ou un certain caractère de l'oiseau et un élément d'articulation semblable: ce sont des mimologismes. Ce phénomène s'est aussi manifesté dans d'autres domaines en écrivant ces noms de manière à leur donner une signification apparentée par étymologie populaire: à tue-tête rac. t-t, voir appendice ð5.29.1., beaucoup rac. b-k ð4.5.23.1., saint-guy rac. s-g ð6.3.10.1, pot-pourri rac. p-p ð6.2.23., bout-de-z'en rac. p-dz ð9.2.2.. Toutes les explications données à ces noms ont été vouées à des échecs car on a voulu y voir des métaphores ou des définitions basées sur leur orthographe au lieu de déterminer la racine du mot parlé et d'en rechercher la catégorie (acoustique etc.). La métonymie, c'est-à-dire le fait de nommer un objet, un fruit etc. d'après un lieu (cf. damas ð3.3.14.11.) ou une personne est presque inexistante parmi les noms d'oiseaux (exceptions: dinde, turkey, espèces importées) et rare ailleurs. C'est aussi un phénomène relativement récent.

Il n'est pas mon intention de discuter de la multitude d'étymologies fantaisistes ou mort-nées comme on les a aussi appelées. Les réfuter chacune aurait par trop allongé cet ouvrage. Pour justifier leur raisonnement, certains auteurs veulent voir dans un nom des caractères que l'oiseau n'a pas, ou dénient à celui-ci des caractères qu'il possède. Afin que le lecteur comprenne mon attitude à ce sujet, je citerai quelques exemples, parmi les plus récents (il ne serait guère flatteur pour leurs auteurs de les nommer):

Le catalan gruneta "hirondelle" serait formé de grua (grue) + oroneta (hirondelle) et ogroneta formé de agro (héron) + oroneta. L'esp. garza aurait été donné au héron parce qu'il a les yeux bleus (c'est faux). Le cat. xerxet "sarcelle" viendrait de cerco parce que cet oiseau a "ein blauer Ring um die Augen" (c'est faux). Le canard serait appelé en slave patka parce qu'il fait pat pat, le dindon puta parce qu'il fait put put! Le courlieu serait ainsi appelé "parce qu'il court les lieux". Le martin-pêcheur aurait été nommé ainsi parce qu'il vole comme le martinet (faux), ou encore aurait-il été nommé d'après le dieu Mars parce qu'il est connu par la bravoure et l'audace avec lesquelles il plonge sur les corbeaux, les faucons et les aigles (!). La bergeronnette serait appelée en esp. aguanieve parce qu'elle vit dans l'eau et que son ventre est blanc de neige, et aguzanieve (par ce même auteur) "avecilla que en días de nieve, busca debajo de esta con su pico aguzado los gusanos y semilla de que se alimenta". Et quelques perles: picus serait le masculin de pica, grolle serait la femelle de la corneille et chouette la femelle du hibou (bien malin qui les différencierait). Citons enfin Gaiera qui réussit à faire dériver le basque txori "oiseau" d'un latin hypothétique avicella !

On a trop souvent essayé de voir un rapport entre deux noms d'oiseaux - n'importe quels oiseaux - pourvu que ces noms répondent aux "exigences de la phonétique". Deux noms d'oiseaux ne sont pas nécessairement apparentés parce qu'il répondent à ces "exigences".

Ce travail n'est pas un recueil de bizarreries étymologiques (déjà conservées pour la postérité dans les dictionnaires!). Je me dispenserai donc d'élucubrations et répondrai par argumentum ex silencio, tout en proposant une explication sémantique raisonnable et logique. Ceci implique que j'ai eu connaissance de toutes ces "étymologies" et qu'elles sont réfutées tacitement dans les paradigmes.

Outre les noms d'origine acoustique, chromatique ou cinétique, les oiseaux ont été nommés par des caractères extérieurs à eux-mêmes: Selon les lieux qu'ils fréquentent, leur habitat: les prés, les buissons, les rivages etc.; d'après leurs habitudes: sont-ils des nageurs ? D'après leur nourriture: vivent-ils de graines, de poissons, de volaille ? D'après les lieux où ils nichent: dans des cavités, au sol, sous les toits ? En fonction de la forme de leur nid: sphérique, maçonné, tissé ? D'après divers autres caractères: sont-ils de passage, arrivent-ils à une époque donnée, proviennent-ils d'une certaine région?

Qui a recueilli les noms d'oiseaux ?

Ce sont d'abord les ornithologues qui étaient en contact avec les gens de la terre et qui, non-spécialisés, s'intéressaient encore aux divers aspects de l'ornithologie. C'était la meilleure source, car il étaient capables d'appliquer à la bonne espèce le nom qu'ils recueillaient, réserve faite toutefois des erreurs d'attribution dont il est question ci-après. Ce sont ensuite les dialectologistes qui ont un don pour déceler des noms très anciens, peu usités et connus seulement par des populations isolées. Cependant l'attribution du nom à l'espèce est souvent très incertaine. Ceci se remarque tout particulièrement dans les atlas linguistiques.

Une des méthodes utilisées consiste à se servir de noms existant dans des recueils et de les faire prononcer ou même traduire par des témoins, ce dont je soupçonne certains enquêteurs d'avoir fait. Cette méthode est certes très fructueuse car elle permet d'obtenir de nombreuses variantes, mais elle manque d'authenticité: Ni l'enquêteur ni les témoins n'ont besoin de connaître l'oiseau en question ou même de savoir si l'espèce se trouve dans la région étudiée !

Afin de récolter des noms et d'éliminer autant que possible les erreurs d'attribution, il est nécessaire de connaître soi-même l'oiseau, son chant, ses divers cris d'appel, ses couleurs et leur disposition (pattern), sa forme, son habitat, sa manière de nicher. Des erreurs subsisteront toujours et il vaut la peine d'examiner certaines d'entre elles.

Erreurs d'attribution des noms et leurs causes

Tout au long de cette compilation on trouvera, entre crochets, à la fin de chaque langue, quelques noms dont l'attribution est erronée. Une des causes d'erreur d'attribution, et celle qui est devenue la plus fréquente, consiste à recueillir le nom puis de chercher dans un ouvrage ornithologique à quelle espèce ce nom doit être attribué. C'est ainsi que les noms du Roitelet (nom scientifique Troglodytes troglodytes) ont très souvent été attribués à Regulus que Cuvier avait donné à un tout autre oiseau; que Calandra a été attribué à l'Alouette calandre (nom scientifique Calandra), et Calandrella à l'Alouette calandrelle (nom sc. Calandrella) alors que ces noms et leurs variantes se rapportent tous à l'Alouette des champs (Alauda arvensis).

Il est important de rappeler ici que les premiers naturalistes, y compris Linné qui recevait en Suède ses peaux d'oiseaux, ne pouvaient attribuer avec précision les noms qui leur étaient communiqués par plusieurs intermédiaires. Leur conception du genre était en plus différente de celle d'aujourd'hui. Ainsi Linné donna le nom de Motacilla à plusieurs espèces aujourd'hui classées dans les genres Anthus, Oenanthe, Saxicola, Phoenicurus. Ceci explique pourquoi les noms de la bergeronnette (aujourd'hui seule à porter le nom générique de Motacilla) ont été attribués à ces diverses espèces par ceux qui utilisaient la nomenclature de Linné. Autres noms de genres ou d'espèces dont l'attribution en ornithologie a été faite incorrectement:

Regulus, anglais Goldcrest, est la traduction en latin de Roitelet

Puffinus, anglais Shearwater, est un nom de Fraterculus, angl. Puffin

Picus martius "Pic noir" est un nom du Pic épeiche Picoides major

Passer montanus devait être un nom du Pinson du Nord et non du Moineau friquet qui ne se trouve justement pas dans les montagnes

Porzana "marouette" est un nom du Râle d'eau Rallus aquaticus

Turdus musicus est un nom de la Grive musicienne, aujourd'hui Turdus philomelos mais avait été donné par confusion à la Grive mauvis.

Sylvia hortensis "Fauvette orphée" décrit la Fauvette des jardins Sylvia borin

Saxicola indique qu'il s'agit du Traquet motteux, aujourd'hui Oenanthe

Sylvia curruca devait être un nom de la Fauvette grisette, Sylvia communis.

Les confusions les plus fréquentes sont celles des noms spécifiques d'espèces souvent assez semblables appartenant à un même genre: Litorne et mauvis sont des noms de la Grive musicienne.Bruant et tarin sont des noms du Verdier. Courlieu est un autre nom du Courlis cendré. Verderolle est un nom du Contrefaisant. Bécassine sourde est un autre nom de la Bécassine des marais. L'italien balestruccio attribué à l'hirondelle de rivage, est un nom du Martinet. L'allemand Buchfink attribué au Pinson des arbres est un nom du Pinson du nord, hôte caractéristique des forêts de hêtres (all. Buche), etc. La confusion est particulièrement grande parmi les rapaces, surtout depuis l'ère de la fauconnerie alors que tant de scribes en relataient les faits et gestes; elle est aussi considérable parmi les chouettes, oiseaux que l'on entend mais que l'on ne voit pas, parmi les limicoles (courlis, bécasse, bécassines, bécasseaux, râles, chevaliers, gravelots), et parmi les canards, les mouettes et les goélands. Le fr. hobereau, angl. hobby sont en réalité des noms de la Buse; franç. émerillon, angl. merlin sont des noms de l'Epervier; faucon, épervier sont des noms collectifs pour tous les petits rapaces; aigle, aquila sont des noms collectifs pour les rapaces, en général les plus grands; l'all. geier est un nom collectif pour plusieurs rapaces, en particulier l'Autour mais ne doit pas se traduire par "vautour", espèce qui n'existe pas dans les pays germanophones.

Je ne ferai pas mystère de mon dédain pour ces calques qui foisonnent dans les écrits ornithologiques, tels que "ardée botaure" (pour l'ancien Ardea botaurus) ou "sylvie currique" (pour Sylvia curruca). De telles inventions, inutiles autant qu'irritantes ont été ressuscitées dans l'ouvrage de Livory (1985) qui, je m'empresse de le souligner, n'est pas l'auteur de ces calques.

Certains de ces calques sont encore en usage aujourd'hui, malheureusement: troglodyte (pour le Roitelet qui dans les pays francophones porte plus de 1'000 noms), phragmite (qui est un nom de plante et non d'oiseau), tichodrome (qui affuble l'un des plus gracieux oiseaux d'Europe), circaète, percnoptère, puffin, oedicnème, hypolais. Pour la clarté et l'harmonie de la langue, et avec la certitude de m'attirer l'ire et la condescendance des ornithologues de langue française, je me suis permis dans cet ouvrage de remplacer ces noms étrangers et faussement "savants" utilisés dans les ouvrages ornithologiques, par des noms français existants. Ce procédé ne présente d'ailleurs aucun inconvénient: l'ornithologue saura tout de même que le Vautour blanc est le Neophron percnopterus et le linguiste saura qu'il aura affaire à un oiseau et non à une plante par l'emploi de rousserolle au lieu de "phragmite".

De nombreuses corrections d'erreurs typographiques ou de lecture ont été apportées, pour autant qu'il a été possible de les déceler. Nul doute cependant que cet ouvrage pèche encore par bien d'autres erreurs de lecture. J'espère en trouver l'excuse dans l'énormité de la tâche.

Apologie de l'homme de la terre

Trop souvent les ornithologues et observateurs d'oiseaux considèrent les noms populaires comme encombrants, superflus ou sujets à confusions, sans se rendre compte que le nom "officiel" qui leur a été imposé n'est qu'un seul parmi le répertoire riche et pittoresque accumulé au cours des siècles ou même de millénaires par des peuples qui ont été en contact plus étroit avec la nature que la plupart des ornithologues citadins d'aujourd'hui. Le Torcol a reçu beaucoup de noms ayant rapport à son habitude de se nourrir de fourmis. Et pourtant combien de personnes de nos jours - linguistes, dialectologistes et, je ne crains pas d'ajouter, ornithologues - ont-ils observé un Torcol en train de se nourrir de fourmis?

On a souvent répété dans les milieux ornithologiques que les paysans ne sont pas curieux, qu'ils sont ignorants etc. Les 100'000 noms rassemblés ici ne sont-ils pas un démenti irréfutable de ces assertions et un éclatant témoignage de leur connaissance de la nature ?

Sources

Cette étude est basée avant tout sur les lexiques dialectaux. Ce sont les gens de la terre et de la mer qui ont nommé les choses de la nature comme ils ont créé les langues que nous parlons. C'est dans leur vocabulaire que l'on doit rechercher la signification de ces noms. Leur sens doit être cherché dans la langue de ceux qui ont créé le mot. Certes il faut aussi dépouiller la littérature, c'est-à-dire la langue écrite: poèmes, chanson, archives, récits historiques etc. Cette méthode a son utilité, mais aussi de très gros inconvénients. Les poètes et autres scribes ont souvent emprunté leur vocabulaire à des langues étrangères, surtout au grec ou au latin. Ces emprunts peuvent donner une fausse idée de l'aire géographique du terme. Ceci d'autant plus que la provenance exacte des noms cités n'est que rarement ou très vaguement indiquée et que l'objet qu'ils désignent n'est pas toujours identifiable.

Si "l'ancien français" aronde est cité pour la première fois dans la Chanson de Roland, cela ne signifie pas qu'à cette époque le nom était connu dans toute la France. Cela signifie seulement que l'auteur a utilisé le nom qu'il connaissait dans son parler à lui, en l'occurence celui du Berry ou de la Champagne où ce nom est encore utilisé de nos jours.

L'attribution correcte du nom est des plus incertaines dans l'ancienne littérature et ceci directement en fonction de l'ancienneté de ces écrits. L'orthographe y est souvent aberrante et sujette à caution. Le souci des gens de plume était de relater des faits historiques et non d'orthographier correctement des mots qui n'existaient dans aucun dictionnaire. On a donc rencontré, chez les Grecs anciens, les poètes latins et surtout les scribes du moyen-âge les orthographes les plus fantaisistes pouvant égarer ou diriger l'étymologiste sur une fausse piste.

Mes toutes premières recherches consistèrent d'abord à dépouiller les travaux ornithologiques, en ayant soin d'écarter les noms "officiels" qui sont souvent des créations artificelles "fabricate din birou" (fabriqué dans un bureau) comme l'a dit mon éminent collègue Mihai Bâcescu (1961). Les noms parus dans les écrits ornithologiques sont-ils des emprunts récents ou bien se trouvent-ils dans les dialectes ? Dans ce dernier cas, celui qui nous intéresse, il importe de déterminer l'aire géographique du nom dans les parlers. J'ai effectué un dépouillement des écrits ornithologiques presque exhaustif. Seules quelques rares publications locales introuvables ont échappé à mes recherches.

Les études dialectologiques ont fourni un très grand nombre de noms avec leurs variantes. Malheureusement les erreurs d'attribution sont très fréquentes, ou alors le nom est seulement défini comme étant celui "d'un petit oiseau gris comme le moineau" ou "un oiseau qui vit dans les buissons et se nourrit d'insectes" etc. (L'appendice 2.2.0 en cite des exemples). Nombre de ces publications dialectologiques sont très locales, souvent anciennes et introuvables, surtout pour les langues slaves. Quelques enquêtes personnelles ont été faites en Valais (romand et alémanique), au Val d'Aoste, en Pays Basque, en Yougoslavie (albanais de Kosovo), en Grèce et en Iran (balouchi).

Un avantage offert par cet ouvrage consistera à rendre accessibles à tous les linguistes et ornithologues les dénominations d'oiseaux, de choses, de couleurs etc. dans les langues de graphies non-romanes telles que le géorgien, l'arabe, l'arménien, le grec, le persan ou le russe.

Cet inventaire pourra aussi apporter un éclairage nouveau sur les mouvements pré- ou proto-historiques des peuples européens. Par exemple, une similitude des noms d'oiseaux de Suisse romande et de Gascogne indique qu'il y a eu un mouvement de populations entre ces deux contrées. Ces similitudes sont parfois étayées par les faits archéologiques ou historiques.

Ce travail ne représente pas le point final de ces recherches mais une base solide qui fournira un précieux instrument de travail aux linguistes et dialectologistes futurs.

Enfin, et ce n'est pas l'aspect le moins important, ce lexique réunissant des milliers de noms enfouis dans des publications obscures ou recueillis de la bouche d'une génération sur le point de s'évanouir, fera oeuvre de sauvegarde certaine. Des termes que l'humanité a mis des millénaires à façonner pourront être ainsi conservés dans le patrimoine linguistique européen.

Les paradigmes à l'aide de la recherche sémantique

Ayant depuis toujours été captivé par la phylogénie des espèces animales ou végétales, sa complexité et son aspect fascinant, il est naturel que je sois arrivé à vouloir remonter à l'origine des mots et de leur évolution comme à celles des organismes vivants: L'étude de l'évolution des mots est en effet une étude phylogénétique: Des arbres généalogiques peuvent être constitués pour les mots comme pour les êtres vivants. Cf. en particulier J.B. Kruskal, I. Dyen & P. Black, The vocabulary method of reconstructing languages trees: innovations and large-scale applications, p. 361-380 in Mathematics in the archaeological and historical sciences. Proc. Anglo-Romanian Conference, Bucarest, 1970. University Press, Edinburg, et D. Penny, E.E. Watson & M.A. Steel, 1993. Trees from languages and genes are very similar. Systematic Biology 42: 382-384.

Après des recherches poursuivies depuis plus d'un quart de siècle, c'est avec satisfaction que j'apprends que la méthode à laquelle je suis parvenu a été appliquée indépendamment par d'autres auteurs. En effet, A. Rey, dans la préface de Structures étymologiques du lexique français de Pierre Guiraud (1986), l'a formulée d'une manière plus apte. J'avoue qu'il est réconfortant de constater, après une vie entière de recherches axées dans une seule direction, que je ne suis pas le seul à m'être engagé sur cette voie. Guiraud a énoncé mieux que je ne saurais le faire les principes de la méthode structurale. Ce qui importe avant tout, c'est que ces questions soient abordées sans esprit de système, sans opinions préconçues d'aucune sorte et sans faire de concessions à l'opinion communément admise.

La deuxième partie de ce travail se compose d'appendices formés de paradigmes, ensembles de termes qui peuvent figurer en un point de la chaîne parlée. De ces filiations se dégagent des structures génétiques dans lesquelles peuvent se retrouver la sémantique de presque tous les noms des oiseaux européens ainsi que de milliers d'autres termes, noms de couleurs, d'objets ou d'animaux définis dans des catégories morpho-sémantiques.

Les oiseaux, comme tout ce qui nous entoure, ont été nommés d'après leur couleur (bases chromatiques), leur forme (morphologiques), leurs mouvements (cinétiques), les sons qu'ils émettent (acoustiques ou phoniques), ou encore d'après leurs diverses fonctions. Chacun de ces caractères peut être représenté par des bases, c'est-à-dire des matrices ou structures élémentaires qui peuvent constituer une typologie du lexique européen. Cette manière de faire nous dispense de créer des racines hypothétiques indo-européennes ou "proto-indo-européennes". "Le recours au quantitatif sauve de l'abstraction" (A. Rey). L'existence des sèmes est garantie par des propriétés statistiques. Le mot est une forme associée à un sens. La relation entre le signifiant et le signifié appartient à un paradigme constitué par la série de tous les mots construits sur le même modèle. Cette relation signifiante est définie par un certain nombre de conditions et de caractères précis et constants dans la mesure où ils se répètent, c'est-à-dire par des lois. L'étymologie cesse d'être l'étude des mots isolés, pour devenir des modèles ou structures (Guiraud). Jusqu'ici l'étymologie était l'étude des mots. Elle devient l'étude de l'idée.

Cette méthode d'analyse sémantique est basée sur la perception par nos sens des caractères très bien définis qui ont été à l'origine de l'attribution d'un nom à un oiseau ainsi qu'à des objets ou animaux porteurs de caractéristiques similaires. Chacune des bases qui sont le fondement de la méthode que je propose est l'expression de nos sens.

Les principales bases qui nous concernent sont:

Sens

Bases Bases

Bases

Ouïe

: Impression acoustique
Acoustiques Acoustiques

Acoustiques

  
  Cinétiques Cinétiques

Cinétiques

Vue

: Impression optique
Chromatiques Chromatiques

Chromatiques

  Morphologiques Morphologiques

Morphologiques

  

Toucher

: Impression tactile
Morphologiques Morphologiques

Morphologiques

  
  (Rares parmi les noms d'oiseaux). (Rares parmi les noms d'oiseaux).

(Rares parmi les noms d'oiseaux).

Odorat

: Impression olfactive
Ex. angl. musk, all. most, fr. moût, moutarde, émoustiller) Ex. angl. musk, all. most, fr. moût, moutarde, émoustiller)

Ex. angl. musk, all. most, fr. moût, moutarde, émoustiller)

  

Goût

: Impression gustative

Inexistantes parmi les noms d'oiseaux, présentes chez les plantes) Inexistantes parmi les noms d'oiseaux, présentes chez les plantes)

Inexistantes parmi les noms d'oiseaux, présentes chez les plantes)

Le groupe de gauche se rapporte à la couleur (le crapaud n'est pas bavard, et l'une des espèces communes est caractérisée par son ventre bariolé de jaune et noir). Le groupe de droite se rapporte à la voix de ces espèces (le pétrel et la fauvette ne sont pas bigarrés mais tous deux sont très bavards sur leur territoire). On peut éliminer d'emblée une origine cinétique (aucun de ces animaux n'a de mouvements caractéristiques communs à tout le groupe).

De même en page 171-172, on peut classer plus rationnellement les termes donnés par Guiraud:

1. Racine d'origine chromatique

all. schick et fr. chic "bonne façon", racine à laquelle appartient également le fr. régional deschaquetey "fait d'étoffe bariolée" mais non déchiqueté (et sans rapport possible avec le shah de Perse).

2. Racine d'origine morphologique: petites choses arrondies ou choses pointues

chiquet "sommet d'un arbre"; fr. chique "petit morceau" etc. (d'où déchiqueter "réduire en petits morceaux"); chiquer "mâcher une chique" n'est qu'une forme verbalisée.

3. Racine d'origine acoustique

fr. chicaner "quereller", prov. chica "bavarder".

4. Racine d'origine cinétique

sikè "être projeté avec force"; chic, chiquenaude "petit coup"; chicoter "sangloter" tsekula "chatouiller" (Engl. tickle)

Cette distinction permet d'y voir quatre bases sans rapport sémantique entre elles, donnant des termes se ressemblant par convergence phonétique. Des termes se rattachant aux quatre racines ci-dessus se trouvent dans presque toutes les langues européennes (voir appendices · 3.3.8.3/ 4.1.10/ 5.13.1/ 6.3.10).

Il est en général possible de classer la plupart des mots dans une catégorie mais il faut bien connaître les sujets étudiés. Dans le cas de caillotin, ci-avant, on peut hésiter : le pinson est bariolé, il est aussi bavard. La situation géographique peut aider; le sens chromatique de caille est plutôt méridional, le sens acoustique plutôt septentrional. L'analyse des autres noms de l'espèce peut le plus souvent décider de l'appartenance des termes de phonétique convergente. C'est bien la convergence phonétique qui a fait réunir ces termes dans un même groupe par Guiraud.

La difficulté, si difficulté il y a, est de rattacher les termes à la qualité qui les caractérise en commun. C'est ce qu'aucun lexicologue n'a fait jusqu'ici d'une manière méthodique, à l'exception de Sadnik & Aitzetmüller (1975), oeuvre qui est malheureusement restée inachevée.

Cette méthode a en plus l'avantage d'éliminer toutes les fastidieuses hypothèses auxquelles se sont livrés beaucoup d'étymologistes, pour essayer de prouver la parenté de deux termes homophoniques. C'est le plus souvent la métaphore qui est invoquée. Mais la métaphore était rare dans la formation du vocabulaire jusqu'à une époque très récente. C'est surtout dans la langue écrite que l'on a usé, et souvent abusé de la métaphore. Celle-ci peut donc être invoquée dans les mots de formation récente, mais non dans les dénominations primitives de choses ou d'animaux. La chose tire son nom de son aspect, de sa fonction. Une vache pie est ainsi qualifiée parce qu'elle est pie (blanche et noire) et non parce qu'elle est de la couleur de la pie.

La méthode que j'ai suivie consiste à partir de quelques bases très simples, existantes et non hypothétiques, qui sont à l'origine même du langage et sur lesquelles se sont formées par mutation, prosthèse, suffixation et changement de catégorie grammaticale, tous les morphèmes existant ou ayant existé.

Sous chaque base les mots sont classés selon leur ressemblance sans égard à la localité ni à la langue, ce qui permet de suivre leur évolution phonétique. On verra que cette méthode, loin d'être chaotique, fait ressortir un classement (pattern) géographique qui se répète presque invariablement pour chaque sémantème.

La valeur sémantique donnée à la base n'est pas inventée ni hypothétique. Elle ressort de la synthèse de l'ensemble du paradigme. L'appendice 6.3.1 (base cinétique tr-p) démontre clairement, par exemple, pourquoi tromper n'est ni "triompher" ni "jouer de la trompe", deux sens incompatibles avec la signification du mot.

Chaque catégorie sémantique est constituée par la série de mots représentant des caractères morphologiques et sémiques communs. C'est la catégorie morpho-sémantique qui constitue le paradigme, ensemble dans lequel les mots sont en relation les uns avec les autres.

Cette étude repose toute chose théorique directement sur des faits attestés dans les langues et les dialectes. Elle définit en détail les ressemblances des mots dans ces parlers sans l'aide de reconstruction de prototypes qui auraient disparu.

Aujourd'hui, la théorie courante, mais nullement acceptée par tous les linguistes, consiste à partir d'une langue hypothétique très complexe, de laquelle seraient nées, par corruptions, pertes et mutations, les langues modernes; ainsi, on a sérieusement proposé que mille viendrait d'une racine hypothétique (s)mghzl(y)o ou même, plus récemment *(smiH2)- gheslo- ! (Pour l'origine de mille · 4.7.11).

A ces prototypes on a donné une signification qui ne peut être que hypothétique: Peut-on donner une signification réelle et précise à une reconstruction fictive ? Ces prototypes ont d'ailleurs servi très souvent à unir des termes n'ayant aucune parenté sémantique, dont voici quelques exemples, pour ne citer que des noms d'oiseaux:

Russe utja "canard" à l'a.gr. nêssa id.

A.gr. kauax "un oiseau de mer" (auquel on a donné le sens précis de "mouette") au latin cavannus "chouette".

Vha. huon "poule" au latin ciconia "cigogne".

Skr. pikas "coucou indien" au vha. speh "pic".

Cymry hwyad "canard" au skr. vis "oiseau".

Un autre exemple entre mille est la relation supposée de fleur à l'anglais blossom par l'intermédiaire d'une racine hypothétique*bhlos-. Les deux termes se rattachent à des racines différentes: pour fleur, voir ð3.1.32.4.; pour blossom ð3.1.19..

Il est certainement faux de croire que notre vocabulaire provient d'une langue "proto-indo-européenne" complexe telle qu'elle est representée par les reconstructions hypothétiques. Au contraire, chaque vocable a évolué à partir d'une base simple par l'adjonction d'affixes et par permutations, la base restant remarquablement constante au cours des millénaires. La reconstruction hypothétique d'un mot latin ou proto-indo-européen est la manière la plus expéditive, d'apparence savante mais en réalité superficielle, comme aussi la plus commode, d'établir une "étymologie", procédé qui peut la priver de toute logique. Pour citer un exemple parmi tant d'autres, oie "vient" d'un mot latin hypothétique avica qui signifierait "petit oiseau", ce qui est exactement le contraire de la réalité.

La reconstruction rigide de racines proto-indo-européennes et l'obsession de la scientificité a conduit la linguistique à se parer d'une fausse rigueur dont on ne trouve nulle part le modèle. Que vaut d'ailleurs cette méthode qui permet, par exemple, à l'albanais sorrë "corneille" de dériver de kwèrnà ? Constatons avec Wagner (1960: 361) que "non è possibile analizzare quali nomi (codisaitta etc.) con le sole resorse della fonetica".

Les étymologistes ont trop souvent tout sacrifié aux "exigences de la phonétique", même la logique, le bon sens et l'évidence la plus flagrante. On a jonglé avec des mots hypothétiques et spéculé sur une évolution sémantique tout aussi hypothétique. Lorsque le mot existe, l'échafaudage, ou mieux la charpente, existe. Il reste à la découvrir. Il ne faut pas créer des racines, mais les trouver là où elles existent. Ecartons donc les solutions faciles. La lexicologie de ce travail est fondée sur un dépouillement minutieux. Ce travail se révèle fécond et positif si l'on prend la peine et le temps de l'effectuer.

Cet ouvrage décrit un certain nombre de modèles, de paradigmes (des matrices, des structures élémentaires) afin de construire une typologie du lexique européen. Si les bases données dans ce travail représentent une partie importante des bases européennes (d'autres se trouveront dans les langues germaniques ou slaves que j'ai peu étudiées), les paradigmes eux-mêmes sont loin d'être complets: les compléter est l'oeuvre de plusieurs générations et c'est, en fin de compte, sur ce modèle que devra s'établir un véritable dictionnaire analytico-sémantique des langues européennes. "Le problème des inventaires et de leur manipulation est fondamental; le jour où il sera résolu, l'étymologie sortira de son enfance et s'affranchira de ses mythes. Il n'est pas absurde de penser qu'une machine électronique sera le plus grand lexicologue de notre génération; car, en première analyse, la valeur critique des simples classements est déjà si grande que les conclusions s'imposeront d'elles-mêmes" (Guiraud, p. 44). Le travail que je présente ici est un premier pas dans cette direction.

Je n'ai porté sur les listes que les termes nécessaires à la continuité de l'idée et de l'évolution du sémantème. Un terme roman n'est donné que pour une seule des langues romanes et en général sans aucun dérivé à moins que celui-ci ne jette quelque lumière sur l'évolution sémantique ou phonétique.

Comme dans cette étude ce sont les langues romanes qui sont les plus étudiées, il est naturel que les mots basques, celtiques, germaniques, slaves ou autres occupent une place marginale dans ces filiations. Une étude approfondie des langues germaniques aurait modifié quelque peu la construction de ces paradigmes, sans cependant en changer le principe; elle les aurait surtout considérablement améliorés. C'était pourtant une impossibilité physique et matérielle pour un chercheur isolé d'élargir ainsi le domaine de ces recherches.

Pour construire un paradigme il faut d'abord rattacher le mot à la base dont on connaît la sémantique. La direction de l'emprunt, si emprunt il y a, ou la provenance substratique s'en dégagera par la suite.

Le mot doit clairement et strictement répondre à la sémantique de la base, pour être inséré dans un paradigme. De ce fait, la place du mot dans la filiation réduit à néant les étymologies douteuses ou dépourvues de logique. Pour paraphraser A. Rey, il ne s'agit pas de nier que grive puisse venir de graecus (ou oie de avica) mais de montrer que cette origine n'a aucun pouvoir explicatif. Un faisceau de causalités internes remplace ici une cause externe et unique, la cause qui se trouve derrière le symbole. Le but de l'étymologie est de trouver le rapport causal entre le phonème et la signification.

Des objets ou animaux portant le même nom (ou une variante) doivent avoir un caractère en commun, exception faite des convergences phonétiques. Ce caractère est leur dénomination commune et sa signification peut être confirmée par la présence de termes adjectivaux dans les dialectes.

Il se dégage d'un paradigme la continuité de l'évolution phonétique (deuxième colonne) et de l'idée (troisième colonne). Dans la première colonne, les parlers ne se présentent pas d'une manière chaotique, mais selon un ordre de parenté qui se répète dans les autre paradigmes.

Certains spécialistes constateront avec surprise que les filiations que j'ai élaborées contiennent un certain nombre de termes extra-européens. Ce n'est pas le but de cette étude de démontrer la communauté d'origine ou l'unicité des langues. Aussi, pour justifier ces inclusions et pour guider ceux qui seraient remplis d'incrédulité et d'idées préconçues, je citerai quelques travaux parmi les plus sérieux sur la parenté des langues :

Brunner, L. 1969. Die gemeinsamen Wurzeln des semitischen und des indogermanischen Wortschatzes. Bern.

Cavalli-Sforza, Luca, 1996. Gènes, peuples et langues. Ed. Odile Jacob. Paris.

Cavalli-Sforza, Luca et al., 1988. Reconstruction of human evolution : Bringing together genetic, archaeological and linguistic data. Proc. Nation. Acad. of Sc. of the USA 85 (16): 8002-8006.

Cavalli-Sforza, Luca & A. Piazza, 1993. Human genomic diversity in Europe: A summary of recent research and prospect for the future. Euro. J. Hum. Genet. 1: 3-18.

Eckardt, André, 1966. Koreanisch und Indogermanisch.

Greenberg, Joseph H. (recent). Indo-European and its closest relatives: The Eurasiatic language family. Stanford University Press, Calif.

Lahovary, N. 1963. Dravidian origins and the West. Bombay.

Mendoza, 1878. Estudio comparativo entre el sanscrito y el nagüatl. Mexico.

Mukharovsky, Hans, G., 1925. Euro-saharanisch, eine alte Spracheinheit Europas und Afrikas. Mitt. anthr. Ges. Wien 95: 66-76.

Nichols, Johanna, 1992. Linguistic diversity in space and time. Univ. of Chicago Press, Chicago, London.

Penny, D., E.E. Watson & M.A. Steel, 1993. Trees from languages and genes are very similar. Systematic Biology 42: 382-384.

Rahder, Johannes, 1963. Etymological vocabulary of Chinese, Japanese, Korean and Ainu. Orbis 12: 45-116.

Rivet, Paul, 1925a. Les Australiens en Amérique. Bull. Soc. ling. Paris 26: 23-63.

Rivet, Paul, 1925b. Sumériens et Polynésiens.

Ruhlen, Merritt, 1987. A guide to the world's languages. Standord Univ. Press, Stanford, Calif.

Ruhlen, Merritt, 1994. The origin of language. John Wiley & Sons, New York, Chichester. (Voir en particulier sa bibliographie).

Schmutz-Höbarthen, Franz, 1966. Die gemeinsamen Ursprung der Sprachen. Krems.

Shafer, Robert, 1963. Eurasial. Orbis 12: 19-44.

Stopa, R. 1966. Afrikanisch und Indogermanisch. Phonetica 14: 181-189.

Swadesh, Morris, 1960. On interhemispheric linguistic connections. Pp. 895-924 in: Culture in History, Essay in honor of P. Radin. Diamond, S., editor.

Swadesh, Morris, 1971. The origin and diversification of language. Chicago, New York.

Trombetti, Alfredo, 1962. L'unità d'origine dei linguaggie. Bologna.

Ulenbrook, Jan, 1967. Einige Ueberstimmungen zwischen dem chinesischen und dem Indogermanischen. Anthropos 62.

Top Of Page