Javacrim » littre  » xml  » littre
Schéma d'encodage du Littré

Littré, structure.

Présentation de la structure informatique du Dictionnaire de la langue française d'Émile Littré, encodé en XML et respectant les spécifications de la TEI-P5. Ce projet a été réalisé à partir de la version électronique du Littré conçue par François Gannaz (version 1.3) et correspond à l'intégralité de l’édition originale de 1872 en 4 volumes, enrichie de son supplément de 1877.

« Le passé de la langue conduit immédiatement l'esprit vers son avenir. »
(Émile Littré, Préface du Dictionnaire de la langue française)

« Pour la nomenclature »

Convaincu de la nécessité de connaître les emplois passés pour éclairer les usages présents, Émile Littré construit la nomenclature de son Dictionnaire de la langue française sur le socle de celle du Dictionnaire de l'Académie Française ; ce « corps de la langue » est donc enrichi à partir de nombreuses sources d'addition :

  • le « dépouillement des auteurs classiques » d'une part, ainsi que les « auteurs du seizième siècle, du quinzième, et même [...] les auteurs antérieurs, s'il était possible d'y puiser sans réserve » ;
  • les « termes de métier » (à partir de la nomenclature des travaux de Furetière et Richelet)  et les termes scientifiques d'autre part, deux objets par ailleurs bien distincts : « tandis que la langue des métiers est toujours populaire, souvent archaïque, et tirée des entrailles même de notre idiome, la langue scientifique est presque toute grecque, artificielle et systématique : là l'étymologie se présente d'elle-même ».

<text>
Corps du document
Contenubody
Usage TEI
<body>
Contenu( entry | entryFree )+
Usage text
<entry>
Article (entrée)

Chaque entrée est dotée d'un identifiant unique, correspondant à sa vedette. Cet identifiant permet d'assurer la liaison entre les nombreux renvois et les entrées auxquelles ils réfèrent. Il peut-être :

  • une forme simple, auquel cas il s'agit du lemme de ce mot, éventuellement suivi d'un point et d'un indice numérique afin de différencier deux entrées portant sur le même lemme
    exemple : @xml:id="abrégé.1" et xml:id="abrégé.2" ;
  • une forme composée – type locution – transcrite telle quelle
    exemple : @xml:id="te_deum" et @xml:id="vaque_à_tout" ;

Attributs@xml:id@ana="supplement"?
Contenuform, note type="plan"?, sense+, re type="PROV."*, note type="REM."*, re type="SYN."*, note type="HIST."?, etym*, re ana="supplement"?
Usage body
<entryFree>
Renvoi, préfixe, suffixe, forme fléchie…

Cet élément permet de distinguer les entrées courtes.

  • un préfixe, auquel cas sa forme sera suivie d'un tiret court, son statut de suffixe étant précisé par l'attribut @type
    exemple : @xml:id="andr-" ;
  • un suffixe, auquel cas sa forme sera la même que celle d'un mot simple, son statut de suffixe étant précisé par l'attribut @type
    exemple : @xml:id="acé" ;
Attributs@xml:id @type?@ana="supplement"?
Contenuform, ( xr | etym | dictScrap | def | note type="REM." )*
Usage body
@type
Valeur"prefixe" |"suffixe" ]
<form>
Contenuorth+, pron?, gram?
Usage entryFree

« Pour la grammaire »

Chaque entrée est composée d'un certain nombre d'éléments significatifs, à commencer par form, un élément obligatoirement présent et encodant des informations relatives à l'identification de l'item traité.

<form>
Forme de la vedette

Au minimum, ces informations se résument à la représentation graphique du mot (orth), éventuellement enrichie d'indications grammaticales (gram) ou sur la prononciation de l'item (pron). Ces indications, le cas échéant, peuvent être enrichies de discussions ou remarques critiques de l'auteur (note), notamment sur la prononciation ou des particularités grammaticales.

Contenu( orth+, note*, pron*, note*, gram? )+, xr?, cit*, note?
Usage entry re
<orth>
Graphie
Contenu text()
Usage form form
<pron>
Prononciation
Contenu( text()  | ref | cit )*
Usage form form
<gram>
Indication grammaticale
Attributs@norm?
Contenu( text()  | ref )*
Usage form form
@norm
Valeur"A" |"S" |"V" ]
<note>
Note mixte
Contenu( text()  | ref | oVar )*
Usage form quote note type="HIST."

« Pour la signification des mots »

« l'Académie met toujours en premier rang la signification qui est la principale dans l'usage, c'est-à-dire celle avec laquelle le mot revient le plus souvent soit dans le parler, soit dans les écrits. [...] Sans doute, en un dictionnaire qui ne donne ni l'étymologie ni l'historique des mots, ce procédé empirique a été le meilleur à suivre. [...] en plaçant de la sorte au premier rang ce que le lecteur est disposé à trouver le plus naturel comme étant le plus habituel, on lui donne une satisfaction superficielle il est vrai, mais réelle pourtant. Toutefois cet avantage est acheté au prix d'inconvénients qui le dépassent de beaucoup. En effet ce sens le plus usité, le premier qui se présente d'ordinaire à la pensée quand on prononce le mot, le premier aussi que l'Académie inscrit, est souvent, par cela même qu'il est habituel et courant dans le langage moderne, un sens fort éloigné de l'acception vraie et primitive ; il en résulte que, ce sens ayant été ainsi posé tout d'abord, il ne reste plus aucun moyen de déduire et de ranger les acceptions subséquentes. [...]

Autre a dû être la méthode d'un dictionnaire qui consigne l'historique des mots et en recherche l'étymologie. Là, tous les éléments étant inscrits, on peut reconnaître la signification primordiale des mots. L'étymologie indique le sens originel dans la langue où le mot a été puisé ; l'historique indique comment, dès les premiers temps de la langue française, ce mot a été entendu, et supplée, ce qui est souvent fort important, des intermédiaires de signification qui ont disparu. Avec cet ensemble de documents, il devenait praticable, et, j'ajouterai, indispensable de soumettre la classification à un arrangement rationnel, sans désormais rien laisser à ce fait tout accidentel de la prédominance de tel ou tel sens dans l'usage commun, et de disposer les significations diverses d'un même mot en une telle série, que l'on comprît, en les suivant, par quels degrés et par quelles vues l'esprit avait passé de l'une a l'autre. »
(Préface du Littré)

<sense>
Acception

La structure des acceptions formule cette hypothèses à valider :

  • Une acception est toujours introduite par une glose (ou citation de définition).
  • Les sous-acceptions se succèdent en série stricte, sans insertions d'autres composants entre les items.
  • Les proverbes et les renvois sont toujours renvoyés en fin d'acception.
Attributs@n?@ana="supplement"?
Contenu( dictScrap | cit | xr ), ( cit | dictScrap )*, sense*, ( re type="PROV." | q | xr )*
Usage entry re ana="supplement" re
<sense>
Sous-acception

Est-ce qu'une sous-acception est toujours introduite par une glose (ou une citation de définition) ?

Attributs@ana="supplement"?
Contenu( cit | dictScrap ), ( cit | dictScrap )*, ( xr | re type="PROV." )*
Usage sense
<dictScrap>
Contenu mixte

« Nous en sommes encore à nous demander comment un homme tel que M. Littré, et comment une maison aussi habile que celle qui figure au bas du titre, ont pu condamner le lecteur à un tel imbroglio et négliger à ce point un accessoire si essentiel dans un livre de recherches : presque point d'alinéas ; certains paragraphes ont jusqu'à deux, trois, quatre et même cinq cent lignes ; les exemples n'ont rien qui les distingue du texte de la définition ; les vers revêtent la forme et le caractère de la prose. »
(Pierre Larousse, Préface du Grand Dictionnaire universel, 1865)

Attributs@ana="supplement"?
Contenu( text()  | def | q | ref | oVar )*
Usage entryFree sense sense re ana="supplement" note type="plan"
<def>
Définition
Contenu( text() )*
Usage entryFree dictScrap
<q>
Exemple, Locution

Cet élément, codant un discours à détacher de celui de l'auteur, dénote principalement des exemples, éventuellement des locutions figées voire des proverbes (la frontière est parfois mince).

Le besoin de sous-structuration de ces textes permet le repérage et l'analyse de nombreuses marques chères à l'auteur, révélant un texte très structuré, notamment dans la séparation entre les locutions et leur glose.
exemple : « se dit de », « se dit quand », « c'est-à-dire ».

Contenu( text()  | oVar )*
Usage sense dictScrap

Citations

« La citation régulière et systématique d'exemples pris aux meilleurs auteurs est une innovation qui paraît être en conformité avec certaines tendances historiques de l'esprit moderne. »
(Préface du Littré)

<cit>
Citation
Attributs@ana="supplement"?
Contenuquote, bibl, note?
Usage form pron sense sense note type="REM." re type="PROV." re type="SYN." note type="HIST." etym re ana="supplement" p re
<quote>
Contenu( text()  | oVar | note )*
Usage cit
<bibl>
Référence bibliographique
Contenuauthor?, biblScope
Usage cit
<author>
Auteur
Attributs@xml:id?
Contenu text()
Usage bibl
<oVar>
Rappel de la vedette
Contenu text()
Usage note dictScrap q quote note type="REM." etym

Remarques

« Sous ce chef, j'ai réuni quelques notions complémentaires qui n'entrent pas d'ordinaire dans les plans lexicographiques, mais qui pourtant ne me semblent pas dénuées d'intérêt et d'utilité. [...] Ces remarques, de leur nature, sont très diverses. »
(Préface du Littré)

Ainsi, ces remarques concernent notamment des difficultés de la langue, et l'auteur s'inspire des grammairiens, tout en apportant des éléments nouveaux, afin d'éclairer l'usage tant dans l'emploi que dans l'orthographe.

Toujours suivant ce principe directeur de « combine[r] l'usage présent de la langue et son usage passé, afin de donner à l'usage présent toute la plénitude et la sûreté qu'il comporte », Littré éclaire certaines proscriptions contemporaines concernant des faits de langue pourtant attestés chez les grands auteurs classiques.

<note type="REM.">
Remarque
Attributs@type="REM."@ana="supplement"?
Contenu( p+ | ( text()  | cit | ref | oVar | xr )+ )
Usage entry entryFree re ana="supplement"

Proverbes

« Il est enfin un dernier ordre de remarques, tantôt mises sous ce chef, tantôt incorporées dans la série des acceptions du mot. Il s'agit de l'interprétation de certaines locutions figurées ou proverbiales. »
(Préface du Littré)

<re type="PROV.">
Proverbe
Attributs@type="PROV."
Contenu( text()  | form | cit | ref )*
Usage entry sense sense re ana="supplement"

Nuances

« [...] la discussion des synonymes m'a souvent averti de prendre garde aux nuances et de ne pas recevoir comme une véritable explication le renvoi d'un terme à l'autre. »
(Préface du Littré)

La structuration raffinée et aboutie des nuances du Littré, d'ores et déjà effectuée par Frédéric Glorieux, est un bon exemple du degré de balisage pouvant être atteint sur l'ensemble du texte, donnant ainsi l'occasion de se pencher sur la lecture et l'étude d'une partie signifiante et cohérente de ce dictionnaire.

<re type="SYN.">
Nuance
Attributs@type="SYN."
Contenu( text()  | cit | ref )*
Usage entry re ana="supplement"

« Pour la partie historique »

« Je donne le nom d'historique à une collection de phrases appartenant à l'ancienne langue. Lorsqu'un mot a été exposé complètement tel qu'il est aujourd'hui dans l'usage, lorsque les sens y ont été rangés d'après l'ordre logique, lorsque des exemples classiques, autant que faire se peut, ont été rapportés à l'appui, lorsque la prononciation a été indiquée et, au besoin, discutée, lorsque enfin des remarques grammaticales et critiques ont touché, dans les cas qui le comportent, à l'emploi du mot ou aux difficultés qu'il présente, alors s'ouvre un nouveau paragraphe pour les textes tirés de la langue d'oïl. Ainsi placé, c'est le prolongement naturel d'une série que l'on tronque quand on s'arrête à notre temps et aux temps classiques. Après avoir vu comment écrivent Corneille, Pascal, Bossuet, Voltaire, Montesquieu et nos contemporains, on pénètre en arrière et l'on voit comment ont écrit Montaigne, Amyot, Commines et Froissart, Oresme et Machaut, Joinville, Jean de Meung, Guillaume de Lorris, Villehardouin, le sire de Couci, le traducteur du livre des Psaumes, et Turold, l'auteur de la Chanson de Roland. »
(Préface du Littré)

<note type="HIST.">
Information historique
Attributs@type="HIST."
Contenu( label, ( cit | note )+ )+
Usage entry re ana="supplement"

« Pour l'étymologie »

« Cette rubrique, née toujours de la volonté de l'auteur de lié passé et présent, prend corps dans « la détermination ou du moins la discussion de l’origine de chaque mot établie par la comparaison des mêmes formes dans le français, dans les patois et dans l'espagnol, l'italien, et le provençal ou langue d'oc. »
(Page de garde du Littré)

« [...] ceux qui iront jusqu'à désirer de connaître l'étymologie entreront dans l'histoire du mot, et trouveront, au-dessous de cette histoire, l'étymologie qui très souvent en est dépendante. »
(Préface du Littré)

<etym>
Étymologie
Attributs@ana="supplement"?
Contenu( ( text()  | oVar | cit | xr | ref ), text() )*
Usage entry entryFree re ana="supplement"

Supplément

@ana="supplement"
Valeur"supplement"
Usage ana > entry entryFree sense sense dictScrap cit note type="REM." etym <
Issu du supplément
<re ana="supplement">
Sous-entrée en supplément
Attributs@orig? @ana="supplement"
Contenu( sense | cit | dictScrap | etym | note type="HIST." | note type="REM." | re | re type="SYN." | re type="PROV." )*
Usage entry

Plan

<note type="plan">
Plan des acceptions
Attributs@type="plan"
ContenudictScrap?, list
Usage entry
<list>
Contenuitem+
Usage note type="plan"
<item>
Attributs@n
Contenu text()
Usage list

Structuration

<p>
Regroupement d'informations
Contenu( text()  | ref | cit )*
Usage note type="REM." availability status="restricted"
<ref>
Renvoi

Littré intègre à son Dictionnaire de la langue française de nombreux renvois entre différentes entrées, qu'il convient de structurer finement afin de mieux comprendre le squelette définitionnel des items. Cela permettrait de représenter systématiquement ce réseau voulu par l'auteur et donner ainsi au texte une vraie dimension électronique, une réelle épaisseur.
Le lien entre le renvoi et sa référence est désormais assuré par la mise en place des attributs @xml:id

Attributs@target
Contenu text()
Usage pron gram note dictScrap note type="REM." re type="PROV." re type="SYN." etym p xr re bibl
<xr>
Corrélat

Contient un renvoi avec ses introducteurs

Contenu( text()  | ref )+
Usage entryFree form sense sense note type="REM." etym
<re>
Contenu( text()  | cit | form | ref | sense )*
Usage re ana="supplement"

Schéma de l'entête de métadonnées

<TEI>
Élément racine
Attributs@xml:id
ContenuteiHeader, text
UsageElément racine
<teiHeader>
Métadonnées
ContenufileDesc
Usage TEI
<fileDesc>
Description du document

Description éditoriale du document.

ContenutitleStmt, publicationStmt, sourceDesc
Usage teiHeader
<titleStmt>
Titre du document
Contenutitle
Usage fileDesc
<publicationStmt>
Mention de publication

Contient une série d'informations relatives à la publication de ce document.

Contenudate, idno, publisher, availability status="restricted"
Usage fileDesc
<availability status="restricted">
Attributs@status="restricted"
Contenup+
Usage publicationStmt
<sourceDesc>
Description des sources

« Décrit la source à partir de laquelle un texte électronique a été dérivé ou produit » (Principes directeurs de la TEI-P5), ici d'une part le Littré, d'autre part la version électronique du Littré réalisée par François Gannaz.

Contenubibl+
Usage fileDesc
<bibl>
Contenu( text()  | ref )*
Usage sourceDesc