Navigation

Page créée et rédigée par Benjamin Galliot (mai 2024).
Organigramme écrit en Typst.
Diagramme réalisé en LaTeX/TikZ.
Page écrite en HTML et CSS (sans cadriciel).

Organigramme

Organigramme de la collection Lexica

Anciens membres :

  • Raphaëlle Chossenot (responsable éditoriale en 2023) ;
  • Claire Sauttreau (apprentie en édition en 2023).

Remerciements :

  • Yin Yuanhao (殷元昊) (traduction chinoise des informations générales).

Fonctionnement technique

Diagramme du logiciel Lexika

Explications

  • Lexica : nom de la collection de dictionnaires multilingues ;
  • Lexika : nom du logiciel moteur de la collection Lexica (Julia, XSL & LuaLaTeX) :
    • jLexika : logiciel actuellement utilisé (codé en Julia) ;
    • pLexika : ancien logiciel ayant été utilisé en 2016 (codé en Python, pour les premières versions des dictionnaires japhug, na et mwotlap).

Fonctionnement éditorial

  • Prise de contact par Benjamin Galliot ou Guillaume Jacques.
  • Vérification de la qualité scientifique (par Guillaume Jacques).
  • Vérification de la qualité technique (par Benjamin Galliot).
  • Analyse des besoins, souhaits et contraintes :
    • nombres de langues, de scripts, etc. ;
    • complexité structurelle (polymorphisme, hiérarchie complexe, sous-entrées, polysémie, etc.) ;
    • travail nécessaire à la source (méstructurations, corrections, balisage pathologique ou à améliorer, etc.) ;
    • pages liminaires (introduction, précis, glossaire, index, etc.) ;
    • nombre de versions (alphabétique, thématique, inverse, etc.) ;
    • version imprimable (couverture pour imprimeur, format autre, etc.) ;
    • type de suivi (création ponctuelle, mises à jour ultérieures, etc.)…
  • Création d’une première version minimale.
  • Allers-retours entre linguiste et ingénieur :
    • modifications à la source ;
    • mise en forme et mise en page.
  • Première version publiable (dépôt de la référence sur HAL au minimum, du dictionnaire PDF si possible).
  • Suivi possible (dans la limite des ressources).

Auctorat

En s’inspirant des recommandations pour la définition des auteurs d’une publication scientifique et de la nomenclature CRediT, la page de couverture et la page de titre contiendront tous les auteurs du dictionnaire, et la page d’informations (en regard de la page de titre interne) contiendra des informations plus détaillées sur les différents rôles des auteurs et contributeurs (non auteurs).

J’en profite pour préciser qu’à partir du moment où l’ingénieur lexicographe travaille substantiellement sur le projet de dictionnaire et qu’il remplit très vraisemblablement tous les critères d’autorat, il sera évidemment mentionné comme co-auteur aux côtés des autres (notamment du linguiste). Je pense qu’il est important de préciser ces éléments, qui pourraient ne pas toujours être en accord avec une certaine tradition dans la discipline… Si un linguiste est intéressé par un tel projet mais est vigoureusement opposé à la présence d’un co-auteur à ses côtés, il est évident que l’ingénieur lexicographe n’aura pas le même investissement et donc n’assurera pas forcément le même niveau de finition ni n’attribuera la même priorité au projet (du fait qu’il s’agira en ce cas d’un service de prestation plus standard).

Pour rappel, voici des listes de critères d’autorat :

D’après l’ICMJE, traduction française, mai 2022, être auteur d’une publication, ou coauteur d’une publication collective, requiert quatre conditions

  1. Contributions substantielles à la conception ou aux méthodes de la recherche ou à l’acquisition, l’analyse ou l’interprétation des données ; ET
  2. Rédaction préliminaire de l’article ou sa révision critique impliquant une contribution importante au contenu intellectuel ; ET
  3. Approbation finale de la version à publier ; ET
  4. Engagement à assumer l’imputabilité pour tous les aspects de la recherche en veillant à ce que les questions liées à l’exactitude ou l’intégrité de toute partie de l’œuvre soient examinées de manière appropriée et résolues.

D’après McNutt et al., chaque auteur est censé :

  1. avoir apporté des contributions substantielles à la conception ou à la réalisation du travail ; ou à l'acquisition, l'analyse ou l'interprétation des données ; ou à la création de nouveaux logiciels utilisés dans le travail ; ou avoir rédigé ou substantiellement révisé le travail ; ET
  2. avoir approuvé la version soumise (et toute version substantiellement modifiée impliquant la contribution de l'auteur à l'étude) ; ET
  3. avoir convenu d'être personnellement responsable de ses propres contributions et de veiller à ce que les questions relatives à l'exactitude ou à l'intégrité de toute partie du travail, même celles dans lesquelles l'auteur n'a pas été personnellement impliqué, soient correctement investiguées, résolues, et que la résolution soit documentée dans la littérature.

Étant donné que certains critères ne sont pas forcément évidents à apprécier dans le cas d’un dictionnaire analysé, restructuré, augmenté, composé et généré à l’aide de l’outil informatique, une autre façon d’apprécier la qualification d’autorat pourrait se retrouver dans ces questions :

  • Le linguiste aurait-il pu réaliser seul un tel ouvrage (critère qualitatif, sachant que la qualité – structurelle et éditoriale – est ici justement l’intérêt principal, et que le linguiste n’est pas forcément à même d’en apprécier la teneur) ?
  • Quel temps cette chaîne de traitement permet de faire économiser au linguiste sur plusieurs années (critère plus quantitatif, à comparer au temps qu’il imagine nécessaire pour mériter d’accorder un co-autorat pour une publication…) ?
  • Le linguiste remarque-t-il que l’ingénieur se sent investi au point que ce dernier déclare qu’il aura son mot à dire pour la soumission ou le dépôt de l’ouvrage, et qu’il se sentira responsable si une erreur structurelle ou éditoriale aura mené à une erreur plus sémantique ?

Il est d’ailleurs évident qu’il paraît difficile pour un ingénieur d’avoir passé autant de temps qu’un linguiste de terrain pour la description d’une langue, et il n’est pas question ici d’utiliser un critère comparatif d’investissement temporel pour juger de la seule qualité d’auteur. Dans de nombreuses disciplines, un travail substantiel ou significatif est déjà suffisant pour commencer à pouvoir se voir accorder un statut de co-auteur…

Ce point méritait sa propre section, selon moi, car il est facile, pour des raisons diverses, et plus ou moins conscientes, de minimiser le travail des ingénieurs, qui, d’ailleurs, peuvent avoir un très haut niveau de spécialisation ou de polyvalence, et cela mérite d’être reconnu à sa juste valeur !

Décisions éditiques et éditoriales générales

  • Format de page par défaut : A4. Tous les dictionnaires ne seront pas forcément imprimés, et un tel format commode permet une impression aisée avec des équipements standards.
  • Polices de caractères par défaut : style classique et élégant, si possible libres :
    • scripts latins : EB Garamond ;
    • scripts phonétiques : Gentium Plus (Gentium Book Plus est un peu trop grasse – à hauteur d’x proche – relativement aux polices environnantes) ;
    • scripts CJC (chinois-japonais-coréen, sans oublier le cas échéant le vietnamien ancien ou le tangoute) :
      • chinois : style calligraphique régulier (楷书), selon la variante en vigueur pour le public cible (choix en cours selon les droits)…
  • Couleurs pour faire ressortir les langues, les éléments sémantiques différents, etc. (au choix du linguiste, selon qu’il désire un style plus ou moins sobre). Attention à prendre des couleurs dans le modèle CMJN (cyan-magenta-jaune-noir, aussi appelé CMYK) et non RVB (rouge-vert-bleu, aussi appelé RGB) dans le cas où le document aurait vocation à être imprimé. Éventuellement, choisir aussi des couleurs qui restent distinctes à l’œil cas d’impression en noir et blanc…
  • Pages liminaires : (Lua)LaTeX requis ou très fortement recommandé (je peux aider si besoin est selon le temps disponible). Quelques modules conseillés :
    • bibliographie : biblatex (avec le moteur biber);
    • exemples avec gloses (interlinéaires) : (langsci-)gb4e ;
    • tableaux : tabularray ;
    • multiples colonnes : multicol ;
    • sectionnement : titlesec ;
    • en-têtes et pieds-de-page : fancyhdr ;
    • index (multiple) : imakeidx.
  • Mise en page par défaut des dictionnaires :
    • double colonne (équilibrées avec titre le cas échéant centré au-dessus) ;
    • contre-indentation pour les vedettes ;
    • en-têtes (avec première et dernière entrée sur les bords) et pieds de page (avec numéro de page sur bord extérieur) sans ligne horizontale ;
    • citation avec nom d’auteur en petites capitales et seulement les dates en lien (pas l’auteur pour éviter des factorisations asymétriques) ;
    • utilisation de couleurs (modèle CMYK pour l’impression) pour distinguer les éléments.
  • Les titres de chapitre peuvent être plus ou moins stylisés (langage TikZ) ;
  • La couverture peut être à rabats (5 parties), et la tranche aura idéalement son titre à l’horizontale (à l’ancienne), si nécessaire avec des abréviations ou une taille plus petite mais toujours centrée pour la continuité.

Notons que tout est configurable dans des limites raisonnables, selon la philosophie de la collection. Il est important aussi de comprendre que ces dictionnaires sont générés automatiquement après configuration de la structure et du style, ainsi ce qui est gagné en vitesse et en automatisation algorithmique est partiellement perdu en corrections manuelles : certains éléments seront difficiles (voire impossibles dans des cas extrêmes) à corriger. Quelques exemples typiques :

  • des coupures de mot (césures) incorrectes par manque de données linguistiques (non fournies) ou du fait de considérations sémantiques et non plus seulement techniques (coupures selon le sens du mot, impossible à détecter techniquement) ;
  • des alignements ou justifications complexes…

Référencement

La référence de Lexika (le moteur permettant de modéliser et éditer ces dictionnaires) sera ajoutée à la bibliographie du dictionnaire (élément Bibtex). De plus, le dictionnaire fera l’objet d’un dépôt sur HAL (mais le fichier PDF lui-même pourra ne pas y être téléversé, même si cela est fortement conseillé…).

Éditeur externe

Par principe et par défaut, les données dictionnaires publiés (version structurée XML, version éditée PDF, etc.) le sont avec la licence CC BY NC SA (version 4). Dans le cas où le dictionnaire est prévu pour être édité par un tiers, notamment pour un usage commercial, des discussions plus approfondies devront avoir lieu.

Polices utilisées

Dans la mesure du possible, les polices utilisées sont des polices libres de droit. Cependant, il arrive que l’on doive utiliser des polices non libres ; en ce cas, je tenterai d’obtenir une autorisation (sans certitude de succès…).

Scripts Nom Licence Créateur Autorisation Commentaire
Latin, cyrillique, grec Gentium Plus OFL SIL - Police par défaut pour l’API (phonétique et langue source sans écriture).
Gentium Book Plus OFL SIL - Police intéressante pour l’API, mais légèrement trop grasse relativement à ses polices voisines (risque de confusion avec du gras).
EB Garamond OFL Georg Mayr-Duffne, Octavio Pardo - Police par défaut pour le français voire aussi l’anglais.
Cormorant OFL Christian Thalmann - Police intéressante et moderne, mais assez typée et plus adaptée pour la grande taille.
CJCV (chinois-japonais-coréen-vietnamien : sinogrammes, etc.) (zhōng)(wén)(biāo)(zhǔn)(jiāo)(huàn)()(quán)()() (TW-Kai) Open Government Data Ministère de l’Éducation taïwanais - Police par défaut pour le CJC (chinois simplifié et traditionnel) en style taïwanais (police calligraphique régulière libre la plus complète).
(huá)(wén)(kǎi)() (STKaiti) Commerciale SinoType oui (depuis le 01/07/2024, certificat officiel no 202407000001003-000) Police par défaut pour le CJC (chinois simplifié et traditionnel).
(fāng)(zhèng)(xīn)(kǎi)() (FZNewKai) Commerciale FounderType non (pas de réponse) Police utilisée pour le CJC (chinois simplifié et traditionnel) dans certaines versions internes en 2023-2024.
Noto Serif CJK / Source Han Serif OFL Google/Adobe - Police intéressante et complète (chinois simplifié, traditionnel, japonais et coréen), mais pas de style calligraphique régulier.
Tibétain BabelStone Tibetan OFL Andrew West, Christopher J. Fynn - Police par défaut pour le tibétain.
Jomolhari OFL Christopher J. Fynn - Ancienne police par défaut pour le tibétain (mais ligne de base trop haute, notamment).
Symbolique (¶, ⬖, ⬒, ■, ►, ▻, ◈, •, etc.) DejaVu Serif domaine public Bitstream, Tavmjong Bah - Police par défaut pour le symbolique.
Symbola UFAS (non commerciale ni éducative) George Douros non Police utilisée pour le symbolique dans certaines versions internes en 2023-2024.

Si jamais un document mis à disposition du public contient une police non libre et pour laquelle nous n’avons pas l’autorisation, il s’agit vraisemblablement d’une erreur. Nous vous remercions de nous le signaler et une nouvelle version sera republiée dans la mesure du possible.