Principes d’édition
Les textes du projet « Gregorius Digital » sont transcrits et édités selon les principes développés et mis en œuvre par l’équipe de la Bibliothèque Universitaire de Heidelberg pour les éditions numériques du Pauvre Henri et de l’Iwein de Hartmann von Aue : « Der arme Heinrich – digital » et « Iwein – digital ». La saisie se divise fondamentalement en deux phases : la transcription des manuscrits et éditions anciennes d’un côté et le traitement éditorial de celle-ci par des normalisations de l’autre.
- Tous les caractères sont transcrits aussi précisément que possible, non seulement les lettres, mais aussi la ponctuation : les points de rime, les marques de limites des mots, les signatures des cahiers, les signes de dépassement d’une ligne, les signes de séparation, d’insertion ou de permutation. En revanche, ce qui n’est pas pertinent pour l’établissement du texte n’est pas saisi : les détériorations des supports si elles n’entraînent pas de perte de texte, les ornements en dehors du miroir d’écriture, les essais de plumes, etc. En cas de doute, l’élément concerné est décrit dans une note.
- Les ajouts tels que les titres de copiste ou les explicits sont saisis et encodés en tant que tels.
- Les retours à la ligne, les changements de page et de colonne sont marqués afin de permettre une correspondance exacte entre le texte et l’image.
- La numérotation des vers ou des lignes se fonde sur une édition de référence, à défaut, sur le manuscrit ou l’édition ancienne transcrit. La numérotation est toujours continue et ne recommence pas à chaque nouvelle page. Ces numéros serviront de référence dans les tableaux de concordance et l’appareil avec les leçons divergentes. Les vers ou lignes supplémentaires par rapport à l’édition de référence seront numérotés avec des minuscules (par exemple ceux ajoutés à la fin du Gregorius de Hartmann : 4006a, 4006b, etc.).
- Ne sont considérés comme lacunes que les cas où un dommage matériel a entraîné une perte de texte, et non par exemple des vers manquants par rapport à l’édition de référence. La transcription indique aussi précisément que possible le nombre de caractères ou de lignes perdus.
- Les corrections anciennes effectuées par les copistes ou les typographes (par exemple ratures, insertions, substitutions ou modifications) sont transcrites. Les insertions modernes (ajoutées après le XVIIIe siècle) ne sont pas prises en compte ou seulement dans des notes. Les corrections complexes impossibles à décrire de manière satisfaisante par l’encodage sont commentées.
- Les passages dont la lecture est incertaine sont transcrits dans la mesure du possible, mais l’incertitude est signalée par un code.
- La séparation des mots des manuscrits et éditions anciennes est conservée. Lorsqu’il est impossible de distinguer un espace d’une graphie conjointe, la transcription s’appuie sur l’usage général du témoin transcrit.
- Lors de la transcription, le texte est tokenisé, c’est-à-dire que, d’un point de vue linguistique, chaque mot est saisi numériquement en tant que tel. Une telle unité s’appelle un token. Certains mots attachés dans le témoin transcrit sont tokenisés séparément. Dans ce cas, l’espace entre deux mots est supprimé. Inversement, les séquences présentant un ou plusieurs espaces dans le témoin transcrit mais formant une seule unité lexicale sont saisies comme un seul token.
- Les 26 lettres de l’alphabet latin sont en principe normalisées selon les usages modernes. Ainsi, aucune distinction n’est faite entre les différentes formes de d, i, r, s attestées dans les manuscrits et éditions anciennes. La seule exception à cette règle est le s long avec une hampe <ſ>, car sa ressemblance avec le f a souvent donné lieu à des erreurs de lecture et de transcription, même déjà à l’époque médiévale.
- La casse est conservée. Au besoin, il convient de définir dans les cas particuliers ce qui est considéré comme une majuscule et ce qui est considéré comme une minuscule. En règle générale, une majuscule diffère de la minuscule par sa forme et non seulement par sa taille.
- Sont considérées comme des litterae notabiliores les lettres mises en exergue en début de vers ou simplement en début de texte ; il peut s’agir d’initiales décalées en retrait vers la gauche ou encore de débuts de vers ou de mots rubriqués en rouge. Ces lettres sont toujours reproduites avec une majuscule, même si la lettre a la forme d’une minuscule, éventuellement agrandie. L’encodage signale le type de mise en exergue. Même dans les manuscrits sans mise en exergue des débuts de vers, mais recourant régulièrement à des majuscules, les graphèmes ayant la forme de minuscules sont saisis comme des majuscules.
- Les lettres i et j (ainsi que y) sont distinguées lorsqu’un texte présente une tendance claire vers une distinction graphémique (généralement dans les manuscrits en textura).
- La régularisation des i et j ou des u et v selon la valeur sonore vocalique et consonantique, optionnelle lors de l’affichage, est encodée au moment de la transcription.
- Les lettres suscrites (les superscripta) sont transcrites avec précision, par exemple les lettres en exposant, les trémas, les caractères accentués, etc.
- Les signes diacritiques sont placés au-dessus ou en dessous de la lettre à laquelle ils se rapportent fonctionnellement. Les éventuels décalages horizontaux, fréquents dans les manuscrits de la fin du Moyen Âge, ne sont donc pas signalés.
- Les abréviations sont saisies en tant que telles et leur résolution est encodée en même temps pour permettre à l’usager de choisir entre l’abréviation et la résolution lors de l’affichage du texte.