Bases de données : arrière-plan

Les registres de personnes, organisations, lieux et index sont les clés pour le recueil des Sources du droit suisses (SDS) ; grâce à eux un accès efficace aux textes sources est possible. En général, il ne changera pas dans le futur : La recherche en plein texte qui sera possible pour les éditions digitales est un complément utile, mais ne remplacera pas l’indexation manuelle.

La recherche en plein texte, connu p.e. par les moteurs de recherche internet, travaille sans compréhension des texte. Elle fonctionne bien, si les auteurs et rechercheurs formules des concepts de la même façon ; dans ce cas les mêmes mots reviennent dans la recherche et dans les documents. Les SDS contiennent des textes de plus de 1000 ans, de différentes régions et en différentes langues et graphies. Même pour des experts il est impossible de prévoir, comment les scribes du XIIe siècle formulaient certaines concepts, de plus en latin, français etc. À ceci s’ajoute que la langue et la graphie sont soumises à une évolution énorme et qu’il n’existe pas d’orthographies normalisées.

Ainsi il est illusoire pour les SDS de trouver automatiquement un texte pertinent en recherchant avec un terme moderne, p.e. « femme » ou « Frau ». Même en recherchant avec différentes graphies comme frauw, fraw, fro, frouw ou vrau, le problème du changement de la signification du terne n’est pas encore résolu - comme la recherche ne donne pas de textes utilisant le terme de wib, wyb, wybs persohn etc. De même pour les personnes et lieux.

L’indexation manuelle est jusqu’alors la seule possibilité pour résoudre ce problème. Il n’est pas judicieux de reprendre tels quels les registres existant ainsi que la façon de les créer dans le médium digitale, mais d’utiliser les moyens actuelles.

Un grand désavantage des registres existants est qu’ils ne font référence qu’à un seule volume. Chaque utilisateur des SDS souhaiterait un registre complèt des SDS. Sur papier cette solution n’est pas réalisable à cause de l’étendue, mais ceci ne pose plus de problème pour le médium digitale, même si nous allons nous concentrer ici sur un registre complèt des futurs volumes.

D’un point de vue informatique, le registre complèt serait donc une base de données qui saisit les informations concernant les personnes, organisations, lieux et termes historiques avec des références aux textes sources. Une telle base de données pourrait être utilisée comme un regestre traditionnel, quoique autres applications seraient possible. De plus, une base de données commune faciliterait le travail des éditeurs et augmenterait la consistence, comme les entrées des personnes, organisations, lieux et termes souvent mentionnés ne doivent être répétées à chaque fois.