ladin | italiano | english
Zum Seitenende

bistro, das Informationssystem für Rechtsterminologie

bistro ist das Informationssystem für Rechtsterminologie, das von den WissenschaftlerInnen des Instituts für Fachkommunikation und Mehrsprachigkeit an der Europäischen Akademie Bozen entwickelt wurde. Das System bietet dem Benutzer eine Reihe von Tools zur Suche, Analyse und Übersetzung von italienischen, deutschen und ladinischen Termini und Texten aus den Bereichen Recht und Verwaltung.

Der Name bistro lässt an die Pariser Atmosphäre denken mit den kleinen Lokalen, in denen Imbisse serviert werden. Die Bezeichnung geht auf die Besetzung Frankreichs durch die alliierten Streitmächte nach der Niederlage Napoleons zurück. Es wird erzählt, dass russische Soldaten, die hinter den Resten der napoleonischen Armee in Paris ankamen, die Kellner mit den Worten Bystro! Bystro! (Schnell! Schnell!) zu einer rascheren Bedienung antrieben. Aus dem Gebrauch dieser Aufforderung entwickelte sich die Bezeichnung „Bistro“ für die Lokale in denen Schnellimbisse serviert werden.

In diesem Sinne soll der Name des Informationssystems die Idee einer schnellen Suche und Beschaffung von vollständigen und nützlichen Informationen vermitteln.

bistro besteht aus:

  • einer Datenbank, die rund 50.000 Termini der italienischen Rechtsordnung (italienische Termini mit den entsprechenden deutschen und ladinischen Übersetzungen) sowie der bundesdeutschen, österreichischen und Schweizer Rechtsordnungen (in deutscher Sprache) umfasst. Es ist auch die deutschsprachige Terminologie enthalten, die gemäß der Entscheidungen der Paritätischen Terminologiekommission (TerKom) in Südtirol verwendet werden soll. Die Entscheidungen der Terminologiekommission stützen sich auf die rechtsvergleichende und linguistische Vorarbeit der WissenschaftlerInnen des Instituts für Fachkommunikation und Mehrsprachigkeit;
  • einem zweisprachigen Korpus (CATEx), das heißt aus einer Sammlung von italienischen Gesetzestexten und deren Übersetzungen ins Deutsche. Darunter befinden sich das Zivilgesetzbuch, die Zivilprozessordnung, die Texte zum italienischen Konkursrecht, der Einheitstext der Steuern auf das Einkommen, eine Sammlung von Landesgesetzen der Autonomen Provinz Bozen;
  • einem dreisprachigen Korpus (CLE), das heißt aus einer Sammlung von italienischen, ladinischen und deutschen Verwaltungstexten aus dem Gadertal und dem Grödnertal, von Dokumenten, die vom Ladinischen Pädagogischen Institut zur Verfügung gestellt wurden, von Landesgesetzen, die vom Amt für Sprachangelegenheiten geliefert wurden, sowie von Material;
  • einem Termerkennungstool, mit dem die in der Datenbank enthaltenen Termini automatisch innerhalb eines in bistro geöffneten Dokuments oder einer in bistro geladenen Webseite identifiziert werden, so dass der Benutzer bei Bedarf die dazu in der Datenbank vorhandenen Übersetzungen aufrufen kann;
  • einem Termextraktionstool, mit dessen Hilfe von in bistro geöffneten Dokumenten oder in bistro geladenen Webseiten automatisch Listen von Termkandidaten erstellt werden können, die als Ausgangspunkt für die vergleichende Terminologiearbeit dienen.

Das Informationssystem bistro ist kostenlos über das Internet zugänglich.


Korpus CATEx

Das Korpus, das mit dem Projekt CATEx (Computer Assisted Terminology Extraction) geschaffen wurde, ist eine Sammlung von italienischen Gesetzestexten und deren Übersetzungen ins Deutsche, die in elektronischer Form durch das Informationssystem bistro zugänglich ist. Das Korpus CATEx enthält die Texte der „Blauen Reihe“, nämlich die Übersetzungen der wichtigsten italienischen Gesetzestexte, sowie eine Reihe von Landesgesetzen der Provinz Bozen-Südtirol.


Liste der im Korpus CATEx enthaltenen Texte:

  • Codice civile - Italienisches Zivilgesetzbuch
  • Codice di procedura civile - Italienische Zivilprozeßordnung
  • Codice di procedura penale - Italienische Strafprozeßordnung
  • Processo amministrativo - Der Italienische Verwaltungsprozess
  • Fallimento ed altre procedure concorsuali - Italienisches Konkursrecht und andere Insolvenzverfahren
  • Ordinamento del notariato italiano - Italienische Notariatsordnung
  • Testo unico delle imposte sui redditi - Einheitstext der Steuern auf das Einkommen
  • Leggi complementari al codice civile - Nebengesetze zum Italienischen Zivilgesetzbuch
  • Sammlung der Landesgesetze (der Autonomen Provinz Bozen - Südtirol)

Das gesamte Korpus besteht aus rund 5 Millionen Wörter in italienischer und deutscher Sprache.

Die Fassungen der Texte in den beiden offiziellen Sprachen der Autonomen Provinz sind auf Paragraphenebene aliniert. Das bedeutet, die Texte wurden so bearbeitet, dass dem Benutzer für jeden Teil des Textes der sofortige Zugriff auf die entsprechende Version in der anderen Sprache möglich ist.


Verwendungsmöglichkeiten

Das Korpus CATEx ist, dank der modernen Technik der Computerlinguistik, ein Hilfsmittel zur terminologischen und linguistischen Forschung im Allgemeinen und zur schnellen und flexiblen Gegenüberstellung von zwei Sprachen (Italienisch und Deutsch). Der Zugang zu den Informationen wird durch eine Benutzerschnittstelle gewährleistet, das Suchen innerhalb des Korpus ermöglicht. Es können einzelne Wörter oder Wortgruppen gesucht werden, z. B. „Fahrlässigkeit“, „grobe Fahrlässigkeit“. Es ist aber auch möglich, die Suche zwischen den beiden Sprachen zu kombinieren, um einen Terminus nur in Verbindung mit einer bestimmten Übersetzung in der anderen Sprache zu finden. Ein Beispiel wäre dafür die Suche nach allen Fällen, in denen „colpa“ mit „Fahrlässigkeit“ übersetzt wurde und nicht mit „Schuld“.


Weitere Informationen

Das Projekt CATEx wurde von Johann Gamper koordiniert. Für weitere Informationen wird auf folgende Artikel in englischer Sprache verwiesen:


Korpus CLE

Das ladinische Korpus der Eurac CLE, wurde im Rahmen des Projekts zur ladinischen Rechts- und Verwaltungsterminologie, TermLad II, geschaffen. Es handelt sich dabei um eine Sammlung von Verwaltungstexten, die von den öffentlichen Ämtern der Autonomen Provinz Bozen verfasst und in elektronischer Form zur Verfügung gestellt wurden. Jeder Ausgangstext, der in den meisten Fällen in Italienisch verfasst wurde, ist mit den deutschen und ladinischen Übersetzungen dank der Alinierung verbunden. Das Korpus umfasst rund 5000 Dokumente (8,5 Millionen Wörter) auf Deutsch, Italienisch und Ladinisch.


Verwendungszweck

Das Corpus CLE wird besonders für Recherchearbeiten zur Erarbeitung von terminologischen Einträgen verwendet oder, genauer gesagt, um die einzelnen Termini, die im Korpus enthalten ist, zu dokumentieren und Kontexte und Definitionen herauszufiltern. Des Weiteren ist es möglich die verschiedenenen Übersetzungslösungen zu analysieren und ihre Frequenz zu erfassen. Das Korpus CLE ist dank einer online Suchmaske öffentlich zugänglich, mit deren Hilfe die Benutzer sowohl italienische, deutsche als auch ladinische Wörter im Korpus suchen können.


Textsammlung

Die Dokumente, die im Korpus enthalten sind, wurden von den Gemeinden des Gadertales und des Grödnertales, vom Amt für Sprachangelegenheiten der Provinz Bozen und vom Ladinischen Pädagogischen Institut (IPL) zur Verfügung gestellt.


Weitere Informationen

Streiter, O./ Stuflesser, M./ Ties, I.: CLE, an Aligned, Tri-lingual Ladin-Italian-German Corpus. Corpus Design and Interface. LREC 2004, Workshop "First Steps for Language Documentation of Minority Languages: Computational Linguistic Tools for Morphology, Lexicon and Corpus Compilation" Lissabon, 24. Mai 2004.



Termwerkzeuge

Die Termwerkzeuge, die dem Benutzer von bistro zur Verfügung stehen sind die Termerkennung und die Termextraktion. Beide Werkzeuge sind dazu gedacht, das Übersetzen und die Terminologiearbeit zu erleichtern und effizienter zu gestalten.


Die Termerkennung ermöglicht dem Benutzer terminologische Untersuchungen in einem von ihm ausgewählten Text oder in einer Internetseite durchzuführen. Der Benutzer kann mit den Funktionen „Kopieren“ und „Einfügen“ das gesamte Dokument (in Format *.doc, *.rtf oder *.txt) direkt in bistro einfügen oder die URL-Adresse eines Textes in das vorgesehene Fenster eingeben.

Danach zeigt bistro den Text an und alle Termini, die bereits in der Datenbank vorhanden sind, werden farblich hervorgehoben. Ausgehend von den einzelnen Termini kann direkt auf den vollständigen terminologischen Eintrag zugegriffen werden.

Mit dieser Funktion kann der Benutzer:

  • sicherstellen, ob die Termini in der Datenbank vorhanden sind, da sie farblich gekennzeichnet werden;
  • auf Definitionen, Kontexte und Übersetzungen zugreifen, die in der Terminologiedatenbank vorhanden sind;
  • die Angabe des Fachgebietes, zu dem der jeweilige Terminus gehört, einsehen (Verwaltungsrecht, Strafrecht, usw.).

Auch die Termextraktion wird auf die oben beschriebene Art und Weise verwendet. In diesem Fall extrahiert das System aus dem ausgewählten Text oder aus einer Internetseite mögliche Termkandidaten in Form eines Glossars, mit denen dann weitere terminologische Untersuchungen in der Datenbank durchgeführt werden können.