ladin | english | deutsch
Zum Seitenende

bistro, il Sistema informativo per la terminologia giuridica

bistro, è il Sistema informativo per la terminologia giuridica sviluppato dai ricercatori dell’Istituto di Comunicazione Specialistica e Plurilinguismo dell’Accademia Europea di Bolzano. Il sistema mette a disposizione degli utenti una serie di servizi che consentono la ricerca, l’analisi e la traduzione di termini e testi che appartengono al linguaggio giuridico-amministrativo italiano, tedesco e ladino.

Il nome bistro evoca l’atmosfera parigina dei locali in cui vengono servite pietanze veloci e nasconde un origine che risale ai tempi dell’occupazione della Francia da parte delle forze alleate che sconfissero Napoleone. Si narra infatti che i soldati russi, giunti a Parigi dietro i resti dell’armata napoleonica, fossero soliti sollecitare i camerieri parigini incitandoli a servirli Bystro! Bystro! (Presto! Presto!). Dall’utilizzo di questa esortazione discese la denominazione “bistrò” per i locali in cui si consuma un pasto veloce.

Il nome scelto per il sistema intende richiamare l’idea della rapidità della ricerca e del reperimento di informazioni complete e fungibili da parte dell’utente.

bistro si compone di:

  • una banca dati contenente circa 50 000 termini giuridico-amministrativi appartenenti all’ordinamento italiano (termini in italiano e equivalenti in lingua tedesca e ladina) e a quelli dei paesi dell’area tedescofona (Austria, Germania, Svizzera). La banca dati contiene anche la terminologia in lingua tedesca approvata dalla Commissione Paritetica di Terminologia (TerKom) per l’Alto Adige, sulla base delle ricerche comparative e linguistiche preliminarmente condotte dai ricercatori dell’Istituto di Comunicazione Specialistica e Plurilinguismo;
  • un corpus bilingue (CATEx) italiano e tedesco, ossia una raccolta di testi legislativi italiani con traduzione tedesca. Tra questi, il Codice Civile, il Codice di Procedura Civile, il Codice Fallimentare, il Testo Unico delle Imposte sui Redditi, nonché una raccolta di leggi provinciali della Provincia Autonoma di Bolzano;
  • un corpus trilingue (CLE) in lingua italiana, tedesca e ladina, costituito da documenti amministrativi provenienti dai comuni della Val Badia e della Val Gardena, da documenti messi a disposizione dall’Istituto Pedagogico Ladino e da una raccolta di leggi provinciali provenienti dall’Ufficio Questioni Linguistiche della Provincia Autonoma di Bolzano;
  • uno strumento di riconoscimento termini che individua automaticamente, all’interno di un documento o di una pagina web caricati su bistro dall’utente, i termini contenuti nella banca dati e consente così di accedere alle loro possibili traduzioni;
  • uno strumento di estrazione termini che consente di ricavare automaticamente, all’interno di pagine web o di documenti caricati su bistro dall’utente, liste di termini candidati che possono essere utilizzate come punto di partenza per ricerche terminografiche comparate;

L’utilizzo del Sistema informativo bistro è gratuito.



Corpus CATEx

Il corpus costituito con il progetto CATEx (Computer Assisted Terminology Extraction) è una raccolta di testi di legge italiani con le relative traduzioni in tedesco, disponibile in formato elettronico tramite bistro. I testi provengono dalla cosiddetta Blaue Reihe, una collana di traduzioni in lingua tedesca dei principali codici di legge italiani e da una raccolta di leggi provinciali.


Testi contenuti nel CATEx

  • Codice civile - Italienisches Zivilgesetzbuch
  • Codice di procedura civile - Italienische Zivilprozeßordnung
  • Codice di procedura penale - Italienische Strafprozeßordnung
  • Processo amministrativo - Der Italienische Verwaltungsprozess
  • Fallimento ed altre procedure concorsuali - Italienisches Konkursrecht und andere Insolvenzverfahren
  • Ordinamento del notariato italiano - Italienische Notariatsordnung
  • Testo unico delle imposte sui redditi - Einheitstext der Steuern auf das Einkommen
  • Leggi complementari al codice civile - Nebengesetze zum Italienischen Zivilgesetzbuch
  • Raccolta di leggi provinciali (della Provincia Autonoma di Bolzano – Alto Adige)

Complessivamente il corpus si compone di circa 5 milioni di parole italiane e tedesche.

Le versioni di ogni testo nelle due lingue ufficiali della provincia (italiano e tedesco) sono allineate a livello di paragrafo. Ciò significa che ad ogni paragrafo in lingua italiana sarà affiancata la relativa traduzione in tedesco e viceversa. In tal modo, l’utente avrà sempre accesso immediato ad un testo e alla sua traduzione.


A cosa serve

Il CATEx offre la possibilità di condurre ricerche terminologiche e linguistiche in generale, nonché di operare confronti tra le due lingue (italiano e tedesco) in modo veloce e flessibile. L’accesso alle informazioni è garantito da un’interfaccia utente che permette di effettuare ricerche mirate all’interno del corpus. Si possono cercare parole semplici o composte e intere espressioni, come ad esempio “delitto”, “colpa grave”, “dolo o colpa grave”, ma è anche possibile combinare la ricerca tra le due lingue in modo da ottenere solo le occorrenze di un termine a cui corrisponda una determinata traduzione nell’altra lingua. Ad esempio, si possono cercare tutti i casi in cui “colpa” è stato tradotto con “Fahrlässigkeit” piuttosto che con “Schuld”.


Approfondimenti

Il progetto CATEx è stato realizzato da Johann Gamper. Per approfondimenti e ulteriori informazioni si rimanda ai seguenti articoli in lingua inglese:



Corpus CLE

Il Corpus Ladino dell’EURAC (CLE), è stato creato nell’ambito del progetto sulla terminologia giuridico-amministrativa ladina, TermLad II. Si tratta di una raccolta di testi amministrativi in formato digitale provenienti da comuni e uffici pubblici della Provincia di Bolzano. Ogni singolo testo di partenza, redatto nella maggior parte dei casi in lingua italiana, è collegato alle relative traduzioni in tedesco e ladino (grazie all’allineamento a livello di paragrafo/frase). Complessivamente il corpus CLE si compone di circa 5000 documenti (8,5 milioni di parole) in italiano, ladino e tedesco.


A cosa serve

Il corpus CLE viene principalmente utilizzato per effettuare ricerche volte all’elaborazione di schede terminologiche, ovvero per documentare la terminologia presente all’interno dei testi, e per estrapolare contesti e definizioni. È inoltre possibile analizzare le diverse scelte traduttive e la loro frequenza. Il corpus CLE è accessibile al pubblico grazie ad una maschera di ricerca che permette all’utente esterno di effettuare ricerche mirate inserendo sia il termine italiano, sia il termine tedesco, sia il termine ladino.


La raccolta dei testi

I testi contenuti nel CLE sono stati messi a disposizione dai Comuni della Val Badia e della Val Gardena, dall’Ufficio Questioni Linguistiche della Provincia di Bolzano e dall’Istituto Pedagogico Ladino (IPL).


Approfondimenti

Streiter, O./ Stuflesser, M./ Ties, I.: CLE, an Aligned, Tri-lingual Ladin-Italian-German Corpus. Corpus Design and Interface. LREC 2004, workshop "First Steps for Language Documentation of Minority Languages: Computational Linguistic Tools for Morphology, Lexicon and Corpus Compilation" Lisbona, 24 maggio 2004.



Strumenti linguistici

Gli strumenti linguistici di cui l’utente può usufruire tramite bistro sono la funzione di riconoscimento termini e di estrazione termini. Entrambe sono volte all’ottimizzazione del lavoro traduttivo e terminologico.


Il modulo di riconoscimento termini consente all’utente di effettuare una ricerca terminologica all’interno di un testo o di una pagina web di sua scelta. Al tale scopo l’utente può inserire il testo in questione in bistro attraverso le funzioni di “copia”/ “incolla” direttamente dal documento (in formato *.doc., *.rtf, o *.txt) oppure indicare l’ indirizzo internet (URL) di un testo nell’apposita maschera di ricerca.

Terminata tale operazione, il testo viene visualizzato in bistro e i termini in esso contenuti, già presenti nella banca dati terminologica di bistro, vengono segnalati attraverso un’evidenziazione. Dai singoli termini si può poi accedere alle relative schede terminologiche.

L’utilizzo di tale funzione consente all’utente di:

  • accertare la presenza di un termine all’interno della banca dati attraverso apposita segnalazione del medesimo con colori diversi;
  • disporre di definizioni, contesti o traduzioni presenti nella banca dati terminologica di bistro;
  • conoscere il settore di appartenenza del termine (diritto amministrativo, penale, ecc.).

Anche per il modulo di estrazione termini si utilizza il procedimento sopra descritto. In questo caso bistro estrapola dal testo prescelto potenziali “candidati-termini” e ne stila una lista, un glossario da utilizzare al fine di eseguire ulteriori ricerche terminologiche.