LINGUISTIC

11 februarie 2024

Traducerea automata

   Traducerea automată (MT) este un domeniu științific interdisciplinar care reunește lingviști, lexicologi, informaticieni și practicieni în traducere în urmărirea unui obiectiv comun: proiectarea și dezvoltarea resurselor electronice și a software-ului de calculator capabil să traducă automat un document într-o limbă sursă. (SL) într-un text echivalent într-o limbă țintă (TL). Prin extensie, tehnologiile de traducere automată includ, de asemenea, instrumente menite să ajute traducătorii umani să-și desfășoare munca mai eficient folosind tehnologia de traducere asistată de calculator (CAT).

    Traducerea automată a început la sfârșitul anilor 1950 cu încercări de a traduce automat rusă în engleză. Realizarea greutății extreme a sarcinii a determinat comunitatea MT să-și concentreze eforturile pe probleme mai concentrate și mai realiste, pornind în domeniul studiilor de procesare a limbajului natural (NLP). MT a fost astfel împărțit în trei subprobleme principale: analiza SL într-o reprezentare mai abstractă, transferul acestei reprezentări într-o reprezentare țintă echivalentă și, în final, generarea unei realizări de suprafață adecvată în TL. Valorificând progresul în NLP aplicat și inteligența artificială, MT a făcut progrese lente în următorii treizeci de ani, folosind în mare parte modele simbolice de procesare a limbajului pentru a realiza procesele de analiză, transfer și generare. În ciuda mai multor realizări remarcabile, aceste modele au fost contestate în anii 1980 de metodologiile bazate pe corpus, care se bazează pe analiza unor corpuri mari de bitexte traduse manual pentru a genera traduceri ale documentelor noi. În special, abordările statistice în traducerea automată introduse la începutul anilor 1990 și îmbunătățite ulterior în deceniul următor au câștigat rapid amploare. Începând cu 2014, abordările statistice au fost înlocuite de tehnici mai puternice de învățare automată bazate pe rețele neuronale artificiale.

   Bazându-se pe exploatarea sistematică a corpurilor uriașe de texte monolingve și bitexte multilingve disponibile pe Internet, „Traducerea automată neuronală” pare a fi cea mai eficientă abordare astăzi pentru o mare varietate de utilizări. Abordările neuronale pot gestiona aproape orice pereche de limbi, cu condiția să fie disponibil un acces suficient la corpurile paralele. O evoluție recentă remarcabilă este dezvoltarea modelelor de traducere multilingve care sunt capabile să gestioneze direcții în mai multe limbi într-un singur sistem.

 

Oxford Bibliographies Online

 

PHRASEA LINGUISTIC TOOLS