Lingvistica computațională (CL) este o combinație interdisciplinară de informatică și lingvistică, cu perspective suplimentare extrase din domenii precum psiholingvistica și filosofia limbajului. Preocuparea sa principală este modelarea computațională a proceselor lingvistice urmărită ca un exercițiu orientat teoretic al cărui scop este fie de a oferi modele care să ne ajute să obținem o perspectivă asupra naturii limbajului și a mecanismului de procesare a limbajului uman, fie să sprijine dezvoltarea de aplicații software care nu lucruri utile cu limbajul (un domeniu denumit uneori tehnologie lingvistică).
Pentru unii, termenul „lingvistică computațională” este sinonim cu procesarea limbajului natural (NLP); totuși, din perspectiva materialului oferit aici, NLP este mai orientat spre aplicații decât CL. Deși oferim câteva indicații pentru lucrări care descriu aplicațiile NLP, accentul nostru principal aici este pe bazele teoretice pe care CL le oferă activităților cu un accent mai practic.
Prima lucrare în CL datează din anii 1950, când s-au făcut primele încercări de a traduce automat rusă în engleză. Până la sfârșitul anilor 1980, majoritatea lucrărilor din domeniu au fost preocupate de ceea ce am putea numi sisteme simbolice, implicând adesea colecții mari de reguli scrise de mână pentru a modela un fenomen lingvistic. De la sfârșitul anilor 1980 a existat o schimbare semnificativă către metodele statistice, în care regulile și generalizările sunt învățate din date, mai degrabă decât produse manual; acest lucru a devenit posibil doar ca urmare a combinației dintre, pe de o parte, cantități mari de date care devin disponibile, în special prin intermediul World Wide Web, și, pe de altă parte, creșterile imense ale puterii de procesare a computerului necesare pentru a executa multe iterații. peste seturi mari de date pentru a obține informații din acestea. În aproape toate subdomeniile CL se poate împărți în general munca desfășurată în perioadele de dinainte și de după această „revoluție statistică”.
Materialul de aici este organizat în jurul descompunerii convenționale a studiului lingvistic în fonologie, morfologie, sintaxă, semantică și pragmatică. Lucrările care se ocupă în primul rând de recunoașterea și sinteza vorbirii nu sunt acoperite. Preocuparea în primul rând este cu munca la prelucrarea limbii engleze; din nou, o mare parte din munca în CL este aplicabilă altor limbi, dar engleza deține o poziție privilegiată ca obiectiv al majorității cercetărilor.
Oxford Bibliographies Online