Maŝintradukado

(Alidirektita el Maŝina tradukado)

Maŝintradukadomaŝina tradukado estas procezo de aŭtomata tradukado de unu natura lingvo al alia pere de komputilo. Maŝintradukado daŭre restas nevenkita defio por informadiko, pli specife por ĝia branĉo lingvokomputiko. Hodiaŭ jam haveblas pluraj sistemoj, kies eliro ne estas perfekta, sed estas sufiĉe altkvalita por esti uzata en multaj kampoj, kie ĝi helpas al homaj tradukantoj.

Oni ofte sugestas Esperanton kiel taŭgan ilon por maŝintradukado - aŭ kiel fontolingvo por tradukado en naciajn lingvojn, aŭ kiel pontolingvo, pere de kiu oni tradukas tekstojn de unu nacia lingvo al alia. Projektoj prilaborantaj kaj utiligantaj tiujn ĉi trajton de Esperanto estas ekzemple Distribuita Lingvo-Tradukado (DLT), aŭ la pli nova UNIKOM.

Pravizio de la homaro redakti

Kompreni fremdan lingvon sen lerni ĝin — tio estas malnova revo. La invento de la komputilo en kombino kun la studo de la fenomeno de lingvo kiel scienca disciplino malfermis je la unua fojo konkretan vojon plenumi tiun vizion.

Ĉefaj okazintaĵoj en historio de maŝintradukado redakti

  • Jaro 1933: Smirnov-Trojanski de Rusio faris projekton pri tradukmaŝino, sed ĝi neniam estis konstruata.
  • Jaro 1946: Warren-Weaver kaj Andrew D. Boothe, en Usono, kune kun R. H. Richens, de Anglujo, komencis seriozajn klopodojn disvolvi aŭtomatan traduksistemon pere de komputilo. En 1951 eniris en la grupon Yehoshua Bar-Hillel.
  • Jaro 1952: Okazis la unua kongreso pri Aŭtomata Tradukado en ?
  • Jaro 1960: Aperas la libro "Automatic Language Translation", fare de A. G. Oettinger, pri la tiutempa stato de la tekniko.
  • Jaro 1962: Aperas la anglalingva libro "The Future of Machine Translation", fare de la jam menciita Bar-Hillel.
  • Jaro 1964: En Usono, la Nacia Konsilantaro pri Esplorado kaj la Nacia Scienca Akademio formis komitaton "ALPAC", kies tasko estis studi objektive la rezultojn de la ĝistiamaj esploroj pri aŭtomata tradukado, kaj konkludi pri la estonteco de tiuj esploroj.
  • Jaro 1966: La komitato "ALPAC" diskonigas siajn konkludojn, kiuj estis pesimismaj pri la ebleco de kontentiga aŭtomata tradukado. Tamen, la studo opinias, ke spite de la verŝajna malsukceso, la esploroj tiutemaj ja utilis por la lingvistiko kaj por la tradukarto ĝenerale, danke al la disvolvo de:
Pli praktikaj metodoj por taksi tradukojn.
Rimedoj por plirapidigi la tradukadon.
Mezuroj pri kvalito de tradukaĵoj.
Mezuroj pri kosto de tradukado.
Statistikoj pri tradukaĵoj.
Studoj pri prokrasto de tradukoj kaj ties kaŭzoj.
Konsultiloj por tradukistoj.
Iomgrada profito de aŭtomata tradukado.

En la sekvantaj jaroj, la esplorado pri aŭtomata tradukado bremsiĝis, verŝajne pro influo de la malentuziasmiga informo de ALPAC, kio etigis la monan kaj alispecajn apogojn por tiutema esplorado.

Tamen, aliaj institucioj kaj komercaj entreprenoj prenis denove la taskon evoluigi sistemojn por aŭtomata tradukado atingante progresojn.

Ĝenerala skizo pri la maŝintraduka procezo redakti

 

Ekzemplo de sintaksa analizo de frazeroj redakti

 

Nombro de tradukprogramoj necesaj por kvin lingvoj redakti

Maldekstre: Du programoj por ĉiu lingvo-paro, unu programo por ĉiu direkto. Dekstre: Helpe de ponto-lingvo (kiel projekto DLT uzis Esperanton), nur du programoj por ĉiu lingvo (eksterlasante la ponto-lingvon el tiu ĉi kalkulo).  

Nombro de programoj funkcie de la nombro de lingvoj redakti

Komparo inter la "rekta" kaj la "ponto-lingva" metodoj.  

La ĝenerala formulo por la nombro de bezonataj programoj (aŭ nombro de homaj tradukistoj) N je rekta traduko de n lingvoj estas:

N = n(n-1)

Je ponto-lingva metodo la bezono estas nur

N = 2n

Kalkulita estas po unu programo aŭ tradukisto por ambaŭ direktoj.

Nombro de programoj por la EU redakti

Por la 24 oficialaj lingvoj en la EU rezultas

je rekta traduko: 24 x 23 = 552 programoj
je ponto-lingva metodo 24 x 2 = 48 programoj

La ponto-lingva metodo ŝparus 87% de la programado.

Nombro de programoj por la UNO redakti

La UNO havas nur 6 oficialajn lingvojn. Membrojn ĝi havas 193. Por liveri tradukojn por ĉiuj 193 membroj, kalkulante po unu lingvon por membro, estus bezonataj

je rekta traduko: 193 x 192 = 37056 programoj
je ponto-lingva metodo 193 x 2 = 368 programoj

La ponto-lingva metodo do ŝparus 99% de la programado.

Fakte, por servi ĉiujn landojn perfekte, la cifero 193 ne estas ĝusta. Minimume kvin landoj uzas la (preskaŭ) saman lingvon, la anglan: Britio, Usono, Kanado, Aŭstralio, Nov-Zelando. Sed Hindio havas kvindek oficialajn lingvojn, kiuj estas parolataj de parte kelkaj milionoj.

Kiam la angla estas pivotlingvo redakti

Ia ŝiboleto ebligas la distingon inter la programoj, kiuj tradukas rekte de unu lingvo al alia, el tiuj, kiuj uzas la anglan kiel pivotligvon ; frazo kiel (en la franca) : « Mon voisin aime ma cousine tandis que ma voisine aime mon cousin » (Mia najbaro amas mian kuzinon, dum mia najbarino amas mian kuzon). Se oni petos Promt, ke ĝi traduku al la germana, la rezulto estos : « Mein Nachbar liebt meine Cousine, während meine Nachbarin meinen Vetter liebt », kaj Systran diros : « Mein Nachbar mag meine Cousine, während meine Nachbarin meinen Vetter mag », du tradukoj konsenteblaj. Sed DeepL kaj Systran respondos unuvoĉe : « Mein Nachbar liebt meinen Cousin, während mein Nachbar meinen Cousin liebt ». (t.e. « Mia najbaro amas mian kuzon, dum mia najbaro amas mian kuzon »). Tiun strangan tradukon oni komprenas kontrolante, ke la pera angla tradukaĵo estas : « My neighbor loves my cousin while my neighbor loves my cousin ». Tamen Promt kaj Systran, kiuj komence uzis senperan tradukadon inter ĉiuj lingvoj, ne daŭrigis kaj nun ambaŭ tradukas al la itala per : « Il mio vicino ama mio cugino mentre il mio vicino ama mio cugino ».

Gravaj konsideroj redakti

Klarigo de vortosenco konsistas en trovi taŭgan tradukon, kiam vorto posedas plurajn signifojn. La problemo estis, la unuan fojon, starita de Yehoshua Bar-Hillel (israela lingvisto) en 1950[1]. Li rimarkigis ke, sen "universala enciklopedio", maŝino neniam povus distingi inter du sencoj de vorto[2]. Hodiaŭ ekzistas multaj metodoj por transponti la problemon. Ili estas klaseblaj inter "profundetaj" alproksimoj aŭ "profundaj" alproksimoj.

Profundetaj alproksimoj supozas neniun konon de la teksto. Ili simple uzas statistikajn metodojn al la vortoj ĉirkaŭantaj la ambiguan terminon en la teksto. Profundaj alproksimoj supozas komprenan konon de la termino. Ĝis nun, la profundetaj alproksimoj estas pli sukcesaj.

Claude Piron, longtempe tradukisto por la Unuiĝintaj Nacioj kaj la Monda Organizaĵo pri Sano, skribis ke maŝintradukado, eĉ pli bone konsiderita, aŭtomatigas la plej facilan parton de la traduklaboro; la plej akra, kaj la plej longdaŭra parto implicas fari profundigitan esploron, por solvi la ambiguojn de la fonta teksto, kiu trudas solvi gramatikajn kaj leksikajn devigojn de la cela lingvo:

"Kial bezonas tradukisto tutan tagon por traduki kvin paĝojn, kaj ne unu horon aŭ du ? ... Proksimume 90% de mezteksto rilatas al tiuj simplaj kondiĉoj. Bedaŭrinde estas la 10% restantaj. Estas tiu ĉi parto, kiu necesigas al li ses [pliajn] laborhorojn. Estas solvendaj ambiguoj. Ekzemple, la aŭtoro de fonta teksto, aŭstralia fizikisto, citis la kazon de epidemio, kiu okazis, dum la dua monda milito, en "Japanese prisoner of war camp". Ĉu estas usona kampo de japanaj malliberuloj, aŭ japana malliberejo de usonaj malliberuloj ? La angla teksto enhavas la du signifojn. Do necesas fari esplorojn, eventuale telefoni en Aŭstralio[3]".

Ideala profunda alproksimo necesigus komputilan tradukprogramaron, kiu faru per si mem ĉiujn esplorojn necesajn pri tia suba ambiguaĵo; sed tio necesigu pli altan gradon da AI ol ĝis nun akiritan. Profundeta alproksimo, kiu simple divenas la sencon de la ambigua angla frazo, kiun Piron menciis, (eble, bazita sur la speco de militmalliberejo, kiu estas la pli ofte menciita en donita korpuso) havas kutime racian oportunecon diveni malbone. La profundeta alproksimo, kiu implicas "demandu la uzanton pri ĉiu ambiguo", nur aŭtomatigus, laŭ takso de Piron, 25%-an da la profesia tradukistlaboro, lasante ankoraŭ la pli malfacilan 75%-an parton farendan de homo.

La kvalito de maŝinaj tradukoj redakti

Multaj maŝintradukitaj tekstoj enhavas erarojn. Nur malrapide progresas la kvalito. Lastatempe la PAT, perstatistika aŭtomata tradukado gajnas kvaliton, ĉar komputiloj iĝas rapide pli kapablaj kaj samtempe iĝas malpli kostaj. Tamen ŝajnas, ke komputiloj ne povos esti perfektaj tradukantoj eĉ post multaj jaroj. Perhoma kontrolo necesas.

Vidu ankaŭ redakti

Eksteraj ligiloj redakti

Informaj redakti

Tradukiloj el/al Esperanto redakti

  • Google-Tradukilo - subtenas Esperanton ekde februaro 2012
  • LingvaNex Tradukas en kaj el pli ol cent lingvoj - interalie Esperanto.
  • Baidu Tradukas en kaj el multaj lingvoj - interalie Esperanto
  • Jandeks-Tradukilo (en: Yandex) - tradukas inter Esperanto kaj dekoj da lingvoj
  • GramTrans - regulbazita maŝintradukilo
  • Apertium Arkivigite je 2007-11-08 per la retarkivo Wayback Machine - sistemo de maŝintradukado kiu povas traduki el la hispana kaj el la kataluna en Esperanton (unua versio, decembro 2007), kaj el la angla en Esperanton (unua versio, februaro 2009). Vidu ankaŭ la artikolon Apertium
  • Elitrad - esperanta retpaĝo pri maŝintradukado kun i.a. senpage uzeblaj tradukiloj inter esperanto kaj la angla (esperante kaj angle) Alternativa ligilo: Traduku.net
  • Esperantilo - traduka sistemo (GPL) kun plene aŭtomata aŭ duone aŭtomata tradukado de Esperanto al pola kaj germana lingvoj (esperante, germane kaj pole)
  • Microsoft 365 Copilot, la servo de artefarita intelekto (AI) de Microsoft, instalita en la retumilo Edge, povas traduki el kaj en Esperanton

Referencoj redakti

  1. Limŝtonoj pri maŝintradukado - n-ro.6: Bar-Hillel kaj la nefareblo de FAHQT (angle) (el Retarkivo 2007), aŭtoro John Hutchins
  2. Bar-Hillel (1960), "Maŝin tradukado de lingvoj". Legebla rete (angle): http://www.mt-archive.info/Bar-Hillel-1960.pdf Arkivigite je 2011-09-28 per la retarkivo Wayback Machine
  3. Claude Piron, Le défi des langues (La lingva defio), Parizo, eld. L'Harmattan, 1994 (france)