Korpusa lingvistiko: Malsamoj inter versioj

[kontrolita revizio][kontrolita revizio]
Enhavo forigita Enhavo aldonita
→‎Vidu ankaŭ: Tradukscienco
la vorto "glotologio" ne ekzistas en PIV, Vikipedio ktp, kaj estas eksmoda en la angla. Ĉu en la nederlanda?
Linio 1:
'''Korpusa lingvistiko''' aŭ '''korpuslingvistiko''' (angle: ''Corpora Linguistics'' aŭ mallonge ankaŭ kiel '''ldc''') estas la studo de [[Lingvo|lingvaj fenomenoj]] (lingvaj regulecoj) uzante kolekton de kompareblaj tekstoj. Tiaj kolektoj de tekstoj estas nomataj [[Korpuso|korpusoj]]<ref name=":0">({{it)}} Francesca Socrate, ''[https://storieinmovimento.org/2020/09/22/zap52-socrate-corpora-erratum/ La linguistica dei corpora. Linguaggio e conflitto]'', en: Zapruder, n-ro 52</ref>.
 
== Korpuso ==
Korpuso estas granda kolekto de lingvaj datumoj , ĝi povas esti (transskribita) parola aŭ desegnita lingvo, aŭ skriba teksto. Estas malsamaj manieroj difini korpuso, sed kutime korpuso estas stokita elektronike konservita por la celo esti reprezenta defiguri la koncernakoncernan lingvolingvon.
 
Lingvo ne estas neŭtrala, ĉar ĝi esprimas subjektivecon, emociojn, opiniojn. Lingvo estas armilo de ofendo aŭ de defendo. La rilatoj kaj konfliktoj inter individuoj kaj inter kolektivoj pasas rekte kaj nerekte tra lingvo, kiu formiĝas ne nur en la eksplicita kontrasto de ideoj kaj valorsistemoj, sed ofte nekonscie flanke de la parolanto ankaŭ en la kaŝita dimensio de morfosintaksaj aspektoj.semantikasemantiko. Komputila analizo do ofertas datumojn, ĝiajn lingvajn objektojn<ref name=":0" />.
 
=== Projekto Tatoeba ===
En 2006 aperis la retejo [[Tatoeba]], kiu ebligas libere aldoni novajn kaj ŝanĝi ekzistantajn frazojn en pli ol 80 lingvoj, ankaŭ en [[Esperanto]] kun preskaŭ 700 000 frazoj<ref>({{eo)}} [https://tatoeba.org/eo/stats/sentences_by_language Listo de sugestoj laŭ lingvoj]</ref>, interrilataj laŭ signifo. Ĉiu povas aldoni novajn frazojn kaj iliajn tradukojn, kaj se necese, senpage elŝuti ĉiujn aŭ parton de ĉiuj lingvaj korpusoj. Vidu ankaŭ sub [[Tekstaro de Esperanto|Tekstaro de EsperanEsperanto]]<nowiki/>to.
 
=== Serĉiloj ===
Interesa serĉilo estis [[Wordtracker]], kiu kolektas trafojn de la serĉiloj Dogpile kaj Metacrawler. Mikrosoft ankaŭ provizas senpagan servon similan al Google Trends nomata Ŝlosilvorta Prognozo (''Keyword Forecast''), kie vioni povas kompari plurajn ŝlosilvortojn samtempe kaj ŝanĝi intereson pri ili sur diagramo tra la jaro. Ankaŭ ''Keyword.io'' estas serĉilo surbaze de pluraj retejoj (YouTube, Vikipedio, fotolia,..)
 
=== Tradukstudoj ===
Studoj pri tradukoj de L1 ĝis L2 baziĝas sur lingvaj trajtoj. Tradukstudoj estas gravaj ĉar ili montras kiel ideo en unu lingvo estas transdonita en alian lingvon. Ekzemple, la esplorado de Baker montris, ke tradukoj de L1 al L2 ofte estas normaligitaj kaj simpligitaj. Ankaŭ, tradukoj ofte estas eksplicitatajeksplicitaj, do ili havasestas pli altan kohezionkoheraj. Paralelaj korpusoj estas uzataj por tradukstudoj ĉar tio estas fidinda bazo por kontrastaj studoj.
 
==== Kvalito de tradukoj ====
Esploristoj kadre de korpusaj tradukstudoj provas evoluigi objektivajn ilojn por taksi la kvaliton de tradukoj5tradukoj. Komparante la originalanoriginan lingvon kaj la lingvon de la tradukocellingvon, oni serĉas la diferencojn inter ili por scii ĉu tiuj diferencoj povas esti uzataj kiel kvalitkriteriojkvalitkriteriojn. Krome, elektronikaj korpusoj povas esti ekspluatitajekspluatataj por plibonigi la kvaliton<ref>({{fr)}} Rudy Loock, ''La traductologie de corpus'', Villeneuve-d'Ascq, Presses universitaires du Septentrion, 2016</ref> <ref>({{en)}} ''[https://litlab.stanford.edu/projects/ Project Translation]'', Stanford Literary Lab</ref>.
 
=== Korpusa lingvistiko kaj ĝia programaro ===
En la pasinteco, vortaroj kaj gramatikoj baziĝis sur korpusoj, plejparte de eta grandeco. Ekde la dua duono de la 20-a jarcento, komputilaj teknologioj subtenas la korpusan lingvistikon helpe de aŭtomata tekst-analiza programaro, kies evoluo kaj ĉiam pli rapida disvastigo pligrandiĝis kaj daŭre vastigas la kapablon por kvanta kaj statistika kontrolado de tekstoj kaj ilia enhavo.(<ref>{{en}} Chiari 2007) ;https://www.euppublishing.com/doi/pdfplus/10.3366/cor.2012.0028</ref>
{{Mankas fonto|Barbera 2013).|dato=2013}} Metodologio naskita en la kampo de glotologio kaj lingvistiko, la ldc estas de kelka tempo uzata ankaŭ de aliaj fakoj ([[sociologio]], [[biologio]], [[socia psikologio]], [[literatura kritiko]], literaturhistorio).<ref name=":0">(it) Francesca Socrate, ''[https://storieinmovimento.org/2020/09/22/zap52-socrate-corpora-erratum/ La linguistica dei corpora. Linguaggio e conflitto]'', en: Zapruder, n-ro 52</ref>.
 
Aferoj kiuj estas ofte ekzamenitajekzamenataj estas la ofteco de certaj vortoj kaj la tipaj [[Kunteksto|kuntekstoj]] en kiuj ili aperas. Ĉi tio estas ĝenerale faritafarata [[Cifereca|ciferece nuntempe]].
 
== Referencoj ==