Kiel registrite je 23:51, 19 jan. 2022 redakti Alifono (diskuto \| kontribuoj) Mempatrolatoj, Patrolantoj, Kontrolantoj 20 279 redaktoj →‎Vidu ankaŭ: Tradukscienco Etikedo: Vida redakto ← Iru al antaŭa ŝanĝo		Kiel registrite je 03:43, 12 jun. 2022 redakti malfari Donald Rogers (diskuto \| kontribuoj) Patrolantoj 740 redaktoj la vorto "glotologio" ne ekzistas en PIV, Vikipedio ktp, kaj estas eksmoda en la angla. Ĉu en la nederlanda? Iru al sekvanta ŝanĝo →
Linio 1: '''Korpusa lingvistiko''' aŭ '''korpuslingvistiko''' (angle: ''Corpora Linguistics'' aŭ mallonge ankaŭ kiel '''ldc''') estas la studo de [[Lingvo\|lingvaj fenomenoj]] (lingvaj regulecoj) uzante kolekton de kompareblaj tekstoj. Tiaj kolektoj de tekstoj estas nomataj [[Korpuso\|korpusoj]]<ref name=":0">({{it)}} Francesca Socrate, ''[https://storieinmovimento.org/2020/09/22/zap52-socrate-corpora-erratum/ La linguistica dei corpora. Linguaggio e conflitto]'', en: Zapruder, n-ro 52</ref>. == Korpuso == Korpuso estas granda kolekto de lingvaj datumoj , ĝi povas esti (transskribita) parola aŭ desegnita lingvo, aŭ skriba teksto. Estas malsamaj manieroj difini korpuso, sed kutime korpuso estas ~~stokita~~ elektronike konservita por la celo ~~esti reprezenta de~~figuri la ~~koncerna~~koncernan ~~lingvo~~lingvon. Lingvo ne estas neŭtrala, ĉar ĝi esprimas subjektivecon, emociojn, opiniojn. Lingvo estas armilo de ofendo aŭ de defendo. La rilatoj kaj konfliktoj inter individuoj kaj inter kolektivoj pasas rekte kaj nerekte tra lingvo, kiu formiĝas ne nur en la eksplicita kontrasto de ideoj kaj valorsistemoj, sed ofte nekonscie flanke de la parolanto ankaŭ en la kaŝita dimensio de morfosintaksaj aspektoj. aŭ ~~semantika~~semantiko. Komputila analizo do ofertas datumojn, ĝiajn lingvajn objektojn<ref name=":0" />. === Projekto Tatoeba === En 2006 aperis la retejo [[Tatoeba]], kiu ebligas libere aldoni novajn kaj ŝanĝi ekzistantajn frazojn en pli ol 80 lingvoj, ankaŭ en [[Esperanto]] kun preskaŭ 700 000 frazoj<ref>({{eo)}} [https://tatoeba.org/eo/stats/sentences_by_language Listo de sugestoj laŭ lingvoj]</ref>, interrilataj laŭ signifo. Ĉiu povas aldoni novajn frazojn kaj iliajn tradukojn, kaj se necese, senpage elŝuti ĉiujn aŭ parton de ĉiuj lingvaj korpusoj. Vidu ankaŭ sub [[Tekstaro de Esperanto\|Tekstaro de ~~Esperan~~Esperanto]]~~<nowiki/>to~~. === Serĉiloj === Interesa serĉilo estis [[Wordtracker]], kiu kolektas trafojn de la serĉiloj Dogpile kaj Metacrawler. Mikrosoft ankaŭ provizas senpagan servon similan al Google Trends nomata Ŝlosilvorta Prognozo (''Keyword Forecast''), kie vioni povas kompari plurajn ŝlosilvortojn samtempe kaj ŝanĝi intereson pri ili sur diagramo tra la jaro. Ankaŭ ''Keyword.io'' estas serĉilo surbaze de pluraj retejoj (YouTube, Vikipedio, fotolia,..) === Tradukstudoj === Studoj pri tradukoj de L1 ĝis L2 baziĝas sur lingvaj trajtoj. Tradukstudoj estas gravaj ĉar ili montras kiel ideo en unu lingvo estas transdonita en alian lingvon. Ekzemple, la esplorado de Baker montris, ke tradukoj de L1 al L2 ofte estas normaligitaj kaj simpligitaj. Ankaŭ, tradukoj ofte estas ~~eksplicitataj~~eksplicitaj, do ili ~~havas~~estas pli ~~altan kohezion~~koheraj. Paralelaj korpusoj estas uzataj por tradukstudoj ĉar tio estas fidinda bazo por kontrastaj studoj. ==== Kvalito de tradukoj ==== Esploristoj kadre de korpusaj tradukstudoj provas evoluigi objektivajn ilojn por taksi la kvaliton de ~~tradukoj5~~tradukoj. Komparante la ~~originalan~~originan lingvon kaj la ~~lingvon de la traduko~~cellingvon, oni serĉas la diferencojn inter ili por scii ĉu tiuj diferencoj povas esti uzataj kiel ~~kvalitkriterioj~~kvalitkriteriojn. Krome, elektronikaj korpusoj povas esti ~~ekspluatitaj~~ekspluatataj por plibonigi la kvaliton<ref>({{fr)}} Rudy Loock, ''La traductologie de corpus'', Villeneuve-d'Ascq, Presses universitaires du Septentrion, 2016</ref> <ref>({{en)}} ''[https://litlab.stanford.edu/projects/ Project Translation]'', Stanford Literary Lab</ref>. === Korpusa lingvistiko kaj ĝia programaro === En la pasinteco, vortaroj kaj gramatikoj baziĝis sur korpusoj, plejparte de eta grandeco. Ekde la dua duono de la 20-a jarcento, komputilaj teknologioj subtenas la korpusan lingvistikon helpe de aŭtomata tekst-analiza programaro, kies evoluo kaj ĉiam pli rapida disvastigo pligrandiĝis kaj daŭre vastigas la kapablon por kvanta kaj statistika kontrolado de tekstoj kaj ilia enhavo.(<ref>{{en}} Chiari 2007) ;https://www.euppublishing.com/doi/pdfplus/10.3366/cor.2012.0028</ref> {{Mankas fonto\|Barbera 2013).\|dato=2013}} Metodologio naskita en la kampo de ~~glotologio kaj~~ lingvistiko, la ldc estas de kelka tempo uzata ankaŭ de aliaj fakoj ([[sociologio]], [[biologio]], [[socia psikologio]], [[literatura kritiko]], literaturhistorio).<ref name=":0"~~>(it) Francesca Socrate, ''[https:~~/~~/storieinmovimento.org/2020/09/22/zap52-socrate-corpora-erratum/ La linguistica dei corpora. Linguaggio e conflitto]'', en: Zapruder, n-ro 52</ref~~>. Aferoj kiuj estas ofte ~~ekzamenitaj~~ekzamenataj estas la ofteco de certaj vortoj kaj la tipaj [[Kunteksto\|kuntekstoj]] en kiuj ili aperas. Ĉi tio estas ĝenerale ~~farita~~farata [[Cifereca\|ciferece nuntempe]]. == Referencoj ==

Korpusa lingvistiko: Malsamoj inter versioj