Parolsintezo: Malsamoj inter versioj

[nekontrolita versio][nekontrolita versio]
Enhavo forigita Enhavo aldonita
Chlewbot (diskuto | kontribuoj)
e robot Adding: eu
Maksim-bot (diskuto | kontribuoj)
AAld: + 1 bildoj + 2 ligoj
Linio 1:
'''Parolsintezo''' estas la permaŝina produktado de homa parolo. Parolsintezilo estas ekipaĵo aŭ programaro, kiu ebligas tion. Nuntempe, parolsinteziloj utiligas komputilan teknikon, sed mekanikaj parolsinteziloj havas historion plurcentjaran.
 
En pli malvasta senco, oni komprenas kiel "parolsintezo" la konvertadon de fonetika reprezento de diraĵo en aŭdeblan parolon. Por plene sukcesi, tia fonetika reprezento devas esti kompleta, kun indiko ne nur de la parolsonoj sed ankaŭ de la intonacio.
 
En pli vasta senco, oni komprenas kiel "parolsintezo" eltekstan parolsintezon (angle: "text-to-speech synthesis"). Tio estas konvertado de ortografia teksto al parolo, kio postulas preparan paŝon: la teksto devas unue esti konvertita en fonetikan formon. Necesas tiel konverti ankaŭ ciferojn kaj aliajn neliterajn simbolojn kaj laŭeble ĝuste indiki la [[intonacio]]n.
Linio 9:
* '''Kunĉeniga sintezo''' uzas erojn de registrita homa parolo. Oni povus ekzemple registri ĉiun el la vokaloj kaj konsonantoj de esperanto, prononcataj de unu parolanto, kaj kunĉeningi ilin laŭbezone. Tiu metodo tamen tute ne funkcias kontentige, ĉar la transiro inter sinsekvaj parolsonoj devas esti ĝusta por ke la parolo estu komprenebla. En pli sukcesaj metodoj tiaspecaj oni uzas aŭ “[[difono]]jn” aŭ pli longajn parolerojn.
** '''Difona sintezo''' baziĝas sur registritaj versioj de ĉiuj son-sinsekvoj kiuj povas aperi en la sintezata lingvo. Ekzistas metodoj por modifi la prozodiajn ecojn de la registritaj difonoj por ke la daŭro de la parolsonoj kaj la intonacio estu ĝustaj.
** '''Paroler-selekta sintezo''' (angle: “unit-selection synthesis”) utiligas larĝan datumbazon de registrita parolo, el kiu la plej longaj sinsekvoj kiuj reaperas en la sintezota teksto estas selektataj kaj kunĉenigataj.
* '''Laŭregula sintezo''' ne uzas registritan parolon, sed la akustika signalo estas kreata per modelo de la homa parolproduktado. Tiaj sistemoj do postulas de la konstruantoj abundan kaj ekzaktan scion, kiu estas respegulata en la komprenebleco kaj natureco de la sinteza parolo. Ili baziĝas sur teorio en kiu la parolo estas konsiderata kiel rezulto de filtrado de origina sono. Ĉe plej multaj parolsonoj, la origina sono estiĝas en la laringo, kaj ĝi filtriĝas survoje trans la parolorgano. La ecoj de la filtro, inter kiuj la frekvencoj de la tiel nomataj “[[formanto]]j” estas la plej gravaj, varias laŭ la artikulacio.
** '''Formanta sintezo''' ne simulas la artikulacion mem, sed nur la filtradon, kiun evidentigas studoj de la akustikaj ecoj de la parolo.
** '''Artikulacia sintezo''' simulas la artikulacion mem. Artikulacia sintezo ankoraŭ ne povas konkurenci kun formanta sintezo, ĉar la akustikaj ecoj de la parolo estas pli bone konataj ol la detaloj de la artikulacio.
 
Linio 36:
[[Kategorio:Fonetiko]]
[[Kategorio:Komputiko]]
[[Dosiero:Voder.jpg|thumb|left|180px|<!-- (enkadrigita, kadrita)|[[Homero Dudley]]'s [[_VODER_]] estis eksponita je la [[1939 (Nov-Jorkio, Novjorko) Internacia ekspozicio]] kaj produktis klare _intelligible_ parolado. -->]]
<br clear=all>
 
== Vidu ankaŭ jenon: ==
* [[Komputila lingvistiko]]
* [[Fonetiko]]
 
 
[[da:Talesyntese]]