Optika signorekono: Malsamoj inter versioj

[nekontrolita versio][nekontrolita versio]
Enhavo forigita Enhavo aldonita
Melancholie (diskuto | kontribuoj)
evoluita --> evoluigita k. s.
Linio 1:
''' Optika signorekono''' (OSR) aŭ tekstorekono aŭ optika karaktra rekono (angla, internacia mallongigo ''OCR'' postlaŭ ''Optical Character Recognition'') estas nocio el la [[IT]]-areo kaj, kiu priskribas alla aŭtomatan tekstorekonon de (plej ofte presita) dokumento.
 
Originale ĝi estis evoluitaevoluigita al aŭtomata tekstorekono de diversaj skribotipoj, kiuj estis uzataj en ĉekoj. Tiuj skribotipoj estis tiel formitaj, ke la rekoniloj povis ilin - sen grava kalkula bezono – deĉifri, dividi inter ili. Tiel la skribotipo ''OSROCR-A'' estas uzata por tre diversaj signoj, ''OCR-B'' por pli similaj signotipoj, kaj ''OCR-H'' por manskriboj.
 
La kreskantaj povumoj de la moderna [[komputilo]] kaj la pliboniĝantaj algoritmoj permesas ankaŭ la rekonon de "normalaj" presitaj signoj ĝis la manskriboj (tiu lasta gravas ekz. ĉe leterodistribuo en la [[poŝto]]).
 
La moderna tekstorekono entenas la rekonon de la diversaj litertipoj kaj -grandoj kaj tiel certigas la preskaŭ plej originalfidanoriginalfidelan reaperigon.
 
 
Linio 12:
La elirpunkto estas bildo ([[rastruma bildo]]), kiu estas farita el dokumento per [[skanilo]], [[cifereca fotilo]] aŭ [[videokamerao]]. La signorekono okazas en tri ŝtupoj:
# '''Paĝo kaj formata rekono:''' La bildaj datenoj estas dividitaj je grava areo (teksto, bildosubskriboj) kaj je negrava areo (figuraĵoj, blankaj partoj, linioj).
# '''modela rekono:''' La pikselmodelo de la teksta aeroareo estas komparata kun modeloj en la [[datenbanko]] kaj okazas kruda ciferecigo.
# '''Erarokorekto:''' La kruda ciferecigo estas komparitakomparata kun vortoj de la programa vortaro kaj eble korektita laŭ lingvistikaj kaj statistikaj spertoj. Multaj programoj proponas propran korektadon.
 
Finfine okazas kodigokodado de la eldona aranĝo (ekz. [[ASCII]]) kiel [[tekstodateno]], kaj aspekta aranĝo (ekz. kiel [[HTML]] aŭ [[PDF]]).
 
 
Linio 34:
 
==Tipoj==
* Recognita plus (2.0-50–5.0)
* OmniPage