Pozor OCR program musí umět rozeznat Češtinu !!! Není to tak
samozřejmé.
http://www.slunecnice.cz/sw/screen-ocr/
Nejznazší je to hned při skenování. Pokud má ovladač skeneru k diuspozici OCR pro češtinu.
1Kdo udělil odpovědi palec? anonym
před 4490 dny
|
0 Nominace Nahlásit |
program pro rozpoznávání znaku (OCR).
př: http://www.freewarefiles.com/Free-OCR_program_34315.html
nebo http://forum.zive.cz/viewtopic.php?t=107912
0
před 4490 dny
|
0 Nominace Nahlásit |
Členové ebook komunity u nás používají pro proces OCR téměř vždy
ABBYY FineReader (někteří možná nejnovější verze OmniPage). Ostatní OCR
mají většinou nízkou úspěšnost rozpoznání: je třeba si uvědomit, že
pokud má OCR úspěšnost 99,9%, není to dost. Každé sté písmeno bude
špatně, tzn: pokud bude mít knížka 700000 znaků („baj voko“
průměrná knížka), bude se v ní nacházet 700 chyb!
OCR ale neni jediná fáze, další je formátování: Na to opět většina
lidí používá jednotný nástroj – Santiagova makra. Jedná se o makra do
Wordu, která ulehčí mnoho úkonů.
A nakonec závěrečná fáze: korektura. Aby výsledek za něco stál, je
třeba celou knihu přečíst a opravit všechny chyby.
Podrobnější postup se dočteš na http://www.ebookforum.sk/
.
Doplňuji:
Chybička se vloudila: Při úspěšnosti 99,9% bude špatně jeden znak
z tisíce (v průměru).
Upravil/a: RedC22
0
před 4490 dny
|
0 Nominace Nahlásit |
U otázky nebylo diskutováno.
Nový příspěvekBedy | 1528 | |
Michal Kole | 1199 | |
led | 1156 | |
Hlada | 1131 | |
mosoj | 1124 | |
gecco | 904 | |
www | 828 | |
badisko | 817 | |
cochee | 814 | |
Dochy | 725 |
Software |
Hardware |
Internet |
Programování a webdesign |
Sítě |
Bezpečnost |
Ostatní počítače a internet |