V ÚCHP byl pořízen rozšiřující OCR systém pro barevnou kopírku v knihovně, převádějící naskenovaný dokument (ve formě bitmapového obrázku) do editovatelného textu ve vybraných formátech. V současnosti máme zvoleny výstupní formáty PDF, XLS, DOC, TXT a ePub. V naskenovaných PDF dokumentech lze prohledávat text, čísla a některé speciální znaky. Požádejte obsluhu kopírovacího stroje o dodání PDF dokumentů, zpracovaných pomocí OCR systému.
Pokud používáte svůj stolní skener, máte již mnoho naskenovaných dokumentů v PDF bez zpracování pomocí OCR, případně používáte mobil nebo tablet jako rychlý skener, můžete nechat zpracovat dokumenty dle níže uvedeného postupu a využít výhody tvorby svého digitálního archivu, ve kterém lze text vyhledávat.
sPDF, excel, word, txt, epub
PDF - sPDF, XLS - excel, DOC - word, TXT- txt, ePub - epub
Out
. Např. u PDF je vstupním adresářem /sPdf
a výstupním /sPdfOut
.result.xml
, jenž obsahuje technické údaje o průběhu procesu. Můžete si jej prohlédnout ve webovém prohlížeči. Na konci tohoto souboru je užitečná informace o výsledku zpracování např. <Statistics TotalCharacters=„910“ UncertainCharacters=„49“ PagesArea=„1“
. Po překopírování souborů na svůj disk, soubory na serveru vymažte.V případě nejasností nebo problémů volejte Výpočetní středisko.