Большое спасибо всем кто откликнулся я сделал так:
sudo pdfimages -j М.pdf img
Выцепляет из PDF имэйджи. Выходные файлы будут img-xxx.nnn
кроме jpg - файлов выдаёт по каким-то причинам ещё и pbm
с помощью команды for f in *.pbm; do convert $f "converted/${f%.pbm}.jpg"; done
сконвертил pbm в jpg.
cuneiform + yagf - меня абсолютно не устроил качеством.. ну и много мелочей не хватает.
После долгих мытарств я понял, что хорошего бесплатного софта для распознавания текста нету я поставил под wine FineReader 7.0
Да, некошерно, зато идеально работает.
Я тут писал уже... Попробуй связку cuneiform + yagf. Ну или кинь свою PDF'ку мне на почту, я попробую. Один хрен на работе всё спокойно =)
http://www.abbyyonline.com/ не подойдёт?
Большое спасибо всем кто откликнулся я сделал так:
sudo pdfimages -j М.pdf img
Выцепляет из PDF имэйджи. Выходные файлы будут img-xxx.nnn
кроме jpg - файлов выдаёт по каким-то причинам ещё и pbm
с помощью команды
for f in *.pbm; do convert $f "converted/${f%.pbm}.jpg"; done
сконвертил pbm в jpg.
cuneiform + yagf - меня абсолютно не устроил качеством.. ну и много мелочей не хватает.
После долгих мытарств я понял, что хорошего бесплатного софта для распознавания текста нету я поставил под wine FineReader 7.0
Да, некошерно, зато идеально работает.
поменял на:
Как раз на днях статья появилась: 3DNews - Онлайн-сервисы для распознавания текста
Тема свободного или бесплатного распознавания не раскрыта.
Либо дерьмово и бесплатно, либо платно и более-менее.
Отправить комментарий