Сканирование (Xsane) и размер файла

Изображение пользователя Voyageur.

Сканер - удобно, функционально, иногда просто незаменимо!
Сегодня решил отсканировать одну страничку и отпраить по почте. Запустил xsane, выбрал формат сохранения - мой любимый pdf -, выбрал разрешение в 300 dpi...тут я неожиданно обратил внимание на нижнюю часть главного окна xsane и увидел там приблизительный размер отсканированного файла. Цифра меня немножко шокировала - 24,9 Мб! Я чуть не подавился. Пытался менять настройки, увеличивал, уменьшал, изменял сохраняемый формат - цифра практические не менялась (при одном и том же dpi). В итоге, реальный размер файла получился 18 Мб (видимо, за счет сжатия).
Возможно я бы и не обратил внимание на это, если бы в Windows сканированный pdf, состоящий из одной странички, не занимал 250 Кб! Значения различаются в 72(!) раза при одном и том же разрешении рисунка (300 dpi). Да, там у меня стоит родная кэноновская программа для сканирования, она, скорее всего, использует какие-то алгоритмы дополнительно сжатия изображений...но не в 72 раза же!
Где ж так тыкнуть, чтобы размер сканируемого изображения был сопоставим с размером в Windows?

Комментарии (11)

0
balamutick - 22 Апрель, 2009 - 01:41
Изображение пользователя balamutick.

Сканируешь в формат Jpeg.
Вставляешь в Writer пакета Open Office, размещаешь как тебе надо, чтобы было.

Далее - Файл - Экспорт в PDF -
и окошко(см. ниже пример), возможно и есть ответ, на тему почему такой большой НИЧЕМ не сжатый PDF формат на выходе у сканера.

Если это решение, возвращаемся, благодарим, ставим плюсы.
Если нет, то отписываемся о результатах и правильности выполненных действий.

0
Voyageur - 22 Апрель, 2009 - 06:46
Изображение пользователя Voyageur.

Не очень это эстетичное решение, как мне кажется...сканировать, потом вставлять в ОО, потом экспортировать...да даже если в самом ОО сканировать, все равно как-то коряво на мой взгляд.
А дело тут именно в формате pdf - я сканировал лист в формат JPEG, при понижении качества (чего я лично не заметил визуально) размер изображения уменьшается! У меня получилось что-то около 400 Кб, а вот pdf - ни в какую((

0
Neksi - 22 Апрель, 2009 - 08:13

Добавь в скрипте сканирования следующее:

scanimage --device-name "$device" --format tiff --resolution $resolution> $output_file
convert $output_file ~/Сканы/$output_file.jpg
rm $output_file

0
Voyageur - 22 Апрель, 2009 - 08:53
Изображение пользователя Voyageur.

Хм, а чего я этим добьюсь? После этих манипуляций размер jpeg'a будет меньше 400 Кб? Или же таким образом можно перегнать и в pdf, получив при этом гораздо меньший размер файла?..Дело в том, что щас я на работе, попробовать не могу, но решение найти ну ооочень хочется!
Моя цель - отсканировать в многостраничный pdf, например, 10 страниц так, чтобы размер результирующего файла был не 150 Мб, а мегабайта 2-3...

0
Neksi - 22 Апрель, 2009 - 09:26

Это сжатие в jpeg

Для конвертации jpg в pdf
convert *.jpg output.pdf

если нужно объеденить pdf
pdftk *.pdf output megaout.pdf

0
Neksi - 22 Апрель, 2009 - 09:29

Еще попробуй gscan2pdf
sudo apt-get install gscan2pdf

0
balamutick - 22 Апрель, 2009 - 09:46
Изображение пользователя balamutick.

Что считает интернет по этому поводу:

А засада видимо в способе создания PDF. Если файл создан на основе отсканированной картинки, он будет весить больше, нежели если изображение будет распознано, преобразовано в текст и засунуто в файл. Предполагаю, что Вы FineReader'ом отсканировали, распознали и экспортировали в pdf, а в Gentoo просто отсканировали и сразу экспортировали...

Вес картинки завист не только от от физического размера и разрешения, но и еще от кучи разных факторов, как то алгоритм сжатия, глубина цвета. Файн-ридер имеет привычку все отсканированные материалы в 1-битный цвет переводить, что позволяет создавать файлы на порядок меньшие, чем, скажем, полноцветрное изображения.

Так же нашёл интересную и возможно полезную статью(caps lock - не мой):
СКАНИРОВАНИЕ ИЗОБРАЖЕНИЙ И ДОКУМЕНТОВ В GNU/LINUX НА ПРИМЕРЕ EPSON PERFECTION 1270

ИМХО, может сначала потыркать в настройки XSANE может он всё умеет, просто ему об этом надо сказать. К примеру, если он будет обычную ч\б сканировать в цветном виде, то вполне может и загнуть с размером.

Вообщем попробуй и расскажи о результатах. Полезная вещь.

0
Voyageur - 22 Апрель, 2009 - 20:10
Изображение пользователя Voyageur.

Написал письмо Oliver'у Rauch'у, разработчику xsane, может он что ответит...
А еще пообщался с ребятами с irc-канала xsane, они сказали, что впринципе размер файла такой по делу, а в винде скан сохраняется скорее всего с потерей качества. Возможно это и так. Единственное, что замечу, так это то, что я этой потери не вижу (то есть она есть, но незаметная).

0
balamutick - 23 Апрель, 2009 - 09:30
Изображение пользователя balamutick.

размер файла такой по делу, а в винде скан сохраняется скорее всего с потерей качества. Вот один в один, всё это время я тебе и мозгую эту мысль.Единственное, что замечу, так это то, что я этой потери не вижу (то есть она есть, но незаметная).Кому нужна потеря, если ты её будешь видеть ? Касаемо потерь см. mp3\jpeg\divX

Просто официально, формат такой. Xsane вероятно честно делает своё дело.

Хорошо, что обратился, может быть подумают о новой возможности.

0
Voyageur - 23 Апрель, 2009 - 10:21
Изображение пользователя Voyageur.

Честно говоря, не уверен даже, что ответят или хотя бы прочитают мои каляки-маляки)) Но если сделают - будет им и нам большой жирный плюс! Я, честно говоря, немного не понимаю, зачем мне нужен скан одной страницы в 18 мегабайт...

0
balamutick - 23 Апрель, 2009 - 10:29
Изображение пользователя balamutick.

А зачем нужны несжатые\ не оцифрованные фильмы ? Аудио CD ?
Может не удачное сравнение, но примерно так.

Как вариант,
Ответ в духе: да всё плохо, XSane пока не умеет жать сразу, для сжатия готовых воспользуйтесь конвертером.

Отправить комментарий

CAPTCHA на основе изображений
Введите цифры