Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator СканКромсатор (Часть 2)

Модерирует : gyra, Maz

Widok (30-03-2009 18:08): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator: Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п. (есть FAQ). Автор: bolega. http://bolega.hotmail.ru/
 
Начало обсуждения - здесь.
 
Текущая версия: ScanKromsator v5.92 (2 МБ)
Предыдущая версия: ScanKromsator v5.91 full (3,26 МБ) зеркало
 
Старые версии: Подробнее...
Изменения в новой версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)

 
Самая краткая инструкция по работе с СК (включает "сборку" СК) от ghosty
 
ScanAndShare - инструкция в картинках от VadimirTT, + начальные установки SK.Использование ScanKromsator’а v5.91 от Melirius
 
Вопросы и ответы по работе со СканКромсатором:
http://abab.front.ru/QandA_SK.ZIP (80 КБ, от 20.06.06)
 
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ) и в HTM и DOC (537 КБ)
 
Пособие по Кромсатору от monday2000  
(Составлено на базе "Вопросов и ответов" + Хелп v1.0).  См. подробности. Обновлено 30.10.07

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 15:15 17-08-2007 | Исправлено: ghosty, 15:09 25-12-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VadimirTT

Цитата:
2. может договоримся,  

Хорошо, сделаем так. Эта книга у меня где-то на двд есть.
 
Добавлено:
bolega
Я ещё раз подумал насчёт разных папок и ИМХО нашёл наиболее оптимальный вариант: достаточно просто делать в папке out вложенную ("split_scans") и туда всегда и во всех случаях класть pic-файлы, парные им "обезкартиночные" сканы и sep-тифы - т.е. все 3 вида "особенных" "картиночных" тифов. Т.е. не надо делать галки
Цитата:
3 галки типа "помещать все pic во вложенную папку", "помещать все sep во вложенную папку", "помещать все парные pic во вложенную папку".
- а использовать "split_scans" постоянно, когда есть хоть один из 3 особенных видов.
 
Опция по удалению pic-файлов по-моему не нужна - FSD всё равно игнорирует такие файлы - т.е. pic-файлы ничему не мешают.
 
Зато в случае, если SK будет делать папку "split_scans", саму папку out можно будет напрямую подавать и на DjVu-кодирование, и на выравнивание кривых строк.
 
Единственный минус такого решения - что делать, если захочется выровнять кривые строки у файлов, парных pic-файлам (и находящися в папке "split_scans")? В этом случае выравниванием кривых строк у этих файлов можно просто пренебречь для простоты. Либо чисто вручную тогда уже это проделать.
 
Ещё мелкий вопрос: почему pic-файлы имеют вид "pic.0001"? Лучше пусть называются "0001.pic" - аналогично "0001.sep" и в папке они тогда будут сортироваться по имени около парных им.
 
Добавлено:

Цитата:
Как это нет?? На это и команда create out-task. После нее исх. файлы можно выбросить.

Точно. Но там только абсолютные пути в out-task - при перемещении папки в другое место out-task так просто уже не откроется - потребует указать путь к новому местонахождению файлов, на которые указывает out-task. Пути вообще не нужны (для архивного хранения) - только список файлов в папке и координаты привязок картинок.
 
Добавлено:
VadimirTT
Упор на хорошую читабельность ИМХО особенно актуален в свете грядущей популяризации E-Ink читалок (потому что можно ожидать через 2-3 года широкоэкранные читалки - вместо нынешнего 6-дюймового издевательства (см. про журнал Esquire). Сейчас DjVu-книги скорее всего используются лишь для эпизодического заглядывания туда как в справочное пособие. Может быть, E-Ink-устройства сделают формат DjVu популярнее на Западе.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:29 31-07-2008 | Исправлено: monday2000, 10:14 31-07-2008
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Давайте попробуем поставить очередную точку в обсуждении вопроса, в каком разрешении сканировать
 
1. Да, режим сканирования 300dpi в полутонах серого подходит примерно для 70-80% случаев.
2. Но: это утверждение не исключает тех самых 20-30% частных случаев, в которых решение необходимо принимать ad hoc.
2.1. В этих случаях следует учитывать:
2.1.1. Качество печати;
2.1.2. Размер наименьшего шрифта.
 
Пример №1 (возможно, не совсем удачный, но ничего другого в голову не приходит):
Букварь, напечатанный на мелованной бумаге. Т.е. самый крупный кегль, хорошая печать – можно сканировать хоть в 150dpi в полутонах с последующим апсемплингом до 300dpi.
 
Пример №2 (реальный из жизни, хотя тоже несколько «экзотичный»):
Любое (в том числе и современное) издание древних текстов, особенно древнегреческих. Т.н. аппарат, приводимый на каждой странице текста, в котором перечисляются варианты написания отдельных слов в разных папирусах, дан очень мелким шрифтом, а специфика греческих символов – в большом количестве тонких перемычек, а также мелких диакритических знаков. Даже в случае хорошей печати (а обычно это очень хорошая печать) при сканировании в режиме 300dpi grey перемычки пропадают, а диакритики «слипаются» друг с другом. Поэтому такие книги приходится сканировать в режиме 600dpi grey.

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 12:02 31-07-2008 | Исправлено: ghosty, 12:36 31-07-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VadimirTT
Фраза из ScanAndShare 1.07:

Цитата:
Здесь же листаем дальше и находим вкладку Denoise ставим галку на Enable, а параметры как на рисунке:

Что это и зачем это?
 
Добавлено:

Цитата:
Давайте попробуем поставить очередную точку

VadimirTT
Весь этот пост ghosty (в немного сжатом виде) хорошо бы полностью перенести в ScanAndShare.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 12:21 31-07-2008 | Исправлено: monday2000, 12:25 31-07-2008
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty
Я спорю не о том в каком разрешении сканировать, а в каком оно будет на выходе, если надо 600 грей, то уж ничего не попишешь.
З.Ы. про букварь это Вы зря пример привели, Вы даете страшное оружие в руки monday2000 !
 
monday2000

Цитата:
Что это и зачем это?

осталось от предыдущей версии кромсатора, когда не было иллюминейшен, оставил на всякий случай, это галка не мешает.

Цитата:
Весь этот пост (в немного сжатом виде) хорошо бы полностью перенести в ScanAndShare.

в инструкции не должно быть никаких дискуссий, а чисто по солдафонски - делать так и никак иначе, уж только после пары тройки книг, когда человек поймет что от него требуется и как выглядит то что называется нормальным сканом (после этого о 300 депеишных дежавюшках он не будет вспоминать ), то пусть экспериментирует, тогда, покрайне мере, он не будет делать плохо, а если получится лучше (для отжима результата, параметры для каждой книги надо подбирать индивидуально), то и замечательно.  

Всего записей: 2872 | Зарегистр. 22-03-2005 | Отправлено: 12:24 31-07-2008 | Исправлено: VadimirTT, 12:33 31-07-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VadimirTT

Цитата:
в инструкции не должно быть никаких дискуссий, а чисто по солдафонски - делать так и никак иначе,  

Эту мысль также следовало бы привести в начале ScanAndShare - чтобы не было недоразумений.
 
Добавлено:
И ещё одно замечание по ScanAndShare: ИМХО с самого начала нужно проделать т.н. унификацию - splitpage-deskew (разрезание сдвоенных разворотов) - прямо над серыми сканами. Или же отпилить ошмётки для 1-стр. сканов. А уже потом такие униф. серые сканы опять загрузить в СК и дальше обрабатывать, как обычно. Такой подход всё сильно упрощает.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 12:38 31-07-2008 | Исправлено: monday2000, 12:45 31-07-2008
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VadimirTT

Цитата:
Вы даете страшное оружие в руки monday2000
Чтобы выбить это оружие из ненадежных рук сразу приведу реальный пример - скан старой газеты в 150dpi без апсемплинга: http://oldgazette.ru/bzr/01121942/01121942-2.djvu
Обратите внимание, что ошибки подстановки символов при кодировании имеются не только в мелком кегле (что естественно), но и в крупном - подзаголовок II в центре листа можно использовать в качестве наглядного пособия
 

Цитата:
Я спорю не о том в каком разрешении сканировать, а в каком оно будет на выходе
Все то же самое можно сказать и о разрешении на выходе. В примере №1 будет достаточно 300dpi, в примере №2 - только 600.
ИМХО, имеется один и только один критерий оценки качества результата: эргономика чтения. Казалось бы, банальность, но многие об этом забывают - для них важны некие технические показатели качества.  
Понятно, к примеру, что плохое качество сканирования/обработки ведет к неудобству чтения книги. Но также понятно, что есть определенный предел в погоне за качеством, после которого никакие попытки что-либо улучшить не будут приводить к улучшению эргономики.

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 12:47 31-07-2008 | Исправлено: ghosty, 12:56 31-07-2008
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty
Про эргономику чтения я и говорю, если распечатать книгу сделанную в 300, даже если над ней старались, то у меня от ее чтения глаза в кучку, а при 600, зачастую, даже лучше оригинала.
И потом, наше дело не учить учёного, а дать на блюдечке наипростейший и легчайший способ оцифровки книг, которую, после этого, нам же будет приятно взять в руки, поэтому никаких поблажек, в том то и будет беда, если monday2000 на своем сайте будет благословлять "легкий" путь.
.

Всего записей: 2872 | Зарегистр. 22-03-2005 | Отправлено: 13:28 31-07-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Нет ли у кого-нибудь исходника программы pnmtodjvurle, которую сделал когда-то Arcand? Хотелось бы его иметь на всякий случай.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 16:36 31-07-2008
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega
В довольно большой по объему книге все диаграммы были заключены в в пикчер-зоны в черно-белом цвете. После обработки книги сделал мердж по всем страницам. При дальнейней чистке страниц пришел  к выводу, что в настройках зоны нужно поменять одно свойство. Чтобы не менять его для каждой конкретной зоны, распространил его на все последующие зоны, но запускать повторную обработку на все распространенные не хочу. Однако сейчас при заходе в режиме Result view на любую страницу с пикчер-зоной выдается сообщение "Cannot open file pic.xxxx.tif".  
Нельзя ли это как-то убрать (м.б. что-то изменить в файле spt)?

Всего записей: 6972 | Зарегистр. 14-01-2005 | Отправлено: 22:00 31-07-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
Судя по всему у Вас включена опция "удалять файлы зон после merge". После merge кромсатор взводит один из битов в параметрах зоны, который в дальнейшем и запрещает ему выдавать такие предупреждения. Скорее всего, Вы не сохранили задание после выполнения merge и этот бит не сохранился, и кромсатор теперь считает, что merge, как и зон, не было. Поменять один бит в spt невозможно,  и заблокировать предупреждение - тоже, к сожалению.  
Могу посоветовать только одно. Раз уж сделан merge, то и зоны на входе не нужны. Можно их просто удалить. Есть быстрый способ удалить зоны, просто щелчком мышкой на ненужной зоне.
Можно еще в свойствах зоны взвести опцию locked (т.е. зона есть, но кромсатор ее игнорирует как будто ее и не задано), но нужно будет делать это для каждой зоны, скопом это не предусмотрено.

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 08:34 01-08-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega
ИМХо есть смысл обозвать сканы с вырезанными картинками как-нибудь вроде "0001.nopic.tif" - а сейчас они просто "0001.tif" - что неотличимо от обычных сканов.
 
Если будете делать папку, вложенную в out (для 3 видов картиночных сканов) - можно её назвать не "split_scans", а "sep" (для простоты).

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:52 01-08-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
есть смысл

Для кого есть этот смысл?
 
 
Добавлено:

Цитата:
Если будете делать папку, вложенную в out

Как Вы уже знаете, проект остановлен

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 11:54 01-08-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Для кого есть этот смысл?  

Просто раз уж эти Picture-зоны существуют (в СК) - то ИМХО разумно было бы их довести до ума (в плане взаимодействия с другими программами) - тем более что усилия для этого требуются просто мизерные (всех делов-то - просто класть "особенные" сканы в другую папку (вложенную), а не в ту же самую).

Цитата:
Как Вы уже знаете, проект остановлен

А, ну ладно, можно, конечно, и сейчас выкрутиться - просто потребуются дополнительные извращения (внешняя утилитка это может делать). Пользователей только жаль.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 12:15 01-08-2008
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Жаль, что дистрибутив СканКромсатора есть чуть ли не только на моём сайте - во всём Интернете. Почему никто не зеркалирует? Зачем было убирать с офсайта?

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 14:23 01-08-2008
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я не убирал с офсайта. Просто hotmail переехал на pochta.ru и все грохнул без моего участия

Всего записей: 4441 | Зарегистр. 09-09-2002 | Отправлено: 14:49 01-08-2008
kontiky

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
Пожалуйста, я зазеркалировал  
_ttp://kontiky.googlepages.com/scan_kromsator_v5_91_full.rar
_ttp://kontiky.googlepages.com/ScanAndShare1.07.rar

Всего записей: 320 | Зарегистр. 14-09-2003 | Отправлено: 11:38 02-08-2008
pavel_nik_563



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Подскажите плиз, в DjvuOCR есть такая штука как "Dump picturure`s координаты" как этим пользоваться, координаты беруться из FR в SK или наоборот?

Всего записей: 139 | Зарегистр. 04-10-2005 | Отправлено: 12:14 02-08-2008
ghosty



Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
pavel_nik_563
Берутся из FR, но в SK не попадают И в свете остановки проекта вряд ли в ближайшее время попадут

Всего записей: 6808 | Зарегистр. 21-09-2002 | Отправлено: 13:10 02-08-2008
pavel_nik_563



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ghosty
Грустно, было бы намного удобнее на автомате получать координаты,чем в ручную выставлять зоны.
А что со СК 5.92 выкладывать будуть или только рассказывать как он хорош?

Всего записей: 139 | Зарегистр. 04-10-2005 | Отправлено: 14:00 02-08-2008
kontiky

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
pavel_nik_563
А что - уже есть sk 5.92? Что там нового?
 
Добавлено:
Просьба автору ScanAndShare - сделайте в Pdf варианте вашего руководства, в начальном разделе оглавления, так, что бы при клике мышкой на номер страницы можно было бы сразу перейти на нужный раздел ScanAndShare, а не долго и нудно пролистывать, как это происходит сейчас.

Всего записей: 320 | Зарегистр. 14-09-2003 | Отправлено: 15:09 02-08-2008
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator СканКромсатор (Часть 2)
Widok (30-03-2009 18:08): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru