Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator / СканКромсатор (Часть 3)

Модерирует : gyra, Maz

gyra (14-11-2018 10:38): ScanKromsator / СканКромсатор (Часть 4)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator

Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п.  
Автор: bolega. http://bolega.hotmail.ru/.  
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Аналог ScanKromsator - Scan Tailor
 
Начало обсуждения - 1 часть, 2 часть.
 
Текущая версия: ScanKromsator v6.00.5 (2,1 МБ) Настройка внешних утилит  
Предыдущая версия: 5.96.2  (файл sk.exe), утилиты к ней можно взять из v5.96.1  
 
Старые версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон


Подборка ответов bolega про работу ScanKromsator (версия 1.0.1 с закладками и сносками), 2016 г.
 
Хрестоматия материалов про СК , 2017 г.
(25 Mb, для открытия файла chm может потребоваться его разблокировать в свойствах файла, кликнув ПКМ)  
Включает, в том числе:
Видеоуроки про ScanKromsator Подробнее...
 
Обработка пикчур-зон от TelecomUral Подробнее...
 
English texts Подробнее...
 
Что делать, если ScanKromsator не делает то, что хотелось бы... И ещё bolega о том же самом...

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 18:07 30-03-2009 | Исправлено: Maz, 09:43 22-08-2018
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
driver1991
Выложите несколько страничек сканов, желательно без предобработки и сжатия в джипег.

Всего записей: 2133 | Зарегистр. 22-03-2005 | Отправлено: 16:39 17-07-2014
driver1991

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VadimirTT
 
Вот два развоторота:
 
https://yadi.sk/i/q2ehn9B0WnXrR  
 
https://yadi.sk/i/mGl65ubTWnXwG
 
Это необработанные сырые сканы.
 
Забыл указать: 300 DPI, серые, 8 бит.

Всего записей: 330 | Зарегистр. 12-09-2011 | Отправлено: 17:11 17-07-2014 | Исправлено: driver1991, 17:15 17-07-2014
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
driver1991
С ходу, пока без обработки, у Вас сканы разворот размером 1280 на 1002 точек, а у меня одна страница, при сканировании в 300 дпи, 1468 на 2336?  
Говорят, что джипег 100% не портят сканы, но я в любом случае его избегаю, на контрастных переходах, границы букв, джипег делает ореол, с этим бороться наверное можно, но зачем?
Для примера некоторые мои сканы, это отнюдь не hi-fi, но так может сделать каждый, при соблюдении минимальных правил.
 
Добавлено:
Вот что у меня получилось, но это "ужас, ужас, ужас"!
Можно ли устранить притензии, озвученные выше?

Всего записей: 2133 | Зарегистр. 22-03-2005 | Отправлено: 20:27 17-07-2014
driver1991

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VadimirTT
 
Я сейчас открыл эти сканы в IrfanView, вот данные:
 
Current size 3029x2370 pixels.
 
Это в обоих случаях. Т. е. если увеличить ширину Вашей страницы вдвое (разворот). получится приюлизитеоьно те же размеры, что и у Вас. Я ничего не сжимал и при сканировании всегда отключаю все сжатия и другие обработки. Почему к Вам попали  такие файлы - я не могу понять. Я также не сжимал их, когда грузил на яндекс. Размер файла должен быть 7 102 кВ.  
 
Я сгрузил файлы с яндекса - размеры не изменены.
 
Если у Вас есть время - прикиньте, в чем может быть причина и скажите, что нужно сделать?
 
Я сегодня пытался сканировать с переменной контрастностью, интересно, что выпадение элементов букв происходит при любой контрастности.  
 
 
Вдогонку.
 
Вот мой скан:
http://rutracker.org/forum/viewtopic.php?t=4692421. Там есть еще несколько.

Всего записей: 330 | Зарегистр. 12-09-2011 | Отправлено: 21:24 17-07-2014 | Исправлено: driver1991, 21:30 17-07-2014
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
driver1991
Приношу извинение, скачал с яндекса немного не то, вот вариант, соответствующий оригинальному скану.
Случай действительно сложный, характерный для худлита советских времен, у меня те же проблемы с Тагором, может гуру помогут, тут нужен не стандартный подход.

Всего записей: 2133 | Зарегистр. 22-03-2005 | Отправлено: 21:55 17-07-2014
driver1991

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VadimirTT
 
"Не ошибается только тот, кто ничего не делает", так что здесь-то ничего страшного. Что действительно плохо - это то, что при сканировании даже с разной контрастностью, оказывается, выпадают элементы букв и это не восстановишь. И хотя текст на взгляд нормальный, сканы получаются плохие, ну Вы видели. Это издание Булгакова 1999 года, но от этого оно лучше не стало. Вот с Тютчевым проблем не было.

Всего записей: 330 | Зарегистр. 12-09-2011 | Отправлено: 22:24 17-07-2014
VadimirTT



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
driver1991
Булгакова не видел, но и к Тютчеву у меня притензии.  
Могли бы Вы рассказать, как Вы сканировали и обрабатывали.
У Тютчева явные глюки джипега, так назывемые изъеденные буквы.
В делании е-буков, самое затратное по времени это сканирование. Сканировать собрания сочинений, почти подвиг . Так что, есть повод разобраться с деталями. Надеюсь, что примут участие и более древнии аксакалы.

Всего записей: 2133 | Зарегистр. 22-03-2005 | Отправлено: 22:44 17-07-2014
driver1991

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VadimirTT
 
Претензии - это не страшно, это можно исправить.
 
Я всегда сканирую и обрабатываю без сжатия, поэтому о каких-либо скажениях букв в результате использования "сжимающих" программ речи быть не может. "Изъеденность" букв есть на сканах, почему меня этот вопрос и волнует.
 
Какие подробности Вас интересуют? Так я мог бы подробнее ответить на все вопросы.  
 

Цитата:
примут участие и более древнии аксакалы
было бы хорошо, но у них обычно нет времени.
 
Насчет Булгакова - задайте на сайте в поиске "Булгаков". Там же есть еще мои Ахматова, Гумилев, Хлебников, Блок, Волошин, Пушкин... Они не без греха, но читабельны.
 

Всего записей: 330 | Зарегистр. 12-09-2011 | Отправлено: 23:10 17-07-2014
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
VadimirTT
driver1991
Вы тему случайно не перепутали?
Вам же давали ссылку на тему, где это обсуждается.

Всего записей: 6290 | Зарегистр. 14-01-2005 | Отправлено: 01:24 18-07-2014
ScrewDriver78

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
вот результатов я не видел

Вот раздача - http://rutracker.org/forum/viewtopic.php?t=1633242 - все 1800 документов (кроме десятка pdf, и десятка изначально качественных) обработаны мной.
 

Цитата:
но с затратой такого количества времени

А кто вам обещал, что будет легко и быстро? SK - инструмент, отличная острая стамеска в руках мастера. А дальше - или ручками, или не делать совсем.
 

Цитата:
Был бы очень благодарен за конкретные указания, как Вы убираете просвечивающие буквы, слабый контраст и другие указанные недостатки.

Подбираются режимы обработки; самый простой вариант - адаптивный порог, если не срабатывает - далее по  вкусу, увеличение резкости, коррекция контрастности, чистка фона в разных режимах и т.д. Всё подбирается на одной странице, наиболее показательной; потом применяется ко всей книге, проходится пакетной обработкой, результат просматривается, выпадающие из общего результата страницы обрабатываются отдельно.
 
 
 
Добавлено:

Цитата:
Вот два развоторота:

http://rghost.ru/56955070 - очень быстро, буквально пять минут, пора на работу бежать.  
Стоило бы увеличить разрешение выхдного файла до 600 - у шрифта слишком тонкие перемычки, и поиграть с очисткой фона, но это не успеваю.

Всего записей: 14 | Зарегистр. 19-10-2011 | Отправлено: 09:18 18-07-2014
driver1991

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScrewDriver78
 
То, что Вы сделали действительно можно сделать за пять минут. К сожалению, потери элементов в буквах, например, потеря перемычек у буквы "н" во многих местах текста, так и остались. Почистить остатки просвечивающего текста на открытых местах - тоже не "сильно" трудно. Эти разговоры "поиграть" и прочее - остаются только разговорами, хороших результатов я не видел. Даже если увеличить разрешение на выходе до 1200 - потерянные элементы букв не появятся, ни один графический редактор не может этого сделать, потому что он не может догадаться, что там за буква, не знает он их, неграмотный. Увеличение порога бинаризации ведет к появлению грязи.
 
Игры с чисткой фона также имеют границы, к сожалению. Очистка между букв приводит к потере знаков препинания, а иногда даже к потере элементов букв.
 
Где Вы видели, что я требую "легко и быстро"? Но между разумными затратами времени на получение хорошого результата и работой, которая может длиться месяцами с неопределенным результатом - на мой взгляд разница есть.
 
Свои выкладки на рутрекере я указал, так что кое-какой опыт есть.
 
Вообще, господа, я очень благодарен, когда мне хотят помочь, но мы здесь являемся участниками форума, кто мы и что мы - никому из нас неизвестно, некоторые имеют знания и опыт, соответствующие тематике форума, остальные приходят учиться и что-то узнавать. Давайте жить дружно, не поучать, а учить и делиться опытом, а не хамить. У нас говорят: "Тот, кто спрашивает - невежда, а тот, кто не спрашивает - остается невеждой навсегда".

Всего записей: 330 | Зарегистр. 12-09-2011 | Отправлено: 11:54 18-07-2014 | Исправлено: driver1991, 11:55 18-07-2014
ScrewDriver78

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Игры с чисткой фона также имеют границы, к сожалению. Очистка между букв приводит к потере знаков препинания, а иногда даже к потере элементов букв.

Надо побирать размер спекла под скан, чтобы не пропадали знаки.
 

Цитата:
Даже если увеличить разрешение на выходе до 1200 - потерянные элементы букв не появятся

больше 600 бесполезно. Касательно потерянных элементов букв - то тут есть два варианта: если шрифт такой, что они не пропечатываются, так их и взять неоткуда; а если они физически ОЧЕНЬ тонкие, существенно тоньше пикселя при разрешении скана 300 dpi - то воленс-ноленс придется сканить в 400 или 600. Или сканить в цвете, а фон смахивать вручную "мэджик клинером".
 

Цитата:
Давайте жить дружно, не поучать, а учить и делиться опытом

В случае СК всё настолько индивидуально для каждого скана, что научить чему-либо тут IMHO невозможно. Некоторые сканы, которые я не могу возможности получить в лучшем состоянии, вылеживаются у меня годами, я делаю по нескольку заходов - пока ВНЕЗАПНО не получается оптимальная комбинация настроек именно для этого варианта.
 
А чаще в критических случаях я просто прощаю себе небольшую "загрязненность" текста, не мешающую чтению. В конце концов, реальные книги практически всегда имеют небольшую замусоренность, и ничего.
То есть при выборе - или потери шрифта, или загрязненность шрифта, я предпочитаю загрязненность потерям.
 

Цитата:
ни один графический редактор не может этого сделать, потому что он не может догадаться, что там за буква, не знает он их, неграмотный

Да, к сожалению, пока нет продукта, сочетающего мощь СК и FineReader-a. А хотелось бы...

Всего записей: 14 | Зарегистр. 19-10-2011 | Отправлено: 12:42 18-07-2014
driver1991

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Надо побирать размер спекла под скан

 
По моему опыту - 8 - 9 пикселей, больше уже рискованно, тогда обрабатывать только небольшие площади и очень внимательно смотреть, достаточно часто некоторые знаки препинания теряются и при этих значениях. Здесь уже играет роль время.
 

Цитата:
Касательно потерянных элементов букв  

Здесь в последнее время меня достали некоторые издания.  
Ситуация такова. В книге на странице все выглядит нормально, все буквы и все их элементы хорошо видны. На сканах пропадают элементы букв. При этом увеличение контрастности не дает никакого улучшения, иногда уменьшение яркости дает лучший результат, но это не всегда.
Я заметил, что эта особенность имеет место на книгах отпечатанных репринтными способами, т. е. на тех, книгах, которые были репродуцированы (каким-либо способом), и печатаются с диапозитивов или как там это все называется, я с этим еще не разбирался. Наткнулся я на это чисто случайно, при сканировании перепечатки Пушкина, выпущенной "Воскресеньем" (не могу удержаться - отвартительное издательство). При сканировании одного тома этого издания у меня выпали две страницы. В пределах досягаемости у меня есть старое издание 1930-х годов. Я сравнил их, разницы никакой (ведь перепечатка!), отсканировал недостающие страницы и вставил эти страницы. Сканы страниц старого издания получились идеальными, хотя и сканер и метода и руки остались теми же.
 

Цитата:
или потери шрифта, или загрязненность шрифта

 
Есть вариант очистки вручную, но это - рабский труд и, как я уже писал, о-о-о-чень долго.
 

Цитата:
пока нет продукта, сочетающего мощь СК и FineReader-a

 
Мне все-такм кажется, что bolega прав, когда не хочет расширять СК. Здесь одни цели и задачи и если расширять их - то может получиться нечто не только неуправляемое, но и содержащее огромное количество ошибок.
 

Всего записей: 330 | Зарегистр. 12-09-2011 | Отправлено: 13:25 18-07-2014 | Исправлено: driver1991, 13:28 18-07-2014
ScrewDriver78

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Я сравнил их, разницы никакой (ведь перепечатка!), отсканировал недостающие страницы и вставил эти страницы. Сканы страниц старого издания получились идеальными, хотя и сканер и метода и руки остались теми же.

 
Хранение материала и печать осуществляются в цифре, с низким разрешением. А оригинал - аналоговый. Поэтому при переводе уже "цифрового" изображения еще раз в цифру неизбежно возникает интерференция между "их" разрешением и вашим. Т.е. часть "их" пикселей попадает в ваш скан только краями, и результирующие пиксели оказываются очень бледными.
Решение неожиданное - может помочь повышение разрешения скана вдвое ПОСЛЕ сканирования и размытие (blur) - перед обработкой. Пару раз мне это помогало вытянуть читаемое качество из очень убитых исходников.

Всего записей: 14 | Зарегистр. 19-10-2011 | Отправлено: 14:03 18-07-2014
driver1991

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
неизбежно возникает интерференция между "их" разрешением и вашим

 
Насколько я понимаю, при репродуктивной печати оригинал проходит (или его проводят) через следующие стадии:
1. Оцифровка исходого оригинала.  
2. Сохранение полученной копии.
3. Печать нового оригинала с сохраненной копии.
4. Полученный оригинал не имеет никакго отношения к цифре(?), он аналоговый.
 
Далее, я вновь сканирую имеющийся оригинал. Если можно, подробнее, откуда здесь интерференция, чего с чем и откуда? Новый аналоговый результат "помнит" о цифре?
 
Похожая, возможно(?), ситуация иногда возникает, когда в СК используется "Background cleaner" в "Gray enhance", там тоже черные пискели многда становятся белыми. Но там есть "Protect black pixels", после чего получается нормальная картинка.

Всего записей: 330 | Зарегистр. 12-09-2011 | Отправлено: 15:02 18-07-2014
ScrewDriver78

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
4. Полученный оригинал не имеет никакго отношения к цифре(?), он аналоговый.

Какой же он аналоговый, если фотошаблон, с которого делается матрица, печатается на лазер-гравере? Положим, это неплохой лазер-гравер и разрешение у него 600 dpi. У вашего сканера тоже 600, но чуть-чуть другие. В итоге пиксели вашего сканера то попадают точно в середину их пикселей, то, через какой-то промежуток - смещаются к краю. И одинаковые элементы шрифта то получаются отлично, то совсем бледно.
Когда печать традиционная - такого быть не может, расстояние между элементами шрифта меняется столбец к столбцу (я имею в виду столбцы пикселей сканера) случайно, и целиком перемычка в букве "н" пропасть не может, могут выпасть только отдельные точки и это будет незаметно.

Всего записей: 14 | Зарегистр. 19-10-2011 | Отправлено: 16:33 18-07-2014 | Исправлено: ScrewDriver78, 16:38 18-07-2014
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Работа над новой версией СК почти подходит к завершению.
 
Новое:
 
- Обработка распределяется параллельно по нескольким процессорам/ядрам. Кол-во задействованных ядер задается пользователем: File->Options->Processing->Number of used cpu kernels.
 Скорость параллельной обработки в зависимости от используемых опций выросла в 2..5 раз (проверялось на 4-х ядерном i5).
 
- Используется новый менеджер памяти, позволяющий СК выполнять обработку сканов большого размера. В предыдущей версии обработка таких сканов аварийно завершалась с  сообщением out of memory.  
 Программа откомпилирована с ключом, позволяющим использовать более 2 Гб оперативной памяти каждым процессом (при соответствующей настройке windows).  
 
- После обработки сканов прямо в окне VR можно выполнять быструю ре-бинаризацию результата с другими значениями порога бинаризации. Для этого СК сохраняет в папке out промежуточный обработанный, но небинаризованный файл. Это требует достаточно большого объема свободного места на ж/диске.
 
- В окне VR можно выполнять переобработку выбранной зоны, не выходя из окна. Параметр File>Options>Processing: Restore zone position after reprocessing определяет, нужно ли помещать зону в положение, которое было перед переобработкой, либо оставлять ее в расчетном месте.
 
- На закладке Quality два новых фильтра: Blur2, Sharpen2. Это аналоги одноименных фильтров Blur, Sharpen, но более сильные. Sharpen2 особенно эффективен в случае жирного текста.  
  Все фильтры на закладке переписаны на MMX-ассемблере и выполняются быстрее в несколько раз.
 
- Фильтр sharpen в Gray image enhance переписан на MMX-ассемблере. Макс. значение радиуса фильтра уменьшено до 5.
 
- Фильтр Enhance contour [Auto] в Gray image enhance переписан на MMX-ассемблере и выполняется на порядок быстрее.
 
- Диапазон значений радиуса фильтра Gauss blur увеличен вдвое чтобы регулировка была более плавной. Задания и профили, созданные в предыдущих версиях, будут при открытии автоматически подстраивать значение радиуса. Т.е. значение 1 в старом задании соответствует значению 2 в новом.
 
- В опции picture-зон добавлены фильтры Mean, Blur2, Sharpen2, Autolevels, Background substract. Опция mean может эффективно применяться для удаления растра (наряду или вместо descreen). Background substract позволяет избавляться от паразитного фона, как правило желтого. Autolevels автоматически улучшает контраст/яркость, степень улучшения регулируется одним параметром.
 Добавлена кнопочка Info, выдающая информацию о геометрических свойствах зоны, на входе и на выходе.
 Каждая зона имеет свойство Group index. Это число от 1 до 10.  При копировании опций зоны (всех, одной или набора) на другие зоны можно указать, что опции следует копировать только на зоны с заданным Group index.
 
- Для защиты рваных букв от despeckle введены новые опции: Page>Special>Protect: Protect from despeckle и Protect from white hole filling. Защита реализована с использованием OCR-движка Tesseract.
  В опциях пользователь выбирает язык (один или более) распознавания (включены наиболее распространенные языки) и задает, какие буквы следует защищать, например "инймМ". Множество букв для despeckle и hole filling задается независимо. Следует отметить, что скорость работы Tesseract чрезвычайно мала, но результат того стоит, если печать в книге очень плохая, в частности, если пропадают перемычки,   кусочки серифов и проч. части букв. Следует иметь также ввиду, что результат защиты целиком зависит от точности распознавания Tesseract. На мой взгляд, Tesseract вполне сносно распознает русский текст, по крайней мере, в том объеме, который необходим СК.
 Опции защиты применяются как к странице, так и к picture-зонам.
 
- Новая команда Zones>Paste zone to other pages. Зону, скопированную в карман, можно  продублировать на заданном диапазоне страниц. Задается диапазон страниц, а также способ горизонтального и вертикального выравнивания зоны при вставке (оригинальное положение,  в заданную точку, в левый верхний угол, в левый нижний и т.д.)
 
- Работа с библиотекой глифов пополнилась рядов усовершенствований: регулировка представления  окошка с глифами (количество колонок, авто-ширина), мульти-выделение и мульти-перетаскивание глифов внутри окошка, авто-кроп вставляемых глифов (удаление лишнего белого пространства вокруг глифа), добавление заданного белого зазора со всех сторон глифа.
  Добавлена возможность авто-установки глифа в место вставки: теперь не обязательно  точно выбирать точку вставки глифа, СК сам постарается найти оптимальное положение для вставки, анализируя некоторую окрестность вблизи курсора.
 
- В гл. окне список последних открываемых файлов расширен до 5. Имя последнего из открытых файлов помещается всегда в конец.
 
- В гл. окне произвольное выделение, полученное с помощью magic wand, можно преобразовать в полигональную зону. Ранее magic-выделение преобразовывалось только в прямоугольную зону.
 
- File>Options: Max number of vertexes in polygonal zones (=300) задает максимально допустимое количество вершин в полигональной зоне. Если при создании зоны количество вершин превосходит это значение, СК автоматически оптимизирует полигон для достижения предельного числа вершин.
  Там же новая опция exclude pic-zones from magic-wand selection. При включении опции  magic-wand selection не будет захватывать имеющиеся на странице picture-зоны.
 
- Если в режиме mouse-up-zone расставлять зоны, то в случае нажатого Shift тип зоны будет всегда exclude независимо от текущего значения переключателя Mouse-up-mode.
 
- Новая опция Quality>Gray enhnce>Contrast: apply contrast/brightness before illumination correction. Назначение понятно из названия.
 
- Немного изменен алгоритм deskew:art, теперь он должен точнее работать для разряженных страниц.
 
- Реорганизовано и упорядочено контекстное меню главного окна и окна VR.
 
- Новая опция окна VR: Options>Editor: paste point location. При вставке изображения (из кармана или библиотеки глифов) точкой вставки может быть или верхний угол глифа, или его середина.
 
- Новые hotkey для гл.окна: "Fit width", "Rotate&save", "Выделить следующую picture-зону", "Выделить предыдущую picture-зону".
 
- Новые hotkey для окна VR: Add glyph to library, Insert glyph to library
 
- при создании djvu в лог пишется командная строка вызова DEE
 
- Пути к утилитам в File>Options>Apps (djvulib, dee и т.д.) могут задаваться относительными. Для этого они должны начинаться с символа точки, напр. "..\folder", "..\..\folder", ".\folder". Пути считаются заданными относительно папки с исполняемым файлом.  
 
- Унифицированы принципы именования файлов при импорте из pdf и djvu. Исключена возможность перезаписи файлов в случае, когда импорт выполняется в одном и том же задании несколько раз.
 
- Исправлен баг с утечкой памяти при создании djvu.
- Исправлен баг: форма полигональной зоны на выходе в процессе обработки определяется неверно в случае, когда резак пересекает ребро зоны под малым острым углом или касается его края.
- Исправлен баг с опцией File->Options->Processing->process priority: ранее смена значения не влияла на реальный приоритет. Приоритет меняется только на время выполнения обработки.
- Исправлен баг: при выполнении draft kromsate с использованием параметра Use options from = named profile из выбранного профиля не применялись глобальные опции обработки (Files->dpi, color; Book->gaps; Options и т.п.).
- Исправлен баг: при импорте pdf при извлечении раскрашенных зон в опции picture-зон помещался правильный цвет раскраски, однако опция paint text color "enabled" не включалась.
 
- Параметр File>Options>Misc: Temp folder for djvu creating задает временную папку, используемую для хранения временных файлов при создании djvu.  
 
- Закладка binarization: у полей threshold новая команда в контекстном меню - "Change threshold...". Позволяет менять порог бинаризации с учетом дополнительных условий. Задается диапазон файлов, способ изменения (поменять на новое значение, прибавить к существующему значению заданную величину, вычесть из существующего значения) и опционально два логических условия (>,=, <>, <, <=, >=). Условия соединяются оператором "и" или "или". Пример команды: увеличить на 10 порог тех файлов, у которых на текущий момент порог лежит в диапазоне 150..180. Еще пример: заменить порог на 180 у тех файлов, у которых на текущий момент порог <185. Команда влияет не только на файлы, у которых порог задан явно, но и на файлы с порогом auto, при условии, что auto-значение уже определено в результате обработки. На пороги smooth и highdark команда не действует.
 
- В контекстном меню зон две новые команды: "convert to convex polygon" и "convert to enclosing circle". Первая преобразует форму произвольной полигональной зоны в выпуклую, вторая - в окружность минимального диаметра, которая содержит внутри себя все вершины полигона зоны (minimum enclosing circle).  
 
- После обработки маркированных зон (команда Zones>Picture zones>process marked zones for files...) в окне VR выводятся только те страницы, зоны на которых были обработаны. Соответственно появилась новая команда Result>show for pages with marked zones.
 
- В окне VR можно включать отображение сетки с заданным шагом. На команду включения/отключения сетки добавлен hotkey.
 
- Значение параметра smoothness фильтра C.Smooth может быть равно 0. При этом искажения контуров букв будут минимальными, сглаживание будет в основном затрагивать только горизонтальные и вертикальные участки контуров. Если вы считаете, что сглаживание данным фильтром слишком сильное, задайте smoothness=0, round=middle, thickness=130..150.
 
- В поля book size, gap можно загружать значения из заранее подготовленного списка стандартных размеров. Список хранится в отдельном текстовом файле. Предлагается готовый список типовых типографских размеров книг.

Всего записей: 3794 | Зарегистр. 09-09-2002 | Отправлено: 15:20 15-08-2014 | Исправлено: bolega, 00:10 13-09-2014
Torino



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Работа над новой версией СК почти подходит к завершению

Олег, спасибо, что не бросаете эту замечательную программу!

Всего записей: 407 | Зарегистр. 20-09-2005 | Отправлено: 16:28 15-08-2014
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
bolega

Цитата:
- После обработки сканов прямо в окне VR можно выполнять быструю ре-бинаризацию результата с другими значениями порога бинаризации.  
А это распространяется на режим просмотра "Zones" и на обработку отдельной зоны на странице?
 
P.S. Две последние возможности - супер!

Всего записей: 6290 | Зарегистр. 14-01-2005 | Отправлено: 19:16 15-08-2014 | Исправлено: shch_vg, 19:21 15-08-2014
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg

Цитата:
А это распространяется на режим просмотра "Zones" и на обработку отдельной зоны на странице?  

Пере-обработку зоны выполнять можно, не выходя в главное окно. What's new поправил.
Ре-бинаризация (по сути интерактивная) не влияет на зоны и не затрагивает их.

Всего записей: 3794 | Зарегистр. 09-09-2002 | Отправлено: 23:38 15-08-2014
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

Компьютерный форум Ru.Board » Компьютеры » Программы » ScanKromsator / СканКромсатор (Часть 3)
gyra (14-11-2018 10:38): ScanKromsator / СканКромсатор (Часть 4)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.Board
© Ru.Board 2000-2020

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru