Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » ScanKromsator / СканКромсатор (Часть 3)

Модерирует : gyra, Maz

gyra (14-11-2018 10:38): ScanKromsator / СканКромсатор (Часть 4)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ScanKromsator

Знаменитый Кромсатор для обрезки получаемых при сканировании изображений, а также для разделения страниц, очистки от мусора и т.п.  
Автор: bolega. http://bolega.hotmail.ru/.  
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator
 
Аналог ScanKromsator - Scan Tailor
 
Начало обсуждения - 1 часть, 2 часть.
 
Текущая версия: ScanKromsator v6.00.5 (2,1 МБ) Настройка внешних утилит  
Предыдущая версия: 5.96.2  (файл sk.exe), утилиты к ней можно взять из v5.96.1  
 
Старые версии: Подробнее...
 

Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон


Подборка ответов bolega про работу ScanKromsator (версия 1.0.1 с закладками и сносками), 2016 г.
 
Хрестоматия материалов про СК , 2017 г.
(25 Mb, для открытия файла chm может потребоваться его разблокировать в свойствах файла, кликнув ПКМ)  
Включает, в том числе:
Видеоуроки про ScanKromsator Подробнее...
 
Обработка пикчур-зон от TelecomUral Подробнее...
 
English texts Подробнее...
 
Что делать, если ScanKromsator не делает то, что хотелось бы... И ещё bolega о том же самом...

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 18:07 30-03-2009 | Исправлено: Maz, 09:43 22-08-2018
bolega

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
driver1991

Цитата:
"One page", "Compare" Zones есть такой пункт

Это он и есть.
 

Цитата:
не получаю такого файла со свободным местом

Я не понимаю, что имелось ввиду.
 

Цитата:
поэтому очень прошу не воспринимать это

Все в порядке. Я адекватный
 
 
 
Добавлено:

Цитата:
Второй вопрос - как сделать фон книги не белый, а такой, какой он есть в книге, т. е. желтый

Это как раз то, что неплохо делает DEE при правильном профиле. В СК лучше этого не делать, разве что иногда.

Всего записей: 4408 | Зарегистр. 09-09-2002 | Отправлено: 19:35 10-04-2014
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
driver1991
этот файл уже чем-то обрабатывали и испортили
 
а) где вы его взяли ? (может, там есть альтернатива ?)
б) возможно ли пересканировать с другими настройками ?
 
PS
можно просто буквы в черный перекрасить (волшебным удалением - серый фейерверк при чувствительности 70)
http://rusfolder.com/40391289
но смысла это делать, когда они все побиты и в половине перемычек нет, никакого нет.

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 19:53 10-04-2014 | Исправлено: daa2013, 20:02 10-04-2014
driver1991

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
bolega

Цитата:
Я не понимаю, что имелось ввиду.  

 
Я попытаюсь объяснить.
 
В примере fon1, где Вы объясняете как делать фон, в папке out есть одинаковые файлы pic.0005.tif и pic.0007.tif. Как Вы их получили - для меня не понятно. Файла pic.0005.tif у меня нет вообще, а нумерация, тем не менее, переходит от 004 к 006. На файле 007 сохраняется часть карты, хотя в Вашем примере ее нет.
 
Файл 004 состоитиз двух частей: текст и картинка с сильно ослабленным текстом, также, как у Вас в примере. Файл 007 - не разделен.
 

Цитата:
Это как раз то, что неплохо делает DEE при правильном профиле.

 
Я работаю преимущественно с .pdf, поэтому (и по другим причинам) для меня кромсатор лучше.
 
daa2013

Цитата:
этот файл уже чем-то обрабатывали и испортили  

 
Этот сырой скан из раздачи. Мне очень хотелось бы иметь эти книги.
 

Цитата:
волшебным удалением - серый фейерверк при чувствительности 70

Если можно - пожалуйста, немного подробнее. Я, к сожалению, этим диалектом не владею, но мне кажется, что это важно. Конечно, если бы удалось испровить шрифт - то это хорошо.
 
Спасибо зо ответы.
 
 

Всего записей: 376 | Зарегистр. 12-09-2011 | Отправлено: 20:47 10-04-2014
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Этот сырой скан из раздачи. Мне очень хотелось бы иметь эти книги.  

 
Это не сырой скан. Возможно у сканера, или сканирующей программы были включены какие-то дополнительные настройки.
 
Из какой раздачи ????

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 08:05 11-04-2014
ScrewDriver78

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Этот сырой скан из раздачи

По-моему, этот скан был уже зажат в djvu без обработки, а потом разжат обратно. Боюсь, ничего хорошего с ним уже не сделаешь, только контраст вытянуть, элементы букв уже утеряны.

Всего записей: 14 | Зарегистр. 19-10-2011 | Отправлено: 09:30 11-04-2014
SAM61K

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Сделайте скрин

Всего записей: 1 | Зарегистр. 11-04-2014 | Отправлено: 09:32 11-04-2014
driver1991

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013

Цитата:
волшебным удалением - серый фейерверк при чувствительности 70

 
Возможно, Вы не заметили, но я просил Вас объяснить, чтобы это значило?

Всего записей: 376 | Зарегистр. 12-09-2011 | Отправлено: 10:37 11-04-2014
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я заметил. Но я уже дважды спросил об источнике тиффов, а вы молчите как партизан. Совершенно сознательно не писал, в ожидании вашего ответа.
 
Что имелось ввиду. Прогнать все сканы без обработки в СК; в режиме result view пипеткой взять за образец цвет буквы; переключить в заливку черным цветом (ctrl+2), и затем нажав кнопку в виде серого фейервекра   magic clear, выделять всю страницу. СК будет выбранный цвет в определенных пределах чувствительности (для вашего скана 70) менять на черный.
Это довольно кривой метод, требующий к тому же ручного труда, и рекомендовать его  неохота.
Например также можно (без ручных действий) собрать в джву, разобрать джву на слои маски и слои фона, бинаризовать слой маски в ч/б, собрать обратно.
 
Но я согласен с ScrewDriver78 что очень похоже, что файл уже джвучили, возможно в jpeg2000 с потерями конвертили, с ним 100% что-то делали, и чем уродоваться с кривыми сканами (все равно буквы уже убиты, и их не вернуть), правильнее раздобыть оригиналы. А оригиналы надо будет обрабатывать совсем-совсем по-другому.
 
Я подозреваю, что это полное собрание сочинений Мельникова-Печерского 1909 года с рутрекера.
Ну напишите раздающему и попросите первоисточники сканов.
Я сам так часто делаю, когда книги поубивали.
 
Рассказываю дальше. Судя по существующей проблеме,
первоисточником этого добра является архив.орг.
Да, моя догадка подтверждается
https://archive.org/details/polnoesobranieso07melnuoft
 
если зайти в кнопочку  
All Files: HTTPS  
https://ia700304.us.archive.org/3/items/polnoesobranieso07melnuoft/
 
то можно добраться до первоисточников: сканов сырцов.
Это самый большой архив  
polnoesobranieso07melnuoft_orig_jp2.tar  
на 425 мегабайт.
 
И вот дальше, если повезет, там (внутри файла с суффиксом orig), действиетльно, будут оригиналы в формате jp2, которые надо будет конвертить в ирфане.
Я скачаю (хотя, почему я должен за вас по инету ползать ?), напишу дальше, что делать.  
Хотя всё, что я со сканами делаю, я многократно уже описывал.
 
Там 7 томов
https://archive.org/search.php?query=melnikov%20sobranie%20AND%20mediatype%3Atexts
 
У вас была 104 страница из первого тома  (мне отдаёт со скоростью 20 кб/сек, долго ждём)

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 11:51 11-04-2014 | Исправлено: daa2013, 13:19 13-04-2014
driver1991

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я не понял вопроса об источнике. Да, это сканы с рутрекера.
 
Приблизительно такой же результат, как  у Вас, я получил несколько другим путем:
 
http://yadi.sk/d/Hpzc46pXMEwaW
 
и
 
http://yadi.sk/d/XMva4VH8MEzW5.
 
Пересылать сканы в формате .tiff достаточно трудоемкое занятие, я делал это сам и знаю насколько это муторно. Поэтому пока попытаюсь обойтись подручными средствами. Но если не будет другого выхода - тогда спрошу автора.
 
Мне интересно получить желтый фон того оттенка, что у старых книг. Можно было бы просто обработать как черно-белый, но со старой орфографией чего-то не хватает. Конечно, это уже близко к бзику.
 
У нас вообще-то все дорогие книги печатают на желтоватой бумаге, вернее типографская бумага высокого качества имеет желтоватый цвет. Как это передать в электронных книгах - пока не знаю, да и стоит ли - тоже вопрос.
 
 
Вдогонку.
 
Я скачал первый том с того архива. Спасибо за указание.
 
Насчет конвертирования в тиф - может быть Фотошоп лучше?

Всего записей: 376 | Зарегистр. 12-09-2011 | Отправлено: 12:58 11-04-2014 | Исправлено: driver1991, 00:48 16-04-2014
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Так на рутрекере никаких сканов печерского нет. Есть только джву.
 
Наконец, скачался 1 том.  
В нем нас интересует 104-я страница
 
- скан-первоисточник, конвертированный в тифф
- обработка по методу bolega (но тут при таком исходнике, конечно, нужно фильтрами играться)
 
 
http://rusfolder.com/40397860
 
PS
у меня нет последних версий фотошопа.
из имеющегося у меня софта конвертация из jp2 есть только в ирфане.

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 13:43 11-04-2014 | Исправлено: daa2013, 13:53 11-04-2014
driver1991

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я не очень понимаю необходимости конвертации в тифф, ведь кромсатель прекрасно работает с jp2.
 
Здесь одна страничка из скачанного с архив.орг первого тома:
 
http://yadi.sk/d/nDARRtNnMFJ66
 
, которую я наспех сделал, она не обработана еще как следует, но вполне читабельна и практически это то, что я хотел.
 
PS
 
Photoshop у меня тоже только CS5, за ними покупать или даже апгрейд делать никаких денего не хватит.
 
Эту страничку я специально выложил в пдф. чтобы показать, что кромсателем можно полностью обработать файлы jp2.
 
Вы упоминали, что Вы много раз уже объясняли, что делать со сканами. Можно узнать - где это?

Всего записей: 376 | Зарегистр. 12-09-2011 | Отправлено: 13:55 11-04-2014 | Исправлено: driver1991, 14:27 11-04-2014
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
daa2013

Цитата:
в режиме result view пипеткой взять за образец цвет буквы

Это как?

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 15:06 11-04-2014
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
"волшебным пальцем", конечно. Пипетка - это в шопе.
"Задать цвет как среднее в текущем выделении". Но одно дело 100 страничек пробежать, другое - 7 томник по 500-600 стр делать.  
 
А фотошоп у меня - 7.0. Что кромсатор жрет jp2 - не знал.

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 15:18 11-04-2014 | Исправлено: daa2013, 15:28 11-04-2014
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
daa2013

Цитата:
Но одно дело 100 страничек пробежать, другое - 7 томник по 500-600 стр делать.

А в чем проблема?
В СК это делается на автомате, надеюсь, достаточно усредненного фона на ВСЮ книгу, а не на каждую страницу.

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 16:24 11-04-2014
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
shch_vg
Подскажите, как усредненный фон для группы файлов делается при обработке  на автомате (т.е. без ручной расстановки зон на каждую старницу, без ручного изменения цвета и т.д.), если на выходе тиффы. Я знаю, вы так газеты обрабабтываете, но я цветной фон почти никогда не делаю.    В момент создания джву ?
 
 
driver1991
Если вас ваш этот вариант устраивает, то я бы далее ClearScan делал и задник до 100 дпи уменьшал
http://rusfolder.com/40400354
имхо читать легче и файл раз в 6 меньше.
Но вот белое пространство по углам чем-то стоит залить.

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 17:38 11-04-2014 | Исправлено: daa2013, 17:40 11-04-2014
driver1991

Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
daa2013
 
Это же только для демонстрации, все еще не обработано, только текст, и то, весьма приблизительно, что читать уже можно, скан не развернут, не вычищен, это только, так сказать, идея.
 
Спасибо Вам большое за архив.орг. Я скачивал оттуда литературу, но мне просто в голову не приходило, что там есть книги на русском языке, теперь предстоит большая работа. На рутрекере опубликовано довольно много изданий до 1917 года, но качество в большистве случаев оставляет желать лучшего.
 
"ClearScan" . что Вы имеете в виду?
 

Цитата:
задник до 100 дпи уменьшал  

Вот этого я еще никогда не делал. Можно подробнее?

Всего записей: 376 | Зарегистр. 12-09-2011 | Отправлено: 18:08 11-04-2014
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
daa2013
Начну с того, что газеты я обрабатываю совсем не так!
При их обработке на выходе я получаю скан в цвете в 300dpi, и фон я стараюсь не трогать (разве что немного обесцвечиваю его, увеличивая яркость обработки), а поля заливаю усредненным цветом фона.
Здесь же разговор, как я понял, идет об обработке в ч/б в 600 дпи, но с усредненным цветным фоном. Я немного переборщил, заявив, что "на автомате", т.к. придется создавать на каждой странице picture-зону на всю страницу.
В свойствах зоны можно задать как цвет фона, так и текста (если кажется, что ч/б его вид слишком черный ).

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 18:15 11-04-2014 | Исправлено: shch_vg, 02:22 12-04-2014
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Уважаемый bolega,
 
хоть Вы и просили новых реквестов не писать,
но раз новая версия СК всё ещё не выложена, значит, работа над ней идёт.
А я с новой ситуацией столкнулся.
 
После долгого перерыва вернулся к обработке задания, где у меня в словаре глифов собрано 4 шрифта-алфавита, и понял, что забыл какой где.  
Проблема в том что буквы строчные, заглавные, знаки препинания каждого из них идут не по порядку, а вразнобой - там где собрались.
Типа:
шрифт а - строчные
шрифт б - знаки
шрифт ц - заглавные
шрифт б - заглавные
шрифт а - знаки  
ну и т д.
 
И если когда я их собирал, я помнил, где что. То сейчас путаюсь. (Они же все похожи, соотношения размеров на панели не видно)
Нельзя ли в словарь глифов встроить возможность делать какие-то разделители и заголовки, или лейблы, или пометки, или цветом глифы выделять ?  
Чтобы как-то различать один шрифт от другого.

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 12:06 12-04-2014 | Исправлено: daa2013, 12:07 12-04-2014
shch_vg

Gold Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
daa2013

Цитата:
а вразнобой - там где собрались.

 а перетаскивать в пределах библиотеки не пробовали?

Всего записей: 6966 | Зарегистр. 14-01-2005 | Отправлено: 20:12 13-04-2014
daa2013

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Они не перетаскиваются группой, только по одному. А 120 символов внутри словаря глифов переставлять - не стоит. Да и потом, я каждый из этих 120 раз путаюсь, где что.
 
ЗЫ
 
bolega
а еще было бы неплохо, чтобы словарь глифов реагировал на колесико мышки,
чтобы не за тулбар тянуть, а колесиком быстро можно было прокручивать.
 
и возможно, не знаю, чтобы при двойном щелчке мышкой появлялся повторно уже размещенный глиф.
Обычно, на участке одна буква кривая, вот чтобы не цапать её каждый раз, а везде и поправить

Всего записей: 1014 | Зарегистр. 13-06-2013 | Отправлено: 22:11 13-04-2014 | Исправлено: daa2013, 22:26 13-04-2014
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199

Компьютерный форум Ru.Board » Компьютеры » Программы » Закладки » ScanKromsator / СканКромсатор (Часть 3)
gyra (14-11-2018 10:38): ScanKromsator / СканКромсатор (Часть 4)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru