Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
drcode
I haven't seen any point-to-point comparison of ScanTailor vs ScanKromsator vs BookRestorer.  The latter two may have features that Scan Tailor lacks (zones in SK, correction of geometric distortions in BR), but none of them can beat ST in ease of use.
 
For a good DjVu reader, try WinDjVu.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 09:16 28-07-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
drcode

Цитата:
Is there a software that can be used to convert djvu to pdf

http://djvu.sourceforge.net/doc/man/ddjvu.html

Цитата:
to read djvu with the same convenience, annotation and other features as acrobat  

http://windjview.sourceforge.net/
http://djvu.sourceforge.net/djview4.html

Цитата:
Can anyone list the names of softwares for book processing  

http://www.djvu-soft.narod.ru/scan/scan_and_share_1_07_eng.rar
 
Добавлено:

Цитата:
For example, compare scantailor with scankromsator and book restorer and any other tools, and list their merits and demerits in a tabular fashion ?  


Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:52 28-07-2009
dabudada

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В новой версии обнаружен вылет на стадии разрезки страниц (в предыдущей с этим же пакетом проблем не было), отправить баг-репорт не получается, лучше бы Вы оставили функцию сохранения репорта на компьютере с последующим копи-пастом его здесь.
 
Добавлено:
Специально решил потестить новую систему разрезки страниц, т.к. хотелось, чтобы
Цитата:
...это тенденция выставлять линию разреза на самом краю картинки в случае одностраничных сканов...
Не сочтите за вредность
Вот страница: http://www.onlinedisk.ru/file/187795/

Всего записей: 21 | Зарегистр. 12-03-2009 | Отправлено: 15:54 29-07-2009 | Исправлено: dabudada, 16:37 29-07-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
В новой версии обнаружен вылет на стадии разрезки страниц (в предыдущей с этим же пакетом проблем не было), отправить баг-репорт не получается, лучше бы Вы оставили функцию сохранения репорта на компьютере с последующим копи-пастом его здесь.  

А что именно происходит после падения?  Диалог отправки сообщения о падении открывается?  Если нет, то скорее всего отчет совсем не сгенерировался по какой-то причине.
 
Насчет линии разреза: одну проблему, приводящую к появлению ложной линии скаю, я исправил, зато тут же создал новую, точнее воскресил старую.  Новая проблема - алгоритм стал слишком чувствительным к перепаду освешения по краям.  Раньше эти перепады подавлялись на стадии препроцессинга как побочный эффект от удаления черного обрамления.  Этот препроцессинг ослаблял и саму линию разреза, так что я решил его отключить.  Теперь видимо опять включу.  Впрочем в вашем примере даже отключение препроцессинга не позволило найти линию сгиба - слишком слабо она видна.  Зато перепад яркости скраю был обнаружен и принят да эту самую линию сгиба.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 01:45 30-07-2009
dabudada

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
А что именно происходит после падения?  Диалог отправки сообщения о падении открывается?  

Вылазит диалоговое окно, в котором предлагается отослать отчет (при на нажатии на него выскакивает стандартное окно с предложением выбора программы открытия неизвестного файла/расширения, я не имею понятия какая софтина его распознает), нажимаю отослать, но через пару минут внизу пишется, что отсылка отчета не удалась (не цитирую, пишу по памяти).
P.S. Еще мучаю проект с исчезнувшей миниатюрой, пока не пришел ни к каким выводам и не нашел способ Вам его отослать.

Всего записей: 21 | Зарегистр. 12-03-2009 | Отправлено: 11:45 30-07-2009
dma200899

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
В диалоге "исправить DPI":
 
часть сканов 200, часть 300, часть 400 dpi.
добрые люди обрезали кажется в СК, в результате у каждой страницы свой размер в пикселях.
Хочется выделить в диалоге группу групп страниц и задать размер.
А вот фиг. Выделение только по узлам.
А их столько - сколько страниц.
 
Хоцца группового выделения в диалоге. Т.е. с shift или alt.
 
Щас же придется все дащит в ACDSEE, сортировать по размерам. делить на три папки по группам размеров и в СК принудительно задавать значения дпи.
 
прошу:
включить кнопки alt, shift в диалоге   "исправить DPI" для выделения одновременно нескольких групп страниц.
 
 
Добавлено:
Баг. Как со случаем удаления широкой страницы.
 
Включил автомат макет.
Одна страница была повернута но 90.
Увидел это на ленте после обработки этой страницы.
Остановил автомат, первернул страницу (исправил ориентацию), продолжил автомат.
 
Эта страница в итоге видится как самая широкая и у нее сохраняется размер (полей), который был до правильного разворота. В итоге у всех страниц гигантские поля.
 
 
 
Добавлено:
PPS
 
нельзя ли кнопку сверху ленты запрграммировать следующим образом.
Чтобы когда авто-обработка закончилась нажатие на нее перемещало ленту на ту страницу, которая сейчас в главной зоне.
А то имеем.
Страница в гланой зоне никак не поименована.
Я пошел на самую широкую, а лента осталась стоять.
Я хочу увидеть самую широкую в ленте (сравнить с соседями) а прийти на нее не могу.
 
 

Всего записей: 126 | Зарегистр. 29-06-2008 | Отправлено: 21:17 30-07-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
dabudada

Цитата:
Вылазит диалоговое окно, в котором предлагается отослать отчет (при на нажатии на него выскакивает стандартное окно с предложением выбора программы открытия неизвестного файла/расширения, я не имею понятия какая софтина его распознает), нажимаю отослать, но через пару минут внизу пишется, что отсылка отчета не удалась (не цитирую, пишу по памяти).  

У вас выход в инет случайно не через прокси?  В принципе могу сделать drag and drop ссылки на файл в файл менеджер, но хотелось бы разобраться, почему отчеты не отсылаются.  В принципе если сильно захотеть, можно до этого файла добраться и без drag and drop'а.  Правый клик на ссылку -> копировать, вставить в Firefox или IE, и там вам по идее должны предложить сохранить этот файл.
 
dma200899

Цитата:
часть сканов 200, часть 300, часть 400 dpi.  
 добрые люди обрезали кажется в СК, в результате у каждой страницы свой размер в пикселях.  
 Хочется выделить в диалоге группу групп страниц и задать размер.  
 А вот фиг. Выделение только по узлам.  
 А их столько - сколько страниц.  
   
 Хоцца группового выделения в диалоге. Т.е. с shift или alt.  
   

Это пожалуй можно.  Сделаю когда дойдут руки, если не забуду конечно.
 

Цитата:
Включил автомат макет.  
 Одна страница была повернута но 90.  
 Увидел это на ленте после обработки этой страницы.  
 Остановил автомат, первернул страницу (исправил ориентацию), продолжил автомат.  
   
 Эта страница в итоге видится как самая широкая и у нее сохраняется размер (полей), который был до правильного разворота. В итоге у всех страниц гигантские поля.  

Воспроизвел.  Буду разбираться.
 

Цитата:
нельзя ли кнопку сверху ленты запрграммировать следующим образом.  
 Чтобы когда авто-обработка закончилась нажатие на нее перемещало ленту на ту страницу, которая сейчас в главной зоне.  

Хм, вроде эта кнопка так и работает - при нажатии прокручивает ленту к текущей выбранной странице.  Текущая выбранная - это как раз та, что в главном окне.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 00:11 31-07-2009
dma200899

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Хм, вроде эта кнопка так и работает

вот сейчас (прогнал обработку на стадии вывод) - да.
а сразу после того как сделал авто макет - не наблюдалось.
 
На этом проекте уже не буду, а буду еще какую книгу делать посмотрю на ее поведение.
Фишка в том и была, что я на кнопку жал, а лента стояла.
Я как раз кажется тогда на "самую широкую" (что крутил на 90) перешел после конца работы автомата.
Но потом для проверки и еще пару страниц жал.
 
Добавлено:
учитывается ли на стадии выводв в режиме "смешанный" исходный скан ?
 
Обнаружил следующее.
Если рамка полезной зоны стоит ровно на границе картинки часть ее может обелиться. Если же рамка от картинки чуть отстоит - больше вероятность, что сегментация пройдет по краю картинки.

Всего записей: 126 | Зарегистр. 29-06-2008 | Отправлено: 02:24 31-07-2009 | Исправлено: dma200899, 02:45 31-07-2009
dabudada

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
У вас выход в инет случайно не через прокси

Прокся-прокся ;( Для таких как я и было бы полезно сохранять отчет на рабочем столе к примеру.

Всего записей: 21 | Зарегистр. 12-03-2009 | Отправлено: 10:54 31-07-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
dabudada
Думаю можно эту систему и через прокси заставить работать.  Может и drag and drop для дамп файла за одно сделаю, если это не слишком сложно окажется.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 01:07 01-08-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Было бы здорово, если стало возможно таскать "полезную область" целиком, без изменения размера ...

Всего записей: 6996 | Зарегистр. 31-08-2008 | Отправлено: 04:06 01-08-2009
dma200899

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ага, и задавать ее точного пиксельного размера

Всего записей: 126 | Зарегистр. 29-06-2008 | Отправлено: 05:13 01-08-2009
AlexShag

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Прошу прощения, если это уже описывалось.
 
При обработке теряются знаки умножения-точки в формулах. Возможно ли оставлять их?

Всего записей: 23 | Зарегистр. 24-02-2007 | Отправлено: 10:30 01-08-2009
dma200899

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
а галка "удалять пятна" включена или выключена ?

Всего записей: 126 | Зарегистр. 29-06-2008 | Отправлено: 11:46 01-08-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Добавил поддержку прокси в краш репортер.
Новая сборка: http://www.onlinedisk.ru/file/189648/
 
Добавлено:
Прокси с паролем думаю все равно работать не будут.
 
Добавлено:
ndch

Цитата:
Было бы здорово, если стало возможно таскать "полезную область" целиком, без изменения размера ...

Это есть в планах, но если я буду отвлекаться на мелочи, то никогда не доберусь до действительно серьезных проблем, а именно:
1. Невозможность вручную выделять картинки.
2. Слишком аггрессивное и нерегулируемое удаление пятен.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 15:23 01-08-2009
ndch

Gold Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
таскать "полезную область" - это не мелочь.
Это "последняя миля" для кадрирования журналов.
 
Потому как в файле проекте легко прописать нужный размер кадра на всех страницах, например:
<content-rect width="1920" x="0" y="0" height="2800" />
 
А вот возможности перемещения области (а особенно перемещения  курсорными клавишами ) нет.
Приходится наращивать края и кадрировать в фотошопе.

Всего записей: 6996 | Зарегистр. 31-08-2008 | Отправлено: 09:08 02-08-2009
dma200899

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Все книгосканировщики хором с самого начала разработки (см. форум натахауса, пост №5 после объявления атора о начале разработки, и далее многократно) говорят что это край как надо, а тулон (оранж) упирается. По типу как с окошком старта.
Хорошо хоть, что не говорит "докажите, что это так".
 
А ведь на самом деле кошмар, если люди ручками файл проекта правят, ибо у действительно нужных вещей "приоритет низкий".
 
Как я уже писал, причина - игнорирование того, что по большей части идет перекидывание сканов из проги в прогу. Я по пальцам могу перечислить книги, которые мной сделаны только в СТ. Даже из своих хороших сканов.
 
Помимо рамки ещё нужна нормальная стадия формирования проекта, где была бы возможность правки дпи, с индикацией дпи и пиксельных размеров для каждого изображения в проекте.  
Как я писал в июне 2008-го:

Цитата:
 
Очень порадовало окно "Fix DPI". Жалко, что оно видно только в начале и потом никак недоступно.   ...
А может можно новую стадию добавить Insert files как первый шаг процесса. А в окне по центру пока картинок страниц нету и показывать таблицу с размерами, прописанными дпи и определять нужны ли какие ресайзинги-ресэмплинги ? Тогда, кстати, можно будет легко добавлять отдельные картинки-файлы в уже существующий проект.
 

 
 
А также возможность отключить исполнение любого этапа. (По сути, monday2000 хочет именно этого).  
Сейчас:
1) разрезка страниц - отключаема  
2) компенсация наклона - вроде пообещали возможность отключения. Я щас тупо 0 руками применяю к каждой, если что.  
3) полезная область - упс. Если только вручную растащить по краям...
править файл проекта - это хорошая идея.
4) макет - можно поставить поля 0  и применить ко всем
5) вывод (сглаживание в ч.б.) как писал тулон если делать в сером, то сглаживания нет -теперь я вывожу в сером (цветном) и тащу бинаризовать в СК.
 
 
Как-то в лом подбирать примеры, но у меня есть три типичных ситуации, когда сглаживание СТ вредно
а) наличие паразитного мусора, который сильно ужирняется (а выключить удаление пятен нельзя ибо пропадет и то что нужно). Причем вследствие этого ужирнения его уже становится тяжело удалить.
б) скан, в котором засечки на буквах (например, и, н, п ...) так близко сходятся, что после сглаживания сливаются:
__  __                           _____  
 |     |   превращается в  |   |  
 |     |                           |   |  
в) уже бинаризованный и сглаженный с ужирнением скан, для которого меняется визуальное восприятие. Нельзя сказать, что он становится нечитаемым, но впечатление таково, что качество ухудшается.

Всего записей: 126 | Зарегистр. 29-06-2008 | Отправлено: 10:16 02-08-2009 | Исправлено: dma200899, 18:59 02-08-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
ndch

Цитата:
таскать "полезную область" - это не мелочь.  
 Это "последняя миля" для кадрирования журналов.  

По сравнению с невозможностью ручного выделения картинок это таки мелочь.  Во первых - книги важнее журналов.  Во вторых - без фиксированной рамки обходиться все же можно - тягять эту рамку за края на каждой странице.  Тяжело но можно.  А вот когда в книге N-ное колличество картинок неправильно определилось - с этим обычный пользователь вообще не справится.  В результате многие вообще избегают СТ для книг с картинками.
 
dma200899

Цитата:
Как я уже писал, причина - игнорирование того, что по большей части идет перекидывание сканов из проги в прогу. Я по пальцам могу перечислить книги, которые мной сделаны только в СТ. Даже из своих хороших сканов.  

Это не игнорирование.  Просто при таком сценарии проблем на порядок больше, и соответственно решаться они будут еще очень долго.
 
Кстати мне интересно, что именно мешает сырой скан (допустим что он у вас есть) от начала и до конца сделать в СТ?  Про фиксированную рамку и выделение картинок я знаю.  Что-то еще?
 

Цитата:
Помимо рамки ещё нужна нормальная стадия формирования проекта, где была бы возможность правки дпи, с индикацией дпи и пиксельных размеров для каждого изображения в проекте.  

Нужна, согласен.  Но все же не приоритетна.  Подумайте сами: для полного счастья при обработке сырых сканов осталось всего пару моментов реализовать / улучшить.  А вот для работы с чужими сканами, которые могут быть:
1. С неправильными DPI (или не дай бог в добавок к этому разнобойными).
2. C полями искусственного происхождения.
3. С низким разрешением.
4. Сжатые в JPEG.
5. С черно-белым мусором.
6. Не разрезанные, но при этом без намека на линию сгиба.
 
Вот и скажите мне теперь, какое направление более приоритетно: доведение до ума обработки сырых сканов (пара месяцев работы), или попытки поддержки поломанных разными способами чужих сканов?  В последнем случае я даже не знаю, сколько времени на это уйдет, и результаты все равно будут не идеальными.  В конце концов если не будет проблем с сырыми сканами, возможно горе сканировщики пересядут на СТ, и наступит всеобщая благодать
 

Цитата:
а) наличие паразитного мусора, который сильно ужирняется (а выключить удаление пятен нельзя ибо пропадет и то что нужно).

Ну удаление пятен в конце концов будет доведено до ума, и задача эта приоритетная.
 

Цитата:
б) скан, в котором засечки на буквах (например, и, н, п ...) так близко сходятся, что после сглаживания сливаются:  

А на входе небось 150 DPI JPEG?  Тогда это вполне ожидаемо.  Кроме того, для выравнивания освешения очень вредны поля искусственного происхождения.
 

Цитата:
в) уже бинаризованный и сглаженный с ужирнением скан, для которого меняется визуальное восприятие. Нельзя сказать, что он становится нечитаемым, но впечатление таково, что качество ухудшается.

Ну вы эстет надо сказать.  В таком случае - вывод в сером режиме и бинаризация где-то еще - вполне себе решение.  Не для масс конечно, но массам это и не нужно.
 

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 11:36 02-08-2009
dma200899

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Кстати мне интересно, что именно мешает сырой скан (допустим что он у вас есть) от начала и до конца сделать в СТ?  Про фиксированную рамку и выделение картинок я знаю.  Что-то еще?  

 
Грязь, но тут вы обольщаетесь, ставя ее приоритетом. Есть такая грязь, что ни БР ни СК ее не берут. Увы, только ручками. Плюс сами буквы могут быть на некоторых страницах попорчены  и тогда ластиком в СК - грязь+реставрация отдельных букв.  
 
А вот интересно, что вы знаете про выделение картинок ?
 
Сейчас очень просто: я  прогоняю пакет в СТ в ч/б, в смешанном и в цветном режимах.
А потом собираю отдельно все правильные картинки и картинки, которые надо довести до ума в СК. Как я уже писал, мне в СК резать неудобно, а энхенсинг делать как раз удобно.
 
Я не думаю, что вы сразу сделаете нормально работу с зонами. Ибо, что я делаю в СК с неполучившимися в СТ страницами (в среднем их где-то 8% от книги):
 
1) Например в СК есть чистка по краям картинки. руками удаляются ошметки вокруг картинки, не трогая саму картинку.
 
2) В СТ у меня есть случаи, когда фоном заливается часть картинки - (хорошо бы иметь настройку порога сегментации, но часть картинок действительно сливается с фоном и это не автоматизировать).
 
3) Для части картинок (малоцвет), когда сегментация в СТ их не выделяет. Для обеления фона я в СК завышаю контраст и снижаю гамму (в уровнях).  
Т.е. вам нужен инструмент уровни в СТ.
 
4) Часть картинок, которые идут в цвете, а СТ в смешанном делает их черно-белым.
Тогда я делаю оутпут цветным и в СК.
 
5) У вас идет смешение опции цвет/серый. Часть серых картинок выглядят как цветные (желтизна, коричневизна), я их в СК конвертю в серый.
 
6) Часть картинок, где идет паразитный фон, я в СК делаю магическое выделение цвета.
В некоторых случаях я делаю это в Фотошопе - при минимальном пороге чувствительности. Волшебное выделение.
Это, как правило, где кривые контуры картинок, а сегметация СТ оставила куски фона.
 
7) Вот как то была книга напечатана в малоцвете, но цвета загрязнились. Я в Фотошопе в иллюстрациях. просто заливал зоны правильным цветом.
 
8) Вот только что на странице прыгала освещенность, но даже БР не помог. Я в СК просто на всей странице навыделял зон и каждой задавал свой порог бинаризации.
 
9) не говоря уже о том, что выделение картинок в СК заточено под джвучивание в FSD - т.е. создается пара картинок с принудительной сегментацией на фон и маску.
См. пример на сайте monday2000
http://www.djvu-soft.narod.ru/scan/djvu_sep.htm
Если картинки имеют мелкие контрастные элементы, то это очень выгодно иначе они уйдут в маску и будут выглядеть плохо.
 
 
Ну допустим вы сделаете пункты  
1 (заливку-ластик, игнорирующие зоны);
4 (запрет на бинаризацию в зоне),
5 (принудительная конвертация в серый)
9 (вы даже кому-то рассказывали где это в СТ внедрять)
 
 
Да вот это самое противное: когда серая или цветная картинка по результатам СТ обработки в смешанном режиме оказывается черно-белой. У меня как-то так было. У части страниц  я удалил фон и вставлял в фотошопе отдельные картинки (там где фон вокруг картинки удалялся а по всей странице нет, или выделял картинку кривой.  
У части - где фон нормально удалялся по всей странице - подменил входные картинки в проекте СТ.
 
 
Но вы приоритетами считаете грязь, что не решит проблему.
 
Выделение картинок, если вы не хотите оутпутить пары субсканов, то это тоже не приоритет, т.к. для нормального кодирования по "методу разделенных сканов" - с использованием программы FSD все равно нужно будет в СК картинки еще раз выделять.
 
Кстати, bolega много писал про перекрывающиеся зоны, про зоны непрямоугольной конфигурации...
 
Да вот щас как раз книжку кодил с такими руками заданными кривыми контурами зонами. Там кривоконтурные цветные картинки были встроены в ч.б. текст. И по другому никак. СТ же сегментацию не делал.

Всего записей: 126 | Зарегистр. 29-06-2008 | Отправлено: 13:03 02-08-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Зоны я уже начал делать.  Они будут из себя представлять многоугольники произвольной формы.  У зон будут свойства.  Самое нужное свойство - "запрет бинаризации" - реализую в первую очередь.  Потом постепенно будут добавляться другие свойства.  Проблемы с выделением картинок это решит.  Например, когда вы говорите "цветную картинку делает черно-белой" - на самом деле СТ просто не распознал эту картинку совсем.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 13:28 02-08-2009
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru