Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor

Модерирует : gyra, Maz

Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

   

Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Scan Tailor

 
Скриншот:

В разработке находится новая альтернатива СканКромсатору. Разработчик - ваш покорный слуга.
Задача программы - пост-обработка сырых сканов с целью их последующей сборки в PDF или DJVU.
 
Уже есть на что посмотреть, и возможно присоединиться к проекту. Проект с открытыми исходниками и кросс-платформенный (Windows + Linux).
 
По сравнению со СканКромсатором планируется большее удобство использования, большая интерактивность, но при этом не меньшая автоматизация процесса.
 
Сайт проекта: http://scantailor.sf.net     Скриншоты
 
Топик программы на форуме Натахаус       Англоязычный топик по ScanTailor

Документация
 
Документация (Wiki)              Зоны картинок в ScanTailor
 
Статья: Scan Tailor. Программа для обработки отсканированных книг
 
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
 
Методика использования STA совместно с Djvu Imager

Дистрибутивы
 
Версия СТ с функцией выпрямления искривленных строк (dewarp от Rob)
 
Патч от anagnost96 Вариант ScanTailor с этим патчем (STA)  Зеркало
 
ScanTailor для Mac
 
Последние изменения в дереве исходников - для сильно любопытных и владеющих английским.
Там же можно подписаться на rss/atom - для нетерпеливых.
 

Дополнительно
 
ST GreyText v1.0 Программа для генерации вывода как бы "Только текст (в режиме серого)" - для Scan Tailor от anagnost96.
 
LayerTailor Программа для разделения сканов (после "Смешанный режим) на foreground и background слои с целью последующего раздельного кодирования в djvu. Принцип работы: Все черные пиксели (яркость==0) переносятся в foreground, остальное - в background. Функция layer принимает на входе 3 параметра: исходное имя файла TIFF, имя файла для foreground и имя файла background. Автор: U235.
 
Предложения к anagnost96 по поводу улучшения его модификации СТ
Сравнение выпрямления искривленных строк в СТ и в BR

Статья О возможности альтернативы СканКромсатору     Полезные ссылки по теме топика
ArtScan - ещё одна программа для сканобработки.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 21:37 15-06-2008 | Исправлено: ndch, 22:37 12-02-2010
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Мда, а у меня не упало.  Пришлось правда залезть в код и отключить фильтр Savitzky-Golay, а то при 1200 DPI я бы до утра ждал результатов.  Arceny, может у вас воспроизведется?
 
Еще такой вопрос: вылетает ли в режиме Цветной / Серый с белыми полями и нормализацией освещения?
 
И выложите-ка на всякий случай ваш проектный файл для одной этой страницы - может с ним воспроизведется.
 
У меня кстати появилась пара идей по ускорению работы на сканах высокого разрешения.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 03:32 04-02-2009
Admig314

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Еще такой вопрос: вылетает ли в режиме Цветной / Серый с белыми полями и нормализацией освещения?  

Нет, не вылетает. Ни в случае tif, ни в случае jpg. Благополучно создает выходные файлы.
Один раз забыл указать, что применить режим "Цветной / Серый" ко всем страницам - так примененная страница нормально обработалась, а на той, для которой остался режим B/W, опять случился все тот же сбой.
 
На всякий случай исходный скан (90 Мб):
Ссылка

Всего записей: 17 | Зарегистр. 19-12-2005 | Отправлено: 04:03 04-02-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon
Думаю, у нас будет 1-2 дня для тестирования сборки с despeckling? Постараюсь найти грязные сканы.
Admig314
Вы файлы tif сжимайте перед отправкой. Зачем же так трафик убивать.

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 06:21 04-02-2009 | Исправлено: denver 22, 06:23 04-02-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Думаю, у нас будет 1-2 дня для тестирования сборки с despeckling? Постараюсь найти грязные сканы.  

Будет.  Пока не исправлю падение, новую версию выпускать не буду.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 11:55 04-02-2009
Admig314

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Вы файлы tif сжимайте перед отправкой

Так они уже сжаты - LZW. Больше и не ужмешь, если без потерь. Несжатые и вовсе 140 Мб весят
 
Добавлено:
Попутно еще такой вопрос. Почитав топик и wiki не нашел ответа. Происходит ли при обработке исправление искажения строк текста. Не перекос, а именно искривление, как бывает в области корешка на развороте толстой книги. Подобное искажение исправляется при обработке в файнридере (и не помню еще в каких-то программах).

Всего записей: 17 | Зарегистр. 19-12-2005 | Отправлено: 12:38 04-02-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Происходит ли при обработке исправление искажения строк текста. Не перекос, а именно искривление, как бывает в области корешка на развороте толстой книги. Подобное искажение исправляется при обработке в файнридере (и не помню еще в каких-то программах).

Нет, такого не делается.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 14:33 04-02-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Admig314
Такое исправление вроде делает Book Restorer.
Tulon
Отчет по Rev.258:
- Кнопка "Автоматически переходить к выбранной страницу" может переименовать в  "Включить автоматическую прокрутку"? А то, если бы я на форуме не прочитал, не понял бы что это означает.
- в продолжение этой функции: Если во время Пакетной обработки выделить обработанный скан, обработка останавливается. Это известный факт? Если ДА, то я не вижу смысла "прокрутки ленты", если по сканам нельзя щелкнуть для просмотра результата. В ней есть смысл, если реализовать фоновую обработку, по примеру фонового распознавания в FineReader-е, когда можно увидеть результат уже в процессе обработки.
- Если возможно, предлагать по-умолчанию сохранять проект в папке с исходными сканами (сейчас: первично - это установочная папка программы; затем - папка предыдущего проекта).
- При ручной проходке на этапе Полезная область (проверял только здесь) лента предпросмотра остается на месте (на 1-м скане). При переходе на другой этап и возврате в "Полезную область", лента стала перемещаться.  
Сначала думал, что то баг. Как выяснилось, причиной могла быть выключенная кнопка автоскроллинга. Но зачем её функция при ручной обработке? Может оставить её действие только в режиме Пакетной обработки, а при ручной - постоянное действие автоскроллинга?
- Впервые компенсация наклона сработала "никак" (парвда это связано с кривым сканом - табличные границы не перпендикулярны друг другу) - см. примеры (Наклон\).
- Очередной пример картинки, не вошедшей в полезную область - Рисунок\aa_0197.tif.
- Рисунок\aa_0083.tif - после предварительного поворота на 90 град - в полезную область вошла незначительная часть рисунка (в нижней правой части страницы).
- Ситуация: после декодирования ч/б книги (решил попробовать не в битональном - вышло в 256 color) очень на многих страницах книги обрезались низ букв нижней строчки и вчерх букв верхних строк. (примеров не представил)
- В частности: Рисунок\aa_0222.tif - вся нижняя строка не вошла в область; aa_0241.tif - вся нижняя формула не вошла в область.
- На будущее: не мешало бы сделать в нижнем поле программы (или отдельное окно) счетчик времени предположительного завершения Пакетной обработки. Надо же знать сколько кофе пить...
 
- Despeckling:  
 - программе пока сложно работать с ч/б сканами для очистки.
   Очистка\ aa_0009.tif, 0009_aa_0009.tiff - удалил полезный контент в таблице - символы ",,". Но в остальном очисткой доволен.
   Очистка\ aa_0082.tif, 0082_aa_0082.tiff - удалена даже четкая штриховка на рисунке.
   Очистка\ aa_0001.tif, 0001_aa_0001.tiff - удалены точки в строках содержания (странно, они же такие большие...).
 - с появлением Despeckling функция "исключения" области из обработки ещё более актуальна (см. примеры).
Вот и сами материалы - http://narod.ru/disk/5464135000/Scan-Test-258.7z.html
 
Как результат, пришлось вернуться в SK, т.к. потери контента для меня неприемлемы. В новых сборках буду продолжать тестировать Despeckling, т.к. эта функция сейчас для меня самая сырая (да ещё и неуправляемая).
 
Сейчас хотел бы от вас услышать, реально ли улучшить ситуацию с исчезновением полезного контента при Despeckling? По идее, решение должно быть. SK справился с этими местами без дополнительных шаманств. При этом степень очистки от мусора как всегда на уровне. Жду мнение на этот счет.
ИМХО, в Despeckling сейчас важнее это поправить, а потом улучшать очистку мусора, которая и так уже очень хороша. Есть примеры, которые для меня практически образцовые (Очистка\Образцы хорошей очистки).

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 21:45 04-02-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
denver 22

Цитата:
- Кнопка "Автоматически переходить к выбранной страницу" может переименовать в  "Включить автоматическую прокрутку"? А то, если бы я на форуме не прочитал, не понял бы что это означает.  

Да, пожалуй так лучше.
 

Цитата:
- в продолжение этой функции: Если во время Пакетной обработки выделить обработанный скан, обработка останавливается. Это известный факт? Если ДА, то я не вижу смысла "прокрутки ленты", если по сканам нельзя щелкнуть для просмотра результата. В ней есть смысл, если реализовать фоновую обработку, по примеру фонового распознавания в FineReader-е, когда можно увидеть результат уже в процессе обработки.  

Факт этот известный, а смысл в автопрокрутке все равно есть.  Во первых, с автопрокруткой видно, какая часть проекта уже обработана.  Во вторых, можно следить за правильностью обработки прямо по ходу этой самой обработки.  Сейчас это правда неудобно, потому что когда вы нашли ошибку и поправили ее, повторный запуск пакетной обработки начнет ее сначала (впрочем уже обработанные сканы пойдут быстрее).  В TODO у меня есть пункт про возобновление пакетной обработки с текущей позиции.
Смысл отключать автоскроллинг тоже есть - например вы следите за лентой предпросмотра по ходу обработки, но что-то вса отвлекло.  Теперь можно отмотать ленту немного назад, и потом догнать ее.
 

Цитата:
- Если возможно, предлагать по-умолчанию сохранять проект в папке с исходными сканами (сейчас: первично - это установочная папка программы; затем - папка предыдущего проекта).  

Пожалуй можно, но когда сделаю - не обещаю.
 

Цитата:
1-м скане). При переходе на другой этап и возврате в "Полезную область", лента стала перемещаться.  
Сначала думал, что то баг. Как выяснилось, причиной могла быть выключенная кнопка автоскроллинга. Но зачем её функция при ручной обработке? Может оставить её действие только в режиме Пакетной обработки, а при ручной - постоянное действие автоскроллинга?  

В ручном режиме ее можно использовать как команду "перейти к текущей странице".  Скажем остановили мы пакетную обработку, промотали немного назад, ничего интересного не нашли, и вернулись на текущую страницу.
 

Цитата:
- Впервые компенсация наклона сработала "никак" (парвда это связано с кривым сканом - табличные границы не перпендикулярны друг другу) - см. примеры (Наклон\).  

Я бы сказал, что компенсация сработала правильно.  Дело в том, что компенсация стремится сделать строки текста горизонтальными.  На вертикальные границы текста она вообще не смотрит.  И строки текста действительно стали горизонтальными.  А у вас сканы с таким типом искажения, который простым вращением не исправить - либо строки будут негоризонтальными, либо вертикальные границы текста - не вертикальными.
 

Цитата:
- Очередной пример картинки, не вошедшей в полезную область - Рисунок\aa_0197.tif.  

Практически нет полей - это плохо.  Рисунок не вошел в область, потому что он ближе к краю страницы, чем к тексту.
 

Цитата:
- Рисунок\aa_0083.tif - после предварительного поворота на 90 град - в полезную область вошла незначительная часть рисунка (в нижней правой части страницы).  

У меня весь вошел, но причина опять та же - практически нет полей.
 

Цитата:
- В частности: Рисунок\aa_0222.tif - вся нижняя строка не вошла в область; aa_0241.tif - вся нижняя формула не вошла в область.  

И тут то же самое - нет полей.
 

Цитата:
- На будущее: не мешало бы сделать в нижнем поле программы (или отдельное окно) счетчик времени предположительного завершения Пакетной обработки. Надо же знать сколько кофе пить...  

Не знаю когда руки дойдут до таких мелочей.
 

Цитата:
 Очистка\ aa_0009.tif, 0009_aa_0009.tiff - удалил полезный контент в таблице - символы ",,". Но в остальном очисткой доволен.
   Очистка\ aa_0082.tif, 0082_aa_0082.tiff - удалена даже четкая штриховка на рисунке.
   Очистка\ aa_0001.tif, 0001_aa_0001.tiff - удалены точки в строках содержания (странно, они же такие большие...).
 - с появлением Despeckling функция "исключения" области из обработки ещё более актуальна (см. примеры).  

Despeckling буду улучшать.  Одно слабое место я уже вижу.  Сейчас алгоритм работает примерно так:
1.  Разделить объекты на классы, основываясь на их размерах.
2.  Совсем большие объекты сразу оставляем, совсем маленькие - сразу удаляем.
3.  Среди остальных классов, удаляем те объекты, у которых поблизости нет объекта более высокого класса.
Так вот в последнем пункте надо добавить "или такого-же класса".  Как ни странно, но такое маленькое изменение существенно усложняет реализацию.
 

Цитата:
ИМХО, в Despeckling сейчас важнее это поправить, а потом улучшать очистку мусора, которая и так уже очень хороша.  

Deskpeckling поправлю, а с очисткой мусора я уже сделал все что смог.  По крайней мере новых идей пока нет.
 
Добавлено:
Admig314
А от вас я жду файла проекта для того скана, на котором программа вылетает.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 00:09 05-02-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Так вот в последнем пункте надо добавить "или такого-же класса".

Думаю вы правы.
И вообще, ИМХО большие кляксы/точки проще удалять в графическом редакторе после работы в ST. Главное, чтобы мелкие удалялись автоматически (их удалять вручную - сплошное самоубийство), и полезный контент сохранялся.
В тех "удачных" примерах, что были высланы мной как раз оставшиеся точки удалять можно вручную, без напрягов.

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 00:29 05-02-2009
Admig314

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Admig314
А от вас я жду файла проекта для того скана, на котором программа вылетает.

Простите, я что-то стормозил, не понял.
Вот:
Ссылка

Всего записей: 17 | Зарегистр. 19-12-2005 | Отправлено: 01:20 05-02-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Ура, воспроизвелось!  Значит завтра исправлю.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 03:03 05-02-2009
Admig314

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Кстати ради интереса попробовал в том же файле уменьшить разрешение до 600dpi.
Все остальные параметры проекта те же самые. Как вылетало, так и вылетает, только быстрее. И для tif, и для jpg

Всего записей: 17 | Зарегистр. 19-12-2005 | Отправлено: 03:24 05-02-2009
U235

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tulon

Цитата:
3.  Среди остальных классов, удаляем те объекты, у которых поблизости нет объекта более высокого класса.
Так вот в последнем пункте надо добавить "или такого-же класса".  Как ни странно, но такое маленькое изменение существенно усложняет реализацию.  

Это можно попробовать сделать так:
Выбираем слой с объектами одного класса. Ужирняем на нем элементы (dilate) на половину заданного растояния R (близкие друг к другу объекты слипнутся в кластеры, далекие -нет). Удаляем элементы, размером меньшие размера класса+R . Делаем логическое И (маскируем) получившегося и исходного изображения данного класса.  

Всего записей: 881 | Зарегистр. 14-12-2005 | Отправлено: 07:51 05-02-2009
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
denver 22

Цитата:
Даже Понедельник в упор не увидел в топике ссылку на неё.  

Будьте любезны, называйте меня только по никнейму - не надо переводить его на русский язык или коверкать каким-либо иным образом.
 
P.S. Любопытно, что модераторы топика на это никак не отреагировали. А вот на Натахаус-форуме на ту же самую проблему отреагировали - и нужным образом.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 09:37 05-02-2009
usrnd

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Обнаружил глюки в программе (серьёзные)
 
Сканировал книгу.
Под windows xp sp3 + updates
400 dpi Gray 8 bit tiff + lzw
(epson perfection v10 + vuescan 4.4.63 pro, vuescan 4.5.01 pro)
потоково (за 1 час - 130 разворотов)
 
Скачал-установил
scantailor20090129
scantailor-0.9.1 Rev.258 denver-22
 
Но на одном скане заметил глюк:
После разрезания, поворота, на стадии "полезная область" правую часть скана в окне prewiev нет части скана,но кадрируется верно.
 
Дома баг не воспроизводится (возможно из-за того что урезал скан), завтра проверю.
 
Добавлено:
Еще более серьёзная проблема.
В процессе выяснения причины вышеописанного бага уменьшал вес скана.
 
В результате
scantailor20090129  
scantailor-0.9.1 Rev.258 denver-22  
 
вылетают!!!
 
Баг воспроизводится!!!
 
Добавлено:
http://rapidshare.com/files/194254062/2.rar.html
http://rs304.rapidshare.com/files/194254062/2.rar
 
http://rapidshare.com/files/194256240/diff2.rar.html
http://rs378.rapidshare.com/files/194256240/diff2.rar
 
Вопрос:
"полезная область" не называется кадрированием по какой-то особой причине или "так сложилось" ?
 
 
Добавлено:
Очень многое в программе понравилось.
Иногда хотелось визуального отображения причины выделения скана.
Это возможно увидеть в следующих версиях ?
 
Предвидится ли в дальнейшем развитии программы исправление геометрических искажений ?

Всего записей: 8 | Зарегистр. 09-01-2008 | Отправлено: 17:30 05-02-2009 | Исправлено: usrnd, 17:41 05-02-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Потребовалось вручную наклонить резак для разделеия страниц - замучился выставлять. Сверху настрою - снизу сбивается и наоборот. Стал подозревать, что он вращается по центру. Это неудобно. При тонкой настройке выставить его правильно по всей высоте разворота почти нереально. Возможно ли настроить его регулировку так, чтобы при перемещении верхнего "круга" центром вращения становился нижний, и наоборот?
 
http://narod.ru/disk/5485942000/Scan-Test-258_2.7z.html
Вот хороший пример того, как очисткой удаляется часть грунта на рисунках, часто встречающихся в строительной литературе. Тут есть и маленькие точки, и большие. Вот уж задача для составления алгоритма! Тот же SK с ними тоже не справляется. Я их сразу включаю в "Exclude region" для исключения из обработки.

Цитата:
Предвидится ли в дальнейшем развитии программы исправление геометрических искажений ?

+1. Тот же вопрос возник утром. Я понимаю, что если и будет, то после какого-нибудь 1.0 релиза

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 19:34 05-02-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
U235

Цитата:
Это можно попробовать сделать так:
Выбираем слой с объектами одного класса. Ужирняем на нем элементы (dilate) на половину заданного растояния R (близкие друг к другу объекты слипнутся в кластеры, далекие -нет). Удаляем элементы, размером меньшие размера класса+R . Делаем логическое И (маскируем) получившегося и исходного изображения данного класса.  

Это может более или менее сносно работать, но тут есть пара проблем:
1. Объекты классифицируются по количеству пикселей, а не по ширине / высоте объекта.
2. У меня реализован только прямоугольный dilate, что нежелательно в данном случае.
 
В общем на тот момент когда я прочел ваш пост, я уже реализовал это на базе Voronoi Diagram, благо соответствующий класс у меня уже был.  Работает достаточно бысто, правда памяти много жрет - аж 12 байт на пиксель.
 
Добавлено:
usrnd

Цитата:
Но на одном скане заметил глюк:
После разрезания, поворота, на стадии "полезная область" правую часть скана в окне prewiev нет части скана,но кадрируется верно.  

Скорее всего проблема была на стадии разрезки.
 

Цитата:
Еще более серьёзная проблема.
В процессе выяснения причины вышеописанного бага уменьшал вес скана.  

Что значит вес?  Размер в байтах?  И что тут такого?
 

Цитата:
вылетают!!!  
Баг воспроизводится!!!
 

В SVN пофиксил два вылета:
1.  С полями, близкими к нулю.
2.  Цветные сканы в режиме Смешанный.  Этот баг я несколько дней назад внес, и только сейчас заметил.
 

Цитата:
"полезная область" не называется кадрированием по какой-то особой причине или "так сложилось" ?  

Мне например непонятен термин кадрирование.  Я конечно не профессионал, но и среди пользователей таких будет много.
 

Цитата:
Иногда хотелось визуального отображения причины выделения скана.  

Нут я не понимаю.  Причина выделения чего именно и где именно?
 

Цитата:
Предвидится ли в дальнейшем развитии программы исправление геометрических искажений ?

Я почитал несколько исследований на эту тему.  В принципе сделать реально, но приоритет у этой задачи низкий - мало кому это надо, а реализовать будет непросто.
 
 
 
 
Добавлено:
denver 22

Цитата:
Потребовалось вручную наклонить резак для разделеия страниц - замучился выставлять. Сверху настрою - снизу сбивается и наоборот. Стал подозревать, что он вращается по центру. Это неудобно. При тонкой настройке выставить его правильно по всей высоте разворота почти нереально. Возможно ли настроить его регулировку так, чтобы при перемещении верхнего "круга" центром вращения становился нижний, и наоборот?  

Да нет, все работает как раз так, как вы хотите.  Чтобы убедить меня в обратном, придется вам видимо screencast (видео рабочего стола) сделать.
 
 
Добавлено:
denver 22

Цитата:
http://narod.ru/disk/5485942000/Scan-Test-258_2.7z.html
Вот хороший пример того, как очисткой удаляется часть грунта на рисунках, часто встречающихся в строительной литературе. Тут есть и маленькие точки, и большие. Вот уж задача для составления алгоритма! Тот же SK с ними тоже не справляется. Я их сразу включаю в "Exclude region" для исключения из обработки.  

На этих сканах у вас неправильный DPI.  Это сказывается на Despeckle.
В SVN уже новый метод Deskpeckle, но ещ епредстоит его настраивать.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 20:07 05-02-2009
usrnd

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
В SVN пофиксил два вылета:  
1. С полями, близкими к нулю.  
2. Цветные сканы в режиме Смешанный. Этот баг я несколько дней назад внес, и только сейчас заметил.

 
Поля далеки от 0, скан - grey 8bit.
Завтра кину домой и кину ссылку на форум.
Или не надо ?
Хочется как-то помочь, чтобы в результате программа не глючила.
 
Т.о. исходники можно скачать и самому компилировать ?
Не ругайтесь пожайлуста, но как под виндой скомпилировать ?
gcc, mingw, исходники, что еще ?  
Заодно и "полезная область" на "кадрирование" поменять можно было бы ;)
 
 

Цитата:

Цитата:
Иногда хотелось визуального отображения причины выделения скана.

Нут я не понимаю. Причина выделения чего именно и где именно?

Иногда "полезная область" выделяется так  что внутри "полезной области" очень много пустого (с моей точки зрения) места, а программа решает что там что-то полезное. Хочется видеть что она считает полезным, из-за чего выделилась область с большой энтропией (с моей точки зрения).
 
Короче - хочется видеть (причину) почему  пустое место попало в "полезную область", при отрезании краёв . Например пятно выделить розовым на общем сиреневом фоне.

Всего записей: 8 | Зарегистр. 09-01-2008 | Отправлено: 21:45 05-02-2009
denver 22

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
На этих сканах у вас неправильный DPI

2-й раз мне такое говорят. А как вообще это проверяется? И какие признаки (чтобы заподозрить неладное)?
Если вы о результирующем файле, где текст не на всю страницу, так это проект незаконченный и на размеры повлияли неправильно ориентированные сканы. А может и вы правы 8-)
Ну уж на моих примерах выше наверное не DPI сказался на качестве очистки. Этот эффект сплошь наблюдается и в SK Но там хоть гибко настроить исключение можно. Извините, но получается, что почти в каждом своем посте я намекаю на эту функцию. Кто знает, может вы реализуете что-то более эффективное.
 
Добавлено:
U235
Вы пожалуйста тоже делайте сборки (если не трудно). Я не уверен, что теперь делаю все правильно. А именно...
Я только-только освоился как правильно обновлять "до ревизии" (раньше каждый раз качал с нуля).
Теперь в CMake сразу нажимаю Configure, потом OK. Правильно? По идее все компилится. Только вот сейчас делаю новую сборку, и на п.9 после 9% сразу 22% стало. Вот и засомневался... уже и 30% - 35%. Так может быть?
 
Добавлено:

Цитата:
Мне например непонятен термин кадрирование.  Я конечно не профессионал, но и среди пользователей таких будет много.  

+1. Может и не особо красиво, но альтернативы тоже не вижу. Этап делает именно это.
 
Добавлено:

Цитата:
новый метод Deskpeckle

Вы на нас все методы будете испытывать? Или я неправильно понял?
Новая сборка (Rev.262) в шапке.

Всего записей: 602 | Зарегистр. 28-07-2005 | Отправлено: 22:06 05-02-2009
Tulon

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
usrnd
 

Цитата:
Поля далеки от 0, скан - grey 8bit.
Завтра кину домой и кину ссылку на форум.
Или не надо ?
Хочется как-то помочь, чтобы в результате программа не глючила.  

Надо конечно.
Посмотрел те два скана, что вы выложили.  На втором скане программа просто зависает - исправил в SVN.  Но сразу закралось сомнение - а правильно ли эти сканы загружаются?  Уж больно странный у них вид.
 

Цитата:
Не ругайтесь пожайлуста, но как под виндой скомпилировать ?

В исходниках есть инструкция по сборке - в packaging/windows/readme.ru.txt
Лучше брать исходники из SVN - там самая свежая версия.  В этой теме я уже пару раз давал инструкции по использованию SVN.
 

Цитата:
Иногда "полезная область" выделяется так  что внутри "полезной области" очень много пустого (с моей точки зрения) места, а программа решает что там что-то полезное. Хочется видеть что она считает полезным, из-за чего выделилась область с большой энтропией (с моей точки зрения).  

Если сильно интересно - включите режим отладки, после чего переключитесь в ручной режим и обратно в автоматический - это чтобы картинка вновь обработалась.  Появятся промежуточные результаты работы алгоритмов.

Всего записей: 718 | Зарегистр. 07-05-2008 | Отправлено: 23:39 05-02-2009
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor
Widok (17-02-2010 12:17): Лимит страниц. Продолжаем здесь.


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru