Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197

Открыть новую тему     Написать ответ в эту тему

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Scan Tailor


Задача программы - пост-обработка сырых сканов книг для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса (по сравнению со СканКромсатором).
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
 
Ветки:
Scan Tailor (ncraun) >>>  последняя версия
Scan Tailor Experimental (Tulon) >>>  последняя версия (обсуждение на DIY Book Scanner)
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Universal (trufanov-nok) >>>  последняя версия (обсуждение на publ.lib.ru)
Scan Tailor Advanced (4lex4) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Advanced (актуальный форк) >>>  история версий
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода


Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Прочие дистрибутивы, форки, дополнения

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 12:17 17-02-2010 | Исправлено: VSHY, 13:44 19-07-2023
jourmager

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Для jpeg специальные тулзы есть:
  • jpeg-quantsmooth
  • libjpegqs
    Сначала их надобно применять, а уж после ST.

  • Применил
    Слева вверху - оригинал jpg 300 dpi HQ 8-bit DeviceGrey
    Справа вверху - оригинал после тулзов
    Слева внизу - оригинал после бинаризации в ScanTailor Advanced Otsu 0 (т.е. всё по умолчанию)
    Справа внизу - после тулзов после бинаризации
     
    Итого имеем:
    Оригинал - артефакты есть, но при чтении они незаметны, вполне читабельно, но большой размер - 800 кбайт на страницу.
    После чистки от артефактов тулзами - артефакты резко сократились по площади и количеству, но размер jpg вырос в 4 раза - с 790 килобайт до 3,1 мегабайт, обработка (почти) никак не повлияла на качество бинаризации. Я пока не вижу практического смысла в применении этих тулзов.
    После бинаризации размер tiff 600 dpi - 170 кбайт, если tiff сконвертировать в jb2 600dpi получим 112 килобайт.
    Пробовал Topaz (очень долго, чёткость повісилась, но криво), FineReader OCR text+image с подстановкой почти родных векторных шрифтов (файл вышел 9 (девять) килобайт), ещё что-то, завтра может сделаю в Adobe Clear Scan.  
    Рутина.
     
     

    Всего записей: 611 | Зарегистр. 04-11-2019 | Отправлено: 00:16 08-12-2023
    indifirent

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    jourmager
    Попробуйте g'mic. Там стопитсот шумодавов и примерно столько же шарперов.
    Из личного опыта, я такие артефакты давил Smooth Bilateral. Впрочем, вас ничего не удерживает от применения других.
    Простите что в этой теме.

    Всего записей: 159 | Зарегистр. 02-06-2018 | Отправлено: 00:27 08-12-2023
    VSHY

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    jourmager
    Цитата:
    P.P.P.S. Я вот думаю, писать [Feature Request] на гитхабы Advanced, Experimental, Deviant, или это только клавиши попусту тыцкать?
    Думаю, что если есть возможность, то писать надо! А там, глядишь, у кого-то и руки дойдут. А если в одном форке будет сделано, то перетянуть решение в другой будет легче.

    Всего записей: 1076 | Зарегистр. 19-05-2008 | Отправлено: 04:11 08-12-2023
    zvezdochiot



    Full Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    jourmager say:

    Цитата:
    оригинал jpg 300 dpi

    Ещё можно после jpegqs применить:
  • stbiscalenx - для поднятия dpi до 600. Основана на pixel-art-овском scale2x, но заменена концепция тождества на похожесть пикселей.
  • stbidespeckle - простенький despeckle.
  • knnimdenoiser - простенький, но щадящий шумодав для png.
     
    Ну и конечно же порог EdgeDiv с малыми окнами (10-50) и высокими коэффициентами (0.75-0.99) в ST для такого сырья просто необходим.

  • Всего записей: 474 | Зарегистр. 18-05-2023 | Отправлено: 07:16 08-12-2023 | Исправлено: zvezdochiot, 07:34 08-12-2023
    Archivist

    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    jourmager

    Цитата:
    Появился у меня pdf. Весом 555 МБ. Внутри 800 чёрно-белых страниц jpg 8-bit 300 dpi <...> Но jpg с кучей артефактов

    Что вы там давите, зачем? Для бинаризации ч/б страниц артефакты не имеют значения. Если цель остаться в четком grayscale 300dpi, достаточно пакетно применить уровни в Photoshop, или его аналогах.

    Всего записей: 314 | Зарегистр. 10-08-2018 | Отправлено: 11:40 08-12-2023
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197

    Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2023

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru

    Рейтинг.ru