Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)

Модерирует : gyra, Maz

Maz (10-01-2024 10:45): Scan Tailor (часть 3)  Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

   

Widok



Moderator-Следопыт
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Предыдущие части: Часть 1
Scan Tailor


Задача программы - пост-обработка сырых сканов книг для последующей сборки в PDF/DJVU,CBR/CBZ и т.д.
Программа обеспечивает большое удобство для использования, большую интерактивность и не меньшую автоматизацию процесса (по сравнению со СканКромсатором).
Кросс-платформенный (Windows,Mac OS, Linux) проект с открытыми исходниками.


Англоязычный топик по ScanTailor
 
Ветки:
Scan Tailor (ncraun) >>>  последняя версия
Scan Tailor Experimental (Tulon) >>>  последняя версия (обсуждение на DIY Book Scanner)
Scan Tailor Plus (Vadim "DikBSD" Kuznetsov) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Еnhanced (Petr "pejuko" Kovar) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Featured (monday2000) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Universal (trufanov-nok) >>>  последняя версия (обсуждение на publ.lib.ru)
Scan Tailor Advanced (4lex4) >>>  последняя версия (отличия от авторской версии)
Scan Tailor Advanced (актуальный форк) >>>  история версий
 
Документация:
Документация (Wiki) | Зоны картинок в ScanTailor | ScanTailor. Быстрое начало | Видеоуроки и скринкасты новых функций СТ от Tulona
Статья: Scan Tailor. Программа для обработки отсканированных книг
Видеоурок: Создание DjVu с помощью Scan Tailor (зеркало)
Использование Scan Tailor совместно с Djvu Imager (сборка djvu методом разделенных сканов)
Как собрать Scan Tailor из исходных кодов под Windows
Почему нельзя сделать сплошную нумерацию вывода


Автор проекта - Tulon. Почему его здесь не видно? .
DikBSD автор ветки ScanTailor Plus история повторяется.
Юзеры! Будьте скромнее!


Прочие дистрибутивы, форки, дополнения

Всего записей: 24190 | Зарегистр. 07-04-2002 | Отправлено: 12:17 17-02-2010 | Исправлено: Maz, 10:43 10-01-2024
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Не нужно.

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 16:09 10-11-2010
C0USIN



Silver Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
anagnost96
а куда кинуть файл jbig2.exe?

----------
Как же я люблю этот сайт! Столько интересных мыслей у людей, каждая обоснованная и аргументированная!

Всего записей: 2739 | Зарегистр. 18-07-2003 | Отправлено: 16:29 10-11-2010
Melirius



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
 
А что Вам вообще надо от консольного FineReader? Если чисто распознавание, так "их есть у меня" и уже давно...

Всего записей: 318 | Зарегистр. 01-04-2005 | Отправлено: 16:33 10-11-2010
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
C0USIN
 
В какую-нибудь директорию, входящую в переменную окружения PATH. К ней же, кстати, надо добавить и папку C:\Ruby186\bin, если этого не сделал инсталлятор.

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 16:38 10-11-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
C0USIN

Цитата:
А PDF это стандарт.

Но вообще-то, для оцифровки бумажных книг DjVu лучше, чем PDF. Я даже об этом недавно статью написал - "Сравнение форматов DjVu и PDF" http://www.djvu-soft.narod.ru/scan/djvu_vs_pdf.htm .
Melirius

Цитата:
А что Вам вообще надо от консольного FineReader?

Это дало бы возможность полностью автоматического внедрения OCR-слоя в DjVu. В том числе пакетно. Сейчас же требуются лишние телодвижения - нужно открывать Файнридер, делать там распознанный пакет, указывать его DjVuOCR'у. А с консольным FineReader было бы проще - открыл DjVu, нажал кнопку "Распознать", подождал - и всё.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 16:54 10-11-2010
C0USIN



Silver Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
anagnost96

Цитата:
В какую-нибудь директорию, входящую в переменную окружения PATH

Не помогает.
Цитата:
JBIG2 compression has been requested, but the encoder is not available.
 
Вот мои переменные:
PATH=C:\Ruby186\lib\ruby\1.8\i386-mingw32;C:\Ruby186\bin;C:\Program Files (x86)\ImageMagick-6.5.6-Q8;C:\Program Files\Common Files\Microsoft Shared\Windows Live;C:\Program Files (x86)\Common Files\Microsoft Shared\Windows Live;C:\Windows\system32;C:\Windows;C:\Windows\System32\Wbem;C:\Windows\System32\WindowsPowerShell\v1.0\;C:\Program Files (x86)\Common Files\Acronis\SnapAPI\;C:\Program Files (x86)\Windows Live\Shared;C:\Program Files (x86)\gcc\bin;C:\Program Files (x86)\gcc\mingw\bin
 
Почему-то gcc не видит ruby.h лежащий в папке C:\Ruby186\lib\ruby\1.8\i386-mingw32

----------
Как же я люблю этот сайт! Столько интересных мыслей у людей, каждая обоснованная и аргументированная!

Всего записей: 2739 | Зарегистр. 18-07-2003 | Отправлено: 16:57 10-11-2010 | Исправлено: C0USIN, 17:27 10-11-2010
Melirius



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
 
Тогда рекомендую вдумчиво перечитать Help к моему пакету, Вы откроете немало интересных вещей, в частности, как действительно из командной строки запускать FR на распознавание в несколько потоков (по числу ядер компа). Там даже приведён полный разбор bat-файла, который это делает, и приведён его полный текст. Ежли что не понятно, обращайтесь.

Всего записей: 318 | Зарегистр. 01-04-2005 | Отправлено: 20:35 10-11-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Melirius

Цитата:
как действительно из командной строки запускать FR на распознавание в несколько потоков (по числу ядер компа).

Вот это: http://www.djvu-soft.narod.ru/soft/fr_auto.htm ? Это слишком ненадёжно и не массово-воспроизводимо. Лучше уж суметь запустить под виндой линуксовую командно-строчную версию файнридера http://ocr4linux.com/. Там можно свободно скачать триальную версию. Только она немного приболевшая - её нужно подлечить , да под виндой суметь использовать.И всё.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 23:05 10-11-2010 | Исправлено: monday2000, 09:11 11-11-2010
VidelSamogO



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Итак, ждать обновлений пока не приходится судя по выражению лиц завсегдатаев форума. А последний удачный бета-релиз с ручным деворпингом, я перезалил, дабы не исчезал из поля зрения.
ссылки для закачки

----------
И тогда, с потухшей елки
тихо спрыгнул желтый ангел...

Всего записей: 765 | Зарегистр. 16-08-2008 | Отправлено: 08:36 11-11-2010 | Исправлено: VidelSamogO, 20:36 11-11-2010
Melirius



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
 
"Вольному - воля, спасённому - рай..." Как хотите - у меня и толпы знакомых уже 2 года без нареканий работает и под Win, и под Linux.

Всего записей: 318 | Зарегистр. 01-04-2005 | Отправлено: 12:34 11-11-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Melirius
Всё это, понимаете, без гарантии. Построено на хакерских приёмах. Нет, нужен железно работающий у всех и всегда вариант, без опасностей сбоев. Цитата из http://www.djvu-soft.narod.ru/soft/fr_auto.htm :

Цитата:
Удаляем исходник на всякий пожарный - FineBR как-то нервно относится к посторонним tiff-ам в своей папке, временами вылетает.

Да и через bat-файлы - это слишком неудобно. Сделайте, что ли, простую и удобную вспомогательную программу (выполняющую работу батников) - скажем, с 8 портабельным файнридером - и тогда уж можно будет о чём-то говорить.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 13:23 11-11-2010
Melirius



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
 
За что я Вас люблю - это за умение наводить тень на плетень в самых ясных ситуациях . А за завышенную оценку моих скромных способностей - спасибо, хакером меня ещё пока никто не обзывал .
 
Вы ж опять придерётесь, что 90Мб FR - это много для того, чтобы качать. Иначе могу сделать.

Всего записей: 318 | Зарегистр. 01-04-2005 | Отправлено: 14:21 11-11-2010
monday2000

Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Melirius

Цитата:
Вы ж опять придерётесь, что 90Мб FR - это много для того, чтобы качать. Иначе могу сделать.

А зачем качать сам Файнридер? Сделайте такую программу, и пусть она будет уметь работать с любым 8 Файнридером. Т.е. избавьте юзеров от необходимости вникать в эти дебри - чтобы самому создавать батники, разбираться в них и т.п. Пусть некая программка выполняет работу батников. Она вряд ли будет слишком "тяжёлой".
 
Заодно такая программа может иметь некий тест пригодности Файнридера на выполнение такой операции.

Всего записей: 2841 | Зарегистр. 13-01-2005 | Отправлено: 17:23 11-11-2010
Melirius



Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
monday2000
 
"Так Вам шашечки или ехать?"
 
bat-файл + все необходимые компоненты для работы за вычетом FR
 
http://ifile.it/6zc8b7e/FR-auto.rar
 
Одно условие - распаковано оно должно быть на тот же диск, где лежит FR. Использование  
 
FR-auto.bat название_djvu-файла
 
Создаёт название_djvu-файла.OCR.djvu
 
P.S. Звиняйте, отладочная версия сначала ушла, теперь правильная.

Всего записей: 318 | Зарегистр. 01-04-2005 | Отправлено: 21:43 11-11-2010 | Исправлено: Melirius, 21:56 11-11-2010
VidelSamogO



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Выложите, пожалуйста ST Separator 1.0. Или лучше все предыдущие, для которых не нужен framework 3.


----------
И тогда, с потухшей елки
тихо спрыгнул желтый ангел...

Всего записей: 765 | Зарегистр. 16-08-2008 | Отправлено: 22:46 11-11-2010
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
C0USIN
 

Цитата:
Не помогает.
Цитата:
JBIG2 compression has been requested, but the encoder is not available.  

 
Это была бага в pdfbeads. Теперь исправлено.

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 07:09 12-11-2010
StanFreeWare

Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
VidelSamogO

Цитата:
 предыдущие, для которых не нужен framework 3.

 
А разве последние версии с sourceforge его требуют? Должен максимум второй фреймворк требовать..

Всего записей: 865 | Зарегистр. 10-01-2007 | Отправлено: 08:20 12-11-2010
C0USIN



Silver Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
anagnost96

Цитата:
Это была бага в pdfbeads. Теперь исправлено.

Спасибо. Теперь кодирует в JBIG2. На удивление компактные файлы получаются. В разы меньше чем при кодировании акробатом.  
Это общий словарь так влияет?
Проверить не смог - опция -p не работает.
 
Но самое неприятное - pdfbeads пропускает некоторые страницы. Не понимаю почему.

----------
Как же я люблю этот сайт! Столько интересных мыслей у людей, каждая обоснованная и аргументированная!

Всего записей: 2739 | Зарегистр. 18-07-2003 | Отправлено: 10:23 12-11-2010 | Исправлено: C0USIN, 10:24 12-11-2010
anagnost96

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
C0USIN

Цитата:
Но самое неприятное - pdfbeads пропускает некоторые страницы. Не понимаю почему.

 
А в именах файлов случайно нет точек? Если не в этом дело, то, может быть, выложите куда-нибудь минимальную подборку файлов, в которой пропускаются страницы?

Всего записей: 132 | Зарегистр. 01-05-2009 | Отправлено: 10:39 12-11-2010
C0USIN



Silver Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
anagnost96
От имен файлов не зависит. Вот десяток страниц http://rghost.ru/3228121
Игнорирует первую и девятую.
 
Разные книги попробовал. Везде попадаются страницы, которые он не замечает.
 
ЗЫ А почему мы тут оффтопим? Есть ведь тема профильная Электронные книги: сканирование, обработка, сборка - IV

----------
Как же я люблю этот сайт! Столько интересных мыслей у людей, каждая обоснованная и аргументированная!

Всего записей: 2739 | Зарегистр. 18-07-2003 | Отправлено: 11:08 12-11-2010 | Исправлено: C0USIN, 11:45 12-11-2010
   

Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200

Компьютерный форум Ru.Board » Компьютеры » Программы » Scan Tailor (часть 2)
Maz (10-01-2024 10:45): Scan Tailor (часть 3)


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru