jourmager
Advanced Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Сорри за лонгрид. Archivist Цитата: Что вы там давите, зачем? | ? Я ничего не давлю. Артефакты в jpg я упомянул, чтобы объяснить ситуацию, но похоже её только запутал. Сейчас в меня шрифтовики будут кидать камнями. Шрифт (гарнитура) Школьная, которым набрана эта бумажная книга, имеет свои особенности в виде тяжёлых жирных массивных больших засечек. Подозреваю, что так было сделано в 60-х для технологического упрощения и удешевления многомиллионных тиражей учебников. Это более-менее нормально смотрится при размере шрифта 12 пунктов. Но при размере 10 пунктов начинается искажение пропорций - засечки надо оставлять массивными, а линейные размеры самого символа уменьшать. В результате имеем то, что видим. При размере 10 пунктов засечки слишком близко расположены друг от друга. Потом растеризация (сканирование) в 300 dpi и получаем ухудшение ситуации - засечки ещё ближе друг к другу. А потом кодирование в jpg и jpg-артефакты сцепляют засечки между собой ещё сильнее. Так что подавление jpeg-артефактов в данном конкретном случае бесполезно - из-за особенностей шрифта артефакты превратились в связки между засечками символов. А ещё ситуация усугубляют светлые пятна на штрихах символов, которые после манипуляций могут превратиться в белые дырки. Цитата: Для бинаризации ч/б страниц артефакты не имеют значения | Ну да. я это и показал на сравнительном скрине в предыдущем посте. Применительно к этой теме: получается так, что фильтры подавления jpeg-артефактов в ScanTailor не имеют смысла. Цитата: Если цель остаться в четком grayscale 300dpi | Цель была - уменьшить размер с 500 МБ до хотя бы 50 МБ при сохранении читабельности лично для меня. Я не собирался выставлять эту книгу на всеобщее обозрение. Я сегодня нашёл варианты этой книги на Л-гене в Adobe Clear Scan размером 29 МБ, и djvu 10 МБ, похоже, сделанный из Clear Scan (!?). Пост был написан для того, чтобы показать проблемы ScanTailor на конкретном примере (юзер кейсе). Потому что очень часто, когда пишешь о проблеме, люди или не понимают, или хотят конкретного примера. Цитата: достаточно пакетно применить уровни в Photoshop, или его аналогах | Применить можно, если знать как и для чего. Вот скриншот оригинала в Photoshop, вот скриншот после двиганья тремя ползунками без понимания куда смотреть и чем после этого двигать. Вот скриншот FineReader OCR Editor - Image Editor - Levels А пакетное применение это классно, но развивать эту тему сейчас не буду. Если я убираю перемычки между засечками, то начинают появляться (увеличиваться) серые проплешины на штрихах символов. Победить это (и многое другое) простыми фотошопными методами, рассчитанными на фотографии, а не на текст - наверное можно, но... ЕМНИП существуют алгоритмы, рассчитанные на закрашивание дырок в штрихах символов, и я даже догадываюсь в каких программах... Но я их никогда не применял на практике. Вот такой фильтр действительно был бы полезен в ScanTailor (если его там ещё нет). Применительно к данной теме: и в Photoshop и в FineReader движение ползунков происходит в реалтайме, естественно без скидывания масштаба. Отличие между ними в том, что применение изменения в FineReader происходит моментально, но с подёргиванием экрана, а в Photoshop выполняется после отпускания кнопки мыши на ползунке, но без подёргиваний. Данные особенности, вероятно, могут зависить от моей графической подсистемы и от конкретных настроек программ. В Photoshop ещё где-то пипетки есть, но с ходу не вспомнил. ИМХО что-то аналогичное хотелось бы видеть в Scan Teilor. И ещё один нюанс. Конечно, можно двинуть ползунки так, чтобы утончить буквы и убрать перемычки. В результате получить не оригинальный шрифт, а фиг знает что. | Всего записей: 730 | Зарегистр. 04-11-2019 | Отправлено: 14:29 08-12-2023 | Исправлено: jourmager, 14:32 08-12-2023 |
|