papaVlad
Junior Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору medvedik Цитата: Пытаюсь вытащить страницу из pdf файла. Везде одна страница получается такого же размера, как исходный файл. Что, как, почему? | Метаданные держатся на всех страницах, удалите их и проблема исчезнет. Вы упомянули Акробат, можно в нём пересохранить как оптимизированный файл, снимите во всех вкладках все галки, оставьте только на удалении метаданных, после этого можно разбирать на страницы. Акробат бережно сохраняет ненужные метаданные пока пользователь сам не попросит их удалить, можно хоть всё стереть со страниц, будет пусто, но файл будет весить несколько МБ. Кстати, это Ваш пустой файл https://disk.yandex.ru/i/bhi9C73EjSYIRA PDF-XChange - это редактор нового поколения, это на сегодня вообще единственный нормальный редактор, в который по умолчанию заложено удаление метаданных при сохранении после любого редактирования. В очередной раз поблагодарю ComboFZ за наводку на него. Для моих нужд связка PDF-XChange и Акробат решают порядка 90% задач, из них XChange перетянул на себя почти всё, при этом поднимите вверх глаза, в шапку топика по редактированию PDF, его там нет, зато хлам, да с приписками "(da best!)" будет хранится вечно. Скажу больше, там упомянут Infix, который в пакетной обработке незаметно портит файлы, реально портит файлы, меняет шрифт и ранее видимый текст улетает за пределы абзаца и страницы, но Вы об этом никогда не узнаете, пока случайно носом не уткнётесь в конкретное место. А посмотрите как работают предложенные программы по удалению логотипов, затестил все, была слегка заметная полупрозрачная логотипка, а получи-ка белый прямоугольник поверх текста и иллюстраций, это "da best!". Тут же в топике пишут, что "A-PDF Text Replace" не работает с русскими шрифтами, но он в шапке, это топ программ по редактированию, их будут бережно хранить, как Акробат метаданные. На фоне этих событий удалось узнать, почему нельзя публиковать удивительно-полезные программы, например за публикацию на рутрекере PDFdu грозит бан, и лишь из-за того, что эта прога светится на сайте какого-то дьякова, хотя также она имеется на куче других, я набрал десяток сайтов с публикацией, но мягко порекомендовали промолчать. Может и на руборде такие же правила, и потому PDF-XChange не достоин шапки, что засветился у конкурента на сайте. Господа, имеющие доступ к шапке, пожалуйста, удалите Infix, про остальное не важно, там пользователь сразу видит плохой результат. los Цитата: там вообще весь файл несуразный. | Обычный файл, похоже издательские поделки Вам редко встречаются) С первых слов от medvedik про газету решил, что он наткнулся на старые файлы от Российской газеты, они как-то выкладывали такие несуразные, где каждая следующая страница содержала в себе все предыдущие, но так как в пдф одинаковые объекты не суммируются, то по размеру выглядели нормально, но при листании/переходе на следующую страницу происходило быстрое мелькание предыдущих, забавное зрелище. Но тут не так сложно оказалось, опять непочищенные метаданные, попадались файлы по 400 МБ, с полезным объёмом около 2 МБ, вот простенький пример из одного старого сообщения https://disk.yandex.ru/d/XFXvSQdyW-iPAw Некоторые специалисты при создании пдф не понимают пользы от удаления метаданных, вот и получаем порой такие вопросы. |