Nano Hash - криптовалюты, майнинг, программирование

Используйте ghostscript для удаления страницы (без извлечения диапазона)

Я знаю, что ghostscript может использовать -dfirstpage -dlastpage только для создания файла из диапазона страниц, но мне нужно заставить его (или другую программу командной строки) удалить вторую страницу в любом PDF-файле, где диапазон страниц явно не указан. Я думал, что это будет намного проще, потому что большинство принтеров позволяют указать «1,3-конец», и я использовал PDFCreator, чтобы сделать это таким образом.

Единственный способ, которым я могу это сделать (очень, очень грязный), - это извлечь страницу 1, извлечь страницы 3 до конца, а затем объединить два PDF-файла. Но я также не знаю, как заставить GS определить количество страниц.

04.04.2014

Ответы:


1

Используйте правильный инструмент для работы!

По причинам, изложенным KenS, Ghostscript — не лучший инструмент для достижения ваших целей. Лучшим инструментом для этой задачи является pdftk. Чтобы удалить 2-ю страницу из input.pdf, вы должны запустить эту командную строку:

pdftk  input.pdf  cat 1 3-end  output output.pdf
18.04.2014

2

ОК, обо всем по порядку. Если вы используете устройство pdfwrite Ghostscript, вы НЕ извлекаете, удаляете или выполняете какие-либо другие «манипуляции» с исходным PDF-файлом. Я продолжаю повторять это, но я собираюсь сказать это снова.

Когда вы передаете входной файл через Ghostscript, он полностью интерпретируется в серию графических примитивов, которые передаются на устройство, обычно устройство отображает примитивы в растровое изображение. В случае устройств «высокого уровня», таких как pdfwrite, примитивы повторно собираются в совершенно новый файл, в случае pdfwrite в файл PDF.

Эта гибкость позволяет вводить данные на различных языках описания страниц (PostScript, PDF, PCL, PCL-XL, XPS), а затем выводить в нескольких различных форматах высокого уровня (PostScript, EPS, разновидности PDF, XPS, PCL, PCL). -XL).

Но новый файл не имеет никакого отношения к оригиналу, кроме внешнего вида.

Теперь, разобравшись с этим... Вы можете использовать PostScript-программу pdf_info.ps, поставляемую в каталоге "toolin" установки Ghostscript, для получения разнообразной информации о PDF-файлах. get — количество страниц в PDF. Вам также не нужно беспокоиться, запустите файл один раз с -dLastPage=1, затем запустите его снова с -dFirstPage=2 (не устанавливайте LastPage), затем запустите оба полученных файла, чтобы создать файл со страницами из каждого комбинированный.

05.04.2014
Новые материалы

Кластеризация: более глубокий взгляд
Кластеризация — это метод обучения без учителя, в котором мы пытаемся найти группы в наборе данных на основе некоторых известных или неизвестных свойств, которые могут существовать. Независимо от..

Как написать эффективное резюме
Предложения по дизайну и макету, чтобы представить себя профессионально Вам не позвонили на собеседование после того, как вы несколько раз подали заявку на работу своей мечты? У вас может..

Частный метод Python: улучшение инкапсуляции и безопасности
Введение Python — универсальный и мощный язык программирования, известный своей простотой и удобством использования. Одной из ключевых особенностей, отличающих Python от других языков, является..

Как я автоматизирую тестирование с помощью Jest
Шутка для победы, когда дело касается автоматизации тестирования Одной очень важной частью разработки программного обеспечения является автоматизация тестирования, поскольку она создает..

Работа с векторными символическими архитектурами, часть 4 (искусственный интеллект)
Hyperseed: неконтролируемое обучение с векторными символическими архитектурами (arXiv) Автор: Евгений Осипов , Сачин Кахавала , Диланта Хапутантри , Тимал Кемпития , Дасвин Де Сильва ,..

Понимание расстояния Вассерштейна: мощная метрика в машинном обучении
В обширной области машинного обучения часто возникает необходимость сравнивать и измерять различия между распределениями вероятностей. Традиционные метрики расстояния, такие как евклидово..

Обеспечение масштабируемости LLM: облачный анализ с помощью AWS Fargate и Copilot
В динамичной области искусственного интеллекта все большее распространение получают модели больших языков (LLM). Они жизненно важны для различных приложений, таких как интеллектуальные..