Как я могу исправить / восстановить поврежденный файл PDF?

Есть ли у кого-нибудь рекомендации или процедуры для восстановления поврежденного PDF-файла? Когда я открываю файл, я получаю сообщение «При открытии этого документа произошла ошибка. Файл поврежден и не может быть восстановлен». Кажется, существует множество инструментов, но ни один из них я не мог бы назвать заслуживающим доверия. Существуют ли для этого какие-либо решения на основе Linux с открытым исходным кодом?


Ghostscript автоматически восстановит ваш поврежденный PDF-файл … если он сможет открыть его в первую очередь (то есть, если он не поврежден и не подлежит ремонту). Но после этого вам все равно нужно будет дважды проверить результат …

В Linux попробуйте эту команду:

  gs  -o  repaired.pdf  -sDEVICE = pdfwrite  -dPDFSETTINGS =/prepress  correpted.pdf  

В Windows попробуйте следующее:

  gswin32c.exe ^ -o repaired.pdf ^ -sDEVICE = pdfwrite ^ -dPDFSETTINGS =/prepress ^ correpted.pdf  

45

У меня был поврежденный файл PDF, print.pdf , который Ghostscript не мог открыть, но обычные графические программы просмотра PDF для Linux (Okular, Evince) открываются нормально. (В моем случае файл имел мусор в начале вместо заголовка PDF при открытии в шестнадцатеричном редакторе.)

Эти программы просмотра PDF используют Poppler в качестве внутреннего средства визуализации PDF. Таким образом, вы можете восстановить PDF-файл с помощью инструментов командной строки Poppler. В Ubuntu они находятся в пакете poppler-utils . Я использовал:

  pdftocairo -pdf print.pdf print_repaired.pdf  

, который сгенерировал файл PDF с правильными заголовками, инструменты вроде Ghostscript теперь принят.

Улучшите этот ответ
ответил 18 июня ’13 в 2:01
  • 4
    +1 это прочитал мой PDF-файл, сгенерированный Quartz, без жалоб и сразу начал генерировать вывод. Ghostscript, Adobe Acrobat Pro и другие настаивали на том, чтобы сначала перестроить мой PDF-файл объемом 120 ГБ. — Орвеллофил, 14 дек. ’13 в 14:17
  • Это не сработало, по крайней мере, для одного странного PDF-файла, с которым я столкнулся, но похоже на хорошее начало. — Брайан Петерсон, 11 ноября 2014 г., 20:00
  • 1
    Отлично работает с PDF-файлом, из которого Ghostscript хотел удалить некоторые произвольные элементы на страницах. — Андреа Лаццаротто, 22 ноя. 2014, в 16:14
  • Ghostscript не смог прочитать документ, но это сработало как шарм. Кстати, я сделал это в Windows, используя новую подсистему linux, так здорово! — HyLian 05 июн 2016, в 17:44
добавить комментарий |

У меня был поврежденный PDF-файл print.pdf , который Ghostscript не мог открыть, но обычные графические программы просмотра PDF для Linux (Okular, Evince) открываются нормально. (В моем случае файл имел мусор в начале вместо заголовка PDF при открытии в шестнадцатеричном редакторе.)

Эти программы просмотра PDF используют Poppler в качестве внутреннего средства визуализации PDF. Таким образом, вы можете восстановить PDF-файл с помощью инструментов командной строки Poppler. В Ubuntu они находятся в пакете poppler-utils . Я использовал:

  pdftocairo -pdf print.pdf print_repaired.pdf  

, который сгенерировал файл PDF с правильными заголовками, инструменты вроде Ghostscript теперь принят.


30

mutool (страница проекта, страница руководства) восстановит поврежденные файлы PDF без их печати .

  • Установка, например в Ubuntu: sudo apt-get install mupdf-tools
  • Запустите его так: mutool clean input.pdf output.pdf
  mutool clean [параметры] input.pdf [output.pdf] [страницы] Команда clean красиво печатает и переписывает синтаксис  файл PDF.  Его можно использовать для восстановления поврежденных файлов, расширения сжатых потоков, фильтрации диапазона страниц и т. Д. Если выходной файл не указан, очищенный PDF-файл будет записан в out.pdf в текущем каталоге.   

В качестве альтернативы, есть несколько инструментов и фреймворков, которые могут разлагать/декомпилировать PDF-файлы на их компоненты без их рендеринга. Они могут быть полезны для извлечения текста, сценариев и изображений. Список таких инструментов см. В этом ответе: https://reverseengineering.stackexchange.com/q/1526/8210. Например. вы можете попробовать текущий популярный ответ Origami, у него есть программа просмотра на основе GTK.

Улучшите этот ответ
отредактировано 13 апреля ’17 в 12:49
Сообщество ♦
1
ответ дан 4 июня 2015 в 17:45
  • 4
    Это решение работает «лучше», чем решения предлагается выше или лучше ранжируется, так как он не «печатает» PDF-файл и сохраняет активные ссылки, интерактивные элементы и т. д. Для меня это звучит более элегантно, чем использование ghostscript или cairo. — Speredenn 05 июня 2015, 15:21
  • 1
    К сожалению, mutool clean не исправляет все возможные ошибки. У меня есть файл с различными ошибками в потоках шрифтов и контента, и mutool сохранит эти ошибки. — Доминик Хоннеф, 09 июня 2016, 20:52
  • 1
    @DominikHonnef Вы всегда можете попробовать инструменты/фреймворки, которые разлагают PDF-файл и позволяют просматривать все части без их рендеринга. Это должно позволить вам напрямую получать текст, сценарии, изображения и т. Д. Список инструментов см. В этом ответе: reverseengineering.stackexchange.com/q/1526/8210 — jmiserez, 24 июня 2016 г., 10:29
  • 1
    Единственное, что у меня сработало! — jamadagni 22 авг., 17:07
  • 1
    Это сработало лучше, поскольку при этом не отображается PDF-файл, который он исследует. — riccs_0x 04 окт. ’17 в 0:28
| показать 2 дополнительных комментария

mutool (страница проекта, страница руководства ) восстановит поврежденные файлы PDF без их печати .

  • Установка, например в Ubuntu: sudo apt-get install mupdf-tools
  • Запустите его так: mutool clean input.pdf output.pdf
  mutool clean [параметры] input.pdf [output.pdf] [страницы] Команда clean красиво печатает и переписывает синтаксис  файл PDF.  Его можно использовать для восстановления поврежденных файлов, расширения сжатых потоков, фильтрации диапазона страниц и т. Д. Если выходной файл не указан, очищенный PDF-файл будет записан в out.pdf в текущем каталоге.   

В качестве альтернативы, есть несколько инструментов и фреймворков, которые могут разлагать/декомпилировать PDF-файлы на их компоненты без их рендеринга. Они могут быть полезны для извлечения текста, сценариев и изображений. Список таких инструментов см. В этом ответе: https://reverseengineering.stackexchange.com/q/1526/8210. Например. вы можете попробовать текущий самый популярный ответ Origami, у него есть программа просмотра на основе GTK.


11

У меня был поврежденный файл pdf, потому что файл php, использованный для его загрузки, повторял некоторые ошибки (в HTML) и символы NUL в конце.

Решение нужно было открыть PDF-файл с помощью Notepad ++ и удалить весь текст после строки

  %% EOF  

Улучшить этот ответ
ответил 29 января ’14 в 12:54
  • имел то же самое, Adobe Reader не открывался, но родной Mac, Chrome и Firefox PDF плагин отлично отображает PDF файл. Причиной также был лишний «NUL» в последней строке, добавленной во время загрузки.. — Тило, 8 апр. ’14 в 19:23
  • У меня был PDF-файл с двумя %% EOF . Я удалил все после первого %% EOF с помощью шестнадцатеричного редактора. Теперь все работает нормально. — adjan 17 июня ’17 в 08:21
добавить комментарий |

У меня был поврежденный файл pdf, потому что файл php, используемый для его загрузки, повторял некоторые ошибки (в HTML) и символы NUL в конце .

Решение заключалось в том, чтобы открыть PDF-файл с помощью Notepad ++ и удалить весь текст после строки

  %% EOF  


Почему я получаю сообщение об ошибке «Не удалось загрузить документ PDF» при попытке просмотреть расшифровку стенограммы ePDF?

# strong> Сообщение об ошибке «Не удалось загрузить PDF-документ» указывает на то, что используемый вами веб-браузер, Google Chrome, пытается открыть электронную расшифровку стенограммы в собственной собственной программе просмотра PDF. Поскольку расшифровка стенограммы является защищенным файлом PDF, его необходимо открывать с помощью Adobe Acrobat Reader. Даже если Adobe Acrobat Reader уже установлен на вашем компьютере, если другая программа (например, Chrome) попытается открыть файл, вы получите сообщение об ошибке. Чтобы убедиться, что файл транскрипции открывается, сначала откройте Adobe Acrobat Reader, затем перейдите к файлу, выберите «Открыть», найдите текст в папке «Загрузки» и откройте его.

Для Windows :

Если вы не выбрали другое расположение, файл с расшифровкой будет сохранен в папке по умолчанию: «C: UsersXXX (UserName) Downloads». Сначала нажмите кнопку запуска. Затем найдите Adobe Acrobat Reader в алфавитном списке программ и откройте его. Перейдите к файлу, затем откройте его, затем найдите расшифровку стенограммы в папке «Загрузки» (или в месте, которое вы выбрали для сохранения стенограммы) и откройте его.

Для Mac:

Ваш файл расшифровки должен быть сохранен в папке «Загрузки». Сначала перейдите в свои приложения и откройте Adobe Acrobat Reader. Перейдите к файлу в верхнем левом углу экрана. Выберите «Открыть», найдите стенограмму в папке «Загрузки» и откройте ее.

Оцените статью
logicle.ru
Добавить комментарий