2014/09/30 18:39:39

PDF (Portable Document Format)

В 2014 году в исследовании ABBYY отмечен рост числа документов в формате PDF. При этом 68% служащих компаний считают - поток бумажных документов возрос.


Portable Document Format (PDF) - формат файлов для отображения текстовой информации и медиаданных на большинстве вычислительных платформ.

Содержание

PDF (Portable Document Format) — межплатформенный формат электронных документов. Разработан компанией Adobe Systems с использованием языка PostScript[1].

Одним из способов создания PDF-документов является виртуальный принтер - документ, как таковой, готовится в своей специализированной программе — графическом приложении или текстовом редакторе, САПР и т.п., затем экспортируется в формат PDF для распространения в электронном виде, передачи в типографию и т.д.

Для просмотра файлов в формате PDF существует множество программ и официальная программа Adobe Reader. Значительное количество современного профессионального печатного оборудования имеет аппаратную поддержку формата PDF, это позволяет печатать документы без использования какого-либо программного обеспечения.


История

Файловый формат PDF создан компанией Adobe в 1992 году. В течение следующих 20 лет формат переносимых документов (PDF) стал открытым стандартом для обмена электронными документами, его признала международная организация по стандартизации (ISO).

В первое время своего существования он не был популярен:

  • ПО от Adobe для чтения и создания PDF было платным;
  • отсутствовала поддержка внешних ссылок;
  • PDF-документы были громоздкими по сравнению с обычным текстом;
  • вывод на экран PDF-документа на машинах с невысокой производительностью требовал от пользователей терпения.

Существовало несколько конкурирующих форматов: Envoy, Common Ground Digital Paper, Farallon Replica и даже PostScript являлся конкурентом.


Функциональные возможности

PDF-файл часто представляется как комбинация текста с растровой и векторной графикой, реже — текста с формами, сценариями на языке Javascript, 3D-графикой и другими типами элементов. Объём двух одинаково выглядящих на экране PDF-документов может отличаться. Это зависит от:

  • внедрения или связывания шрифтов и мультимедиа;
  • разрешения растровых изображений;
  • использования встроенного механизма сжатия всего документа;
  • используемых алгоритмов сжатия растровых изображений.

Для создания документа минимального объёма необходимо использовать векторную графику и «безопасные» шрифты, коих имеется 14, в их составе:

  • Times (v3) (обычный, курсив, полужирный и полужирный курсив)
  • Courier (обычный, наклонный, полужирный и полужирный наклонный)
  • Helvetica (v3) (обычный, наклонный, полужирный и полужирный наклонный)
  • Symbol
  • Zapf Dingbats

Эти шрифты можно использовать без внедрения в документ, поскольку все программы должны корректно отображать их на экранах. Любые другие шрифты, не внедренные в документ и отсутствующие в системе, будут заменяться одним из имеющихся, что может стать причиной увеличения или уменьшения числа страниц, количества символов в строке, межстрочного интервала и других ошибок отображения, связанных с метрикой шрифта.

Для редактирования файлов этого формата имеется некоторое количество программных продуктов.

Документы, формы, графика и веб-страницы, преобразованные в формат PDF не отличаются от напечатанных, но, в отличие от бумажных документов, файлы PDF могут содержать ссылки и элементы интерактивного интерфейса, активируемые с помощью "мыши", поля форм, встроенные видео- и аудиоданные, логические схемы, помогающие в автоматизации типовых бизнес-процессов. Содержимое файла в формате PDF может прочесть любой пользователь, используя бесплатное ПО Adobe Reader или приложения Adobe Reader для мобильных устройств.

Формат PDF позволяет внедрять необходимые шрифты, изменяющие текстовое оформление, векторные и растровые изображения, формы и мультимедиа-вставки. Поддерживаются цветовые профили RGB, CMYK, Grayscale, Lab, Duotone, Bitmap, несколько типов сжатия растровой информации. Имеются собственные технические форматы для полиграфии: PDF/X-1, PDF/X-3. Механизм защиты представлен возможностями электронной подписи. В формате PDF распространяется большое количество сопутствующей документации.


Стандарт документа PDF

1 июля 2008 года PDF стал открытым стандартом ISO 32000.


Преимущества

  • Доверие. Во всем мире формат PDF используется в качестве стандарта, обеспечивающего значительный уровень безопасности документооборота. Файлы этого формата:
    • можно защищать паролем,
    • можно помешать посторонним получить доступ к документам PDF,
    • помешать копировать их, изменять или печатать.
    • возможно удаление из документов PDF конфиденциальной информации.

  • Поддержка разных платформ. Взаимодействие с документами PDF возможно практически на любой платформе, включая Windows, ОС Mac и мобильные платформы - Android и iOS для iPhone и iPad.

  • Сохранение целостности файлов. Документы формата PDF выглядят так же, как исходные файлы, сохраняют всю содержащуюся в них информацию даже в случаях, когда текст, рисунки, видео, аудио, трехмерные карты, полноцветная графика, фото и бизнес-логика объединяются в одном файле или PDF-портфолио.

  • Простота подписи. Любой пользователь может поставить электронную подпись на документе PDF, используя бесплатное ПО Adobe Reader XI или Adobe Reader для мобильных устройств. Формат PDF предусматривает поддержку обычных цифровых изображений подписи, сертифицируемых подписей, заверяемых независимыми центрами сертификации.

  • Возможность поиска. В файле легко провести поиск по тексту или метаданным, включая сканированный текст, преобразованный с помощью технологии оптического распознавания символов (OCR).

  • Расширенный доступ. Файлы PDF более доступны для людей с ограниченными возможностями (слабое зрение или слепота).

  • Широкое распространение.


Спецификации Adobe PDF

  • 1993 — PDF 1.0 / Acrobat 1.0
  • 1994 — PDF 1.1 / Acrobat 2.0
  • 1996 — PDF 1.2 / Acrobat 3.0
  • 2000 — PDF 1.3 / Acrobat 4.0
  • 2001 — PDF 1.4 / Acrobat 5.0
  • 2003 — PDF 1.5 / Acrobat 6.0
  • 2005 — PDF 1.6 / Acrobat 7.0
  • 2006 — PDF 1.7 / Acrobat 8.0
  • 2006 — PDF 1.7 / Acrobat 8.2
  • 2008 — PDF 1.7, Adobe Extension Level 3 / Acrobat 9.0
  • 2009 — PDF 1.7, Adobe Extension Level 5 / Acrobat 9.1


Версии Adobe PDF

Год Версия Новые возможности Версия ПО
1993 PDF 1.0 Acrobat 1.0
1994 PDF 1.1 пароли ссылки потоки, независимая от устройства цветопередача Acrobat 2.0
1996 PDF 1.2 интерактивные элементы, обработка событий мыши, мультимедийные типы, уникод, улучшенное представление цвета и графики Acrobat 3.0
1999 PDF 1.3 цифровые подписи, цветовые пространства ICC и DeviceN, JavaScript Acrobat 4.0
2001 PDF 1.4 JBIG2, прозрачность, текстовый слой OCR Acrobat 5.0
2003 PDF 1.5 JPEG 2000, связанное мультимедиа, объектные потоки, перекрестные потоки, слои Acrobat 6.0
2005 PDF 1.6 внедренное мультимедиа, 3D, XML-формы, AES-шифрование Acrobat 7.0
2006 PDF 1.7 Acrobat 8.0
2008 PDF 1.7, AEL3 AES-шифрование 256-битным ключом Acrobat 9.0
2009 PDF 1.7, AEL5 XFA 3.0 Acrobat 9.1
2011 PDF 1.7, AEL8 Acrobat X (10)


Разновидность формата PDF для долгосрочного архивного хранения электронных документов - PDF/A

PDF/A (англ. Portable Document Format/A) — стандарт ISO 19005-1:2005 (опубликован 1 октября 2005 года) для долгосрочного архивного хранения электронных документов. Основа - описание стандарта PDF версии 1.4 от Adobe Systems Inc. (использовался в Adobe Acrobat 5).

PDF/A - подмножество формата PDF, из которого исключены особенности, не соответствующие требованиям к данным для долгосрочного архивного хранения. Реализован аналогично PDF/X.

Основные элементы соответствия требованиям PDF/A:

  • Запрещение встраивания аудио- и видео
  • Запрещено встраивание кода на Javascript и команд на запуск исполняемых файлов.
  • Все шрифты должны внедряться и они должны быть легально внедряемы для неограниченного универсального отображения. Это касается и так называемых стандартных шрифтов Postscript - Times или Helvetica.
  • Цветовые пространства определяются независимым от устройства способом.
  • Шифрование не разрешено.
  • Предписывается использование метаданных на основании стандартов.

2014: Использование PDF в России

30 сентября 2014 года компания Abbyy Россия (Аби) сообщила о завершении исследования рынка PDF-документов в России и сценариях работы с PDF-документами.

Как используют PDF в России

В опросе приняли участие 500 офисных сотрудников из Москвы, Санкт-Петербурга и ряда городов, работающие в различных отраслях индустрии государственного и частного секторов. Согласно этому документу, в 2014 году респонденты отмечали рост объемов документов в формате PDF. Ещё результаты исследования дали понять, что переход на электронный документооборот произошел далеко не везде: 68% офисных служащих считают, что поток бумажных документов возрос.

Наиболее частые сценарии работы с PDF-документами:

  • 62% опрошенных часто ищут информацию в тексте PDF;
  • 60% копируют текст из PDF;
  • 54% регулярно работают со страницами в документе:
    • меняют их порядок,
    • добавляют новые
    • удаляют существующие;

  • 52% вносят мелкие правки в текст PDF, исправляют ошибки или опечатки;
  • 46% объединяют файлы различных форматов в единый PDF.

Ссылки

Примечания

  1. Язык описания страниц. Используется, в основном, в настольных издательских системах