Содержание к диссертации
Введение
Глава 1. Аналитический обзор 10
1.1 Представление информации в СПОИ 10
1.1.1 Цифровое представление текстовой информации 10
1.1.2 Цифровое представление графической информации 11
1.1.2.1 Векторная графика 12
1.1.2.2 Растровая графика 14
1.1.3 Цифровое представление шрифтов 15
1.1.3.1 PostScript-шрифты 16
1.1.3.2 TrueType-шрифты 16
1.2 Языки описания полос 17
1.2.1 История развития языка PostScript 18
1.2.2 История развития PDF 20
1.3 Структура языка PostScript 25
1.3.1 Основные понятия .26
1.3.1.1 Интерпретатор 26
1.3.1.2 Структура программы 27
1.3.1.3 Сканер 28
1.3.1.4 Набор символов 28
1.3.1.5 Стек 29
1.3.1.6 Операторы 29
1.3.1.7 Типы данных 30
1.3.1.8 Процедуры 31
1.3.1.9 Формы 32
1.3.1.10 Комментарии 32
1.3.2 Представление графических элементов в языке PostScript 32
1.3.2.1 Векторная графика 32
1.3.2.2 Растровая графика 33
1.3.2.3 Шрифты , 33
1.3.3 Ограничения PostScript 35
1.4 Структура PDF 36
1.4.1 Объекты 37
1.4.2. Структура файла 38
1.4.3 Дерево страниц 40
1.4.4 Ограничения PDF 40
1.5 Технологический процесс на основе форматов вывода 41
1.5.1 Программное обеспечение 42
1.5.1.1 Программное обеспечение для генерации файлов вывода 42
1.5.1.2 Программы-конверторы форматов вывода 44
1.5.1.3 Интерпретаторы PostScript 47
1.6 Современные тенденции развития форматов вывода .49
1.6.1 Тенденции развития формата PDF 49
1.6.2 Тенденции развития формата PostScript 50
1.6.3 Тенденции развития альтернативных форматов 51
1.7 Анализ ранее проведенных исследований 53
1.8 Постановка задач 55
Глава 2. Практические исследования 57
2.1. Разработка методики эксперимента 57
2.1.1. Технологические схемы вывода графической информации 58
2.2. Подготовка тестовых объектов 60
2.2.1 Тесты на качеаво передачи технологическим процессом различных графических элементов 60
2.2.1.1. Тест на качество передачи растровой графики 60
2.2.1.2. Тесты на качество передачи векторной графики 62
2.2.1.3. Тесты на качество передачи шрифтов .64
2.2.2. Тесты на исследование эффективности системы вывода 65
2.2.2.1. Тесты растровой графики 65
2.2.2.2. Тесты векторной графики 66
2.3. Описание условий эксперимента 69
2.3.1. Рабочая станция верстки и генерации файлов вывода 69
2.3.2. Рабочая станция обработки файлов вывода 70
2.3.3. Растровый процессор 70
2.4. Исследование качества воспроизведения графических объектов 71
2.4.1. Исследование качества воспроизведения растровой графики 71
2.4.1.1. Исследование зависимости качества воспроизведения растровой графики от методов оптимизации программы QuarkXPress 72
2.4.1.2. Исследование зависимости качества воспроизведения растровой графики от формата вывода 75
2.4.2. Исследование качества воспроизведения векторной графики 80
2.4.2.1. Исследование зависимости качества воспроизведения векторных контуров от используемого формата вывода 80
2.4.2.2. Исследование зависимости качества воспроизведения векторных градиентов от используемой программы верстки 82
2.4.2.3. Исследование зависимости качества воспроизведения векторных градиентов от используемого формата вывода 83
2.4.3. Исследование качества воспроизведения шрифтов 86
2.4.3.1. Исследование качества воспроизведения PostScript-шрифтов 86
2.4.3.2. Исследование качества воспроизведения TrueType-шрифтов 88
2.4.3.2.1. Исследование зависимости качества воспроизведения TrueType-шрифтов от параметров генерации PostScript-файла .88
2.4.3.2.2. Исследование зависимости качества воспроизведения TrueType-шрифтов от формата вывода 91
2.5. Исследование эффективности системы вывода 93
2.5.1. Воспроизведение растровой графики 95
2.5.1.1. Генерация PostScript-файла 95
2.5.1.2. Генерация PDF-файла 97
2.5.1.3. Обработка PostScript и PDF файлов 99
2.5.1.4. Интерпретация PostScript и PDF файлов .101
2.5.2. Воспроизведение векторной графики 102
2.5.2.1. Генерация PostScript-файла 102
2.5.2.2. Генерация PDF-файла 103
2.5.2.3. Обработка PostScript и PDF файлов 105
2.5.2.4. Интерпретация PostScript и PDF файлов .106
2.5.3. Выводы 108
2.6. Общие выводы и рекомендации . 110
Обзор литературы 114
Приложение 119
- Цифровое представление графической информации
- Программное обеспечение для генерации файлов вывода
- Исследование зависимости качества воспроизведения растровой графики от методов оптимизации программы QuarkXPress
- Исследование зависимости качества воспроизведения TrueType-шрифтов от параметров генерации PostScript-файла
Введение к работе
Научно-технический прогресс 20 лет назад привел к революции в допечатной отрасли — появлению компьютерных издательских систем (КИС). В то время это был огромный шаг вперед не только в возможностях подготовки и оформления изданий, но и в сроках их изготовления.
С тех пор идет непрерывная борьба как за качество, так и за скорость. Борьба среди поставщиков оборудования, программного обеспечения, среди издательств, репроцентров и других полиграфических фирм. Конкурентная борьба ведет к постоянному повышению качества изданий и снижению сроков их изготовления.
В настоящее время в распоряжении полиграфической отрасли имеются мощнейшие программно-аппаратные комплексы по подготовке изданий. Однако борьба среди графических станций, программ, форматов продолжается.
Процесс вывода графической информации на физический носитель — финальный этап технологии подготовки изданий в КИС. Вместе с тем это этап, на котором ошибки и изъяны всех предшествующих процессов всплывают на поверхность. И хотя в настоящее время процесс вывода не является как 20 лет назад сложнейшим вычислительным процессом в КИС, во многих случаях он оказывается «узким местом» в технологии подготовки изданий.
Этап вывода, как любой другой в КИС, складывается из аппаратных и программных возможностей компьютерной издательской системы. Аппаратные возможности КИС определяются научно-техническим прогрессом и постоянно совершенствуются. Современные графические станции способны решить сложнейшие вычислительные задачи, возможные при допечатной подготовке изданий.
Программные возможности КИС определяются не только программным обеспечением процесса вывода, но и основным инструментом передачи графической информации на выводное устройство — форматом вывода.
Существующие сегодня форматы вывода выделились еше на заре развития компьютерных издательских систем. В настоя-
шее время с уверенностью можно сказать, что практически все позиции на этом секторе рынка занимают продукты фирмы Adobe. Форматы вывода этого производителя представлены двумя параллельно существующими решениями: языка описания полос PostScript и электронного формата документов PDF. Ближайшие конкуренты продуктов Adobe либо применяются исключительно в замкнутых программно-аппаратных системах, либо обладают гораздо более скромными возможностями воспроизведения графики и в профессиональных компьютерно-издательских системах не используются. Эти факторы обусловили существующую сегодня монополию продуктов Adobe в сфере форматов вывода.
Какими возможностями обладают форматы PostScript и PDF, и как эти возможности должны влиять на выбор того или иного формата? Это основной вопрос при поиске возможностей сокращения сроков технологического процесса подготовки изданий. Ответ на этот, вопрос прежде всего, должен исходить от производителя. Многочисленные руководства по эксплуатации форматов вывода, обзоры и публикации независимых авторов освещают поставленный вопрос с точки зрения поддерживаемых типов графических объектов, цветовых пространств, максимально допустимых объемов и т.д. Однако реальный технологический процесс — довольно сложный механизм, в котором задействованы сотни и тысячи графических объектов, имеющих разную природу, цветовые характеристики, объем, сложность. Следует также заметить, что в современном технологическом цикле как «создателем», так и «потребителем» массива графических данных является программа (драйвер печати либо интерпретатор). При написании файла вывода программа не обязательно решает поставленную задачу наиболее оптимальным способом. В процессе обработки полученного потока данных интерпретатору может потребоваться значительное время, а результат может быть неудовлетворительным или нестабильным.
Принимая во внимание вышесказанное можно отметить, что представления о базовых возможностях форматов вывода недостаточны для оценки формата, как элемента технологического процесса. При выборе формата вывода необходимо в первую очередь опираться на характер воспроизводимой графической информации и на конкретный технологический процесс. Рекомендаций такого плана в настоящее время практически не суше-
ствует. Современный процесс вывода графической информации является в некотором роде «черным яшиком», где оператор видит только исходный макет и конечный результат вывода информации на физический носитель, не имея представления об используемых алгоритмах воспроизведения и преобразованиях информации. В данной ситуации прогнозировать сроки выполнения вывода и качество воспроизведения можно только опираясь на эмпирические данные.
Цифровое представление графической информации
Представление текстовой информации в электронных публикациях осуществляется с помощью стандартов кодирования символов и текстовых форматов. На данный момент их перечень весьма ограничен. В качестве стандартов кодирования символов используются ASCII, ANSI, UNICODE.
Стандарт представления символов ASCII (American Standard Code for Information Interchange) — это 7-битовое описание кода символа. Поскольку в персональных компьютерах используются байты, состоящие из 8 бит, производители компьютеров часто определяют наборы символов, использующие 256 кодов вместо 128 кодов ASCII. В результате получается «расширенный набор символов» (extended character set), который включает в себя набор символов ASCII и до 128 других символов. Коды от 2 Oh до 7Ah (первые 128 символов) — это выводимые на дисплей символы из набора символов ASCII. Оставшиеся — символы псевдографики. Для множества программ, работающих в текстовом режиме и написанных не для MS Windows, требуется этот расширенный набор символов, поскольку в них для вывода информации на экран используются символы псевдографики — символы блоков и линий. [33]
Некоторые страны начали также применять кодовую таблицу Code Page 850, в которой содержится меньшее количество псевдографических символов. За счет этого введены дополнительные символы, необходимые для языков этих стран, знаки ударения и другие специальные символы.
Расширенный набор символов, который в большинстве случаев использует Windows и программы для Windows, называется набор символов ANSI (ANSI chnrncterset), фактически он является международным стандартом ISO. В России кодовые комбинации начиная со 129 используются для кодирования символов кириллицы, математических символов и другой информации. Причем для каждой платформы используется свое расположение символов в кодовой таблице. Так, известны кодировки Windows, Mac, DOS-OS/2, ISO (Dec) и КОИ-8. Справедливости ради следует отметить, что существуют нормативы: «Основная кодировка ГОСТа», «Альтернативная кодировка ГОСТа» и кодировка КОИ-8. В последнем случае символы кириллицы имеют коды: А-Я — 224-254 (не в алфавитном порядке); а-я - 192-223 (не в алфавитном порядке). [33] Стандарт Unicode был предложен некоммерческой организацией Unicode Consortium, образованной в 1991 г. Для представления каждого символа в этом стандарте используются два байта: один байт для кодирования символа, другой для кодирования признака. Тем самым обеспечивается информационная совместимость данного способа кодирования со стандартом ASCII. Двухбайтовое описание кодов символов позволяет закодировать очень большое число символов из различных письменностей. Так, в документах Unicode могут соседствовать русские, латинские, греческие буквы, китайские иероглифы и математические символы. Кодовое пространство Unicode разделено на несколько областей. Область с кодами от 0000 до 007F содержит символы набора Latin 1 (младшие байты соответствуют кодировке ISO 8859-1). Далее идут области, в которых расположены знаки различных письменностей, а также знаки пунктуации и технические символы. Часть кодов зарезервирована для использования в будущем (29000). 6000 кодовых комбинаций оставлено программистам. Символам кириллицы вьщелены коды в диапазоне от 0400flo04FE [19] В настоящее время разработано и успешно применяется два основных принципа представления изображений — растровая и векторная графика. В основе того и другого способа лежат математические модели, для растровой графики — это массив (матрица) чисел, описывающих цветовые параметры каждой точки (пикселя), а для векторной графики — это математическая формула, используя которую программа всякий раз пересчитывает все точки контура, исходя из новых значений координат нескольких точек. Векторная (объектно-ориентированная) графика исходит из принципов построения изображений из объектов — векторных контуров, которым могут присваиваться параметры обводок и параметры заливок. Контуры в свою очередь описываются математическими формулами, в настоящее время широко используется так называемая кривая Безье, названная в честь французского математика Пьера Безье (P. Bezier), который применял математические кривые и поверхности в процессе конструирования кузова автомобиля Рено. Собственно математическая теория, на основе которой появилась возможность использовать кривые в различных прикладных областях, была сформулирована в начале XX века российским и советским математиком академиком Сергеем Натановичем Бернштейном (1880—1968). [50] В качестве формулы, которая была бы достаточно простой (с точки зрения математика), универсальной (с точки зрения программиста) и геометрически наглядной (с точки зрения пользователя — художника или дизайнера), чаще всего используется упомянутая кривая Безье. Кривые Безье — это целое семейство кривых, из которых используется частный случай с кубической степенью, т. е. кривая третьего порядка, описываемая следующим параметрическим уравнением: Общий вид элементарной кривой Безье представлен на рис. 1.1.1. Кривая строится на основе координат четырех точек, называемых контрольными. Из четырех контрольных точек кривая проходит только через две, эти точки называются опорными (anchor points). Две другие контрольные точки не лежат на кривой, но их расположение определяет кривизну кривой, поэтому эти точки называются управляющими точками, а линии, Безье является гладкой кривой, т. е. она не имеет разрывов и непрерывно заполняет отрезок между начальной и конечной точками. Кривая начинается в первой опорной точке, касаясь отрезка своей управляющей линии, и заканчивается в последней опорной точке, также касаясь отрезка своей управляющей линии. Это позволяет гладко соединять две кривые Безье друг с другом: управляющие линии располагаются вдоль одной прямой, которая является касательной к получившейся кривой. Кривая Безье симметрична, т. е. она сохраняет свою форму, если изменить направление вектора кривой на противоположный. Кривая Безье сохраняет свою форму при масштабировании. Это свойство является фундаментом свободы манипулирования объектами векторной графики. Если существует только две контрольных точки (опорных точки) или управляющие линии коллинеарны (лежат на одной прямой), кривая превращается в прямой отрезок. [50] Каждый элемент векторной графики — контур — представляет собой независимый объект, который можно перемещать, масштабировать, изменять до бесконечности. Векторная графика получила широкое распространение из-за своих многочисленных достоинств.
Программное обеспечение для генерации файлов вывода
Язык PostScript не ограничивает размеры или количество объектов в описании полос, таких как числа, массивы, множества, пути и т.д. Однако, PostScript интерпретатор, запускаемый на конкретном процессоре на конкретной операционной среде может иметь такие ограничения, и быть неспособным выполнить PostScript программы, выходящие за эти пределы.
Операция, выходящая за пределы вызывает в интерпретаторе ошибку «limitcheck» (или «VMerror», если операция исчерпала ресурсы виртуальной памяти). Так как PostScript-интерпретаторы разрабатываются для управления очень сложными описаниями страниц, все лимиты выполнения достаточно широки для того, чтобы большинство PostScript описаний полос интерпретировались без ошибок.
Возникновение ошибки limitcheck в процессе выполнения описания полосы зачастую указывает на ошибку в самой PostScript программе, такую как бесконечное повторение одного из множеств. VMerror обычно указывает, что программа не использует операции save и restore надлежащим образом.
Ограничения PostScript-интерпретатора подразделяются на два класса: Архитектурные лимиты. Аппаратные средства, на котором работает PostScript-интерпретатор накладывает определенные ограничения. Например, целые числа обычно представляются в 32 битах, ограничивая ряд значений целых чисел. К тому же, архитектура программного обеспечения накладывает некоторые ограничения, такие как лимит 65,535 элементов в массиве или строке. Таблица 1.3.1. показывает типичные архитектурные лимиты при работе интерпретатора на 32-разрядной платформе. Лимиты памяти. Объем памяти необходимый интерпретатору определяется количеством объектов которые он должен обрабатывать одновременно. Лимиты памяти могут быть определены точно только на конкретном программно-аппаратном комплексе. [16] Формат PDF основывается на той же графической технологии, что и Adobe PostScript. Операторы создания страниц PDF подобны операторам языка PostScript. Однако PDF является не языком программирования, а форматом хранения данных, он не содержит процедур, переменных и т.п. Существует несколько важных различий между PostScript и PDF: PDF-файл может содержать объекты, подобные гипертекстовым ссылкам, доступные только при интерактивном просмотре; для упрощения процесса описания страниц PDF не использует конструкции программных языков; PDF создает определенную структуру файла, которая позволяет программным приложениям иметь доступ к любой части документа; PDF-файл содержит информацию о размерах шрифта и т.п.; PDF-файл не может быть прямо преобразован в PostScript-публикацию для печати; PDF-файл строится на основе либо 7-битового ASCII-файла, либо на базе бинарного файла. Если это ASCII-файл, в нем используются .только-печатные символы-7-битового ASCII- -кода, пробел, табуляция, возврат каретки и перевод строки. В случае бинарного файла могут быть использованы все символы 8-битового кода. Считается, что ASCII-код — наиболее удобный для переноса вид кодировки. [15] Для уменьшения размера файла PDF использует различные методы сжатия изображений: JPEG — для полноцветных иллюстраций и изображений в градациях серой шкалы; CCITT — для черно-белых изображений; LZW — для компрессии и декомпрессии текстового материала. [33] Все эти методы оперируют с двоичными данными, которые затем могут быть закодированы в коде ASCII. Для обеспечения независимости от шрифтов PDF-файл содержит описание для каждого шрифта, использованного в публикации. Описание включает название, кегль (размер) и стиль шрифта. В режиме просмотра публикации, если шрифт, использованный в документе, доступен, то он используется. Если недоступен, то заменяется на подобный с тем же кеглем и другими характеристиками. Некоторые шрифты могут встраиваться в PDF-публикацию. Для прямого поиска любой страницы файла PDF-файл содержит специальную таблицу ссылок. Таблица размещается в конце файла и способствует уменьшению времени поиска и вывода страницы в PDF-публикации, так как обеспечивает независимость времени поиска от общего количества страниц в документе. Формат PDF поддерживает несколько основных типов объектов, например: bollean — логические (true, false); number — числовые (integer, real); string — последовательность символов в круглых скобках; array — последовательность PDF-объектов различных типов; dictionary — таблицы, состоящие из двух элементов: ключа и значения (используются для соединения атрибутов сложных.объектов, например, в PDF-публикациях с помощью этих объектов представляются страницы и шрифты); stream — в виде объекта типа stream представлены большие объемы данных, такие, как изображения и описания страниц.
Косвенные объекты могут быть помечены так, чтобы на них ссылались другие объекты. Это используется, например, для создания объекта, значение которого изначально не известно. Любой тип объекта может быть помечен как косвенный. Такой объект содержит идентификатор объекта, который сохраняется даже при изменении самого объекта.
Любой объект, использующийся как элемент массива или значение dictionary, может быть определен либо как обычный объект, либо как косвенная ссылка. Косвенная ссылка - это ссылка на косвенный объект, содержащая номер косвенного объекта (идентификатор) и ключевое слово R. [33]
Исследование зависимости качества воспроизведения растровой графики от методов оптимизации программы QuarkXPress
Тема исследований не перестает быть актуальной с момента создания формата PDF версии 1.2.
Еще задолго до этого, в момент монополии формата вывода PostScript, назревал вопрос о решении проблем вывода, связанных с несовершенством формата. Естественно, с появлением первых версий нового электронного формата PDF ведущие полиграфические компании и производители программного обеспечения обратили внимание на преимущества новой архитектуры, применительно к выводу электронных публикаций. Однако эволюционное развитие PDF не было столь быстрым, как бы хотелось потребителям. С появлением новых версий формата добавлялись все новые и новые возможности для полноценной подготовки изданий.
На фоне постепенного развития формата PDF вопрос о сравнении его возможностей с отработанной технологией PostScript неоднократно поднимался в прессе. Прежде всего основные рекомендации по данной теме давались производителем — компанией Adobe. Большинство статей и руководств Adobe в настоящее время освещает сравнение инструментальных возможностей двух форматов с явным упорором на преимущества PDF. [20] В качестве примеров реальных технологических процессов на базе формата PDF подробно рассматриваются процессы подготовки периодических изданий крупных издательств: Associated Press, Zero Нога, Autologic Information International и других. В целом, обзоры компании Adobe имеют рекламный характер и рекомендуют переход вывода большинства изданий на формат PDF. [21]
Оценки сторонних авторов выглядят более объективными. В частности, внештатный редактор журнала «Publish» Джеймс Фелличи производит анализ достоинств и недостатков форматов вывода PostScript level 2 и PDF 1.2. [54] В качестве недостатков PostScript выделены несовершенство структуры документов, непредсказуемость, ненаглядность — свойства которые одновременно являются преимуществами PDF. Недостатки PDF представлены в виде пожеланий для разработчиков формата с целью повысить эффективность вывода. Среди них: отсутствие поддержки треппинга, градиентных заливок, цветовых каналов DCS, некорректное отображение TrueType-шрифтов и др. В целом Фелличи склоняется к мысли, что PDF, несмотря на свое медленное развитие, в будущем полностью заменит формат PostScript. С момента выпуска статьи вышли две новые спецификации PDF 1.3 и 1.4 и во многом материал Дж. Фелличи потерял свою актуальность. Большинство рекомендаций, данных автором были реализованы, однако прогнозы Дж. Фелличи по полному вытеснению формата PostScript пока не оправдались.
Из более поздних публикаций стоит отметить отечественных авторов: А. Амангельдыева «Не электронными публикациями едиными» [24] и А. Моисеева «PostScript умер, да здравствует PDF?!» [46].
В первой публикации освещены недостатки ранних версий формата PDF. Практически все из них перекликаются с ранее описанными Дж. Фелличи недостатками. Помимо того, в статье А. Амангельдыева произведено сравнение старых версий PDF с только вышедшей версией 1.4. Отмечено, например, решение проблемы треппинга: Acrobat Distiller 4.0 позволяет сохранять информацию о треппинге из исходного PostScript-файла в PDF-файл. Сравнительная характеристика форматов А. Амангельдыева основана скорее на личном опыте автора и адресована скорее начинающему специалисту по допечатным процессам.
В публикации А. Моисеева ставятся следующие вопросы: в чем недостатки PostScript, в чем преимущества формата PDF перед PostScript, в чем PostScript остается лучше PDF. Последний поставленный вопрос отличает автора от всех рассмотренных выше. Ответить на него однозначно нельзя, так как все преимущества PostScript одновременно являются и его недостатками. Однако, без него сравнительный анализ форматов не может быть полноценным. Проведен обзор решений, альтернативных форматам компании Adobe. В выводах статьи автор высказывает мысль, о необходимости учета особенностей конкретного технологического процесса при выборе формата вывода.
Таким образом, вопрос о сравнении форматов вывода неоднократно поднимался в прессе. Позиция авторов до появления формата PDF 1.3 была направлена на ожидание дальнейших действий Adobe. С появлением PDF версии 1.3 и 1.4 функциональные возможности форматов PostScript и PDF выровнялись.
Компания Adobe провозгласила курс на постепенную замену формата PostScript на PDF, который был поддержан крупными издательствами и прессой. Сравнительно небольшая часть авторов все же была склонна к трезвому анализу достоинств и недостатков обоих форматов. Публикации данного типа, в том числе и рассмотренные выше, опираются в основном на личный опыт авторов и не имеют экспериментальных обоснований. В результате этого ни в одной публикации нет точной количественной оценки эффективности вывода графической информации через тот или иной формат. В вопросе об эффективности авторы оперируют в первую очередь сравнением объемов файлов вывода, на чем строится основное преимущество формата PDF. Однако вопрос о сравнении скорости обработки информации остается открытым.
Вопрос о качестве воспроизведения графических элементов тем или иным форматом вышеупомянутым авторам не кажется актуальным. Объясняется это сходными функциональными возможностями современных форматов. Однако реальный технологический процесс может накладывать некоторые потери качества в силу определенных настроек программного обеспечения вывода графической информации. При этом графический формат, имеющий широкие функциональные возможности, фактически не использует их на сто процентов. Для анализа таких особенностей требуется детальное рассмотрение всех технологических процессов подготовки изданий с помощью экспериментальных исследований.
Учитывая рассмотренные недостатки работ по данной теме, для ее раскрытия требуется экспериментальная база. Эффективность формата вывода складывается из множества факторов. Каждый из них более или менее важен при оценке формата. Однако, можно выделить из них три основных: качество получаемого репродуцированного изображения; скорость обработки графических данных при использовании формата; возможности формата. Последний фактор подробно оснсшен в справочных руководствах фирмы Adobe и был рассмотрен в аналитическом обзоре. Возможности формата определяются, с одной стороны, ограничениями его переменных величин, с другой стороны, различными программными расширениями или сопутствующим программным обеспечением. Таким образом, для сравнения эффективности форматов вывода необходимо подробно рассмотреть два первых фактора эффективности. Выделим основные задачи, решаемые в работе. 1. Исследования зависимости качества репродуцированного изображения от выбора формата вывода. 2. Исследование зависимости скорости обработки данных от используемого формата вывода. Этот вопрос имеет более общую формулировку: исследование зависимости скорости процесса от выбора технологической схемы подготовки издания. 3. Выработка рекомендаций о выборе формата вывода. Рекомендации должны учитывать все факторы оценки эффективности формата вывода, включая возможности формата, рассмотренные в теоретической части.
Исследование зависимости качества воспроизведения TrueType-шрифтов от параметров генерации PostScript-файла
В результате анализа теоретического материала и проделанной экспериментальной работы сделаны следующие выводы.
Язык описания полос PostScript обладает широкими возможностями для корректного и качественного вывода подавляющего большинства графических объектов, применяемых в КИС. Несмотря на присутствие в языке количественных ограничений, практически все они лежат за пределами используемых в КИС объемов информации. Превышение лимитов системы вывода на современных рабочих станциях может говорить скорее о наличии неоптимизированного потока данных, чем об несовершенстве самой системы.
Несмотря на широкие возможности языка PostScript в стандартных технологических схемах, применяемых в современных КИС, используется достаточно ограниченный объем операторов языка (около двадцати). Для большей части выводимой графической информации этого вполне достаточно. Однако в ряде случаев это приводит к нерациональному описанию данных в формате PostScript и дальнейшему существенному росту временных затрат на стадии вывода. С другой стороны, применение некоторых стандартных процедур на стадии записи PostScript-кода или его последующей обработки позволило бы существенно оптимизировать процесс вывода. Внедряемая сегодня технология Idiom Recognition частично решает вопрос, однако она затрагивает только конечную стадию процесса — интерпретацию. На всех предшествующих стадиях процесса приходится иметь дело с неоптимизированным потоком графических данных.
Формат PDF ранних версий (1.2 и меньше) обладает довольно узкими возможностями для формата вывода. Ряд графических объектов, поддерживаемых языком PostScript и программами верстки, используемыми в КИС, преобразуются в результате генерации PDF-файла в графические объекты более низкого порядка. Результатом является потеря качества графической информации, которая в ряде случаев неприемлема при выводе публикаций. Другим отрицательным фактором является возможное увеличение объема графической информации при генерации PDF-файла, что противоречит основному принципу формата PDF — компактности.
Формат PDF версий 1.3 и выше обладает всеми возможностями формата PostScript и, следовательно, не уступает ему по качеству воспроизведения графической информации. 5. Вследствие особенностей архитектуры формата PDF, его использование существенно упрощает конвертации многополосных файлов вывода, такие как спуск полос, треппинг и т.д. 6. Интерпретация массива графических данных происходит со скоростью, зависящей только от характера обрабатываемой графической информации. При этом формат выводимого файла не вносит существенного вклада в скорость интерпретации. Несмотря на заявления разработчиков формата PDF, что запись растровой графики в формате PDF позволяет производить вывод быстрее, чем через формат PostScript, интерпретация растровой графики через оба формата производится с одинаковой скоростью. 7. Программные методы генерации и обработки формата PostScript фактически лишены средств оптимизации графической информации. При использовании технологических схем, основанных на формате PostScript, следует полагаться только на средства оптимизации программ верстки и возможности интерпретатора. 8. Программные методы генерации PDF с одной стороны обладают широкими возможностями оптимизации растровой графики, но с другой стороны практически лишены возможностей оптимизации векторной графики. Существующая однобокость программных средств во многих случаях не решает задачи сокращения времени вывода сложной графической информации. Однако это не противоречит принципу оптимизации формата PDF — сокращению объема файлов, так как основной вклад в объем файлов вносит именно растровая графика. 9. При воспроизведении в технологическом процессе больших объемов графических данных, смена технологической схемы №2 на №1 приводит к существенному сокращению вре мени процесса, вследствие особенностей генерации PostScript файлов рассматриваемыми графическими редакторами и про граммами верстки. При воспроизведении в технологическом процессе больших объемов векторной графики использование формата PDF приводит к добавлению лишнего звена в технологический процесс, при этом не сокращая скорость процесса на других стадиях. Следствием может быть существенное увеличение времени выполнения вывода. 11. Основной тенденцией развития форматов вывода на сегодняшний день является разработка новых технологий вывода, основанных на формате PDF. Практически все технологии, внедряемые в настоящее время в технологические процессы вывода PDF-файла имеются в возможностях формата PostScript. Однако по ряду причин они не нашли в свое время широкого распространения. 12. В настоящее время показатели и возможности форматов вывода PostScript и PDF равны. Однако политика компании Adobe, направленная на дальнейшее продвижение формата PDF, может в скором времени привести к перемене ситуации в пользу последнего. В результате проделанной практической работы выработаны рекомендации по выбору форматов и технологического процесса вывода в зависимости от характера воспроизводимой информации. 1. При выводе изданий, содержащих преимущественно растровую графику, оптимальным процессом является использование формата вывода PDF. В этом технологическом процессе программа Acrobat Distiller эффективно оптимизирует растровую графику, как методами понижения разрешения, так и методами компрессии. При этом время, затраченное на лишнее технологическое звено — генерацию PDF-файла, оправдано существенным сокращением времени интерпретации. Вывод изданий, содержащих преимущественно векторную графику, используя формат PDF, не эффективен. При достаточно больших объемах векторной графики время технологического цикла увеличивается за счет добавления стадии генерации PDF-файла, однако, оптимизация векторной графики программой Acrobat Distiller не эффективна. 2. При использовании в процессе генерации файла вывода процедурных свойств языка PostScript, не рекомендуется использование формата вывода PDF. В случае использования при выводе программой верстки циклических процедур языка PostScript, преобразование выводных файлов в формат PDF влечет за собой увеличение объема файла и времени интерпретации. Циклические процедуры при записи PostScript, в частности, использует программа Adobe Illustrator при описании заливок «Pattern Fill» и программа Art Pro при генерации спуска полос. 3. При использовании программного обеспечения, шрифтов, драйверов печати ранних версий, а также языка PostScript 1-го уровня, вероятность ошибок на стадии интерпре тации существенно увеличивается. В этом случае рекомендуется использование PDF в качестве формата вывода. Acrobat Distiller при этом является промежуточным интерпретатором, позволяю щим отлавливать ошибки и сбои на стадии генерации файла вы вода. Использование формата PDF является дополнительным барьером контроля ошибок вывода.