Skip to content
reader.me

PDF РЕЧНИК

PDF речник: термини и формати

Какво всъщност означава всеки PDF термин и формат, на разбираем език. Жаргонът, на който се натъквате, обяснен по човешки.

Формати

PDF

PDF (Portable Document Format) е файлов формат, който фиксира точното положение на всеки знак, линия и изображение на страницата, така че документът изглежда еднакво независимо дали го отваряте на телефон, на лаптоп или на печатарската машина в студио за печат. Adobe го създава през 1993 г. и през 2008 г. предава спецификацията на ISO, където той става отвореният стандарт ISO 32000. Именно тази отвореност е причината толкова много независими инструменти да могат да четат и записват PDF, без да искат разрешение от никого.

PDF/A

PDF/A е профилът ISO 19005, създаден за дългосрочно архивиране. Целта е проста: документ, отворен след петдесет години, трябва да изглежда точно както днес — без липсващи шрифтове и без зависимост от външни ресурси, които може да са изчезнали. За да гарантира това, стандартът забранява всичко, което може да се повреди с времето.

PDF/UA

PDF/UA (ISO 14289, където UA означава Universal Accessibility — универсална достъпност) е стандартът, който прави един PDF използваем за хората, които разчитат на помощни технологии. Екранният четец не може да осмисли мастило върху страница; нужна му е логическа структура отдолу. PDF/UA определя точно как трябва да бъде изградена тази структура.

PDF/X

PDF/X (ISO 15930) е семейството профили, създадени за професионален печат и графични изкуства. Когато файл отива в печатница, неяснотата струва скъпо: липсващ шрифт, RGB изображение там, където се очаква CMYK, или недефинирана зона на обрязване може да съсипе цял печатен тираж. PDF/X премахва тази неяснота, като принуждава всяка критична за печата подробност да бъде изрична.

Понятия

OCR

OCR (Optical Character Recognition — оптично разпознаване на знаци) превръща картината на текста в истински, избираеми знаци. Сканирана страница или снимка на документ за компютъра е просто решетка от пиксели: в нея няма текст, само изображение, което случайно прилича на думи. OCR анализира формите на буквите и възстановява заложения зад тях низ от знаци.

AcroForm

AcroForm е родната, вградена технология за формуляри на PDF — онзи вид интерактивен формуляр, който е част от формата от края на 90-те години. Попълваемите полета, които виждате в данъчна декларация или във формуляр за кандидатстване — текстови полета, отметки, радиобутони, падащи менюта и полета за подпис — са AcroForm обекти, дефинирани директно в обектната структура на PDF.

XFA

XFA (XML Forms Architecture) е алтернативната технология за формуляри на Adobe, при която формулярът се дефинира не от родни PDF обекти, а от XML съдържание, вградено вътре в PDF обвивката. Тя е проектирана за сложни, динамични формуляри: оформления, които растат с добавянето на редове, полета, които се появяват или изчезват в зависимост от предишните отговори, и тясно обвързване със схеми с данни от системата отзад.

Метаданни

Метаданните са данните за вашите данни — информацията, която PDF носи отвъд видимото съдържание на страницата. Има две основни хранилища: наследеният речник с информация за документа (заглавие, автор, тема, ключови думи, софтуерът, който го е създал, и датите на създаване и промяна) и XMP — базиран на XML блок, който държи същите полета плюс по-богати, разширяеми свойства.

Компресия

Компресията е това, което държи размерите на PDF файловете управляеми, и един документ обикновено смесва няколко метода, защото смесва няколко вида съдържание. Текстът и инструкциите за векторно изчертаване се компресират без загуба с Flate (същият алгоритъм Deflate зад ZIP), така че всеки знак се връща точно както е влязъл.

Вградени шрифтове

Вградените шрифтове са шрифтове, опаковани вътре в самия PDF, вместо заети от компютъра, който го отваря. Това е функцията, която прави PDF истински преносим: ако шрифтът пътува с документа, текстът се изобразява еднакво навсякъде, дори на машина, на която този шрифт никога не е бил инсталиран.

Текстов слой

Текстовият слой е частта от PDF, която държи истински, машинночетими знаци — съдържанието, което можете да изберете с курсора, да копирате, да търсите и да накарате да бъде прочетено на глас. PDF, изграден от текстообработваща програма или приложение за оформление, има този слой по рождение, като всеки знак е съпоставен с позиция и шрифт.

Воден знак

Воден знак е текст или изображение, положено върху страниците на PDF, за да отбележи състояние или собственост — бледо „ЧЕРНОВА“ или „ПОВЕРИТЕЛНО“ по диагонала на страницата, фирмено лого или ред с авторско право. Той сигнализира намерение, без да закрива основното съдържание, обикновено като е полупрозрачен или седи зад основния текст.

Линеаризация

Линеаризацията, предлагана от Adobe под името Fast Web View, е начин за преподреждане на вътрешния байтов ред на PDF, така че той да може да се покаже, преди целият файл да е пристигнал. В обикновен PDF таблицата с препратки, която индексира всеки обект, седи в самия край, така че програмата за преглед технически се нуждае от целия файл, за да знае къде са нещата.

Сигурност

AES

AES (Advanced Encryption Standard) е блоковият шифър, който защитава PDF, защитен с парола. Когато заключите документ, потоците със съдържанието на страницата и текстовите низове се криптират с AES, а единственият път обратно до четимите байтове е да подадете правилната парола и да изведете правилния ключ. Без него файлът на диска е просто шифрован текст.

Електронен подпис

Електронният подпис е, в най-широкия правен смисъл, всякакви данни, прикачени към документ, които показват намерението на подписващия да се съгласи — от изписано име или нарисувана драскулка до криптографски подкрепен печат. Регламентът eIDAS на ЕС ги разпределя в нива и това разграничение има значение, когато по-късно подписът трябва да издържи проверка.

Цифров подпис

Цифровият подпис е криптографският механизъм, който доказва кой е подписал даден PDF и че никой не го е променял оттогава. Той е техническият двигател, на който разчитат най-силните електронни подписи, и е изграден от криптография с публичен ключ, а не от каквато и да е картина на драсване с писалка.

Изображения

Векторна графика

Векторната графика описва изображението като математика — точки, линии, криви и запълвания — а не като фиксирана решетка от оцветени точки. Окръжност се съхранява като център, радиус и цвят, така че компютърът я преизчертава с какъвто и да е поискан размер. Следствието е определящото свойство на векторното изкуство: то се мащабира до всякакъв размер без загуба на острота.

Растерно изображение

Растерното изображение е правоъгълна решетка от пиксели, всеки от които държи цветова стойност — моделът зад всяка снимка и сканиране. За разлика от вектора, растерът има фиксирана собствена резолюция: съхранява точно толкова точки по ширина и височина, и целият му детайл е запечен в тази решетка.

JPG

JPG (изписван и JPEG, по групата Joint Photographic Experts Group, която го дефинира) е загубеният растерен формат, създаден за снимки. Работи, като преобразува изображението в честотни компоненти и отхвърля фините детайли, които човешкото око най-малко вероятно ще пропусне — така той смалява пълноцветна снимка в малък файл.

PNG

PNG (Portable Network Graphics) е растерният формат без загуба за графики с остри ръбове и плосък цвят — екранни снимки, лога, икони, диаграми и всичко, съдържащо текст. Без загуба означава, че съхранява изображението точно: презаписвайте го колкото искате и нито един пиксел не се променя — обратното на поколенческото влошаване на JPEG.

WebP

WebP е графичен формат от Google, който цели да замени едновременно JPEG и PNG с един контейнер. Номерът му е поддръжката на два режима: загубена компресия за снимки, като JPEG, и компресия без загуба за графики, като PNG, докато обикновено произвежда по-малки файлове от всеки от тях при сравнимо качество.

TIFF

TIFF (Tagged Image File Format) е тежкият растерен формат, използван в архивиране, сканиране и професионална обработка на изображения. Името му идва от структурата му: гъвкав набор от тагове, описващи изображението, който позволява един TIFF да държи некомпресирани или компресирани без загуба данни, високи битови дълбочини, вградени цветови профили и значително количество технически метаданни.

SVG

SVG (Scalable Vector Graphics) е отворен, базиран на XML векторен формат — изображение, записано като четим текст, описващ форми, пътища, цветове и текст. Тъй като е векторно, се мащабира до всякакъв размер с напълно ясни ръбове, а тъй като е XML, може да се стилизира с CSS, да се анимира и дори да се търси или редактира в обикновен текстов редактор.

DPI

DPI (dots per inch — точки на инч) измерва резолюцията — колко точки детайл са събрани във всеки инч от изображение или печат. Колкото по-високо е числото, толкова по-фин е детайлът и толкова по-голям е файлът. Това е единствената настройка, която най-често решава дали сканиране или експорт ще изглежда ясно или разочароващо.