8
A PDF fájlformátum bemutatása Czafit Zsófia Informatikus-könyvtáros III. (levelező)

A PDF fájlformátum bemutatása

  • Upload
    ofika

  • View
    373

  • Download
    3

Embed Size (px)

Citation preview

Page 1: A PDF fájlformátum bemutatása

A PDF fájlformátum bemutatása

Czafit Zsófia

Informatikus-könyvtáros III.

(levelező)

Page 2: A PDF fájlformátum bemutatása

A referátum célja egy kiválasztott fájlformátum bemutatása. Az általam kiválasztott formátum

a PDF fájlformátum, a következőkben ezt szeretném bemutatni

A Portable Document Format (PDF) az Adobe Systems által kifejlesztett bináris

fájlformátum. Ebben a formátumban dokumentumok tárolhatók, amelyek különböző

szoftverekkel, hardverekkel és operációs rendszerekkel olvashatók és létrehozhatók. A PDF

alkalmas szöveget, ábrát és képeket tartalmazó dokumentum leírására eszköz független és

felbontás független formában. A dokumentum lehet egyoldalas, és több ezer oldalas is,

egyszerű vagy összetett: sokféle betűtípussal, ábrával, színnel és képpel

A PDF dokumentumok használata népszerű. Egyik fő előnyük az operációs rendszertől és a

megjelenítő program verziójától való elég nagyfokú függetlenségük. A PDF specifikációja

nyilvános és a megjelenítésükhöz az ingyenes Acrobat Reader minden elterjedt operációs

rendszeren: Windows, Unix/Linux, MacOS rendelkezésre áll. Az alábbiakban ismertetett

programok általában valamennyi 32 bites Windows változatnál: Windows 98, ME, NT, 2000,

XP, Vista és 7 használhatók.

Az egyes irodai alkalmazásokná,l mint például a Microsoft Office a PDF formátumba

mentéshez szükségünk van egy beépülő modulra amely a Microsoft honlapjáról ingyenesen

letölthető. Ennek a modulnak a neve: 2007-es Microsoft Office-bővítmény: Microsoft Mentés

PDF vagy XPS formátumban.

A PDF fájl fizikai felépítése:

A PDF fájlok fizikailag 4 különböző típusú részből állnak. Ezek a következők:

a fejléc (file header)

a törzs (file body)

a kereszthivatkozási táblázat (cross-reference table)

a lezáró rész (trailer)

A PDF fájlok támogatják az incrementális update-elést és ezért a törzs, a kereszthivatkozási

táblázat és a lezáró rész (ebben a sorrendben) többször is előfordulhatnak a fájlban, azaz az

incrementális update során újabb törzsadatok, kereszthivatkozási táblázat és lezáró rész lesz

hozzáfűzve a meglévő fájlhoz anélkül, hogy a már meglévő adatokat megváltoztatnánk. Ebből

következően a PDF fájlok elemzését (parse-olását) a fájl végén az utolsó lezáró résznél kell

Page 3: A PDF fájlformátum bemutatása

kezdeni, majd visszafelé haladva a lezáró részeken és az azokat megelőző kereszthivatkozás-

táblázat részeken fel kell építeni a végleges kereszthivatkozás táblázatot. Ha egy

objektumazonosító több kereszthivatkozás-táblázat részben is előfordul, akkor az utolsó

előfordulás által megadott hivatkozásnak kell a végleges kereszthivatkozás táblázatba

bekerülni.

Fejléc:

A PDF fájl fejléce egyetlen sorból, a fájl első sorában áll, ami egy speciális kommentet

tartalmaz. Ez a komment tartalmazza a PDF fájl verziószámát ASCII formátumban. A

verziószámot megadó komment után szokás még egy kommentet írni ugyanebbe a sorba. Ez a

második komment az ASCII kódkészleten kívül eső karaktereket tartalmaz azért, hogy

fájlátvitel során a fájlátvitelt végző programok felismerjék, hogy bináris fájlformátumról van

szó és ne alkalmazzanak rá semmilyen konverziót, ami a bináris PDF fájlt tönkretenné.

Page 4: A PDF fájlformátum bemutatása

Törzs:

A PDF fájl törzse az PDF objektumok felsorolásából áll. Minden itt felsorolt PDF objektum

előtt szerepel egy objektumazonosító szám és egy generációs szám. Ez a két szám

egyértelműen azonosítja az objektumot a PDF fájlon belül, így a fájl más pontjain

hivatkozhatunk az adott objektumra.

Kereszthivatkozási táblázat:

A kereszthivatkozási táblázat tartalmazza, hogy a törzsben felsorolt PDF objektumok a

fájlban milyen offsetcímen találhatóak, azaz mi az indexe annak a byte-nek a PDF fájlban,

ahol az adott PDF objektum kezdődik. A kereszthivatkozási-táblázat részek az xref

kulcsszóval és az őket követő lezáró rész trailer kulcsszójáig tartanak. Az xref kulcsszó után

következő táblázatrész több szekcióból épül fel. Ezeknek a szekciónak az első sora mindig két

darab, egymástól szóközzel elválasztott egész számot tartalmaz, amelyeknek a jelentése a

következő: az első szám határozza meg a szekcióban szereplő első bejegyzés

objektumazonosítóját, a második szám pedig a szekcióban található bejegyzések számát,

amelyekhez mindig az egyel, nagyobb sorszámú objektumazonosító tartozik. Maguk a

bejegyzések pontosan 20 byte-os sorok, amelyeknek két fajtája van: a szabad és a foglalt

objektumazonosítókat megadó bejegyzések.

Lezáró rész:

A PDF-et lezáró rész a trailer kulcsszóval kezdődik, majd ezt egy speciális név-érték lista

követi, ahol többek között a következő információk vannak megadva:

törzs részben (illetve incrementális update esetén: az összes törzs részben) szereplő

PDF objektumok száma

ha több lezáró rész is található a fájlban, akkor az előző lezáró rész előtti

kereszhivatkozási táblázat offsetcíme

a PDF dokumentum logikai felépítését megadó PDF objektumok közül a logikai

felépítés kiindulópontjául szolgáló gyökérelem offsetcíme a dokumentumon belül.

a PDF fájl fájlazonosítója

Page 5: A PDF fájlformátum bemutatása

PDF dokumentumok előállítása:

PDF dokumentumok előállíthatók az OpenOffice programokkal, minden további eszköz

nélkül is. De készíthetők bármilyen programmal, ami egyáltalában nyomtatni tud. Ehhez

telepíteni kell pl. a CuteWriter vagy a PDF creator programokat, amelyek (virtuális)

nyomtatóként települnek, kimenetüket egy PDF file-ban állítják elő. A PDF file előállításához

ezeket a (virtualis) nyomtatókat kell a nyomtatáshoz kiválasztani. A CuteWriter egyszerűbb,

csak a PDF file előállítására képes. A PDFCreator-nak többletszolgáltatásai is vannak,lehet  a

PDF tulajdonságokat módosítani: a megnyitást, másolást, nyomtatást jelszóhoz kötni, az

elkészült PDF file-t azonnal meg lehet nézni pl. az Acrobat readerrel, vagy bármely más

tetszőleges PDF-et kezelő programmal. Ahhoz, hogy teljes értékű PDF dokumentumot

állítsunk elő, egy további programra is szükség van, az úgynevezett."distillerre", ami a

dokumentumban található hivatkozásokat, stb. feldolgozza. Ezt eredetileg az Adobe

bocsátotta ki, de a Transcom társaság tovább fejlesztette, letölthető tőlük a PDF -T-Maker ami

szabadon használható. 

PDF dokumentumok szerkesztése:

Az PDF fájlok szerkesztése túl sok időt igényel, illetve lehetetlen, ha nem áll rendelkezésre a

megfelelő szoftver vagy forrásfájl. Egyes programok ugyan lehetővé teszik a PDF

dokumentumban való kisebb javításokat, de ezek csak töredékét tudják a

szövegszerkesztőknek.

Ha PDF formátumban ment egy dokumentumot, a továbbiakban az nem hajthat végre

közvetlen módosításokat. A változtatásokat az eredeti fájlon kell végrehajtani. amellyel

létrehozta az adott dokumentumot, majd a fájlt újra kell menteni PDF formátumban .

A hordozható dokumentumformátumnak tartott PDF (portable document format) a fordító

számára sokszor inkább problémás dokumentumformátumnak bizonyul. A PDF-formátum

célja a megjelenítés, ezt a feladatát kiválóan megoldja, de nem tekinthető szerkeszthető

formátumnak.

Page 6: A PDF fájlformátum bemutatása

Irodalom:(megtekintve 2009.12.28.)

http://www.adobe.com/hu/products/acrobat/solutions/detail/edit_pdf.html

http://office.microsoft.com/hu-hu/help/HA101675271038.aspx#1 (megtekintve 2009.12.28.)

http://hu.wikipedia.org/wiki/PDF (megtekintve 2009.12.28.)

http://office.microsoft.com/hu-hu/help/HA100649921038.aspx (megtekintve 2009.12.28.)