Upload
ofika
View
373
Download
3
Embed Size (px)
Citation preview
A PDF fájlformátum bemutatása
Czafit Zsófia
Informatikus-könyvtáros III.
(levelező)
A referátum célja egy kiválasztott fájlformátum bemutatása. Az általam kiválasztott formátum
a PDF fájlformátum, a következőkben ezt szeretném bemutatni
A Portable Document Format (PDF) az Adobe Systems által kifejlesztett bináris
fájlformátum. Ebben a formátumban dokumentumok tárolhatók, amelyek különböző
szoftverekkel, hardverekkel és operációs rendszerekkel olvashatók és létrehozhatók. A PDF
alkalmas szöveget, ábrát és képeket tartalmazó dokumentum leírására eszköz független és
felbontás független formában. A dokumentum lehet egyoldalas, és több ezer oldalas is,
egyszerű vagy összetett: sokféle betűtípussal, ábrával, színnel és képpel
A PDF dokumentumok használata népszerű. Egyik fő előnyük az operációs rendszertől és a
megjelenítő program verziójától való elég nagyfokú függetlenségük. A PDF specifikációja
nyilvános és a megjelenítésükhöz az ingyenes Acrobat Reader minden elterjedt operációs
rendszeren: Windows, Unix/Linux, MacOS rendelkezésre áll. Az alábbiakban ismertetett
programok általában valamennyi 32 bites Windows változatnál: Windows 98, ME, NT, 2000,
XP, Vista és 7 használhatók.
Az egyes irodai alkalmazásokná,l mint például a Microsoft Office a PDF formátumba
mentéshez szükségünk van egy beépülő modulra amely a Microsoft honlapjáról ingyenesen
letölthető. Ennek a modulnak a neve: 2007-es Microsoft Office-bővítmény: Microsoft Mentés
PDF vagy XPS formátumban.
A PDF fájl fizikai felépítése:
A PDF fájlok fizikailag 4 különböző típusú részből állnak. Ezek a következők:
a fejléc (file header)
a törzs (file body)
a kereszthivatkozási táblázat (cross-reference table)
a lezáró rész (trailer)
A PDF fájlok támogatják az incrementális update-elést és ezért a törzs, a kereszthivatkozási
táblázat és a lezáró rész (ebben a sorrendben) többször is előfordulhatnak a fájlban, azaz az
incrementális update során újabb törzsadatok, kereszthivatkozási táblázat és lezáró rész lesz
hozzáfűzve a meglévő fájlhoz anélkül, hogy a már meglévő adatokat megváltoztatnánk. Ebből
következően a PDF fájlok elemzését (parse-olását) a fájl végén az utolsó lezáró résznél kell
kezdeni, majd visszafelé haladva a lezáró részeken és az azokat megelőző kereszthivatkozás-
táblázat részeken fel kell építeni a végleges kereszthivatkozás táblázatot. Ha egy
objektumazonosító több kereszthivatkozás-táblázat részben is előfordul, akkor az utolsó
előfordulás által megadott hivatkozásnak kell a végleges kereszthivatkozás táblázatba
bekerülni.
Fejléc:
A PDF fájl fejléce egyetlen sorból, a fájl első sorában áll, ami egy speciális kommentet
tartalmaz. Ez a komment tartalmazza a PDF fájl verziószámát ASCII formátumban. A
verziószámot megadó komment után szokás még egy kommentet írni ugyanebbe a sorba. Ez a
második komment az ASCII kódkészleten kívül eső karaktereket tartalmaz azért, hogy
fájlátvitel során a fájlátvitelt végző programok felismerjék, hogy bináris fájlformátumról van
szó és ne alkalmazzanak rá semmilyen konverziót, ami a bináris PDF fájlt tönkretenné.
Törzs:
A PDF fájl törzse az PDF objektumok felsorolásából áll. Minden itt felsorolt PDF objektum
előtt szerepel egy objektumazonosító szám és egy generációs szám. Ez a két szám
egyértelműen azonosítja az objektumot a PDF fájlon belül, így a fájl más pontjain
hivatkozhatunk az adott objektumra.
Kereszthivatkozási táblázat:
A kereszthivatkozási táblázat tartalmazza, hogy a törzsben felsorolt PDF objektumok a
fájlban milyen offsetcímen találhatóak, azaz mi az indexe annak a byte-nek a PDF fájlban,
ahol az adott PDF objektum kezdődik. A kereszthivatkozási-táblázat részek az xref
kulcsszóval és az őket követő lezáró rész trailer kulcsszójáig tartanak. Az xref kulcsszó után
következő táblázatrész több szekcióból épül fel. Ezeknek a szekciónak az első sora mindig két
darab, egymástól szóközzel elválasztott egész számot tartalmaz, amelyeknek a jelentése a
következő: az első szám határozza meg a szekcióban szereplő első bejegyzés
objektumazonosítóját, a második szám pedig a szekcióban található bejegyzések számát,
amelyekhez mindig az egyel, nagyobb sorszámú objektumazonosító tartozik. Maguk a
bejegyzések pontosan 20 byte-os sorok, amelyeknek két fajtája van: a szabad és a foglalt
objektumazonosítókat megadó bejegyzések.
Lezáró rész:
A PDF-et lezáró rész a trailer kulcsszóval kezdődik, majd ezt egy speciális név-érték lista
követi, ahol többek között a következő információk vannak megadva:
törzs részben (illetve incrementális update esetén: az összes törzs részben) szereplő
PDF objektumok száma
ha több lezáró rész is található a fájlban, akkor az előző lezáró rész előtti
kereszhivatkozási táblázat offsetcíme
a PDF dokumentum logikai felépítését megadó PDF objektumok közül a logikai
felépítés kiindulópontjául szolgáló gyökérelem offsetcíme a dokumentumon belül.
a PDF fájl fájlazonosítója
PDF dokumentumok előállítása:
PDF dokumentumok előállíthatók az OpenOffice programokkal, minden további eszköz
nélkül is. De készíthetők bármilyen programmal, ami egyáltalában nyomtatni tud. Ehhez
telepíteni kell pl. a CuteWriter vagy a PDF creator programokat, amelyek (virtuális)
nyomtatóként települnek, kimenetüket egy PDF file-ban állítják elő. A PDF file előállításához
ezeket a (virtualis) nyomtatókat kell a nyomtatáshoz kiválasztani. A CuteWriter egyszerűbb,
csak a PDF file előállítására képes. A PDFCreator-nak többletszolgáltatásai is vannak,lehet a
PDF tulajdonságokat módosítani: a megnyitást, másolást, nyomtatást jelszóhoz kötni, az
elkészült PDF file-t azonnal meg lehet nézni pl. az Acrobat readerrel, vagy bármely más
tetszőleges PDF-et kezelő programmal. Ahhoz, hogy teljes értékű PDF dokumentumot
állítsunk elő, egy további programra is szükség van, az úgynevezett."distillerre", ami a
dokumentumban található hivatkozásokat, stb. feldolgozza. Ezt eredetileg az Adobe
bocsátotta ki, de a Transcom társaság tovább fejlesztette, letölthető tőlük a PDF -T-Maker ami
szabadon használható.
PDF dokumentumok szerkesztése:
Az PDF fájlok szerkesztése túl sok időt igényel, illetve lehetetlen, ha nem áll rendelkezésre a
megfelelő szoftver vagy forrásfájl. Egyes programok ugyan lehetővé teszik a PDF
dokumentumban való kisebb javításokat, de ezek csak töredékét tudják a
szövegszerkesztőknek.
Ha PDF formátumban ment egy dokumentumot, a továbbiakban az nem hajthat végre
közvetlen módosításokat. A változtatásokat az eredeti fájlon kell végrehajtani. amellyel
létrehozta az adott dokumentumot, majd a fájlt újra kell menteni PDF formátumban .
A hordozható dokumentumformátumnak tartott PDF (portable document format) a fordító
számára sokszor inkább problémás dokumentumformátumnak bizonyul. A PDF-formátum
célja a megjelenítés, ezt a feladatát kiválóan megoldja, de nem tekinthető szerkeszthető
formátumnak.
Irodalom:(megtekintve 2009.12.28.)
http://www.adobe.com/hu/products/acrobat/solutions/detail/edit_pdf.html
http://office.microsoft.com/hu-hu/help/HA101675271038.aspx#1 (megtekintve 2009.12.28.)
http://hu.wikipedia.org/wiki/PDF (megtekintve 2009.12.28.)
http://office.microsoft.com/hu-hu/help/HA100649921038.aspx (megtekintve 2009.12.28.)