151
Petr Sojka: Elektronická pˇ ríprava dokument˚ u 1. pˇ rednáška PB029, 19. 9. 2011, Brno c Petr Sojka, 2000–2011 1 “You cannot not communicate” Paul Watzlawick (1921– ) Lidé komunikují prostˇ rednictvím dokument ˚ u pˇ ripravovaných elektronicky Petr Sojka: Materiály k výuce pˇ redm ˇ etu Elektronická ríprava dokument˚ u (PB029) na FI MU. Verze z December 5, 2011 formátovaná k úspornému tisku.

“You cannot not communicate”1sojka/PB029/edp.pdf · Petr Sojka: Elektronická pˇríprava dokumentu˚ 1.pˇrednáška PB029, 19.9.2011, Brno c Petr Sojka, 2000–2011 “You cannot

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

  • Petr Sojka: Elektronická příprava dokumentů1. přednáška PB029, 19. 9. 2011, Brno c© Petr Sojka, 2000–2011

    1

    “You cannot not communicate”Paul Watzlawick (1921– )

    Lidé komunikují prostřednictvímdokumentů připravovanýchelektronicky

    Petr Sojka: Materiály k výuce předmětu Elektronickápříprava dokumentů (PB029) na FI MU.

    Verze z December 5, 2011 formátovanák úspornému tisku.

  • Petr Sojka: Elektronická příprava dokumentů1. přednáška PB029, 19. 9. 2011, Brno c© Petr Sojka, 2000–2011

    2PB029

    Elektronická příprava dokumentůElectronic Preparation of Documents

    ❑ Petr Sojka1, mailto://[email protected]

    ❑ Materiály k předmětu budou průběžně zveřejňovány nawebové stránce předmětu2, případně v IS MU.

    ❑ Aktuální sylabus předmětu3 je na IS MUNI4.

    ❑ Doporučená komunikace: diskuzní fórum předmětu naISu.

    ❑ Konzultační hodiny na podzim 2011:středa 13:00–13:50 (v C523|522, 5. patro C, Botanická68a)pátek 10:00–11:30 tamtéž, po domluvě emailem i jindy.

    1http://www.fi.muni.cz/usr/sojka/2http://www.fi.muni.cz/˜sojka/PB029/3https://is.muni.cz/auth/predmety/uplny vypis?fakulta=1433;obdobi=5364;predmet=6325414http://is.muni.cz

  • Petr Sojka: Elektronická příprava dokumentů1. přednáška PB029, 19. 9. 2011, Brno c© Petr Sojka, 2000–2011

    3❑ Cvičení jednohodinová, účast povinná. Kromě

    přednášejícího cvičí Michal Růžička5. Na cvičení seregistrujte!

    ❑ Kredity: tři plus ukončení.

    5http://www.fi.muni.cz/˜xruzick7/

  • Petr Sojka: Elektronická příprava dokumentů1. přednáška PB029, 19. 9. 2011, Brno c© Petr Sojka, 2000–2011

    4Obsah dnešní p řednášky

    ❑ Základní pojmy.

    ❑ Cyklus přípravy dokumentů.

    ❑ Sylabus kursu.

    ❑ Doporučená literatura.

    ❑ Test – korektura.

    ❑ Anketa.

    ❑ Logické a vizuální značkování.

    ❑ Dotazy, agenda (cvičení, rozdělení do skupin), brožurkaZačínáme s TEXem na FI.

  • Petr Sojka: Elektronická příprava dokumentů1. přednáška PB029, 19. 9. 2011, Brno c© Petr Sojka, 2000–2011

    5Základní pojmy

    ☞ Informatika – „Nauka o vzniku, oběhu a působeníinformací.“

    ☞ Informace, její předávání – dokument : “A document isone or more official pieces of paper with writing onthem.” (Collins Cobuild)

    ☞ Příprava dokumentů: obsah a forma dokumentů

    ☞ Prezentace informací a její důležitost, stále častějielektronicky : “An electronic process or activityinvolves the use of electronic devices.”

    ☞ Stále vyšší požadavky na přípravu dokumentů:“Preparation is the process of getting something readyfor use or for a particular purpose.”

  • Petr Sojka: Elektronická příprava dokumentů1. přednáška PB029, 19. 9. 2011, Brno c© Petr Sojka, 2000–2011

    6Cyklus lad ění dokumentu

    “A man who would letterspace lower case would stealsheep.”

    Frederick Goudy, (1894–1945)

    “If this wisdom needs updating, it is chiefly to add thatA woman who would . . . ”

    Robert Bringhurst, (1946–)

    ☞ Autor −→ čtenář

    ☞ Cyklus ladění dokumentu: paralela s laděním programu(waterfall diagram)

  • Petr Sojka: Elektronická příprava dokumentů1. přednáška PB029, 19. 9. 2011, Brno c© Petr Sojka, 2000–2011

    7

    ➀ Pořízení textu, značkování logických částí➁ Design – návrh dokumentu➂ Sazba, typografie➃ Korektury➄ Vytvoření předlohy/matrice➅ Tisk (vystavení) dokumentu

  • Petr Sojka: Elektronická příprava dokumentů1. přednáška PB029, 19. 9. 2011, Brno c© Petr Sojka, 2000–2011

    8☞ Dynamické a odvozené „dokumenty“ −→ hypertext,

    interaktivní texty, e-learning, virtuální realita, . . .

  • Petr Sojka: Elektronická příprava dokumentů1. přednáška PB029, 19. 9. 2011, Brno c© Petr Sojka, 2000–2011

    9Sylabus p řednášky

    Předmětem výuky tohoto předmětu je výklad základníchprincipů, algoritmů a technik tvorby dokumentů, s ohledemna jejich využití při publikační činnosti (příprava skript,prezentačních materiálů, psaní diplomové, dizertačnípráce, dokumentace programu ap.), se zaměřením nasystém TEX.

    ➀ Postup při přípravě dokumentů; základní pojmy aterminologie.

    ➁ Logická struktura dokumentu; značkování, značkovacíjazyky, SGML, HTML, XHTML, XML, WML. Gramatikydokumentů, DTD, validace. NSGMLS.

    ➂ Návrh. Principy knižního designu. Návrhstrukturovaných dokumentů.

    ➃ Publikace na síti Internet (WWW) a specifika návrhu avytváření těchto dokumentů. CSS, XSL, HTML5.

    ➄ Základy typografie, specifika sazby českých textů.

  • Petr Sojka: Elektronická příprava dokumentů1. přednáška PB029, 19. 9. 2011, Brno c© Petr Sojka, 2000–2011

    10➅ Písma, typy písem, způsoby reprezentace a designu

    písem. Rastrovací algoritmy, techniky redukcí tvarupísem. Formáty písem.

    ➆ Sázecí systémy. TEX jako příklad dávkového sázecíhosystému a jeho principy. Sazba. LATEX. Styly sazby ajejich implementace (makroprogramování).

    ➇ Algoritmy řádkového a stránkového zlomu,hz-algoritmus.

    ➈ Jazyky pro popis stránek. PostScript. Bézierovy křivky.

    ➉ Výstupní zařízení, charakteristiky výstupních zařízení.Osvit, tisk a vazba.

    ➊ Hypertext, hypertextové systémy. Portable DocumentFormat, technologie Adobe Acrobat, pdfTEX.

    ➋ Paralelní publikace na papíře a na síti. Publikacedatabází. Konverze mezi různými formáty. LATEX2html.Dynamické dokumenty.

    ➌ Závěrečné shrnutí, sdílení zkušeností. Vyhodnocenípříkladů. Test.

  • Petr Sojka: Elektronická příprava dokumentů1. přednáška PB029, 19. 9. 2011, Brno c© Petr Sojka, 2000–2011

    11„Dokumenty v TEXu jsou mstou akademiků studentům,takže přežijí do té doby, dokud budou přežívat zatvrzelci

    v akademických sborech (řádově několik tisíciletí).“Jiří Hlavenka, (1964– )

    :-( Naproti tomu:„Rozhodně, prosím, opust’te vody nepoučených

    ’nalévačů

    textu‘ či’myšařů‘ a začněte vyrábět sazbu, již je nejen

    radost číst, ale na níž i oko se zalíbením spočinouti může.“Michal Ptáček

    “TEX in Schools? Just Say No!” (Konrad Neuwirth)

  • Petr Sojka: Elektronická příprava dokumentů1. přednáška PB029, 19. 9. 2011, Brno c© Petr Sojka, 2000–2011

    12Shrnutí – Dokumenty a VT

    ☞ Použití výpočetní techniky při celém cyklu práces dokumenty (vytváření, testování a údržbadokumentů – nosičů informací).

    ☞ Dokumenty tištěné; zaměření na technické,strukturované (DP, odborné publikace, články, přípravy).

    ☞ Hypertext: „dokumenty“ elektronické, jejich značkování,vytváření, validace, konverze, šíření.

    ☞ Přednášky – „teorie“, důraz na principy; cvičení –„praxe“, sdílení zkušeností se softwarovými systémy ael. vytvářením dokumentů, TEX.

    ☞ Hodnocení – bodovací systém: závěrečný testsestávající se z korektury (10 %) a testu (40 %).Vytvoření dokumentů tištěného (strukturovaného,alespoň 4 strany, např. životopis) a elektronického(WWW či WAP domovská stránka), domácí úlohy adokumenty (50 %). Prémiové body.

  • Petr Sojka: Elektronická příprava dokumentů1. přednáška PB029, 19. 9. 2011, Brno c© Petr Sojka, 2000–2011

    13Relevantní kurzy na FI

    ☞ PA178 – Digital Typography and Visualization

    ☞ PV212 – Seminar on Dig. Typography

    ☞ ?PV126 Typographic programming (Hans Hagen,blokově)

    ☞ PV123 – Základy vizuální komunikace

    ☞ PB138 – Moderní značkovací jazyky

    ☞ PV066, PV067, PV099 – Typografie I, II, III

    ☞ PV078, PV083, PV100 – Grafický design I, II, III

    ☞ PV084, PV085, PV101 – Písmo I, II, III

    ☞ PB009 – Základy počítačové grafiky

    ☞ PB182 – Komunikace člověka s počítačem

  • Petr Sojka: Elektronická příprava dokumentů1. přednáška PB029, 19. 9. 2011, Brno c© Petr Sojka, 2000–2011

    14☞ nebo i PV030 – Textové informační systémy

    ☞ příbuzné kurzy (počítačová lingvistika, multimédia,Java)

    ☞ bohatá knihovna (ssh knihovna.muni.cz ), poličkapředmětu v knihovně s materiály

    ☞ brožurka Začínáme s TEXem na fi.muni.cz6

    ☞ DVD TEXlive 2011, modul texlive-2011 (-2010, -2008,2003, -2005a, -6), stránky CSTUG

    6http://www.fi.muni.cz/˜sojka/PB029/zaciname.html

  • Petr Sojka: Elektronická příprava dokumentů1. přednáška PB029, 19. 9. 2011, Brno c© Petr Sojka, 2000–2011

    15Literatura

    ➀ Donald Knuth: Digital Typography, Addison-Wesley,1999.

    ➁ Vladimír Beran a kol.: Aktualizovaný Typografickýmanuál, Kafka, 2000.

    ➂ Jean-Luc Dusong, Fabienne Siegwartová: Typografieod olova k počítačům, Svojtka, Vašut, 1997.

    ➃ Petr Olšák: Typografický systém TEX, Konvoj&CSTUG,2000.

    ➄ Jiří Kosek: XML pro každého, Grada, 2000.

    ➅ Pavel Satrapa: WWW pro čtenáře, autory a misionáře.

    ➆ Petr Olšák: TEXbook naruby, Konvoj, 1998.

    ➇ P. Taylor, J. Zlatuška: Book design, sborník SOFSEM1993, Zpravodaj CSTUG 1–4/95.

    ➈ P. Pop a kol.: Sazba I, SPN 1984.

  • Petr Sojka: Elektronická příprava dokumentů1. přednáška PB029, 19. 9. 2011, Brno c© Petr Sojka, 2000–2011

    16➉ Jiří Rybička: LATEX pro začátečníky, Konvoj 2003, 3.

    vydání.

    ➊ Zdenka Dvořáková: DTP a předtisková příprava,CPress 2008.

    ➋ Časopisy Typografia, Font, Electronic Publishing, PCWorld, ročník 94.

    ➌ Studijní materiály v ISu, odpovědníky.

    ➍ Safari Bookshelf online7.

    ➎ Odkazy na WWW stránce předmětu a dokumentechpředmětu (slidy), na www.kosek.cz8, www.CSTUG.cz9.

    ➏ http://www.fi.muni.cz/~sojka/PB029/typobib.pdf10.

    ➐ knihovna.muni.cz11.

    7http://proquest.safaribooksonline.com/home8http://www.kosek.cz9http://www.cstug.cz

    10http://www.fi.muni.cz/~sojka/PB029/typobib.pdf11http://knihovna.muni.cz

  • Petr Sojka: Elektronická příprava dokumentů1. přednáška PB029, 19. 9. 2011, Brno c© Petr Sojka, 2000–2011

    17Anketa

    ➀ Dosavadní praxe vytváření tištěných dokumentů(zejména technických, i pracovních):

    (a) rozsah a typ dokumentů (odb. lit., eseje, dopisy, . . . )(b) jaký software používáte?(c) v čem jste s dosavadním stavem nespokojeni?

    ➁ Totéž pro elektronické/multimediální dokumenty (HTML,PDF, případně alespoň elektronická pošta apod.)

    ➂ Proč jste si předmět zapsali (co si slibujete od jehoabsolvování) – kromě kreditů?

    ➃ Návrhy, připomínky k zaměření, obsahu apod.?

    ➄ Jak hodláte zúročit informace z předmětu v praxi?

    ➅ Jakou vlastníte relevantní literaturu a jaké příbuznépředměty jste absolvovali respektive máte zapsány?

    ➆ Oblast expertízy, zkušeností s publikováním, používanésoftwarové systémy (o čem byste chtěli referovat)?

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    18Minitest – korektura

    ➀ Najděte během deseti minut samostatně v přiloženémtextu deset typografických chyb.

    ➁ Spočtěte si počet úspěšně nalezených.

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    19Osnova dnešní p řednášky

    ☞ Anketa a agenda.

    ☞ Logické a vizuální značkování.

    ☞ Značkovací jazyky. Formální dokumenty a principyznačkování – SGML.

    ☞ Gramatiky dokumentů, DTD.

    ☞ Validace a vytváření SGML dokumentů.

    ☞ Výměna dokumentů na Internetu, URI/URL/URN.

    ☞ Aplikace SGML: HTML, XHTML.

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    20Agenda

    ☞ Zhodnocení ankety.

    ☞ Domácí úlohy – logické/vizuální značkování: noste docvičení.

    ☞ Domácí a prémiové úlohy sledujte pravidelně na webupředmětu! Aktuální je např. prémiová úloha z Invexu.

    ☞ Body a prezence na cvičení je ve vystavenýchzáznamnících na IS (kontrolujte si).

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    21Vizuální a logická struktura dokumentu

    “Algorithms + Data = Program”Niklaus Wirth

    „Forma + Obsah = Dokument“Petr Sojka

    ☞ Přenos informace – raison d’être dokumentu

    ☞ Obsah – stylistika, jazyková správnost, koheze

    ☞ Forma

    ❑ jednotnost❑ přenos informace❑ struktura

    typografie

    literatura=

    interpretace

    kompoziceskladby

    ☞ Obsah −→ Forma; vizuální prvky musí podporovatvnitřní obsah a strukturu a být s ní konzistentní.

    ☞ Značkovací jazyky (Markup Languages): SGML, HTML,WML, XML, LATEX umožňují oddělit obsah a formu tam,kde je to možné.

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    22☞ Značky logické struktury × vizuální.

    ☞ Někdy oddělit nelze (Trychtýř12 ChristianaMorgensterna).

    12http://www.alb-neckar-schwarzwald.de/morgenstern/morgenstern poems.html

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    23Cyklus vývoje dokumentu v L ATEXu

    TFM HYP CLS POOL

    ?��

    ��INITEX

    ? ?

    LOG FMT TEX STY CLS TFM

    ?��

    ��(pdf)TEX

    ? ? ? ?

    DVI LOG IDX AUX

    6

    BIB BST

    ?��

    ��BIBTEX

    ? ?

    BLG BBL

    6

    IST

    ?��

    ��MakeIndex

    ? ?

    ILG IND 6

    FNT

    ?��

    ��DVI ovladač

    ?

    ���� �

    ���

    výstup

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    24Použití p řípon souborů

    SOUBOR POPIS IDENTIFIKACE(SUFFIX, EXTENZE, ETC.)

    TEX textový vstup tex , ltxDVI výstup (pdf)TEXu, zformátovaný text dviLOG log soubor (pdf)TEXu log , lis , listHYP vzory dělení slov texTFM metriky fontů tfm

    POOL chybová hlášení pool , poo , polFMT format file fmtCLS TEXové styly tex , cls , dtxSTY TEXové pom. styly file sty , tex , docAUX pomocné soubory aux , toc , lot , lof ,

    glo , tmp , texIDX neutříděný rejstřík idxIST styl sazby rejstříku istILG MakeIndex log soubor ilgIND utříděný rejstřík indBIB bibliografické záznamy bibBBL seznamy citací bblBLG BIBTEX log soubor blgBST BIBTEX style soubor bst

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    25Z hlavy autora do elektronické podoby

    “Data cannot be used at a finer grainthan it is marked up at.”

    R. Jelliffe

    ☞ Autor, jeho interní model problematiky v hlavě a jeho(neustálá) reorganizace. Lineární zápis v časovémokamžiku formou textu (psaní). O

    ☞ Tentýž text může mít více interpretací.

    ☞ Pro uchopení obsahu a automatizaci zpracování jenutný značkovací jazyk : text je obohacen azjednoznačněn značkami .

    ☞ Příklady značek: :-) (ze slovníčku smileys) či... .

    ☞ Značka je kód přidávaný k (elektronicky) vytvářenémutextu, který definuje strukturu textu (logická zna čka )nebo formát textu (vizuální zna čka ).

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    26☞ Značka explicitně určuje interpretaci (víceznačného)

    textu. Dříve sazeč určoval interpretaci implicitněz kontextu a sémantiky textu (holý text v přirozenémjazyce ve strojopise je víceznačný).

    ☞ Procedurální (jména pro zpracování) versusdeskriptivní zna čkování (jména pro kategorizaci).

    ☞ Výhody deskriptivního značkování:

    ❑ Nezávislé zpracování označených dat různýmizpůsoby a programy. Tedy například umožňujegenerování různých výstupů z jednoho zdroje(databáze, dobře označkovaný text) pro elektronickou(XML, HTML, PDF, Hypercard, . . . ) nebo tištěnouverzi (PS, PDF z LATEXu).

    ❑ Oddělení obsahu a formy (ohledně formy mározhodující slovo nakladatel).

    ❑ Je snazší výměna a komunikace obsahu:komunikace mezi (spolu)autory, redakcí (přesInternet).

    ❑ Datová nezávislost: textové soubory, dlouhodobáarchivace trvalých hodnot [papír (500 let) versus bity(k nové verzi programu)].

    → lingua franca značkovacích jazyků?

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    27Jaký zna čkovací jazyk?

    ☞ Nevýhody proprietárních formátů (Word, WordPerfect):účelově se mění, jsou nestabilní. Hrozí babylonskézmatení jazyků nebo monopol nevhodného formátu.

    ☞ Organizace ISO13 (International StandardsOrganization), vydává známé normy jako ISO 8859-2,10646-1 (Unicode), . . .

    ☞ Norma ISO 8879:1986 Information processing – Textand office systems – Standard Generalized MarkupLanguage (SGML), vydaná 15. 10. 1986 po dlouhémprocesu standardizace na základě návrhu CharleseGoldfarba a jeho GML. Počátky již na konci šedesátýchlet při návrhu informačního systému právnických textův IBM.

    ☞ Celá sada standardů ISO: kromě SGML, DSSSL(Document Style Semantics and SpecificationLanguage, ISO/IEC DIS 10179.2:1994), SPDL(Standard Page Description Language, ISO/IEC DIS10180:1991) a HyTime (Hypermedia/Time-basedStructuring Language, ISO/IEC 10744:1992). O

    13http://www.iso.org/

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    28☞ S odstupem času: nesporný úspěch SGML, základ pro

    další značkovací jazyky (XML), ale například neúspěchSPDL oproti proprietárnímu PostScriptu.

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    29SGML – historie a motivace

    ☞ Výhody: znovupoužívání částí dokumentů, kvalita aotevřenost systému, obecnost, nezávislost na konkrétníformě (WWW konsorcium), rozšiřitelnost dletechnologických možností (hypertext), snížení nákladů,možnost validace (ověření korektnosti dokumentu nazákladě formální definice jazyka dokumentu).

    ☞ Nevýhody: za obecnost se platí složitostí, i po šestnáctiletech jsou nejlepší systémy na plné SGML drahé,změna s rozšířením HTML, přesto přechod k XML(složitost).

    ☞ Uživatelé SGML (zpočátku velké instituce, elektronickýa letecký průmysl, nakladatelé): AAP, OUP, Boeing,Lufthansa, British Patent Office, Association of Germaneditors, TEI, McGraw-Hill, LDC, . . . viz stránkyOrganization for the Advancement of StructuredInformation Standards14 .

    ☞ Dnes přesnější a relevantnější vyhledávání naInternetu.

    14http://www.oasis-open.org/cover/

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    30Metajazyk SGML – definice

    ☞ SGML je mezinárodní standard pro popis značkovacíchjazyků.

    ☞ Formálněji je to syntaktický metajazyk pro definici tříddokumentů (deskriptivních značkovacích jazyků),nezávislých na abecedě.

    ☞ Formální definice typu dokumentu se nazývá DTD –Document Type Definition, definice typu dokumentu(gramatika třídy dokumentů). SGML parser (validátor)pak čte na vstupu DTD a kontroluje formální správnost.

    ☞ Instance SGML dokumentu (dále jen SGML dokument)sestává z deklarace (pokynů pro parser), gramatiky(DTD) a vlastního popisně označkovaného textu.

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    31SGML deklarace

    ☞ „Pokyny pro parser“ s definicemi abeced (analogiepopisu BNF):

    ❑ role oddělovačů;❑ rezervovaná jména;❑ zakázané znaky, typicky kontrolní ASCII;❑ pravidla pro pojmenovávání, citlivost na malá a velká

    písmena;❑ velikosti délek, značek, . . . ;❑ komentáře;❑ parametry chování, které vlastnosti kontrolovat

    (OMITTAG).

    ☞ Pokud deklarace v dokumentu není uvedena, používáse implicitně referen ční syntaxe Reference ConcreteSyntax (RCS).

    ☞ příklad deklarace15:15ftp://ftp.ifi.uio.no/pub/SGML/declaration

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    32

    0 9 UNUSED9 2 9 -- TAB, LF --

    11 2 UNUSED13 1 13 -- CR --14 18 UNUSED

    32 95 32127 1 UNUSED

    CAPACITY SGMLREFTOTALCAP 35000

    ...NAMECASE

    GENERAL YESENTITY NO

    DELIMGENERAL SGMLREFMDO "" -- markup decl close --DSO "[" -- declaration subset open --DSC "]" -- declaration subset close --MSC "]]" -- marked section close --COM "--" -- comment --RNI "#" -- reserved name indicator --LIT """ -- literal --LITA "’" -- alternative literal --GRPO "(" -- group open --

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    33

    GRPC ")" -- group close --AND "&" -- and connector --OR "|" -- or connector --SEQ "," -- seq connector --OPT "?" -- opt occurrence indicator --REP "* " -- rep occurrence indicator --PLUS "+" -- plus occ ind, inclusion --MINUS "-" -- exclusion, omission flag --CRO "" -- character reference open --ERO "&" -- entity reference open --PERO "%" -- parameter entity reference open --REFC ";" -- reference close --PIO "

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    34SGML DTD: atributová gramatika

    ☞ Terminologie teorie formálních jazyků: neterminály(elementy ), terminály (entity ).

    ☞ Elementy vytvářejí stromovou strukturu, nemohou senavzájem křížit, jeden element je kořenový. Lze použítprázdné elementy.

    ☞ Elementy mohou mít atributy . O

    cislo CDATA #REQUIREDvystaveni CDATA #REQUIREDsplatnost CDATA #REQUIREDvystavil CDATA #IMPLIED>

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    35Deklarace elementů a atributů

    ☞ Sekvence, alternativa, ANY, EMPTY, #PCDATA.

    ☞ Opakování: právě jednou, nejvýše jednou (?), alespoňjednou (+), libovolněkrát (*).

    ☞ Typy atributů CDATA, NMTOKEN, NMTOKENS, ID , IDREF,IDREFS, ENTITY, ENTITIES , vý čet .

    ☞ Implicitní hodnoty atributů: "hodnota" , #REQUIRED,#IMPLIED , #FIXED "hodnota" .

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    36Entity

    ☞ Vhodné pojmenovat části a fragmenty SGML, některéřetězce (&TeX; v IS) a znaky použité jako oddělovačev gramatice: < , & , " .

    ☞ Entity interní textové, externí textové, externí binární aparametrické.

    ☞ Příklad množiny interních textových entit: ISO Latin216.

    ...

    ☞ Externí textové entity:

    ☞ Externí binární entity:16ftp://ftp.ifi.uio.no/pub/SGML/ENTITIES/ISOlat2

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    37

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    38Další p říklady DTD

    ☞ DTD diplomové práce O .

    ☞ DTD informací o studijním předmětu O .

    ☞ DTD rozvrhu.

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    39Připojení DTD k instanci dokumentu

    ☞ Odkazem na soubor:

    ...

    ☞ DTD součástí dokumentu:

    dodavatel, polozka+)>...]> ...

    ☞ Veřejný identifikátor PUBLIC s URL:

    V případě veřejného identifikátoru je mapování odřetězce k souboru určeno tzv. katalogem (proměnnáokolí SGMLCATALOGFILES či XML CATALOGFILES ).

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    40Příklad SGML dokumentu

    Ferda PistoriusBoubín 772862667777 291-2862667777

    Hynek BednaMáchovo jezero 782862467777 291-2862467777

    XML editor500

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    41Pohledy na SGML

    ☞ Lexikální pohled : SGML dokument je řetěz znaků,z nichž některé jsou data a některé odd ělova če,značky.

    Úvod do SGMLSGML: hlavní principyZobecn ěné zna čkování

    Základem ......

    ☞ Syntaktický pohled : SGML dokument má tři části:SGML deklaraci (instrukce pro SGML parser), DTD(gramatiku jazyka) a vlastní instanci dokumentu(v tomto jazyce). Instance dokumentu obsahuje data aznačky vyhovující DTD. Tento pohled vytváří parserz lexikálního pohledu.

    ☞ Pohled hierarchie objektů : SGML dokument jeuspořádaná hierarchie (obvykle stromová struktura)objektů s obsahem (elementů ). Elementy mají atributy,obsah a další vlastnosti. O

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    42☞ Entitn ě-strukturní pohled : SGML dokument je

    vnořená kolekce entit . Většina entit je pojmenovaných.Textové entity mohou odkazovat na další entity,zatímco datové entity obsahují libovolná data.

    ☞ Aplika ční pohled : SGML dokument je cokoli, co autorchce aby jím bylo. Data belongs to whoever creates it,and you get to decide what’s important about your owndata.

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    43SGML – validace a parsing

    ☞ Validace. Parsery. SP a sgmls/nsgmls Jamese Clarka17.

    ☞ Výstup parseru: Element Structure Information Set(ESIS) formát.

    ☞ Ukázky validace, chyb, ladění, ESIS.

    ☞ Třídy dokumentů. CATALOG./packages/share/sgml-catalogs/

    ☞ Další příklady DTD – informace o studijnímpředmětu. O

    17http://www.jclark.com

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    44Vytvá ření zna čkovaných dokumentů

    ☞ Běžný ascii editor (emacs, joe nebo i notepad ).

    ☞ PSGML mód emacsu: příklad stránky předmětu.

    ☞ Komerční systémy: Arbortext (Epic), SoftQuad, CorelXMetal . . .

    ☞ (X)HTML svět: Mozilla/Firefox, MSIE, Amaya,HomeSite, Netscape, FrontPage, . . .

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    45Značkovací jazyky na Internetu – vývoj

    ☞ 3/1989: návrh projektu World Wide Web, TimBerners-Lee, CERN

    ☞ 12/1990: návrh HTML DTD, první Web software podNExT

    ☞ 1991: první WWW prohlížeč pro omezené užití

    ☞ 1992: CERN začíná propagovat WWW projekt

    ☞ 2/1993: NCSA zveřejňuje alfa verzi prohlížeče Mosaic/XMarca Andreesena

    ☞ 7/1993: HTML 1.0 specifikace (Hypertext MarkupLanguage) (RFC 1866) jako Internet draft pracovnískupinou IETF/IIR (Internet Engineering Task ForceInternet Information Resources): dokumentový jazykdefinovaný pomocí SGML užívaný na WWW.

    ☞ 9/1993: Mosaic pro PC, MAC a X-Window

  • Petr Sojka: Elektronická příprava dokumentů2. přednáška PB029, 26. 9. 2011, Brno c© Petr Sojka, 2000–2011

    46☞ 11/1993: Dave Raggett (HP) navrhuje HTML specifikaci

    s formuláři, tabulkami a rovnicemi

    ☞ 4/1994: HTML DTD test suite (Dan Connolly)

    ☞ 6/1994: MIT/CERN vytváří organizaci W3

    ☞ 6/1994: IETF vytváří pracovní skupinu HTML a HTML2.0 specifikaci

    ☞ 11/1994: volně šířený prohlížeč Netscape 1.0

    ☞ 4/1995: Netscape Navigator 1.1

    ☞ 5/1995: Netscape a Sun se dohodli na podpoře Javy

    ☞ . . . World Wide Web Consortium (W3C).

    ☞ XML/XHTML, MathML.

  • Petr Sojka: Elektronická příprava dokumentů3. přednáška PB029, 3. 10. 2011, Brno c© Petr Sojka, 2000–2011

    47Výměna dokumentů na Internetu

    ☞ Identifikace dokumentů na Internetu: Uniform ResourceLocator/Identifier/Name (URL/URI/URN18).

    ☞ URN: URI, kdy organizace zajištuje trvalost odkazů(typicky překladovou službou).

    ☞ metoda://server[:port]/cesta/soubor[#kotva]

    ☞ Http, https, mailto, news, file, ftp, gopher, rlogin, telnet,tn3270, wais.

    ☞ Klient/server; http, https server.

    ☞ Klienti: Google Chrome, Firefox 6/Mozilla/NetscapeNavigator, MS Internet Explorer, Opera, Galeon,Konqueror, Lynx, Mosaic, Amaya, HotJava, . . .

    ☞ Různé módy renderování v posledních verzíchprohlížečů: zpětně kompatibilní (quirk mode) astandardy W3C dodržující (standard mode).

    ☞ Servery: Apache, Netscape Commerce, MS IIS, NCSA.

    18http://www.w3.org/Addressing/#terms

  • Petr Sojka: Elektronická příprava dokumentů3. přednáška PB029, 3. 10. 2011, Brno c© Petr Sojka, 2000–2011

    48Osnova dnešní p řednášky

    ➀ Agenda (úkoly do cvičení, prém. úkoly, bak. práce,. . . ).

    ➁ Aplikace SGML: HTML, XHTML.

    ➂ XML? XML!

    ➃ WML.

    ➄ ISO/IEC 10646, Unicode.

    ➅ Formáty a normy související s XML (XLink, XPointer,RDF, XTM). AJAX. DOM.

    ➆ Návrh/design (webový): úvod.

  • Petr Sojka: Elektronická příprava dokumentů3. přednáška PB029, 3. 10. 2011, Brno c© Petr Sojka, 2000–2011

    49Dokumentové jazyky založené na SGML

    ☞ Nejrozšířenější je HTML.

    ☞ Vývoj HTML – různá fixní DTD (jedné třídy dokumentů).

    ☞ Koordinace W3C, velké nekompatibilní odchylkyvelkých firem, problémy s validací.

    ☞ DocBook DTD: svět Linuxu, dokumentace, knihy(O’Reilly, Kosek, Safari online).

    ☞ Další rozšířené dokumentové jazyky: TEI (TextEncoding Initiative) DTD.

    ☞ Rainbow DTD: formalizace RTF pro konverze z Wordu.

    ☞ WML (WAP), CALS, MATHML, TEXML, . . .

  • Petr Sojka: Elektronická příprava dokumentů3. přednáška PB029, 3. 10. 2011, Brno c© Petr Sojka, 2000–2011

    50Proč XML? Desatero cílů.

    XML (Extensible Markup Language) – zjednodušenáverze SGML optimalizovaná pro použití na Internetuvyvíjená konsorciem W3C19. Desatero cílů:

    ☞ Přímočaré použití na Internetu.

    ☞ Široké spektrum použití/aplikací.

    ☞ Kompatibilita s SGML.

    ☞ Snadnost vytváření programů pro práci s XML.

    ☞ Absolutní minimum či absence volitelných rysů XML.

    ☞ Čitelnost a jasnost.

    ☞ Rychlost návrhu.

    ☞ Formální popis a návrh.

    ☞ Snadnost vytváření XML dokumentů.19http://www.w3.org

  • Petr Sojka: Elektronická příprava dokumentů3. přednáška PB029, 3. 10. 2011, Brno c© Petr Sojka, 2000–2011

    51☞ Úsečnost zápisu není důležitá.

  • Petr Sojka: Elektronická příprava dokumentů3. přednáška PB029, 3. 10. 2011, Brno c© Petr Sojka, 2000–2011

    52XML? XML! Nikdy není pozd ě!

  • Petr Sojka: Elektronická příprava dokumentů3. přednáška PB029, 3. 10. 2011, Brno c© Petr Sojka, 2000–2011

    53Co je to XML?

    ☞ Doporučení W3C20: rozšiřitelný značkovací (meta)jazyk.

    ☞ Univerzální a otevřený formát pro reprezentaci (avýměnu) téměř libovolné datové struktury – dat idokumentů. Násobné a opakované použití jakou SGML.

    ☞ Celá sada technologií a formátů s XML souvisejících(XPointer, XLink, XSL) pro elektronickou výměnu dat (adokumentů).

    20http://www.w3.org/TR/REC-xml

  • Petr Sojka: Elektronická příprava dokumentů3. přednáška PB029, 3. 10. 2011, Brno c© Petr Sojka, 2000–2011

    54Vymezení XML

    ☞ Odlišení od HTML: rozšiřitelnost, možnost změnsémantiky značek. XML nespecifikuje ani sémantiku,ani množinu značek, umožňuje však značky definovat adefinovat jejich strukturální závislosti. Sémantiku určujíaplikace (webové prohlížeče jsou jedny z nich).

    ☞ Odlišení od SGML: zjednodušeně řečeno XML je SGMLs restrikcemi. Odchylky jsou minimální (chovánímezery).

    ☞ Technický úvod do XML Normana Walshe21.

    21http://www.xml.com/xml/

  • Petr Sojka: Elektronická příprava dokumentů3. přednáška PB029, 3. 10. 2011, Brno c© Petr Sojka, 2000–2011

    55Syntaxe XML

    ☞ Slabší pojem než validita: správná strukturovanost(well-formed ).

    ☞ Správně strukturovaný dokument by měla zpracovatkaždá XML aplikace.

    ☞ Validátory SGML umí obvykle i XML.

    ☞ Parsery: nsgmls, msxml, xerces, xmllint, . . .

    ☞ Sekce CDATA pro pohodlnější psaní části dokumentůobsahujících významné znaky:

    (1 < 2) & 2 = 1000 x 1]]>

  • Petr Sojka: Elektronická příprava dokumentů3. přednáška PB029, 3. 10. 2011, Brno c© Petr Sojka, 2000–2011

    56XML deklarace

    ☞ Musí být na prvním řádku dokumentu.

    ☞ Při standalone yes není třeba číst externí DTD.

  • Petr Sojka: Elektronická příprava dokumentů3. přednáška PB029, 3. 10. 2011, Brno c© Petr Sojka, 2000–2011

    57Instrukce pro zpracování

    Pokyny (procesní instrukce) pro specifické aplikace:

    nebo

    či

  • Petr Sojka: Elektronická příprava dokumentů3. přednáška PB029, 3. 10. 2011, Brno c© Petr Sojka, 2000–2011

    58XHTML? XHTML!

    ☞ Postupný přechod z HTML: XHTML22, reformulaceHTML jako modulární XML aplikace.

    ☞ XHTML čtou všechny XML-kompatibilní aplikace, azároveň je možno psát dob ře zformované(well-formed) dokumenty již nyní.

    ☞ Příklad XHTML dokumentu:

    simple document

    a simple paragraph

    22http://www.xhtml.org

  • Petr Sojka: Elektronická příprava dokumentů3. přednáška PB029, 3. 10. 2011, Brno c© Petr Sojka, 2000–2011

    59MathML: zna čkování matematiky na Webu

    ☞ MATHML23 2.0 (Mathematical Markup Language) –doporučení W3C. XML slovník/aplikace pro popismatematiky (struktury formulí i prezentačních forem).

    ☞ Příklad: kubickou křivku formalizovat pro dalšízpracování (vykreslení křivky, integrace, . . . ) na základěXML kódu:

    x3

    ☞ Použití jak pro sazbu, tak pro výpočet v systémech jakoje Mathematica: přímočaré odlišení víceznačností:diferenciál x od proměnné dx a součinu proměnných dx.

    23http://www.w3.org/Math/

  • Petr Sojka: Elektronická příprava dokumentů3. přednáška PB029, 3. 10. 2011, Brno c© Petr Sojka, 2000–2011

    60☞ Nativní podpora MathML od Mozilly 1.1. Renderovací

    stroj MathML pro MSIE: MathPlayer24. TechexplorerIBM25: plug-in pro Navigator a MSIE pro renderováníTEXu, LATEXu a MathML.

    ☞ Možnosti výpočtů, validace, renderování naMathMLcentral26.

    24http://www.dessci.com/webmath/mathplayer/25http://www.ibm.com/software/techexplorer/26http://www.mathmlcentral.com

  • Petr Sojka: Elektronická příprava dokumentů3. přednáška PB029, 3. 10. 2011, Brno c© Petr Sojka, 2000–2011

    61WML

    ☞ WML (Wireless Markup Language) je jazyk dokumentů,které jsou zobrazitelné na displejích mobilních telefonů:jsou dostupná DTD27.

    ☞ Průmyslová asociace WAPFORUM28. (1997, Nokia,Ericsson, Motorola, Unwired Planet).

    ☞ WAP (Wireless Application Protocol) – komunikačníprotokol pro přenos informací z Internetu na mobilnízařízení. resp./packages/share/sgml-catalogs/WML .

    ☞ WAP browsery: CCWAP29, Nokia browser, WINWAP, . . .

    ☞ Více paměti, silnější procesory: přechod na XHTML?

    27http://www.wapforum.org/DTD/28http://www.wapforum.org29http://www.ccwap.com

  • Petr Sojka: Elektronická příprava dokumentů3. přednáška PB029, 3. 10. 2011, Brno c© Petr Sojka, 2000–2011

    62Příklad WML dokumentu

    I am learning the basics of WML.

  • Petr Sojka: Elektronická příprava dokumentů3. přednáška PB029, 3. 10. 2011, Brno c© Petr Sojka, 2000–2011

    63WML – pokra čování

    ☞ Konfigurace http serveru pro WML: do souboru~/.htaccess je třeba přidat:

    addtype text/vnd.wap.wml Wmladdtype Application/vnd.wap.wmlc Wmlcaddtype text/vnd.wap.wmlscript Wmlsaddtype Application/vnd.wap.wmlscriptc Wmlscaddtype image/vnd.wap.wbmp wbmp

    ☞ Prohlížení většinou pomocí apletů v prohlížeči,vývojová prostředí např. EasyPad Waptor30.

    30http://www.yourwap.com

  • Petr Sojka: Elektronická příprava dokumentů4. přednáška PB029, 10. 10. 2011, Brno c© Petr Sojka, 2000–2011

    64Domácí úkoly (do cvi čení 4)

    ☞ Do cvičení 4: Přinést si neznačkovaný text pro sazbutištěného dokumentu do čtyř stran A4, t.j. cca osmnormostran textu.

    ☞ Dovalidovat český html dokument pomocí nsgmls.

    ☞ Možná prémiová úloha: navštívit Invex, vystavit na svéstránce předmětu validní stránečku o zajímavostech zesvěta EDP a poreferovat v pěti větách/bodech nacvičení.

  • Petr Sojka: Elektronická příprava dokumentů4. přednáška PB029, 10. 10. 2011, Brno c© Petr Sojka, 2000–2011

    65Technologie a formáty související s XML

    ☞ ISO/IEC 10646-1 Unicode.

    ☞ XLink, XPointer, XPath. XQuery.

    ☞ RDF (Resource Description Framework) – metadata naWWW.

    ☞ CSS.

    ☞ XSL, XSL-FO.

    ☞ SVG.

  • Petr Sojka: Elektronická příprava dokumentů4. přednáška PB029, 10. 10. 2011, Brno c© Petr Sojka, 2000–2011

    66ISO/IEC 10646-1 standard

    ☞ Mezinárodní ISO standard ISO/IEC 10646-1, 1993:Universal Multiple-Octet Coded Character Set(UCS).

    ☞ První standard s ambiciózním cílem obsahovat všechnyznaky používané v psaných jazycích, včetněmatematických a dalších symbolů.

    ☞ Jednotné kódování, sekvence 16bitové (UCS-2, 65 536pozic), nebo 31bitové (UCS-4, 2 147 483 648 pozic):proto multi-octet .

    ☞ Jazykově neutrální, zrušení předpokladů ekvivalenceznaků a glyfů, neproporcionality hladkého textu.

    ☞ Kritériem přidání znaku je odlišnost ve významu i tvaru(CJK unifikace). Výjimky: Latin P, Greek P (capital rho),Cyrillic P (R).

    ☞ Struktura kódového prostoru UCS-2 (256 skupin po256 buňkách), Basic Multilingual Plane (BMP).

  • Petr Sojka: Elektronická příprava dokumentů4. přednáška PB029, 10. 10. 2011, Brno c© Petr Sojka, 2000–2011

    67☞ Privátní zóny pro privátní použití aplikací.

    ☞ Implementační úrovně 1–3; příklad dánského “A withring above and acute accent”: 01FA reprezentacepoužitá v úrovních 1 a 2: jeden složený znak; 00C50301 “A with ring above” + combining acute accentnebo 0041 030A 0301 “A” + combining ring above +combining acute accent : program implementujícístandard úrovně 3 musí být schopen zpracovat tytokompozitní sekvence stejně jako výše uvedenoureprezentaci.

  • Petr Sojka: Elektronická příprava dokumentů4. přednáška PB029, 10. 10. 2011, Brno c© Petr Sojka, 2000–2011

    68Unicode konsorcium, znaková sada Unicode

    ☞ Unicode Consortium 31 je nevýdělečná organizace,založená 1989 pro vývoj, rozšiřování a podporupoužívání Unicode Standardu. Členové konsorciapředstavují široké spektrum korporací a organizacív průmyslu počítačů a informačních technologií.Konsorcium je finančně podporováno pouze členskýmipoplatky.

    ☞ Respektuje ISO.

    ☞ Unicode: sada znaků specifikovaná konsorciemUnicode.

    ☞ Databáze znaků32 poskytovaná konsorciem (k 10/2009verze Unicode 5.2.0) či přehledné tabulky znaků33.

    ☞ Znak s libovolným kódem z ISO 10646 můžeme zapsatpomocí entity kod (kod je v desítkové soustavě)nebo kod (kod je šestnáctkově): code points0–10FFFF16.

    31htpp://www.unicode.org/32http://www.unicode.org/Public/UNIDATA/33http:/www.unicode.org/charts/

  • Petr Sojka: Elektronická příprava dokumentů4. přednáška PB029, 10. 10. 2011, Brno c© Petr Sojka, 2000–2011

    69☞ Jednoznačný trend použití pro rozšíření na WWW, v OS

    [cut & paste], značkovacích i programovacích jazycích.

  • Petr Sojka: Elektronická příprava dokumentů4. přednáška PB029, 10. 10. 2011, Brno c© Petr Sojka, 2000–2011

    70UCS a přenos znaků

    ☞ UCS-4 resp. UCS-2 “Universal Character Set coded in4 resp. 2 octets”.

    ☞ UCS-2 pouze pro BMP (two-octet BMP form).

    ☞ Problémy s přímým přenosem textů v UCS (prostorověneefektivní) → transformační/kódovací metody UTF-8,UTF-7, UTF-16.

    ☞ UTF-8: znaky ASCII nahrazeny byty hex 00-7F. Ostatníznaky nahrazeny dvěma až šesti byty hex 80-FF.

    ☞ UTF-16 16bitové slovo obsahuje kód znaku, rozšíření:1 znak zabere dvě 16bitová slova.

    ☞ UTF-7: pro SMTP protokol; kódovány i speciální znakyASCII. Specifikovaný IETF, Internet Engineering TaskForce, a formálně nesouvisející s ISO/IEC 10646.Výsledkem je text neobsahující kontrolní znaky a znakynad 7F.

    ☞ Detaily a přehled34.

    34http://www.nada.kth.se/i18n/ucs/unicode-iso10646-oview.html

  • Petr Sojka: Elektronická příprava dokumentů4. přednáška PB029, 10. 10. 2011, Brno c© Petr Sojka, 2000–2011

    71XPointer a XLink

    “Only connect! That was the whole of the sermon”E. M. Forster, (1879–1970)

    Doporučení XLink35 XML Linking Language a draftXPointer36 XML Pointer language pro specifikaci vazebmezi XML dokumenty nebo jejich částmi.

    ☞ Zobecnění hypertextového odkazu známého z HTML,„zpětná kompatibilita“.

    ☞ Odkazy mezi více zdroji.

    ☞ Doplnění odkazů o metadata.

    ☞ Odkazy je možno uložit mimo odkazované dokumenty.

    ☞ Xpointer: přesné určení místa ve zdroji, případně výběrjeho části.

    ☞ Odkazy se vytvářejí pomocí elementů a atributůpatřících do jmenného prostoruhttp://www.w3.org/1999/xlink.

    35http://www.w3.org/TR/xlink/36http://www.w3.org/TR/2001/WD-xptr-20010108/

  • Petr Sojka: Elektronická příprava dokumentů4. přednáška PB029, 10. 10. 2011, Brno c© Petr Sojka, 2000–2011

    72

    Domovina PB029

  • Petr Sojka: Elektronická příprava dokumentů4. přednáška PB029, 10. 10. 2011, Brno c© Petr Sojka, 2000–2011

    73RDF

    ☞ RDF37 (Resource Description Framework) – metadatana WWW.

    ☞ Model pro reprezentaci pojmenovaných vlastností areprezentaci hodnot.

    ☞ Krok k sémantickému Webu?

    ☞ RDF validátor38:

    PB029 Elektronická p říprava dokumentůStránky p ředmětu PB029

    vyu čovaného Petrem Sojkou na FI MU v Brn ě, CZ.Petr SojkaPetr Sojka2005-10-03text/htmlcs

    37http://www.w3.org/RDF/38http://www.w3.org/RDF/Validator/

  • Petr Sojka: Elektronická příprava dokumentů4. přednáška PB029, 10. 10. 2011, Brno c© Petr Sojka, 2000–2011

    74Závěrem k etap ě o značkování

    Trendy:

    ☞ Rozhraní a služby na Webu: SOAP, UDDI, WSDL,XLANG/XAML, XKMS.

    ☞ Sémantický web, ontologie: formální vyjádření sdílenékonceptualizace daného oboru. Použití pro přesnějšívyhledávání, Google.

    ☞ XML a navazující technologie, Topic Maps (ISO/IEC13250) mapy témat, XTM 1.039. Unicode.

    ☞ Výměna dokumentů/dat v heterogenním prostředí:B2B, B2C.

    ☞ SMIL (Synchronized Multimedia Integration Language)pro interaktivní multimédia na Webu.

    39http://www.topicmaps.org/xtm/1.0/

  • Petr Sojka: Elektronická příprava dokumentů4. přednáška PB029, 10. 10. 2011, Brno c© Petr Sojka, 2000–2011

    75☞ Další zdroje, odkazy a literatura je na stránce předmětu

    (Kosek40, xml.com41, zvon.org42, W3C43, . . . ).

    40http://www.kosek.cz41http://www.xml.com42http://www.zvon.org43http://www.w3c.org/

  • Petr Sojka: Elektronická příprava dokumentů4. přednáška PB029, 10. 10. 2011, Brno c© Petr Sojka, 2000–2011

    76Kaskádové styly

    “The Web is Ruined and I Ruined It!44”David Siegel45

    ☞ Informační web – výhody strikního oddělení obsahu aformy: kaskádové styly 46. CSS, CSS247 (1998),CSS348.

    ☞ Jazyk stylů má formální gramatiku49, proto je možnávalidace CSS50.

    44http://www.webreview.com/1997/04 11/webauthors/04 11 97 1.shtml45http://www.dsiegel.com46http://www.w3.org/Style/47http://www.w3.org/TR/REC-CSS2/48http://www.w3.org/TR/css3-roadmap/49http://www.w3.org/TR/REC-CSS2/grammar.html50http://jigsaw.w3.org/css-validator/

  • Petr Sojka: Elektronická příprava dokumentů4. přednáška PB029, 10. 10. 2011, Brno c© Petr Sojka, 2000–2011

    77Zpracování dokumentu s kaskádovými styly

    ☞ Parsing a vytvoření stromu dokumentu.

    ☞ Identifikace výstupního za řízení .

    ☞ Stažení všech stylů souvisejících s vybranýmvýstupním zařízením.

    ☞ Přiřazení hodnot všem vlastnostem výstupníhozařízení, použitím pravidel dědi čnosti a kaskádování .

    ☞ Pravidlo: selektor a deklarace .

    BODY font-size: 10ptH1 font-size: 120%

    ☞ Kaskáda pravidel: autor (ve stránce), uživatel,uživatelův agent (nejnižší váha).

    ☞ Nejvyšší váhu má implicitně autor, uživatel ji ale můžepřebít (!important ).

  • Petr Sojka: Elektronická příprava dokumentů4. přednáška PB029, 10. 10. 2011, Brno c© Petr Sojka, 2000–2011

    78Vytvá ření kaskádového stylu

    ☞ Koskův článek o dynamickém HTML51.

    ☞ Kuchařka Dave Raggetta52.

    ☞ Příklady webů pánů Staníčka, Pecháčka53, Řezáče54 čiKacvinského.

    51http://www.kosek.cz/clanky/dhtml/styly.html52http://www.w3.org/MarkUp/Guide/Style53http://www.y3k.cz/epd/54http://www.fi.muni.cz/

  • Petr Sojka: Elektronická příprava dokumentů4. přednáška PB029, 10. 10. 2011, Brno c© Petr Sojka, 2000–2011

    79Příklad CSS2

    BODY padding: 8px; line-height: 1.33H1 font-size: 2em; margin: .67em 0H2 font-size: 1.5em; margin: .83em 0H3 font-size: 1.17em; margin: 1em 0H4, P,BLOCKQUOTE, UL,FIELDSET, FORM,OL, DL, DIR,MENU margin: 1.33em 0H5 font-size: .83em; line-height: 1.17em; margin: 1.67em 0H6 font-size: .67em; margin: 2.33em 0H1, H2, H3, H4,H5, H6, B,STRONG font-weight: bolderBLOCKQUOTE margin-left: 40px; margin-right: 40px

    I, CITE, EM,VAR, ADDRESS font-style: italicPRE, TT, CODE,KBD, SAMP font-family: monospacePRE white-space: preBIG font-size: 1.17emSMALL, SUB, SUP font-size: .83emSUB vertical-align: subSUP vertical-align: superS, STRIKE, DEL text-decoration: line-throughHR border: 1px insetOL, UL, DIR,MENU, DD margin-left: 40pxOL list-style-type: decimalOL UL, UL OL,UL UL, OL OL margin-top: 0; margin-bottom: 0U, INS text-decoration: underlineCENTER text-align: centerBR:before content: "\ A"

  • Petr Sojka: Elektronická příprava dokumentů4. přednáška PB029, 10. 10. 2011, Brno c© Petr Sojka, 2000–2011

    80

    / * An example of style for HTML 4.0’s ABBR/ACRONYM elements * /

    ABBR, ACRONYM font-variant: small-caps; letter-spacing: 0.1emA[href] text-decoration: underline:focus outline: thin dotted invert

    @media print@page margin: 10%H1, H2, H3,H4, H5, H6 page-break-after: avoid; page-break-inside: av oidBLOCKQUOTE,PRE page-break-inside: avoidUL, OL, DL page-break-before: avoid

    @media speechH1, H2, H3,H4, H5, H6 voice-family: paul, male; stress: 20; richness: 9 0H1 pitch: x-low; pitch-range: 90H2 pitch: x-low; pitch-range: 80H3 pitch: low; pitch-range: 70H4 pitch: medium; pitch-range: 60H5 pitch: medium; pitch-range: 50H6 pitch: medium; pitch-range: 40LI, DT, DD pitch: medium; richness: 60DT stress: 80PRE, CODE, TT pitch: medium; pitch-range: 0; stress: 0; rich ness: 80EM pitch: medium; pitch-range: 60; stress: 60; richness: 50STRONG pitch: medium; pitch-range: 60; stress: 90; richnes s: 90DFN pitch: high; pitch-range: 60; stress: 60S, STRIKE richness: 0I pitch: medium; pitch-range: 60; stress: 60; richness: 50B pitch: medium; pitch-range: 60; stress: 90; richness: 90U richness: 0A:link voice-family: harry, maleA:visited voice-family: betty, femaleA:active voice-family: betty, female; pitch-range: 80; pi tch: x-high

  • Petr Sojka: Elektronická příprava dokumentů4. přednáška PB029, 10. 10. 2011, Brno c© Petr Sojka, 2000–2011

    81XSL, XSLT, XSL-FO

    “Use CSS when you can, use XSL when you must.”W3C

    ☞ Proč XSL? CSS nebo XSL55?

    ☞ XSLT – transformační jazyk XSL.

    ☞ XSL-FO – formátovací objekty XSL.55http://www.w3.org/Style/CSS-vs-XSL

  • Petr Sojka: Elektronická příprava dokumentů4. přednáška PB029, 10. 10. 2011, Brno c© Petr Sojka, 2000–2011

    82

  • Petr Sojka: Elektronická příprava dokumentů4. přednáška PB029, 10. 10. 2011, Brno c© Petr Sojka, 2000–2011

    83Dynamické HTML

    ☞ Skriptování na straně klienta (JavaScript, standardECMAScript; VBScript).

    ☞ Skriptování na straně serveru. CGI skripty (Perl, PHP).

    ☞ API: Objektový model dokumentu W3C DOM.

    ☞ DHTML vs. Java.56

    ☞ Sada technologií AJAX (Asynchronous JavaScript andXML).

    56http://www.kosek.cz/clanky/dhtml/index.html

  • Petr Sojka: Elektronická příprava dokumentů4. přednáška PB029, 10. 10. 2011, Brno c© Petr Sojka, 2000–2011

    84WWW design

    „Já věřím tomu, co je vytištěno černou barvou na papíře.Média jsou pro okultisty.“

    František Štorm, 1. střešovická písmolijna

    ☞ Design dokumentu je závislý na přenosovém médiu(pravidla pro knižní design pro WWW design vesměsneplatí ). Nutno proto mít různé verze dokumentů prorůzná média.

    ☞ Specifika WWW: čtení na obrazovce počítače (poměrstran, rozlišení), různé „oči“ (prohlížeče), různá„viditelnost/osvětlení“ (tloušt’ka/rychlost linky sít’ovéhopřipojení), snadnost vyjádření struktury, vazeb(hypertext, nelineárnost).

    ☞ Informační × prezentační web.

  • Petr Sojka: Elektronická příprava dokumentů4. přednáška PB029, 10. 10. 2011, Brno c© Petr Sojka, 2000–2011

    85Kucha řka dobrého WWW designu

    ☞ Web není WYSIWYG (návrhář nezná předem čtenářovanastavení).

    ☞ Klíčem k úspěchu je originální obsah.

    ☞ Vytváření stránek se liší od zpracování textu.

    ☞ HTML/XHTML/XML je strukturální jazyk.

    ☞ Ne každý uživatel má grafického klienta nebo funkčnízrak.

    ☞ Většina skvělých triků není až tak skvělá (zmenšujíčtenářskou obec).

    ☞ Důležité je časování (čtenář a jeho konektivita se mění,špičkové věci rychle zastarávají).

    ☞ Dodržování standardů – statistika není argument pronekorektní stránky.

    ☞ Uživatelé mají rádi rychlé stránky.

  • Petr Sojka: Elektronická příprava dokumentů4. přednáška PB029, 10. 10. 2011, Brno c© Petr Sojka, 2000–2011

    86☞ Kontrolujte se.

  • Petr Sojka: Elektronická příprava dokumentů4. přednáška PB029, 10. 10. 2011, Brno c© Petr Sojka, 2000–2011

    87Desatero WWW designu

    ☞ Thou shalt put no page element before Content, forContent is thy lord and It is a jealous lord.

    ☞ Thou shalt make thy webpages to load quickly.

    ☞ Thou shalt respect the trademarks, copyrights, andreputation of thy neighbor.

    ☞ Thou shalt use graphics and animations that arerelevant and meaningful, and thou shalt not scatterthem carelessly as birds scatter seeds on hard ground.

    ☞ Thou shalt not resize thy neighbor’s browser windownor shall thou disrupt the function of thy neighbor’s"back" button nor shall thou force text to a size that isunreadably small on thy neighbor’s 1280x1024 display.

    ☞ If thou art inspired to create a webpage of lasting value,then thou shalt make it in such a manner so that thyneighbor may bookmark or print it. Twould be evenbetter if he could do both.

  • Petr Sojka: Elektronická příprava dokumentů4. přednáška PB029, 10. 10. 2011, Brno c© Petr Sojka, 2000–2011

    88☞ Thou shalt make the elements which must be seen and

    comprehended first so that they load first.

    ☞ Thou shalt use text for text and graphics for graphicsand never graphics where text is appropriate, underthreat of banishment to the pit of darkness wheresearches and indexes are unknown.

    ☞ Thou shalt make thy pages to be both standardscompliant and backwards compatible, but wherebackward compatibility shall cause the page to loadslowly, thou shalt leave those with weak and oldbrowsers in the wilderness they have chosen for theirhome.

    ☞ Thou shalt not steal bandwidth by including images orother objects housed on thy neighbor’s website on thyown pages, nor shalt thou place thy neighbor’s websitein a frame on thy page. In all things remember to treatthy neighbor’s website as thou wouldst have him or hertreat thine.

  • Petr Sojka: Elektronická příprava dokumentů4. přednáška PB029, 10. 10. 2011, Brno c© Petr Sojka, 2000–2011

    89Chyby návrhu WWW stránek

    ☞ Chybějící navigační podpora.

    ☞ Nekonzistence (nejednotnost) a přeplácanost.

    ☞ Příliš pomalá doprava.

    ☞ Osiřelé stránky.

    ☞ Dlouhé, těžké stránky.

    ☞ Zastaralé informace.

    ☞ Nadužívání nejmodernějších technologií.

    ☞ Pohyb bez příčiny.

    ☞ Složitá URL.

    ☞ Nestandardní barvy odkazů.

    ☞ Používání rámů57.57http://www.useit.com/alertbox/9612.html

  • Petr Sojka: Elektronická příprava dokumentů4. přednáška PB029, 10. 10. 2011, Brno c© Petr Sojka, 2000–2011

    90Odkazy k technologiím na webu

    ☞ Weby W3C58, OASIS59.

    ☞ V češtině například Koskovy články60, W3Schools61

    nebo tutoriály na Živě62.

    ☞ Knihy Jacoba Nielsena, Davida Siegela, Pavla Satrapyči Petra Staníčka.

    58http://www.w3c.com59http://www.oasis-open.org/cover/sgml-xml.html60http://www.kosek.cz61http://www.w3schools.com/62http://www.zive.cz/H/Developerdaily/

  • Petr Sojka: Elektronická příprava dokumentů4. přednáška PB029, 10. 10. 2011, Brno c© Petr Sojka, 2000–2011

    91Budoucnost WWW (designu)

    ☞ ???

    ☞ Různá kódování (češtiny) −→ Unicode.

    ☞ Standardy W3C: SVG, XML/RDF, XLink, Xpointer,XTM, . . .

    ☞ Závislosti časové (SMIL?).

    ☞ Závislosti na výstupním zařízení (PDA a WAP[640 × 260], multimédia). XSL? XSL!

    ☞ Dynamické stránky (AJAX, Java, Flash, CGI skripty,výhody a nevýhody).

    ☞ DOM (Document Object Model).

    ☞ Napojení na databáze, PHP, ASP.

    ☞ VRML (Virtual Reality Markup Language),multimodalita.

  • Petr Sojka: Elektronická příprava dokumentů5. přednáška PB029, 17. 10. 2011, Brno c© Petr Sojka, 2000–2011

    92☞ Velikost dat (obrázky, rozlišení), rychlost linek.

    ☞ Worth world wide web: Dogma W463?

    63http://www.pixy.cz/dogmaw41/

  • Petr Sojka: Elektronická příprava dokumentů6. přednáška PB029, 25. 10. 2011, Brno c© Petr Sojka, 2000–2011

    93Webmastering v praxi (Kacvinský)

    ☞ Technologie pro webové publikování

    ☞ Javaskriptové platformy

    ☞ AJAX, HTML5

  • Petr Sojka: Elektronická příprava dokumentů6. přednáška PB029, 25. 10. 2011, Brno c© Petr Sojka, 2000–2011

    94Osnova dnešní p řednášky

    ☞ Agenda

    ☞ Design tištěného. Typografické tradice, cyklus přípravydokumentů

    ☞ Základy návrhu publikací knižního typu

    ☞ Sazba, základní pojmy, písma

    ☞ Typografická pravidla pro české texty

    ☞ Principy návrhu knih

    ☞ Sazba, sázecí systémy

    ☞ Základy typografie

  • Petr Sojka: Elektronická příprava dokumentů6. přednáška PB029, 25. 10. 2011, Brno c© Petr Sojka, 2000–2011

    95Abstrakt

    V první části přednášky budou zmíněny základní zásadyčasto zcela absentující etapy přípravy dokumentů, a tonávrhu (knižních) dokumentů. Jádrem přednášky pakbude přehled typografických pravidel české sazby, které seustálily tradicí v průběhu minulých staletí, ale dnes příliščasto ctěny nejsou, zvláště v publikacích vznikajících nastole (DTP) příležitostných sazečů.„Rozhodně, prosím, opust’te vody nepoučených „nalévačů

    textu“ či „myšařů“ a začněte vyrábět sazbu, již je nejenradost číst, ale na níž i oko se zalíbením spočinouti může.“

    Michal Ptáček, 1995 (seriál v PC World)

  • Petr Sojka: Elektronická příprava dokumentů6. přednáška PB029, 25. 10. 2011, Brno c© Petr Sojka, 2000–2011

    96Principy návrhu knih

    “No, Watson, this was not done by accident, but by design.”Sherlock Holmes

    ☞ Generace návrhářů, typografů samouků; samozvanýchexpertů.

    ☞ Nejčastější chyba: instantní řešení, absence návrhu(designu ).

    ☞ Schopnost odlišovat dobrý návrh od špatného.

    ☞ Černobílost pohledu, protikladnost požadavků, výjimky.„Šaty dělaj’ člověka“.

    ☞ Knižní design: co je kniha; specifika?

    ❑ Poctivost obalu (na rozdíl od časopisu).❑ Vazba po blocích (na rozdíl od vazby na stříšku).

    ☞ Forma

    ❑ Jednotnost.❑ Přenos informace (raison d’être).❑ Struktura (rejstřík, obsah).

  • Petr Sojka: Elektronická příprava dokumentů6. přednáška PB029, 25. 10. 2011, Brno c© Petr Sojka, 2000–2011

    97Jednotnost (makrotypografie)

    ☞ Pravidelné šedivé mřížky (citlivost oka).

    ☞ Nezbytnost bílých míst (horror vacui), nesou informaci(oddělují, spojují)!

    ☞ Dvoustránka (double-spread), vyváženost, příkladvýjimky: zkrácení dvoustránky.

    ☞ Jednotnost umístění stránky, prvků ve stránce.

    ☞ Řádkový rejstřík (protisk!).

  • Petr Sojka: Elektronická příprava dokumentů6. přednáška PB029, 25. 10. 2011, Brno c© Petr Sojka, 2000–2011

    98Jednotnost (mikrotypografie)

    ☞ Mezipísmenný proklad.

    ☞ Mezerování (data, zkratky, sazba telefonních čísel,mezivětné mezery).

    ☞ Zavěšená interpunkce.

    ☞ Odstavcová odrážka.

    ☞ „Zákon malých celých čísel“.

  • Petr Sojka: Elektronická příprava dokumentů6. přednáška PB029, 25. 10. 2011, Brno c© Petr Sojka, 2000–2011

    99Přenos informace

    “Printing should be invisible.”M. Warde

    ☞ Spojitost nadpisu s následným textem.

    ☞ Spojitost popisky s tabulkou, obrázkem.

    ☞ Způsoby vyjádření vazeb, spojitostí, nebezpečí(duktus/velikost).

    ☞ Patkové, bezpatkové písmo. Střídmost.

    ☞ Čitelnost. Počet znaků na řádek.

    ☞ Velikosti stránek. Souhrn standardů – paskvil.

    ☞ Volba písem – střední výška písma.

  • Petr Sojka: Elektronická příprava dokumentů6. přednáška PB029, 25. 10. 2011, Brno c© Petr Sojka, 2000–2011

    100Struktura

    ☞ Obsah, seznamy tabulek, obrázků.

    ☞ Křížové odkazy, jednoúrovňové, dvojúrovňové(nepřímé).

    ☞ Rejstřík.

    ☞ Paginace, paginace vakátů.

    ☞ Spuštěné číslování na úvodních stránkách kapitol.

    ☞ Živá záhlaví, zápatí, co do nich (která úroveň nadpisů)?

    ☞ Zkracování nadpisů do záhlaví, číslování.

  • Petr Sojka: Elektronická příprava dokumentů6. přednáška PB029, 25. 10. 2011, Brno c© Petr Sojka, 2000–2011

    101Knižní design – praktické rady

    Stránka/dvoustránka – maketa

    ☞ Rozměry stránky: standardní velikosti (řada A, B,kvarto, folio, . . . ).

    ☞ Aspect ratio: poměr šířky k výšce; důvody:

    ❑ stabilnost držení v ruce (těžiště blíže než délkadlaně);

    ❑ počet znaků na řádku 40–70.

    ☞ Okraje: 1:6:2, 1:8:3, ořez, odpad (montáž), vazba,avantgardní design, marginálie jako prvek designu.

    ☞ Umístění stránky na listu: světlost záhlaví, zápatí.

    ☞ Symetrie a asymetrie.

    ☞ Mřížkový design.

  • Petr Sojka: Elektronická příprava dokumentů6. přednáška PB029, 25. 10. 2011, Brno c© Petr Sojka, 2000–2011

    102Písmo a rozpal

    ☞ Písmo, základní parametr návrhu.

    ❑ Konotace – klasická (Antikva) × avantgardní(Grotesk) písma.

    ❑ Čitelnost (patkové × bezpatkové).❑ Velikost (mladí × staří čtenáři).❑ Rodina (Times × Palatino), anamorfní zmenšení

    písma (na 24/25 ve vertikálním směru) v případěnutného přizpůsobení Computer Modern (Monotype8a), závisí na výstupním zařízení (kontrast mezitenkými a silnými liniemi).

    ❑ Základní velikost mezislovní mezery (řeky, řešenívýchodů kapitol).

    ❑ Jednotnost: řezy téže rodiny, i pro matematiku (zatímmalý výběr).

    ☞ Rozpal:

    ❑ 10/12, světlost, sazba na řádek;❑ typ textů (diplomová práce, inzerát).

  • Petr Sojka: Elektronická příprava dokumentů6. přednáška PB029, 25. 10. 2011, Brno c© Petr Sojka, 2000–2011

    103

    Číslování a řazení v knize

    i. patitul

    ii. vakát

    iii. titul

    iv. katalogizace publikace, copyright, [tiráž]

    v. předmluva k vydání

    vi. obecná předmluva

    vii. ditto, pokračování

    viii. vakát

    ix. obsah

    x. ditto, pokračování

    xi. slovníček

  • Petr Sojka: Elektronická příprava dokumentů6. přednáška PB029, 25. 10. 2011, Brno c© Petr Sojka, 2000–2011

    104xii. vakát

    1 první kapitola

    . . .

    [tiráž]

  • Petr Sojka: Elektronická příprava dokumentů6. přednáška PB029, 25. 10. 2011, Brno c© Petr Sojka, 2000–2011

    105Dobrý návrh nek ři čí

    “Good typography is not loud. A resonably appliedand readable type style is the first ingredient of goodcomposition. Today, asymmetric composition is certainlyfeasible, however, typography is intrinsically symmetrical.A text block without indents is unclear. Indents help thereader by reinforcing the logical order of the text. The besttypography is invisible to the reader and serves to transmitthe thoughts and intent of the author. Beautiful text, a textwell-composed, is legible. One of the highest virtues ofgood typography is its subtle elegance. It is not the dutyof the typographer to consciously display or emulate thestyle of current trends, nor to reflect the spirit of the times.Typography must be itself, it must be pleasing to the eyeand not tiring. Good typography has absolutely nothing todo with remarkable or exotic type styles. This is the opinionof amateurs. The essence of letterform is not modernity,but readability.”

    Jan Tschichold

  • Petr Sojka: Elektronická příprava dokumentů6. přednáška PB029, 25. 10. 2011, Brno c© Petr Sojka, 2000–2011

    106Základní typografické pojmy – osnova

    ☞ Tradice, omezující podmínky, v designu explicitněnespecifikované.

    ☞ Normy (ON 88 2503,. . . ) a jejich respektování.http://www.typotext.cz/radce7b 1.html64

    ☞ Znaky.

    ☞ Písmová osnova.

    ☞ Kresba písmového znaku.

    ☞ Měření písma.

    ☞ Typ písma.

    ☞ Rodina písma.

    ☞ Klasifikace tiskových písem.64http://www.typotext.cz/radce7b 1.html

  • Petr Sojka: Elektronická příprava dokumentů8./9. přednáška PB029, 8.–15. 11. 2011, Brno c© Petr Sojka, 2000–2011

    107☞ Fonty.

    ☞ Mezislovní mezera.

    ☞ Vyplňování řádků.

    ☞ Řádkový proklad.

  • Petr Sojka: Elektronická příprava dokumentů8./9. přednáška PB029, 8.–15. 11. 2011, Brno c© Petr Sojka, 2000–2011

    108Základní pravidla sazby – pokra čování,osnova

    ☞ Odstavec, odstavcová odrážka.

    ☞ Zarovnaný text.

    ☞ Nezarovnaný text.

    ☞ Dělení slov.

    ☞ Znaménka.

    ☞ Čísla a zkratky.

    ☞ Hladká sazba.

    ☞ Smíšená sazba.

    ☞ Korekturní znaménka.

    ☞ Typografické pravítko.

  • Petr Sojka: Elektronická příprava dokumentů10. přednáška PB029, 22. 11. 2011, Brno c© Petr Sojka, 2000–2011

    109☞ Příprava textů, rukopis.

    ☞ Sazební obrazec.

    ☞ Formáty papíru, počítání rozsahu sazby.

    ☞ Korekturní znaménka.

    ☞ Pro detaily předchozích přednášek viz BeranůvAktualizovaný typografický manuál65, příslušné ČSN,Ptáčkův text v PC Worldu 1994.

    65http://www.dtpstudio.cz/obchod/promoakce/typomanual.htm

  • Petr Sojka: Elektronická příprava dokumentů10. přednáška PB029, 22. 11. 2011, Brno c© Petr Sojka, 2000–2011

    110Osnova dnešní p řednášky

    ☞ Sazba, sázecí systémy. Co je TEX?

    ☞ Vznik a vývoj TEXu.

    ☞ Základní principy, řádkový a stránkový zlom.

    ☞ Základy digitální typografie, užití pro elektronicképublikování. Pravidla sazby.

    ☞ Vše, co jste chtěli vědět o TEXu, ale báli jste se zeptat.

  • Petr Sojka: Elektronická příprava dokumentů10. přednáška PB029, 22. 11. 2011, Brno c© Petr Sojka, 2000–2011

    111Motivace

    „Dokumenty v TEXu jsou mstou akademiků studentům,takže přežijí do té doby, dokud budou přežívat zatvrzelci

    v akademických sborech (řádově několik tisíciletí).“Jiří Hlavenka, (1964– )

    :-( Naproti tomu:„Rozhodně, prosím, opust’te vody nepoučených

    ’nalévačů

    textu‘ či’myšařů‘ a začněte vyrábět sazbu, již je nejen

    radost číst, ale na níž i oko se zalíbením spočinouti může.“Michal Ptáček

  • Petr Sojka: Elektronická příprava dokumentů10. přednáška PB029, 22. 11. 2011, Brno c© Petr Sojka, 2000–2011

    112Typografické tradice – řemeslo a um ění

    ☞ „Dnes, kdy je typografie neprávem potlačována a kdyse typografem cítí každý, kdo dokáže vytvořit napočítači stránku textu, si vám dovolíme přiblížit dobu,kdy typografie byla řemeslem a uměním.“

    ☞ „Budiž světlo!“

    ☞ Učební doba čtyřletá až pětiletá.

    ☞ Po staletí používané zvyky se staly tradiční, vytvořenínárodních typografických zvyklostí. (Vojtěch Preissig1873–1944, Oldřich Menhart 1897–1962, OldřichHlavsa 1909–, František Muzika), Muzeum knihy veŽd’áru nad Sázavou.

    “Those old guys stole all our best ideas.”Frederick Goudy

  • Petr Sojka: Elektronická příprava dokumentů10. přednáška PB029, 22. 11. 2011, Brno c© Petr Sojka, 2000–2011

    113Digitální revoluce a její důsledky

    pro černé řemeslo

    ☞ Digitální revoluce koncem sedmdesátých let.

    “Mathematics books and journals do not lookas beautiful as they used to.”

    Donald Ervin Knuth66

    ☞ Počítač: od imitace psacího stroje po sázecí systémDTP.

    ☞ Typografie matematiky, matematika/informatika sloužítypografii: místo metalurgie informatika, matematickýpopis křivek (kubické splajny v programu pro návrhpísem METAFONT).

    “Go forth and create masterpieces of electronicpublishing art.”

    (paraphrase of Donald Knuth [TEXbook, p. 303])

    66http://www-cs-faculty.stanford.edu/ knuth/

  • Petr Sojka: Elektronická příprava dokumentů10. přednáška PB029, 22. 11. 2011, Brno c© Petr Sojka, 2000–2011

    114Sázecí systémy

    “GUIs normally make it simple to accomplish simpleactions and impossible to accomplish complex actions.”

    Doug Gwyn

    ☞ Sazba: realizace návrhu nad značkovanými daty.

    ☞ WYSIWYG (WYSIAWYG): InDesign, Pagemaker(Adobe67), QuarkXpress (Quark68), 3B2 (AdventPublishing69).

    ☞ Dávkové systémy: TEX70, troff/groff/nroff/runoff, Lout71

    (nutnost kontroly návrhu dokumentů ve finální podobě,ne jen na obrazovce).

    ☞ Textové procesory Word, AmiPro, . . . sem de factonepatří (nedovedou některé docela zásadní potřebysazeče – nedělitelná roztažitelná mezera, fixace zlomupro různá výstupní zařízení apod.).

    67http://www.adobe.com68http://www.quark.com69http://www.3b2.com70http://www.cstug.cz/71http://snark.ptc.spbu.ru/ uwe/lout/

  • Petr Sojka: Elektronická příprava dokumentů10. přednáška PB029, 22. 11. 2011, Brno c© Petr Sojka, 2000–2011

    115Programování sazby – T EX

    ☞ Algoritmy počítačové sazby v sázecím systému TEX

    ➀ Zlom řádků.➁ Zlom stránky.➂ Dělení slov.➃ Umist’ování obrázků, viditelnost.➄ Umist’ování poznámek pod čarou.➅ Sazba matematických výrazů:

    (

    0

    x2

    2+ 1

    )

    ☞ $$\sqrt{\left(\int_0^\infty\sqrt{\frac{x^2}{2}}+1\right)}$$

    ☞ (Makro)programování sazby, otevřenost systému.

    ☞ OSS, CSTUG72, CTAN73, pros & cons.

    72http://www.cstug.cz/73http://www.cstug.cz/ctan?

  • Petr Sojka: Elektronická příprava dokumentů10. přednáška PB029, 22. 11. 2011, Brno c© Petr Sojka, 2000–2011

    116Co je TEX?

    ☞ Sázecí autorský systém.

    ☞ Programovatelný, t.j. s vlastním makrojazykem(s vyjadřovací silou Turingova stroje – byl v němnapříklad pro zábavu implementován interpret jazykaBASIC); výhoda pro cca 2 % populace.

    ☞ Dávkový: ze vstupu $c=\sqrt{a^2+b^2}$

    dostaneme c =√

    a2 + b2: http://tex.mendelu.cz74,http://sciencesoft.at/index.jsp?link=latex75.

    ☞ Otevřený/rozšiřitelný.

    ☞ Portabilní (od Atari či dvoudisketového PC XT po Cray).

    ☞ Stabilní ($256 za nalezení chyby), verze −→ π.

    ☞ Dobře dokumentovaný (vyšel knižně).74ukázka 175ukázka 2

  • Petr Sojka: Elektronická příprava dokumentů10. přednáška PB029, 22. 11. 2011, Brno c© Petr Sojka, 2000–2011

    117☞ Volně šiřitelný (vývoj hrazen granty).

    ☞ S výstupem nezávislým na výstupním zařízení.

    ☞ Jednoduchý základ pro sazbu: model box, glue, penalty.

    ☞ “A computer program of which a professor of computerscience might be proud of.” (DEK)

    ☞ Optimalizovaný, vysoce efektivní, využívajícínejrychlejší algoritmy své doby – při vývoji nalezenynové informatické metody a datové struktury (trie).

  • Petr Sojka: Elektronická příprava dokumentů10. přednáška PB029, 22. 11. 2011, Brno c© Petr Sojka, 2000–2011

    118Co TEX není?

    ❑ Editor.

    ❑ Program na grafiku (na to slouží komplementárníprogram METAFONT přibližně stejné velikosti).

    ❑ WYSIWYG (nadstavby jako LyX existují).

    ❑ Rychle naučitelný (strmější učicí křivka).

  • Petr Sojka: Elektronická příprava dokumentů10. přednáška PB029, 22. 11. 2011, Brno c© Petr Sojka, 2000–2011

    119Vznik a vývoj T EXu

    ❑ 1977, korektura The Art of Computer Programming.

    ❑ 1978, první verze; TEX82, METAFONT84; osmibitovýTEX 3 (1990); rozšiřování o výstupní formáty(PostScript).

    ❑ 1992: zmrazení dalšího vývoje, pevný bod, jen opravychyb.

    ❑ Vznik makrobalíků.

    ❑ Téměř žádný marketing, uživatele sdružuje TUG alokální sdružení uživatelů – LUG.

  • Petr Sojka: Elektronická příprava dokumentů10. přednáška PB029, 22. 11. 2011, Brno c© Petr Sojka, 2000–2011

    120TEX dnes: pro klasickou publika ční činnost

    ❑ Zejména pro matematiku a všude tam, kde je možnáalgoritmizace zpracování ($$).

    ❑ Velká nakladatelství technické literatury a časopisůSpringer-Verlag, Elsevier Publishers, Kluwer sázív TEXu časopisy, sborníky.

    ❑ Databázové publikování: Dopravní podnik města Brna(tabulky jízdních řádů pro zastávky, řidiče, dispečery),rozvrhy FI MU, studijní program FI MU přímoz databáze informačního systému MU.

    ❑ Slovníky (LEDA76) a první díl encyklopedie (Diderot77).

    ❑ Jádro TEXu či jeho algoritmy v sázecích systémech3B2, InDesign, troff, Lout či v textovém procesoru Word.

    76http://www.leda.cz77http://www.diderot.cz

  • Petr Sojka: Elektronická příprava dokumentů10. přednáška PB029, 22. 11. 2011, Brno c© Petr Sojka, 2000–2011

    121TEX dnes I: PDF

    ❑ Nový formát pro elektronické knihy fy Adobe.

    ❑ Otevřenost TEXu: pdfTEX78 Hàn Thế Thành.

    ❑ Kalkulačka v PDF (+JavaScript): dříve než Adobe.

    ❑ AcroTEX79.

    ❑ PDF není až tak portabilní jak říká název – místo proDVI3?

    78http://www.cstug.cz/pdftex/79http://www.math.uaktorn.edu/˜dpstory/acrotex.html

  • Petr Sojka: Elektronická příprava dokumentů10. přednáška PB029, 22. 11. 2011, Brno c© Petr Sojka, 2000–2011

    122TEX dnes II: Internet (HTML/XML/MATHML)

    ❑ HyperTEX (Los Alamos archiv80).

    ❑ LATEX2HTML81, konvertor z nejznámějšího makrobalíku

    do HTML v Perlu.

    ❑ TEX4ht, nebo jiné mnohé komerční implementace TEXus alternativním výstupem do HTML jako TEXpider

    82

    (MicroPress).

    ❑ eeTEX (pro přímou sazbu SGML).

    ❑ TTH83: konvertor TEXu do HTML.

    ❑ IBM techplorer Hypermedia Browser84 – plug-in doNetscape a Internet Exploreru.

    ❑ MathType85 pro psaní matematiky ve Windows.80http://xxx.lanl.gov81http://www-texdev.mpce.mq.edu.au/l2h/mathdocs/mathdocs/82http://www.micropress-inc.com/webb/wbstart.htm83http://hutchinson.belmont.ma.us/tth/84http://www-4.ibm.com/software/network/techexplorer/85http://www.mathtype.com

  • Petr Sojka: Elektronická příprava dokumentů10. přednáška PB029, 22. 11. 2011, Brno c© Petr Sojka, 2000–2011

    123❑ TEXML

    86 (Doug Lovell, IBM): XML reprezentace TEXovésyntaxe.

    ❑ WebEQ87: sada programů včetně Javovského apletupro rastrování matematiky.

    ❑ Texi2html88: konverze Texinfo formátu do html.

    ❑ Word2TeX89: konfigurovatelný konvertor z rozšířenéhoměnícího se formátu do stabilního.

    ❑ ASTER90 systém pro čtení LATEXového zápisu adokumentů pro nevidomé

    ❑ a mnoho dalších . . .

    86http://www.alphaWorks.ibm.com/formula/texml/87http://www.webeq.com/88http://www.mathematik.uni-kl.de/ obachman/Texi2html/89http://www.word2tex.com/90http://www.cs.cornell.edu/Info/People/raman/aster/demo.html

  • Petr Sojka: Elektronická příprava dokumentů10. přednáška PB029, 22. 11. 2011, Brno c© Petr Sojka, 2000–2011

    124TEX dnes III: Java, Unicode, OpenType

    ❑ NTS: reimplementace TEXu bez optimalizací v Javě(Karel Skoupý, FI MU, nyní ÚVT MU), a následnývýzkum.

    ❑ PDF prohlížeč v Javě91 → vysoce portabilní prvotřídněvysazené dokumenty s minimem přenosu datv dohledu.

    ❑ Omega92: mnohem více než šestnáctibitový TEX;konverze LATEXu do MathML.

    ❑ PATLIB93, opatgen, upatgen, . . .

    ❑ XeTEX94, viz sobotní přednáška CSTUG95.

    91http://www.adobe.com/products/acrviewer/main.html92http://omega.cse.unsw.edu.au:8080/index.html93http://www.fi.muni.cz/˜xantos/PATLIB/94http://scripts.sil.org/xetex95http://bulletin.cstug.cz/pozvanka/

  • Petr Sojka: Elektronická příprava dokumentů10. přednáška PB029, 22. 11. 2011, Brno c© Petr Sojka, 2000–2011

    125Perspektivy T EXu a jeho následníků

    v tomto tisíciletí

    ❑ TEX pevný bod v chaosu postmoderního světa?

    ❑ Interaktivní dokumenty: otevřenost umožňuje rychlereagovat na nové formáty a standardy.

    ❑ Rozšiřování požadavků na autorské systémy.

    ❑ Bude se opakovat historie s tím, že v TEXové komunitěnavržené a vyzkoumané postupy, algoritmy a přístupyse stanou základem většiny komerčních aplikacív oblasti DTP?

    ❑ embedded systémy [části] TEXu součástí většíchprojektů.

  • Petr Sojka: Elektronická příprava dokumentů11. přednáška PB029, 29. 11. 2011 c© Petr Sojka, 2000–2011

    126Jak se na to p řipravit?

    ❑ Instalovat si TEX a učit se ho:

    ❑ učit se, učit se, učit se.

    ❑ Stát se členem sdružení CSTUG96 a účastnit se aktivnějeho akcí a projektů.

    ❑ Úcta k tradicím, osvěta.

    ❑ Další studium: www.sazba.cz97 (Kapr: Sto a jedna větao knižní úpravě), www.typo.cz98 (písma, PostScript, . . . ),Beranův Typografický manuál99.

    “A man who would letterspace lower case would stealsheep.”

    Frederick Goudy, 1894–1945

    “If this wisdom needs updating, it is chiefly to add thatA woman who would . . . ”

    Robert Bringhurst96http://www.cstug.cz97href://www.sazba.cz98href://www.typo.cz99http://www.dtpstudio.cz/obchod/promoakce/typomanual.htm

  • Petr Sojka: Elektronická příprava dokumentů11. přednáška PB029, 29. 11. 2011 c© Petr Sojka, 2000–2011

    127Sazba – Algoritmy zlomu a formáty písem

    ☞ Digitální formáty písem

    ☞ Algoritmy zlomu

    ☞ hz rozšíření

  • Petr Sojka: Elektronická příprava dokumentů11. přednáška PB029, 29. 11. 2011 c© Petr Sojka, 2000–2011

    128Digitální formáty písem

    ☞ Formáty METAFONT, PostScript a TrueType(OpenType).

    ☞ Princip oddělení metrické informace potřebné při sazběod informace o tvarech znaků.

    ☞ Metrické informace: rozměry jednotlivých znaků,mezipísmenný kerning, ligační programy. Formáty TFMa AFM, program afm2tfm.

    ☞ Tvary znaků jsou popsány jako bitmapy (optimalizaceznaků pro obrazovku, PostScript Type 3) nebo pomocíkřivek obrysů či per. PostScript Type1 používá propopis obrysů kubické Bézierovy křivky, formát TrueTypevýpočetně méně náročné kvadratické Bézierovy křivkya METAFONT parametrická pera.

    ☞ Detailní český popis digitálních formátů písem jek nalezení v DP PřF MU Pavla Janíka a DP FI MU JanaVidy.

  • Petr Sojka: Elektronická příprava dokumentů11. přednáška PB029, 29. 11. 2011 c© Petr Sojka, 2000–2011

    129Algoritmy řádkového a stránkového zlomu

    ☞ Algoritmus First fit: sazba po řádcích, výběr prvníhomožného zlomu. Nenáročné na výpočetní kapacitu.

    ☞ Algoritmus Best fit: zlom po řádcích, výběr nejlepšíhozlomu na řádku bez přihlédnutí k předchozímmožnostem. Míra optimality řádku je měřena mírouodchylky od ideální velikosti mezislovní mezery. V TEXuje míra škaredosti (badness) 100 · |r|3, kde r je poměrrozdílu přirozené a požadované délky řádku ku součturoztažitelných a stlačitelných složek lepidla (glue).

    ☞ Algoritmus Optimum fit: optimalizace zlomu v rámcicelého odstavce naráz s využitím modelu ‘box, glue apenalty’. Úloha podobná hledání nejkratší cesty v grafu,každé cestě odpovídá škaredost, která se minimalizuje.Stačí zvažovat pouze možnosti hezčí než zadanátolerance.

  • Petr Sojka: Elektronická příprava dokumentů11. přednáška PB029, 29. 11. 2011 c© Petr Sojka, 2000–2011

    130Parametry algoritmu řádkového zlomu T EXu

    ☞ Až tři průchody: první bez dělení slov, limit škaredosti je\pretolerance . Pak jsou rozdělena všechna slovav odstavci a proveden druhý pokus s limitem škaredosti\tolerance .

    ☞ Pokud je nastaven registr \emergencystretch nakladnou délku (zvětšení roztažitelnosti mezislovnímezery) a jde o TEX3.0 či vyšší, provede se třetí pokuso zlom s těmito limity roztažitelností.

    ☞ Další parametry ovliviňující algoritmy zlomu: řádkového:\adjdemerits , \linepenalty , \hyphenpenalty ,\exhyphenpenalty , \looseness a stránkového:\interlinepenalty , \clubpenalty ,\widowpenalty , \brokenpenalty , . . .

    ☞ Ladění parametrů zlomu pro daný projekt (Diderot).

    ☞ Detailní český popis variant algoritmů zlomu jek nalezení v DP FI MU Jana Pazdziory.

  • Petr Sojka: Elektronická příprava dokumentů11. přednáška PB029, 29. 11. 2011 c© Petr Sojka, 2000–2011

    131hz-algoritmus

    ☞ Motivace: Gutenbergova 42řádková Bible měla 290písmen abecedy proměnné šířky, stejná mezislovnímezera při sazbě do bloku.

    ☞ Principy: kerning, scaling, composing.

    ☞ URW, Karrow, Zapf, neúspěch (fonty).

    ☞ Implementace v pdfTEXu (Thành).

    ☞ Implementace v InDesignu (Karrow).

    ☞ Detailní český popis modifikací zlomového algoritmupísem je k nalezení v DP Mirky Misákové a dizertaciHàn Thế Thànha.

  • Petr Sojka: Elektronická příprava dokumentů11. přednáška PB029, 29. 11. 2011 c© Petr Sojka, 2000–2011

    132Implementace algoritmu d ělení slov

    ☞ Dizertace a program PatGen Franka Lianga.

    ☞ Princip soutěživých vzorů, nezávislost na jazyce.

    ☞ Vytváření a generování vzorů.

    ☞ OPatGen, knihovna PatLib, upatgen.

    ☞ Detailní popis algoritmu dělení slov je k nalezení v DPFI MU Davida Antoše.

  • Petr Sojka: Elektronická příprava dokumentů11. přednáška PB029, 29. 11. 2011 c© Petr Sojka, 2000–2011

    133Principy makroprogramování

    ☞ Makrojazyk TEXu: složité sázecí postupy skládanéz 300 základních příkazů (primitiv).

    ☞ (Ne)vhodnost makroprogramování (versus detailníznačkování), minimalizace vstupu.

    ☞ Input procesor: řádky nezávislé na operačním systému.

    ☞ Token procesor.

    ☞ Expand procesor.

    ☞ Hlavní procesor.

    ☞ Detaily v češtině jsou v Olšákově TeXbooku naruby(TBN).

  • Petr Sojka: Elektronická příprava dokumentů11. přednáška PB029, 29. 11. 2011 c© Petr Sojka, 2000–2011

    134Makrobalíky

    ☞ Znovuobjevování kola většinou není potřeba: tisícebalíků maker na CTAN (Comprehensive TEX ArchiveNetwork).

    ☞ Katalog balíků na CTAN.

    ☞ Příklady balíků, kniha LATEX Companion.

    ☞ DVD s distribucí TEXlive 2011.

  • Petr Sojka: Elektronická příprava dokumentů12. přednáška PB029, 5. 12. 2011 c© Petr Sojka, 2000–2011

    135InDesign

    ☞ Komerční program firmy Adobe pro WYSIWYGpočítačovou sazbu.

    ☞ Zlomový algoritmus (převzat z TEXu) s pomocí DavidaKarrowa (URW).

    ☞ Škálování znaků.

    ☞ Optický proklad (David Kindersley: Optical letterspacing for new printing systems, 1976).

    ☞ Příklady zlomu a chyb.100

    100http://www.fi.muni.cz/˜sojka/PB029/xznamen/

  • Petr Sojka: Elektronická příprava dokumentů12. přednáška PB029, 5. 12. 2011 c© Petr Sojka, 2000–2011

    136Jazyky pro popis stránky

    ☞ PDL – jazyk pro popis stránky, kombinace textus grafikou.

    ☞ Formát firmy Adobe (Geschke, Warnock, 1982, AppleLaserwriter, Aldus Pagemaker), nyní de facto standard.

    ☞ Linotronic 1986, svět osvitových jednotek (vysokérozlišení).

    ☞ Vývoj/podpora – Level1, Level2, (Level3).

    ☞ Návazné/odvozené/související produkty/standardy:PDF, písma Type1 (vektorový popis), Type3 (bitmapy).

    ☞ Nově OpenType101.

    101http://www.microsoft.com/typography/developers/opentype/default.htm

  • Petr Sojka: Elektronická příprava dokumentů12. přednáška PB029, 5. 12. 2011 c© Petr Sojka, 2000–2011

    137PostScript – vlastnosti jazyka

    ☞ Nezávislost na zařízení (různé rozlišovací schopnostivýstupních zařízení).

    ☞ Souřadné systémy, prostor uživatele, prostor zařízení.

    ☞ Interpreter – PostScriptový RIP, hardwarový nebosoftwarový (Ghostscript, Ghostview).

    ☞ Zásobníkový programovací jazyk, postfixový zápisv reverzní polské notaci.

    ☞ Podpora různých barevných prostorů (CMYK, RGB),direktní barvy.

    ☞ Nezávislost na platformě – vytváření/generováníPostScriptu aplikacemi.

  • Petr Sojka: Elektronická příprava dokumentů12. přednáška PB029, 5. 12. 2011 c© Petr Sojka, 2000–2011

    138Postscript – p říklad

    1 %!PS-Adobe-2.02 %%Title: Priklad Postscript programu3 /Helvetica-Bold findfont4 50 scalefont setfont5 0 0 moveto 200 0 lineto6 200 100 lineto 0 100 lineto7 closepath 0.8 setgray fill8 0 setgray9 30 40 moveto

    10 (FI MU)show11 showpage

    FI MU

  • Petr Sojka: