Écritures alphabétiques européennes

  • View
    215

  • Download
    2

Embed Size (px)

Transcript

  • Je ne connais pas dautre ressource moderne, ni en anglais ni en franais, regroupant une telle gamme de sujets utiles, et les expliquant de faon si claire et si accessible un large public. Jespre que vous apprcierez cet ouvrage autant que moi.

    Mark Davis, Ph. D. Prsident et cofondateur du Consortium Unicode

    Commandez en ligne

    Prface

    Table des matires

    Avant-propos

    Premier Chapitre

    Index

    Errata

    http://www.dunod.com/pages/ouvrages/ficheouvrage.asp?id=51140http://livre.fnac.com/a2028000/Patrick-Andries-Unicode-5-0-en-pratique?Mn=-1&Ra=-1&To=0&Nu=1&Fr=0http://www.amazon.fr/Unicode-5-0-pratique-Patrick-Andries/dp/2100511408/ref=pd_bbs_sr_1?ie=UTF8&s=books&qid=1206989878&sr=8-1http://alapage.com/-/Fiche/Livres/9782100511402/unicode-et-internationalisation-a-andries.htm?fulltext=Unicode&id=258871207344372&donnee_appel=ALAPAGE#reviewhttp://www.decitre.fr/livres/Unicode-5-0-en-pratique.aspx/9782100511402http://hapax.qc.ca/dunod/Unicode_Preface.pdfhttp://hapax.qc.ca/dunod/Unicode_tdm.pdfhttp://hapax.qc.ca/dunod/Unicode_AP.pdfhttp://hapax.qc.ca/dunod/Unicode_Chap_1.pdfhttp://hapax.qc.ca/dunod/Unicode_Index.pdfhttp://hapax.qc.ca/errata-unicode-5.html

  • Chapitre 8

    critures europennes alphabtiques Toutes les critures alphabtiques europennes modernes sont issues de lcriture grecque ou ont subi son influence. Le mot alphabet provient du mot grec alphabetos, lui-mme driv du nom des deux premires lettres de lalphabet grec, alpha et bta. Lcriture grecque est une adaptation de lcriture phnicienne. Les Grecs innovrent en crivant de gauche droite, une caractristique de toutes les critures drives ou sinspirant du grec. Les critures alphabtiques europennes selon le standard Unicode1 sont :

    latin,

    grec,

    cyrillique,

    armnien,

    gorgien,

    ogam,

    runes,

    italique,

    gotique.

    Elles scrivent de gauche droite. Plusieurs font la distinction entre les formes capitales et de bas de casse de leur alphabet. Des espaces sparent les mots. Les accents et autres signes diacritiques indiquent gnralement des caractristiques phontiques2 et permettent dtendre la puissance descriptive des critures de base et dcrire ainsi dautres langues. Lutilisation de ces signes diacritiques est potentiellement ouverte cest lune des raisons pour lesquelles ces signes combinatoires sont repris dans le standard Unicode. Le latin et le cyrillique servent crire ou translittrer plusieurs langues. Lalphabet latin est issu dun alphabet trusque, lui-mme inspir dune version occidentale de lalphabet grec classique. lorigine, il ne contenait que 24 lettres capitales. Lalphabet latin moderne, tel quil est cod dans le bloc du latin de base, doit son apparition aux innovations apportes par les scribes mdivaux et les imprimeurs du dbut de la Renaissance. Lcriture cyrillique, labore au IXe sicle, constitue le dernier avatar du grec en Europe. Les critures gorgiennes et armniennes furent inventes au cinquime sicle sous linfluence du grec. Le gorgien moderne ne distingue pas les majuscules des minuscules ; on dit alors que lcriture est unicamrale. Lalphabet phontique international est une extension de lalphabet latin qui permet de transcrire la dimension phontique de toutes les langues.

    1 Dans lordre dapparition de ce chapitre. Cet ordre nimplique aucunement une importance relative des critures, mais les couches successives dajout au standard Unicode. Les dernires critures dans la liste tant les plus rcentes. 2 Ce nest pas le cas en franais dans des mots comme o ou parat .

  • CRITURES EUROPENNES ALPHABTIQUES CHAPITRE 8

    UNICODE 3.1 ANNOT 2

    Les deux critures historiques de lEurope du Nord-ouest, les runes et logam, diffrent foncirement par leur aspect des autres critures, consquence de leur support principal : le bois et la pierre. De manire gnrale, elles scrivent de gauche droite dans les textes rudits, toutefois lorigine on les gravait souvent en forme darche pour suivre de la sorte la forme de la pierre. Lalphabet italique synthtise un certain nombre dalphabets prclassiques provenant tous de la pninsule italienne. Quant au gotique, ne pas confondre avec le style , il sagit de lcriture des Goths, reprsentants de la branche orientale des peuples germains installs sur la Mer Noire au IVe sicle. Cette criture sinspire du grec pour les sons communs au grec et au gotique, avec quelques amnagements pour les sons propres au gotique.

  • CRITURES EUROPENNES ALPHABTIQUES CHAPITRE 8

    UNICODE 3.1 ANNOT 3

    8.1 Latin Lcriture latine est drive de lcriture grecque. On utilise prsent pour crire un grand nombre de langues dans le monde. Au cours de son adaptation, elle a subi diffrentes extensions. La plus courante est lajout de signes diacritiques. La cration de digrammes, de formes culbutes ou rflchies, et de caractres indits a galement enrichi lcriture latine. Lcriture latine scrit de gauche droite. Des espaces sparent les mots et permettent le plus souvent de couper les lignes. Pour la coupure de mots en fin de ligne, on emploie des traits dunion. Pour plus dinformation, consultez le Rapport technique dUnicode n 14, Line Breaking Properties , prsent sur le cdrom ou sur le site Internet du consortium Unicode pour une version tenue jour. Lcriture latine distingue les majuscules et les minuscules ; on parle donc dune criture bicamrale. Signes diacritiques. Leffet dun signe diacritique sur une lettre de base dpend de la langue qui lutilise. Certaines langues considrent cette combinaison comme une lettre part entire. Dautres, comme langlais, permettent que le mme mot scrive avec ou sans diacritique sans que le sens en soit affect. Dans la plupart des langues utilisant lcriture latine, on considre les lettres portant un signe diacritique comme une variante de la lettre de base, sans que cette combinaison ne forme une lettre supplmentaire et indpendante dans son alphabet. Le codage Unicode de lcriture latine est suffisamment souple pour que les mises en uvre puissent prendre en charge ces lettres conformment aux attentes des usagers, pour autant que la langue soit connue. Les caractres accentus les plus frquents existent sous la forme de caractres simples (prcomposs) afin de se conformer aux codages prexistants les plus rpandus. Toutes ces lettres accentues, ainsi que dautres encore, peuvent sexprimer laide dune suite de caractres combinatoires. Unicode prcise que les signes diacritiques doivent suivre le caractre de base auquel il se rapporte. Pour plus de dtails, consultez la sous-section Diacritiques dans la Section 8.9, Diacritiques et la Section 2.6, Caractres combinatoires. Normes. Les lettres latines Unicode jusqu' U+00FF correspondent dans lordre aux lettres de lISO/CEI 8859-1. Celle norme reprend elle-mme lordre de normes antrieures, parmi lesquelles ASCII (ANSI X3.4) identique ISO/CEI 646:1991-IRV. Comme lASCII, lISO/CEI 8859-1 inclut des lettres latines, des signes de ponctuation et des symboles mathmatiques ; lutilisation de ces caractres supplmentaires nest pas restreinte lcriture latine. Le Chapitre 6, Ponctuation, dcrit ces caractres. Caractres connexes. Pour les autres caractres latins ou drivs du latin, consultez les Symboles de type lettre (U+2100..U+214F), les Symboles montaires (U+20A0..U+20CF), les Symboles divers (U+2600..U+26FF), les Alphanumriques cercls (U+2460..U+24FF) et les Formes pleine chasse (U+FF21..U+FF5A).

    Lettres latines de base : U+0020 U+00BF Rares sont les langues rdiges avec lcriture latine qui ne scrivent quavec les 26 minuscules et majuscules latines de ce bloc. Les 26 paires des lettres de base forment lessentiel des alphabets utiliss par toutes ces langues. Un texte utilisant un de ces alphabets utilisera donc la fois des caractres du latin de base et des caractres dautres blocs latins. Certaines langues omettent quelques paires de lettres de base, comme litalien qui ne connat ni le j ni le w.

  • CRITURES EUROPENNES ALPHABTIQUES CHAPITRE 8

    UNICODE 3.1 ANNOT 4

    Variantes dil. La boucle ferme ou ouverte des lettres a et g en bas de casse constitue une variation typographique courante selon la police utilise. Des systmes de transcription phontique, comme lAPI, font la distinction entre ces diffrentes formes ( a et g par rapport et ) .

    Lettres du supplment latin-1 : U+00C0 U+00FF Le supplment latin-1 ajoute aux 26 paires de lettres de base de lASCII les lettres des principales langues dEurope occidentale (voir la liste au prochain paragraphe). Comme pour lASCII, le latin-1 inclut divers autres signes mathmatiques et de ponctuation. La ponctuation, les signes et les symboles qui ne sont pas inclus dans le bloc du latin de base ni le supplment latin-1 sont cods dans des blocs de caractres, commencer par le bloc de ponctuation gnrale. Langues. Le supplment latin-1 permet dcrire lallemand, le danois, lespagnol, le finnois, le froen, lirlandais, lislandais, litalien, le nerlandais, le norvgien, le portugais et le sudois. Nombres ordinaux. On peut reproduire 00AA INDICATEUR ORDINAL FMININ et U+00BA INDICATEUR ORDINAL MASCULIN accompagns dun soulign, toutefois plusieurs polices de caractres modernes les affichent simplement sous la forme dexposants, sans soulign. Ces caractres devraient tre considrs, pour le tri et le reprage, comme des quivalents faibles des caractres latins correspondants. Clones chasse des diacritiques. La norme ISO/CEI 8859-1 comprend huit caractres ambigus, car on ne sait prcisment sil sagit de caractres combinatoires (des diacritiques) ou de caractres part entire. Les points de code Unicode correspondants (U+005E ^ ACCENT CIRCONFLEXE, U+005F _TIRET BAS, U+0060 ` ACCENT GRAVE, U+007E ~ TILDE, U+00A8 TRMA, U+00AF MACRON, U+00