17
8 Кодування символів тексту Розділ 1 § 1.2 Для опрацювання текстових повідомлень з використанням комп'ютера символи повідомлення кодують числами. Для кодування тексту використовують таблиці кодів символів, у яких для кожного символа, що може бути використаний у текстовому повідомленні, ставиться у відповідність деяке число.

Кодування символів тексту...8 Розділ 1 Для тих, хтохочезнати більше 1.2 Таблиця символів в операційній

  • Upload
    others

  • View
    6

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Кодування символів тексту...8 Розділ 1 Для тих, хтохочезнати більше 1.2 Таблиця символів в операційній

8Кодування символів тексту

Розділ 1

§ 1.2

Для опрацювання текстовихповідомлень з використаннямкомп'ютера символи повідомленнякодують числами.

Для кодування текстувикористовують таблиці кодівсимволів, у яких для кожного символа,що може бути використаний утекстовому повідомленні, ставиться увідповідність деяке число.

Page 2: Кодування символів тексту...8 Розділ 1 Для тих, хтохочезнати більше 1.2 Таблиця символів в операційній

8Кодування символів тексту

Розділ 1

§ 1.2

У 1963 р. у США було розробленонабір таких кодів символів дляпередавання повідомленьтелетайпом. Пізніше він ставстандартом для використання вкомп'ютерній техніці й отримавназву таблиці кодів символів ASCII(англ. American Standard Code forInformation Interchange -американський стандартний код дляобміну інформацією).

Page 3: Кодування символів тексту...8 Розділ 1 Для тих, хтохочезнати більше 1.2 Таблиця символів в операційній

8Цікаво

Розділ 1

§ 1.2

Телетайп (лат. tele - віддалений, англ. type —друкування) - електромеханічна друкуюча машина, якувикористовують для передавання текстовихповідомлень дротами.

Page 4: Кодування символів тексту...8 Розділ 1 Для тих, хтохочезнати більше 1.2 Таблиця символів в операційній

8Кодування символів тексту

Розділ 1

§ 1.2

У таблиці ASCIIлітераманглійськогоалфавіту, цифрам,розділовимзнакам, символамредагування таформатуваннятексту ставляться увідповідністьчисла від 0 до 127.

Page 5: Кодування символів тексту...8 Розділ 1 Для тих, хтохочезнати більше 1.2 Таблиця символів в операційній

8Кодування символів тексту

Розділ 1

§ 1.2

Таблиця кодів символів ASCII містить коди літер лишеанглійського алфавіту. Для кодування літер іншихалфавітів було розроблено інакші таблиці кодівсимволів. Наприклад, таблиці KOI8-U (КОІ - код обмінуінформацією) і Windows-1251 містять без змін усі кодитаблиці ASCII, а також - коди літер кирилиці. Цимлітерам ставляться у відповідність натуральні числа від128 до 255.

КОІ8-U Windows-1251

Page 6: Кодування символів тексту...8 Розділ 1 Для тих, хтохочезнати більше 1.2 Таблиця символів в операційній

8Кодування символів тексту

Розділ 1

§ 1.2

Таблиця кодів символівWindows-1251 є стандартом длякодування літер кирилиці вопераційній системі Windows. Уній, наприклад, літері «а»українського алфавіту ставитьсяу відповідність число 224, літері«і» -число 179, літері «ґ»- число180 та ін. Текстові символи, щокодуються у таблиці Windows-1251 числами від 128 до 255,наведені в додатку 2.

Page 7: Кодування символів тексту...8 Розділ 1 Для тих, хтохочезнати більше 1.2 Таблиця символів в операційній

8Кодування символів тексту

Розділ 1

§ 1.2

Цілих чисел від 0 до 255вистачає, щоб закодуватисимволи двох алфавітів -латиниці й кирилиці та деякіінші символи. Але длякодування символів іншихалфавітів (грецького чиарабського алфавітів, ієрогліфівтощо) потрібно значно більшезначень кодів. Для нихрозроблено таблицю кодівсимволів Юнікод (англ. Unicode- уніфіковане кодування).

Page 8: Кодування символів тексту...8 Розділ 1 Для тих, хтохочезнати більше 1.2 Таблиця символів в операційній

8Кодування символів тексту

Розділ 1

§ 1.2

Таблиця Юнікод складається з 17 наборів по 65 536значень кодів у кожному та дає можливість закодувати1 114 112 різних символів, тобто майже всі символиписемності всіх світових мов. Як і в інших таблицяхкодів, у Юнікоді незмінними залишаються перші 128значень кодів, що відповідають таблиці ASCII. Окремийрозділ у таблиці Юнікод містить коди літер кирилиці.Наприклад, літері «а» українського алфавіту ставитьсяу відповідність код 53424, літері «і» - код 53654, літері«ґ» -код 53905 та ін.

Наразі у новітніх операційних системахвикористовується таблиця кодів Юнікод.

Page 9: Кодування символів тексту...8 Розділ 1 Для тих, хтохочезнати більше 1.2 Таблиця символів в операційній

8

Порівняння структури таблиць кодів символівРозділ 1

§ 1.2

Page 10: Кодування символів тексту...8 Розділ 1 Для тих, хтохочезнати більше 1.2 Таблиця символів в операційній

8Кодування символів веб-сторінок

Розділ 1

§ 1.2

У таблиці Юнікод містяться коди не лише літер тацифр, а й символів, які позначають торговельні марки,грошові одиниці, символи транскрипцій, ідеограмитощо. Наприклад, кодом символу української грошовоїодиниці гривні ₴ є число 8 372, кодом ідеограми чоловікє число 10080, а ідеограми жінка - число 10081 тощо.

Ідеограма — писемний знак,що передає, на відміну відбукви, не звук певної мови, адеяке поняття, ідею.

Page 11: Кодування символів тексту...8 Розділ 1 Для тих, хтохочезнати більше 1.2 Таблиця символів в операційній

8Кодування символів веб-сторінок

Розділ 1

§ 1.2

Для вставлення символів у документ можназастосовувати їх коди з таблиці Юнікод. Для цьогопотрібно натиснути та утримувати клавішу Alt і набратикод символу на додатковій цифровій клавіатурі. Такможуть бути вставлені наприклад, символи сніговик ☃ -код 9731, серце у вигляді квітки ❧ - код 10087, нота ♪ -код 9834, шахова фігура кінь ♞ - код 9822 та інші.

☃ ❧ ♪ ♞

Page 12: Кодування символів тексту...8 Розділ 1 Для тих, хтохочезнати більше 1.2 Таблиця символів в операційній

8Кодування символів веб-сторінок

Розділ 1

§ 1.2

Особливості кодування тексту з використанням різнихтаблиць кодів символів можна побачити також під часперегляду веб-сторінок. Іноді під час відкриття веб-сторінки таблиця кодів символів обирається браузеромнеправильно. У такому випадку текст веб-сторінкинепридатний для розуміння.

Page 13: Кодування символів тексту...8 Розділ 1 Для тих, хтохочезнати більше 1.2 Таблиця символів в операційній

8Кодування символів веб-сторінок

Розділ 1

§ 1.2

У кожного веб-браузера є інструменти для виборутаблиці кодів символів користувачами. Наприклад, убраузері Google Chrome для зміни таблиці кодівсимволів потрібно:

1. Вибрати кнопку Налаштування та керування GoogleChrome.

2. Виконати Інші інструменти Кодування.

3. Вибрати таблицю кодів символів, при якій текствеб-сторінки буде придатним для розуміння.

Page 14: Кодування символів тексту...8 Розділ 1 Для тих, хтохочезнати більше 1.2 Таблиця символів в операційній

8Кодування символів веб-сторінок

Розділ 1

§ 1.2

Для україномовних веб-сторінок найчастішезастосовують таблицю кодів символів Юнікод (UTF-8),але для окремих веб-сторінок може бути використанекодування Кирилиця (Windows-1251) або Кирилиця(KOI8-U).

Page 15: Кодування символів тексту...8 Розділ 1 Для тих, хтохочезнати більше 1.2 Таблиця символів в операційній

8Для тих, хто хоче знати більше

Розділ 1

§ 1.2

Таблиця символів в операційній системі Windows

Серед службових програм вопераційній системі Windows єпрограма Таблиця символів, щопризначена для перегляду,пошуку та вставлення в текстовідокументи різноманітнихсимволів, у тому числі тих, яківідсутні на клавіатурі. Для запускупотрібно виконати Пуск Усіпрограми Стандартні Службові Таблиця символів, після чоговідкриється вікно програми.

Page 16: Кодування символів тексту...8 Розділ 1 Для тих, хтохочезнати більше 1.2 Таблиця символів в операційній

8Кодування символів веб-сторінок

Розділ 1

§ 1.2

Використовуючи цю програму, можна побачити різнігрупи символів, що призначені для вставлення вдокументи. Для цього потрібно:

1. Встановити позначку прапорця Додаткові параметриперегляду у вікні програми.

2. У полі Набір символів у нижній частині вікна вибратиЮнікод.

3. У полі Групування вибрати Діапазони Юнікоду.

4. У списку вікна Групування, що відкриється, вибратидіапазон кодів, символи з якого потрібно вставити вдокумент.

Page 17: Кодування символів тексту...8 Розділ 1 Для тих, хтохочезнати більше 1.2 Таблиця символів в операційній

8Кодування символів веб-сторінок

Розділ 1

§ 1.2

Якщо в таблиці вибратидеякий символ, то в рядкустатусу вікна програми ліворучбуде відображено код цьогосимволу в таблиці кодівсимволів Юнікод та його описанглійською мовою, а праворуч- сполучення клавіш, якепотрібно натиснути длявставлення цього символу вдокумент. Наприклад, намалюнку 1.6 вибрано