34
18.06.22 Кодирование информации. Двоичное кодирование.

кодирование инф

Embed Size (px)

Citation preview

Page 1: кодирование инф

13.04.23

Кодирование информации.

Двоичное кодирование.

Page 2: кодирование инф

Кодирование информации

Кодирование – это операция преобразования символов или группы символов одного кода в символы или группы символов другого кода.

Кодирование – это запись информации с помощью некоторой знаковой системы (языка).

Код – это система условных знаков для представления информации.

Page 3: кодирование инф

3

Кодирование информации

Зачем кодируют информацию? Зачем кодируют информацию??

кодирование

10101001010

данные (код)

обработка

11111100010

данные (код)

хранение

борьба с помехами (специальные

способы кодирования)

борьба с помехами (специальные

способы кодирования)

передача

передача

Информация передается, обрабатывается и хранится в виде кодов.

Page 4: кодирование инф

4

ЯзыкиЯзык – знаковая система, используемая для хранения

и передачи информации (знаковая форма представления информации).

Естественные языки:1. носят национальный характер (русский,

английский, …);2. есть правила и исключения.Формальные языки:1. интернациональны, понятны всем (язык физики и

т.п.);2. наличие строгих правил.

2mcE program qq;beginwriteln("Привет!");end.

program qq;beginwriteln("Привет!");end.

2816 10000201016

Page 5: кодирование инф

5

КодированиеУпражнение 1. Закодируйте имя ВАСЯ с помощью азбуки Морзе.

ВАСЯ

Код неравномерный, нужен разделитель!

!

Page 6: кодирование инф

6

КодированиеУпражнение 2. Закодируйте имя ВАСЯ с помощью кодовой таблицы (Windows-1251):

0 1 2 3 4 5 6 7 8 9 A B C D E F

C А Б В Г Д Е Ж З И Й К Л М Н О П

D Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я

ВАСЯ С2 С0 D1 DF

В А С Я

Код равномерный, разделитель НЕ нужен!!

Page 7: кодирование инф

Грамматика – правила по которым из символов алфавита строятся слова. Синтаксис - правила по которым из слов. строятся предложения. Упражнение 3. Представьте с помощью естественных и нормальных языков следующую информацию

Языки

Информация Формальный

языкЕстественный

язык

Нахождение площади

треугольника

Правило дорожного движения

Призыв о помощи

sin**2

1S ba

Page 8: кодирование инф

8

Кодирование: цели и способыТекст:

в Росии: Привет, Вася! Windows-1251: CFF0E8E2E52C20C2E0F1FF21 передача за рубеж (транслит): Privet, Vasya! стенография: шифрование: Рсйгжу-!Гбта”

Информация (смысл сообщения) может быть закодирована разными способами!

!

Числа: для вычислений: 25 прописью: двадцать пять римская система: XXV

Как зашифровано??

Page 9: кодирование инф

В процессе обмена информацией кроме кодирования информации происходит и ее декодирование:

Источник информации

Кодирующее устройство

Передача информации

Декодирующее устройство

Получатель информации

Page 10: кодирование инф

Пример: как создается новая мелодия

Запись композитором мелодии нотами

Образ мелодии

Передача исполнителю носителя с нотами

Перевод исполнителем нот в звуки

Прослушивание мелодии

Page 11: кодирование инф

Упражнение 4 (устно).

Девочка заменила каждую букву своего имени ее номером в алфавите. Получилось 141261. Как зовут девочку?

Код имени необходимо разделить следующим образом: 14-1-26-1. 14-М, 1-А, 26-Ш.

Имя - Маша

Page 12: кодирование инф

12

Двоичное кодирование

Двоичное кодирование – это кодирование всех видов информации с помощью двух знаков (обычно 0 и 1).

Передача электрических сигналов:

сигнал с помехамисигнал с помехами

время

U

«1»

«0»полезный сигнал

полезный сигнал

сигнал с помехамисигнал с помехами

5 В

U

1 0 1

времяполезный

сигналполезный

сигнал

Page 13: кодирование инф

13

Двоичное кодирование

• в такой форме можно закодировать все виды информации

• нужны только устройства с двумя состояниями• практически нет ошибок при передаче• компьютеру легче обрабатывать данные

• человеку сложно воспринимать двоичные коды

Можно ли использовать не «0» и «1», а другие символы, например, «А» и «Б»?

?

кодировщиккодировщик

числачисла

символысимволы

рисункирисунки

звукзвук

101011011101110110101101011011101110110101

Page 14: кодирование инф

Упражнение 4. Заполните таблицу:

Количество бит 1 2 3 4 5 6 7 8 9 10

Кодируемое количество сообщений

Page 15: кодирование инф

Двоичное кодирование

текстовой

информации

13.04.23

Page 16: кодирование инф

При вводе в компьютер текстовой информации каждая буква кодируется определенным числом, а при выводе на внешние устройства (экран или печать) для восприятия человеком по этим числам строятся изображения букв. Соответствие между набором букв и числами называется кодировкой символов.

Page 17: кодирование инф

Традиционно для кодирования одного символа используется количество информации, равное 1 байту (8 битам). Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255, а каждому десятичному коду соответствует 8-разрядный двоичный код от 00000000 до 11111111.Код символа хранится в памяти компьютера, где занимает 1 байт.При таком способе можно закодировать 256 различных символов (256 = 28).Такое количество символов достаточно для представления текстовой информации, включая прописные и заглавные буквы русского алфавита, цифры, знаки, графические символы и т. д.

Page 18: кодирование инф

18

Кодирование символов

Текстовый файл

• на экране (символы)

• в памяти – двоичные коды

10000012 10000102 10000112 10001002

В файле хранятся не изображения символов, а их числовые коды в двоичной системе!

!

65 66 67 68

А где же хранятся изображения?

Page 19: кодирование инф

Таким образом, компьютер различает символы по их коду. Присвоение символу конкретного кода является вопросом соглашения, которое фиксируется в конкретной кодовой таблице.В качестве международного стандарта принята кодовая таблица ASCII. В этой кодовой таблице латинские буквы (прописные и строчные) располагаются в алфавитном порядке.Расположение цифр также упорядочено по возрастанию значений .

Page 20: кодирование инф

Стандартными в этой таблице кодов ASCII являются только первые 128 символов,т. е. символы с номерами от нуля (двоичный код 00000000) до 127 (01111111). Первые 33 кода (с 0 до 32) соответствуют не символам, а операциям (перевод строки, ввод пробела и т.д.).Коды 33 до 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.

Page 21: кодирование инф

Остальные 128 кодов, начиная со 128 (двоичный код 10000000) и кончая 255 (11111111), используются для кодировки букв национальных алфавитов, символов псевдографикии научных символов.

В национальных кодировках одному и тому же коду соответствуют различные символы. К сожалению, в настоящее время существует 5 различных кодовых таблиц для русских букв, поэтому тексты созданные в одной кодировке, не будут правильно отображаться в другой.

Page 22: кодирование инф

22

Кодировка 1 байт на символ

0 1 254 255127 128

таблица ASCII (международная)

кодовая страница

ASCII = American Standard Code for Information Interchange0-31 управляющие символы:

7 – звонок, 10 – новая строка, 13 – возврат каретки, 27 – Esc.

32 пробелзнаки препинания: . , : ; ! ?специальные знаки: + - * / () {} []48-57 цифры 0..965-90 заглавные латинские буквы A-Z97-122 строчные латинские буквы a-z

Кодовая страница (расширенная таблица ASCII)для русского языка:

CP-866 для системы MS DOSCP-1251 для системы Windows (Интернет)КОИ8-R для системы UNIX (Интернет)

Page 23: кодирование инф

Хронологически одним из первых стандартов кодирования русских букв на компьютерах был код КОИ – 8 («Код обмена информационный – 8 битный»). Эта кодировка применяется в компьютерах с операционной системой UNIX.

Page 24: кодирование инф

Наиболее распространенная кодировка – это стандартная кириллистическая кодировка Microsoft Windows, обозначаемая сокращением CP1251 («CP» означает «Code Page»). Все Windows – приложения, работающие с русским языком, поддерживают эту кодировку.

Page 25: кодирование инф

Для работы в среде операционной системы MS-DOS используется «альтернативная» кодировка, в терминологии фирмы Microsoft – кодировка CP 866.

Page 26: кодирование инф

Фирма Apple разработала для компьютеров Macintosh свою собственную кодировку русских букв (Mac)

Page 27: кодирование инф

Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859 – 5.

Page 28: кодирование инф

1. КОИ-8 - UNIX

2. CP1251 («CP» означает «Code Page») - Microsoft Windows

3. CP 866 - MS-DOS

4. Mac - Macintosh

5. ISO 8859 – 5

Стандарты кодировок:Стандарты кодировок:

Page 29: кодирование инф

Таблица кодировки символовДвоичный

код Десятичный

кодКОИ8 CP1251 CP866 Mac ISO

0000 0000 0

………

0000 1000 8 Удаление последнего символа (клавиша Backspace)

………

0000 1101 13 Перевод строки (клавиша Enter)

………

0010 0000 32 Пробел

0010 0001 33 !

………

0101 1010 90 Z

………

0111 1111 127

……… 128 - Ъ А А К

………

1100 0010 194 Б В - - Т

………

1100 1100 204 Л М : : Ь

………

1101 1101 221 Щ Э - Ё Н

………

1111 1111 225 Ь я Нераз. пробел Нераз. пробел п

Page 30: кодирование инф

В последнее время появился новый международный стандарт Unicode, который отводит на каждый символ не один байт, а два, и поэтому с его помощью можно закодировать не 256 символов, 216=65 536 различных символов. Эту кодировку поддерживает платформа Microsoft Windows&Office97.

Page 31: кодирование инф

31

Кодировка UNICODE (UTF-16)

•Windows, MS Office, …•16 бит на символ

• 65536 или 216 символов в одной таблице

можно одновременно использовать символы разных языков (Интернет)

размер файла увеличивается в 2 раза

Page 32: кодирование инф

Задание : определите символ по числовому коду.• Запустите программу БЛОКНОТ• Нажмите ALT и 0224 (на дополнительной

цифровой клавиатуре).

• Появится символ а.• Повторите эту операцию для числовых кодов

от 0225 до 0233.• Появятся символы в кодировке (CP 1251

Windows).• Запишите их в тетрадь.

Page 33: кодирование инф

Задание 2: определите символ по числовому коду.• Запустите программу БЛОКНОТ• Нажмите ALT и 161 (на дополнительной

цифровой клавиатуре).• Появится символ.• Повторите эту операцию для числовых кодов

160, 169, 226.• Появятся символы в кодировке (CP 866 MS-

DOS).• Запишите их в тетрадь.

Page 34: кодирование инф

- ; II # $ % & I ( ) * + » - /

. зз 34 35 36 3? 38 33 40 41 42 43 44 45 46 47

0 1 2 3 4 5 6 7 8 9 1 < = > 9

. 43 50 51 52 53 54 55 56 5? 58 59 60 61 62 63

■ А В С D Е F G н 1 J К L M N 0

•i 65 66 67 68 63

то

Т1 72 73 74 75 76 77 T8 79

р Q R S

т иV W X Y

z[ \ 3

л

ео 81 82 83 84 85 86 81 88 89 90 91 92 33 94 35

» а b С

ае f Я h j i k 1 m n О

96 зт 38 83 100 101 102 103 104 105 106 107 108 109 110 111

Р q Г S t U V W X У z { I } ~

112 113 1U 115 116 11Т 118 113 120 121 122 123 124 125 126