Upload
dexter-garrison
View
72
Download
0
Embed Size (px)
DESCRIPTION
Алфавитный подход к измерению информации. Все множество используемых в языке символов называется алфавитом . Полное количество символов алфавита принято называть мощностью алфавита ( N). Сколько информации несет один символ в русском языке. П Р И В Е Т ! К А К Д. 2 I = N. - PowerPoint PPT Presentation
Citation preview
Алфавитный подход к измерению информации
• Все множество используемых в языке символов называется алфавитом.
• Полное количество символов алфавита принято называть мощностью алфавита (N).
Сколько информации несет один символ в русском языке
П Р И В Е Т ! К А К Д
2I = N
2I = 54. I = 5.755 бит.
Вот сколько информации несет один символ в русском тексте!
К. Поляков, 2006-2011 http://kpolyakov.narod.ru
Алфавит – набор знаков, используемых при кодировании информации с помощью некоторого языка.
Примеры: АБВГДЕЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯ 32 ABCDEFGHIJKLMNOPQRSTUVWXYZ
26 × O 2 0123456789
10
Мощность алфавита – количество символов.
Алфавитный подход
Все символы несут одинаковую информацию: Все символы несут одинаковую информацию:!
NI 2log мощность алфавитамощность алфавита
информационная емкость символаинформационная емкость символа
4
Таким образом, при алфавитном подходе к измерению информации количество информации от содержания не
зависит. Количество информации зависит от объема текста и от мощности алфавита
Количество информации C, содержащееся в символьном сообщении, равно K x i, где К – число символов в тексте сообщения, а i – информационный вес символа, который находится из уравнения
2 i = N, где N мощность используемого алфавита.
Количество информации в текстеА для того, чтобы найти количество информации во всем тексте,
нужно посчитать число символов в нем и умножить на I.Посчитаем количество информации на одной странице книги.
Пусть страница содержит 50 строк. В каждой строке — 60 символов. Значит, на странице умещается 50x60=3000 знаков. Тогда объем информации будет равен: 5,755 х 3000 = 17265 бит.
При алфавитном подходе к измерению информации количество информации зависит не от содержания, а от размера текста
и мощности алфавита.
К. Поляков, 2006-2011 http://kpolyakov.narod.ru
Алфавитный подходЗадача. Определить объем информации в сообщении
ПРИВЕТВАСЯ для кодирования которого используется русский алфавит
(только заглавные буквы).
Ответ: 10·5 бит = 50 бит
считаем все символы (здесь 10 символов) мощность алфавита – 32 символа (32=25) 1 символ несет 5 бит информации
Решение:
7
Задание :• Определите информационный объем страницы
книги, если для записи текста использовались только заглавные буквы русского алфавита, кроме буквы Ё.
Решение:1. N = 322. 2I = N3. 2I = 324. I = 55. На странице 3000 знаков, тогда объем
информации = 3000 * 5 = 15000 бит.
К. Поляков, 2006-2011 http://kpolyakov.narod.ru
Пример 1. Алфавит племени Мульти состоит из 8 букв. Какое количество информации несет одна буква этого алфавита? Слово, состоящее из пяти букв? Ответ: 3 бита, 15 бит.Пример 2. Сообщение, записанное буквами 64-х символьного алфавита, содержит 20 символов. Какой объем информации оно содержит?Решение: 2i = 64; i = 6 битовI = 20 * 6 = 120 битовОтвет: 120 битовПример 3. Для записи сообщения использовался 32-х символьный алфавит. Все сообщение занимает 4 страницы, на каждой странице по 30 строк, в каждой строке по 50 символов. Какое количество информации в этом сообщении?Решение: 2i = 32; i = 5 битовI = 4*30*50 * 5 = 30000 битов.Ответ: 30000 битов
Достаточный алфавит
Поскольку 256 = 28, то один символ этого алфавита «весит» 8 бит. Причем 8 бит информации — это настолько характерная величина, что ей даже присвоили свое название — байт.
1 байт = 8 бит
Количество информации в тексте
Пусть небольшая книжка, сделанная с помощью компьютера, содержит 150 страниц; на каждой странице — 40 строк, в каждой строке — 60 символов.
Значит страница содержит 40x60=2400 байт информации.
Объем всей информации в книге: 2400 х 150 = 360 000 байт.
К. Поляков, 2006-2011 http://kpolyakov.narod.ru
1) 4 2) 2 3) 8 4) 6
Задание 1. В алфавите формального (искусственного) языка
всего два знака-буквы («+» и «-»). Каждое слово этого языка состоит из двух букв. Максимальное число слов этого языка:
Решение.Решение задачи сводится к поиску количества (N)
комбинаций строк длиной (i) 2 символа, составленных из 2 знаков. Следовательно, используя формулу 2i = N, получаем 22 = 4.
Ответ: 1.
К. Поляков, 2006-2011 http://kpolyakov.narod.ru
1) 8 бит 2) 1 байт 3) 3 бита 4) 2 бита
Задание 2. Алфавит племени содержит всего 8 букв. Какое
количество информации несет одна буква этого алфавита?
Решение.Мощность алфавита племени – 8 букв. Применим формулу 2i
= N, где N – мощность алфавита, i – количество бит на один символ алфавита. 2i =8, i=3 бит, что соответствует варианту ответа №3.
Ответ: 3.
К. Поляков, 2006-2011 http://kpolyakov.narod.ru
1) 10 2) 16 3) 4 4) 8
Задание 3.
Если вариант теста в среднем имеет объем 20 килобайт (на каждой странице теста 40 строк по 64 символа в строке, 1 символ занимает 8 бит), то количество страниц в тесте равно:
Решение.Известен информационный объем теста и
информационный «вес» одного символа в нем. Найдем объем одной страницы: 40*64*8 бит. 20 Кбайт = 20*1024 байт = 20*1024*8 бит. Найдем количество страниц: 20*1024*8/(40*64*8) = 8 (стр.) (Ответ № 4)
Ответ: 4.
К. Поляков, 2006-2011 http://kpolyakov.narod.ru
1) 5000 байт 2) 5120 байт 3) 500 байт 4) 5000 бит
Задание 4. В пяти килобайтах:
Решение.5 Кб = 5*1024 байт = 5120 байт, что соответствует ответу №2.Ответ: 2
К. Поляков, 2006-2011 http://kpolyakov.narod.ru
1) 235 2) 16*220 3) 224 4) 222
Задание 5 Сколько байт в 32
Гбайт?
Решение.32Гб = 25 Гб = 25*210 Мб = 25*210 *210 Кб =25*210 *210*210 байт = 235 байт, что соответствует ответу №1.Ответ: 1.
К. Поляков, 2006-2011 http://kpolyakov.narod.ru
Задание 6. Считая, что один символ кодируется одним байтом,
подсчитать в байтах количество информации, содержащееся в фразе: “Терпение и труд все перетрут.”
Решение. В фразе 29 символов (включая точку и пробелы), 1 символ
несет 1 байт информации, значит фраза содержит 29 байт.Ответ: 29.
К. Поляков, 2006-2011 http://kpolyakov.narod.ru
1) 108 бит 2) 864 бит 3) 108 килобайт 4) 864 килобайт
Задание 7. (Задание А2 демоверсии 2004 г.)Считая, что каждый символ кодируется одним байтом,
оцените информационный объём предложения: «Мой дядя самых честных правил, Когда не в шутку занемог, Он уважать себя заставил И лучше выдумать не мог.»
Решение.Предложенная строка содержит ровно 108 символов,
включая кавычки, пробелы и знаки препинания. При кодировании каждого символа одним байтом на символ будет приходиться по 8 бит, поэтому объём этого предложения составит 108 байт или 108х8=864 бит, что соответствует ответу №2.
Ответ: 2.
К. Поляков, 2006-2011 http://kpolyakov.narod.ru
1) 4 2) 5 3) 6 4) 7
Задание 8. (Задание А3 демоверсии 2004 г.)Шахматная доска состоит из 64 полей: 8 столбцов и 8 строк.
Какое минимальное количество бит потребуется для кодирования координат одного шахматного поля?
Решение.Для того, чтобы различить 64 клетки шахматного поля
потребуются 64 значения двоичного кода. Поскольку 64=26, то в двоичном коде потребуется шесть разрядов. Верный ответ-№3.
Ответ: 3.
К. Поляков, 2006-2011 http://kpolyakov.narod.ru
1) 5 2) 2 3) 3 4) 4
Задание 9. (Задание А4 демоверсии 2004 г.)Получено сообщение, информационный объём
которого равен 32 битам. Чему равен этот объём в байтах?
Решение. 1 байт = 8 бит, следовательно, 32/8=4, что соответствует
ответу №4.Ответ: 4.
К. Поляков, 2006-2011 http://kpolyakov.narod.ru
1) 10 2) 100 3) 125 4) 1000
Задание 10. Каждое показание счётчика, фиксируемое в памяти
компьютера, занимает 10 бит. Записано 100 показаний этого датчика. Каков информационный объём снятых значений в байтах?
Решение. 10 бит*100= 1000 бит, 1 байт = 8 бит, следовательно:
1000/8=125 байт. Значит, верный ответ №3.Ответ: 3.
Скорость передачи информации
Прием-передача информации могут происходить с разной скоростью.
Количество информации, передаваемое за единицу времени, есть скорость передачи информации или скорость информационного потока.
Очевидно, эта скорость выражается в таких единицах, как бит в секунду (бит/с), байт в секунду (байт/с), килобайт в секунду (Кбайт/с) и т.д.
К. Поляков, 2006-2011 http://kpolyakov.narod.ru
Задачи: передача информацииСкорость передачи данных через ADSL-соединение равна 256000 бит/c. Передача файла через это соединение заняла 2 минуты. Определите размер файла в килобайтах.
время передачи: 2·60 сек=120 сек передано информации
256 ·1000·120 бит = 28· 23·125 · 22·30 бит=
Решение:
Ответ: объем файла 3750 Кбайт
213·125·30 Кбайт213
23
1. Информационное сообщение объемом 1,5 Кбайта содержит 3072 символа. Сколько символов содержит алфавит, при помощи которого записано это сообщение?
Дано: I = 1,5 Кб, К = 3072 символа. Найти: N — ? Решение. I = 1,5 Кб = 1,5 • 1024 • 8=12 288 бит. N = 2i = 24 = 16 символовОтвет: 16 символов.
2. Книга, набранная с помощью компьютера, содержит 150 страниц, на каждой странице — 40 строк, в каждой строке — 60 символов. Каков объем информации в книге?
Дано: страниц – 150, одна страница — 40 строк, одна строка – 60 символов,
Найти: I — ?
Решение.• 150 • 40 • 60 = 360 000 — количество символов во всей
книге. • Если в компьютер ном тексте 1 символ несет в себе 1
байт информации, то объем информации в книге равен:• 360 000 • 1 байт = 360 000 байт. • Переведем в другие единицы измерения: 360 000 байт =
0,3 Мб• Ответ: Объем информации в книге составляет
приблизительно 0,3 Мб.
3. Сообщение занимает 2 страницы и содержит 1/16 Кбайта информации. На каждой странице записано 256 символов. Какова мощность использованного алфавита?
Дано: I = 1/16 Кб, страниц — 2, одна страница — 256 символов.
Найти: N — ? Решение.I = 1/16 Кб=1/16*1024*8=512битК = 256 * 2 = 512 символов на двух страницах. i=1/K=512/512=1битN= 2i = 21 = 2 символаОтвет: 2 символа.
4. Подсчитайте, используя алфавитный подход к измерению информации, сколько бит информации содержится в тексте, заключенном в кавычки: «Кодирование информации с помощью знаковых систем». Учесть, что между словами ставится только один пробел и для кодирования информации используется кодировка Windows CP1251(таблица кодировки содержит 256 символов).
Решение: 48 символов по 1 байту. Количество информации 48*8=384 бит.
Ответ: 384 бит.
Дома: Решить задачу: Для записи сообщения использовался 64-х символьный алфавит. Каждая страница содержит 30 строк. Все сообщение содержит 8775 байтов информации и занимает 6 страниц. Сколько символов в строке?