Upload
ferris-wheeler
View
49
Download
5
Embed Size (px)
DESCRIPTION
Základy informatiky. přednášky. Rovnoměrné a nerovnoměrné kódy. ZÁKLADY INFORMATIKY – Rovnoměrné a nerovnoměrné kódy. Vznik a vývoj teorie informace Matematický aparát v teorii informace Základy teorie pravděpodobnosti – Náhodné veličiny Číselné soustavy Informace - PowerPoint PPT Presentation
Citation preview
1. Vznik a vývoj teorie informace
2. Matematický aparát v teorii informace• Základy teorie pravděpodobnosti – Náhodné veličiny• Číselné soustavy
3. Informace• Základní pojmy – jednotka a zobrazení informace, informační hodnota• Entropie – vlastnosti entropie• Zdroje zpráv – spojité zdroje zpráv, diskrétní zdroje zpráv• Přenos informace – vlastnosti přenosu kanálů, poruchy a šumy přenosu,
způsoby boje proti šumu
4. Kódování• Elementární teorie kódování• Rovnoměrné kódy – telegrafní kód• Nerovnoměrné kódy – Morseova abeceda, konstrukce nerovnoměrných
kódů• Efektivní kódy – Shannonova – Fanova metoda, Huffmanova metoda
5. Bezpečností kódy • Zabezpečující schopnosti kódů, • Systematické kódy, • Nesystematické kódy
ZÁKLADY INFORMATIKY – Rovnoměrné a nerovnoměrné kódyZÁKLADY INFORMATIKY – Rovnoměrné a nerovnoměrné kódy
Rovnoměrné kódyRovnoměrné kódy
Rovnoměrné kódyRovnoměrné kódyRovnoměrné kódy jsou takové kódy, u kterých se každému znaku zdrojové abecedy přiřadí stejný počet kódových znaků.
Z toho důvodu mají tyto kódy velkou výhodu při dekódování.
Nerozšířenější příklady rovnoměrných kódů jsou: telegrafní kód a ASCII kód.
Telegrafní kód se používá v dálnopisných sítích. Verze MTA2 se používá už od roku 1932.
Roku 1820 Oersted zjistil, že kolem elektrického vodiče (drátu) vzniká elektromagnetické pole schopné otáčet ručičkou kompasu.
Telegrafní kódTelegrafní kód
Na tomto principu vznikl elektromagnet a další vývoj už byl "jen" otázkou dobrých nápadů. V roce 1832 se objevují první jehlové telegrafy (tehdy se říkalo galvanoměrygalvanoměry).
Systém používá pěti jehlových ukazatelů k indikaci zvláštního kódu, jehož význam se pak hledá ve slovníku.
V tom samém roce se objevuje Samuel F. B. MorseSamuel F. B. Morse jehož jméno je spojeno s
ELEKTROMAGNETICKÝM telegrafem.
Zdrojová abeceda obsahuje
• všechny písmena anglické abecedy, číslice 0, 1, ... , 9
• a některá interpunkční znaménka.
Každému znaku zdrojové abecedy je přiřazena konkrétní pětice kódových znakůpětice kódových znaků 0 a 1.
O rok později už předvádí své první zařízení pro přenos signálů po drátě: na jednom konci zapíná vypínač a na druhém označuje papírovou pásku.
V roce 1840 dostává MORSE patent na záznamový elektrický telegraf a telegrafní symboly.
Protože písmen anglické abecedy je 26, k tomu ještě 10 číslic (a nějaká interpunkční znaménka), kapacita kódu, která je rovna 25=32 znaků, je
nepostačující.
Tento problém se řeší tak, že se většina pětic znaků využívá dvakrát. K jejich rozlišení se používá tzv.
změna registru.
Pro písmenovou změnu je přiřazené kódové slovo 11111 a pro číslicovou změnu 11011.
To umožňuje, abychom mohli zakódovat 2.25-2=62 zdrojových znaků.
Písmena Číslice Kód Písmena Číslice Kód 1. A - 11000 17. Q 1 11101 2. B ? 10011 18. R 4 01010 3. C : 01110 19. S , 10100 4. D kdo tam? 10010 20. T 5 00001 5. E 3 10000 21. U 7 11100 6. F “ 10110 22. V ů 01111 7. G ˇ 01011 23. W 2 11001 8. H ´ 00101 24. X / 10111 9. I 8 01100 25. Y 6 10101
10. J zvonek 11010 26. Z + 10001 11. K 11110 27. návrat vozíku 00010 12. L 01001 28. posun o řádek 01000 13. M . 00111 29. písmenová
změna 11111
14. N , 00110 30. číslicová změna 11011 15. O 9 00011 31. mezera 00100 16. P 0 01101 32. nepoužito 00000
11111 00111 10100 00100 10010 00011
Písmenová M S mezera D Ozměna
10100 00100 11011 11100 00111 01101
S mezera číslicová 7 . 0změna
Příklad: Pomocí tabulky telegrafního kódu zakódujte zprávu„MS DOS 7.0“
Protože existují 22 = 4 různé dvojice kódových znaků 0 a 1 stačí kódovat takto:
a1 = 00 a2 = 01 a3 = 10
Příklad: Abeceda zdroje má tři znaky A={a1, a2, a3}. Zakódujte znaky zdroje rovnoměrným kódem.
V současné době, době počítačů a počítačových sítí ztrácí dálnopisy význam. Telegrafní kód je již dlouho nepostačující současným potřebám přenosu dat.
V šedesátých letech proto vznikl v USA kód vyvinutý speciálně pro mikropočítače - ASCII
Zdrojová abeceda obsahuje kromě písmen anglické abecedy a číslic i znaky používané ve výpočetní technice (malá písmena, algebraické znaky +,,,=...).
Každému z 27=128 znaků zdrojové abecedy se přiřadí sedmicesedmice kódových znakůkódových znaků 0 a 1.
ASCII kódASCII kód
Zdokonalováním ASCII kódu se vyvinulo mnoho
dalších rovnoměrných kódů např. ISO-7, ISO-8
Z ISO-7 se vycházelo při sestavování osmi prvkového kódu ISO-8.
Osmý paritní bit ISO-7 byl nahrazen významovým bitem umožňujícím vyjádřit malá i velká písmena např. azbuky a v české verzi písmena s háčky a čárkami (prvních 7 sloupců kódové tabulky ISO-8 je shodných se sloupci ISO-7).
1010100 1100101 1100011 1101000 1101110 1101111 1101100 1101111 T e c h n o l o 1100111 1101001 1100011 1101011 1100001 1000110 1100001 1101011 g i c k a F a k 1110101 1101100 1110100 1100001 u l t a
Příklad: Pomocí tabulky ISO-7 kódu zakódujte zprávu „Technologická Fakulta“
Nerovnoměrné kódy
Nerovnoměrné kódy
Nerovnoměrné kódyNerovnoměrné kódy
Nerovnoměrné kódy jsou takové kódy, kdy se jednotlivým znakům zdrojové abecedy přiřazují kódová slova, která mají různý počet znakůrůzný počet znaků.
Nejznámějším a nejrozšířenějším příkladem
tohoto kódování je Morseova abeceda.
Charakteristickou vlastností tohoto kódu je, že zohledňuje pravděpodobnostní strukturu zdrojové abecedy.
To znamená, že znakům s vyšší frekvencí výskytu je přiřazeno kratší kódové slovo a naopak znakům s nižší frekvencí výskytu delší kódové slovo.
Morseova abecedaMorseova abeceda
Je obecně známo, že Morseova abeceda
obsahuje znaky .(tečka) a - (čárka) .
Bližším zkoumáním bychom zjistili, že to není úplně pravda protože kódová abeceda obsahuje znaky tři.
Plyne to z pravidel vysílání:
- čas vysílání znaku . je t - čas vysílání znaku - je 3t - mezi znaky . a - je pauza t - mezi zdrojovými znaky je pauza 3t - mezi zdrojovými slovy je pauza 6t
Z toho kódová abeceda je:
Y={ y1, y2, y3 }
y1= . + t
y2= - + t
y3= 3t
Písmena Kód Písmena Kód Písmena Kód Písmena Kód
A . - K - . - U . . - 5 . . . . .
B - . . . L . - . . V . . . - 6 - . . . .
C - . - . M - - W . - - 7 - - . . .
D - . . N - . X - . . - 8 - - - . .
E . O - - - Y - . - - 9 - - - - .
F . . - . P . - - . Z - - . . 0 - - - - -
G - - . Q - - . - 1 . - - - - pozor - . - . -.
H . . . . R . - . 2 . . - - - nerozumím . . . . . . . .
I . . S . . . 3 . . . - - konec . . . - . -
J . - - - T - 4 . . . . - rozumím - - - - . -
TABULKA MORSEOVY TABULKA MORSEOVY ABECEDYABECEDY
a) do Morseové abecedy
b) do kódové abecedy Y
Řešení:
Z I M N Í S E M E S T R
a) --.. .. -- -. .. ... . -- . ... - .-.
b) y2 y2 y1 y1 y3 y1 y1 y3 y2 y2 y3 y2 y1 y3 y1 y1 y3 y3 y1 y1
y1 y3 y1 y3 y2 y2 y3 y1 y3 y1 y1 y1 y3 y2 y3 y1 y2 y1 y3
ZDE JE MOŽNO SI VYZKOUŠET MORSEOVU ABECEDU
Příklad: Pomocí tabulky Morseové abecedy zakódujte zprávu „ZIMNÍ SEMESTR“
Ke konstrukci nerovnoměrných kódů se využívají grafy.
V teorii grafů se takovýto graf nazývá strom.
Strom obsahuje uzly a z každého uzlu stromu vycházejí dvě hrany.
Posloupnost za sebou následujících hran se nazývá cesta.
Konstrukce nerovnoměrných kódůKonstrukce nerovnoměrných kódů
Po dohodě, že při pohybu po stromě od jednoho uzlu k druhému přiřadíme:
směrem doprava - 1
směrem doleva - 0
0
0
0
1
1
111
101100
Z toho vyplývá, že každé cestě začínající v kořeni stromu odpovídá nějaké kódové slovo a každému kódovému slovu je jednoznačně přiřazena nějaká cesta začínající v kořeni stromu.
Platí:
Přiřadíme-li zdrojovému znaku aaii nějakou cestu
začínající v kořeni stromu, pak žádné jiné zdrojové slovo aajj a a
ii nemůže mít přiřazenou cestu, která
by obsahovala celou cestu přiřazenou znaku aaii..
Toto pravidlo se označuje jako
vlastnost předpony - P (prefix property)
a takovéto kódy se nazývají P-kódy.
Tyto kódy jsou jednoznačně dekódovatelné!
Jejich dekódování spočívá v postupném ověřování patří-li přijaté kódové slovo (nebo jeho část) do kódu, nebo ne.
Uvažujme, že pro zdrojovou abecedu A={A={aa11, a, a22,...,a,...,a
NN}}
zadáme dopředu délku kódových slov příslušících jednotlivým zdrojovým znakům.
Budeme tedy vyžadovat, aby znaku aaii A A odpovídalo
kódové slovo délky nnii, i=1, ..., N, i=1, ..., N.
Mc Millan (1956) dokázal, že pro jednoznačně dekódovatelný kód s délkami kódových slov
n1, n2, ..., nN platí:
121
N
i
ni
Zde je možné vyzkoušet
Mc Millanovu podmínku:
) Zjistíme, existuje-li takový kód pomocí
Mc Millanova vztahu:
2-2 + 2-2 + 2-3 + 2-3 + 2-4 + 2-5 + 25 =
= 0.25 + 0.25 + 0.125 + 0.125 + 0.0625 + 0.03125 + 0.03125 = 0.8751
Příklad: Sestrojte kód pro zdrojovou abecedu, která obsahuje 7 písmen, jsou-li dány délky jednotlivých kódových slov takto: 2, 2, 3, 3, 4, 5, 5 2, 2, 3, 3, 4, 5, 5.
Znamená to, že takový kód existuje a stačí obsadit libovolné:
2 uzly na druhé úrovni2 uzly na druhé úrovni
2 uzly na třetí úrovni2 uzly na třetí úrovni
1 uzel na čtvrté 1 uzel na čtvrté úrovniúrovni 2 uzly na páté úrovni2 uzly na páté úrovni
)) Sestrojíme jeden z možných kódů:Sestrojíme jeden z možných kódů:
0. úroveň
1. úroveň
2. úroveň
3. úroveň
4. úroveň
5. úroveň
00 01
100 101
11010 11011
1111
Výsledný kódVýsledný kód je { je { 00,01,100,101,1111,11010,1101100,01,100,101,1111,11010,11011 }.}.
0 1
Začneme-li teď uvažovat o otázce kódových slov z hlediska pravděpodobnostní struktury zdrojové abecedy, přiřadíme zdrojové abecedě A={A={aa11,a,a22,...,a,...,a
77 } }
pravděpodobnosti:
A a1 a2 a3 a4 a5 a6 a7
P(A=ai
) 0.2 0.1 0.2 0.1 0.1 0.1 0.2
Na jejich zakódování použijeme kód vytvořený v příkladu:
K 00 01 100 101 1111 11010 11011
ni 2 2 3 3 4 5 5
Vypočítejme teď, kolik kódových znaků musíme vyslat, chceme-li poslat zprávu obsahující 1000 zdrojových znaků:
= 3400 kódových znakůZ toho vyplývá, že na jeden zdrojový znak připadne 1/1000 tzn. 3.4 kódového znaku.
( Toto číslo je průměrná délka kódového slovaprůměrná délka kódového slova při nezávislém vysílání zdrojových znaků ).
)52.051.041.031.032.021.022.0(1000
)(1000)(10007
1
7
1
i
iii
ii naPnaP