97

Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Embed Size (px)

Citation preview

Page 1: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana
Page 2: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Istorija ASCII koda

ASCII kod je prvi put korišćen kao 7-bitni teleprinterski kod.

Nastao je od telegrafskog koda.

Rad na ASCII standardu je počeo 6.10.2016. na prvom sastanku organizacije ASA danas poznate kao ANSI (američki nacionalni zavod za standardizaciju).

ASCII kod je prvi put objavljen 1963 godine ali je menjan dva puta 1867. godine i 1986. godine.

Page 3: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

O ASCII kodu

ASCII kod je 7-bitni kod koji se sastoji

od 128 karaktera (33 kontrolna

karaktera).

Uveden je kako bi se standardizovala

komunikacija medju računarima.

U ASCII kodu postoji ukupno 95

karaktera koji se mogu štampati od 2016

do 7E16 (2016 je “SPACE” karakter i ulazi

u karaktere koji se mogu štampati).

Page 4: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

prikaz karaktera u

ASCII kodu

Page 5: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

O YUSCII kodu

YUSCII kod je adaptacija ASCII koda

korišćena u bivšoj Jugoslaviji pre pojave

ISO-8 i univac standarda.

YUSCII kod je neformalno ime za

nekoliko JUS standarda za 7-bitno

kodiranjemeđu kojima su JUS

I.B1.002(latinica), JUS I.B1.003(Srpska

ćirilica) i JUS I.B1.004(Makedonska

ćirilica).

Page 6: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

O YUSCII kodu

YUSCII kod je standardan ASCII kod u kome su ređe korišćeni simboli zamenjeni slovima iz latinice u JUS I.B1.002 odnosno ćirilice u JUS I.B1.003.

Korišćen je za teleprintere ali i u računarima.

Među programerima je smatran kao loša ideja jer su mu nedostajali znaci poput {, [, }, ], ^, ~, |, \ koji su im bili potrebni.

Page 7: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Zanimljivosti

Sva mala i velika slova u standardnom

ASCII kodu se razlikuju samo po

vrednosti petog bita, kod velikih slova on

je 0 a kod malih 1.

Na primer:

G je 1000111

g je 1100111

Page 8: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Zanimljivosti

Peti i Šesti bit određuju kojoj od četiri

ASCII grupe karakter pripada

00 su kontolni kontrolni karakteri

01 su cifre i interpunkciski znaci

10 su velika slova i specijalni karakteri

11 su mala slova i specijalni karakteri

Page 9: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Izvori

https://en.wikipedia.org/wiki/ASCII

https://en.wikipedia.org/wiki/YUSCII

Hvala na pažnji

Page 10: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

ASCII kod

ASCII (Američki standardni kod za razmenu podataka) je skup znakova i kodna stranica utemeljena na

latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana latinica.To je sedmobitni

kod.Prvi put ga je objavilo Američko udruženje za standarde 1963.Proizveo ga je servis za podatke Bell Sistem

Bell.Istorijski gledano njegova 1. upotreba je je bila sedmobitni teleprinterski štampač.Neke mogućnosti ASCII-

a,uključujući i iskejp sekvence,dodate su zahvaljujući Bobu Bumeru.

Prva 32 koda u tabeli ASCII-kodova su rezervisana za upravljačke znakove(upravljaju štampačima,skenerima...)

Npr. kod čija je vrednost 10 nalaže štempaču da pomeri papir na gore za 1 red,dok za vrednost 27 simula

pritisak na taster iskejp.Kod 127 poznat je i kao „briši“.Upravljački znakovi XON i XOFF se koriste da kontrolišu

tok podataka sa nekog brzog uređaja an neki spor uređaj da ne bi došlo do preskakanja i gubjenja

podataka.Kod 32 se koristi za razmak između 2 reči.Kodovi od 33 do 126 se nazivaju štampajućim znakovima

koji predstavljaju slova,cifre,znakove interpunkcije...

U početku druge varijante ASCII-a su počele da se prave kako bi se osim engleskog izrazili drugi jezici.Prvi takav

pokušaj se dogodio 1972. godine kada je napravljen ISO 464.Kasnije razvojom tehnologije razvili su se

osmobitmni standardi kao što je ISO/IEC 8859 koji su predstavljali proširenje ASCII-a.Unikod i ISO/IEC 8859

imaju daleko širi izobr znakova i oni ubrzo zamenjuju ISO/IEC 8859 i ASCII.Može se reći da su oni proširenje

ASCII-a.

Page 11: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

ASCII kod

Page 12: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

ASCII je skraćeno za American Standard Code forInformation Interchange (Američki Standardni Kod zaRazmenu informacija)

Izgovara se „aski“

Standard je za kodiranje karaktera

ASCII kodovi predstavljaju tekst u kompjuterima,telekomunikacionoj opremi i drugim uređajima.

U našim krajevima se ponekad naziva „ošišana latinica“

Osnovno o ASCII

Page 13: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana
Page 14: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Prvi standard je objavljen 1963. godine, 3 godine nakonšto je započet rad na ASCII kodu (6. oktobar 1960).

Došlo je do velikih ispravki 1967. godine, dok je poslednjapromena nastala 1986. godine

Za razliku od ranijih kodova, ASCII je organizovan tako dabude što lakše sortirati liste alfabetički.

Većina modernih načina kodiranja karaktera su baziranina ASCII, iako sadrže mnogo dodatnih karakera.

Kratka istorija ASCII koda

Page 15: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Mladen =

01001101 01101100 01100001 01100100 01100101 01101110

Puzic =

01010000 01110101 01111010 01101001 01100011

ASCII =

01000001 01010011 01000011 01001001 01001001

Primeri ASCII koda

Page 16: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

ASCII umetnost je tehnika grafičkog dizajn koja koristi 95ASCII karaktera koje je moguće ispisati da napravi slike.

Koristila se na pisaćim mašinama, negrafičkimkompjuterskim terminalima, email i izvornim kodovima.

Bila je korisna u situacijama u kojima nije bilo mogućekoristiti slike ili gde je tekst bio čitljiviji od slika.

ASCII umetnost

Page 17: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana
Page 18: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana
Page 19: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana
Page 20: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

KODOVI

Page 21: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Ukratko o ASCII kodu

-To je skup znakova i kodna stranica utemeljena na latinskom pismu

koje koristi engleski jezik (i jos neki zapadnoevropski).

ASCII je sedmobitni kod, tj. koristi sedam binarnih cifara (0-127 u

dekadnom).

Prva 32 koda u ASCII tabeli (0-31) su rezervisana za upravljacke

znakove (npr. kod vrednosti 10 je komanda „novi red“).

Rani korisnici ASCII koda su iskoristili neke upravljacke znakove da

predstavljaju posebne vrste podataka (npr. povratak na pocetak

reda).

Page 22: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

ASCII umetnost

To je umetnicki medij koji se pre svega pojavljuje u racunarima za

prezentaciju.

Sastavljen je od slika koje cini 95 karaktera (definisanih ASCII kodom,

naravno).

Na slici desno je prikazan primer ASCII umetnosti.

Page 23: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

ASCII kod:

Page 24: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

EBCDIC kod

EBCDIC je skracenica od Extended Binary Coded Interchange

code.

8-bitni kod. Slika koda je prikazana dole.

Page 25: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

UNIKOD (UNICODE)

Je industrijski standard za endokovanje, prikaz I rukovanje tekstom iz

vecine svetskih pisama.

Osnovni problem sa kodnim stranama je to sto se medjusobno

iskljucuju, tj. cijeli dokument mora da bude napisan istim pismom.

To nije uglavnom problem realizovati, ali recimo u turistickom vodicu

gde treba “mesati” jezike (tj. postoji tekst I na srpskom I na

engleskom I ceskom itd).

Odatle ideja da se napravi jedinstveni kod za sve jezike – UNIKOD.

Logo UNIKOD-a:

Page 26: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

UNIKOD za Ceski, Madjarski I

Skandinavske zemlje

Page 27: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

YUSCII kod

Enkodira latinicu, cirilicu (srpsku I makedonsku).

Korisceni u Jugoslaviji.

Nije vise u upotrebi (jedan od razloga je postojanje UNIKODA).

Evo kako je YUSCII kod zapravo izgledao:

Page 28: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

84 72 69 69 78 68 *

* “THE END”, zapisano u ASCII kodu.

Page 29: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Prva verzija ASCII standarda objavljena je 1963.

Današnja verzija je objavljena 1986.

Prva 32 karaktera su kontrolni karakteri

Bit 5 i 6 oznacavaju kojoj grupi karaktera pripada:

Bit 6 Bit 5 Grupa

0 0 Kontrolni karakteri

0 1 Cifre i interpunkcija

1 0 Velika slova i specijalni karakteri

1 1 Mala slova i specijalni karateri

Mala slova se mogu pretvoriti u velika(i obrnuto) promenom petog bita

Ruski standard KOI7 je modifikacija ASCII standarda takva da su sva

mala slova zamenjena velikim ćiriličnim, pa nisu postojala mala slova

Unicode standard razvijen je 1990-ih godina

Cilj je da se dogovori jedan standard za sve karaktere koji postoje

Najnovija verzija je Unicode 9.0, sadrži malo više od 128000 karaktera

Jedan od problema je što nije uzeto u obzir da se karakteri nekih ćiriličnih

pisama razlikuju, što se najčešće ispoljava u Italic-u.

UTF-8 je standard sposoban da zapiše sve karaktere kao Unicode, ali da

zauzima manje prostora za češće karaktere

Sastavili su ga Ken Tompson (razvijo UNIX operativni sistem) i Rob Pajk

Page 30: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Domaći rad o kodovima

YUSCII – 7-bitni kod, kodiranja zasnovana na ISO 646. Korišćen je u Jugoslaviji pre nego što

su ušli u upotrebu ISO 8859-2, Windows -1250/1251 i Unicode. Ime dobio po ASCII kodu.

Onog trenutka kada su računari zaživeli po celom svetu, a ne samo na engleskom govornom

području, javili su se problemi sa nacionalnim znakovima. ASCII je već bio popunjen, pa je

jedno od prvih rešenja bilo da se pojedini simboli "žrtvuju". Tako su kodne reči rezervisane u

ASCII-ju za '@', '[', '\', ']', '^', '`', '{', '|', '}', '~' kod nas pridružene simbolima 'Ž', 'Š', 'Đ', 'Ć', 'Č', 'ž',

'š', 'đ', 'ć', 'č' i tako je nastao YUASCII ili YUSCII.

ASCII - 7-bitni kod i predstavlja standardni kod za čuvanje i prenošenje informacija sa jednog

računara na drugi. U vreme kada je nastao, njegovo korišćenje je planirano samo na engleskom

govornom području, te se stoga naša slova ne nalaze među njegovih 128 karaktera (numerisanih

od 0 do 127). U međuvremenu su se javile potrebe za većim brojem karaktera i samim tim

kodovima veće širine, ali ASCII je ostao sastavni deo svih modernih kodova koji se danas široko

primenjuju.

ISO-8859-2 - 8-bitni kod. Prvih 128 karaktera su identični sa ASCII karakterima i obično se

nazivaju donja kodna strana. Naša slova se nalaze među preostalih 128 karaktera u tzv. gornjoj

kodnoj strani.

UNICODE – 16-bitni kod. Prvih 256 Unicode-kodova se poklapaju sa karakterima u ISO-8859-

1 i nazivaju se kao Latin -1 podskup Unicode-a. Naša slova pripadaju narednom delu od 128

karaktera, Latin Extended – A podskup Unicode-a.

Page 31: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

-ASCII(skraćenica od „Američki standardni kod za razmenu podataka“) u srpskom jeziku se

naziva ošišana latinica jer ne sadrzi š,č,ć,đ,ž. Slično drugim kodovima, ASCII određuje odnos

između skupova bitova i znakova pisanog jezika, i omogućava digitalnim uređajima da

međusobno komuniciraju i obrađuju i čuvaju podatke koje sadrže znakove. ASCII je sedmobitni

kod, što znači da koristi sedam binarnih cifara dok se osmi bit uglavnom koristi za proveru

grašaka u prenosu podataka. ASCII je kao standard prvi put objavilo Američko udruženje za

standarde 1963 godine.

-EBCDIC(Extended Binary Coded Decimal Interchange Code) je osmo bitni znakovni sistem koji se

koristi na IBM mainframe z/OS, s/390, AS/400 i i5/OS. EBCDIC kodni sistem razvio se od 6-

bitnog BCD sistema za kodiranje bušenih kartica.

-ISO-8 je osmobitni kod sa 256 karaktera.

-IBM-PC je osmobitni kod čijih se prvih 127 pozicija poklapa sa ISO-8 i ASCII kodom.

-UNICODE je industrijski standard za dosledno enkodovanje, prikaz i rukovanje tekstom iz

većine svetskih pisama. Postoji više verzija Unikoda. Osnovna verzija je dvobajtni format zapisa

do 216 = 65536 znakova. Njen naziv je USC -2 zato što koristi dva okteta, odnosno dva bajta.Sa 16

bitova je rešen problem zapisa svih postojecih pisama. Postoji i noviji UNICODE standard pod

nazivom UCS-4 koji koristi 4 bajta za zapis 231 = 2147483648 znakova podeljenih u tzv. ravni.

Prva dva bajta definišu ravan, tako da ima 215= 32768 ravni. Druga dva bajta definišu znak unutar

ravni, tako da ima 216 = 65536 znakova po ravni.

-UTF-8 je zamišljen kao format koji najviše odgovara latiničnom tekstu. To je veoma pogodno za

korišćenje u izvornom kodu programa ili u raznoraznim markup jezicima jer su standardne

komande tih programskih/markup jezika uvek ASCII, a tekst koji se koristi može da bude i ASCII i

UTF-8. Na taj način se ne ometa rad programskog kompajlera ili parsera markup jezika, a

omogućava se korišćenje višejezičke podrške.

-YUSCII je vrezija ASCII koda prilagođena za potrebe Jugoslavije.

Page 32: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Korišćenje naših karaktera

U ranim verzijama Windows-a korisnici, su se dovijali na razne načine da bi dobili "naše

karaktere". Neki fontovi su sadržali prepravljene tabele, tako da su se umesto engleskih

karaktera koji se ređe koriste ubacivala naša slova (š, đ, č, ć i ž). Najčešće korišćeni tzv. kodni

raspored je bio YUSCII. Fontovi po ovom rasporedu koriste se još i danas (iako sve manje).

Njihov kvalitet je uglavnom jako loš; neki karakteri su izbačeni iz fonta (pa se ne mogu dobiti

znaci poput "@", "^", "\" ili "~"); pri prenosu dokumenta na drugi računar, verovatno naša slova

su se gubila, osim ako ne bismo odneli i instalirali font koji smo koristili. Problem je bio I što

oznake na tasterima tastature nisu postojale ni po jednom od naših bivših "standarda".

Haos koji je nastao iz upotrebe ovog kvazi-standarda su hiljade različitih oblika slova, a išlo se

dotle da su pojedini korisnici imali svoj lični font. Jedina opravdana upotreba je bila u pripremi

grafičkog materijala gde se priprema za štampu obavljala na lokalnom računaru, a na njemu nije

postojao nijedan sličan font po Unicode standardu.

Razmena dokumenata je najbitniji deo priče. Na našem podneblju u "divlje vreme" nepostojanja

razvijenog standarda u praksi zaživelo je čak desetak različitih kodnih rasporeda (osim

standardnog i prihvatljivog CP 852 i najraširenijeg YUSCII rasporeda, tu su bili i Custom 1/2/3,

MacCustom, JUS.015...) pa su korisnici gubili dragoceno vreme prilagođavajući setove

karaktera pri razmeni dokumenata. Najčešće korišćeni "naš raspored" je bio YUSCII koji vuče

korene još iz DOS-a, iako je DOS imao predviđen kodni raspored za naše podneblje po imenu

CP 852.

Kodna strana 852 (poznata kao CP 852, IBM 00852, OEM 852 (Latin II), MS-DOS Latin 2) je kodna strana korišćena pod DOS-om za pisanje na centralno evropskim jezicima (kao što su srpski, hrvatski, češki, mađarski, poljski, rumunski i slovački).

Kodna strana 852 (DOS Latin 2) je vrlo različita od ISO/IEC 8859-2 (ISO Latin-2), iako se obe vode kao "Latin-2", doduše u različitim jezičkim područjima.

Sledeća tabela prikazuje kodnu stranu 852. Svaki karakter prikazan je Unicode prikazom i dekadnim zapisom. Dat je samo drugi deo tabele (kodni zapisi od 128–255), prva polovina tabele (kodni prikaz 0–127) ista je kao u ASCII kodu; dok kodni zapis 1–31 i 127 (00–1Fhex) ima drugačiju interpretaciju u izvesnim uslovima.

Page 33: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

CP 852

_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _A _B _C _D _E _F

8_ Ç00C7

128

ü00FC

129

é00E9

130

â00E2

131

ä00E4

132

ů016F

133

ć0107

134

ç00E7

135

ł0142

136

ë00EB

137

Ő0150

138

ő0151

139

î00EE

140

Ź0179

141

Ä00C4

142

Ć0106

143

9_ É00C9

144

Ĺ0139

145

ĺ013A

146

ô00F4

147

ö00F6

148

Ľ013D

149

ľ013E

150

Ś015A

151

ś015B

152

Ö00D6

153

Ü00DC

154

Ť0164

155

ť0165

156

Ł0141

157

×00D7

158

č010D

159

A_ á00E1

160

í00ED

161

ó00F3

162

ú00FA

163

Ą0104

164

ą0105

165

Ž017D

166

ž017E

167

Ę0118

168

ę0119

169

¬00AC

170

ź017A

171

Č010C

172

ş015F

173

«00AB

174

»00BB

175

B_ ░2591

176

▒2592

177

▓2593

178

│2502

179

┤2524

180

Á00C1

181

Â00C2

182

Ě011A

183

Ş015E

184

╣2563

185

║2551

186

╗2557

187

╝255D

188

Ż017B

189

ż017C

190

┐2510

191

C_ └2514

192

┴2534

193

┬252C

194

├251C

195

─2500

196

┼253C

197

Ă0102

198

ă0103

199

╚255A

200

╔2554

201

╩2569

202

╦2566

203

╠2560

204

═2550

205

╬256C

206

¤00A4

207

D_ đ0111

208

Đ0110

209

Ď010E

210

Ë00CB

211

ď010F

212

Ň0147

213

Í00CD

214

Î00CE

215

ě011B

216

┘2518

217

┌250C

218

█2588

219

▄2584

220

Ţ0162

221

Ů016E

222

▀2580

223

E_ Ó00D3

224

ß00DF

225

Ô00D4

226

Ń0143

227

ń0144

228

ň0148

229

Š0160

230

š0161

231

Ŕ0154

232

Ú00DA

233

ŕ0155

234

Ű0170

235

ý00FD

236

Ý00DD

237

ţ0163

238

´00B4

239

F_

SHY 00AD

240

˝02DD

241

˛02DB

242

ˇ02C7

243

˘02D8

244

§00A7

245

÷00F7

246

¸00B8

247

°00B0

248

¨00A8

249

˙02D9

250

ű0171

251

Ř0158

252

ř0159

253

■25A0

254

NBSP 00A0

255

Page 34: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _A _B _C _D _E _F

Situacija se u proteklim godinama popravila, zahvaljujući kvalitetnoj sistemskoj podršci

Windowsa počev od verzije 95. Međutim, dokumenti, pa i baze podataka ispisane YUSCII

"standardom" postoje i danas kao eho tog vremena, ali sve ih je manje, što je dobar znak da je

pravilan standard zaživeo. Lakoća primene standarda je presudan faktor za njegovu primenu:

dovoljno je da postavimo odgovarajući kodni raspored tastature i upotrebimo jedan od Unicode

fontova koji se instaliraju uz Windows i dobijamo dokument koji izgleda isto na bilo kom

računaru.

Page 35: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Kodovi

ASCII

Skup kompijuterskih kodova ga je osmislio 1968. godine I standardizovao 1982. godine

kao sredstvo za cuvanje i prenos teksta na engleskom. Standardni kod obuhvata 32

neprikazana kontrolna karaktera (kao što su “početak teksta” ili “vrati na početak reda”)

I 96 prikazanih alfanumeričkih i drugih karaktera, a svako slovo ili drugi simbol imaju

jeda broj od 0 do 128 : fna primer, 33 za !, 36 za $, 65 za A, 66 za B, 97 za a, i 98 za b.

U srpskom jeziku popularno se naziva ošišana latinica — latinica bez kvačica na (velikim i

malim) slovima š, ž, č, ć, odnosno dj umesto đ.

Znakovni kod ASCII, ili njegovo kompatibilno proširenje , se koristi u gotovo svim

računarima, naročito personalnim računarima i radnim stanicama. Preporučeni MIME

naziv za ovo kodiranje je „US-ASCII“.

ASCII je, strogo govoreći, sedmobitni kod, što znači da koristi sedam binarnih cifara (u

rasponu od 0 do 127 u dekadnom sistemu) za predstavljanje znakovnih podataka. U

vreme kada je ASCII bio uveden, mnogi računari su koristili osmobitne grupe (bajtove), ili

preciznije oktete) kao najmanju jedinicu za predstavljanje podataka. Osmi bit je bio

obično korišćen kao bit parnosti za proveru grešaka u prenosu podataka ili je imao ulogu

karakterističnu za dati uređaj.

Neki računarski stručnjaci smatraju ASCII najuspešnijim softverskim standardom ikad

predlaganim.

Istorijski gledano, ASCII se razvio iz telegrafskih kodova i njegova prva komercijalna

upotreba je bila kao sedmobitni teleprinterski kod kojeg je proizvodio Servis za podatke

Bel.

„Separatorski“ znakovi trebalo je da se koriste u sistemima koji koriste magnetne trake,

ali su ove ispale sa tržišta pojavom modernijih medijuma.

Upravljački znakovi XON i XOFF se koriste da kontrolišu tok podataka sa nekog brzog

uređaja (npr. računara) na neki spor uređaj (npr. štampač) da ne bi došlo do preskakanja

i gubljenja podataka.

EBCDIC

To je prošireni binarni kod za IMB mainframe, računare srednje klase, I spoljašnjeuređaje koji koriste 8-bitni umesto originalnog 6-bitnog formata. Iako je EBCD uupotrebi danas , postoje I modernije forme kodiranja kao što su ASCII i Unicode.

EBCDIC se sastoji od formata 8-bitni karaktera koji opisuju kako kompjuter interpretirakomande.

Na primer, dok jedan bit može kontrolisati u kom jeziku je komanda, drugi bit može kontrolisatida li je karakter predstavljen kao veliko ili malo slovo.

Page 36: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Dok EBCDIC sadrži osnovne funkcije za podršku stvarnih računarskih svojstva i ima blagu podrškuza novije jezike, to ne podržava mnoge funkcije koje Unicode i ASCII pružaju, kao što jemogucnost da se piše na više jezika.

Prednost EBCDIC-a je to što se sastoji od jezika 8-bitni karaktera, a ne starog 6-bitnog jezika kojise zasnivao na kodirajućem sistemu bušenih kartica. Ovo omogucava da EBCDIC pruži IBMmašinama podršku za širok spektar funkcija . Međutim, EBCDIC dozvoljava mašinama daobrađuju Engleski I samo još jedan jezik I ispisuje karaktere sa leva na desno radije nego sadesno na levo , kakav je slučaj u arapskom jeziku.

UNICODE (UNIversal encODE)

Postoji više verzija unicode-a. Bazična verzija je dvobajtni format zapisa do 216 = 65536

karaktera. Njen naziv je ucs-2 zato što koristi dva okteta, odnosno dva bajta. Sa tih 65536

karaktera riješen je problem zapisa skoro svih postojećih pisama (uključujući čak i neka

izmišljena, kao na primer klingonsko pismo).

Prvo je razvijena unicode transformaciona šema sa osnovnom jedinicom od 8 bita. Pomoću nje

se karakter zapisuje u jednom, dva ili tri bajta, u zavisnosti od toga o kom je karakteru reč.

Postoji i noviji unicode standard pod nazivom ucs-4 koji koristi 4 bajta za zapis 231 =

2147483648 karaktera podijeljenih u tzv. Ravni. Prva dva bajta definišu ravan, tako da ima 215 =

32768 ravni. Druga dva bajta definišu karakter unutar ravni, tako da ima 216 = 65536 karaktera

po ravni. Taj noviji format je više napravljen kao plan za budućnost nego kao realna opcija.

Postoje dvije organizacije koje definišu dva standarda za Unicode. Jedan format je razvijen od

strane tzv. The Unicode Consortium pod nazivom The Unicode Standard. Drugi standard je

razvila Međunarodna organizacija za standardizaciju - International Organization for

Standardization. Ta dva standarda su skoro identična i razlikuju se po predstavljanjuu kineskih,

japanskih I korejskih znakova.

Svjetski trendovi razvoja baza podataka idu ka uvođenju Unicode-a, kao standardni način zapisa

podataka. Većina baza podataka već duže vreme podržava Unicode.

UTF-8

UTF-8 varijanta je najzgodnija za kodiranje većinski latiničnog teksta.

UTF-8 je zamišljen kao format koji najviše odgovara latiničnom tekstu. To je veoma pogodno za

korišćenje u izvornom kodu programa ili u raznoraznim markup jezicima (HTML, XML, \LaTeX, ...)

jer su standardne komande tih programskih/markup jezika uvek ASCII, a tekst koji se koristi

može da bude i ASCII i UTF-8. Na taj način se ne ometa rad programskog kompajlera ili parsera

markup jezika, a omogućava se korišćenje višejezičke podrške.

U UTF-8 se karakter zapisuje u obliku jednog bajta ako u svom zapisu sadrži samo najnižih 7 bita,

odnosno, ako je reč o ASCII karakteru (vidi poglavlje Razvoj elektronskog zapisa teksta). Ukoliko

karakter u svom Unicode zapisu sadrži samo najnižih 11 bita, u UTF-8 se zapisuje u obliku dva

bajta. I na kraju, ako karakter sadrži svih 16 bita, zapisuje se u obliku tri bajta. U tabeli 1 je data

šema kako se UCS-4 transformiše u UTF-8. Tabela je data za pun, četvorobajtni Unicode, a ako je

Page 37: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

reč o dvobajtnom Unicode-u, tj. o UCS-2, treba gledati samo prva tri reda u tabeli. Detaljniji opis

algoritma za transformaciju može se naći u RFC 2279.

UTF-8 nije optimalan način zapisa za kineski i japanski tekst jer umesto da se koriste dva bajta po

karakteru, za takav tekst bi bilo korišćeno čak tri bajta po karakteru, ali to i nije toliko važno za

nas. Za ćirilični tekst je, sa druge strane, sve jedno da li se koristi čisti UNICODE ili UTF-8, pošto

se svaki ćirilični karakter zapisuje u obliku dva bajta i u jednom i u drugom formatu. Za nas je

ipak optimalniji UTF-8 jer postoji mogućnost pisanja i ćirilicom i latinicom, pa ako u ćirilici već ne

može da se izbegne upotreba dva bajta, u latinici se skoro svi karakteri zapisuju samo sa jednim

bajtom (osim šđčćž).

IMB-PC

Code page 437 je set karaktera za originalni IBM PC ili DOS. Poznat je takođe i kao CP437, OEM-

US, OEM 437, PC-8,[2] ili DOS Latin US. Komplet sadrži ASCII kodove 32-126, produžene kodove

za akcentovana slova ,neka Grčka slova, ikone i linijski crtane simbole. Nekad se I naziva "OEM

font" ili "high ASCII", ili "extended ASCII”.

U kontrolnom rasponu C0 (0 – 31) mapirani su grafički karakteri. Za ove kodove se

podrazumijeva njihova izvorna kontrolna funkcija, ali se prikazuju kao grafički kada se nalaze u

RAM-u grafičke kartice. Kod 127, DEL, takođe ima grafički prikaz.

U rasponu 128 – 255 mapirani su različiti znakovi: neki karakteri s dijakriticima, karakteri za

crtanje okvira, matematički znakovi i deo grčkog alfabeta.

Ovaj karakter postavlja ostatke primarnog fonta u jezgru od EGA ili VGA kompatibilnih grafičkih

kartica.

To je prvi tekst koji se pojavi kad se kompijuter ponovo pokrene.

Page 38: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Kodovi i kodiranje

Page 39: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Uvod

▪ Računar razumije samo binarni jezik , jezik koji se sastoji od dva simbola,„0“ i „1“. Unutar računara znakovi su prikazani pomoću binarnih brojeva.

▪ Postupak pripisivanja simbola znakovima vanjskog svijeta naziva sekodiranje. Skup takvih simbola naziva se kod. Kodni sistem je dogovor onačinu kodiranja. Najrasprostranjeniji kodni sistem je ASCII kod ( skraćenood: American standard code for information intercharge). Svaki simbol iznak je predočen jednim sedmeroznamenkastim binarnim brojem, aukupno je na raspolaganju 27 =128 znakova.

▪ Postoji i proširen , osambitovni ASCII u kojem se prvih 128 znakova koristikao i u osnovnom ASCII-u , a preostalih 128 znakova se koristi za slovarazličitih zemalja , pa postoji mnogo različitih proširenih ASCII normi.

Page 40: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Kod

▪ Kodovi su nastali u srednjem vijeku. U istoriji se spominju kodovi još iz XIII i XIV vijeka koji suprimjenjivani u nekim italijanskim državicama.

▪ Disciplina koja se bavi proučavanjem i otkrivanjem kodova i šifri zove se kriptografija.

▪ Kod je u najširem smislu sistem znakova pomoću kojega sudionici komunikacije (najmanje dva)komuniciraju. Svaki kod da bi se smatrao kodom mora imati popis svih znakova, propis po kojemuse ti znakovi slažu i opis tih znakova.

▪ Kod je vrsta šifre kod koje se riječi, rečenice, dijelovi riječi i rečenica, slova i brojevi otvorenogteksta zamjenjuju grupama slova ili brojki - kodnim zamjenama. Kodovi se najčešće izrađuju uobliku rječnika. Sadrže nekoliko desetina hiljada otvorenih izraza, od kojih svaka ima po jednu iliviše kodnih zamjena, skupine od po 2, 3, 4 ili 5 slova ili brojeva. Kao i ostale vrste šifri i kodovi sunamijenjeni osiguranju tajnosti sadržaja povjerljive poruke (vojne, diplomatske i druge).

▪ Kodom se postiže i skraćivanje teksta.

Page 41: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Osnovne teorije kodiranja

▪ Pod kodiranjem razumijevamo prevođenje određenih podataka u simboličke oblike s ciljemnjihove obrade putem kompjutera. Prema tome, kompjuterska obrada podataka pretpostavljakodiranje podataka pri ulazu u središnju procesorsku jedinicu i nakon njihove obradedekodiranjem radi distribucije korisnicima. To drugim riječima znači da su prihvaćanje, čuvanje iobrada podataka u kompjuteru mogući samo ako su oni kodirani pomoću dualnih simbola 0 i 1 .Suština i cilj kodiranja jest transformacija znakova napisanih u alfabetu u simbole alfabeta.

▪ To znači da se sva slova brojevi , specijalni znači i instrukcije kodiranu alfabetom. Prema tome ,ulazni skup podataka B= (bi), i= 1,2,3,…. n. Može se izvesti skupom simbola Am= (aj) , j=1,2,3,…m koji se nazivaju simbolima alfabeta. Svaki simbol alfabeta Am naziva se slovo čiji nizčini riječ , a dužina riječi može biti različita.

▪ Ma koliko sve riječi koje čine kod moraju biti iste dužine od q slova , onda je riječ oravnomjernom kodu čija dužina mora zadovoljiti uslov n<=qm . Za n=qn dobiva se brojkombinacija koje znači mogućnost nekog sustava za kodiranje gdje m predstavlja bazu koda a q broj znakova u kodnoj riječi. Međutim svaki sustav za kodiranje mora zadovoljiti načelojednoznačnosti i ekonomičnosti. Jednoznačan je onaj kod u kojem su sve riječi različite. Ekonomičan je onaj kod koji ima najmanju redundanciju.

Page 42: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Dekodiranje

▪ Dekodiranje je obrnuti proces, kada se podaci poslati od izvorapretvaraju u informaciju razumljivu primaocu. Jedan od razloga zakodiranje je omogućiti komunikaciju tamo gdje normalni govorni ilipisani jezik nije moguć. ( na primjer u računaru) .

▪ Pri procesu dekodiranja informacija se mora pretvoriti u drugi oblikkorištenjem istih pravila i normi korištenih prilikom kodiranja da bi sedobila identična informacija to jest da bi se ispravno prenijela vijestdo odredišta.

Page 43: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

ASCII

▪ Jedan od najstarijih i najrasprostranjenijih kodnih sistema zakomunikaciju računalom je ASCII kod. Razvio ga je American NationalStandards Instituta ,a prve verzije koda su razvijene 1963.g. zapotrebe američke telefonske i telegrafske mreže.

▪ ASCII kod je skraćenica od početnih slova rečenice 'AmericanStandard Code for Information Interchange', što prevedeno znači:Američki standardni kod za razmjenu informacija. Tokom razvojaračunarske tehnologije definisano je više varijanti ovoga koda.Najčešće je u upotrebi osam bit-na varijanta u kojoj je prvih 128kombinacija (0-127) standardizirano, a drugih 128 kombinacija (128-255) dato je na volju korisniku da sam kreira kodne elemente.

▪ Po ASCII-u je nazvan jedan asteroid.

Page 44: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Prvih 128 elemenata ASCII koda

Page 45: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

2 tipa ASCII koda

▪ 1. Osnovni ASCII kod koristi kodne zamjene dužine 7 bita, što značida se njime može prikazati 128 znakova ( 27 ). Svaki simbol i znak je predočen jednim sedmeroznamenkastim binarnim brojem.Prva 32 mjesta u ASCII tablici su dodijeljena kontrolnim znakovima(neispisivi znakovi) a ostala 96 su slova, brojke, znakovi interpunkcijeitd.

▪ 2. ProšireniASCII kod koristi 8 bitne zamjene te može prikazati 256 ( 28 ) različitih znakova. Prvih 128 znakova jednako je standardnomASCII kodu. Pomoću njega se prikazuju posebni znakovi drugih jezikate grafički znakovi. Zbog razlike u jezicima u različitim zemljama sudonesene lokalne norme.

Page 46: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

EBCDI

▪ - Extended Binary Coded Decimal Interchange Code (EBCDI ) jeosmobitni kod , odnosno prošireni , izmjenjivi binarno-decimalni kod.

▪ U ovom kodu svaki se standardni znak prikazuje pomoću jednogbajta, pa je tako omogućeno prikazivanje 28 = 256 različito kodiranihznakova.

Page 47: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

UNICODE

▪ Standard za razmjenu podataka usmjeren na prikaz slova na načinneovisan o jeziku, računarskoom programu ili računarskoj platformi.

▪ On predstavlja daleko veći skup od dotadašnjih 256 znakova. Unicodekonzorcij i ISO, međunarodna organizacija za standardizaciju suuskladili napore i proizveli usuglašene standarde ISO-10646 odnosnoUnicode.

▪ Ovi standardi omogućuju ispravno bilježenje i razlikovanje prekomilion znakova, što nam omogućuje ispravan i nedvosmislen prikazznakova korištenih u mnogobrojnim jezicima i pismima.

Page 48: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

UTF-8

▪ UTF-8 je zamišljen kao format koji najviše odgovara latiničnom tekstu. To je veoma pogodno zakorišćenje u izvornom kodu programa ili u raznoraznim markup jezicima (HTML, XML, \LaTeX, ...) jersu standardne komande tih programskih/markup jezika uvek ASCII, a tekst koji se koristi može dabude i ASCII i UTF-8. Na taj način se ne ometa rad programskog kompajlera ili parsera markupjezika, a omogućava se korišćenje višejezičke podrške.

▪ U UTF-8 se karakter zapisuje u obliku jednog bajta ako u svom zapisu sadrži samo najnižih 7 bita,odnosno, ako je reč o ASCII karakteru (vidi poglavlje Razvoj elektronskog zapisa teksta). Ukolikokarakter u svom Unicode zapisu sadrži samo najnižih 11 bita, u UTF-8 se zapisuje u obliku dva bajta. Ina kraju, ako karakter sadrži svih 16 bita, zapisuje se u obliku tri bajta. U tabeli 1 je data šema kakose UCS-4 transformiše u UTF-8. Tabela je data za pun, četvorobajtni Unicode, a ako je reč odvobajtnom Unicode-u, tj. o UCS-2, treba gledati samo prva tri reda u tabeli. Detaljniji opisalgoritma za transformaciju može se naći u RFC 2279.

▪ UTF-8 nije optimalan način zapisa za kineski i japanski tekst jer umesto da se koriste dva bajta pokarakteru, za takav tekst bi bilo korišćeno čak tri bajta po karakteru, ali to i nije toliko važno za nas.Za ćirilični tekst je, sa druge strane, sve jedno da li se koristi čisti UNICODE ili UTF-8, pošto se svakićirilični karakter zapisuje u obliku dva bajta i u jednom i u drugom formatu. Za nas je ipak optimalnijiUTF-8 jer postoji mogućnost pisanja i ćirilicom i latinicom, pa ako u ćirilici već ne može da se izbegneupotreba dva bajta, u latinici se skoro svi karakteri zapisuju samo sa jednim bajtom (osim šđčćž).

Page 49: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Tabela:

Šema kodiranja UCS-4 u UTF-8

UCS-4 opseg (hex.) UTF-8 binarni zapis

0000 0000-0000 007F 0xxxxxxx

0000 0080-0000 07FF 110xxxxx 10xxxxxx

0000 0800-0000 FFFF1110xxxx 10xxxxxx 10xxxxxx

0001 0000-001F FFFF 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx

0020 0000-03FF FFFF 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

0400 0000-7FFF FFFF 1111110x 10xxxxxx ...10xxxxxx

Page 50: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Hvala na pažnji!

Page 51: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

ZAPIS ZNAKOVNIH PODATAKABINARNI KODOVI

Page 52: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

UVOD

• Kreatori jezika C su bili minimalisti (po današnjim merama, jer jeza tada bilo dovoljno (za engleski jezik)). Na početku jepostojao samo char (skraćenica od charactrer) sa 8 bitova začuvanje simbola.

• Bitno je da je maksimalan broj simbola kodiranih sa 8 bitova256, a danas postoji više od miliona različitihsimbola/karaktera.

• Tek kasnije je dodat wchar_t, ali sada nije o tome reč.

Page 53: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

ASCII • Domišljati kreatori ASCII koda su brzo rezervisali prvih 128

kodova pod standardne simbole kojima je bilo mogućekodirati maltene sve vezano za engleski jezik, ostavivšipreostalu polovinu za potrebe celog sveta.

• Na početku svi su se trudili da se uguraju u preostalu polovinu;svaki set simbola je bio standardizovan pod određenimnazivom. Jednog dana je postojalo više standarda negosimbola u bajtu i svi su se bitno razlikovali u delovima van prvih128 simbola. Tako je došlo do potpunog haosa, računari suprikazivali nečitljive znakove i simbole…

Page 54: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

ASCII

TABLE

Page 55: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

PRIMER EXTENDED ASCII (BASIC LATIN)

Page 56: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

• Osim toga, postojao je i ogromni broj drugih kodova; došlo je ido različitih nikako ne povezanih kodiranja istih stvari, na primerMS DOS za ćirilicu koristi kodove 855 i 866, Windows koristi 1251,a Mac Os još nešto. Osim toga postoje i KOI 8 i KOI 7, pa i ISO8859-5, i svako slovo ima više različitih izgleda.

• Primer mešanja više kodova (Chrome u Notepad-u):

hрaI ќГиUр цШАюА„Ыt „АtjYл3ЙAишюяя„АuhшCI hCI я”ђH Pя�ђH …АtяР[‹е]ГU‹мѓм|ЎPK 3Е‰EьSVWj^3А‰uшj3Ыf‰EдЌUд‰]фYи%& „А„‚ ЌMди•µ „А„r h hшDI h ЂЌM�‰]�‰]њ‰] иНУ …А…BnH

• Kao rešenje se pojavio UNICODE.

Page 57: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

UNICODE

• Ideja UNICODE (UNIversalenCODE) je bilajednostavna. Svaki simbolje dobijao svoj kod jednomi zauvek. Ovo je 16-bitnikod i može da sadrži 65536različitih karaktera (a to jeviše nego dovoljno). Ukasnijoj verziji je proširen na32 bita.

Page 58: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

DRUGI KODOVI

Osim ASCII i UNICODE izdvajaju se i drugi kodovi poput EBCDIC, ISO-8, IBM PC, itd.

• EBCDIC (Extended Binary Coded Decimal Interchange Code) jestandardni 8-bitni kod koji je stvorio IBM za svoju proizvodnju, postojaloje najmanje 6 verzija EBCDIC-a i sve su bile međusobnonekompatibilne.

• ISO-8 (International Organization for Standardization-8). 8-bitni kod, 256karaktera. Prvih 127 pozicija poklapa se sa ASCII kodom. Pozicije iznadsu popunjenje različitim kontrolnim i grafičkim karakterima i simbolima.

• YUSCII je bio 7-bitni kod baziran na ASCII za Jugoslaviju (YU) mnogonezgodan za programere u C-u zato što su uglaste i vitičaste zagradezamenjene slovima š, ć, ž, itd.

Page 59: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

IBM PC KOD• IBM-PC kod, takođe poznat kao CP437, OEM-US, OEM 437, PC-

8, ili DOS Latin US; je kod korišćen od prve verzije IBM PC-a sveod 1981. godine. Bitan je po tome što je prvi značajniji načinkodiranja u koji su ubačeni emotikoni i slični simboli.

Page 60: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

UTF-8

• UTF-8 (Unicode Transformation Format) je način kodiranjaJunikoda, pri čemu se svaki UNICODE simbol kodira pomoćupromenljivog broja (1-4) okteta (svaki oktet ima 8 bitova), pričemu broj okteta zavisi od celobrojne vrednosti koja jedodeljena UNICODE karakteru. On je kompatibilan sa ASCIIkodom i danas je u veoma širokoj upotrebi.

Page 61: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

KRAJ

______________[C++ _☐x][ ]__

[ { } ] \[______________] \

\_M_ \\

==================

_ _\{0 } _ {0 }\

Page 62: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

KODOVI

Kod je vrsta šifre kod koje se reči ili rečenice, delovi reči i rečenica, slova i brojevi

zamenjuju grupama slova ili brojeva.

Kodiranje predstavlja prevođenje određenih podataka u simboličke oblike obrnut

proces naziva se dekodiranje.

Oni su jako potrebni računaru pošto on razume samo cifre 0 i 1.A potrebno je

definisati još mnoge simbole i znakove.

Kodovi su nastali još u srednjem veku i korišćeni su u nekim tadašnjim italijanskim

državama.

Nauka koja se bavi proučavanjem kodova i šifri zove se kriptografija.

Svaki kod se sastoji od određenog broja bitova.Što više bitova to je veći broj

mogućih znakova u kodu.

Najčešće se izrađuju u obliku rečnika.Sadrže hiljade otvorenih izraza, od kojih

svaki ima po jednu ili više kodnih zamena, od po 2, 3, 4 ili 5 slova ili brojeva.

Poznatiji kodovi:

1. Gray Aiken

2. Exzess 3

3. BCD(Binary Coded Decimal)

4. ASCII (American Standard Code for Information Interchange)

5. EBCDI (Extended Binary Coded Decimal Interchange Code)

6.

Gray kod

- u ovom kodu se brojevi prikazuju tako da svaka decimalna znamenka zameni

adekvatnom binarnom tetradom.

Aiken kod- on pripada u simetrične kodove što olakšava izvođenje računskih

operacija .

Page 63: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Exzess 3

- dobio je ovo ime zato što se njegove tetrade pomiču za tri mesta u odnosu na

BCD kod, a to znači da tetradi iz čistog binarnog koda dodajemo broj 0011.

BCD kod

- ovaj kod je posredni kod između čistog binarnog i decimalnog koda , što znači da

se svaka decimalna znamenka direktno izražava pomoću jedne terade.ulazni i

izlazni podaci iz kompjuterska formiraju se u decimalnom obliku , ali se u

kompjuteru putem ovog koda svaka decimalna znamenka predstavlja pomoću 4

bita tzv.tetrade, koje predstavljaju broj u binarnom obliku.

ASCII KOD

Jedan od najstarijih I najrasprostranjenijih kodova.

Definisano je više varijanti ovog koda a najviše se upotrebljuje 8bit-na verzija u

kojoj je prvih 128 kombinacija standarno a drugih 128 ostavljeno prazno da

korisnik sam može da ih kreira.

1. Osnovni ASCII kod koristi kodne zamene dužine 7 bita, što znači da se njime

može prikazati 128 znakova ( 27 ).

Prva 32 mesta u ASCII tablici su dodeljena kontrolnim znakovima (neispisivi znakovi)

a ostala 96 su slova, brojke, znakovi interpunkcije itd.

2. Prošireni ASCII kod koristi 8 bitne zamjene te može prikazati 256 ( 28 ) različitih

znakova. Prvih 128 znakova jednako je standardnom ASCII kodu. Pomoću njega se

prikazuju posebni znakovi drugih jezika. Zbog razlike u jezicima u različitim

zemljama su donesene lokalne norme.

ZNAČENJA POJEDINIH INSTRUKCIJA ASCII KODA

SOH → oznaka početka kontrolnih podataka pred blokom poruke

STX → oznaka kraja kontrolnih podataka i početak bloka poruke

ETX → oznaka kraja bloka poruke

EOT → oznaka kraja prenosa podatka (kontrole i poruke)

ENQ → zahtev za odgovor odredišta

ACK → potvrda odredišta o prijemu

Page 64: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

BEL → aktiviranje zvučnog poziva

BS → brisanje kursorom unatrag (u levo)

HT → kontrola skokova

LF → postavljanje kursora u novi red

VT → kontrola skokova po redovima

FS → rastavljač blokova podataka (datoteka)

GS → rastavljač grupe podataka u bloku

RS → rastavljač pojedinih zapisa u grupi

US → rastavljač jedinica

SP → razmak (prazan znak)

DEL → brisanje znaka s desne strane kursora

-EBCDI KOD

Extended Binary Coded Decimal Interchange Code (EBCDI ) je osmobitni kod

odnosno prošireni , izmjenjivi binarno-decimalni kod. U ovom kodu svaki se

standardni znak prikazuje pomoću jednog bajta, pa je tako omogućeno prikazivanje

28 = 256 različito kodiranih znakova. Također se i kod ovog koda za skraćeno

prikazivanje znakova koristi heksadecimalni ili oktalni brojevni sistem.

-UNICODE

Standard za razmenu podataka usmeren na prikaz slova na način nezavvisan od

jezika, računarskom programu. On predstavlja daleko veći skup od dotadašnjih 256

znakova. Unicode i ISO-međunarodna organizacija za standardizaciju su uskladili

napore i proizveli usaglašene standarde ISO-10646 odnosno Unicode. Ovi

standardi omogućuju ispravno beleženje i razlikovanje preko milion znakova, što

nam omogućuje ispravan prikaz znakova korišćenih u mnogobrojnim jezicima i

pismima.Jako je koristan jer sada u celom svetu svi mogu da se sporazumeju preko

njega.

ZANIMLJIVOSTI O KODOVIMA

-Tajni agent 007

Popularni lik iz filma Džejms Bond dobio je broj 007 po kodu 0070 koji je

Nemačka dodelila nizu svojih ratnih kodova.

Page 65: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

-Mnogi korisnici Android telefona ne znaju za skrivene kodove u meniju za

pozivanje.

1 *#*#197328640#*#* – Aktivacija test režima

2. *#*#232339#*#* – Test za Wireless LAN

3. *#*#0842#*#* – Test za vibraciju i pozadinsko svjetlo

4. *#*#2664#*#* – Test za displej osjetljiv na dodir

5. *#*#1111#*#* – FTA (fabrička) verzija softvera (uz 1234 u kodu daje

prikaz PDA i FW)

6. *#12580*369# – Informacije o softveru i hardveru

7. *#9090# – Dijagnostičke informacije

8. *#9900# – System dump mode

9. *#301279# – HSDPA/HSUPA kontrolni meni

Page 66: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Kodovi

Kodovi su uvedeni da bi se prikaz slova i znakova pomoću binarnog sistema u racunarima standardizovao

i da bi se slova zapisivala isto u svakom kompjuteru (bilo je potrebno zbog prenosa kodova sa jednog

računara na drugi).

ASCII (American Standard Code for Information Interchange) jedan je od najpoznatijih kodova. Većina

današnjih kodova se zasnivaju na ASCII kodu, ali su u njih dodati još neki karakteri kao što su ćirilična

slova, nemačka slova sa umlautima itd. Početak razvijanja ASCII koda bio je 1960. godine na sastanku

udruženja ASA (American Standard Assosiation, kasnije nazvanog ANSI, te se ovaj kod naziva i

ANSI_X3.4-1968). ASCII kod je zasnovan na tadašnjem telegrafskom kodu od strane Bell laboratorija.

ASCII sadrži dve grupe karaktera: kontorlni (control characters) i vidljivi (printable characters). Kontrolni

karakteri služili su za zapisivanje naredbi kao što su novi red, kraj teksta itd., dok su vidljivi služili za samo

ispisivanje teksta. Kod se menjao kroz vreme, objavljen je 1963. godine, da bi se 1986. godine formirala

njegova verzija koja se i danas koristi. ASCII je na početku bio 7-bitni kod, popunjen je sa 100 karaktera a

ostalih 28 ostavljeni su kao mogućnost za dodavanje novih karaktera. Kako su razvijani računari, prostor

za čuvanje podataka postao je jedan bajt (8 bitova) tako da su nastali novi kodovi od ASCII koda, koji su

koristili osam bitova za zapis karaktera. Takođe, vremenom su nastale i razne verzije ovog koda kao što

su YUSCII (Yugoslav Standard Code for Information Interchange), ISCII (Indijska verzija), VISCII

(Vijetnam) itd. Zanimljivo je da se iz ovog koda razvila tehnika grafičkog dizajna koja se naziva ASCII art.

To su slike koje se sastoje od različitih karaktera. Još jedna zanimljivost je da je jedan asteroid nazvan po

ASCII kodu.

EBCDIC (Extended Binary Coded Decimal Interchange Code) objavljen je 1963. godine od strane

kompanije IBM. Napravljen je kao proširenje BCDIC sistema za kodiranje (Binary Coded Decimal

Interchange Code). U ovo vreme EBCDIC bio je opšte nepopularan među programerima. Eric S. Raymond

napisao u svom rečniku Jargon file: “Postoji bar šest verzija ovog koda koje su nekompatibilne

međusobno, a ni jedna verzija ne sadrži sve karaktere koji su potrebni za moderno programiranje”.

ISO-8 (International Organization for Standardization-8) je osmobitni kod koji lici na EASCII (Extended

ASCII), dakle sadrži 256 karaktera, od kojih se prvih 127 poklapa sa ASCII kodom. IBM PC je takođe razvio

Page 67: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

osmobitni kod, kod koga se prvih 127 karaktera poklapa sa ASCII kodom, a ostatak je originalno

definisan.

UNICODE (UNIversal enCODE) nastao je 1990. godine da bi se omogućilo ispisivanje teksta na više

različitih jezika. Sadrži više od 128.000 različitih slova. Karakteri se u kompjuteru mogu prikazati kao 8

bitova, 16 bitova ili 32 bita.

UTF-8 (Unicode Transformation Format) je kod, kod koga duzina zapisa karaktera u kompjuteru moze da

varira (8 bitova, 16 bitova ili 32 bita). Ovaj kod napravili su Ken Thompson i Rob Pike. Danas je

najkorišćeniji od svih kodova.

Page 68: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Najčešći ASCII Kontrolni Karakteri

Kontrolni karakter, ili neštampajući karakter jeste karakter koji ne predstavlja simbol za pisanje.

U ASCII tabeli to su karakteri do koda 32, a i kod 127 (DEL karakter) je takodje kontrolni

karakter. U novijim načinima kodiranja, kao što su ISO-8 i UNICODE, postoji još kontrolnih

karaktera.

Ispod su navedeni neki od bitnijih kontrolnih karaktera iz ASCII tabele i njihova značenja:

0 (null, NUL ,\0, @), prvobitno je trebalo da bude karakter koji bi se potpuno ignorisao,

ali ga u današnje vreme mnogi programski jezici koriste za označavanje kraja stringa;

7 (bell, BEL, \a, ^G), često se koristi da natera uredjaj da pošalje upozorenje (najčešće

zvučno);

8 (backspace, BS, \b, ^B), koristi se da obriše poslednji ispisani karakter;

9 (horizontal tab, VT, \v, ^K), pomera sve karaktere u redu za nekoliko mesta udesno;

10 (line feed, LF, \n, ^J), označava kraj reda na većini UNIX sistema;

12 (form feed, FF, \f, ^L), daje informaciju štampaču da izbacuje papir do početka

sledeće stranice ili terminalu da očisti ekran;

13 (carriage return, CR, \r, ^M), vrlo je sličan line feed-u s tim što resetuje poziciju na

početak reda;

26 (Control-Z, SUB, EOF, ^Z,) koristi se kao zamena za nepoznati karakter;

27 (escape, ESC, \e, ^[), ima razne primene, najčešće se koristi da prekine neki proces;

127 (delete, DEL, ^?), kao i 0, planirano je da se koristi kao karakter koji se ignoriše,

ali se sada u nekim sistemima koristi da izbriše karakter.

Page 69: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

ZANIMLJIVOSTI O KODOVIMA

Page 70: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Uvod

Kodovi se dele prema tome koliku dužinureči mogu da prevedu.

Dakle imamo :

1. Petobitne kodove

2. Šestobitne kodove

3. Sedmobitne kodove

4. Osmobitne kodove

5. 10,16,32-bitni kodovi

6. Tetradni kodovi

7. Varirajuća dužina koda

Page 71: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Petobitni kodovi

1. ITA 1 – Baudotov kod

2. ITA 2 – Murejov kod

3. USTTY – varijanta ITA 1 u Americi

4. DIN 66006 – napravljeni za prezentaciju

ALGOL/ALCOR programa na papirnim

trakama i bušenim karticama

Koristili su se u vreme kada su se

koristile bušene kartice

Page 72: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Šestobitni kodovi

1. IAT 4

2. Šestobitni BCD – korišćen na početnim

industrijskim kompjuterima

3. Šestobitni ASCII – preteča današnjeg

ASCII-a

4. Brajev kod – pretstavljen preko 6 tačkica

rasprostranjenih u četvorougao

Page 73: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Sedmobitni kodovi

1. IAT 3- izveden iz Moore ARQ koda a

poznat je i kao RCA

2. ASCII – kao i njegove verzije koje su

pravljene prvobitno za teleprintere

(YSCII)

3. CCIR 476 – unapređena verzija ITA 2

4. ITA 4 – unapređena verzija

Page 74: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Osmobitni kodovi

1. Extended ASCII

2. HP Roman

3. ISO/IEC 8859

4. MAC OS Roman

5. Windows – 1252

6. EBCDIC – korišćen u ranijim IBM

računarima

Page 75: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

10,16,32-bitni kodovi

1. AUTOSPEC – Bauerov kod (10-bitni

kod)

2. UCS-2 – unapređen Unicode(16-bitni

kod)

3. UTF-32/UCS-4 – svaki karakter se

pretstavlja preko 4 bajta unapređeni

Unicode (32-bitni kod)

Page 76: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Tetradni kodovi

1. Grej-u ovom kodu se brojevi prikazuju

tako što se svaka decimalna cifra zameni

odgovarajućom tetradom

2. Aiken – simetrični kod koji olakšava

operacije

3. Exzess-3 kod – tetradi iz čistog binarnog

broja dodajemo broj 0011

4. BCD kod – jako poznati način kodiranja

rađen na času

Page 77: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Varirajuća dužina koda

1. UTF-8 – pokriva ceo unicode sasekvencom do osam 4-bitna bajta

2. UTF-16 - unapredjeni UCS-2 koji je možeda uzima vrednost od jednog ili dva 16-bitna elementa

3. GB 18030 – napravljen da bi se unicodeuskladio sa kineskim miltibajtovskimkodovima

4. Huffman – korišćeniji karakteri seobeležavaju kraće nego specijalni; pretstavakoda je interesntna jer se pretstavlja prekografa

Page 78: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Baudotov kod

Ovaj kod se primenjivao na mašini koja jeradila po principu 3 desna 2 leva prsta.

Kada bi neko ukucao tih pet parametarana tastaturi mašina bi čekala dok seprenos podataka ne završi a potom bi uz“ritamski signal” obavestila da je spremnaza sledeći unos.

To je u to vreme bio napredak jer su sedo tada koristili samo teleprinteri zaslanje informacija.

Page 79: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Izgled mašine na kojoj se kucalo Tabela pretstavljanja karaktera

Page 80: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Murejov kod

Ovo je unapređena verzija Baudotovog

koda značajna je jer su njom uvedeni

takozvani KONTROLNI KARAKTERI.

Za razliku od Baudotovog koda gde se

svaki uneti karakter ispisivao kod

Murejovog koda su kontrolni karakteri

doneli na preglednosti celog zapisa.

Page 81: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Upoređene tabeleBritish Creed mašina na kojom se radilo sa ovim kodom

Page 82: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Morzeova azbuka

Značaja Murejovog i Baudotovog koda je

da se iz njih razvio Morzeov kod.

On se koristio na mašini koja je odašiljala

kraće ili duže pulseve.

Ovo se koristilo u ratovima kao izmenjena

svetlosna verzija (dugi puls bi bio duži

svetlosni zrak dok je kraći kratak) .

Page 83: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Tabela morzeovog koda Odašiljač pulseva

Page 84: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Brajev kod

Ovo je kod koji se koristi kod slepih ljudi i

značajan je za razvoj i snalaženje.

Ovaj kod je pretstavljen preko 6 tačkica

kod kojih svaki raspored tačaka ima

određene vrednosti.

Napravio ga je Luis Brajev koji je i sam

oslepeo usled nesreće, kada je imao 15

godina.

Page 85: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Tabela vrednosti brajevog koda Knjiga napisana brajevim kodom

Page 86: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

ASCII

Napravljen je iz jednog 7-bitnog teleprintera

koji je napravila Bell data service.

Danas je je u najširoj upotrebi.

Koristi se za pretstavljanje teksta u

kompjuteru.

Ima 33 kontrolna karaktera i 95 koji se

ispisuju.

YUSCII je nastao u Jugoslavjiji jer prvobitni

ASCII nije sadržao karaktere za srpska slova.

Page 87: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

ASCII tabela

Page 88: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

EBCDIC

On je nastao iz prvih bušenih kartica.

Ovo je 8-bitni kod.

Za ovaj kod ima dosta šala zato što je

napravljen po zahtevu vlade Amerike

Jedna od njih ide ovako:

Professor: "So the American government went

to IBM to come up with an encryption

standard, and they came up with—"

Student: "EBCDIC!"

Page 89: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Primer bušene kartice preko EBCDIC-a

Tabela vrednosti

Page 90: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Grejev kod

Reflektovani binarni kod, takođe poznak kaoGrejev kod, je sistem binarnih cifara u kojemse dve uzastopne vrednosti razlikuju u samojednom bitu.

Reflektovani binarni kod je prvobitnoprojektovan da spreči lažni izlaz izelektromehaničkih prekidača.

Danas se Grejev kod koristi za ispravljanjegrešaka u digitalnim komunikacijama, kao štosu digitalne zemaljske televizije i nekikablovski sistemi.

Page 91: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Tabela vrednostiSlika prikazuje IKM cev sa reflektujućim

binarnim kodovima na tanjiru

Page 92: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Hufmanovo kodiranje

Ovaj kod je znanimljiv jer ima specifičanmetod za reprezentaciju simbola, koja nakraju završava u prefiksiranom kodu.

To znači da se na predstavu broja koristibinarna vrednost plus neki prefiks.

Još jedna interesantna stvar kod ovogkodiranja jeste da se fajl u memorijipredstavlja kao graf.

Primer Francusk verzije pretstave:

https://upload.wikimedia.org/wikipedia/commons/a/ac/Huffman_huff_demo.gif

Page 93: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

NADAM SE DA STE UŽIVALI ČITAJUĆI!!

Page 94: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

Словима једног великог светског писма названог Jуникод (Unicode)одавно може да барата

рачунар, али је на Интернету остало још неколико ситница.

Одавно је могуће да се на рачунару креира садржај исписан другим писмима осим ASCII сета

карактера (неки је зову енглеска, а неки ћелава латиница). Стандардизован је један велики скуп

свих светских писама назван UNICODE (чита се јуникод), који се користи у ту сврху. Садржај сајта

одавно је могуће исписати на Јуникоду, а тастатуре се одавно у многим земљама могу срести

на важећем писму за ту земљу, оперативни системи су одавно локализовани и једина

„ситничица” која је остала на „ћелавој латиници” јесте управо „адреса” сајта (домен).

ICANN је базирао будућност Интернета на томе ће свака земља моћи да има домен на свом

писму. IDN ccTLD Fast Track је привремени и „покусни” пројекат ICCANA-а, врховног

регулаторског тела за интернет домене, којим је пробао да изађе у сусрет земљама које немају

латиницу као своје основно писмо и да се самим тим прошири коришћење Интернета. Циљ је

да се имплементира једна врста преводиоца Уницоде у ASCII који је за корисника невидљив.

Корисник у броузеру куца адресу користећи Уницоде (односно на ћирилици, на пример), а тај

захтев се уз помоћ преводиоца претвара у ASCII са реалном адресом (облика –хн хххх) и шаље

„позив” сајту. То превођење из Уницода у АСЦИИ „замаскирао” је и извршио сам броузер

корисника.

Адреса конвертера јуникода:

https://www.branah.com/unicode-converter

YUSCII или YUASCII је Југословенски АСКИ код.

_

0

_1 _2 _3 _4 _5 _6 _7 _8 _9 _A _B _C _D _E _F

0

_

NUL 000

0

0

SOH 000

1

1

STX 000

2

2

ETX 000

3

3

EOT 000

4

4

ENQ 000

5

5

ACK 000

6

6

BEL 000

7

7

BS 000

8

8

HT 000

9

9

LF 000

A

10

VT 000

B

11

FF 000C

12

CR 000D

13

SO 000

E

14

SI 000

F

15

Page 95: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

1

_

DLE 001

0

16

DC1 001

1

17

DC2 001

2

18

DC3 001

3

19

DC4 001

4

20

NAK 001

5

21

SYN 001

6

22

ETB 001

7

23

CAN 001

8

24

EM 001

9

25

SUB 001

A

26

ESC 001

B

27

FS 001C

28

GS 001D

29

RS 001

E

30

US 001

F

31

2

_

SP 002

0

32

!002

1

33

"002

2

34

#002

3

35

$002

4

36

%002

5

37

&002

6

38

'002

7

39

(002

8

40

)002

9

41

*002

A

42

+002

B

43

,002C

44

-002D

45

.002

E

46

/002

F

47

3

_

0003

0

48

1003

1

49

2003

2

50

3003

3

51

4003

4

52

5003

5

53

6003

6

54

7003

7

55

8003

8

56

9003

9

57

:003

A

58

;003

B

59

<003C

60

=003D

61

>003

E

62

?003

F

63

4

_

Ž

/

Ж017

D/0

416

64

A

/

А004

1/0

410

65

B

/

Б004

2/0

411

66

C

/

Ц004

3/0

426

67

D

/

Д004

4/0

414

68

E

/

Е004

5/0

415

69

F

/

Ф004

6/0

424

70

G

/

Г004

7/0

413

71

H

/

Х004

8/0

425

72

I

/

И004

9/0

418

73

J

/

Ј004

A/0

408

74

K

/

К004

B/0

41A

75

L/

Л004C

/041

B

76

M/

М004D

/041

C

77

N

/

Н004

E/0

41D

78

O

/

О004

F/0

41E

79

5

_

P

/

П005

0/0

41F

80

Q

/

Љ005

1/0

409

81

R

/

Р005

2/0

420

82

S

/

С005

3/0

421

83

T

/

Т005

4/0

422

84

U

/

У005

5/0

423

85

V

/

В005

6/0

412

86

W

/

Њ005

7/0

40A

87

X

/

Џ005

8/0

40F

88

Y

/

Ѕ005

9/0

405

89

Z

/

З005

A/0

417

90

Š

/

Ш016

0/0

428

91

Đ/

Ђ/

Ѓ0110

/040

2

92

Ć/

Ћ/

Ќ0106

/040

B

93

Č

/

Ч010

C/0

427

94

_005

F

95

6

_

ž

/

ж017

E/0

436

96

a

/

а006

1/0

430

97

b

/

б006

2/0

431

98

c

/

ц006

3/0

446

99

d

/

д006

4/0

434

100

e

/

е006

5/0

435

101

f

/

ф006

6/0

444

102

g

/

г006

7/0

433

103

h

/

х006

8/0

445

104

i

/

и006

9/0

438

105

j

/

ј006

A/0

458

106

k

/

к006

B/0

43A

107

l/

л006C

/043

B

108

m/

м006D

/043

C

109

n

/

н006

E/0

43D

110

o

/

о006

F/0

43E

111

7

_

p

/

q

/

r

/

s

/

t

/

u

/

v

/

w

/

x

/

y

/

z

/

š

/

đ/

ђ/

ć/

ћ/

č

/

DEL 007

F

127

Page 96: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

п007

0/0

43F

112

љ007

1/0

459

113

р007

2/0

440

114

с007

3/0

441

115

т007

4/0

442

116

у007

5/0

443

117

в007

6/0

432

118

њ007

7/0

45A

119

џ007

8/0

45F

120

ѕ007

9/0

455

121

з007

A/0

437

122

ш016

1/0

448

123

ѓ0111

/045

2

124

ќ0107

/045

B

125

ч010

D/0

447

126

\\\|||///

=======

| O O |

\`___'/

_| |_

( )

//|* *|\\

\( * )/

=====

( U )

|| ||

---'| |`----

----' `-----

Аски уметност је уметнички медиј који се пре свега појављује на рачунарима за презентацију и

састављен је од слика које чини 95 видљивих карактера дефинисаних АСКИ кодним системом.

Термин се ређе користи и много неодређеније за уметност засновану на тексту.

Јуникод конзорцијум је међународно тело које се бави стандардима за комуникацију на

дигиталним платформама, а надлежно је и за стандардизацију сличица којима нове генерације

воле да комуницирају и изражавају своје емоције.

Ускоро ће бити објављен Јуникод 9.0 у којем ће бити укључено 70-ак нових емотикона.

Page 97: Istorija ASCII koda - poincare.matf.bg.ac.rspoincare.matf.bg.ac.rs/~jasmina/1d/DomaciKodovi.pdf · latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana

● Yuscii код је био југословенски бинарни код. Предности су му биле што јепоседовао ћирилична слова и што је био наш, али му је озбиљна мана билашто су неки знакови као што су { , [ недостајали те није био прилагођен запрограмере.

● Наука о кодирању порука назива се криптографија. Криптографија је значајнапошто се поруке (као и све што је битно а може се прислушкивати) шифрујукако би се учиниле неразумљивим за неовлашћено лица, па се у испоруцидругој особи дешифрују.

● Најстарији кодови у историји су (према сајтовима informatika.buzdo.com иopusteno.rs ) су римска алтернативна абецеда у којој се свако слово абецедешифровало словом које је три места после у абецеди, а самим тим седешифровао словом које је три места пре у абецеди. Постојао је и спартанскикод који је служио за комуницирање заповедника војске. Поруку су записивалина комаду коже и обмотавали око спиралне палице. Када би је размоталипорука би била нејасна и могла се прочитати само намотавањем на палицуистих димензија и истог облика.

● Постоје алгоритми за симетрично кодирање и они који кодирају на један начин адекодирају на потпуно другачији начин.

● Мана алгоритама за симетрично кодирање је да се могу декодирати грубомсилом, тј. испробавањем свих могућности.

● DES је био званични стандард за енкрипцију у САД-у 1993. али је дешифрованвећ 4 месеца касније пошто је био симетричан.

● RSA код се заснива на одабиру два велика проста броја и шифровања помоћуњих. Код за дешифровање је неупоредиво сложенији од кода за шифровање, апошто за проналазак о којим бројевима се ради не постоји ништа брже одЕратостеновог сита то би процес дешифровања трајао милијардама година.Једини проблем је проналазак великих простих бројева, али постоје алгоритми,попут оних који користе тврђење да ако број испуњава услов Мале Фермаоветеореме, да су му шансе да није прост равне 1:1000000.