Upload
doandiep
View
274
Download
2
Embed Size (px)
Citation preview
Istorija ASCII koda
ASCII kod je prvi put korišćen kao 7-bitni teleprinterski kod.
Nastao je od telegrafskog koda.
Rad na ASCII standardu je počeo 6.10.2016. na prvom sastanku organizacije ASA danas poznate kao ANSI (američki nacionalni zavod za standardizaciju).
ASCII kod je prvi put objavljen 1963 godine ali je menjan dva puta 1867. godine i 1986. godine.
O ASCII kodu
ASCII kod je 7-bitni kod koji se sastoji
od 128 karaktera (33 kontrolna
karaktera).
Uveden je kako bi se standardizovala
komunikacija medju računarima.
U ASCII kodu postoji ukupno 95
karaktera koji se mogu štampati od 2016
do 7E16 (2016 je “SPACE” karakter i ulazi
u karaktere koji se mogu štampati).
prikaz karaktera u
ASCII kodu
O YUSCII kodu
YUSCII kod je adaptacija ASCII koda
korišćena u bivšoj Jugoslaviji pre pojave
ISO-8 i univac standarda.
YUSCII kod je neformalno ime za
nekoliko JUS standarda za 7-bitno
kodiranjemeđu kojima su JUS
I.B1.002(latinica), JUS I.B1.003(Srpska
ćirilica) i JUS I.B1.004(Makedonska
ćirilica).
O YUSCII kodu
YUSCII kod je standardan ASCII kod u kome su ređe korišćeni simboli zamenjeni slovima iz latinice u JUS I.B1.002 odnosno ćirilice u JUS I.B1.003.
Korišćen je za teleprintere ali i u računarima.
Među programerima je smatran kao loša ideja jer su mu nedostajali znaci poput {, [, }, ], ^, ~, |, \ koji su im bili potrebni.
Zanimljivosti
Sva mala i velika slova u standardnom
ASCII kodu se razlikuju samo po
vrednosti petog bita, kod velikih slova on
je 0 a kod malih 1.
Na primer:
G je 1000111
g je 1100111
Zanimljivosti
Peti i Šesti bit određuju kojoj od četiri
ASCII grupe karakter pripada
00 su kontolni kontrolni karakteri
01 su cifre i interpunkciski znaci
10 su velika slova i specijalni karakteri
11 su mala slova i specijalni karakteri
Izvori
https://en.wikipedia.org/wiki/ASCII
https://en.wikipedia.org/wiki/YUSCII
Hvala na pažnji
ASCII kod
ASCII (Američki standardni kod za razmenu podataka) je skup znakova i kodna stranica utemeljena na
latinskom pismu kakvo koristi engleski jezik.Kod nas je popularan kao ošišana latinica.To je sedmobitni
kod.Prvi put ga je objavilo Američko udruženje za standarde 1963.Proizveo ga je servis za podatke Bell Sistem
Bell.Istorijski gledano njegova 1. upotreba je je bila sedmobitni teleprinterski štampač.Neke mogućnosti ASCII-
a,uključujući i iskejp sekvence,dodate su zahvaljujući Bobu Bumeru.
Prva 32 koda u tabeli ASCII-kodova su rezervisana za upravljačke znakove(upravljaju štampačima,skenerima...)
Npr. kod čija je vrednost 10 nalaže štempaču da pomeri papir na gore za 1 red,dok za vrednost 27 simula
pritisak na taster iskejp.Kod 127 poznat je i kao „briši“.Upravljački znakovi XON i XOFF se koriste da kontrolišu
tok podataka sa nekog brzog uređaja an neki spor uređaj da ne bi došlo do preskakanja i gubjenja
podataka.Kod 32 se koristi za razmak između 2 reči.Kodovi od 33 do 126 se nazivaju štampajućim znakovima
koji predstavljaju slova,cifre,znakove interpunkcije...
U početku druge varijante ASCII-a su počele da se prave kako bi se osim engleskog izrazili drugi jezici.Prvi takav
pokušaj se dogodio 1972. godine kada je napravljen ISO 464.Kasnije razvojom tehnologije razvili su se
osmobitmni standardi kao što je ISO/IEC 8859 koji su predstavljali proširenje ASCII-a.Unikod i ISO/IEC 8859
imaju daleko širi izobr znakova i oni ubrzo zamenjuju ISO/IEC 8859 i ASCII.Može se reći da su oni proširenje
ASCII-a.
ASCII kod
ASCII je skraćeno za American Standard Code forInformation Interchange (Američki Standardni Kod zaRazmenu informacija)
Izgovara se „aski“
Standard je za kodiranje karaktera
ASCII kodovi predstavljaju tekst u kompjuterima,telekomunikacionoj opremi i drugim uređajima.
U našim krajevima se ponekad naziva „ošišana latinica“
Osnovno o ASCII
Prvi standard je objavljen 1963. godine, 3 godine nakonšto je započet rad na ASCII kodu (6. oktobar 1960).
Došlo je do velikih ispravki 1967. godine, dok je poslednjapromena nastala 1986. godine
Za razliku od ranijih kodova, ASCII je organizovan tako dabude što lakše sortirati liste alfabetički.
Većina modernih načina kodiranja karaktera su baziranina ASCII, iako sadrže mnogo dodatnih karakera.
Kratka istorija ASCII koda
Mladen =
01001101 01101100 01100001 01100100 01100101 01101110
Puzic =
01010000 01110101 01111010 01101001 01100011
ASCII =
01000001 01010011 01000011 01001001 01001001
Primeri ASCII koda
ASCII umetnost je tehnika grafičkog dizajn koja koristi 95ASCII karaktera koje je moguće ispisati da napravi slike.
Koristila se na pisaćim mašinama, negrafičkimkompjuterskim terminalima, email i izvornim kodovima.
Bila je korisna u situacijama u kojima nije bilo mogućekoristiti slike ili gde je tekst bio čitljiviji od slika.
ASCII umetnost
KODOVI
Ukratko o ASCII kodu
-To je skup znakova i kodna stranica utemeljena na latinskom pismu
koje koristi engleski jezik (i jos neki zapadnoevropski).
ASCII je sedmobitni kod, tj. koristi sedam binarnih cifara (0-127 u
dekadnom).
Prva 32 koda u ASCII tabeli (0-31) su rezervisana za upravljacke
znakove (npr. kod vrednosti 10 je komanda „novi red“).
Rani korisnici ASCII koda su iskoristili neke upravljacke znakove da
predstavljaju posebne vrste podataka (npr. povratak na pocetak
reda).
ASCII umetnost
To je umetnicki medij koji se pre svega pojavljuje u racunarima za
prezentaciju.
Sastavljen je od slika koje cini 95 karaktera (definisanih ASCII kodom,
naravno).
Na slici desno je prikazan primer ASCII umetnosti.
ASCII kod:
EBCDIC kod
EBCDIC je skracenica od Extended Binary Coded Interchange
code.
8-bitni kod. Slika koda je prikazana dole.
UNIKOD (UNICODE)
Je industrijski standard za endokovanje, prikaz I rukovanje tekstom iz
vecine svetskih pisama.
Osnovni problem sa kodnim stranama je to sto se medjusobno
iskljucuju, tj. cijeli dokument mora da bude napisan istim pismom.
To nije uglavnom problem realizovati, ali recimo u turistickom vodicu
gde treba “mesati” jezike (tj. postoji tekst I na srpskom I na
engleskom I ceskom itd).
Odatle ideja da se napravi jedinstveni kod za sve jezike – UNIKOD.
Logo UNIKOD-a:
UNIKOD za Ceski, Madjarski I
Skandinavske zemlje
YUSCII kod
Enkodira latinicu, cirilicu (srpsku I makedonsku).
Korisceni u Jugoslaviji.
Nije vise u upotrebi (jedan od razloga je postojanje UNIKODA).
Evo kako je YUSCII kod zapravo izgledao:
84 72 69 69 78 68 *
* “THE END”, zapisano u ASCII kodu.
Prva verzija ASCII standarda objavljena je 1963.
Današnja verzija je objavljena 1986.
Prva 32 karaktera su kontrolni karakteri
Bit 5 i 6 oznacavaju kojoj grupi karaktera pripada:
Bit 6 Bit 5 Grupa
0 0 Kontrolni karakteri
0 1 Cifre i interpunkcija
1 0 Velika slova i specijalni karakteri
1 1 Mala slova i specijalni karateri
Mala slova se mogu pretvoriti u velika(i obrnuto) promenom petog bita
Ruski standard KOI7 je modifikacija ASCII standarda takva da su sva
mala slova zamenjena velikim ćiriličnim, pa nisu postojala mala slova
Unicode standard razvijen je 1990-ih godina
Cilj je da se dogovori jedan standard za sve karaktere koji postoje
Najnovija verzija je Unicode 9.0, sadrži malo više od 128000 karaktera
Jedan od problema je što nije uzeto u obzir da se karakteri nekih ćiriličnih
pisama razlikuju, što se najčešće ispoljava u Italic-u.
UTF-8 je standard sposoban da zapiše sve karaktere kao Unicode, ali da
zauzima manje prostora za češće karaktere
Sastavili su ga Ken Tompson (razvijo UNIX operativni sistem) i Rob Pajk
Domaći rad o kodovima
YUSCII – 7-bitni kod, kodiranja zasnovana na ISO 646. Korišćen je u Jugoslaviji pre nego što
su ušli u upotrebu ISO 8859-2, Windows -1250/1251 i Unicode. Ime dobio po ASCII kodu.
Onog trenutka kada su računari zaživeli po celom svetu, a ne samo na engleskom govornom
području, javili su se problemi sa nacionalnim znakovima. ASCII je već bio popunjen, pa je
jedno od prvih rešenja bilo da se pojedini simboli "žrtvuju". Tako su kodne reči rezervisane u
ASCII-ju za '@', '[', '\', ']', '^', '`', '{', '|', '}', '~' kod nas pridružene simbolima 'Ž', 'Š', 'Đ', 'Ć', 'Č', 'ž',
'š', 'đ', 'ć', 'č' i tako je nastao YUASCII ili YUSCII.
ASCII - 7-bitni kod i predstavlja standardni kod za čuvanje i prenošenje informacija sa jednog
računara na drugi. U vreme kada je nastao, njegovo korišćenje je planirano samo na engleskom
govornom području, te se stoga naša slova ne nalaze među njegovih 128 karaktera (numerisanih
od 0 do 127). U međuvremenu su se javile potrebe za većim brojem karaktera i samim tim
kodovima veće širine, ali ASCII je ostao sastavni deo svih modernih kodova koji se danas široko
primenjuju.
ISO-8859-2 - 8-bitni kod. Prvih 128 karaktera su identični sa ASCII karakterima i obično se
nazivaju donja kodna strana. Naša slova se nalaze među preostalih 128 karaktera u tzv. gornjoj
kodnoj strani.
UNICODE – 16-bitni kod. Prvih 256 Unicode-kodova se poklapaju sa karakterima u ISO-8859-
1 i nazivaju se kao Latin -1 podskup Unicode-a. Naša slova pripadaju narednom delu od 128
karaktera, Latin Extended – A podskup Unicode-a.
-ASCII(skraćenica od „Američki standardni kod za razmenu podataka“) u srpskom jeziku se
naziva ošišana latinica jer ne sadrzi š,č,ć,đ,ž. Slično drugim kodovima, ASCII određuje odnos
između skupova bitova i znakova pisanog jezika, i omogućava digitalnim uređajima da
međusobno komuniciraju i obrađuju i čuvaju podatke koje sadrže znakove. ASCII je sedmobitni
kod, što znači da koristi sedam binarnih cifara dok se osmi bit uglavnom koristi za proveru
grašaka u prenosu podataka. ASCII je kao standard prvi put objavilo Američko udruženje za
standarde 1963 godine.
-EBCDIC(Extended Binary Coded Decimal Interchange Code) je osmo bitni znakovni sistem koji se
koristi na IBM mainframe z/OS, s/390, AS/400 i i5/OS. EBCDIC kodni sistem razvio se od 6-
bitnog BCD sistema za kodiranje bušenih kartica.
-ISO-8 je osmobitni kod sa 256 karaktera.
-IBM-PC je osmobitni kod čijih se prvih 127 pozicija poklapa sa ISO-8 i ASCII kodom.
-UNICODE je industrijski standard za dosledno enkodovanje, prikaz i rukovanje tekstom iz
većine svetskih pisama. Postoji više verzija Unikoda. Osnovna verzija je dvobajtni format zapisa
do 216 = 65536 znakova. Njen naziv je USC -2 zato što koristi dva okteta, odnosno dva bajta.Sa 16
bitova je rešen problem zapisa svih postojecih pisama. Postoji i noviji UNICODE standard pod
nazivom UCS-4 koji koristi 4 bajta za zapis 231 = 2147483648 znakova podeljenih u tzv. ravni.
Prva dva bajta definišu ravan, tako da ima 215= 32768 ravni. Druga dva bajta definišu znak unutar
ravni, tako da ima 216 = 65536 znakova po ravni.
-UTF-8 je zamišljen kao format koji najviše odgovara latiničnom tekstu. To je veoma pogodno za
korišćenje u izvornom kodu programa ili u raznoraznim markup jezicima jer su standardne
komande tih programskih/markup jezika uvek ASCII, a tekst koji se koristi može da bude i ASCII i
UTF-8. Na taj način se ne ometa rad programskog kompajlera ili parsera markup jezika, a
omogućava se korišćenje višejezičke podrške.
-YUSCII je vrezija ASCII koda prilagođena za potrebe Jugoslavije.
Korišćenje naših karaktera
U ranim verzijama Windows-a korisnici, su se dovijali na razne načine da bi dobili "naše
karaktere". Neki fontovi su sadržali prepravljene tabele, tako da su se umesto engleskih
karaktera koji se ređe koriste ubacivala naša slova (š, đ, č, ć i ž). Najčešće korišćeni tzv. kodni
raspored je bio YUSCII. Fontovi po ovom rasporedu koriste se još i danas (iako sve manje).
Njihov kvalitet je uglavnom jako loš; neki karakteri su izbačeni iz fonta (pa se ne mogu dobiti
znaci poput "@", "^", "\" ili "~"); pri prenosu dokumenta na drugi računar, verovatno naša slova
su se gubila, osim ako ne bismo odneli i instalirali font koji smo koristili. Problem je bio I što
oznake na tasterima tastature nisu postojale ni po jednom od naših bivših "standarda".
Haos koji je nastao iz upotrebe ovog kvazi-standarda su hiljade različitih oblika slova, a išlo se
dotle da su pojedini korisnici imali svoj lični font. Jedina opravdana upotreba je bila u pripremi
grafičkog materijala gde se priprema za štampu obavljala na lokalnom računaru, a na njemu nije
postojao nijedan sličan font po Unicode standardu.
Razmena dokumenata je najbitniji deo priče. Na našem podneblju u "divlje vreme" nepostojanja
razvijenog standarda u praksi zaživelo je čak desetak različitih kodnih rasporeda (osim
standardnog i prihvatljivog CP 852 i najraširenijeg YUSCII rasporeda, tu su bili i Custom 1/2/3,
MacCustom, JUS.015...) pa su korisnici gubili dragoceno vreme prilagođavajući setove
karaktera pri razmeni dokumenata. Najčešće korišćeni "naš raspored" je bio YUSCII koji vuče
korene još iz DOS-a, iako je DOS imao predviđen kodni raspored za naše podneblje po imenu
CP 852.
Kodna strana 852 (poznata kao CP 852, IBM 00852, OEM 852 (Latin II), MS-DOS Latin 2) je kodna strana korišćena pod DOS-om za pisanje na centralno evropskim jezicima (kao što su srpski, hrvatski, češki, mađarski, poljski, rumunski i slovački).
Kodna strana 852 (DOS Latin 2) je vrlo različita od ISO/IEC 8859-2 (ISO Latin-2), iako se obe vode kao "Latin-2", doduše u različitim jezičkim područjima.
Sledeća tabela prikazuje kodnu stranu 852. Svaki karakter prikazan je Unicode prikazom i dekadnim zapisom. Dat je samo drugi deo tabele (kodni zapisi od 128–255), prva polovina tabele (kodni prikaz 0–127) ista je kao u ASCII kodu; dok kodni zapis 1–31 i 127 (00–1Fhex) ima drugačiju interpretaciju u izvesnim uslovima.
CP 852
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _A _B _C _D _E _F
8_ Ç00C7
128
ü00FC
129
é00E9
130
â00E2
131
ä00E4
132
ů016F
133
ć0107
134
ç00E7
135
ł0142
136
ë00EB
137
Ő0150
138
ő0151
139
î00EE
140
Ź0179
141
Ä00C4
142
Ć0106
143
9_ É00C9
144
Ĺ0139
145
ĺ013A
146
ô00F4
147
ö00F6
148
Ľ013D
149
ľ013E
150
Ś015A
151
ś015B
152
Ö00D6
153
Ü00DC
154
Ť0164
155
ť0165
156
Ł0141
157
×00D7
158
č010D
159
A_ á00E1
160
í00ED
161
ó00F3
162
ú00FA
163
Ą0104
164
ą0105
165
Ž017D
166
ž017E
167
Ę0118
168
ę0119
169
¬00AC
170
ź017A
171
Č010C
172
ş015F
173
«00AB
174
»00BB
175
B_ ░2591
176
▒2592
177
▓2593
178
│2502
179
┤2524
180
Á00C1
181
Â00C2
182
Ě011A
183
Ş015E
184
╣2563
185
║2551
186
╗2557
187
╝255D
188
Ż017B
189
ż017C
190
┐2510
191
C_ └2514
192
┴2534
193
┬252C
194
├251C
195
─2500
196
┼253C
197
Ă0102
198
ă0103
199
╚255A
200
╔2554
201
╩2569
202
╦2566
203
╠2560
204
═2550
205
╬256C
206
¤00A4
207
D_ đ0111
208
Đ0110
209
Ď010E
210
Ë00CB
211
ď010F
212
Ň0147
213
Í00CD
214
Î00CE
215
ě011B
216
┘2518
217
┌250C
218
█2588
219
▄2584
220
Ţ0162
221
Ů016E
222
▀2580
223
E_ Ó00D3
224
ß00DF
225
Ô00D4
226
Ń0143
227
ń0144
228
ň0148
229
Š0160
230
š0161
231
Ŕ0154
232
Ú00DA
233
ŕ0155
234
Ű0170
235
ý00FD
236
Ý00DD
237
ţ0163
238
´00B4
239
F_
SHY 00AD
240
˝02DD
241
˛02DB
242
ˇ02C7
243
˘02D8
244
§00A7
245
÷00F7
246
¸00B8
247
°00B0
248
¨00A8
249
˙02D9
250
ű0171
251
Ř0158
252
ř0159
253
■25A0
254
NBSP 00A0
255
_0 _1 _2 _3 _4 _5 _6 _7 _8 _9 _A _B _C _D _E _F
Situacija se u proteklim godinama popravila, zahvaljujući kvalitetnoj sistemskoj podršci
Windowsa počev od verzije 95. Međutim, dokumenti, pa i baze podataka ispisane YUSCII
"standardom" postoje i danas kao eho tog vremena, ali sve ih je manje, što je dobar znak da je
pravilan standard zaživeo. Lakoća primene standarda je presudan faktor za njegovu primenu:
dovoljno je da postavimo odgovarajući kodni raspored tastature i upotrebimo jedan od Unicode
fontova koji se instaliraju uz Windows i dobijamo dokument koji izgleda isto na bilo kom
računaru.
Kodovi
ASCII
Skup kompijuterskih kodova ga je osmislio 1968. godine I standardizovao 1982. godine
kao sredstvo za cuvanje i prenos teksta na engleskom. Standardni kod obuhvata 32
neprikazana kontrolna karaktera (kao što su “početak teksta” ili “vrati na početak reda”)
I 96 prikazanih alfanumeričkih i drugih karaktera, a svako slovo ili drugi simbol imaju
jeda broj od 0 do 128 : fna primer, 33 za !, 36 za $, 65 za A, 66 za B, 97 za a, i 98 za b.
U srpskom jeziku popularno se naziva ošišana latinica — latinica bez kvačica na (velikim i
malim) slovima š, ž, č, ć, odnosno dj umesto đ.
Znakovni kod ASCII, ili njegovo kompatibilno proširenje , se koristi u gotovo svim
računarima, naročito personalnim računarima i radnim stanicama. Preporučeni MIME
naziv za ovo kodiranje je „US-ASCII“.
ASCII je, strogo govoreći, sedmobitni kod, što znači da koristi sedam binarnih cifara (u
rasponu od 0 do 127 u dekadnom sistemu) za predstavljanje znakovnih podataka. U
vreme kada je ASCII bio uveden, mnogi računari su koristili osmobitne grupe (bajtove), ili
preciznije oktete) kao najmanju jedinicu za predstavljanje podataka. Osmi bit je bio
obično korišćen kao bit parnosti za proveru grešaka u prenosu podataka ili je imao ulogu
karakterističnu za dati uređaj.
Neki računarski stručnjaci smatraju ASCII najuspešnijim softverskim standardom ikad
predlaganim.
Istorijski gledano, ASCII se razvio iz telegrafskih kodova i njegova prva komercijalna
upotreba je bila kao sedmobitni teleprinterski kod kojeg je proizvodio Servis za podatke
Bel.
„Separatorski“ znakovi trebalo je da se koriste u sistemima koji koriste magnetne trake,
ali su ove ispale sa tržišta pojavom modernijih medijuma.
Upravljački znakovi XON i XOFF se koriste da kontrolišu tok podataka sa nekog brzog
uređaja (npr. računara) na neki spor uređaj (npr. štampač) da ne bi došlo do preskakanja
i gubljenja podataka.
EBCDIC
To je prošireni binarni kod za IMB mainframe, računare srednje klase, I spoljašnjeuređaje koji koriste 8-bitni umesto originalnog 6-bitnog formata. Iako je EBCD uupotrebi danas , postoje I modernije forme kodiranja kao što su ASCII i Unicode.
EBCDIC se sastoji od formata 8-bitni karaktera koji opisuju kako kompjuter interpretirakomande.
Na primer, dok jedan bit može kontrolisati u kom jeziku je komanda, drugi bit može kontrolisatida li je karakter predstavljen kao veliko ili malo slovo.
Dok EBCDIC sadrži osnovne funkcije za podršku stvarnih računarskih svojstva i ima blagu podrškuza novije jezike, to ne podržava mnoge funkcije koje Unicode i ASCII pružaju, kao što jemogucnost da se piše na više jezika.
Prednost EBCDIC-a je to što se sastoji od jezika 8-bitni karaktera, a ne starog 6-bitnog jezika kojise zasnivao na kodirajućem sistemu bušenih kartica. Ovo omogucava da EBCDIC pruži IBMmašinama podršku za širok spektar funkcija . Međutim, EBCDIC dozvoljava mašinama daobrađuju Engleski I samo još jedan jezik I ispisuje karaktere sa leva na desno radije nego sadesno na levo , kakav je slučaj u arapskom jeziku.
UNICODE (UNIversal encODE)
Postoji više verzija unicode-a. Bazična verzija je dvobajtni format zapisa do 216 = 65536
karaktera. Njen naziv je ucs-2 zato što koristi dva okteta, odnosno dva bajta. Sa tih 65536
karaktera riješen je problem zapisa skoro svih postojećih pisama (uključujući čak i neka
izmišljena, kao na primer klingonsko pismo).
Prvo je razvijena unicode transformaciona šema sa osnovnom jedinicom od 8 bita. Pomoću nje
se karakter zapisuje u jednom, dva ili tri bajta, u zavisnosti od toga o kom je karakteru reč.
Postoji i noviji unicode standard pod nazivom ucs-4 koji koristi 4 bajta za zapis 231 =
2147483648 karaktera podijeljenih u tzv. Ravni. Prva dva bajta definišu ravan, tako da ima 215 =
32768 ravni. Druga dva bajta definišu karakter unutar ravni, tako da ima 216 = 65536 karaktera
po ravni. Taj noviji format je više napravljen kao plan za budućnost nego kao realna opcija.
Postoje dvije organizacije koje definišu dva standarda za Unicode. Jedan format je razvijen od
strane tzv. The Unicode Consortium pod nazivom The Unicode Standard. Drugi standard je
razvila Međunarodna organizacija za standardizaciju - International Organization for
Standardization. Ta dva standarda su skoro identična i razlikuju se po predstavljanjuu kineskih,
japanskih I korejskih znakova.
Svjetski trendovi razvoja baza podataka idu ka uvođenju Unicode-a, kao standardni način zapisa
podataka. Većina baza podataka već duže vreme podržava Unicode.
UTF-8
UTF-8 varijanta je najzgodnija za kodiranje većinski latiničnog teksta.
UTF-8 je zamišljen kao format koji najviše odgovara latiničnom tekstu. To je veoma pogodno za
korišćenje u izvornom kodu programa ili u raznoraznim markup jezicima (HTML, XML, \LaTeX, ...)
jer su standardne komande tih programskih/markup jezika uvek ASCII, a tekst koji se koristi
može da bude i ASCII i UTF-8. Na taj način se ne ometa rad programskog kompajlera ili parsera
markup jezika, a omogućava se korišćenje višejezičke podrške.
U UTF-8 se karakter zapisuje u obliku jednog bajta ako u svom zapisu sadrži samo najnižih 7 bita,
odnosno, ako je reč o ASCII karakteru (vidi poglavlje Razvoj elektronskog zapisa teksta). Ukoliko
karakter u svom Unicode zapisu sadrži samo najnižih 11 bita, u UTF-8 se zapisuje u obliku dva
bajta. I na kraju, ako karakter sadrži svih 16 bita, zapisuje se u obliku tri bajta. U tabeli 1 je data
šema kako se UCS-4 transformiše u UTF-8. Tabela je data za pun, četvorobajtni Unicode, a ako je
reč o dvobajtnom Unicode-u, tj. o UCS-2, treba gledati samo prva tri reda u tabeli. Detaljniji opis
algoritma za transformaciju može se naći u RFC 2279.
UTF-8 nije optimalan način zapisa za kineski i japanski tekst jer umesto da se koriste dva bajta po
karakteru, za takav tekst bi bilo korišćeno čak tri bajta po karakteru, ali to i nije toliko važno za
nas. Za ćirilični tekst je, sa druge strane, sve jedno da li se koristi čisti UNICODE ili UTF-8, pošto
se svaki ćirilični karakter zapisuje u obliku dva bajta i u jednom i u drugom formatu. Za nas je
ipak optimalniji UTF-8 jer postoji mogućnost pisanja i ćirilicom i latinicom, pa ako u ćirilici već ne
može da se izbegne upotreba dva bajta, u latinici se skoro svi karakteri zapisuju samo sa jednim
bajtom (osim šđčćž).
IMB-PC
Code page 437 je set karaktera za originalni IBM PC ili DOS. Poznat je takođe i kao CP437, OEM-
US, OEM 437, PC-8,[2] ili DOS Latin US. Komplet sadrži ASCII kodove 32-126, produžene kodove
za akcentovana slova ,neka Grčka slova, ikone i linijski crtane simbole. Nekad se I naziva "OEM
font" ili "high ASCII", ili "extended ASCII”.
U kontrolnom rasponu C0 (0 – 31) mapirani su grafički karakteri. Za ove kodove se
podrazumijeva njihova izvorna kontrolna funkcija, ali se prikazuju kao grafički kada se nalaze u
RAM-u grafičke kartice. Kod 127, DEL, takođe ima grafički prikaz.
U rasponu 128 – 255 mapirani su različiti znakovi: neki karakteri s dijakriticima, karakteri za
crtanje okvira, matematički znakovi i deo grčkog alfabeta.
Ovaj karakter postavlja ostatke primarnog fonta u jezgru od EGA ili VGA kompatibilnih grafičkih
kartica.
To je prvi tekst koji se pojavi kad se kompijuter ponovo pokrene.
Kodovi i kodiranje
Uvod
▪ Računar razumije samo binarni jezik , jezik koji se sastoji od dva simbola,„0“ i „1“. Unutar računara znakovi su prikazani pomoću binarnih brojeva.
▪ Postupak pripisivanja simbola znakovima vanjskog svijeta naziva sekodiranje. Skup takvih simbola naziva se kod. Kodni sistem je dogovor onačinu kodiranja. Najrasprostranjeniji kodni sistem je ASCII kod ( skraćenood: American standard code for information intercharge). Svaki simbol iznak je predočen jednim sedmeroznamenkastim binarnim brojem, aukupno je na raspolaganju 27 =128 znakova.
▪ Postoji i proširen , osambitovni ASCII u kojem se prvih 128 znakova koristikao i u osnovnom ASCII-u , a preostalih 128 znakova se koristi za slovarazličitih zemalja , pa postoji mnogo različitih proširenih ASCII normi.
Kod
▪ Kodovi su nastali u srednjem vijeku. U istoriji se spominju kodovi još iz XIII i XIV vijeka koji suprimjenjivani u nekim italijanskim državicama.
▪ Disciplina koja se bavi proučavanjem i otkrivanjem kodova i šifri zove se kriptografija.
▪ Kod je u najširem smislu sistem znakova pomoću kojega sudionici komunikacije (najmanje dva)komuniciraju. Svaki kod da bi se smatrao kodom mora imati popis svih znakova, propis po kojemuse ti znakovi slažu i opis tih znakova.
▪ Kod je vrsta šifre kod koje se riječi, rečenice, dijelovi riječi i rečenica, slova i brojevi otvorenogteksta zamjenjuju grupama slova ili brojki - kodnim zamjenama. Kodovi se najčešće izrađuju uobliku rječnika. Sadrže nekoliko desetina hiljada otvorenih izraza, od kojih svaka ima po jednu iliviše kodnih zamjena, skupine od po 2, 3, 4 ili 5 slova ili brojeva. Kao i ostale vrste šifri i kodovi sunamijenjeni osiguranju tajnosti sadržaja povjerljive poruke (vojne, diplomatske i druge).
▪ Kodom se postiže i skraćivanje teksta.
Osnovne teorije kodiranja
▪ Pod kodiranjem razumijevamo prevođenje određenih podataka u simboličke oblike s ciljemnjihove obrade putem kompjutera. Prema tome, kompjuterska obrada podataka pretpostavljakodiranje podataka pri ulazu u središnju procesorsku jedinicu i nakon njihove obradedekodiranjem radi distribucije korisnicima. To drugim riječima znači da su prihvaćanje, čuvanje iobrada podataka u kompjuteru mogući samo ako su oni kodirani pomoću dualnih simbola 0 i 1 .Suština i cilj kodiranja jest transformacija znakova napisanih u alfabetu u simbole alfabeta.
▪ To znači da se sva slova brojevi , specijalni znači i instrukcije kodiranu alfabetom. Prema tome ,ulazni skup podataka B= (bi), i= 1,2,3,…. n. Može se izvesti skupom simbola Am= (aj) , j=1,2,3,…m koji se nazivaju simbolima alfabeta. Svaki simbol alfabeta Am naziva se slovo čiji nizčini riječ , a dužina riječi može biti različita.
▪ Ma koliko sve riječi koje čine kod moraju biti iste dužine od q slova , onda je riječ oravnomjernom kodu čija dužina mora zadovoljiti uslov n<=qm . Za n=qn dobiva se brojkombinacija koje znači mogućnost nekog sustava za kodiranje gdje m predstavlja bazu koda a q broj znakova u kodnoj riječi. Međutim svaki sustav za kodiranje mora zadovoljiti načelojednoznačnosti i ekonomičnosti. Jednoznačan je onaj kod u kojem su sve riječi različite. Ekonomičan je onaj kod koji ima najmanju redundanciju.
Dekodiranje
▪ Dekodiranje je obrnuti proces, kada se podaci poslati od izvorapretvaraju u informaciju razumljivu primaocu. Jedan od razloga zakodiranje je omogućiti komunikaciju tamo gdje normalni govorni ilipisani jezik nije moguć. ( na primjer u računaru) .
▪ Pri procesu dekodiranja informacija se mora pretvoriti u drugi oblikkorištenjem istih pravila i normi korištenih prilikom kodiranja da bi sedobila identična informacija to jest da bi se ispravno prenijela vijestdo odredišta.
ASCII
▪ Jedan od najstarijih i najrasprostranjenijih kodnih sistema zakomunikaciju računalom je ASCII kod. Razvio ga je American NationalStandards Instituta ,a prve verzije koda su razvijene 1963.g. zapotrebe američke telefonske i telegrafske mreže.
▪ ASCII kod je skraćenica od početnih slova rečenice 'AmericanStandard Code for Information Interchange', što prevedeno znači:Američki standardni kod za razmjenu informacija. Tokom razvojaračunarske tehnologije definisano je više varijanti ovoga koda.Najčešće je u upotrebi osam bit-na varijanta u kojoj je prvih 128kombinacija (0-127) standardizirano, a drugih 128 kombinacija (128-255) dato je na volju korisniku da sam kreira kodne elemente.
▪ Po ASCII-u je nazvan jedan asteroid.
Prvih 128 elemenata ASCII koda
2 tipa ASCII koda
▪ 1. Osnovni ASCII kod koristi kodne zamjene dužine 7 bita, što značida se njime može prikazati 128 znakova ( 27 ). Svaki simbol i znak je predočen jednim sedmeroznamenkastim binarnim brojem.Prva 32 mjesta u ASCII tablici su dodijeljena kontrolnim znakovima(neispisivi znakovi) a ostala 96 su slova, brojke, znakovi interpunkcijeitd.
▪ 2. ProšireniASCII kod koristi 8 bitne zamjene te može prikazati 256 ( 28 ) različitih znakova. Prvih 128 znakova jednako je standardnomASCII kodu. Pomoću njega se prikazuju posebni znakovi drugih jezikate grafički znakovi. Zbog razlike u jezicima u različitim zemljama sudonesene lokalne norme.
EBCDI
▪ - Extended Binary Coded Decimal Interchange Code (EBCDI ) jeosmobitni kod , odnosno prošireni , izmjenjivi binarno-decimalni kod.
▪ U ovom kodu svaki se standardni znak prikazuje pomoću jednogbajta, pa je tako omogućeno prikazivanje 28 = 256 različito kodiranihznakova.
UNICODE
▪ Standard za razmjenu podataka usmjeren na prikaz slova na načinneovisan o jeziku, računarskoom programu ili računarskoj platformi.
▪ On predstavlja daleko veći skup od dotadašnjih 256 znakova. Unicodekonzorcij i ISO, međunarodna organizacija za standardizaciju suuskladili napore i proizveli usuglašene standarde ISO-10646 odnosnoUnicode.
▪ Ovi standardi omogućuju ispravno bilježenje i razlikovanje prekomilion znakova, što nam omogućuje ispravan i nedvosmislen prikazznakova korištenih u mnogobrojnim jezicima i pismima.
UTF-8
▪ UTF-8 je zamišljen kao format koji najviše odgovara latiničnom tekstu. To je veoma pogodno zakorišćenje u izvornom kodu programa ili u raznoraznim markup jezicima (HTML, XML, \LaTeX, ...) jersu standardne komande tih programskih/markup jezika uvek ASCII, a tekst koji se koristi može dabude i ASCII i UTF-8. Na taj način se ne ometa rad programskog kompajlera ili parsera markupjezika, a omogućava se korišćenje višejezičke podrške.
▪ U UTF-8 se karakter zapisuje u obliku jednog bajta ako u svom zapisu sadrži samo najnižih 7 bita,odnosno, ako je reč o ASCII karakteru (vidi poglavlje Razvoj elektronskog zapisa teksta). Ukolikokarakter u svom Unicode zapisu sadrži samo najnižih 11 bita, u UTF-8 se zapisuje u obliku dva bajta. Ina kraju, ako karakter sadrži svih 16 bita, zapisuje se u obliku tri bajta. U tabeli 1 je data šema kakose UCS-4 transformiše u UTF-8. Tabela je data za pun, četvorobajtni Unicode, a ako je reč odvobajtnom Unicode-u, tj. o UCS-2, treba gledati samo prva tri reda u tabeli. Detaljniji opisalgoritma za transformaciju može se naći u RFC 2279.
▪ UTF-8 nije optimalan način zapisa za kineski i japanski tekst jer umesto da se koriste dva bajta pokarakteru, za takav tekst bi bilo korišćeno čak tri bajta po karakteru, ali to i nije toliko važno za nas.Za ćirilični tekst je, sa druge strane, sve jedno da li se koristi čisti UNICODE ili UTF-8, pošto se svakićirilični karakter zapisuje u obliku dva bajta i u jednom i u drugom formatu. Za nas je ipak optimalnijiUTF-8 jer postoji mogućnost pisanja i ćirilicom i latinicom, pa ako u ćirilici već ne može da se izbegneupotreba dva bajta, u latinici se skoro svi karakteri zapisuju samo sa jednim bajtom (osim šđčćž).
Tabela:
Šema kodiranja UCS-4 u UTF-8
UCS-4 opseg (hex.) UTF-8 binarni zapis
0000 0000-0000 007F 0xxxxxxx
0000 0080-0000 07FF 110xxxxx 10xxxxxx
0000 0800-0000 FFFF1110xxxx 10xxxxxx 10xxxxxx
0001 0000-001F FFFF 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
0020 0000-03FF FFFF 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
0400 0000-7FFF FFFF 1111110x 10xxxxxx ...10xxxxxx
Hvala na pažnji!
ZAPIS ZNAKOVNIH PODATAKABINARNI KODOVI
UVOD
• Kreatori jezika C su bili minimalisti (po današnjim merama, jer jeza tada bilo dovoljno (za engleski jezik)). Na početku jepostojao samo char (skraćenica od charactrer) sa 8 bitova začuvanje simbola.
• Bitno je da je maksimalan broj simbola kodiranih sa 8 bitova256, a danas postoji više od miliona različitihsimbola/karaktera.
• Tek kasnije je dodat wchar_t, ali sada nije o tome reč.
ASCII • Domišljati kreatori ASCII koda su brzo rezervisali prvih 128
kodova pod standardne simbole kojima je bilo mogućekodirati maltene sve vezano za engleski jezik, ostavivšipreostalu polovinu za potrebe celog sveta.
• Na početku svi su se trudili da se uguraju u preostalu polovinu;svaki set simbola je bio standardizovan pod određenimnazivom. Jednog dana je postojalo više standarda negosimbola u bajtu i svi su se bitno razlikovali u delovima van prvih128 simbola. Tako je došlo do potpunog haosa, računari suprikazivali nečitljive znakove i simbole…
ASCII
TABLE
PRIMER EXTENDED ASCII (BASIC LATIN)
• Osim toga, postojao je i ogromni broj drugih kodova; došlo je ido različitih nikako ne povezanih kodiranja istih stvari, na primerMS DOS za ćirilicu koristi kodove 855 i 866, Windows koristi 1251,a Mac Os još nešto. Osim toga postoje i KOI 8 i KOI 7, pa i ISO8859-5, i svako slovo ima više različitih izgleda.
• Primer mešanja više kodova (Chrome u Notepad-u):
hрaI ќГиUр цШАюА„Ыt „АtjYл3ЙAишюяя„АuhшCI hCI я”ђH Pя�ђH …АtяР[‹е]ГU‹мѓм|ЎPK 3Е‰EьSVWj^3А‰uшj3Ыf‰EдЌUд‰]фYи%& „А„‚ ЌMди•µ „А„r h hшDI h ЂЌM�‰]�‰]њ‰] иНУ …А…BnH
• Kao rešenje se pojavio UNICODE.
UNICODE
• Ideja UNICODE (UNIversalenCODE) je bilajednostavna. Svaki simbolje dobijao svoj kod jednomi zauvek. Ovo je 16-bitnikod i može da sadrži 65536različitih karaktera (a to jeviše nego dovoljno). Ukasnijoj verziji je proširen na32 bita.
DRUGI KODOVI
Osim ASCII i UNICODE izdvajaju se i drugi kodovi poput EBCDIC, ISO-8, IBM PC, itd.
• EBCDIC (Extended Binary Coded Decimal Interchange Code) jestandardni 8-bitni kod koji je stvorio IBM za svoju proizvodnju, postojaloje najmanje 6 verzija EBCDIC-a i sve su bile međusobnonekompatibilne.
• ISO-8 (International Organization for Standardization-8). 8-bitni kod, 256karaktera. Prvih 127 pozicija poklapa se sa ASCII kodom. Pozicije iznadsu popunjenje različitim kontrolnim i grafičkim karakterima i simbolima.
• YUSCII je bio 7-bitni kod baziran na ASCII za Jugoslaviju (YU) mnogonezgodan za programere u C-u zato što su uglaste i vitičaste zagradezamenjene slovima š, ć, ž, itd.
IBM PC KOD• IBM-PC kod, takođe poznat kao CP437, OEM-US, OEM 437, PC-
8, ili DOS Latin US; je kod korišćen od prve verzije IBM PC-a sveod 1981. godine. Bitan je po tome što je prvi značajniji načinkodiranja u koji su ubačeni emotikoni i slični simboli.
UTF-8
• UTF-8 (Unicode Transformation Format) je način kodiranjaJunikoda, pri čemu se svaki UNICODE simbol kodira pomoćupromenljivog broja (1-4) okteta (svaki oktet ima 8 bitova), pričemu broj okteta zavisi od celobrojne vrednosti koja jedodeljena UNICODE karakteru. On je kompatibilan sa ASCIIkodom i danas je u veoma širokoj upotrebi.
KRAJ
______________[C++ _☐x][ ]__
[ { } ] \[______________] \
\_M_ \\
==================
_ _\{0 } _ {0 }\
KODOVI
Kod je vrsta šifre kod koje se reči ili rečenice, delovi reči i rečenica, slova i brojevi
zamenjuju grupama slova ili brojeva.
Kodiranje predstavlja prevođenje određenih podataka u simboličke oblike obrnut
proces naziva se dekodiranje.
Oni su jako potrebni računaru pošto on razume samo cifre 0 i 1.A potrebno je
definisati još mnoge simbole i znakove.
Kodovi su nastali još u srednjem veku i korišćeni su u nekim tadašnjim italijanskim
državama.
Nauka koja se bavi proučavanjem kodova i šifri zove se kriptografija.
Svaki kod se sastoji od određenog broja bitova.Što više bitova to je veći broj
mogućih znakova u kodu.
Najčešće se izrađuju u obliku rečnika.Sadrže hiljade otvorenih izraza, od kojih
svaki ima po jednu ili više kodnih zamena, od po 2, 3, 4 ili 5 slova ili brojeva.
Poznatiji kodovi:
1. Gray Aiken
2. Exzess 3
3. BCD(Binary Coded Decimal)
4. ASCII (American Standard Code for Information Interchange)
5. EBCDI (Extended Binary Coded Decimal Interchange Code)
6.
Gray kod
- u ovom kodu se brojevi prikazuju tako da svaka decimalna znamenka zameni
adekvatnom binarnom tetradom.
Aiken kod- on pripada u simetrične kodove što olakšava izvođenje računskih
operacija .
Exzess 3
- dobio je ovo ime zato što se njegove tetrade pomiču za tri mesta u odnosu na
BCD kod, a to znači da tetradi iz čistog binarnog koda dodajemo broj 0011.
BCD kod
- ovaj kod je posredni kod između čistog binarnog i decimalnog koda , što znači da
se svaka decimalna znamenka direktno izražava pomoću jedne terade.ulazni i
izlazni podaci iz kompjuterska formiraju se u decimalnom obliku , ali se u
kompjuteru putem ovog koda svaka decimalna znamenka predstavlja pomoću 4
bita tzv.tetrade, koje predstavljaju broj u binarnom obliku.
ASCII KOD
Jedan od najstarijih I najrasprostranjenijih kodova.
Definisano je više varijanti ovog koda a najviše se upotrebljuje 8bit-na verzija u
kojoj je prvih 128 kombinacija standarno a drugih 128 ostavljeno prazno da
korisnik sam može da ih kreira.
1. Osnovni ASCII kod koristi kodne zamene dužine 7 bita, što znači da se njime
može prikazati 128 znakova ( 27 ).
Prva 32 mesta u ASCII tablici su dodeljena kontrolnim znakovima (neispisivi znakovi)
a ostala 96 su slova, brojke, znakovi interpunkcije itd.
2. Prošireni ASCII kod koristi 8 bitne zamjene te može prikazati 256 ( 28 ) različitih
znakova. Prvih 128 znakova jednako je standardnom ASCII kodu. Pomoću njega se
prikazuju posebni znakovi drugih jezika. Zbog razlike u jezicima u različitim
zemljama su donesene lokalne norme.
ZNAČENJA POJEDINIH INSTRUKCIJA ASCII KODA
SOH → oznaka početka kontrolnih podataka pred blokom poruke
STX → oznaka kraja kontrolnih podataka i početak bloka poruke
ETX → oznaka kraja bloka poruke
EOT → oznaka kraja prenosa podatka (kontrole i poruke)
ENQ → zahtev za odgovor odredišta
ACK → potvrda odredišta o prijemu
BEL → aktiviranje zvučnog poziva
BS → brisanje kursorom unatrag (u levo)
HT → kontrola skokova
LF → postavljanje kursora u novi red
VT → kontrola skokova po redovima
FS → rastavljač blokova podataka (datoteka)
GS → rastavljač grupe podataka u bloku
RS → rastavljač pojedinih zapisa u grupi
US → rastavljač jedinica
SP → razmak (prazan znak)
DEL → brisanje znaka s desne strane kursora
-EBCDI KOD
Extended Binary Coded Decimal Interchange Code (EBCDI ) je osmobitni kod
odnosno prošireni , izmjenjivi binarno-decimalni kod. U ovom kodu svaki se
standardni znak prikazuje pomoću jednog bajta, pa je tako omogućeno prikazivanje
28 = 256 različito kodiranih znakova. Također se i kod ovog koda za skraćeno
prikazivanje znakova koristi heksadecimalni ili oktalni brojevni sistem.
-UNICODE
Standard za razmenu podataka usmeren na prikaz slova na način nezavvisan od
jezika, računarskom programu. On predstavlja daleko veći skup od dotadašnjih 256
znakova. Unicode i ISO-međunarodna organizacija za standardizaciju su uskladili
napore i proizveli usaglašene standarde ISO-10646 odnosno Unicode. Ovi
standardi omogućuju ispravno beleženje i razlikovanje preko milion znakova, što
nam omogućuje ispravan prikaz znakova korišćenih u mnogobrojnim jezicima i
pismima.Jako je koristan jer sada u celom svetu svi mogu da se sporazumeju preko
njega.
ZANIMLJIVOSTI O KODOVIMA
-Tajni agent 007
Popularni lik iz filma Džejms Bond dobio je broj 007 po kodu 0070 koji je
Nemačka dodelila nizu svojih ratnih kodova.
-Mnogi korisnici Android telefona ne znaju za skrivene kodove u meniju za
pozivanje.
1 *#*#197328640#*#* – Aktivacija test režima
2. *#*#232339#*#* – Test za Wireless LAN
3. *#*#0842#*#* – Test za vibraciju i pozadinsko svjetlo
4. *#*#2664#*#* – Test za displej osjetljiv na dodir
5. *#*#1111#*#* – FTA (fabrička) verzija softvera (uz 1234 u kodu daje
prikaz PDA i FW)
6. *#12580*369# – Informacije o softveru i hardveru
7. *#9090# – Dijagnostičke informacije
8. *#9900# – System dump mode
9. *#301279# – HSDPA/HSUPA kontrolni meni
Kodovi
Kodovi su uvedeni da bi se prikaz slova i znakova pomoću binarnog sistema u racunarima standardizovao
i da bi se slova zapisivala isto u svakom kompjuteru (bilo je potrebno zbog prenosa kodova sa jednog
računara na drugi).
ASCII (American Standard Code for Information Interchange) jedan je od najpoznatijih kodova. Većina
današnjih kodova se zasnivaju na ASCII kodu, ali su u njih dodati još neki karakteri kao što su ćirilična
slova, nemačka slova sa umlautima itd. Početak razvijanja ASCII koda bio je 1960. godine na sastanku
udruženja ASA (American Standard Assosiation, kasnije nazvanog ANSI, te se ovaj kod naziva i
ANSI_X3.4-1968). ASCII kod je zasnovan na tadašnjem telegrafskom kodu od strane Bell laboratorija.
ASCII sadrži dve grupe karaktera: kontorlni (control characters) i vidljivi (printable characters). Kontrolni
karakteri služili su za zapisivanje naredbi kao što su novi red, kraj teksta itd., dok su vidljivi služili za samo
ispisivanje teksta. Kod se menjao kroz vreme, objavljen je 1963. godine, da bi se 1986. godine formirala
njegova verzija koja se i danas koristi. ASCII je na početku bio 7-bitni kod, popunjen je sa 100 karaktera a
ostalih 28 ostavljeni su kao mogućnost za dodavanje novih karaktera. Kako su razvijani računari, prostor
za čuvanje podataka postao je jedan bajt (8 bitova) tako da su nastali novi kodovi od ASCII koda, koji su
koristili osam bitova za zapis karaktera. Takođe, vremenom su nastale i razne verzije ovog koda kao što
su YUSCII (Yugoslav Standard Code for Information Interchange), ISCII (Indijska verzija), VISCII
(Vijetnam) itd. Zanimljivo je da se iz ovog koda razvila tehnika grafičkog dizajna koja se naziva ASCII art.
To su slike koje se sastoje od različitih karaktera. Još jedna zanimljivost je da je jedan asteroid nazvan po
ASCII kodu.
EBCDIC (Extended Binary Coded Decimal Interchange Code) objavljen je 1963. godine od strane
kompanije IBM. Napravljen je kao proširenje BCDIC sistema za kodiranje (Binary Coded Decimal
Interchange Code). U ovo vreme EBCDIC bio je opšte nepopularan među programerima. Eric S. Raymond
napisao u svom rečniku Jargon file: “Postoji bar šest verzija ovog koda koje su nekompatibilne
međusobno, a ni jedna verzija ne sadrži sve karaktere koji su potrebni za moderno programiranje”.
ISO-8 (International Organization for Standardization-8) je osmobitni kod koji lici na EASCII (Extended
ASCII), dakle sadrži 256 karaktera, od kojih se prvih 127 poklapa sa ASCII kodom. IBM PC je takođe razvio
osmobitni kod, kod koga se prvih 127 karaktera poklapa sa ASCII kodom, a ostatak je originalno
definisan.
UNICODE (UNIversal enCODE) nastao je 1990. godine da bi se omogućilo ispisivanje teksta na više
različitih jezika. Sadrži više od 128.000 različitih slova. Karakteri se u kompjuteru mogu prikazati kao 8
bitova, 16 bitova ili 32 bita.
UTF-8 (Unicode Transformation Format) je kod, kod koga duzina zapisa karaktera u kompjuteru moze da
varira (8 bitova, 16 bitova ili 32 bita). Ovaj kod napravili su Ken Thompson i Rob Pike. Danas je
najkorišćeniji od svih kodova.
Najčešći ASCII Kontrolni Karakteri
Kontrolni karakter, ili neštampajući karakter jeste karakter koji ne predstavlja simbol za pisanje.
U ASCII tabeli to su karakteri do koda 32, a i kod 127 (DEL karakter) je takodje kontrolni
karakter. U novijim načinima kodiranja, kao što su ISO-8 i UNICODE, postoji još kontrolnih
karaktera.
Ispod su navedeni neki od bitnijih kontrolnih karaktera iz ASCII tabele i njihova značenja:
0 (null, NUL ,\0, @), prvobitno je trebalo da bude karakter koji bi se potpuno ignorisao,
ali ga u današnje vreme mnogi programski jezici koriste za označavanje kraja stringa;
7 (bell, BEL, \a, ^G), često se koristi da natera uredjaj da pošalje upozorenje (najčešće
zvučno);
8 (backspace, BS, \b, ^B), koristi se da obriše poslednji ispisani karakter;
9 (horizontal tab, VT, \v, ^K), pomera sve karaktere u redu za nekoliko mesta udesno;
10 (line feed, LF, \n, ^J), označava kraj reda na većini UNIX sistema;
12 (form feed, FF, \f, ^L), daje informaciju štampaču da izbacuje papir do početka
sledeće stranice ili terminalu da očisti ekran;
13 (carriage return, CR, \r, ^M), vrlo je sličan line feed-u s tim što resetuje poziciju na
početak reda;
26 (Control-Z, SUB, EOF, ^Z,) koristi se kao zamena za nepoznati karakter;
27 (escape, ESC, \e, ^[), ima razne primene, najčešće se koristi da prekine neki proces;
127 (delete, DEL, ^?), kao i 0, planirano je da se koristi kao karakter koji se ignoriše,
ali se sada u nekim sistemima koristi da izbriše karakter.
ZANIMLJIVOSTI O KODOVIMA
Uvod
Kodovi se dele prema tome koliku dužinureči mogu da prevedu.
Dakle imamo :
1. Petobitne kodove
2. Šestobitne kodove
3. Sedmobitne kodove
4. Osmobitne kodove
5. 10,16,32-bitni kodovi
6. Tetradni kodovi
7. Varirajuća dužina koda
Petobitni kodovi
1. ITA 1 – Baudotov kod
2. ITA 2 – Murejov kod
3. USTTY – varijanta ITA 1 u Americi
4. DIN 66006 – napravljeni za prezentaciju
ALGOL/ALCOR programa na papirnim
trakama i bušenim karticama
Koristili su se u vreme kada su se
koristile bušene kartice
Šestobitni kodovi
1. IAT 4
2. Šestobitni BCD – korišćen na početnim
industrijskim kompjuterima
3. Šestobitni ASCII – preteča današnjeg
ASCII-a
4. Brajev kod – pretstavljen preko 6 tačkica
rasprostranjenih u četvorougao
Sedmobitni kodovi
1. IAT 3- izveden iz Moore ARQ koda a
poznat je i kao RCA
2. ASCII – kao i njegove verzije koje su
pravljene prvobitno za teleprintere
(YSCII)
3. CCIR 476 – unapređena verzija ITA 2
4. ITA 4 – unapređena verzija
Osmobitni kodovi
1. Extended ASCII
2. HP Roman
3. ISO/IEC 8859
4. MAC OS Roman
5. Windows – 1252
6. EBCDIC – korišćen u ranijim IBM
računarima
10,16,32-bitni kodovi
1. AUTOSPEC – Bauerov kod (10-bitni
kod)
2. UCS-2 – unapređen Unicode(16-bitni
kod)
3. UTF-32/UCS-4 – svaki karakter se
pretstavlja preko 4 bajta unapređeni
Unicode (32-bitni kod)
Tetradni kodovi
1. Grej-u ovom kodu se brojevi prikazuju
tako što se svaka decimalna cifra zameni
odgovarajućom tetradom
2. Aiken – simetrični kod koji olakšava
operacije
3. Exzess-3 kod – tetradi iz čistog binarnog
broja dodajemo broj 0011
4. BCD kod – jako poznati način kodiranja
rađen na času
Varirajuća dužina koda
1. UTF-8 – pokriva ceo unicode sasekvencom do osam 4-bitna bajta
2. UTF-16 - unapredjeni UCS-2 koji je možeda uzima vrednost od jednog ili dva 16-bitna elementa
3. GB 18030 – napravljen da bi se unicodeuskladio sa kineskim miltibajtovskimkodovima
4. Huffman – korišćeniji karakteri seobeležavaju kraće nego specijalni; pretstavakoda je interesntna jer se pretstavlja prekografa
Baudotov kod
Ovaj kod se primenjivao na mašini koja jeradila po principu 3 desna 2 leva prsta.
Kada bi neko ukucao tih pet parametarana tastaturi mašina bi čekala dok seprenos podataka ne završi a potom bi uz“ritamski signal” obavestila da je spremnaza sledeći unos.
To je u to vreme bio napredak jer su sedo tada koristili samo teleprinteri zaslanje informacija.
Izgled mašine na kojoj se kucalo Tabela pretstavljanja karaktera
Murejov kod
Ovo je unapređena verzija Baudotovog
koda značajna je jer su njom uvedeni
takozvani KONTROLNI KARAKTERI.
Za razliku od Baudotovog koda gde se
svaki uneti karakter ispisivao kod
Murejovog koda su kontrolni karakteri
doneli na preglednosti celog zapisa.
Upoređene tabeleBritish Creed mašina na kojom se radilo sa ovim kodom
Morzeova azbuka
Značaja Murejovog i Baudotovog koda je
da se iz njih razvio Morzeov kod.
On se koristio na mašini koja je odašiljala
kraće ili duže pulseve.
Ovo se koristilo u ratovima kao izmenjena
svetlosna verzija (dugi puls bi bio duži
svetlosni zrak dok je kraći kratak) .
Tabela morzeovog koda Odašiljač pulseva
Brajev kod
Ovo je kod koji se koristi kod slepih ljudi i
značajan je za razvoj i snalaženje.
Ovaj kod je pretstavljen preko 6 tačkica
kod kojih svaki raspored tačaka ima
određene vrednosti.
Napravio ga je Luis Brajev koji je i sam
oslepeo usled nesreće, kada je imao 15
godina.
Tabela vrednosti brajevog koda Knjiga napisana brajevim kodom
ASCII
Napravljen je iz jednog 7-bitnog teleprintera
koji je napravila Bell data service.
Danas je je u najširoj upotrebi.
Koristi se za pretstavljanje teksta u
kompjuteru.
Ima 33 kontrolna karaktera i 95 koji se
ispisuju.
YUSCII je nastao u Jugoslavjiji jer prvobitni
ASCII nije sadržao karaktere za srpska slova.
ASCII tabela
EBCDIC
On je nastao iz prvih bušenih kartica.
Ovo je 8-bitni kod.
Za ovaj kod ima dosta šala zato što je
napravljen po zahtevu vlade Amerike
Jedna od njih ide ovako:
Professor: "So the American government went
to IBM to come up with an encryption
standard, and they came up with—"
Student: "EBCDIC!"
Primer bušene kartice preko EBCDIC-a
Tabela vrednosti
Grejev kod
Reflektovani binarni kod, takođe poznak kaoGrejev kod, je sistem binarnih cifara u kojemse dve uzastopne vrednosti razlikuju u samojednom bitu.
Reflektovani binarni kod je prvobitnoprojektovan da spreči lažni izlaz izelektromehaničkih prekidača.
Danas se Grejev kod koristi za ispravljanjegrešaka u digitalnim komunikacijama, kao štosu digitalne zemaljske televizije i nekikablovski sistemi.
Tabela vrednostiSlika prikazuje IKM cev sa reflektujućim
binarnim kodovima na tanjiru
Hufmanovo kodiranje
Ovaj kod je znanimljiv jer ima specifičanmetod za reprezentaciju simbola, koja nakraju završava u prefiksiranom kodu.
To znači da se na predstavu broja koristibinarna vrednost plus neki prefiks.
Još jedna interesantna stvar kod ovogkodiranja jeste da se fajl u memorijipredstavlja kao graf.
Primer Francusk verzije pretstave:
https://upload.wikimedia.org/wikipedia/commons/a/ac/Huffman_huff_demo.gif
NADAM SE DA STE UŽIVALI ČITAJUĆI!!
Словима једног великог светског писма названог Jуникод (Unicode)одавно може да барата
рачунар, али је на Интернету остало још неколико ситница.
Одавно је могуће да се на рачунару креира садржај исписан другим писмима осим ASCII сета
карактера (неки је зову енглеска, а неки ћелава латиница). Стандардизован је један велики скуп
свих светских писама назван UNICODE (чита се јуникод), који се користи у ту сврху. Садржај сајта
одавно је могуће исписати на Јуникоду, а тастатуре се одавно у многим земљама могу срести
на важећем писму за ту земљу, оперативни системи су одавно локализовани и једина
„ситничица” која је остала на „ћелавој латиници” јесте управо „адреса” сајта (домен).
ICANN је базирао будућност Интернета на томе ће свака земља моћи да има домен на свом
писму. IDN ccTLD Fast Track је привремени и „покусни” пројекат ICCANA-а, врховног
регулаторског тела за интернет домене, којим је пробао да изађе у сусрет земљама које немају
латиницу као своје основно писмо и да се самим тим прошири коришћење Интернета. Циљ је
да се имплементира једна врста преводиоца Уницоде у ASCII који је за корисника невидљив.
Корисник у броузеру куца адресу користећи Уницоде (односно на ћирилици, на пример), а тај
захтев се уз помоћ преводиоца претвара у ASCII са реалном адресом (облика –хн хххх) и шаље
„позив” сајту. То превођење из Уницода у АСЦИИ „замаскирао” је и извршио сам броузер
корисника.
Адреса конвертера јуникода:
https://www.branah.com/unicode-converter
YUSCII или YUASCII је Југословенски АСКИ код.
_
0
_1 _2 _3 _4 _5 _6 _7 _8 _9 _A _B _C _D _E _F
0
_
NUL 000
0
0
SOH 000
1
1
STX 000
2
2
ETX 000
3
3
EOT 000
4
4
ENQ 000
5
5
ACK 000
6
6
BEL 000
7
7
BS 000
8
8
HT 000
9
9
LF 000
A
10
VT 000
B
11
FF 000C
12
CR 000D
13
SO 000
E
14
SI 000
F
15
1
_
DLE 001
0
16
DC1 001
1
17
DC2 001
2
18
DC3 001
3
19
DC4 001
4
20
NAK 001
5
21
SYN 001
6
22
ETB 001
7
23
CAN 001
8
24
EM 001
9
25
SUB 001
A
26
ESC 001
B
27
FS 001C
28
GS 001D
29
RS 001
E
30
US 001
F
31
2
_
SP 002
0
32
!002
1
33
"002
2
34
#002
3
35
$002
4
36
%002
5
37
&002
6
38
'002
7
39
(002
8
40
)002
9
41
*002
A
42
+002
B
43
,002C
44
-002D
45
.002
E
46
/002
F
47
3
_
0003
0
48
1003
1
49
2003
2
50
3003
3
51
4003
4
52
5003
5
53
6003
6
54
7003
7
55
8003
8
56
9003
9
57
:003
A
58
;003
B
59
<003C
60
=003D
61
>003
E
62
?003
F
63
4
_
Ž
/
Ж017
D/0
416
64
A
/
А004
1/0
410
65
B
/
Б004
2/0
411
66
C
/
Ц004
3/0
426
67
D
/
Д004
4/0
414
68
E
/
Е004
5/0
415
69
F
/
Ф004
6/0
424
70
G
/
Г004
7/0
413
71
H
/
Х004
8/0
425
72
I
/
И004
9/0
418
73
J
/
Ј004
A/0
408
74
K
/
К004
B/0
41A
75
L/
Л004C
/041
B
76
M/
М004D
/041
C
77
N
/
Н004
E/0
41D
78
O
/
О004
F/0
41E
79
5
_
P
/
П005
0/0
41F
80
Q
/
Љ005
1/0
409
81
R
/
Р005
2/0
420
82
S
/
С005
3/0
421
83
T
/
Т005
4/0
422
84
U
/
У005
5/0
423
85
V
/
В005
6/0
412
86
W
/
Њ005
7/0
40A
87
X
/
Џ005
8/0
40F
88
Y
/
Ѕ005
9/0
405
89
Z
/
З005
A/0
417
90
Š
/
Ш016
0/0
428
91
Đ/
Ђ/
Ѓ0110
/040
2
92
Ć/
Ћ/
Ќ0106
/040
B
93
Č
/
Ч010
C/0
427
94
_005
F
95
6
_
ž
/
ж017
E/0
436
96
a
/
а006
1/0
430
97
b
/
б006
2/0
431
98
c
/
ц006
3/0
446
99
d
/
д006
4/0
434
100
e
/
е006
5/0
435
101
f
/
ф006
6/0
444
102
g
/
г006
7/0
433
103
h
/
х006
8/0
445
104
i
/
и006
9/0
438
105
j
/
ј006
A/0
458
106
k
/
к006
B/0
43A
107
l/
л006C
/043
B
108
m/
м006D
/043
C
109
n
/
н006
E/0
43D
110
o
/
о006
F/0
43E
111
7
_
p
/
q
/
r
/
s
/
t
/
u
/
v
/
w
/
x
/
y
/
z
/
š
/
đ/
ђ/
ć/
ћ/
č
/
DEL 007
F
127
п007
0/0
43F
112
љ007
1/0
459
113
р007
2/0
440
114
с007
3/0
441
115
т007
4/0
442
116
у007
5/0
443
117
в007
6/0
432
118
њ007
7/0
45A
119
џ007
8/0
45F
120
ѕ007
9/0
455
121
з007
A/0
437
122
ш016
1/0
448
123
ѓ0111
/045
2
124
ќ0107
/045
B
125
ч010
D/0
447
126
\\\|||///
=======
| O O |
\`___'/
_| |_
( )
//|* *|\\
\( * )/
=====
( U )
|| ||
---'| |`----
----' `-----
Аски уметност је уметнички медиј који се пре свега појављује на рачунарима за презентацију и
састављен је од слика које чини 95 видљивих карактера дефинисаних АСКИ кодним системом.
Термин се ређе користи и много неодређеније за уметност засновану на тексту.
Јуникод конзорцијум је међународно тело које се бави стандардима за комуникацију на
дигиталним платформама, а надлежно је и за стандардизацију сличица којима нове генерације
воле да комуницирају и изражавају своје емоције.
Ускоро ће бити објављен Јуникод 9.0 у којем ће бити укључено 70-ак нових емотикона.
● Yuscii код је био југословенски бинарни код. Предности су му биле што јепоседовао ћирилична слова и што је био наш, али му је озбиљна мана билашто су неки знакови као што су { , [ недостајали те није био прилагођен запрограмере.
● Наука о кодирању порука назива се криптографија. Криптографија је значајнапошто се поруке (као и све што је битно а може се прислушкивати) шифрујукако би се учиниле неразумљивим за неовлашћено лица, па се у испоруцидругој особи дешифрују.
● Најстарији кодови у историји су (према сајтовима informatika.buzdo.com иopusteno.rs ) су римска алтернативна абецеда у којој се свако слово абецедешифровало словом које је три места после у абецеди, а самим тим седешифровао словом које је три места пре у абецеди. Постојао је и спартанскикод који је служио за комуницирање заповедника војске. Поруку су записивалина комаду коже и обмотавали око спиралне палице. Када би је размоталипорука би била нејасна и могла се прочитати само намотавањем на палицуистих димензија и истог облика.
● Постоје алгоритми за симетрично кодирање и они који кодирају на један начин адекодирају на потпуно другачији начин.
● Мана алгоритама за симетрично кодирање је да се могу декодирати грубомсилом, тј. испробавањем свих могућности.
● DES је био званични стандард за енкрипцију у САД-у 1993. али је дешифрованвећ 4 месеца касније пошто је био симетричан.
● RSA код се заснива на одабиру два велика проста броја и шифровања помоћуњих. Код за дешифровање је неупоредиво сложенији од кода за шифровање, апошто за проналазак о којим бројевима се ради не постоји ништа брже одЕратостеновог сита то би процес дешифровања трајао милијардама година.Једини проблем је проналазак великих простих бројева, али постоје алгоритми,попут оних који користе тврђење да ако број испуњава услов Мале Фермаоветеореме, да су му шансе да није прост равне 1:1000000.