View
112
Download
0
Category
Preview:
Citation preview
Insegnamento di Informatica – a.a. 2016-17
La rappresentazione delle informazioni
INSEGNAMENTO DI INFORMATICA – A.A. 2016-17
Francesco Ciclosi
Macerata, AA. 2016-2017
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
La comunicazione tra uomo e macchina
Affinché gli esseri umani possano interagire con
gli elaboratori è necessario operare una traduzione
tra i differenti linguaggi utilizzati da entrambi
Gli elaboratori utilizzano un codice semplice e
disambiguo (il linguaggio binario)
Gli esseri umani utilizzano un codice complesso e
ambiguo
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
Avviene una conversione delle informazioni
scambiate con l’elaboratore
In tale processo si utilizzano le tabelle dei codici
La comunicazione uomo-macchina
può avvenire con successo se e solo se
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
La rappresentazione delle informazioni
Le informazioni possono essere codificate come
pattern di bit
Esistono metodologie differenti per codificare:
• Testo
• Numeri
• Immagini
• Suono
Insegnamento di Informatica – a.a. 2016-17
Rappresentazione del testo
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
Il carattere
È un’unità minima di informazione
Corrisponde a un grafema, o a un simbolo, della
forma scritta di una lingua naturale
Esempi di carattere sono:
• lettere
• numeri
• segni di interpunzione
• caratteri di controllo (es: carriage return, line feed)
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
Rappresentazione del testo
Le informazioni testuali sono rappresentate
tramite un codice che assegna a ogni carattere un
pattern univoco di bit
Esistono vari codici di questo tipo e non tutti i
dispositivi li sanno interpretare
Per risolvere i problemi di standardizzazione
l’ANSI ha adottato il codice ASCII
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
ASCII
ASCII (American Standard Code for Information
Interchange) è un codice per la codifica dei caratteri
Lo standard è stato pubblicato da ANSI nel 1968
Il sistema originario US-ASCII codificava i caratteri
a 7 bit e è ora standard ISO (ISO/IEC 646)
Nei PC si usa la versione extended ASCII che
utilizza 8 bit per la codifica
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
La codifica US-ASCII
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
ASCII esteso Utilizza l’ottavo bit di ogni byte per rappresentare
altri 128 caratteri aggiuntivi
Ciò ha prodotto notevoli problemi di compatibilità
dovuti anche all’utilizzo di estensioni proprietarie
ISO ha rilasciato uno standard (ISO 8859)
contenente un’estensione a 8 bit del set ASCII
• ISO 8859-1 (Latin1): caratteri lingue Europa Occidentale
• ISO 8859-2: caratteri linguaggi Europa Orientale
• ISO 8859-5: caratteri cirillici
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
La codifica Latin1
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
Un esempio di codifica ASCII
B U O N
0100 0010 0101 0101 0100 1111 0100 1110
G I O R N O
0100 0111 0100 1001 0100 1111 0101 0010 0100 1110 0100 1111
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
Criticità di ASCII
Anche nella versione estesa è troppo ridotto per
ospitare gli alfabeti di alcune lingue
• Come a esempio quelle asiatiche
Poiché un documento può utilizzare un solo
standard, nello stesso documento non sono
supportate lingue appartenenti a gruppi
linguistici differenti
Per ovviare a tali criticità nasce UNICODE
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
Lo standard Unicode
Assegna un numero univoco ad ogni carattere usato
per la scrittura di testi, in maniera indipendente
• dalla lingua
• dalla piattaforma informatica
• dal programma utilizzato
È compilato e aggiornato dall’Unicode Consortium che
opera per garantire l’interoperabilità nel trattamento
informatico di testi in lingue diverse
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
Unicode + UTF-8
Se il set di caratteri Unicode è combinato con lo
standard Unicode Transformation Format 8-bit
(UTF-8):
• I caratteri ASCII originali sono rappresentati con 8 bit
• I caratteri di altre lingue (come cinese, giapponese e
ebraico) sono rappresentati con 16 bit
• Sono disponibili pattern a 24 e 32 bit per rappresentare
altri simboli insoliti e per future espansioni
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
Differenza tra file di testo Un file di testo è un file composto da una lunga
sequenza di simboli codificati in ASCII o Unicode
Esistono file di testo semplici
• Manipolati da editor di testo (come Blocco Note)
• Che contengono solo una codifica carattere per carattere
Esistono file di testo più elaborati
• Manipolati dai word processor (come Microsoft Word)
• Contengono oltre alla codifica carattere per carattere,
molti codici proprietari rappresentanti la formattazione
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
Esempio di differenze tra file di testo
Insegnamento di Informatica – a.a. 2016-17
Rappresentazione dei valori numerici
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
Alcune problematiche di rappresentazione
Se i dati da registrare sono solo numerici,
rappresentarli come caratteri non è efficiente
• Utilizzando un byte per simbolo, la rappresentazione di
un numero in ASCII richiede sempre un byte
In tal caso utilizzeremo la notazione binaria
• ASCII: 1 byte 10 numeri | 2 byte 100 numeri
• Binario: 1 byte 256 numeri | 2 byte 65536 numeri
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
La notazione binaria
Nella notazione binaria i numeri sono
rappresentati utilizzando solo le cifre: 0, 1
Nella notazione decimale i numeri sono
rappresentati utilizzando le cifre: 0, 1, 2, 3, 4, 5,
6, 7, 8, 9
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
1
0
1
0
1
0
0
1
1
0
1
0
0
1
1
0
1
0
1
1
1
1
0
0
0 1 0
1
1
1 10
9
8
7
6
5
4
3
2
1
0
Nu
meri
decim
ali
Nu
meri
bin
ari
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
Tecniche di memorizzazione numerica
I numeri interi sono memorizzati utilizzando il
sistema della notazione in complemento a due
• Consente di rappresentare sia i numeri negativi che
quelli positivi
I numeri che presentano una parte frazionaria
sono memorizzati utilizzando la notazione in
virgola mobile
Insegnamento di Informatica – a.a. 2016-17
La rappresentazione delle immagini
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
L’immagine come insieme di puntini
L’immagine può essere descritta come una
collezione di punti
Ogni punto è detto pixel (picture element)
Una collezione di pixel codificati viene
denominata bitmap (mappa di bit)
Stampanti e monitor operano con il concetto di
pixel
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
La codifica di un pixel
Per rappresentare un pixel serve un numero di
bit variabile con la quantità di informazione
presente
• Immagine in b/n (fax) 1 bit
• Immagine a toni di grigio (255) 1 byte
• Immagine a colori in true color (circa 16 milioni di
colori) 3 byte
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
La codifica di un’immagine a colori
Ci sono due differenti approcci per codificare ciascun
pixel:
• RGB
o Ogni pixel è rappresentato come combinazione di 3 colori
(rosso, verde, blu)
o Per rappresentare ogni colore si utilizza un byte
• Luminosità + colore
o La luminosità (o luminanza) è la quantità di luce bianca nel pixel
o La crominanza blu/rossa è, rispettivamente, la differenza tra la
luminanza e la quantità di luce blu/rossa
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
Problematiche delle bitmap
L’immagine non è
ingrandibile se non
aumentando la
dimensione dei singoli
pixel che la
compongono
Il risultato ottenuto è
un’immagine sgranata
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
La rappresentazione vettoriale
Consiste nel descrivere l’immagine come
insieme di strutture geometriche codificabili
utilizzando tecniche di geometria analitica
Il dispositivo che visualizzerà l’immagine potrà
scegliere come rappresentare le strutture
geometriche
• Non sarà quindi richiesta la riproduzione di un
pattern di pixel particolare
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
I font bitmap Sono un particolare tipo di font che prevede la
memorizzazione dei caratteri come matrice di punti
Utilizzano le mappe di bit
Occupano una grossa porzione di memoria
Sono usati nelle stampanti
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
I font scalabili Sono memorizzati come
una serie di formule che
descrivono la struttura dei
caratteri
Sono ridimensionabili
Occupano poco spazio in
memoria
In sede di stampa sono
convertiti in mappa di bit
(rasterizzazione)
Insegnamento di Informatica – a.a. 2016-17
La rappresentazione dei suoni
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
Segnale analogico
È molto sensibile alle
interferenze
Può assumere infiniti
stati
Presenta di fatto una
minore risoluzione
∞ stati possibili
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
Segnale digitale
Poco sensibile alle interferenze
Può assumere due soli stati: 0 e 1
Presenta una maggiore risoluzione
2 soli stati
possibili
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
Digitale vs analogico: interferenze I segnali digitali sono più resistenti alle
interferenze di quelli analogici
• È più semplice riconoscere tra due soli stati anche in
base al «principio di prossimità»
Segnale digitale «pulito»
Segnale analogico «pulito»
Segnale digitale con interferenze
Segnale analogico con interferenze
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
Segnale continuo
È una grandezza fisica variabile nel tempo in
modo continuo
Non è funzione di una variabile discreta
Il valore della grandezza può essere misurato in
qualsiasi istante
Può essere studiato sia nel dominio del tempo
che in quello della frequenza
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
Segnale discreto: definizione
È una successione di valori di una grandezza in
corrispondenza di una serie di valori discreti nel
tempo
È una funzione con valori forniti in
corrispondenza a una serie di tempi scelti nel
dominio dei numeri interi
Ciascun valore della successione è chiamato
campionamento
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
Segnale discreto: campionamento
Non è in funzione di una variabile continua
ma è ottenuto campionando un valore continuo
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
«Risoluzione» di un segnale
A parità di durata, la quantità di informazione
trasportata da un segnale continuo è maggiore
rispetto a quella trasportata da un segnale discreto
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
Segnale digitale
Un segnale digitale è un segnale discreto che può
assumere soltanto valori appartenenti ad un
insieme discreto
È ottenuto campionando un segnale analogico
(continuo)
Ha una determinata frequenza di campionamento
• Durata dell’intervallo temporale uniforme in
corrispondenza del quale si misurano i valori della
serie
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
La codifica classica delle informazioni audio
Per codificare delle informazioni audio si
procede:
1. campionamento dell’ampiezza dell’onda sonora a
intervalli regolari
2. Registrazione delle serie di valori numerici ottenuti
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
Alcuni esempi
Conversazione telefonica
• 8000 campioni al secondo
• Si effettua una codifica ogni otto millesimi di secondo
CD audio
• 44100 campioni al secondo
• I dati sono ottenuti sono rappresentati con 16 o 32 bit
(stereo)
• Ogni secondo di musica richiede più di un milione di bit
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
MIDI: un’altra forma di codifica audio
Il MIDI (Musical Instrument Digital Interface) è un
sistema di codifica più economico
Non prevede la codifica del suono
Prevede la codifica delle istruzioni necessarie per
produrre la musica su di un sintetizzatore
La qualità dell’esecuzione del brano dipende dal
sintetizzatore utilizzato per la riproduzione
Il numero di bit necessario per la codifica è ridotto
Unimc - Dipartimento di Economia e Diritto - Corso di Laurea in Economia: banche, aziende e mercati
© Francesco Ciclosi – Settembre 2016 CC-BY-SA 4.0 – Common Deed – Legal Code
Insegnamento di Informatica – a.a. 2016-17
I miei contatti
http://it.linkedin.com/pub/francesco-ciclosi/62/680/a06/
https://www.facebook.com/francesco.ciclosi
@francyciclosi
www
http://docenti.unimc.it/f.ciclosi
http://www.francescociclosi.it
Recommended