28
ΗΜΥ 007 – Τεχνολογία Πληροφορίας Διάλεξη 8 Ηχητική Πληροφορία TΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ

ΗΜΥ 007 – Τεχνολογία Πληροφορίας Διάλεξη 8

  • Upload
    gracie

  • View
    65

  • Download
    3

Embed Size (px)

DESCRIPTION

ΗΜΥ 007 – Τεχνολογία Πληροφορίας Διάλεξη 8. Ηχητική Πληροφορία. T ΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝ ΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ. Περίληψη. Θέματα για σήμερα Δημιουργία ηχητικού σήματος Χαρακτηριστικά ηχητικού σήματος Συχνότητα, πλάτος , φάσμα, εύρος ζώνης - PowerPoint PPT Presentation

Citation preview

Page 1: ΗΜΥ  007  –  Τεχνολογία Πληροφορίας Διάλεξη  8

ΗΜΥ 007 – Τεχνολογία Πληροφορίας

Διάλεξη 8

Ηχητική Πληροφορία

TΜΗΜΑ ΗΛΕΚΤΡΟΛΟΓΩΝ ΜΗΧΑΝΙΚΩΝ ΚΑΙ ΜΗΧΑΝΙΚΩΝ ΥΠΟΛΟΓΙΣΤΩΝΠΟΛΥΤΕΧΝΙΚΗ ΣΧΟΛΗ

ΠΑΝΕΠΙΣΤΗΜΙΟ ΚΥΠΡΟΥ

Page 2: ΗΜΥ  007  –  Τεχνολογία Πληροφορίας Διάλεξη  8

Περίληψη

Θέματα για σήμερα• Δημιουργία ηχητικού σήματος• Χαρακτηριστικά ηχητικού σήματος

• Συχνότητα, πλάτος, φάσμα, εύρος ζώνης• Μετατροπή ηχητικού σήματος αναλογικό /

ψηφιακό • Δειγματοληψία• Κβαντισμός

• Μετατροπή ψηφιακό / αναλογικό • Demo

Page 3: ΗΜΥ  007  –  Τεχνολογία Πληροφορίας Διάλεξη  8

Υλικό Αναφοράς

• Cyganski, D., Orr, A. O., and Vaz, R. F., Information Technology Inside and Outside, Prentice Hall, 2001,

• Κεφ. 10, σελίδες 150-163• Κεφ. 11, σελίδες 164-165• Κεφ. 12, σελίδες 172-179• Demos στο CD

• Ήχος• http://www.clab.edc.uoc.gr/physics/sound/sound_1.htm

• Ήχος και ηχητικά πρότυπα• http://danaos.cslab.ntua.gr/~ekall/Science/personal_docs/

ixos.htm• Τα μικρόφωνα και εμείς

• http://www.zainea.com/micro.htm• Σύλληψη του ήχου και ψηφιοποίηση του αναλογικού

σήματος• http://www.geocities.com/ResearchTriangle/Campus/8308/

Audio.html

Page 4: ΗΜΥ  007  –  Τεχνολογία Πληροφορίας Διάλεξη  8

Δημιουργία ηχητικού σήματος

• Ο ήχος που ακούμε δημιουργείτε από την κίνηση (συμπίεση και αποσυμπίεση) των μορίων του αέρα ως αποτέλεσμα μιας μηχανικής δύναμης

• Π.χ. ακούμε θόρυβο όταν ένα βιβλίο πέσει στο πάτωμα

• Η λειτουργία των αυτιών μάς επιτρέπει να αντιληφθούμε την μεταβολή στην πίεση του αέρα

• Αυτή η διαφορά στην πίεση του αέρα μπορεί να μετρηθεί με το μικρόφωνο

• Μετατροπή της κίνησης του αέρα σε ηλεκτρικό σήμα (τάση ή ρεύμα)

• Το ηχητικό σήμα είναι το ηλεκτρικό σήμα που παράγει το μικρόφωνο και αναπαριστά την αλλαγή της πίεσης του αέρα σαν συνάρτηση του χρόνου

Ο μηχανισμός διάδοσης του ηχητικού κύματος σε ένα μέσοείναι σαν ένα ελατήριο

Page 5: ΗΜΥ  007  –  Τεχνολογία Πληροφορίας Διάλεξη  8

Παράδειγμα ηχητικού σήματος

Χρόνος τ [ms]

ν(τ) [V]

Page 6: ΗΜΥ  007  –  Τεχνολογία Πληροφορίας Διάλεξη  8

Γνήσιος Τόνος (pure tone) – Απλός Ήχος

• Το χρονικό διάστημα μεταξύ δύο κορυφών του σήματος είναι κάθε

2.27 ms = (1 / 440) s• => αυτό το σήμα

επαναλαμβάνεται 440 φορές ανά δευτερόλεπτο

• Λέμε ότι έχει συχνότητα 440 HZ • Hz = cycles / s

κορυφή

τ [s]

κορυφή

Σημείωση: s – second ms – millisecond

Page 7: ΗΜΥ  007  –  Τεχνολογία Πληροφορίας Διάλεξη  8

Φυσικά Χαρακτηριστικά του Ήχου

• Συχνότητα (frequency – f ): - Καθορίζει πόσες ταλαντώσεις εκτελούνται σε μια μονάδα

του χρόνου• Όσο μεγαλύτερη η συχνότητα τόσο πιο οξύς ο ήχος • Το ανθρώπινο αυτί αντιλαμβάνεται τις συχνότητες στο

διάστημα: 20Hz – 20kHz • Οι ήχοι υψηλότερων συχνοτήτων δεν γίνονται αντιληπτοί και

ονομάζονται υπέρηχοι • Πολύ μεγαλύτερη ευαισθησία σε σύγκριση με το μάτι

• Πλάτος (ένταση): - Όσο μεγαλύτερο το πλάτος τόσο μεγαλύτερη η δύναμη με την οποία τα μόρια του αέρα χτυπούν στο τύμπανο του αυτιού • Μεγαλύτερο πλάτος σημαίνει δυνατότερος ήχος

Page 8: ΗΜΥ  007  –  Τεχνολογία Πληροφορίας Διάλεξη  8

Απλοί και σύνθετοι ήχοι

Γνήσιοι τόνοι (Απλοί Ήχοι)

f= 220 HZ

f= 440 HZ f= 440 HZ

f= 440 HZ

Σύνθετοι Ήχοι

Πλά

τος

Πλά

τος

/ δύν

αμη

ήχου

Page 9: ΗΜΥ  007  –  Τεχνολογία Πληροφορίας Διάλεξη  8

Απλοί και σύνθετοι ήχοι

• Ένα διαπασών ταλαντώνεται σε μια συγκεκριμένη συχνότητα, όμως οι περισσότερες πηγές ήχου ταλαντώνονται με πιο πολύπλοκο τρόπο.

• Η νότα που παράγεται από τη χορδή ενός βιολιού προκαλεί διαφορετικές ταλαντώσεις σε συχνότητες που είναι ακέραια πολλαπλάσια της χαρακτηριστικής συχνότητας της συγκεκριμένης νότας.

• Το συγκεκριμένο μίγμα των διαφορετικών συχνοτήτων καθορίζουν την χροιά (timbre) ενός σύνθετου ήχου. Το βιολί και το φλάουτο μπορεί να παίζουν την ίδια νότα, αλλά η χροιά τους είναι διαφορετική.

Διαπασών

ΚονγκΒιολί

Φλάουτο

Page 10: ΗΜΥ  007  –  Τεχνολογία Πληροφορίας Διάλεξη  8

Φάσμα συχνοτήτων (Spectrum)

• Όλα τα σήματα μπορούν να δημιουργηθούν προσθέτοντας γνήσιους τόνους (απλούς ήχους)

• => ένα ηχητικό σήμα είναι το άθροισμα (σύνθεση) συγκεκριμένων γνήσιων τόνων• Ο κάθε γνήσιος τόνος έχει μία συχνότητα

• => ένα ηχητικό σήμα έχει ένα φάσμα συχνοτήτων• Η διαφορά μεταξύ της μεγαλύτερης συχνότητας και της

μικρότερης συχνότητας λέγεται το εύρος ζώνης (bandwidth) του σήματος

Page 11: ΗΜΥ  007  –  Τεχνολογία Πληροφορίας Διάλεξη  8

Φάσμα γνήσιου τόνου

Χρόνος [s]

Χαρακτηριστική συχνότητα γνήσιου τόνου (μία συχνότητα)

Πλά

τος

Συχνότητα [Hz]

Page 12: ΗΜΥ  007  –  Τεχνολογία Πληροφορίας Διάλεξη  8

Φάσμα μουσικής νότας

Χρόνος [s]

Συχνότητες που είναι ακέραια πολλαπλάσια της χαρακτηριστικής συχνότητας της συγκεκριμένης νότας (καθορίζουν την χροιά του ήχου).

Χαρακτηριστική συχνότητα

Πλά

τος

Συχνότητα [Hz]

Page 13: ΗΜΥ  007  –  Τεχνολογία Πληροφορίας Διάλεξη  8

Φάσμα σήματος φωνής

Μέγιστη συχνότητα

Μέγιστη συχνότητα

Εύρος ζώνης (bandwidth)

Χρόνος [s] Συχνότητα [Hz]

Page 14: ΗΜΥ  007  –  Τεχνολογία Πληροφορίας Διάλεξη  8

Μετατροπή Ηχητικού Σήματος

• Ένα αναλογικό σήμα μπορεί να μετατραπεί σε ένα ψηφιακό σήμα

Αναλογικό/ψηφιακός μετατροπέας (A/D converter)

][nv)(tv

Δειγματολήπτης ][nv)(tv Κβαντιστής

(στρογγυλοποίηση)

Page 15: ΗΜΥ  007  –  Τεχνολογία Πληροφορίας Διάλεξη  8

Επεξεργασία Ηχητικών Σημάτων

• Παράδειγμα:• Μετατροπή μουσικού σήματος σε ψηφιακό σήμα• Αποθήκευση του ψηφιακού σήματος σε οπτικό

δίσκο (CD) • Αναπαραγωγή αναλογικού μουσικού σήματος

• Σε ένα σύστημα έχουμε συνδυασμό αναλογικών και ψηφιακών σημάτων καθώς και συνδυασμό αναλογικής και ψηφιακής συμπεριφοράς.

][nv)(tvA/D D/A

)(~ tv][~ nvΣύστημαΨηφιακήςΕπεξεργασίας

Page 16: ΗΜΥ  007  –  Τεχνολογία Πληροφορίας Διάλεξη  8

Δειγματοληψία (Sampling)

Αναλογικό σήμα Σήμα διακριτού χρόνου

Page 17: ΗΜΥ  007  –  Τεχνολογία Πληροφορίας Διάλεξη  8

Δειγματοληψία (Sampling)

• Το σήμα διακριτού χρόνου αποτελείται από δείγματα (samples) του αναλογικού σήματος που παίρνονται σε τακτά χρονικά διαστήματα nT, όπου n είναι ένας ακέραιος αριθμός, και

• Τ είναι η περίοδος δειγματοληψίας (sampling period)• fs= 1 / T είναι η συχνότητα ή ρυθμός δειγματοληψίας

(sampling rate).

Page 18: ΗΜΥ  007  –  Τεχνολογία Πληροφορίας Διάλεξη  8

Δειγματοληψία

• Δεδομένο: Όποτε γίνεται δειγματοληψία από ένα αναλογικό σήμα αναπόφευκτα χάνονται ορισμένες πληροφορίες του σήματος.

• Ερώτηση: Πόσο γρήγορα πρέπει να παίρνουμε δείγματα από ένα αναλογικό σήμα; Δηλαδή, πόσα δείγματα σε κάποιο χρονικό διάστημα;

• Απάντηση: Η δειγματοληψία πρέπει γίνεται με τέτοιο ρυθμό έτσι ώστε το σήμα να αναγνωρίζεται από τα δείγματα. Τότε, η ποσότητα πληροφοριών του σήματος που χάνεται είναι η μικρότερη.

Page 19: ΗΜΥ  007  –  Τεχνολογία Πληροφορίας Διάλεξη  8

Αναγνώριση Σήματος από Δείγματα

Τριγωνικό σήμα

Page 20: ΗΜΥ  007  –  Τεχνολογία Πληροφορίας Διάλεξη  8

Ρυθμός Δειγματοληψίας

• Εξαρτάται από το σήμα • Σύγκρινε το ημιτονικό και το τριγωνικό σήμα στο

προηγούμενο σχήμα• Ψηλότερος ρυθμός είναι απαραίτητος για ένα σήμα που

αλλάζει ραγδαία • Εξαρτάται και από την εφαρμογή

• Στην τηλεφωνία ο ρυθμός δειγματοληψίας είναι fs= 8 ΚHz δηλαδή 8000 δείγματα ανά δευτερόλεπτο

• Για CD (compact disc) μουσικής χρησιμοποιείται fs= 44.1 ΚHz • δηλαδή 44100 δείγματα ανά δευτερόλεπτο για ακριβή αναπαραγωγή

της μουσικής• => παίρνουμε την τιμή του σήματος μία φορά κάθε 1/(44100)

= 23 ms (milliseconds)

Page 21: ΗΜΥ  007  –  Τεχνολογία Πληροφορίας Διάλεξη  8

Ρυθμός Δειγματοληψίας

• Η ρυθμός δειγματοληψίας δεν είναι τυχαίος • Το θεώρημα της δειγματοληψίας του Nyquist/Shannon

ορίζει πως για να μην υπάρχει αλλοίωση στο περιεχόμενο ενός σήματος, πρέπει η συχνότητα με την οποία θα γίνει η δειγματοληψία να είναι τουλάχιστον διπλάσια από την μέγιστη συχνότητα η οποία μπορεί να περιέχεται στο σήμα. (Διαφορετικά έχουμε αναδίπλωση φάσματος – aliasing.)

• Το σήμα φωνής έχει μέγιστη συχνότητα περίπου 4 KHz => χρειαζόμαστε τουλάχιστον fs= 8 ΚHz

• Ένα ηχητικό σήμα ψηλής ποιότητας μπορεί να περιέχει συχνότητα μέχρι τα 20ΚHz περίπου => χρειαζόμαστε τουλάχιστον fs= 40 ΚHz . (Για το CD μουσικής χρησιμοποιείται fs= 44.1 KHz.)

Page 22: ΗΜΥ  007  –  Τεχνολογία Πληροφορίας Διάλεξη  8

Κβαντισμός (Quantization)

• Οι τιμές ενός σήματος διακριτού χρόνου είναι αναλογικές (δηλαδή συνεχείς). Μετατρέπονται σε ψηφιακές με κβαντισμό (στρογγυλοποίηση) .

• Με τον κβαντισμό περιορίζουμε το πεδίο τιμών σε ένα σύνολο πεπερασμένου αριθμού Μ τιμών. Η ευκρίνεια του σήματος εξαρτάται / καθορίζεται από τον αριθμό Μ. (Όσο πιο μεγάλος τόσο λιγότερη η αλλοίωση («θόρυβος) λόγω κβαντισμού / στρογγυλοποίησης.)

• Αυτές οι τιμές μπορούν να αναπαρίστανται με δυαδικούς αριθμούς (που αποτελούνται από 0 και 1) τους οποίους επεξεργάζεται ένας υπολογιστής.

Page 23: ΗΜΥ  007  –  Τεχνολογία Πληροφορίας Διάλεξη  8

Παράδειγμα: Μ = 9

Ψηφιακό σήμαΣήμα διακριτού χρόνου

Page 24: ΗΜΥ  007  –  Τεχνολογία Πληροφορίας Διάλεξη  8

Δυαδική Αναπαράσταση Ήχου

Δειγματοληψία Κβαντισμός (στρογγυλοποίηση)

Κωδικοποίηση

)(tv ][nv

Page 25: ΗΜΥ  007  –  Τεχνολογία Πληροφορίας Διάλεξη  8

Αναπαραγωγή Ήχου με Ψηφιακό/Αναλογικό Μετατροπέα (D/A

Converter)

Zero-order hold

Ψηφιακό σήμα

][nv )(tv

Filter

Ομαλό αναλογικό σήμαΣκαλωτό αναλογικό σήμα

Page 26: ΗΜΥ  007  –  Τεχνολογία Πληροφορίας Διάλεξη  8

Διαχωρισμός Σημάτων

• Αναλογικό σήμα (analog signal): συνεχής συνάρτηση στην οποία η ανεξάρτητη μεταβλητή και η εξαρτώμενη μεταβλητή παίρνουν συνεχές τιμές.

• Σήμα διακριτού χρόνου (discrete-time signal): συνάρτηση στην οποία η ανεξάρτητη μεταβλητή παίρνει διακριτές τιμές και η εξαρτώμενη μεταβλητή παίρνει συνεχές τιμές. (Δημιουργείται μετά από δειγματοληψία.)

• Ψηφιακό σήμα (digital signal): συνάρτηση στην οποία η ανεξάρτητη μεταβλητή και η εξαρτημένη μεταβλητή παίρνουν διακριτές τιμές. (Δημιουργείται μετά από κβαντισμό.)

• Δυαδικό σήμα (binary signal): στοιχειοσειρά που αποτελείται από τα δυαδικά ψηφία 0 και 1. (Δημιουργείται μετά από κωδικοποίηση.)

Page 27: ΗΜΥ  007  –  Τεχνολογία Πληροφορίας Διάλεξη  8

Παράδειγμα

• Σήμα αποθηκευμένο σε μουσικό οπτικό δίσκο CD• Για την αποθήκευση του σήματος

χρησιμοποιούνται λέξεις των 16 bits• δηλαδή η τιμή του σήματος μπορεί να πάρει μια ένδειξη

ανάμεσα σε 216=65.536 τιμές• Δειγματοληψία με fs= 44.1 ΚHz

• δηλαδή 44.100 δείγματα ανά δευτερόλεπτό για ακριβή αναπαραγωγή της μουσικής

• 44.100 δείγματα / sec x 16 bits /δείγμα = 705.600 bits /sec• Για 60 λεπτά μουσικής στέρεο (όσα χωρεί ένα CD)

έχουμε:(60 min) x (60 sec / min) x (705.600 bits /sec) x 2 channels =

= 5.080.320.000 bits !• (Μπορούμε να συμπιέσουμε με απώλειες τις ηχητικές πληροφορίες,

π.χ. χρησιμοποιώντας το ηχητικό πρότυπο MP3.)

Page 28: ΗΜΥ  007  –  Τεχνολογία Πληροφορίας Διάλεξη  8

Στην συνέχεια…

• Σύστημα Τηλεφώνου • Βασικά στοιχεία και τύποι συστήματος

• αναλογικό, ψηφιακό• ενσύρματο, ασύρματο (κινητό και δορυφορικό)