17
ΜΕΡΟΣ Α : ΜΕΡΟΣ Α : ΤΗΛΕΠΙΚΟΙΝΩΝΙΑΚΑ ΘΕΜΑΤΑ ΤΗΛΕΠΙΚΟΙΝΩΝΙΑΚΑ ΘΕΜΑΤΑ ΕΝΟΤΗΤΑ Νο. 3 ΕΝΟΤΗΤΑ Νο. 3 ΤΕΧΝΙΚΕΣ ΚΩΔΙΚΟΠΟΙΗΣΗΣ ΠΗΓΗΣ ΤΕΧΝΙΚΕΣ ΚΩΔΙΚΟΠΟΙΗΣΗΣ ΠΗΓΗΣ - - Η ΠΕΡΙΠΤΩΣΗ ΤΗΣ ΦΩΝΗΣ Η ΠΕΡΙΠΤΩΣΗ ΤΗΣ ΦΩΝΗΣ ΚΙΝΗΤΑ ΔΙΚΤΥΑ ΕΠΙΚΟΙΝΩΝΙΩΝ ΚΙΝΗΤΑ ΔΙΚΤΥΑ ΕΠΙΚΟΙΝΩΝΙΩΝ

ΚΙΝΗΤΑ ΔΙΚΤΥΑ ΕΠΙΚΟΙΝΩΝΙΩΝ

  • Upload
    wilona

  • View
    30

  • Download
    0

Embed Size (px)

DESCRIPTION

ΚΙΝΗΤΑ ΔΙΚΤΥΑ ΕΠΙΚΟΙΝΩΝΙΩΝ. ΜΕΡΟΣ Α : ΤΗΛΕΠΙΚΟΙΝΩΝΙΑΚΑ ΘΕΜΑΤΑ ΕΝΟΤΗΤΑ Νο. 3 ΤΕΧΝΙΚΕΣ ΚΩΔΙΚΟΠΟΙΗΣΗΣ ΠΗΓΗΣ - Η ΠΕΡΙΠΤΩΣΗ ΤΗΣ ΦΩΝΗΣ. - PowerPoint PPT Presentation

Citation preview

Page 1: ΚΙΝΗΤΑ  ΔΙΚΤΥΑ  ΕΠΙΚΟΙΝΩΝΙΩΝ

ΜΕΡΟΣ Α :ΜΕΡΟΣ Α :

ΤΗΛΕΠΙΚΟΙΝΩΝΙΑΚΑ ΘΕΜΑΤΑΤΗΛΕΠΙΚΟΙΝΩΝΙΑΚΑ ΘΕΜΑΤΑ

ΕΝΟΤΗΤΑ Νο. 3ΕΝΟΤΗΤΑ Νο. 3

ΤΕΧΝΙΚΕΣ ΚΩΔΙΚΟΠΟΙΗΣΗΣ ΠΗΓΗΣ ΤΕΧΝΙΚΕΣ ΚΩΔΙΚΟΠΟΙΗΣΗΣ ΠΗΓΗΣ

-- Η ΠΕΡΙΠΤΩΣΗ ΤΗΣ ΦΩΝΗΣ Η ΠΕΡΙΠΤΩΣΗ ΤΗΣ ΦΩΝΗΣ

ΚΙΝΗΤΑ ΔΙΚΤΥΑ ΕΠΙΚΟΙΝΩΝΙΩΝΚΙΝΗΤΑ ΔΙΚΤΥΑ ΕΠΙΚΟΙΝΩΝΙΩΝ

Page 2: ΚΙΝΗΤΑ  ΔΙΚΤΥΑ  ΕΠΙΚΟΙΝΩΝΙΩΝ

Τεχνικές Κωδικοποίησης ΦωνήςΤεχνικές Κωδικοποίησης Φωνής

Κωδικοποίηση Πηγής: Η πληροφορία μιας διακριτής πηγής Κωδικοποίηση Πηγής: Η πληροφορία μιας διακριτής πηγής κωδικοποιείται με σκοπό την οικονομική δυαδική κωδικοποιείται με σκοπό την οικονομική δυαδική αναπαράσταση. Μέσω της διαδικασίας αυτής απορρίπτεται η αναπαράσταση. Μέσω της διαδικασίας αυτής απορρίπτεται η πλεονάζουσα «πληροφορία». πλεονάζουσα «πληροφορία». Η κωδικοποίηση χωρίς απώλειες (Η κωδικοποίηση χωρίς απώλειες (lossless) lossless) υπόκειται στο υπόκειται στο θεμελιώδη περιορισμό ότι ‘‘μια πηγή με εντροπία Η μπορεί να θεμελιώδη περιορισμό ότι ‘‘μια πηγή με εντροπία Η μπορεί να κωδικοποιηθεί με μηδενική πιθανότητα σφάλματος εφόσον ο κωδικοποιηθεί με μηδενική πιθανότητα σφάλματος εφόσον ο ρυθμός που προκύπτει είναι ρυθμός που προκύπτει είναι R > H, R > H, και αντίστροφα, εάν και αντίστροφα, εάν R R << HH τότε, ανεξάρτητα από την πολυπλοκότητα του κώδικα θα τότε, ανεξάρτητα από την πολυπλοκότητα του κώδικα θα προκύψει μη μηδενική πιθανότητα σφάλματος’’ , (1ο Θεώρημα προκύψει μη μηδενική πιθανότητα σφάλματος’’ , (1ο Θεώρημα του του Shannon).Shannon). Κλασικές τεχνικές Κλασικές τεχνικές losslesslossless, γενικού σκοπού:, γενικού σκοπού:

- Αλγόριθμος του - Αλγόριθμος του ShannonShannon

- Αλγόριθμος των - Αλγόριθμος των Lempel – ZivLempel – Ziv

- - Αλγόριθμος του Αλγόριθμος του HuffmanHuffman

Κωδικοποίηση αναλογικών πηγών : Έχει αναπόφευκταΚωδικοποίηση αναλογικών πηγών : Έχει αναπόφευκτα απώλειες (απώλειες (lossylossy) που οφείλονται στη διακριτοποίηση των ) που οφείλονται στη διακριτοποίηση των τιμών (κβαντισμός). Ο στόχος στην περίπτωση αυτή είναι η τιμών (κβαντισμός). Ο στόχος στην περίπτωση αυτή είναι η ελαχιστοποίηση αυτών των απωλειών και εν συνεχεία η ελαχιστοποίηση αυτών των απωλειών και εν συνεχεία η συμπίεση με ελεγχόμενες και πάλι απώλειεςσυμπίεση με ελεγχόμενες και πάλι απώλειες (Rate-Distortion (Rate-Distortion Theory)Theory)

Page 3: ΚΙΝΗΤΑ  ΔΙΚΤΥΑ  ΕΠΙΚΟΙΝΩΝΙΩΝ

Τεχνικές Κωδικοποίησης ΦωνήςΤεχνικές Κωδικοποίησης Φωνής

Κωδικοποίηση Φωνής: Ιδιαίτερα χρήσιμη διαδικασία αν Κωδικοποίηση Φωνής: Ιδιαίτερα χρήσιμη διαδικασία αν αναλογιστούμε ότι μεγάλο μέρος της διακινούμενης αναλογιστούμε ότι μεγάλο μέρος της διακινούμενης πληροφορίας είναι φωνή και ότι μέσω της συμπίεσης της πληροφορίας είναι φωνή και ότι μέσω της συμπίεσης της μπορεί να επιτευχθεί σημαντική μείωση του απαιτούμενου μπορεί να επιτευχθεί σημαντική μείωση του απαιτούμενου εύρους ζώνης (μέχρι και 4-5 φορέςεύρους ζώνης (μέχρι και 4-5 φορές χωρίς αισθητή υποβάθμιση χωρίς αισθητή υποβάθμιση της ποιότητας).της ποιότητας).

Γενική κατηγοριοποίηση των τεχνικών Γενική κατηγοριοποίηση των τεχνικών

1) 1) Waveform Coding Waveform Coding

- - Temporal Temporal

- Spectral (Transform) - Spectral (Transform)

22) Model-based Coding) Model-based Coding

Παρόμοια κατηγοριοποίηση ισχύει και σε άλλου τύπου Παρόμοια κατηγοριοποίηση ισχύει και σε άλλου τύπου αναλογικές πηγέςαναλογικές πηγές, ,

π.χ. εικόνα ή π.χ. εικόνα ή video (video (η φυσική σκηνή είναι σχεδόν πάντα η φυσική σκηνή είναι σχεδόν πάντα αναλογική) αναλογική)

Page 4: ΚΙΝΗΤΑ  ΔΙΚΤΥΑ  ΕΠΙΚΟΙΝΩΝΙΩΝ

Τεχνικές Κωδικοποίησης ΦωνήςΤεχνικές Κωδικοποίησης Φωνής

Ιεραρχική κατηγοριοποίηση των διαφόρων τεχνικών Ιεραρχική κατηγοριοποίηση των διαφόρων τεχνικών κωδικοποίησης κωδικοποίησης

Page 5: ΚΙΝΗΤΑ  ΔΙΚΤΥΑ  ΕΠΙΚΟΙΝΩΝΙΩΝ

Τεχνικές Κωδικοποίησης ΦωνήςΤεχνικές Κωδικοποίησης Φωνής

Διάγραμμα βαθμίδων ενός κωδικοποιητή Διάγραμμα βαθμίδων ενός κωδικοποιητή ADPCM ADPCM (CT2 cordless telephone system)(CT2 cordless telephone system)

Το σύστημα είναι προσαρμοστικό (προβλέπτης και Το σύστημα είναι προσαρμοστικό (προβλέπτης και κβαντιστής) και έτσι είναι σε θέση να παρακολουθεί τις κβαντιστής) και έτσι είναι σε θέση να παρακολουθεί τις στατιστικές αλλαγές του σήματος εισόδου στατιστικές αλλαγές του σήματος εισόδου S(k)S(k)

Page 6: ΚΙΝΗΤΑ  ΔΙΚΤΥΑ  ΕΠΙΚΟΙΝΩΝΙΩΝ

Τεχνικές Κωδικοποίησης ΦωνήςΤεχνικές Κωδικοποίησης Φωνής

Διαγράμματα βαθμίδων υπο-ζωνικού κωδικοποιητή και Διαγράμματα βαθμίδων υπο-ζωνικού κωδικοποιητή και αποκωδικοποιητή αποκωδικοποιητή

Sub-band Codec ( Sub-band Codec ( CoCoder-der-DecDecoder )oder )

- Χρήση των - Χρήση των filter banks QMFfilter banks QMF για ακύρωση της αναδίπλωσης για ακύρωση της αναδίπλωσης φάσματοςφάσματος

Page 7: ΚΙΝΗΤΑ  ΔΙΚΤΥΑ  ΕΠΙΚΟΙΝΩΝΙΩΝ

Adaptive Transform Coding (ADC)Adaptive Transform Coding (ADC)

- Κωδικοποίηση τμημάτων φωνής στο πεδίο συχνοτήτων Κωδικοποίηση τμημάτων φωνής στο πεδίο συχνοτήτων - Συνήθως χρησιμοποιείται ο Διακριτός Μετασχηματισμός Συνήθως χρησιμοποιείται ο Διακριτός Μετασχηματισμός Συνημιτόνου Συνημιτόνου (DCT) (DCT) του οποίου οι σχέσεις ανάλυσης και του οποίου οι σχέσεις ανάλυσης και σύνθεσης φαίνονται παρακάτωσύνθεσης φαίνονται παρακάτω ( ( g(0)=1, g(k)=2g(0)=1, g(k)=21/2 1/2 )) ::

Τυπικός διαχωρισμός υπο-ζωνών Τυπικός διαχωρισμός υπο-ζωνών

Τεχνικές Κωδικοποίησης ΦωνήςΤεχνικές Κωδικοποίησης Φωνής

Page 8: ΚΙΝΗΤΑ  ΔΙΚΤΥΑ  ΕΠΙΚΟΙΝΩΝΙΩΝ

Τεχνικές Κωδικοποίησης ΦωνήςΤεχνικές Κωδικοποίησης Φωνής

Μοντέλο παραγωγής φωνήςΜοντέλο παραγωγής φωνής

Με δεδομένη τη βασική φωνητική οδό, Με δεδομένη τη βασική φωνητική οδό, απαιτείται επιπλέον η εκτίμηση των απαιτείται επιπλέον η εκτίμηση των εξής παραμέτρων:εξής παραμέτρων: - Αν το φώνημα είναι εύφωνο (- Αν το φώνημα είναι εύφωνο (voiced) voiced) ή άφωνο (ή άφωνο (unvoiced)unvoiced) - - - Θεμελιώδης συχνότητα (- Θεμελιώδης συχνότητα (pitch)pitch) - - Μέση ισχύς του φωνήματοςΜέση ισχύς του φωνήματος

Page 9: ΚΙΝΗΤΑ  ΔΙΚΤΥΑ  ΕΠΙΚΟΙΝΩΝΙΩΝ

Τεχνικές Κωδικοποίησης ΦωνήςΤεχνικές Κωδικοποίησης Φωνής

Κωδικοποιητές φωνής Κωδικοποιητές φωνής (Vocoders) (Vocoders) τύπου τύπου LPC (Linear LPC (Linear Predictive Coding)Predictive Coding)

Ένας Ένας LPC Vocoder LPC Vocoder μοντελοποιεί τη φωνητική οδό ως ένα μοντελοποιεί τη φωνητική οδό ως ένα γραμμικό σύστημα τύπου γραμμικό σύστημα τύπου all-poleall-pole με συνάρτηση μεταφοράς: με συνάρτηση μεταφοράς:

Προσδιορισμός των συντελεστών του Προσδιορισμός των συντελεστών του LPC Vocoder LPC Vocoder ::

min{min{Σ Σ ee22nn} w.r.t. } w.r.t. α αkk R R αα = = r r ((R = Toeplitz) (Levinson-R = Toeplitz) (Levinson-

Durbin Algorithm)Durbin Algorithm)

To To τρέχον δείγμα γράφεται ως τρέχον δείγμα γράφεται ως γραμμικός συνδυασμός γραμμικός συνδυασμός προηγουμένων δειγμάτων :προηγουμένων δειγμάτων :

Page 10: ΚΙΝΗΤΑ  ΔΙΚΤΥΑ  ΕΠΙΚΟΙΝΩΝΙΩΝ

Τεχνικές Κωδικοποίησης ΦωνήςΤεχνικές Κωδικοποίησης Φωνής

Διάγραμμα βαθμίδων ενός κωδικοποιητή Διάγραμμα βαθμίδων ενός κωδικοποιητή LPCLPC

Απαιτούμενη πληροφορία Απαιτούμενη πληροφορία στον δέκτη:στον δέκτη: - Συντελεστές - Συντελεστές LPC LPC ((κβαντισμένοι)κβαντισμένοι) - - Voiced/unvoiced Voiced/unvoiced decisiondecision - Pitch period- Pitch period - Gain- Gain

> Τεχνικές > Τεχνικές εκτίμησης/ανίχνευσης για τις εκτίμησης/ανίχνευσης για τις παραπάνω παραμέτρουςπαραπάνω παραμέτρους

Η διαδικασία LPC θυμίζει το ADPCM με τη βασική διαφορά ότι αντί να αποστέλλεται το κβαντισμένο σφάλμα αποστέλλονται κάποια χαρακτηριστικά του

Page 11: ΚΙΝΗΤΑ  ΔΙΚΤΥΑ  ΕΠΙΚΟΙΝΩΝΙΩΝ

Τεχνικές Κωδικοποίησης ΦωνήςΤεχνικές Κωδικοποίησης Φωνής

Διάφορες εναλλακτικές μέθοδοι δημιουργίας του σήματος Διάφορες εναλλακτικές μέθοδοι δημιουργίας του σήματος διέγερσης διέγερσης

στον αποκωδικοποιητή στον αποκωδικοποιητή LPCLPC

LPCLPC Vocoder Vocoder

MPE-LPCMPE-LPC(Multipulse (Multipulse Excitation)Excitation)Χρήση πολλών παλμών Χρήση πολλών παλμών ανά περίοδο με ανά περίοδο με μεταβαλλόμενα πλάτη μεταβαλλόμενα πλάτη και θέσειςκαι θέσεις

CELPCELP(Code Excited LP)(Code Excited LP)Χρήση ενός Χρήση ενός προκαθορισμένου προκαθορισμένου codebook codebook με σήματα με σήματα διέγερσηςδιέγερσης

Page 12: ΚΙΝΗΤΑ  ΔΙΚΤΥΑ  ΕΠΙΚΟΙΝΩΝΙΩΝ

Τεχνικές Κωδικοποίησης ΦωνήςΤεχνικές Κωδικοποίησης Φωνής

Διάγραμμα βαθμίδων της διαδικασίας Διάγραμμα βαθμίδων της διαδικασίας code book search code book search του του συστήματος κωδικοποίησης συστήματος κωδικοποίησης CELP (Code Excited Linear CELP (Code Excited Linear

Predictive)Predictive)

Οι βασικές διαδικασίες στον κωδικοποιητή Οι βασικές διαδικασίες στον κωδικοποιητή CELP:CELP:

- - Υπολογισμός των δύο προβλεπτών (Υπολογισμός των δύο προβλεπτών (LTP, STP) LTP, STP) από το από το εκάστοτε τμήμα φωνήςεκάστοτε τμήμα φωνής (Long Term & Short Term Prediction)(Long Term & Short Term Prediction) - - Εύρεση της βέλτιστης διέγερσης (από το Εύρεση της βέλτιστης διέγερσης (από το codebook)codebook). . Το Το αντικειμενικό σφάλμα αντικειμενικό σφάλμα ανακατασκευής (ανακατασκευής (error)error) υφίσταται περαιτέρω υφίσταται περαιτέρω μετασχηματισμό σύμφωνα με τονμετασχηματισμό σύμφωνα με τον αντιληπτικό μηχανισμό μας (αντιληπτικό μηχανισμό μας (perceptual masking)perceptual masking)

Page 13: ΚΙΝΗΤΑ  ΔΙΚΤΥΑ  ΕΠΙΚΟΙΝΩΝΙΩΝ

Τεχνικές Κωδικοποίησης ΦωνήςΤεχνικές Κωδικοποίησης Φωνής

Διάγραμμα βαθμίδων του συστήματος κωδικοποίησης Διάγραμμα βαθμίδων του συστήματος κωδικοποίησης RELP RELP

(Residual Excited Linear Predictive)(Residual Excited Linear Predictive)

To To σύστημα κωδικοποίησης σύστημα κωδικοποίησης RELP RELP βασίζεται ουσιαστικά βασίζεται ουσιαστικά στην ίδια λογική με αυτή τουστην ίδια λογική με αυτή του συστήματοςσυστήματος ADPCM ADPCM με με επιπλέον στοιχεία την ενσωμάτωση χαρακτηριστικών του επιπλέον στοιχεία την ενσωμάτωση χαρακτηριστικών του τρέχοντος δείγματος (τρέχοντος δείγματος (v/u, gain, pitch)v/u, gain, pitch) . Σχηματίζεται το . Σχηματίζεται το σήμα σφάλματος (σήμα σφάλματος (residual) residual) το οποίο κβαντίζεται και το οποίο κβαντίζεται και μεταδίδεται.μεταδίδεται.

Page 14: ΚΙΝΗΤΑ  ΔΙΚΤΥΑ  ΕΠΙΚΟΙΝΩΝΙΩΝ

Τεχνικές Κωδικοποίησης ΦωνήςΤεχνικές Κωδικοποίησης Φωνής

Διάγραμμα βαθμίδων του κωδικοποιητή φωνής του Διάγραμμα βαθμίδων του κωδικοποιητή φωνής του συστήματος συστήματος GSMGSM

(( Regular Pulse Excited - Long Term Prediction – RPE-LTP ) Regular Pulse Excited - Long Term Prediction – RPE-LTP )

To To σύστημα σύστημα RPE-LTP RPE-LTP συνδυάζει τα πλεονεκτήματα του συνδυάζει τα πλεονεκτήματα του RELP RELP και του και του MPE-LTPMPE-LTP. Ουσιαστικά είναι σύστημα. Ουσιαστικά είναι σύστημα τύπου τύπου RELPRELP που που έχει ενσωματώσει τη διαδικασία έχει ενσωματώσει τη διαδικασία LTP.LTP.

Page 15: ΚΙΝΗΤΑ  ΔΙΚΤΥΑ  ΕΠΙΚΟΙΝΩΝΙΩΝ

Τεχνικές Κωδικοποίησης ΦωνήςΤεχνικές Κωδικοποίησης Φωνής

Διάγραμμα βαθμίδων του αποκωδικοποιητή φωνής του Διάγραμμα βαθμίδων του αποκωδικοποιητή φωνής του συστήματος συστήματος GSMGSM

- H - H ανάλυση ανάλυση STP STP (στον κωδικοποιητή) δίνει τους λεγόμενους (στον κωδικοποιητή) δίνει τους λεγόμενους reflection coefficients reflection coefficients και όχι τους ίδιους τους συντελεστές και όχι τους ίδιους τους συντελεστές πρόβλεψης. Είναι μαθηματικά ισοδύναμη παραμετροποίηση. πρόβλεψης. Είναι μαθηματικά ισοδύναμη παραμετροποίηση.

- - Στη συνέχεια από τους Στη συνέχεια από τους r.c. r.c. υπολογίζονται οι συντελεστές υπολογίζονται οι συντελεστές L.A.R. L.A.R. (logarithmic area ratios)(logarithmic area ratios) μέσω ενός απλού μη-γραμμικού μέσω ενός απλού μη-γραμμικού μετασχηματισμού. Οι συντελεστές που προκύπτουν έχουν καλύτερες μετασχηματισμού. Οι συντελεστές που προκύπτουν έχουν καλύτερες ιδιότητες κβάντισης.ιδιότητες κβάντισης.

Page 16: ΚΙΝΗΤΑ  ΔΙΚΤΥΑ  ΕΠΙΚΟΙΝΩΝΙΩΝ

Τεχνικές Κωδικοποίησης ΦωνήςΤεχνικές Κωδικοποίησης Φωνής

Τεχνικές κωδικοποίησης που χρησιμοποιούνται σε διάφορα Τεχνικές κωδικοποίησης που χρησιμοποιούνται σε διάφορα συστήματασυστήματα

κινητών επικοινωνιών κινητών επικοινωνιών

- Συστήματα 3ης γενιάς: Συστήματα 3ης γενιάς: Adaptive Multirate (AMR) Adaptive Multirate (AMR) speechspeech codeccodec

Το σύστημα επιτρέπει συμπίεση σε διαφορετικούς ρυθμούς ανάλογα με τις Το σύστημα επιτρέπει συμπίεση σε διαφορετικούς ρυθμούς ανάλογα με τις συνθήκες. Στον πυρήνα του συστήματος είναι η τεχνική συνθήκες. Στον πυρήνα του συστήματος είναι η τεχνική ACELP (Algebraic ACELP (Algebraic CELP) CELP) που είναι κατά βάση η που είναι κατά βάση η CELP CELP με διαφορετικό με διαφορετικό coodbook design and search.coodbook design and search.

Page 17: ΚΙΝΗΤΑ  ΔΙΚΤΥΑ  ΕΠΙΚΟΙΝΩΝΙΩΝ

Τεχνικές Κωδικοποίησης ΦωνήςΤεχνικές Κωδικοποίησης Φωνής

Αξιολόγηση της απόδοσης διαφόρων τεχνικών κωδικοποίησης Αξιολόγηση της απόδοσης διαφόρων τεχνικών κωδικοποίησης με βάση τον δείκτη με βάση τον δείκτη MOS (Mean Opinion Score)MOS (Mean Opinion Score)

- Εξαιρετική ποιότητα (5) : Καταληπτότητα χωρίς καμμία Εξαιρετική ποιότητα (5) : Καταληπτότητα χωρίς καμμία προσπάθειαπροσπάθεια- Καλή ποιότητα (4) : Καταληπτότητα χωρίς ιδιαίτερη Καλή ποιότητα (4) : Καταληπτότητα χωρίς ιδιαίτερη προσπάθειαπροσπάθεια- Μέτρια ποιότητα (3) : Καταληπτότητα με σχετική προσπάθειαΜέτρια ποιότητα (3) : Καταληπτότητα με σχετική προσπάθεια- Ανεπαρκής ποιότητα (2) : Καταληπτότητα με σημαντική Ανεπαρκής ποιότητα (2) : Καταληπτότητα με σημαντική προσπάθειαπροσπάθεια- Κακή ποιότητα (1) : Πολύ περιορισμένη καταληπτότητα παρά Κακή ποιότητα (1) : Πολύ περιορισμένη καταληπτότητα παρά την την

σημαντική προσπάθειασημαντική προσπάθεια