Upload
others
View
5
Download
0
Embed Size (px)
Citation preview
HamRadio/Dr. Ha, 25.6.2012/1
Prof. Dr.-Ing. M. HartjeFachbereich
Elektrotechnik & [email protected]
Digitale Sprachübertragung –wie funktioniert ein Vocoder
HamRadio/Dr. Ha, 25.6.2012/2
Sprachübertragung
HamRadio/Dr. Ha, 25.6.2012/3
Digitale SprachübertragungAm Anfang war die analoge Übertragung
Mikrophon – TX – Antenne – RX - Lautsprecher
Einschleifen eines Digitalisierungsweges mit ADU-DAU erfordert
BandbegrenzungQuantisierung
Vorführung!
HamRadio/Dr. Ha, 25.6.2012/4
Günstige BedingungenSprachverständlichkeit als Ziel:
Erkennen der Phoneme
WorterkennungSatzerkennung
SinnbildungSprecher erkennen
Emotionen erkennen
Was können / wollen wir weglassen?
HamRadio/Dr. Ha, 25.6.2012/5
Verminderung der Datenrate für kleine ÜbertragungsbandbreitenErreichbares Minimum bei
Persönliche Stimmmerkmale entfernen
mit Textübertragung dannSpracherkennung (TX) und TTS (RX)
Datenreduktion (Quellencodierung)Redundanz
Irrelevanz
�MP3, OGG-Vorbis, lineare Prediction
HamRadio/Dr. Ha, 25.6.2012/6
Vokaltrakt und Stimmlippen
Aus Sataloff R.T.: die menschliche Stimme 11.1993, Spektrum der Wissenschaft
HamRadio/Dr. Ha, 25.6.2012/7
Physikalisches Modell
Tonerzeugung Artikulationstrakt (Filter)
Nach Flanaagan: Speech analysis … 1965
HamRadio/Dr. Ha, 25.6.2012/8
VorführungVocale
Stimmlose Laute
HamRadio/Dr. Ha, 25.6.2012/9
BeobachtungenStimmhafte Laute mit unterschiedlichen Oberschwingungsanteilen
Stimmlose Laute als Rauschspektrum
HamRadio/Dr. Ha, 25.6.2012/10
Sprache ermöglicht mehrPhysikalische Stimmerzeugung mathematisch modellieren
Analysieren
SynthetisierenDifferenz zwischen Modell und Momentanwerten
Übertragung mit Fehlern möglich, da Satzverständlichkeit das Ziel ist
HamRadio/Dr. Ha, 25.6.2012/11
Sprachkodierung im ÜberblickSignalformkodierung
ZeitbereichSkalare QuantisierungVektorquantisierung (mit Codebüchern)
FrequenzbereichTeilbänder (SBC)Transformationscodierung
Parametrische Kodierung (Vokoder)Sinusmodellierung (20-40 Schwingungen)Vokoder
Klassischer Vokoder (zB 16 Filterkanäle � 2,4-3,2 kBit/s, IMBE, AMBE)Prädiktionsvokoder (Allpolfilter mit 10 Koeffizienten; CELP, auch CODEC2)
HamRadio/Dr. Ha, 25.6.2012/12
Parametrische Vocoder
HamRadio/Dr. Ha, 25.6.2012/13
Modell eines VocodersImpuls-generator
Rausch-generator
Sprachtraktmodell(Filter)
Grund-frequenz stimmhaft
stimmlos
Energie
Änderung aller Parameter inkurzen Zeitscheiben: typisch 20 ms
Nachteil: nur zwei Anregungszustände
HamRadio/Dr. Ha, 25.6.2012/14
Prinzip LPC-Vocoder (Details)
LPC: lineare Prediction Codec
HamRadio/Dr. Ha, 25.6.2012/15
Einschränkungen bei VocodernOptimiert für Sprachverständlichkeit
(MELP: germanische Sprachen, Englisch)
Sprache wird mit mathematischem Modell verglichen und daran angepaßt
Musik, DTMF, Geräusche nicht geeignet
HamRadio/Dr. Ha, 25.6.2012/16
Vocoder (Dudley: 1939)MELP – patentiert, geringe Bitraten, DoD
Qualität eingeschränkt
Optimiert für Sprachverständlichkeit
AMBE – patentiertes VerfahrenCELP – Codebook Exited Linear Prediction
Teil vom MPEG-4 (IEC 14496-3)
HamRadio/Dr. Ha, 25.6.2012/17
Digitale ÜbertragungssystemeInformationsgehalt der Übertragung (Quelle bis Senke) bestimmen (Quellencodierung)
Redundanz
Irrelevanz
Umwandlung mit Verlusten � DatenstromSicherheit der Übertragung durch Forward Error Correction erhöhen (Kanalcodierung)
Scrambling (Burstfehler)
HamRadio/Dr. Ha, 25.6.2012/18
Kodierung und wechselnde Redundanz
Quellen-Codierung
Signal
RedundanzIrrelvanz
Kanal-Codierung
Leitungs-Codierung
Redundanz
Quellen-decodierung
Signal
Redundanz
Kanal-decodierung
Leitungs-decodierung
Fehlerkorrektur + * StörungenKanal
Kanal
HamRadio/Dr. Ha, 25.6.2012/19
Digital Voice Radio System
A/D codecenc
FECenc mod
HF/VHFKanal
D/A codecdec
FECdec demod
Störung
TXTXTXTX
RX
bekanntNicht so gut bekannt
HamRadio/Dr. Ha, 25.6.2012/20
Sprachcodierung im BesonderenAbtastwerte (mit zB 16 bit bei 8 ks/s = 128 kBit/s)Aufgabe: Reduziere auf 2400 bit/s (Faktor: 50!)Frage: Was kann wegfallen?
Erkennbare SpracheNatürliche Sprache mit Sprechererkennung
Spracherzeugungsmodell modellieren, und Parameter übertragen
HamRadio/Dr. Ha, 25.6.2012/21
Sinusansatz der SprachmodellePitch Period35 samplesor 4.4ms at 8kHzsample rate
Time (samples)
Amplitude(16 bit samples)
HamRadio/Dr. Ha, 25.6.2012/22
Sinusansatz der SprachmodelleAmplitude
(dB)
Frequency (Hz)
Pitch 230Hz or 4.3ms
Harmonics of 230Hz
1
2
3
4
5
6 7
8 9 10 1112
13
14
Ziffern: Oberschwingungen
HamRadio/Dr. Ha, 25.6.2012/23
Bit Allocation des Codec2
ParameterParameter Bits/frameBits/frameSpectral magnitudes (LSPs) 36Energy 5Voicing (updated each 10ms) 2Pitch 7TotalTotal 5050
Alpha V0.1 codec, (noch in der Bearbeitung)50 bits per 20ms frame, or 2500 bit/sAuch als 2 Halb-Frames � 1200 bit/s
HamRadio/Dr. Ha, 25.6.2012/24
Vorführung SPEEXCodec2
HamRadio/Dr. Ha, 25.6.2012/25
Vocoderdaten übertragen?Niedrige Datenrate � niedrige BandbreiteSicherung gegen Fehler � erfordert Kanalstörungen zu untersuchenEinfache Anwendung bei Inband-ÜT �SSB, oder FMHuckepack bei DSTAR-Datenkanal?Lösung aus 2007: G3PLX: FDMDV
HamRadio/Dr. Ha, 25.6.2012/26
Codec2 – OpenSource Vocoder+ Modem
Vocoder: 1200, 1400, 2500 Bit/sFDMDV-Modem (G3PLX; N1SU-Webseite)
14 Träger, ∆f=75Hz, DQPSK , 50 Symbole/sBandbreite: 1,1 KHz, 1 Synchronisations-Träger1440 Bit/sÜbertragen im Sprachkanal SSB oder FM
VHF-Modem mit GMSK (V: ON1KRF)Bandbreite: 2 kHz (< ½ DSTAR, ¼ DMR/TRBO )Besser geeignet für nichtlineare PA
HamRadio/Dr. Ha, 25.6.2012/27
FDMDV - ModemFrequency Division Multiplex
Digital Voice
HamRadio/Dr. Ha, 25.6.2012/28
Funktion FDMDV (G3PLX, 2007)Daten über 15 Träger verteilt
Trägerabstand 75 Hz � B = 1125 HzSymbole zu 2 Bit (DQPSK) auf 14 TrägernTräger 15 für
Schnelle Synchronisation (keine Ausfälle)Schnelle Frequenzkorrektor (< 200 Hz)
Ohne VorwärtsOhne VorwärtsOhne VorwärtsOhne Vorwärts----Fehlerkorrektur (FEC)Fehlerkorrektur (FEC)Fehlerkorrektur (FEC)Fehlerkorrektur (FEC)Aber schnelle Synchronisation!!!Aber schnelle Synchronisation!!!Aber schnelle Synchronisation!!!Aber schnelle Synchronisation!!!Übertragung bei geringem SNR (3dB)Original: mit MELP / CELP-Coder
HamRadio/Dr. Ha, 25.6.2012/29
FDMDV BlockschaltbildSymbolrate
50 Hz
raised root cosineM=160
Abtastrate8000 Hz
fu: 600fM:1200fo: 1800
1400 Bps
HamRadio/Dr. Ha, 25.6.2012/30
Konstellationsdiagramm FDMDV
InformationPilotton
Pilotton
HamRadio/Dr. Ha, 25.6.2012/31
Wasserfall-Spektrum des FDMDV
HamRadio/Dr. Ha, 25.6.2012/32
+4dB SNR Konstellationsdiagramm
HamRadio/Dr. Ha, 25.6.2012/33
VorführungCodec2 + FDMDV-Modem
HamRadio/Dr. Ha, 25.6.2012/34
FDMDV-Decoder
HamRadio/Dr. Ha, 25.6.2012/35
Derzeitiger Entwicklungsstand CODEC2
HamRadio/Dr. Ha, 25.6.2012/36
ZusammenfassungWie kann man Sprache kodieren?Welche Möglichkeit besteht, die Vokaltrakt und die Spracherzeugung mathematisch zu modellieren?Was ist ein Vocoder?Codec2 mit FDMDV-Modem für die Inband-Übertragung (FM, SSB)