16
5 de jul de 2022 LPC LINEAR PREDICTIVE CODEC INTEGRANTES MARÍA FERNANDA MARQUEZ ERNESTO NOBOA JAIRO JÁCOME

Unidad2difus multimedia-100527113812-phpapp01 - copia

Embed Size (px)

Citation preview

Page 1: Unidad2difus multimedia-100527113812-phpapp01 - copia

3 de may de 2023

LPC LINEAR PREDICTIVE CODEC

INTEGRANTES

MARÍA FERNANDA MARQUEZERNESTO NOBOA

JAIRO JÁCOME

Page 2: Unidad2difus multimedia-100527113812-phpapp01 - copia

Codificación predictiva lineal (LPC)

3 de may de 2023

La idea fundamental del modelo LPC es representar a la señal de voz como una función de excitación constituida por un tren de pulsos cuasiperiódicos (para sonidos vocalizados) ouna fuente de ruido aleatorio (para sonidos no vocalizados)

Page 3: Unidad2difus multimedia-100527113812-phpapp01 - copia

3 de may de 2023

Codificación predictiva lineal (LPC)

Características de la voz.La voz humana se produce cuando el aire es forzado a salir desde los pulmones, a través de las cuerdas vocales y a lo largo del tracto vocal. Mientras esto sucede, las cuerdas vocales vibran produciendo energía de audio que se concentra en las frecuencias con que éstas vibran.

Page 4: Unidad2difus multimedia-100527113812-phpapp01 - copia

3 de may de 2023

Codificación predictiva lineal (LPC)

Ciertas frecuencias resuenan dentro del tracto vocal, dependiendo estas frecuencias de la forma y tamaño del tracto. La energía de estas frecuencias es reforzada por las reflexiones de las ondas, las cuales se suman entre sí, mientras que la energía de las otras frecuencias tiende a disiparse. A estas reverberaciones de las cuerdas vocales se les denomina resonancias o formantes.

Page 5: Unidad2difus multimedia-100527113812-phpapp01 - copia

3 de may de 2023

Codificación predictiva lineal (LPC)

A medida que el tracto vocal varía, moviendo la lengua, variando la forma de los labios, ó variando la apertura de la boca, por ejemplo, las frecuencias de los formantes son controladas.

Basándose en el modo de excitación, la voz puede categorizarse en tres clases: sonidos con voz (voiced sounds) sonidos sin voz (unvoiced sounds) y sonidos explosivos (plosive sounds).

Page 6: Unidad2difus multimedia-100527113812-phpapp01 - copia

3 de may de 2023

Codificación predictiva lineal (LPC)

Los sonidos con voz En los sonidos sin voz Los sonidos explosivos Combinación de sonidos

Page 7: Unidad2difus multimedia-100527113812-phpapp01 - copia

3 de may de 2023

Codificación predictiva lineal (LPC)

La codificación LPC (linear Predictive Coding) basa su funcionamiento en el modelaje del tracto vocal. El modelo asume que cada muestra de voz representa una combinación lineal de las muestras anteriores.

Page 8: Unidad2difus multimedia-100527113812-phpapp01 - copia

3 de may de 2023

La codificación predictiva lineal o LPC es un tipo de codificador ampliamente utilizado en audio digital.En sistemas de procesado de voz, se usa partiendo de la idea de que la voz puede modelarse como una combinación lineal de p muestras anteriores más una señal de error.

Donde los coeficientes se denominan coeficientes LPC (del inglés linear prediction coding).

Codificación predictiva lineal (LPC)

Page 9: Unidad2difus multimedia-100527113812-phpapp01 - copia

3 de may de 2023

Codificación predictiva lineal (LPC)

Para esto utiliza una ecuación en la que cada muestra de voz se expresa como una combinación lineal de las muestras anteriores.

Los coeficientes de la ecuación (coeficientes de predicción) caracterizan el tracto vocal y el sistema requiere estimarlos

Esta estimación se realiza minimizando el error medio cuadrático entre la predicción de la señal y la señal misma

Page 10: Unidad2difus multimedia-100527113812-phpapp01 - copia

3 de may de 2023

Codificación predictiva lineal (LPC)

El tracto vocal es modelado como un tubo principal con un generador de frecuencias al final del mismo. La glotis (el espacio entre las cuerdas vocales) produce el sonido del timbre, el cual es caracterizado por su intensidad (loudness) y frecuencia (pitch). El tracto vocal (la garganta y la boca) forma el tubo. A este tubo principal se encuentran concatenados otros tubos acústicos que, junto con el principal, caracterizan las resonancias del tracto vocal

Page 11: Unidad2difus multimedia-100527113812-phpapp01 - copia

3 de may de 2023

Codificación predictiva lineal (LPC)

Generador(FrecuenciaAmplitud)

Modelo de tracto vocal

Page 12: Unidad2difus multimedia-100527113812-phpapp01 - copia

3 de may de 2023

Codificación predictiva lineal (LPC)

LPC analiza la señal de la voz estimando los formantes (frecuencias de resonancia de las cuerdas vocales) y calculando la intensidad y la frecuencia de los mismos.

El problema básico de un sistema LPC consiste en determinar el modelo del tracto vocal a partir de la señal de voz

Page 13: Unidad2difus multimedia-100527113812-phpapp01 - copia

3 de may de 2023

Codificación predictiva lineal (LPC)

LPC divide la señal de voz en segmentos temporales de alrededor de 20 mseg. (lo que equivaldría a 160 muestras PCM).

Page 14: Unidad2difus multimedia-100527113812-phpapp01 - copia

3 de may de 2023

Codificación predictiva lineal (LPC)

Hoy día se puede codificar la voz con LPC a velocidades entre 2.4 y 4.8 Kbps con una señal de voz reconstruida con una calidad razonable. Desafortunadamente, ciertos sonidos no se pueden reproducir fielmente con este método. La representación del tracto vocal por una serie de tubos acústicos concatenados no permite representar los sonidos nasales, los cuales, requieren una representación matemática mucho más compleja

Page 15: Unidad2difus multimedia-100527113812-phpapp01 - copia

3 de may de 2023

Codificación predictiva lineal (LPC)

Adicionalmente, el modelaje del tracto vocal también conlleva a que la señal reconstruida difiera de la real, debido a las diferencias entre el modelo y el tracto vocal real. La principal ventaja de la utilización del LPC es su capacidad de producir voz inteligible a muy bajas velocidades (entre 2,4 y 4,8 Kbps).

Page 16: Unidad2difus multimedia-100527113812-phpapp01 - copia

3 de may de 2023

Codificación predictiva lineal (LPC)

Sin embargo, al utilizar este tipo de codificación generalmente se hace imposible reconocer, a partir de la voz sintetizada, a la persona que la origina. La razón de esto es que las características del tracto vocal varían enormemente de persona a persona, lo cual hace el modelaje sumamente difícil.