Unidad2difus multimedia-100527113812-phpapp01 - copia

3 de may de 2023

LPC LINEAR PREDICTIVE CODEC

INTEGRANTES

MARÍA FERNANDA MARQUEZERNESTO NOBOA

JAIRO JÁCOME

Codificación predictiva lineal (LPC)

3 de may de 2023

La idea fundamental del modelo LPC es representar a la señal de voz como una función de excitación constituida por un tren de pulsos cuasiperiódicos (para sonidos vocalizados) ouna fuente de ruido aleatorio (para sonidos no vocalizados)

3 de may de 2023


Características de la voz.La voz humana se produce cuando el aire es forzado a salir desde los pulmones, a través de las cuerdas vocales y a lo largo del tracto vocal. Mientras esto sucede, las cuerdas vocales vibran produciendo energía de audio que se concentra en las frecuencias con que éstas vibran.

3 de may de 2023


Ciertas frecuencias resuenan dentro del tracto vocal, dependiendo estas frecuencias de la forma y tamaño del tracto. La energía de estas frecuencias es reforzada por las reflexiones de las ondas, las cuales se suman entre sí, mientras que la energía de las otras frecuencias tiende a disiparse. A estas reverberaciones de las cuerdas vocales se les denomina resonancias o formantes.

3 de may de 2023


A medida que el tracto vocal varía, moviendo la lengua, variando la forma de los labios, ó variando la apertura de la boca, por ejemplo, las frecuencias de los formantes son controladas.

Basándose en el modo de excitación, la voz puede categorizarse en tres clases: sonidos con voz (voiced sounds) sonidos sin voz (unvoiced sounds) y sonidos explosivos (plosive sounds).

3 de may de 2023


Los sonidos con voz En los sonidos sin voz Los sonidos explosivos Combinación de sonidos

3 de may de 2023


La codificación LPC (linear Predictive Coding) basa su funcionamiento en el modelaje del tracto vocal. El modelo asume que cada muestra de voz representa una combinación lineal de las muestras anteriores.

3 de may de 2023

La codificación predictiva lineal o LPC es un tipo de codificador ampliamente utilizado en audio digital.En sistemas de procesado de voz, se usa partiendo de la idea de que la voz puede modelarse como una combinación lineal de p muestras anteriores más una señal de error.

Donde los coeficientes se denominan coeficientes LPC (del inglés linear prediction coding).


3 de may de 2023


Para esto utiliza una ecuación en la que cada muestra de voz se expresa como una combinación lineal de las muestras anteriores.

Los coeficientes de la ecuación (coeficientes de predicción) caracterizan el tracto vocal y el sistema requiere estimarlos

Esta estimación se realiza minimizando el error medio cuadrático entre la predicción de la señal y la señal misma

3 de may de 2023


El tracto vocal es modelado como un tubo principal con un generador de frecuencias al final del mismo. La glotis (el espacio entre las cuerdas vocales) produce el sonido del timbre, el cual es caracterizado por su intensidad (loudness) y frecuencia (pitch). El tracto vocal (la garganta y la boca) forma el tubo. A este tubo principal se encuentran concatenados otros tubos acústicos que, junto con el principal, caracterizan las resonancias del tracto vocal

3 de may de 2023


Generador(FrecuenciaAmplitud)

Modelo de tracto vocal

3 de may de 2023


LPC analiza la señal de la voz estimando los formantes (frecuencias de resonancia de las cuerdas vocales) y calculando la intensidad y la frecuencia de los mismos.

El problema básico de un sistema LPC consiste en determinar el modelo del tracto vocal a partir de la señal de voz

3 de may de 2023


LPC divide la señal de voz en segmentos temporales de alrededor de 20 mseg. (lo que equivaldría a 160 muestras PCM).

3 de may de 2023


Hoy día se puede codificar la voz con LPC a velocidades entre 2.4 y 4.8 Kbps con una señal de voz reconstruida con una calidad razonable. Desafortunadamente, ciertos sonidos no se pueden reproducir fielmente con este método. La representación del tracto vocal por una serie de tubos acústicos concatenados no permite representar los sonidos nasales, los cuales, requieren una representación matemática mucho más compleja

3 de may de 2023


Adicionalmente, el modelaje del tracto vocal también conlleva a que la señal reconstruida difiera de la real, debido a las diferencias entre el modelo y el tracto vocal real. La principal ventaja de la utilización del LPC es su capacidad de producir voz inteligible a muy bajas velocidades (entre 2,4 y 4,8 Kbps).

3 de may de 2023


Sin embargo, al utilizar este tipo de codificación generalmente se hace imposible reconocer, a partir de la voz sintetizada, a la persona que la origina. La razón de esto es que las características del tracto vocal varían enormemente de persona a persona, lo cual hace el modelaje sumamente difícil.

Internet

Unidad2difus multimedia-100527113812-phpapp01 - copia