305
Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad de Zaragoza, mayo de 2021 1. Interpolación de Lagrange Las técnicas de interpolación aparecen en Matemáticas con mucha frecuen- cia. El nombre interpolación significa insertar un punto entre otros ya dados, en contraste con el nombre extrapolación, que quiere decir colocarlo fuera. En general, el análisis del error y de la estabilidad nos permite afirmar que la in- terpolación proporciona resultados más exactos que la extrapolación y que los cálculos de interpolación son más estables que los cálculos de extrapolación. En muchos casos, se utilizan los mismos métodos y fórmulas para interpolación y para extrapolación, por lo que no se suele establecer la distinción, utilizándose la palabra interpolación con significado genérico, independientemente de que el valor calculado corresponda a puntos interiores o exteriores. Los primeros métodos de interpolación están ligados al uso de tablas. En antiguos textos babilonios ya aparecen referencias que indican que los métodos de interpolación se usaban para completar tablas. En la matemática griega la recomendación de sustituir el valor exacto por otro aproximado mediante in- terpolación son más explícitas. Por ejemplo, la Sintaxis de Ptolomeo muestra cómo puede construirse una tabla que proporciona la longitud de una cuerda c (x) = 2sen(x_2) correspondiente a una determinada longitud de arco x, que puede considerarse como la tabla más antigua de valores de una función tri- gonométrica. En el siglo XVII, John Napier y Jost Bürgi introdujeron el uso de tablas de logaritmos que fueron mejoradas por Henry Briggs, que a su vez intro- dujo nuevas tablas de funciones. Para el cálculo de algunos valores de las tablas utilizaron técnicas de interpolación usando polinomios cuadráticos, obteniendo resultados muy precisos. Existen funciones cuyo cálculo y tabulación puede ser muy laborioso. In- cluso aunque manejemos una tabla muy completa de una función, siempre po- demos necesitar un valor no contenido en la tabla. Podemos obtener el valor de la función volviendo a realizar todos los cálculos necesarios con el consiguien- te consumo de recursos y de tiempo. Incluso el cálculo puede ser tan complejo que solo pueda ser llevado a cabo por matemáticos especialistas. Pero si solo se requiere una buena aproximación del verdadero valor de la función, las téc- nicas de interpolación permiten utilizar los valores ya conocidos para obtener 1

Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Análisis Numéricopor Jesús Carnicer Álvarez,

Departamento de Matemática Aplicada,Universidad de Zaragoza, mayo de 2021

1. Interpolación de LagrangeLas técnicas de interpolación aparecen en Matemáticas con mucha frecuen-

cia. El nombre interpolación significa insertar un punto entre otros ya dados,en contraste con el nombre extrapolación, que quiere decir colocarlo fuera. Engeneral, el análisis del error y de la estabilidad nos permite afirmar que la in-terpolación proporciona resultados más exactos que la extrapolación y que loscálculos de interpolación son más estables que los cálculos de extrapolación. Enmuchos casos, se utilizan los mismos métodos y fórmulas para interpolación ypara extrapolación, por lo que no se suele establecer la distinción, utilizándosela palabra interpolación con significado genérico, independientemente de queel valor calculado corresponda a puntos interiores o exteriores.

Los primeros métodos de interpolación están ligados al uso de tablas. Enantiguos textos babilonios ya aparecen referencias que indican que los métodosde interpolación se usaban para completar tablas. En la matemática griega larecomendación de sustituir el valor exacto por otro aproximado mediante in-terpolación son más explícitas. Por ejemplo, la Sintaxis de Ptolomeo muestracómo puede construirse una tabla que proporciona la longitud de una cuerdac(x) = 2 sen(x∕2) correspondiente a una determinada longitud de arco x, quepuede considerarse como la tabla más antigua de valores de una función tri-gonométrica. En el siglo XVII, John Napier y Jost Bürgi introdujeron el uso detablas de logaritmos que fueron mejoradas por Henry Briggs, que a su vez intro-dujo nuevas tablas de funciones. Para el cálculo de algunos valores de las tablasutilizaron técnicas de interpolación usando polinomios cuadráticos, obteniendoresultados muy precisos.

Existen funciones cuyo cálculo y tabulación puede ser muy laborioso. In-cluso aunque manejemos una tabla muy completa de una función, siempre po-demos necesitar un valor no contenido en la tabla. Podemos obtener el valor dela función volviendo a realizar todos los cálculos necesarios con el consiguien-te consumo de recursos y de tiempo. Incluso el cálculo puede ser tan complejoque solo pueda ser llevado a cabo por matemáticos especialistas. Pero si solose requiere una buena aproximación del verdadero valor de la función, las téc-nicas de interpolación permiten utilizar los valores ya conocidos para obtener

1

Page 2: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

X XX

Y

Y

0

0

Y

1

1

P

P

P

0

1

Figura 1.1. Interpolación lineal y Teorema de Thales.

aproximaciones del valor de la función mediante fórmulas simples que ademáscontienen información sobre el tamaño del error cometido.

El método más simple de interpolación consiste en sustituir los valores deuna función f cuyo valor conocemos en dos puntos x0, x1, por la función poli-nómica de primer grado p(x) cuya gráfica es la línea recta que une los puntos(x0, f (x0)) y (x1, f (x1)).

Como la gráfica del interpolante es una línea recta, puede deducirse el valordel interpolante y = p(x) mediante el Teorema de Thales. Sea y0 = f (x0),y1 = f (x1) y definamos los puntos

P0 = (x0, y0), P = (x, y), P1 = (x1, y1).

Los puntos P0, P , P1 están alineados porque se encuentran en la gráfica de lafunción p(x). Sean X0, X y X1 las proyecciones respectivas sobre el eje de lasXX’ de P0, P , P1 e Y0, Y , Y1 las proyecciones respectivas sobre el eje de las YY’.Según el Teorema de Thales, los segmentos P0P y P0P1 son proporcionales alos segmentos X0X y X0X1 y también a los segmentos Y0Y y Y0Y1

X0XX0X1

=P0PP0P1

=Y0YY0Y1

.

Por tanto tenemos proporcionalidad entre las diferencias de valores de la funciónp y diferencias respectivas de las abscisas

y − y0y1 − y0

=x − x0x1 − x0

.

2

Page 3: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

log(x)p(x)

Figura 1.2. El logaritmo neperiano y su interpolante lineal en x0 = 1, x1 = 2.

Esta relación de proporcionalidad permite determinar la diferencia y − y0 me-diante la relación

y − y0 =y1 − y0x1 − x0

(x − x0),

y, considerando este valor como la corrección que debe añadirse a y0 para cal-cular el valor de y, obtenemos

y = y0 +y1 − y0x1 − x0

(x − x0),

de donde se obtiene la siguiente fórmula del interpolante de primer grado

p(x) = f (x0) +f (x1) − f (x0)

x1 − x0(x − x0).

Sustituir los valores de f (x) por los de p(x) puede conducirnos a grandeserrores de cálculo, pero si la función es suave y los puntos x0, x1, x, están su-ficientemente próximos, el error puede ser muy pequeño. En la Figura 1.2 semuestra el polinomio de primer grado que interpola a la función log(x) en lospuntos x0 = 1, x1 = 2. El error cometido es bajo en el interior del intervalo(1, 2) y cerca de los extremos.

Si conocemos el valor de la función f en más de dos puntos parece lógicoutilizar toda esa información para construir una función p que tenga mejorespropiedades de aproximación que una función polinómica de primer grado. Enel problema de interpolación de Lagrange buscamos una aproximación p cuyosvalores coincidan con los de la función f en los puntos dados.

3

Page 4: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Problema de interpolación de Lagrange. Se trata de encontrar una funciónp tal que p(xi) = yi, i = 0,… , n, para xi ∈ ℝ distintos, yi ∈ ℝ, i = 0,… , n,arbitrarios.

En el planteamiento del problema está implícito que el dominio de definiciónde la solución p debe ser un conjunto que contiene a todos los puntos x0,… , xn.Con frecuencia se exige que la solución sea una función continua y el dominiode definición de la solución sea un intervalo.

Geométricamente, el problema se traduce en determinar una curva de laforma (x, p(x)), x ∈ I , que pase por todos los puntos (xi, yi), i = 0,… , n. Lasabscisas xi de interpolación reciben el nombre de nodos y los valores yi recibenel nombre de datos.

Es habitual que los datos procedan de una función, es decir yi = f (xi),i = 0,… , n, para cierta función f . En ese caso decimos que la solución p(x) esla función interpoladora o interpolante y que f (x) es la función interpolada ointerpolando.

Problema de Lagrange en un espacio de funcionesEn los problemas de Lagrange, el interpolante suele elegirse dentro de los

elementos de un espacio vectorial de funciones U .En la discusión de existencia y unicidad de interpolación es útil considerar

la evaluación en los nodos

X ∶ u ∈ U →

u(x0)

u(xn)

∈ ℝn+1,

que es una aplicación lineal. El problema de interpolación de Lagrange en unasucesión de nodos x0,… , xn puede interpretarse en términos de la aplicaciónevaluación X: para un conjunto de datos (y0,… , yn) ∈ ℝn+1, buscamos u ∈ Utal que Xu = (y0,… , yn).

Observemos que la existencia de un interpolante para cualquier conjuntode datos (y0,… , yn) equivale a afirmar que X es una aplicación suprayectiva.La unicidad del interpolante en U equivale a afirmar que la aplicación X esinyectiva.

Si la dimensión del espacio U coincide con el número de nodos, dimU =n + 1, entonces

dim kerX + dimX(U ) = dimU = n + 1.

4

Page 5: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Se deduce que la existencia de solución de un problema de interpolación deLagrange equivale a la unicidad. Resumimos esta conclusión en el siguienteresultado.

Proposición 1.1. Sea U un espacio de funciones definidas en un intervalo quecontiene x0,… , xn con dimU = n + 1. Son equivalentes

(a) La única solución al problema de interpolación de Lagrange con nodosx0,… , xn y datos nulos en el espacio U es la función nula.

(b) Siempre existe al menos una solución del problema de interpolación deLagrange con nodos x0,… , xn y datos y0,… , yn cualesquiera en el espa-cio U .

(c) El problema de interpolación de Lagrange con nodos x0,… , xn es uni-solvente en U , es decir, para cualquier conjunto de datos, siempre existeuna única solución en U .

Veamos que el problema de interpolación de Lagrange en n + 1 nodos enun espacio vectorial U con dimU = n + 1 se reduce a resolver un sistema den + 1 ecuaciones con n + 1 incógnitas. Para ello, consideramos (u0,… , un) unabase del espacio vectorial U . Entonces toda función u ∈ U , es de la formau(x) =

∑nj=0 cjuj(x). Al imponer las condiciones de interpolación en x0,… , xn,

tenemosn∑

j=0cjuj(xi) = yi, i = 0,… , n,

o en forma matricial

u0(x0) u1(x0) ⋯ un(x0)

u0(x1) u1(x1) ⋯ un(x1)

⋮ ⋮ ⋱ ⋮

u0(xn) u1(xn) ⋯ un(xn)

c0c1⋮

cn

=

y0y1⋮

yn

.

La matriz de coeficientes del sistema anterior se llama matriz de coloca-ción o matriz de Vandermonde de la base (u0,… , un) en la sucesión de nodos(x0,… , xn) y se denota por

M( u0,… , unx0,… , xn

)

= (uj(xi))i,j=0,…,n.

Proposición 1.2. Sea U un espacio de dimensión n + 1 y (u0,… , un) una basecualquiera de dicho espacio. El problema de interpolación de Lagrange en la

5

Page 6: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

sucesión de nodos x0,… , xn tiene solución única para cualquier conjunto dedatos y0,… , yn si y solo si la matriz de colocación

M( u0,… , unx0,… , xn

)

es no singular.

Demostración. Como (u0,… , un) una base del espacio vectorial U , toda fun-ción u ∈ U , es de la forma u(x) =

∑nj=0 cjuj(x). Si u verifica las condiciones de

interpolaciónu(xi) = yi, i = 0,… , n,

entonces el vector de coeficientes (c0,… , cn) verifica

M( u0,… , unx0,… , xn

)

c0c1⋮

cn

=

y0y1⋮

yn

.

Recíprocamente, si (c0,… , cn) es solución del sistema lineal anterior, enton-ces u(x) =

∑nj=0 cjuj(x) verifica las condiciones de interpolación en los nodos

u(xi) = yi, i = 0,… , n. Por tanto, la existencia y unicidad de solución delproblema de interpolación equivalen a la existencia y unicidad de solución delsistema de ecuaciones correspondiente.

La proposición anterior parece indicar que el hecho de que la matriz de colo-cación sea no singular no depende de la base elegida. Sin embargo, la matriz decolocación que se obtiene depende de la base elegida. Consideremos (v0,… , vn)otra base de U y sea P la matriz de cambio entre las bases

(v0,… , vn) = (u0,… , un)P .

Entonces tenemos

M(v0,… , vnx0,… , xn

)

= M( u0,… , unx0,… , xn

)

P .

Como la matriz de cambio de base P es no singular, vemos que el hecho de quela matriz de colocación sea no singular no depende de la base elegida.

6

Page 7: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Describimos a continuación algunos espacios de funciones en los que surgela necesidad de buscar interpolantes para obtener aproximaciones de una fun-ción.Interpolación polinómicaSe elige como espacio de interpolación el espacio Pn de los polinomios de gradomenor o igual que n, de modo que el interpolante es de la forma p(x) =

∑ni=0 cix

i.La matriz de colocación de este problema recibe el nombre de matriz de Van-dermonde

V (x0,… , xn) = M( 1, x,… , xn

x0, x1,… , xn

)

=

1 x0 ⋯ xn01 x1 ⋯ xn1⋮ ⋮ ⋱ ⋮

1 xn ⋯ xnn

.

Interpolación trigonométricaSe elige como espacio de interpolación el espacio Tn de los polinomios trigo-nométricos de grado menor o igual que n, generado por

1, cos x, sen x, cos 2x, sen 2x,… , cos nx, sen nx.

Todo polinomio trigonométrico admite la expresión

t(x) =a02+

n∑

k=1(ak cos(kx) + bk sen(kx)).

Para determinados propósitos puede ser conveniente expresar un polinomio tri-gonométrico respecto a la base compleja

exp(ikx) = cos kx + i sen kx, k = −n,… ,−1, 0, 1,… , n.

En ese caso tenemos

t(x) =n∑

k=−nck exp(ikx).

donde c0 = a0∕2 y

c−k =ak + ibk

2, ck =

ak − ibk2

, k = 1,… , n.

7

Page 8: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Interpolación mediante polinomios exponencialesSe elige como espacio de interpolación el espacio E�0,…,�n generado por las fun-ciones

exp(�0x),… , exp(�nx), �0 < ⋯ < �n.Si admitimos valores complejos para los parámetros �0,… , �n, obtenemos lospolinomios trigonométricos como caso particular. El espacio de polinomios ex-ponenciales puede extenderse al caso de valores repetidos de los parámetros. Enese caso

E�0,…,�n ∶= ker(D − �0I)⋯ (D − �nI),es decirE�0,…,�n es el espacio de soluciones de una ecuación diferencial de ordenn+ 1 con coeficientes constantes y cuyos valores característicos son �0,… , �n.Una base de este espacio puede describirse como

exp(�ix)xri−1, ri ∶= #{j ≤ i ∣ �j = �i}, i = 0,… , n.

El caso del espacio de polinomios Pn corresponde al caso particular en que �0 =⋯ = �n = 0.

Interpolación mediante funciones splineDados puntos de un intervalo

a = �0 < �1 < ⋯ < �n = b,

llamados nudos, queda inducida una partición del intervalo [a, b] en n subinter-valos [�i, �i+1], i = 0,… , n−1. Una función spline es una función s ∶ [a, b] → ℝque coincide con un polinomio en cada subintervalo de la partición. Estos in-terpolantes se utilizan para problemas con un gran número de datos, ya quepresentan buenas propiedades de estabilidad.

Interpolación mediante funciones racionalesSe eligen como interpolantes funciones racionales

r(x) =p(x)q(x)

, p ∈ Pn, q ∈ Pm.

El grado del denominador no tiene por qué coincidir con el grado del numerador.Si el denominador es fijo, se puede formar un espacio vectorial de interpolantesde dimensión apropiada. Si consideramos la posibilidad de tener denominado-res variables, entonces el conjunto de interpolantes considerados puede no serun espacio vectorial, dando lugar a un problema de interpolación no lineal. Endicho caso, la existencia y unicidad de solución requieren un análisis más com-plicado, ya que la solución no se obtiene simplemente resolviendo un sistemade ecuaciones lineales.

8

Page 9: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

El teorema del restoUn polinomio es una expresión de la forma

n∑

k=0akx

k,

donde a0,… , an son los llamados coeficientes del polinomio y x recibe el nom-bre de indeterminada.

Definición. El grado de un polinomio no nulo p(x) =∑n

k=0 akxk se define como

grad p ∶= max{k ∈ {0,… , n} ∣ ak ≠ 0}.

El polinomio nulo (con todos sus coeficientes nulos) no tiene grado definidoaunque conviene asignarle el grado −∞ para que el grado de la suma sea menoro igual que el máximo de los grados y el grado del producto sea igual a la sumade los grados.

División euclídea. Dados dos polinomios p(x) y d(x) tales que d(x) no es elpolinomio nulo, existen dos polinomios q(x) y r(x) tales que

p(x) = d(x)q(x) + r(x), grad r < grad d.

El polinomio p(x) recibe el nombre de dividendo, d(x) divisor, y determinanunívocamente los polinomios q(x) cociente y r(x) resto de la división euclídea.

En el caso particular de que el divisor es de primer grado grad d(x) = 1, setiene que el resto r es una constante.

Todo polinomio con coeficientes complejos a0,… , an ∈ ℂ define una fun-ción polinómica p ∶ ℂ → ℂ, dada por

p(�) ∶=n∑

k=0ak�

k, � ∈ ℂ.

Definición. Sea p un polinomio con coeficientes complejos. Una raíz (o cero)del polinomio p es cualquier � ∈ ℂ tal que p(�) = 0

El problema de determinar las raíces de un polinomio está relacionado conel problema de descomponer un polinomio como producto de factores.

Teorema 1.3 (Teorema del resto). Sea p(x) un polinomio con coeficientes com-plejos.

9

Page 10: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

(a) El resto de la división de p(x) para x − x0, con x0 ∈ ℂ es precisamentep(x0)

(b) x0 ∈ ℂ es una raíz del polinomio p(x) si y solo si x − x0 divide a p(x).(c) Si x0,… , xn ∈ ℂ son raíces distintas del polinomio p(x), entonces el

polinomio !n+1(x) ∶= (x − x0)⋯ (x − xn) divide a p(x).

Demostración. (a) Sea q el polinomio cociente y r el resto de la division. Eva-luando en x = x0 la relación p(x) = (x − x0)q(x) + r, obtenemos r = p(x0).

(b) Si x0 es una raíz del polinomio, entonces r = p(x0) = 0 y la relaciónp(x) = (x − x0)q(x) + r se reduce a p(x) = (x − x0)q(x). Recíprocamente six − x0 divide a p(x) entonces se tiene que p(x) = (x − x0)q(x) y, evaluando enx = x0, deducimos que p(x0) = 0.

(c) Por inducción sobre n. Si n = 0, el resultado se sigue de (b). Suponiendocierto el resultado para n − 1, veámoslo para n. Como p(xn) = 0, tenemos por(b) que

p(x) = (x − xn)qn(x).

Evaluando en xi, i = 0,… , n − 1, tenemos

(xi − xn)qn(xi) = p(xi) = 0, i = 0,… , n − 1.

Como los puntos son distintos, xi − xn ≠ 0, i = 0,… , n − 1, y deducimos que

qn(xi) = 0, i = 0,… , n − 1.

Aplicando la hipótesis de inducción al polinomio qn, existe un polinomio q0 talque

qn(x) = (x − x0)⋯ (x − xn−1)q0(x),

de donde se obtiene la relación

p(x) = (x − x0)⋯ (x − xn)q0(x),

que equivale a afirmar que el polinomio !n+1(x) ∶= (x − x0)⋯ (x − xn) dividea p(x).

El Teorema del resto propiamente dicho corresponde al apartado (a) delTeorema ??. El apartado (b) del Teorema anterior es una consecuencia directay recibe a veces el nombre de Teorema del factor. Fue enunciado y utilizadopor René Descartes en 1637 en su obra La Géométrie. Como consecuencia delTeorema ?? (c), tenemos el siguiente resultado que se atribuye a Jean le Rondd’Alembert.

10

Page 11: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Corolario 1.4. El conjunto de las raíces complejas de un polinomio no nulo esfinito. El número de raíces complejas distintas de un polinomio de grado n esmenor o igual que n.

Demostración. Supongamos que existen k raíces distintas x1,… , xk ∈ ℂ. Porel Teorema ?? (c), tenemos

p(x) = q(x)(x − x1)⋯ (x − xk).

Si p ≠ 0, entonces q ≠ 0 y

grad p = grad q + k,

de donde se deduce quek ≤ grad p.

Por tanto el conjunto de raíces es finito y el número de raíces distintas debe sermenor o igual que grad p.

La regla de Ruffini o algoritmo de HornerLos coeficientes del cociente y el resto de la división euclídea correspon-

diente a divisores de la forma x − x0 pueden calcularse mediante una sencillarecurrencia.

Teorema 1.5. Sea p(x) = a0 + a1x +⋯ + anxn, un polinomio con coeficientescomplejos de grado menor o igual que n y x0 ∈ ℂ.

(a) Existe un polinomio q(x) = b0 + b1x +⋯ + bn−1xn−1 de grado menor oigual que n − 1 y una constante r ∈ ℂ tales que

p(x) = (x − x0)q(x) + r.

(b) Los coeficientes del cociente q(x) y el resto r están determinados por p(x)y x0 y pueden calcularse mediante la recurrencia

bn−1 ∶= an,

bi−1 ∶= ai + x0bi, i = n − 1,… , 2, 1,

r ∶= a0 + x0b0

11

Page 12: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Demostración. Desarrollemos (x − x0)q(x) + r en potencias de x

(x − x0)(b0 + b1x +⋯ + bn−1xn−1) + r

= (r − x0b0) + (b0 − x0b1)x +⋯ + (bn−2 − x0bn−1)xn−1 + bn−1xn.

Identificando los coeficientes de este polinomio con los del polinomio p(x) seobtienen las relaciones

r − x0b0 = a0bi−1 − x0bi = ai, i = 1, 2,… , n − 1,

bn−1 = an.

Podemos interpretar las relaciones anteriores como un sistema triangular supe-rior cuyo vector de incógnitas es (r, b0,… , bn−1). La resolución de dicho sistemapor sustitución regresiva da lugar a las relaciones de recurrencia. En efecto, dela última ecuación obtenemos el valor de bn−1 = an. Procediendo con la susti-tución regresiva obtenemos sucesivamente los valores

bi−1 = ai + x0bi, i = n − 1,… , 2, 1.

Finalmente la primera ecuación se utiliza para obtener r = a0 + x0b0.

Las relaciones de recurrencia anteriores simplifican considerablemente elcálculo del cociente y del resto de la división dando lugar a la llamada regla deRuffini, que en su versión algorítmica recibe el nombre de algoritmo de Horner.

Algoritmo de Hornerbn−1 ← anPara i = n − 1, n − 2,… , 2, 1

bi−1 ← ai + x0bir ← a0 + x0b0

En virtud del Teorema del resto, el algoritmo de Horner para el cálculo delresto r de la división de un polinomio p para x−x0 también puede considerarsecomo un algoritmo de evaluación del valor p(x0) del polinomio p en el puntox0.

Nota. El algoritmo de Horner solamente contiene sumas y multiplicaciones delos coeficientes a0,… , an y x0. Por tanto si el polinomio p tiene coeficientesreales y x0 ∈ ℝ entonces el polinomio cociente q también tiene coeficientesreales y el resto r también es una constante real.

12

Page 13: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Para evaluar un polinomio p(x) =∑n

i=0 aixi en x = x0, podemos calcular

separadamente cada uno de los sumandos en la expresión

a0 + a1x0 + a2x20 +⋯ + anx

n0.

Teniendo en cuenta que el sumando i-ésimo aixi0 contiene i productos, se re-quieren 0 + 1 + 2 +⋯ + n = n(n + 1)∕2 productos y n sumas en total.

Podemos economizar multiplicaciones en la evaluación de la base de mo-nomios

mi(x) ∶= xi, i = 0,… , n,almacenando los resultados previamente calculados utilizando la relación derecurrencia

mi(x0) = x0mi−1(x0).

Algoritmo: Evaluación de un polinomiom1(x0) ← x0Para i = 2,… , n

mi(x0) ← x0mi−1(x0)p(x0) ← a0 + a1m1(x0) +⋯ + anmn(x0)

El número total de operaciones de este algoritmo se reduce a 2n−1 productosy n sumas. El algoritmo de Horner todavía reduce más el esfuerzo computacio-nal y proporciona el valor de r = p(x0) utilizando solamente n productos y nsumas. Por su mayor economía, se recomienda usar el algoritmo de Horner enlugar de sumar los valores de cada monomio.

El algoritmo de Horner puede interpretarse como el algoritmo de evaluacióncorrespondiente a la fórmula anidada

p(x0) = a0 + x0(

a1 + x0(

a2 +⋯ + x0(an−1 + x0an))

)

.

Los pasos del algoritmo de Horner corresponden a evaluar las fórmulas entreparéntesis, comenzando por los paréntesis más internos y terminando con el másexterior. Partiendo de la identificación bn−1 = an, el paréntesis interior es bn−2 =an−1+x0bn−1. El valor del paréntesis que lo contiene es bn−3 = an−2+x0bn−2 y asísucesivamente, hasta tener el contenido del paréntesis exterior b0 = a1 + x0b1.Finalmente el valor del polinomio es r = a0 + x0b0.

El algoritmo de Horner puede utilizarse para evaluar las derivadas sucesivasde p. En efecto, derivando la fórmula

p(x) = (x − x0)q(x) + r,

13

Page 14: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

obtenemosp′(x) = (x − x0)q′(x) + q(x)

y, evaluando en x = x0, llegamos a la conclusión de que p′(x0) = q(x0). Luegopara evaluar la derivada de p en el punto x0 basta con evaluar el polinomiocociente en x0, evaluación que puede realizarse por el método de Horner.

Si queremos obtener derivadas de orden superior, podemos aplicar el algo-ritmo de Horner reiteradamente. Denotando por qj(x) al cociente de la divisiónde p(x) para (x − x0)j , j = 0,… , n, tenemos

qj(x) = (x − x0)qj+1(x) + qj(x0), j = 0,… , n − 1.

Aplicando la derivada k-ésima a ambos miembros 1 ≤ k ≤ n− j obtenemos lasrelaciones

q(k)j (x) = (x − x0)q(k)j+1(x) + kq(k−1)j−1 (x), j = 0,… , n − 1,

y evaluando en x0, se deduce que

q(k)j (x0) = kq(k−1)j+1 (x0), j = 0,… , n − 1.

Aplicando reiteradamente las relaciones anteriores

p(k)(x0) = q(k)0 (x0) = kq(k−1)1 (x0) = k(k − 1)q(k−2)2 (x0) = ⋯ = k!qk(x0),

se deduce que la reiteración del algoritmo de Horner k + 1 veces conduce alcálculo del valor qk(x0) = p(k)(x0)∕k!.

Ejemplo. Se quiere realizar la división del polinomio p(x) = x4+3x3−2x2+5para x+2. Para obtener el resto, podemos aplicar el Teorema del resto r = p(−2)y el problema se reduce a evaluar el polinomio. Sustituyendo directamente x =−2 tenemos

r = p(−2) = 16 − 24 − 8 + 5 = −11.El algoritmo de Horner utiliza menos operaciones y aprovecha los pasos inter-medios para proporcionar información sobre el cociente. Siguiendo los pasosdel algoritmo de Horner obtenemos

b3 = 1,

b2 = 3 + (−2) = 1,

b1 = −2 + (−2) = −4,

b0 = (−2)(−4) = 8,

r = 5 + (−2)8 = −11.

14

Page 15: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Los cálculos anteriores pueden presentarse en una tabla de Ruffini

1 3 −2 0 5

−2 −2 −2 8 −16

1 1 −4 8 ⌊−11

correspondientes a la representación

p(x) = −11 + (x + 2)(x3 + x2 − 4x + 8).

Si queremos calcular las derivadas sucesivas en x = −2 aplicaremos reitera-damente el algoritmo de Horner, que podemos representar mediante las tablasencadenadas

1 3 −2 0 5

−2 −2 −2 8 −16

1 1 −4 8 ⌊−11

−2 −2 2 4

1 −1 −2 ⌊12

−2 −2 6

1 −3 ⌊4

−2 −2

1 ⌊−5

obteniendo los valores

p′(−2) = 12, p′′(−2) = 8, p′′′(−2) = −30, p(4)(−2) = 24.

Espacios de funciones polinómicasDecimos que una función p ∶ I → ℝ definida sobre I ⊆ ℝ es una función

polinómica real de variable real si existe un polinomio con coeficientes realesa0,… , an ∈ ℝ tal que

p(x) =n∑

k=0akx

k, x ∈ I.

15

Page 16: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Denotemos por P (I) es espacio de todas las funciones polinómicas definidas enel intervalo I . De la definición se deduce que el espacio P (I) está formado porlas restricciones p|I de las funciones polinómicas p ∈ P (ℝ) definidas en todala recta real.

Por el Corolario ??, todo polinomio no nulo (cuyos coeficientes no son to-dos cero) define una función polinómica no nula, por lo que podemos identificarel espacio de polinomios con coeficientes reales P con el correspondiente es-pacio de funciones polinómicas P (ℝ). Esta propiedad puede generalizarse a undominio cualquiera de la recta real que contenga un número infinito de puntos.

Proposición 1.6. Sea I ⊆ ℝ. La aplicación EI ∶ P → P (I) que asocia a cadapolinomio p la función polinómica x ∈ I → p(x) ∈ ℝ es lineal y suprayectiva.Si I = {x0,… , xn} es un conjunto finito entonces

ker EI = !n(x)P = {!n+1p; p ∈ P }

es el ideal generado por !n+1(x) = (x−x0)⋯ (x−xn), el polinomio mónico dede grado n+1 que se anula en x0,… , xn. Si I es un conjunto infinito la apliciónEI es un isomorfismo.

Demostración. Claramente EI es lineal. Por definición, toda función polinómi-ca en I es la evaluación de un polinomio con coeficientes reales sobre los puntosde I , luego EI es una aplicación suprayectiva. Si I = {x0,… , xn} es un con-junto finito, entonces ker EI es el conjunto de polinomios tales que p(xi) = 0,i = 0,… , n. Por el Teorema del resto !n+1(x) = (x − x0)⋯ (x − xn) divide a Iy por tanto ker EI ⊆ !n+1P . Además si p = !n+1q entonces

p(xi) = !n+1(xi)q(xi) = 0, i = 0,… , n,

y se deduce que ker EI = !n+1P . Si I es un conjunto infinito y p ∈ ker I , p ≠ 0tomamos un subconjunto de puntos x0,… , xn de n + 1 puntos con n = grad p.Como p|I = 0, se deduce del Teorema del resto que !n+1 divide a p, luegograd p ≥ grad!n+1 = n + 1. Esta contradicción implica que el único elementode ker EI es el polinomio nulo y que EI es inyectiva.

El resultado anterior tiene una importante consecuencia. Si I es un conjuntoinfinito, la aplicación lineal EI◦E−1

ℝ que hace corresponder a todo polinomio dep ∈ P (ℝ) su restricción p|I a un conjunto I es un isomorfismo. Por tanto, todafunción polinómica definida en un conjunto I ⊂ ℝ infinito admite una únicaextensión a toda la recta real. Esta extensión es precisamente Eℝ◦E−1

I p.Otra interesante consecuencia útil para construir bases de espacios de poli-

nomios es que la independencia de funciones polinómicas se conserva al res-tringirlas a un dominio infinito. Esto no ocurre con otro tipo de funciones. Por

16

Page 17: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

ejemplo las funciones x y |x| son linealmente independientes en toda la rectareal, pero sus restricciones al intervalo [0,+∞) son linealmente dependientes.

Por definición de función polinómica todo polinomio en P (ℝ) está generadopor los monomios

m0(x) = 1, mk(x) = xk, k ≥ 1.

Veamos que los monomios son funciones independientes del espacio P (ℝ). Enefecto, si p(x) =

∑nk=0 akmk(x) es una combinación lineal finita de monomios

que coincide con la función nula, entonces

ak =p(k)(0)k!

= 0, k = 0,… , n.

Teniendo en cuenta el isomorfismo entre P (ℝ) y P (I) deducimos que los mo-nomios forman una base del espacio de las funciones polinómicas en cualquierdominio infinito.

Sea Pn el espacio de los polinomios de grado menor o igual que n (incluyen-do el polinomio nulo) con coeficientes reales y Pn(I) el espacio de funcionespolinómicas de grado menor o igual que n. Entonces tenemos que m0,… , mn esun sistema generador de Pn(I) definidas en el conjunto I . Si I es un conjuntoinfinito, entonces m0,… , mn también es linealmente independiente. Por tantom0,… , mn es una base de Pn(I) y dimPn(I) = n + 1.

Fórmula de LagrangeUn problema de interpolación puede resolverse mediante las funciones de

Lagrange (o soluciones fundamentales), caracterizadas por ser las únicas fun-ciones li(x) que valen 1 en el nodo xi y 0 en los nodos restantes, es decir talesque

li(xj) = �ij , i = 0, 1,… , n,siendo �ij el símbolo delta de Kronecker con valor 1 si i = j y valor nulo sii ≠ j.

Una vez determinadas las funciones de Lagrange, la llamada fórmula deLagrange proporciona una expresión del interpolante

p(x) =n∑

i=0yili(x). (Fórmula de Lagrange)

La deducción de una fórmula de Lagrange permite demostrar la existencia desolución del problema de interpolación considerado.

17

Page 18: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

-1

-0.5

0

0.5

1

1.5

0 1 2 3 4 5

Figura 1.3. Polinomios básicos de Lagrange de grado 5.

La fórmula de Lagrange del problema de interpolación polinómica fue pu-blicada por primera vez en 1779 por E. Waring y también propuesta por J. L.Lagrange 16 años más tarde.

Para deducir la fórmula de Lagrange polinómica, observemos que los poli-nomios fundamentales li ∈ Pn, i = 0,… , n, pueden determinarse a través delTeorema del resto. Como los nodos xj son raíces de li(x), j ≠ i, deducimos que

li(x) = �i∏

j∈{0,…,n}⧵{i}(x − xj),

siendo �i una constante que depende de los puntos x0,… , xn. De la condiciónli(xi) = 1, se deduce que

�i =1

j∈{0,…,n}⧵{i}(xi − xj),

obteniéndose la expresión explícita de los polinomios de Lagrange

li(x) =∏

j∈{0,…,n}⧵{i}

x − xjxi − xj

, i = 0,… , n.

La Figura 1.3 muestra la gráfica de los polinomios de Lagrange de grado5 en los nodos 0, 1, 2, 3, 4 y 5. Con un círculo están marcados los puntos por

18

Page 19: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

los que tienen que pasar las gráficas de estos polinomios de acuerdo con lascondiciones li(xj) = �ij .

La construcción anterior de los polinomios de Lagrange permite deducirla existencia de solución de cualquier problema de Lagrange en Pn como sedemuestra en el siguiente resultado.

Teorema 1.7. El problema de interpolación de Lagrange admite siempre unaúnica solución en Pn, el espacio de polinomios de grado menor o igual que n.Además la solución viene dada por la fórmula de Waring-Lagrange

p(x) =n∑

i=0yili(x), li(x) =

j∈{0,…,n}⧵{i}

x − xjxi − xj

, i = 0,… , n.

Demostración. Para demostrar la unicidad, supongamos que p1, p2 son dos so-luciones del problema. Entonces p1 − p2 se anula en x0,… , xn. Sea !n+1(x) =(x − x0)⋯ (x − xn). Del Teorema del resto, se deduce que

p2(x) − p1(x) = q(x)!n+1(x),

con grad(p2 − p1) ≤ n y grad!n+1 = n + 1. Se deduce que q = 0, y p1 = p2.Para la existencia, tengamos en cuenta que los polinomios de Lagrange veri-

fican li(xj) = �ij para todo i, j ∈ {0, 1,… , n}. Evaluando p(x) ∶=∑n

i=0 yili(x)en el nodo xj , obtenemos

p(xj) =n∑

i=0yili(xj) =

n∑

i=0yi�ij = yj , j = 0,… , n,

lo que demuestra que p ∈ Pn es el polinomio de interpolación.

Nota. Presuponer que los datos y0,… , yn provienen de una función no es ningu-na restricción, ya que podemos considerar el conjunto de datos como los valoresyi = f (xi) que toma una función f ∶ I → ℝ definida en el dominio discretoI ∶= {x0,… , xn}. Además, el hecho de que siempre exista un interpolante po-linómico, y por tanto, C∞(ℝ) nos permite suponer, sin pérdida de generalidad,que la función f que se ajusta a los datos está definida en un intervalo suficien-temente amplio y que es suficientemente suave para nuestros propósitos.

Denotaremos mediante P (f ; x0,… , xn) al polinomio de Pn que interpola ala función f en la sucesión de nodos x0,… , xn, es decir, P (f ; x0,… , xn) es elúnico polinomio que verifica

P (f ; x0,… , xn) ∈ Pn, P (f ; x0,… , xn)(xi) = f (xi), i = 0,… , n.

19

Page 20: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

La fórmula de Lagrange nos proporciona una expresión del interpolante en tér-minos de los valores f (xi), i = 0,… , n,

P (f ; x0,… , xn) =n∑

i=0f (xi)li(x).

Observemos que la unicidad del interpolante implica que, si f es un po-linomio de grado menor o igual que n, f debe ser su interpolante. Por tanto,tenemos

P (f ; x0,… , xn) = f, ∀f ∈ Pn,y expresando el interpolante mediante la fórmula de Lagrange se deduce que

n∑

i=0f (xi)li(x) = f (x), x ∈ ℝ, f ∈ Pn.

En particular, si aplicamos la fórmula anterior a la función constante f (x) = 1,tenemos

n∑

i=0li(x) = 1, (1.1)

es decir, los polinomios de Lagrange suman 1.

Fórmula baricéntricaSea

!n+1(x) ∶= (x − x0)⋯ (x − xn)el polinomio mónico de grado n+1 que se anula en x0,… , xn. Derivando !n+1en los nodos obtenemos

!′n+1(xi) =

j∈{0,…,n}⧵{i}(xi − xj) ≠ 0,

lo que permite expresar los polinomios de Lagrange en la forma

li(x) =!n+1(x)

!′n+1(xi)(x − xi)

, i = 0,… , n. (1.2)

Sustituyendo (1.2) en la fórmula de Lagrange y extrayendo el factor común!n+1(x), obtenemos la siguiente fórmula del interpolante

P (f ; x0,… , xn)(x) = !n+1(x)n∑

i=0

f (xi)!′n+1(xi)(x − xi)

. (1.3)

20

Page 21: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

La fórmula (1.3) recibe el nombre de primera fórmula baricéntrica, ya que es elpunto de partida para deducir la fórmula baricéntrica propiamente dicha, tam-bién llamada segunda fórmula baricéntrica. La primera fórmula baricéntrica seusa con frecuencia para economizar el número de operaciones necesarias paraevaluar el interpolante.

El cálculo de los coeficientes

!′n+1(xi) =

j∈{0,…,n}⧵{i}(xi − xj), i = 0,… , n,

es independiente del punto x en el que evaluamos. Para deducir fórmulas que nospermitan calcular por recurrencia !n+1(x) y los coeficientes !′

n+1(xi), definimoslos polinomios mónicos de grado k + 1 que se anulan en los nodos x0,… , xk

!k+1(x) ∶=k∏

i=0(x − xi), k = 0,… , n.

Estos polinomios pueden evaluarse por recurrencia en cualquier punto.

Algoritmo Cálculo de !k+1(x), k = 1,… , n.!0(x) ← 1!1(x) ← x − x0Para k = 1, 2,… , n

!k+1(x) ← (x − xk)!k(x)

El siguiente algoritmo propone calcular los coeficientes !′n+1(xi), obtenien-

do como resultados intermedios los valores !′k+1(xi), i = 0,… , k, para k =

1,… , n. Observamos que

!′k+1(xi) = (xi − xk)!k(xi), i = 0,… , k − 1,

propiedad que permite proponer el siguiente algoritmo.

Algoritmo Cálculo de !′k+1(xi), i = 0,… , k, k = 1,… , n.

!′1(x0) ← 1

Para k = 1, 2,… , nPara i = 0, 1,… , k − 1

!′k+1(xi) ← −(xk − xi)!′

k(xi)!′k+1(xk) ←

∏k−1j=0(xk − xj)

21

Page 22: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Analicemos el coste computacional de la primera fórmula baricéntrica. Ex-cluimos el cálculo de los f (xi), i = 0,… , n, ya que normalmente son datos delproblema. En el caso de que tengamos que evaluar f en los nodos, el númerode operaciones dependerá de la función f .

El cálculo de !′k+1(xi), i = 0,… , k−1, requiere k diferencias y k productos,

k = 1,… , n, y el de !′k+1(xk) = !k(xk) requiere también k diferencias y k − 1

productos. El número total de operaciones para calcular !′n+1(xi), i = 0,… , n,

es n(n+1) diferencias y n2 productos. En el algoritmo anterior hemos expresadoxi − xk en la forma −(xk − xi) con objeto de reducir a la mitad, n(n + 1)∕2, elnúmero de diferencias calculadas.

Si evaluamos en muchos puntos x, será conveniente tener previamente cal-culados los cocientes f (xi)∕!′

n+1(xi), lo que supone n+1 divisiones adicionales.Para cada punto x en el que evaluemos, debemos calcular n + 1 diferencias

x− xi, i = 0,… , n. Para el cálculo de !n+1(x) necesitamos además n productosy para el cálculo de la suma

n∑

i=0

f (xi)∕!′n+1(xi)

x − xi

necesitamos calcular n sumas y n + 1 divisiones adicionales. Necesitamos unamultiplicación final para obtener el producto de la suma anterior por !n+1(x).En resumen, para cada punto x de evaluación la fórmula utiliza en total 4n + 3operaciones: n sumas, n + 1 restas, n + 1 productos y n + 1 cocientes.

operación coste fijo coste por evaluación total

+ 0 n n

− 12n(n + 1) n + 1 1

2(n + 1)(n + 2)

× n2 n + 1 n2 + n + 1

∕ n + 1 n + 1 2n + 2

total 32n2 + 3

2n + 1 4n + 3 3

2n2 + 11

2n + 4

Coste computacional de la primera fórmula baricéntrica

Usando la primera fórmula baricéntrica conseguimos un notable ahorro porcada evaluación. Veamos el coste computacional de la aplicación directa de la

22

Page 23: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

fórmula de Waring-Lagrangen∑

i=0

f (xi)!′n+1(xi)

j∈{0,…,n}⧵{i}(x − xj).

De nuevo podemos considerar que los cocientes f (xi)∕!′n+1(xi) se han calculado

previamente. Si no seguimos una estrategia especial de cálculo que tenga encuenta los factores comunes en todos los productos

j∈{0,…,n}⧵{i}(x − xj), i = 0,… , n,

el número de productos que hay que calcular por cada evaluación se eleva a(n + 1)n, en lugar de las 2n + 2 operaciones de multiplicación y división en laprimera fórmula baricéntrica.

operación fórmula baricéntrica fórmula de Lagrange

+ n n

− n + 1 n + 1

× n + 1 n2 + n

∕ n + 1 0

total 4n + 3 n2 + 3n + 1

Comparación del coste extra por cada evaluaciónLa principal desventaja de la fórmula baricéntrica es la complejidad extra

que supone tener que considerar el caso excepcional en el que un denominadorse anula por coincidir el punto de evaluación con uno de los nodos.

Hemos visto en (1.1) que los polinomios de Lagrange suman 1. Sustituyendoli(x) por la expresión de la fórmula (1.2), obtenemos la relación

1 = !n+1(x)n∑

i=0

1!′n+1(xi)(x − xi)

, x ∈ ℝ.

Insertando la fórmula anterior en la fórmula primera fórmula baricéntrica (1.3),obtenemos la llamada segunda fórmula baricéntrica del polinomio de interpo-lación

P (f ; x0,… , xn)(x) =∑n

i=0wi(x)f (xi)∑n

i=0wi(x),

23

Page 24: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

dondewi(x) ∶=

1!′n+1(xi)(x − xi)

, i = 0,… , n.

Interpretación afín de la fórmula baricéntricaEl nombre de fórmula baricéntrica proviene de la similitud formal entre la

segunda fórmula baricéntrica y la que expresa la posición del centro de gravedadG de varios pesos w0,… , wn, situados en puntos X0,… , Xn,

G = 1∑n

i=0wi

n∑

i=0wiXi.

Para poder interpretar la fórmula baricéntrica cuando x coincide con uno delos nodos, tenemos que extender la definición de baricentro al caso de pesosinfinitos. Si el peso wi es infinito y los demás son finitos, consideramos que elbaricentro está bien definido y se encuentra en el punto Xi.

La terminología tradicional relaciona la fórmula de Lagrange con la posiciónde un centro de gravedad o centro de masas. Sin embargo, las funciones wi(x)tienen signo opuesto a cada lado del nodo xi. Por tanto, no podemos considerarque la fórmula baricéntrica describa un baricentro propiamente dicho para todox (los pesos deben ser no negativos). Desde un punto de vista físico, sería másapropiado establecer la comparación con un centro de cargas eléctricas, ya quelas cargas eléctricas pueden ser positivas o negativas.

Si n ≥ 1, la función f (x) = x coincide con su propio polinomio de interpo-lación y, usando la fórmula baricéntrica, deducimos

x =∑n

i=0wi(x)xi∑n

i=0wi(x).

Combinando la relación anterior con la fórmula baricéntrica obtenemos

x

p(x)

= 1∑n

i=0wi(x)

n∑

i=0wi(x)

xif (xi)

,

es decir, cada punto (x, p(x)) de la gráfica del polinomio de interpolación p(x) =P (f ; x0,… , xn)(x) es un baricentro de los puntos del plano (xi, f (xi)), en losque hemos situado un peso (tal vez negativo o infinito) wi(x), i = 0,… , n, quedepende del punto x.

24

Page 25: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Coordenadas baricéntricasPara que el centro de gravedad de dos pesos w0 y w1 situados en x0, x1 sea

exactamente x ∈ (x0, x1), debe verificarse

w0x0 +w1x1w0 +w1

= x,

de donde se deduce que es necesario colocar en cada extremo pesos inversa-mente proporcionales a las distancias de x a cada extremo

(x − x0)w0 = (x1 − x)w1

El centro de gravedad no cambia si cambiamos los pesos manteniendo su pro-porción relativa. Imponiendo la condición de normalización

w0 +w1 = 1,

obtenemosw0 =

x1 − xx1 − x0

, w1 =x − x0x1 − x0

,

de modo quew0x0 +w1x1 = x.

Los pesos normalizados w0 y w1 son las llamadas coordenadas baricéntricasdel punto x en el segmento [x0, x1]

�0(x; x0, x1) ∶=x1 − xx1 − x0

, �1(x; x0, x1) ∶=x − x0x1 − x0

Las coordenadas baricéntricas son razones simples y, por tanto, invariantesafines. Por ello, la introducción de coordenadas baricéntricas se utiliza con fre-cuencia para analizar cómo se transforman determinadas fórmulas al realizar uncambio afín para y deducir una fórmula análoga en otro intervalo.

La gráfica del segmento que une (x0, f (x0)) con (x1, f (x1))

�0(x; x0, x1)⎛

x0f (x0)

+ �1(x; x0, x1)⎛

x1f (x1)

, x ∈ (x0, x1),

puede verse como el conjunto de todos los posibles centros de gravedad cuan-do situamos en (x0, f (x0)) y en (x1, f (x1)) pesos cualesquiera. Como la gráfica

25

Page 26: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

(x, P (f ; x0, x1)(x)) del polinomio de interpolación es una línea recta, conclui-mos que

P (f ; x0, x1)(x) = �0(x; x0, x1)f (x0) + �1(x; x0, x1)f (x1).

Una simple comparación con la fórmula de Lagrange, permite deducir que

l0(x) = �0(x; x0, x1) =x1 − xx1 − x0

, l1(x) = �1(x; x0, x1) =x − x0x1 − x0

.

Por lo tanto, las funciones de Lagrange de grado uno coinciden con las coorde-nadas baricéntricas, es decir, son los pesos normalizados que hay que colocaren x0, x1, respectivamente para que el baricentro se encuentre en x ∈ (x0, x1).

El determinante de VandermondeRecordemos que la matriz de Vandermonde es la matriz de colocación del

problema de interpolación de Lagrange polinómica, cuando expresamos un po-linomio respecto a la base de monomios

V (x0,… , xn) =

1 x0 ⋯ xn01 x1 ⋯ xn1⋮ ⋮ ⋱ ⋮

1 xn ⋯ xnn

.

Puesto que la existencia y unicidad de interpolante p(x) =∑n

i=0 cixi con condi-

ciones de Lagrange p(xi) = yi, i = 0,… , n, equivale a la existencia y unicidadde solución del sistema lineal

V (x0,… , xn)

c0⋮

cn

=

y0⋮

yn

,

el Teorema 1.7 implica que det V (x0,… , xn) ≠ 0, cuando los puntos son dis-tintos.

El valor del determinante de Vandermonde tiene cierto interés en teoría deinterpolación por lo que vamos a indicar cómo se calcula. En primer lugar, ob-servemos que si desarrollamos det V (x0,… , xn−1, x) por la última fila, deduci-mos que para x0,… , xn−1 fijos, la función

q(x) ∶= det V (x0,… , xn−1, x), x ∈ ℝ

26

Page 27: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

es un polinomio en la variable x de grado menor o igual que n cuyo coeficienteen xn es det V (x0,… , xn−1).

Supongamos primero que x0,… xn−1 son distintos. Si x = xi, la matrizV (x0,… , xn−1, x) tiene dos filas iguales y

q(xi) = 0, i = 0,… , n − 1.

Por el Teorema del resto, el polinomio !n(x) = (x − x0)⋯ (x − xn−1) divide aq(x), y se deduce la relación

det V (x0,… , xn−1, x) = det V (x0,… , xn−1)!n(x).

La relación anterior es válida aunque tengamos coincidencias entre los nodosx0,… , xn−1, lo que permite demostrar por inducción

det V (x0,… , xn−1, xn) = !1(x1)⋯!n(xn) =n

i=1

i−1∏

j=0(xi − xj).

Las funciones básicas de Lagrange admiten la siguiente representación entérminos de determinantes de Vandermonde

li(x) =det V (x0,… , xi−1, x, xi+1,… , xn−1, xn)

det V (x0,… , xn).

En efecto, el miembro de la derecha de la igualdad anterior es un polinomiode grado menor o igual que n, como se evidencia al desarrollar el determinan-te del numerador por la columna que contiene las potencias de x. Claramenteli(xi) = 1 porque, al sustituir x por xi coinciden numerador y denominador, ysi i ≠ j tenemos filas repetidas en el numerador por lo que el valor es nulo.De la unicidad del polinomio de interpolación deducimos que el miembro de laderecha debe ser el i-ésimo polinomio de Lagrange.

Interpolación por recurrenciaEl la década de los años 30 del siglo XX, Alexander Craig Aitken y Eric

Harold Neville obtuvieron relaciones de recurrencia que permitían expresar elpolinomio de interpolación en un conjunto de nodos en términos de polinomiosde interpolación que usan un nodo menos.

Teorema 1.8 (Fórmula de Aitken-Neville).

P (f ; x0, x1,… , xn−1, xn)(x)

=xn − xxn − x0

P (f ; x0, x1,… , xn−1)(x) +x − x0xn − x0

P (f ; x1,… , xn−1, xn)(x).

27

Page 28: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Demostración. Sea

p(x) ∶=xn − xxn − x0

P (f ; x0,… , xn−1)(x) +x − x0xn − x0

P (f ; x1,… , xn)(x)

Claramente p es un polinomio de grado menor o igual que n. Sustituyendo x porx0 y xn , vemos que

p(x0) = P (f ; x0,… , xn−1)(x0) = f (x0),p(xn) = P (f ; x1,… , xn)(xn) = f (xn).

Tomando ahora x = xi con 0 < i < n obtenemos

p(xi) =xn − xixn − x0

P (f ; x0,… , xn−1)(xi) +xi − x0xn − x0

P (f ; x1,… , xn)(xi).

En este caso

P (f ; x0,… , xn−1)(xi) = P (f ; x1,… , xn)(xi) = f (xi),

ya que xi pertenece a ambos conjuntos de nodos {x0,… , xn−1} y {x1,… , xn} ydeducimos que

p(xi) =xn − xixn − x0

f (xi) +xi − x0xn − x0

f (xi) = f (xi), 0 < i < n.

Por tanto, p(x) interpola a la función f en x0,… , xn. De la unicidad del polino-mio de interpolación deducimos que p = P (f ; x0,… , xn).

La fórmula de Aitken-Neville permite construir y evaluar el polinomio deinterpolación por recurrencia. Hay varias formas de expresar estas recurrenciaspartiendo desde los datos iniciales considerando las constantes como polino-mios de interpolación de grado cero y construyendo interpolantes de grado cadavez mayor basados en subconjuntos de los nodos. Presentamos en primer lugarel algoritmo de Neville que construye los polinomios de interpolación pi,k ennodos con índices consecutivos: xi, xi+1,… , xi+k.

Algoritmo de NevillePara i = 0,… , n

pi,0(x) ← f (xi)Para k = 1,… , n

Para i = 0,… , n − kpi,k(x) ←

xi+k − xxi+k − xi

pi,k−1(x) +x − xi

xi+k − xipi+1,k−1(x)

28

Page 29: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

x0 x1x

(x0,y0)

x2

(x1,y1)

(x2,y2)

(x0,p01(x))

(x2,p11(x))

(x,p01(x))

(x,p11(x))

(x,p02(x))

Figura 1.4. Interpretación gráfica del algoritmo de Neville.

En el algoritmo de Neville obtenemos los interpolantes

pi,k ∶= P (f ; xi,… , xi+k), i = 0,… , n − k, k = 1,… , n.

El polinomio p0,n(x) calculado en el último paso del algoritmo es el polinomiode interpolación en todos los nodos x0,… , xn.

El valor de pi,k(x) en cada paso del algoritmo puede interpretarse como elvalor en x del polinomio de interpolación de grado 1 que en xi toma el va-lor pi,k−1(x) y en xi+k toma el valor pi+1,k−1. Como la gráfica del polinomiode interpolación de grado 1 es la gráfica de la recta que pasa por los puntos(xi, pi,k−1(x)) y (xi+k, pi+1,k−1), podemos construir el valor del polinomio de in-terpolación gráficamente mediante el trazado de varias líneas rectas como semuestra en la Figura 1.4.

Otra estrategia que conduce al cálculo del interpolante se debe a Aitken. Enesta recurrencia se construyen los polinomios de interpolación qi,k con nodosiniciales excepto el último: x0,… , xk−1, xi.

qi,k ∶= P (f ; x0,… , xk−1, xi), i = k,… , n, k = 1,… , n.

obteniéndose como resultado final el interpolante de grado n en todos los nodosqn,n.

29

Page 30: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Algoritmo de AitkenPara i = 0,… , n

qi,0(x) ← f (xi)Para k = 1,… , n

Para i = k,… , nqi,k(x) ←

xi − xxi − xk−1

qk−1,k−1(x) +x − xi

xi − xk−1qi,k−1(x)

Ejemplo. Tomando los nodos x0 = −2, x1 = −1, x2 = 0, x3 = 1 y f (x) = 2x

deseamos calcular una aproximación a√

2 ≈ 1.41421356237 mediante inter-polación cúbica utilizando el algoritmo de Neville. Sea

pi,k ∶= P (f ; xi,… , xi+k), i = 0,… , 3 − k, k = 0,… , 3.

Como√

2 = f (1∕2), la aproximación buscada será el valor de p0,3(1∕2). Par-tiendo de los valores

p0,0 = 1∕4, p1,0 = 1∕2, p2,0 = 1, p3,0 = 2,

calculamos para k = 1

p0,1(1∕2) =−32p0,0 +

52p1,0 =

78,

p1,1(1∕2) =−12p1,0 +

32p2,0 =

54,

p2,1(1∕2) =12p2,0 +

12p3,0 =

32.

Tomamos k = 2, y utilizando los valores obtenidos en el paso anterior, obtene-mos

p0,2(1∕2) =−14p0,1(1∕2) +

54p1,1(1∕2) =

4332

,

p1,2(1∕2) =14p1,1(1∕2) +

34p2,1(1∕2) =

2316

.

Finalmente, para k = 3 tenemos

p0,3(1∕2) =16p0,1(1∕2) +

56p1,1(1∕2) =

9164

.

y 91∕64 = 1.421875 es la aproximación buscada.

30

Page 31: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Podemos expresar de forma resumida los pasos del algoritmo mediante elesquema

xi pi,0 pi,1(12) pi,2(

12) pi,3(

12)

−2 14

×−32→

78

×−14→

4332

×16→

9164

×52↗ ×5

4↗ ×5

6↗

−1 12

×−12→

54

×14→

2316

×32↗ ×3

4↗

0 1 ×12→

32

×12↗

1 2

y presentar los resultados en la siguiente tabla

xi pi,0 pi,1(12) pi,2(

12) pi,3(

12)

−2 14

78

4332

9164

−1 12

54

2316

0 1 32

1 2

Los cálculos intermedios del algoritmo de Aitken son diferentes. Definimosqi,k ∶= P (f ; x0,… , xk−1, xi), para i = k,… , 3, k = 1,… , 3, y, partiendo de losdatos iniciales,

q0,0 = 1∕4, q1,0 = 1∕2, q2,0 = 1, q3,0 = 2,

tenemos para k = 1

q1,1(1∕2) =−32q0,0 +

52q1,0 =

78,

q2,1(1∕2) =−14q0,0 +

54q2,0 =

1916

,

q3,1(1∕2) =16q0,0 +

56q3,0 =

4124

,

31

Page 32: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

para k = 2q2,2(1∕2) =

−12q1,1(1∕2) +

32q2,1(1∕2) =

4332

,

q3,2(1∕2) =16q1,1(1∕2) +

56q3,1(1∕2) =

32,

y, para k = 3q3,3(1∕2) =

12q2,2(1∕2) +

12q3,2(1∕2) =

9164

.

Los cálculos se muestran abreviadamente en la siguiente tabla

xi qi,0 qi,1(12) qi,2(

12) qi,3(

12)

−2 14

−1 12

78

0 1 1916

4332

1 2 4124

32

9164

Diferencias divididas y fórmula de NewtonLa diferencia dividida en dos puntos

[x0, x1]f =f (x1) − f (x0)

x1 − x0

es la pendiente de la recta secante que pasa por los puntos (xi, f (xi)), i = 0, 1.En los cálculos de interpolantes de mayor grado aparecen nuevas diferenciasdivididas de diferencias divididas. Este hecho ya fue observado por Isaac New-ton en su tratado Methodus Differentialis, publicado en 1711. Según revela lacorrespondencia epistolar de Isaac Newton, Methodus Differentialis se redactó,al menos, once años antes de la publicación en 1687 de la primera edición dePhilosophiae naturalis principia mathematica. En el Lema V del Libro III delos Philosophiae naturalis principia mathematica, Newton muestra cómo en-contrar una curva parabólica que pase por puntos dados cualesquiera. En laterminología de Newton, una curva parabólica es la generalización de una pa-rábola en el sentido de que incluimos las gráficas de un funciones polinómicascualesquiera y no solamente cuadráticas.

Mostramos a continuación una definición de la diferencia dividida inspiradaen el método propuesto por Newton para el cálculo de polinomio de interpola-ción. Esta definición por recurrencia tiene el inconveniente de que la diferencia

32

Page 33: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

dividida también puede obtenerse a partir de otras relaciones de recurrencia. Enel capítulo siguiente utilizaremos la definición propuesta por G. Kowalewski en1932, que evita la delicada cuestión de demostrar que la diferencia dividida estábien definida.

Definición. La diferencia dividida [x0,… , xn]f de f en la sucesión de puntosdistintos x0,… , xn se define para n = 0 mediante

[x0]f ∶= f (x0),

y para n > 0 mediante la relación recurrencia

[x0, x1,… , xn−1, xn]f ∶=[x1,… , xn−1, xn]f − [x0, x1,… , xn−1]f

xn − x0.

El orden de una diferencia dividida es n, si está basada en una sucesión de n+1puntos.

Proposición 1.9. (a) [x0,… , xn]f es el coeficiente en xn de P (f ; x0,… , xn).(b) El valor de la diferencia dividida es independiente del orden de los argu-

mentos.(c)

[x0,… , xn]f =n∑

i=0

f (xi)∏

j∈{0,…,n}⧵{i}(xi − xj). (1.4)

Demostración. (a) se deduce por inducción sobre n de la fórmula de Aitken-Neville, (b) es consecuencia de la unicidad del polinomio de interpolación, in-dependientemente del orden en que se presenten los datos, (c) se obtiene al tomarel coeficiente de mayor grado en la fórmula de interpolación de Lagrange.

Una consecuencia de que el valor de una diferencia dividida sea indepen-diente del orden de los argumentos es que la recurrencia que define la diferenciadividida, puede expresarse equivalentemente en la forma

[x0,… , xn−1, xn]f =[x0,… , xn−2, xn]f − [x0,… , xn−2, xn−1]f

xn − xn−1,

es decir,

[x0,… , xn−1, xn]f = [xn−1, xn]g, con g(x) ∶= [x0,… , xn−2, x]f.

Por tanto, una diferencia dividida de orden n puede verse como una diferen-cia dividida de primer orden de una diferencia dividida de orden n − 1 con unargumento variable.

33

Page 34: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

En el método de interpolación propuesto por Newton está presente la ideade que las diferencias divididas permiten reducir el grado del problema de in-terpolación. El método de Newton permite determinar el polinomio de inter-polación mediante una igualdad entre diferencias divididas de orden n. Seap = P (f ; x0,… , xn) el polinomio de interpolación de una función f en losnodos x0,… , xn. Partiendo de q0(x) ∶= p(x), construimos

q1(x) ∶= [x0, x]q0 =p(x) − f (x0)

x − x0Como p(x)−f (x0) es un polinomio de grado n que se anula en x = x0, se deducedel Teorema del resto que p(x) − f (x0) es divisible para x − x0. Por tanto q1 esun polinomio de grado menor o igual que n − 1. Podemos determinar q1 comola solución de un único problema de interpolación cuyos datos son

q1(xi) = yi,1, i = 1,… , n,

dondeyi,1 ∶= [x0, xi]f =

f (xi) − f (x0)xi − x0

, i = 1,… , n.

Esta idea puede aplicarse a su vez a q1. Definiendo

q2(x) ∶= [x1, x]q1 =q1(x) − q1(x1)

x − x1,

se tiene que q2 es un polinomio de grado n − 2 solución del problema de inter-polación

q2(xi) = yi,2, i = 2,… , n,donde

yi,2 ∶=yi,1 − y1,1xi − x1

=[x0, xi]f − [x0, x1]f

xi − x1= [x0, x1, xi]f, i = 2,… , n,

puede calcularse en términos de los valores yi,1, obtenidos en el paso anterior.Si ahora suponemos calculado el polinomio qk, k < n, de grado n − k,

podemos definir el polinomio

qk+1(x) ∶= [xk, x]qk =qk(x) − qk(xk)

x − xk.

Podemos identificar qk+1 con la única solución en Pn−k−1 del problema de inter-polación de Lagrange

qk+1(xi) = yi,k+1, i = k + 1,… , n,

34

Page 35: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

donde

yi,k+1 ∶=yi,k − yk,kxi − xk

= [x0,… , xk, xi]f, i = k + 1,… , n.

Tras n pasos, se obtiene un polinomio qn constante

qn = yn,n = [x0, x1,… , xn]f.

Para obtener una fórmula explícita del interpolante, tengamos en cuenta que lospolinomios qk pueden obtenerse sucesivamente mediante

qk(x) = yk,k + (x − xk)qk+1(x), k = n − 1,… , 1, 0,

de modo que p = q0 puede expresarse mediante la fórmula

p(x) = y0,0 + y1,1(x − x0) +⋯ + yn,n(x − x0)⋯ (x − xn−1),

donde y0,0 ∶= f (x0).La fórmula anterior recibe el nombre de fórmula de Newton. Presentamos

a continuación una demostración de dicha fórmula. La idea de la demostraciónconsiste en identificar el término que hay que añadir a un interpolante de gradon − 1 en una sucesión de nodos para obtener un interpolante de grado n en lasucesión obtenida al añadir un nuevo nodo.

Proposición 1.10 (Fórmula de Newton).

P (f ; x0,… , xn)(x) = [x0]f + [x0, x1]f (x − x0)+⋯ + [x0,… , xn]f (x − x0)⋯ (x − xn−1).

Demostración. El caso n = 0 es trivial. Para el caso general, notemos que

r(x) ∶= P (f ; x0,… , xn−1, xn)(x) − P (f ; x0,… , xn−1)(x)

es un polinomio de grado menor o igual que n que se anula en x0,… , xn−1. Portanto

r(x) = a(x − x0)⋯ (x − xn−1),siendo a el coeficiente en xn del polinomio r(x), que coincide con el coefi-ciente en xn de P (f ; x0,… , xn). Por la Proposición ?? (a), tenemos que a =[x0,… , xn]f , de donde se deduce la fórmula

P (f ; x0,… , xn−1, xn)(x) = P (f ; x0,… , xn−1)(x)+ [x0,… , xn]f (x − x0)⋯ (x − xn−1),

que permite demostrar la fórmula de Newton por inducción.

35

Page 36: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Si definimos !0(x) = 1, y

!k(x) ∶= (x − x0)⋯ (x − xk−1), k ≥ 1,

la fórmula de Newton admite la expresión

P (f ; x0,… , xn) =n∑

k=0[x0,… , xk]f ⋅ !k.

Cálculo de las diferencias divididasEl siguiente algoritmo permite calcular la tabla de valores de diferencias

divididas en nodos con índices consecutivos

di,k ∶= [xi,… , xi+k]f, i = 0,… , n − k, k = 0,… , n,

utilizando las relaciones de recurrencia entre diferencias divididas

[xi,… , xi+k]f =[xi+1,… , xi+k]f − [xi,… , xi+k−1]f

xi+k − xi,

para i = 0,… , n − k y k = 1,… , n.

Algoritmo Cálculo de la tabla de diferencias divididas.Para i = 0,… , n

di,0(x) ← f (xi)Para k = 1,… , n

Para i = 0,… , n − kdi,k(x) ← (di+1,k−1 − di,k−1)∕(xi+k − xi)

Observemos que el número de operaciones requeridas para calcular la tablade diferencias divididas es n(n+ 1) diferencias y n(n+ 1)∕2 cocientes. En total3n(n + 1)∕2 operaciones, muy similar al coste computacional 1 + 3n(n + 1)∕2necesario para calcular los cocientes f (xi)∕!′

n+1(xi), i = 0,… , n, que aparecenen la fórmula de Lagrange.

La sucesión de valores d0,k son precisamente los coeficientes de las funcio-nes !k en la fórmula de Newton. Una alternativa al algoritmo anterior consisteen utilizar la fórmula (1.4). En primer lugar aplicamos el algoritmo que usala recurrencia !′

k+1(xi) = (xi − xk)!k(xi), i < k, para obtener los valores de!′k+1(xi), i = 0,… , k, k = 1,… , n, y luego calculamos

d0,k ∶=k∑

i=0

f (xi)!′k+1(xi)

, k = 1,… , n.

36

Page 37: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

En este caso, el coste computacional es algo superior: n(n + 1)∕2 diferenciasy n2 productos para obtener los !′

k+1(xi) y (n + 1)(n + 2)∕2 − 1 divisiones yn(n + 1)∕2 sumas para obtener los d0,k, k = 0,… , n. En total, 5n(n + 1)∕2operaciones aritméticas.

Evaluación de la fórmula de NewtonUna vez calculadas las diferencias divididas

d0,k ∶= [x0,… , xk]f, k = 0,… , n,

la evaluación del polinomio puede efectuarse cómodamente. Para cada x, po-demos calcular sucesivamente los valores de !k(x), k = 0,… , n, usando larecurrencia

!k+1(x) = (x − xk)!k(x)

y obtener el valor del interpolante p(x) sumando los n+1 términos∑n

i=0 d0,k!k(x).La fórmula de Newton, al igual que la expresión de un polinomio en térmi-

nos de los monomios admite una expresión anidada

d0,0 + (x − x0)(

d0,1 +⋯ + (x − xn−2)(d0,n−1 + (x − xn−1)d0,n)⋯)

.

lo que permite evaluar el interpolante mediante un algoritmo análogo al algo-ritmo de Horner

Algoritmo Evaluación de la fórmula de Newtoncn ← d0,nPara k = n − 1,… , 1, 0

ck ← d0,k + (x − xk)ck+1

El valor de cn−1 es el del paréntesis más interno, el paréntesis que lo contienees cn−2, y así sucesivamente. El paréntesis exterior es c1 y c0 es el valor delinterpolante en x.

El número de operaciones es algo superior al algoritmo de Horner: n di-ferencias, n productos y n sumas. En total, el coste se eleva a 3n operaciones.Este mayor número de operaciones se debe a que es necesario evaluar todas lasdiferencias x − xk, k = 0,… , n − 1.

Veamos por inducción que los cálculos intermedios del algoritmo anteriorson diferencias divididas que incluyen el punto de evaluación,

ck = [x0,… , xk−1, x]p, k = 0,… , n.

37

Page 38: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

En primer lugar, para k = n, sabemos que [x0,… , xn−1, x]p es el coeficiente enxn del polinomio de interpolación, que coincide con cn = d0,n = [x0,… , xn]f .Suponiendo que [x0,… , xk, x]p = ck+1, tenemos

[x0,… , xk−1, x]p = [x0,… , xk−1, xk]p + (x − xk)[x0,… , xk, x]p= dk,0 + (x − xk)ck+1 = ck.

Por tanto, los cálculos intermedios para la evaluación pueden anotarse en la tablade diferencias divididas como una fila adicional correspondiente a la adición delnodo extra x.

Introducción de nuevos datosLa fórmula

P (f ; x0,… , xn)(x) = P (f ; x0,… , xn−1)(x)+[x0,… , xn]f (x−x0)⋯ (x−xn−1)

permite añadir nuevos datos y corregir el interpolante. Supongamos que nos handado los valores de la función f en los puntos x0,… , xn−1 y hemos construidoel polinomio de interpolación P (f ; x0,… , xn−1). Si se ofrece un nuevo dato,f (xn), no es necesario rehacer de nuevo los cálculos para obtener una nuevafórmula del interpolante. La fórmula nos indica precisamente el término de co-rrección que hay que añadir al interpolante antiguo para obtener el interpolanteen un punto más. Además para el cálculo del coeficiente d0,n = [x0,… , xn]fno es necesario calcular de nuevo toda la tabla de diferencias divididas di,k =[xi,… , xi+k]f , i = 0,… , n − k, k = 0,… , n. La tabla anteriormente calcu-lada di,k, i = 0,… , n − k, k = 0,… , n − 1, es una subtabla de la tabla quepretendemos construir y los valores que faltan se obtienen mediante

dn,0 ∶= f (xn), dn−k,k ∶=dn−k+1,k−1 − dn−k,k−1

xn − xn−k, k = 1,… , n.

Ordenación de los nodosUna reordenación de los nodos en la fórmula de Newton da lugar a diferentes

expresiones del interpolante. Para cada permutación

� ∶ {0, 1,… , n} → {0, 1,… , n}

tenemos diferentes fórmulas de Newton del mismo interpolante

P (f ; x0,… , xn)(x) =n∑

k=0[x�(0),… , x�(k)]f (x − x�(0))⋯ (x − x�(k−1))

38

Page 39: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

que implican modos diferentes de organizar los cálculos.Si ordenamos los nodos de menor a mayor x0 < x1 < ⋯ < xn tenemos la

llamada fórmula de Newton progresiva

P (f ; x0,… , xn)(x) =n∑

k=0[x0,… , xk]f (x − x0)⋯ (x − xk−1).

La fórmula de Newton regresiva se obtiene al invertir el orden de los nodosx0 < x1 < ⋯ < xn, mediante la permutación �(i) = n − i, i = 0,… , n,

P (f ; x0,… , xn)(x) =n∑

k=0[xn−k,… , xn]f (x − xn)⋯ (x − xn−k+1).

La evaluación de las fórmulas de Newton puede amplificar los errores de redon-deo considerablemente. Como norma general las fórmulas progresivas son másestables en los puntos del intervalo próximos a x0 y manifiestan su mayor ines-tabilidad en puntos del intervalo alejados de x0. Las fórmulas regresivas tienenun comportamiento opuesto y son más estables en un entorno de xn mientrasque su mayor inestabilidad se produce en puntos del intervalo lejos de xn.

Una ordenación que produce buenos resultados es el llamado orden de Leja.Esta ordenación hace grandes los denominadores de las fórmulas de diferenciasdivididas y controla el tamaño de las funciones de la base de Newton en lasucesión ordenada de nodos x�(0),… , x�(n)

!k(x) = (x − x�(0))⋯ (x − x�(k−1)), k = 0,… , n,

evitando que su crecimiento sea demasiado rápido, factores que inciden en laestabilidad de la fórmula de Newton.Orden de Leja. Sea X = {x0,… , xn} un conjunto finito de nodos, x0,… , xndistintos.

Inicialmente se elige �(0) ∈ {0,… , n} cualquiera. Con objeto de maxi-mizar |x�(1) − x�(0)| en el segundo paso, debe elegirse como primer nodox�(0) de la ordenación, el mínimo o el máximo de los puntos del conjuntoX.En el segundo paso se elige �(1) ∈ {0,… , n} ⧵ {�(0)} tal que

|x�(1) − x�(0)| = maxi∈{0,…,n}⧵{�(0)}

|xi − x�(0)|.

El segundo punto x�(1) es el otro extremo (máximo o mínimo) del conjuntoX.

39

Page 40: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

El el paso k-ésimo se selecciona

�(k) ∈ {0,… , n} ⧵ {�(0),… , �(k − 1)}

tal que

k−1∏

j=0|x�(k) − x�(j)| = max

i∈{0,…,n}⧵{�(0),…,�(k−1)}

k−1∏

j=0|xi − x�(j)|.

El orden de Leja no es único, ya que el mayor producto de distancias puedealcanzarse en varios nodos. Un posible criterio para seleccionar los puntos eselegir en cada caso el menor (o el mayor) de los puntos posibles en cada paso.

Ejemplo. Sea p(x) el polinomio de interpolación de f (x) = 2x en x0 = −2,x1 = −1, x2 = 0, x3 = 1. Podemos calcular por recurrencia las diferenciasdivididas obteniendo la siguiente tabla de diferencias divididas de la función f .

xi di,0 di,1 di,2 di,3−2 1

41∕2−1∕4(−1)−(−2)

= 14

1∕2−1∕40−(−2)

= 18

1∕4−1∕81−(−2)

= 124

−1 12

1−1∕20−(−1)

= 12

1−1∕21−(−1)

= 14

0 1 2−11−0

= 1

1 2

La fórmula de Newton del interpolante es

p(x) = 14+ 14(x + 2) + 1

8(x + 2)(x + 1) + 1

24(x + 2)(x + 1)x.

Para evaluar el interpolante en x = 1∕2 podemos sustituir directamente en lafórmula de Newton

p(12

)

= 14+ 14× 52+ 18× 15

4+ 124

× 158

= 9164

= 1.421875.

También se puede utilizar el algoritmo tipo Horner descrito anteriormente

c2 =18+ 124

× 12= 7

48, c1 =

14+ 748

× 32= 15

32, c0 =

14+ 1532

× 52= 91

64.

Los cálculos pueden disponerse en la forma de una tabla de Ruffini. Hemosinsertado una fila adicional para expresar los factores 1∕2 − xk, k = 2, 1, 0, que

40

Page 41: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

intervienen en el cálculo.

124

18

14

14

12

148

732

7564

×12

×32

×52

124

748

1532

9164

El resultado del algoritmo también puede representarse mediante una fila adi-cional en la tabla de diferencias divididas de p.

12

9164

1532

748

124

0

−2 14

14

18

124

−1 12

12

14

0 1 1

1 2

La tabla de diferencias divididas con los nodos ordenados de mayor a menorcontiene las mismas diferencias divididas que la tabla con los nodos ordenadosde menor a mayor, pero dispuestas en otro orden. Por tanto, para obtener la fór-mula regresiva de Newton no es necesario construir una nueva tabla. Basándo-nos en la tabla con los nodos ordenados de menor a mayor, la fórmula regresivapuede obtenerse considerando el último elemento de cada columna

p(x) = 2 + (x − 1) + 14(x − 1)x + 1

24(x − 1)x(x + 1)

y los cálculos del algoritmo de tipo Horner pueden representarse añadiendo unelemento al final de cada columna de la tabla de diferencias divididas

−2 14

14

18

124

0

−1 12

12

14

124

0 1 1 516

1 2 3732

12

9164

41

Page 42: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Si tomamos los nodos ordenados según el orden de Leja: −2, 1,−1, 0, hay querealizar nuevos cálculos para obtener la nueva tabla

12

9164

1532

1148

124

0

−2 14

712

16

124

1 2 34

14

−1 12

12

0 1

correspondiente a la fórmula

p(x) = 14+ 712

(x + 2) + 16(x + 2)(x − 1) + 1

24(x + 2)(x − 1)(x + 1).

La fila superior de la tabla describe los cálculos intermedios en la evaluacióndel polinomio en x = 1∕2.

Funcionales y bases dualesDefinición. Un funcional es una aplicación que asigna a cada función de unespacio de funciones F un valor. Decimos que el funcional es lineal si la apli-cación que define es una forma lineal o aplicación lineal de F en ℝ.

El espacio dual de un espacio de funciones F es el espacio F ′ de los fun-cionales lineales definidos en el conjunto F .

Definición. Sean f0,… , fn funciones de un espacio F y sean�0,… , �n funcionales lineales de F ′. Decimos que (f0,… , fn) y (�0,… , �n)forman un par dual si se verifica

�i(fj) = �ij , i, j = 0,… , n.

Proposición 1.11. Sean f0,… , fn funciones de un espacio F y sean�0,… , �n funcionales lineales de F ′ de modo que (f0,… , fn) y (�0,… , �n)forman un par dual. Entonces f0,… , fn ∈ F son funciones linealmente inde-pendientes y �0,… , �n son funcionales linealmente independientes de F ′.

Demostración. Supongamos que∑n

j=0 cjfj = 0 para c0,… , cn ∈ ℝ. Entonces

ci = �i(n∑

j=0cjfj) = 0, i = 0,… , n.

42

Page 43: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Por tanto f0,… , fn son funciones linealmente independientes. Análogamentesi∑n

i=0 ci�i = 0 para ciertos c0,… , cn ∈ ℝ, tendremos que

cj = (n∑

i=0ci�i)fj = 0, j = 0,… , n

de donde se sigue la independencia de los funcionales �0,… , �n.

Sea I un intervalo que contiene a todos los nodos x0,… , xn. La evaluaciónen cada nodo

�i ∶ f ∈ C(I) → f (xi) ∈ ℝforma un conjunto de funcionales lineales, definidos en el espacio de las fun-ciones continuas C(I). Los funcionales lineales �0,… , �n generan un espaciovectorial

L ∶= ⟨�0,… , �n⟩

contenido en el espacio dual de las funciones continuas.La existencia de polinomios de Lagrange l0,… , ln tales que

�ilj = �ij ,

nos indica que (l0,… , ln) y (�0,… , �n) forman un par dual. Teniendo en cuentaque dimPn = n + 1, se deduce de la Proposición ?? que (l0,… , ln) es una basede Pn dual de la base de funcionales (�0,… , �n) de L y que dimL = n + 1.

La diferencia dividida en los nodos x0,… , xn es un funcional

[x0,… , xn] ∶ f ∈ C(I) → [x0,… , xn]f ∈ ℝ.

De la fórmula (1.4) se deduce que el funcional [x0,… , xn] es lineal y puede ex-presarse como una combinación lineal de los funcionales evaluación. Por tanto,[x0,… , xn] pertenece al espacio L ∶= ⟨�0,… , �n⟩.

Veamos que los (!0,… , !n) y ([x0], [x0, x1],… , [x0… , xn]) forman un pardual. Sea P (!i; x0,… , xk) ∈ Pk el polinomio de interpolación de Lagrange de!i en x0,… , xk. Observemos que si k < i, entonces !i se anula en todos losnodos y P (!i; x0,… , xk) = 0. Por la Proposición ?? (a), [x0,… , xk]!i = 0.Si k ≥ i, entonces el propio polinomio !i ∈ Pk es el interpolante, de donde sededuce que P (!i; x0,… , xk) = !i. Considerando el coeficiente en xk se deduceque [x0,… , xk]!i = 0 si i < k y [x0,… , xk]!i = 1 si i = k. Por tanto,

[x0,… , xk]!i = �ik,

donde �ik es el símbolo delta de Kronecker.

43

Page 44: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Así que (!0,… , !n) es una base de Pn, llamada base de Newton y las dife-rencias divididas ([x0], [x0, x1],… , [x0… , xn]) forman una base en el espacioL dual a la base de Newton.

Obtengamos el cambio de bases entre los funcionales evaluación y la base dediferencias divididas de L descrita anteriormente. Para expresar los funcionalesdiferencia dividida en términos de los funcionales de evaluación utilizamos lafórmula (1.4)

[x0,… , xk] =k∑

i=0

1!′k+1(xi)

�i, k = 0,… , n,

donde!′k+1(xi) =

j∈{0,…,k}⧵{i}(xi − xj), 0 ≤ i ≤ k ≤ n.

La fórmula de Newton evaluada en x = xi

�if = f (xi) = P (f ; x0,… , xn)(xi) =n∑

k=0!k(xi)[x0,… , xk]f,

nos proporciona el cambio inverso que permite expresar los funcionales de eva-luación en términos de las diferencias divididas. Teniendo en cuenta que!k(xi) =0 si k > i, se deduce la expresión del cambio

�i =i

k=0!k(xi) [x0,… , xk], i = 0,… , n.

Análogamente podemos obtener la matriz de cambio entre las bases de La-grange y de Newton. Para expresar la base de Newton en términos de la basede Lagrange, aplicamos la fórmula de Lagrange a los polinomios de la base deNewton, teniendo en cuenta que !k(xi) = 0 para i < k,

!k(x) =n∑

i=k!k(xi)li(x), k = 0,… , n.

Aplicando la fórmula (1.4) a los polinomios de Lagrange, se deduce que

[x0,… , xk]li =

1!′k+1(xi)

, si k ≥ i

0 si k < i,

44

Page 45: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

obteniéndose el cambio inverso.

li(x) =n∑

k=i

1!′k+1(xi)

!k(x), i = 0,… , n.

2. Interpolación en nodos equidistantesEstudiemos el problema de Lagrange en el caso de que los nodos x0,… , xn

sean equidistantesxi+1 − xi = ℎ, i = 1,… , n.

La sucesión de nodos es de la forma

xi = x0 + iℎ, i = 0,… , n.

Introduciendo la notación

fi ∶= f (xi), i = 0,… , n,

el problema de interpolación de Lagrange consiste en encontrar p ∈ Pn tal que

p(xi) = fi, i = 0,… , n.

Sea q(t) ∶= p(x0 + tℎ). Entonces q es una función polinómica de Pn si ysolo si p ∈ Pn. Las condiciones de interpolación se transforman en

q(i) = fi, i = 0,… , n.

Por tanto, el cambio de variables x(t) = x + tℎ convierte todo problema deLagrange en nodos equidistantes en un problema en el conjunto de nodos enteros

ti = i, i = 0,… , n.

Diferencias progresivasPara obtener una fórmula de Newton, introducimos el operador diferencia

progresivaΔ ∶ ℝℕ0 → ℝℕ0

que asocia a una sucesión de valores

fi, i = 0, 1,…

45

Page 46: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

una nueva sucesión de valores

Δfi ∶= fi+1 − fi i = 0, 1,…

El operador Δ2 corresponde a aplicar 2 veces el operador diferencia progresiva

Δ2fi ∶= Δ(Δfi) = Δfi+1 − Δfi = fi+2 − 2fi+1 + fi, i = 0, 1,…

De esta manera podemos definir operadores diferencia progresiva de orden cual-quiera

Δkfi ∶= Δk−1(Δfi) = Δk−1fi+1 − Δk−1fi, i = 0, 1,…El operador diferencia progresiva puede aplicarse a diferentes tipos de suce-

siones. Si la sucesión de valores dada es finita con índices enteros desde j hastan,

fi, i = j,… , n,solamente tiene sentido calcular los valores Δkfi correspondientes a los índicesi = j,… , n − k y solamente para k = 0,… , n − j.

La diferencia progresiva k-ésima puede expresarse en términos de los valo-res de la sucesión mediante la siguiente fórmula

Proposición 2.1. Sea f0, f1,… , fn,… una sucesión de valores. Entonces paratodo k tenemos

Δkfi =k∑

j=0(−1)k−j

(

kj

)

fi+j .

Demostración. Por inducción sobre k. Para k = 0, es trivial ya que Δ0fi = fi.El caso k = 1 corresponde a la definición. Suponiendo el resultado cierto parak − 1, veamos que se verifica para k

Δkfi = Δk−1fi+1 − Δk−1fi

=k−1∑

j=0(−1)k−j−1

(

k − 1j

)

fi+j+1 −k−1∑

j=0(−1)k−j−1

(

k − 1j

)

fi+j

Mediante un cambio de índices en la primera suma podemos organizar los su-mandos en la forma

k∑

j=1(−1)k−j

(

k − 1j − 1

)

fi+j +k−1∑

j=0(−1)k−j

(

k − 1j

)

fi+j

= (−1)kfi +k−1∑

j=1(−1)k−j

((

k − 1j − 1

)

+(

k − 1j

))

fi+j + fi+k

46

Page 47: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

y, teniendo en cuenta la identidad de Pascal,(

k − 1j − 1

)

+(

k − 1j

)

=(

kj

)

,

se deduce el resultado.

El resultado anterior tiene la siguiente interpretación en términos del ope-rador desplazamiento definido como

Efi ∶= fi+1, i = 0, 1,…

de modo queEkfi = fi+k, i = 0, 1,…

Tenemos Δ = E − I , donde I denota al operador identidad. Formalmente po-demos componer varias veces los operadores lineales obteniendo

Δ2fi = (E − I)2fi = (E2 − 2E + I)fiy en general tenemos

Δk = (E − I)k =k∑

j=0(−1)k−j

(

kj

)

Ej .

La fórmula de Newton progresivaVeamos que las diferencias divididas pueden expresarse en términos de di-

ferencias progresivas.Teorema 2.2. Sean x0,… , xn nodos equidistantes xi+1 − xi = ℎ > 0, i =0,… , n − 1, f una función definida en un dominio que contiene al conjunto denodos {x0,… , xn} y fi = f (xi), i = 0,… , n. Entonces

[xi,… , xi+k]f = 1k!ℎ−kΔkfi.

Demostración. Por inducción sobre n. Para n = 0, es trivial [xi]f = f (xi) =fi = Δ0fi . Supongamos que el resultado es cierto para k y veamos que severifica para k + 1

[xi,… , xi+k, xi+k+1]f =[xi+1,… , xi+k+1]f − [xi,… , xi+k]f

xi+k+1 − xi

= 1k!ℎ−kΔfi+1 − Δfi

(k + 1)ℎ= 1

(k + 1)!ℎ−k−1Δk+1fi.

47

Page 48: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Podemos expresar algunas fórmulas relativas a puntos equidistantes utili-zando el coeficiente binómico generalizado

(

tn

)

∶=t(t − 1)⋯ (t − n + 1)

n!.

De la definición se deduce que(

−tn

)

= (−1)n(

t + n − 1n

)

.

Si aplicamos el Teorema ?? a la fórmula de Newton de diferencias divididas

p(x) =n∑

k=0[x0,… , xk]f!k(x)

obtenemos

p(x) =n∑

k=0

1k!ℎ−kΔkf0!k(x).

Introduciendo el cambio x = x0 + tℎ y teniendo en cuenta que xi = x0 + iℎ,i = 0,… , n, tenemos

!k(x) = (x − x0)⋯ (x − xk−1) = ℎkt(t − 1)⋯ (t − k + 1) = k!ℎk(

tk

)

,

de donde se deduce la expresión de la fórmula de Newton progresiva para nodosequidistantes, también conocida como fórmula de Newton-Gregory progresivaFórmula de Newton-Gregory progresiva.

p(x0 + tℎ) =n∑

k=0Δkf0

(

tk

)

.

Si en la fórmula anterior tomamos t = n, obtenemos

fn =n∑

k=0

(

nk

)

Δkf0.

Lo que permite expresar el último término de la sucesión de valores fn en tér-minos de las diferencias progresivas Δkf0, k = 0,… , n. Evaluando en el puntoxi+j el polinomio de interpolación de grado j ≤ n en fi,… , fi+j expresadomediante la fórmula de Newton progresiva, obtenemos el siguiente resultado

48

Page 49: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Proposición 2.3. Sea f0, f1,… , fn,… una sucesión de valores. Entonces paratodo j tenemos

fi+j =j∑

k=0

(

jk

)

Δkfi.

El resultado anterior puede interpretarse en términos de los operadores des-plazamiento y diferencia. Partiendo de la relación E = I + Δ, obtenemos

Ej = (I + Δ)j =j∑

k=0

(

jk

)

Δk.

Aplicación a las fórmulas de sumaciónLa fórmula de Newton permite obtener fórmulas de sumación de sucesiones

fj cuyo término general es un polinomio.

Proposición 2.4. Sea q ∈ Pn y fj ∶= q(j), j = 1, 2,… Entonces

i∑

j=1fj =

n∑

k=0Δkf1

(

ik + 1

)

, i = 1, 2,…

Demostración. Sea s0 ∶= 0 y

si ∶=i

j=1fj , i = 1, 2,…

Entonces tenemos que

Δsi = fi+1, i = 0, 1,… ,

de donde se obtienen las diferencias progresivas sucesivas

Δk+1si = Δkfi+1, i = 0, 1, 2,…

Veamos que si es una sucesión cuyo término general corresponde a un poli-nomio de grado menor o igual que n+1. Sea p ∈ Pn+1 el polinomio que interpolaa si, i = 0,… , n + 1, en los nodos ti = 0, 1,… , n, n + 1. Este polinomio puedecalcularse utilizando la fórmula de Newton

p(t) =n+1∑

k=0Δks0

(

tk

)

.

49

Page 50: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Teniendo en cuenta que Δksi = Δk−1fi+1, k = 1,… , n + 1 y que s0 = 0,obtenemos la siguiente fórmula para el polinomio p en términos de la sucesiónf1,… , fn, fn+1

p(t) =n∑

k=0Δkf1

(

tk + 1

)

.

Veamos que si = p(i) para todo entero i ≥ 0. De la identidad de Pascal(

i + 1k + 1

)

−(

ik + 1

)

=(

ik

)

,

deducimos que

p(i + 1) − p(i) =n∑

k=0Δkf1

((

i + 1k + 1

)

−(

ik + 1

))

=n∑

k=0Δkf1

(

ik

)

para todo entero no negativo i.Como q ∈ Pn verifica q(j) = fj , j = 1,… , n + 1, deducimos de la fórmula

de Newton

q(t + 1) =n∑

k=0Δkf1

(

tk

)

.

Por tanto,

p(i + 1) − p(i) =n∑

k=0Δkf1

(

ik

)

= q(i + 1).

Sea di ∶= si − p(i). Entonces

Δdi = fi+1 − (p(i + 1) − p(i)) = fi+1 − q(i + 1) = 0,

para todo entero no negativo i, lo que implica que la sucesión de valores d0, d1, d2,…es constante y, como d(0) = s0 − p(0) = 0, se deduce que

0 = d0 = d1 = d2 = ⋯

Luego si = p(i) para todo entero no negativo i.

Ejemplo. Se busca una fórmula para la suma si ∶=∑i

j=1 j2. Partiendo de fj =

j2, j ≥ 1, calculamos Δ0f1 = 1, Δf1 = 3, Δ2f1 = 2 y aplicamos la fórmula desumación anterior para obtener

i∑

j=1j2 =

2∑

k=0Δkf1

(

ik + 1

)

= i + 3i(i − 1)

2+ 2

i(i − 1)(i − 2)6

= i6(6 + (i − 1)(9 + 2(i − 2))) = i

6(2i2 + 3i + 1) =

(2i + 1)(i + 1)i6

.

50

Page 51: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Otros tipos de diferencias finitasLa diferencia regresiva de una sucesión de valores … , f0, f1,… , fn se de-

fine∇fi ∶= fi − fi−1.

Notemos que si la sucesión de valores dada es finita fj ,… , fn, solamente tienesentido calcular ∇kfi para i = j + k,… , n, k = 0,… , n − j. Las diferenciasregresivas se relacionan directamente con las diferencias progresivas, ya que

∇fi = Δfi−1,

y∇kfi = Δkfi−k.

La fórmula de Newton progresiva expresa el interpolante en puntos equi-distantes en términos de diferencias progresivas. Análogamente, la fórmula deNewton regresiva expresa el interpolante en términos de diferencias regresivas.Para obtenerla, aplicamos la fórmula de Newton tomando los nodos en ordeninverso xn, xn−1,… , x0,

p(x) =n∑

k=0[xn−k,… , xn−1, xn]f !k(x),

donde

!k(x) ∶= (x − xn)(x − xn−1)⋯ (x − xn−k+1), k = 0,… , n.

Notemos que

!k(x0 + tℎ) = ℎk(t − n)(t − n + 1)⋯ (t − n + k − 1) = k!ℎk(

t − n + k − 1k

)

.

El Teorema ??, nos permite deducir que

[xn−k,⋯ , xn]f = ℎ−kΔkfn−kk!

= ℎ−k∇kfnk!

.

Por tanto, tenemos la fórmula Newton regresiva para nodos equidistantes o fór-mula de Newton-Gregory regresiva

p(x0+tℎ) =n∑

k=0

∇kfnk!

(t−n)(t−n+1)⋯ (t−n+k−1) =n∑

k=0∇kfn

(

t − n + k − 1k

)

51

Page 52: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

La fórmula regresiva admite varias descripciones. Como el primer nodo seencuentra en xn y los demás se encuentran a la izquierda, parece más naturalrealizar el cambio de variables x = xn−sℎ, transformando la sucesión xn,… , x0en la sucesión de enteros 0, 1,… , n. Aplicando el cambio de variables

!k(xn − sℎ) = ℎk(−1)ks(s − 1)⋯ (s − k + 1) = (−1)kℎk(

sk

)

,

obtenemos la siguiente expresión alternativa de la fórmula de Newton regresivaFórmula de Newton-Gregory regresiva.

p(xn − sℎ) =n∑

k=0(−1)k∇kfn

(

sk

)

.

La diferencias progresivas y regresivas son los tipos más importantes dediferencias finitas. También se utilizan las llamadas diferencias centrales. Lasfórmulas centrales pretenden aprovechar propiedades de simetría de la distribu-ción de nodos, como sucede en el caso de nodos equidistantes.

Consideremos la sucesión de puntos equidistantes

xi = x0 + iℎ, i ∈ ℤ,

que forman una malla unidimensional. Notemos que los puntos medios

xi = x0 + iℎ, i ∈ ℤ

forman una malla de puntos equidistantes entrelazada con la malla original

xi+ 12= x0 + (i + 1

2)ℎ, i ∈ ℤ.

Para definir las diferencias centrales, es necesario considerar los valores en pun-tos de la malla original

fi = f (xi), i ∈ ℤy en los puntos de la malla formada por los puntos medios

fi+ 12= f (xi+ 1

2), i ∈ ℤ.

El operador diferencia central se define formalmente como

�fi ∶= fi+ 12− fi− 1

2.

52

Page 53: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Las diferencias centrales aplicadas un número par de veces utilizan los valoresde los puntos en los puntos de la propia malla, mientras que si se aplican unnúmero impar de veces utilizan los de la malla de puntos medios. Por ejemplo,

�2fi = fi+1 − 2fi + fi−1, �3fi = fi+ 32− 3fi+ 1

2+ 3fi− 1

2− fi− 3

2.

Las fórmulas de Newton que expresan el interpolante en términos de diferen-cias centrales son más complicadas que las fórmulas progresivas y regresivas.Estas fórmulas se utilizan en contextos especializados, por lo que omitimos sudescripción.

Fórmula de LagrangeRecordemos que

li(x) =∏

j∈{0,…,n}⧵{i}

x − xjxi − xj

,

sustituyendo xi = x0 + iℎ, x = x0 + tℎ, obtenemos

li(x0 + tℎ) =∏

j∈{0,…,n}⧵{i}

x0 + tℎ − x0 − jℎx0 + iℎ − x0 − jℎ

=∏

j∈{0,…,n}⧵{i}

t − ji − j

.

En primer lugar tenemos que

j∈{0,…,n}⧵{i}(i − j) =

i−1∏

j=0(i − j)

n∏

j=i+1(i − j) = i!(−1)n−i(n − i)!

luego1

j∈{0,…,n}⧵{i}(i − j)=

(−1)n−i

n!

(

ni

)

,

de donde se obtiene

li(x0 + tℎ) = (−1)n−i(

ni

)

j∈{0,…,n}⧵{i}(t − j)n!

, i = 0,… , n.

La primera fórmula baricéntrica del interpolante se reduce a

p(x0 + tℎ) =t(t − 1)⋯ (t − n)

n!

n∑

i=0(−1)n−i

(

ni

)

fit − i

.

53

Page 54: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Esta fórmula requiere pocas operaciones: los números n! y(ni

)

, i = 0,… , npueden estar calculados previamente. El cálculo de n! requiere n−2 productos.Teniendo en cuenta que

(ni

)

=( nn−i

)

solamente es preciso calcular estos coefi-cientes para i = 1,… , ⌊n∕2⌋, lo que da lugar a ⌊n∕2⌋ − 1 productos y otrostantos cocientes. También podemos tener previamente calculados los valores(−1)n−i

(ni

)

fi utilizando n − 1 productos adicionales. Para evaluar el polinomiode interpolación necesitaremos por cada t, n + 1 restas, n + 1 divisiones, n su-mas, n + 1 productos y la división correspondiente al denominador n!. Tam-bién hay que tener en cuenta la diferencia y el cociente requeridos para hallart = (x−x0)∕ℎ. Esto economiza bastante el número de operaciones que requiereel interpolante. Si además evaluamos el polinomio en puntos simétricamentedistribuidos, la relación li(x) = ln−i(x0 + xn − x) permite reducir los cálculosaún más.

Utilizando coeficientes binómicos generalizados, podemos expresar los po-linomios de Lagrange para nodos equidistantes en la forma

li(x0 + tℎ) =(

ti

)(

n − tn − i

)

, i = 0,… , n,

y la fórmula de Lagrange adopta la forma

p(x0 + tℎ) =n∑

i=0fi

(

ti

)(

n − tn − i

)

.

3. Interpolación de HermiteSea f una función de clase C1 y sea el polinomio de primer grado

P (f ; x0, x1)(x) = [x0]f + [x0, x1]f (x − x0)

que interpola a f en x0 ≠ x1. Este polinomio puede interpretarse como la gráficade la recta secante. Si hacemos x1 → x0 entonces la recta secante tiende a latangente en el punto x0, cuya pendiente es f ′(x0). Por tanto

lımx1→x0

P (f ; x0, x1)(x) = T1(f ; x0)(x)

dondeT1(f ; x0)(x) = f (x0) + f ′(x0)(x − x0).

54

Page 55: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

denota al polinomio de Taylor de primer grado de la función f en x0. Puesto queel límite del polinomio de interpolación está bien definido, tiene sentido definirel interpolante y la diferencia dividida en el caso de coalescencia de 2 nodos

P (f ; x0, x0) ∶= T1(f ; x0), [x0, x0]f ∶= lımx1→x0

[x0, x1]f = f ′(x0).

En virtud del Teorema del valor medio generalizado (véase Teorema ??),tenemos

lımx1,…,xn→x0

[x0,… , xn]f =f (n)(x0)

n!y el polinomio de interpolación

P (f ; x0,… , xn)(x) = [x0]f +⋯ + [x0,… , xn]f ⋅ (x − x0)⋯ (x − xn−1)

converge al polinomio de Taylor

Tn(f ; x0) ∶=n∑

i=0f (i)(x0)

(x − x0)i

i!,

cuando x1,… , xn → x0. El propio Brook Taylor hizo notar que los desarrollosen serie de potencias pueden verse como el límite de la fórmula de Newton paranodos equidistantes cuando los nodos tienden a coincidir.

Multiplicidades de ceros de una funciónEl comportamiento local de dos funciones en un punto es similar si los pri-

meros términos del desarrollo en serie de Taylor coinciden, lo que equivale aafirmar que el polinomio de Taylor de cierto grado de la diferencia de ambasfunciones es el polinomio nulo. El polinomio de Taylor es nulo si las derivadassucesivas de f hasta cierto orden son todas nulas. Para expresar esta condiciónintroducimos el concepto de multiplicidad de un cero de una función. Recorde-mos que un cero de una función es un punto del dominio en el que la funcióntoma el valor nulo.

Definición. Sea f una función de clase Cm en un entorno de x0. Si

f (x0) = f ′(x0) = ⋯ = f (m−1)(x0) = 0, f (m)(x0) ≠ 0,

entonces se dice que x0 es un cero de f de multiplicidad m.Por convenio decimos que la multiplicidad de x0 como cero de una función

continua f en x0 es 0 si f (x0) ≠ 0 (en otras palabras, x0 no es un cero de f ). Sila multiplicidad es 1, decimos que x0 es un cero simple de f y si la multiplicidades mayor que 1, decimos que x0 un cero múltiple de f .

55

Page 56: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

En el caso de polinomios no nulos la multiplicidad siempre está bien de-finida y es menor o igual que el grado, ya que si grad p = n, entonces p(n)(x)es una constante no nula. Como las funciones polinómicas admiten extensión atodo el campo complejo, podemos aplicar la definición de multiplicidad de uncero a cualquier x0 ∈ ℂ. La multiplicidad de un cero de un polinomio puedecaracterizarse en términos de divisibilidad en el álgebra de los polinomios concoeficientes complejos.

Teorema 3.1. Si x0 ∈ ℂ es un cero de multiplicidad m de un polinomio p,entonces existe un polinomio q con q(x0) ≠ 0 tal que p(x) = (x− x0)mq(x). Portanto, la multiplicidad de un x0 como cero de un polinomio p es el mayor enterono negativo m tal que (x − x0)m divide a p(x).

Demostración. Lo demostraremos por inducción sobre la multiplicidad m delpolinomio p. El caso m = 0 es trivial. Supongamos que la propiedad es válidapara m − 1 y que p es un polinomio tal que x0 es un cero con multiplicidadm ≥ 1. Por el Teorema del resto p(x) = (x−x0)q1(x). Derivando sucesivamenteobtenemos

p(k)(x) = (x − x0)q(k)1 (x) + kq(k−1)1 (x), k = 1,… , m + 1,

y evaluando en x = x0 deducimos que

p(k)(x0) = kq(k−1)1 (x0), k = 1,… , m + 1.

Como p tiene un cero de multiplicidad m en x0, deducimos que

q(k−1)1 (x0) = 0, k = 1,… , m,

y que

q(m)1 (x0) =p(m)(x0)

m≠ 0.

Así que x0 es un cero de q1 de multiplicidad m − 1. Por hipótesis de inducción

q1(x) = (x − x0)m−1q(x)

con q(x0) ≠ 0, luegop(x) = (x − x0)mq(x).

Por tanto, si x0 es un cero de p de multiplicidad m, (x − x0)k divide a p(x)para todo k ≤ m. Si (x−x0)m+1 dividiera a p(x), entonces x−x0 dividiría a q(x)en contradicción con el hecho de que q(x0) ≠ 0.

56

Page 57: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

La definición de multiplicidad no cubre todos los casos posibles. La multi-plicidad exacta de x0 como cero de f puede no estar bien definida si todas lasderivadas de f en x0 se anulan hasta orden m y no existe la derivada de ordenm + 1.

Definición. Sea f una función de clase Ck en entorno de x0. Si para ciertom ≤ k + 1 tenemos

f (x0) = f ′(x0) = ⋯ = f (m−1)(x0) = 0

entonces se dice que f se anula m veces en x0

Nota. Si f a anula m veces en x0 y la multiplicidad de x0 como cero de f estábien definida entonces x0 es un cero de f de multiplicidad mayor o igual que m.

Teniendo en cuenta que el anillo de polinomios es un dominio de factori-zación única, podemos generalizar el Teorema ?? al caso en que haya variosceros.

Teorema 3.2 (Teorema del Resto generalizado). Supongamos que x0,… , xk ∈ℂ distintos. Si p ∈ P es un polinomio que tiene en xi un cero de multiplicidadmayor o igual quemi, i = 0,… , k, entonces (x−x0)m0 ⋯ (x−xk)mk divide a p(x).Recíprocamente, si (x−x0)m0 ⋯ (x−xk)mk divide a un polinomio p(x) entoncesla multiplicidad de xi como cero de p es mayor o igual que mi, i = 0,… , k.

Demostración. Veámoslo por inducción sobre m = m0 +⋯ + mk. Si

m0 = ⋯ = mk = 0,

el resultado es trivial. Suponer ahora que algún mi es no nulo. Sin pérdida degeneralidad podemos suponer que m0 > 0. Por el Teorema ??, tenemos que(x−xi)mi divide a p(x), i = 0,… , k. Como los polinomios (x−xi)mi, i = 0,… , n,son primos entre sí, deducimos que (x − x0)m0 ⋯ (x − xk)mk divide a p(x).

Recíprocamente supongamos que (x−x0)m0 ⋯ (x−xk)mk divide a p(x). En-tonces (x−xi)mi divide a p(x), i = 0,… , k. Aplicando el Teorema ??, deducimosque la multiplicidad en xi de p es mayor o igual que mi, i = 0,… , k.

Del teorema anterior se deduce que la suma de las multiplicidades de todoslos ceros complejos de un polinomio es menor o igual que el grado. Utilizaremosla expresión número de ceros, contando multiplicidades, para referirnos a lasuma de las multiplicidades de todos los ceros.

57

Page 58: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Teorema 3.3 (Teorema fundamental del álgebra, forma débil). El número deceros complejos de un polinomio no nulo, contando multiplicidades, es menoro igual que el grado.

Del Teorema ?? se deduce que el conjunto de los polinomios que tienen enxi ceros con multiplicidad mayor o igual que mi, i = 0,… , k, forman un idealdel álgebra de polinomios que puede identificarse con el ideal generado por elpolinomio (x − x0)m0 ⋯ (x − xk)mk.

En el caso de funciones diferenciables generales, podemos relacionar la lamultiplicidad del producto con la multiplicidad de cada uno de los factores.Proposición 3.4. Sean f1, f2 funciones de clase Ck en un entorno de x0 y f =f1f2.

(a) Si f1 se anula m1 veces en x0 y f2 se anula m2 veces en x0 con m1+m2 ≤k + 1, entonces f se anula m1 + m2 veces en x0.

(b) Si las multiplicidades de x0 como cero de f1 y de f2 son exactamente m1y m2, respectivamente, y m1 + m2 ≤ k, entonces la multiplicidad de x0como cero de f es exactamente m1 + m2.

(c) Si la multiplicidad de x0 como cero de f1 es exactamente m1 con m1 ≤ ky f se anula m veces en x0, con m1 ≤ m ≤ k + 1, entonces f2 se anulam − m1 veces en x0.

Demostración. Por la regla de Leibniz tenemos

f (j)(x0) =j∑

i=0

(

ji

)

f (i)1 (x0)f

(j−i)2 (x0), i = 0,… , k.

(a) Tenemos que

f (i)1 (x0) = 0, i ∈ {0,… , m1 − 1},

f (j−i)2 (x0) = 0, i ∈ {j − m2 + 1,… , j}.

Si j ≤ m1+m2−1, entonces j−m2+1 ≤ m1 y todos los sumandos de la fórmulade Leibniz son nulos. Por tanto, f (j)(x0) = 0 para todo j ∈ {0,… , m1+m2−1}y f se anula m1 + m2 veces en x0.

(b) Por el apartado anterior, tenemos que

f (j)(x0) = 0, j ∈ {0,… , m1 + m2 − 1}.

Además todos los sumandos en la fórmula de Leibniz para f (m1+m2)(x0) son nu-los, excepto el correspondiente a i = m1, de donde se deduce que

f (m1+m2)(x0) = f (m1)1 (x0)f

(m2)2 (x0) ≠ 0.

58

Page 59: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Por tanto, la multiplicidad de x0 como cero de f es exactamente m.(c) Si m = m1, el resultado es trivial. Demostremos el resultado por induc-

ción sobre m2 ∶= m − m1. Como la multiplicidad de x0 como cero de f1 esexactamente m1,

f (i)1 (x0) = 0, i ∈ {0,… , m1 − 1}, f (m1)

1 (x0) ≠ 0.

Comof (j)(x0) = 0, j ∈ {0,… , m − 2},

podemos aplicar la hipótesis de inducción para deducir que f (i)2 (x0) = 0 para

todo i ∈ {0,… , m2 − 2}. Aplicando la fórmula de Leibniz para la derivada(m − 1)-ésima, vemos que todos los sumandos correspondiente a i ≠ m1 sonnulos, de donde deducimos que

f (m−1)(x0) = f (m1)1 (x0)f

(m2−1)2 (x0).

Como f (m−1)(x0) = 0 y f (m1)1 (x0) ≠ 0, deducimos que f (m2−1)

2 (x0) = 0, lo queimplica que f2 se anula en m2 veces en x0.

La Proposición ?? aplicada a funciones polinómicas, proporciona una de-mostración alternativa del Teorema del resto generalizado sin necesidad de uti-lizar el hecho de que el anillo de polinomios es un dominio de factorizaciónúnica. Partiendo de p(x) y considerando x0 un cero de multiplicidad m0 > 0,tenemos por el Teorema del resto que p(x) = (x− x0)q(x). Aplicando la Propo-sición ?? deducimos que la multiplicidad de los ceros de q es la misma que lamultiplicidad de los de p, excepto en el caso de x0, para el que la multiplicidades m0−1. Esta propiedad permite deducir el Teorema del resto generalizado porinducción.

El problema de TaylorEl polinomio de Taylor puede considerarse como un interpolante, si con-

templamos la posibilidad de prescribir, no solamente valores, sino también de-rivadas de la función.

El problema de interpolación de Taylor para f suficientemente diferenciableen un entorno de x0 consiste en encontrar p ∈ Pn tal que

p(j)(x0) = f (j)(x0), j = 0,… , n.

Veamos que el problema de Taylor siempre admite una única solución.

59

Page 60: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Proposición 3.5. La única solución al problema de interpolación de Taylor

p(j)(x0) = f (j)(x0), j = 0,… , n.

es el polinomio de Taylor

Tn(f ; x0) ∶=n∑

i=0f (i)(x0)

(x − x0)i

i!.

Demostración. Para la existencia, tengamos en cuenta que, si tomamos p(x) =Tn(f ; x0)(x), tenemos

p(j)(x) =n−j∑

i=0f (i+j)(x0)

(x − x0)i

i!= Tn−j(f (j); x0),

de donde se deduce quep(j)(x0) = f (j)(x0),

lo que muestra la existencia de solución. Para la unicidad, supongamos quep1, p2 ∈ Pn son soluciones del mismo problema. Definiendo q ∶= p1− p2 ∈ Pn,tenemos

q(j)(x0) = 0, j = 0,… , n,

luego x0 es un cero de q de multiplicidad mayor o igual que n + 1. Se deducedel Teorema del resto generalizado que el polinomio (x−x0)n+1, de grado n+1divide al polinomio q(x), lo que implica que q(x) es el polinomio nulo. Por tanto,tenemos unicidad de solución p1(x) = p2(x).

El problema de Hermite generalExtenderemos el concepto de conjunto de nodos al caso en que pueda ha-

ber repeticiones de nodos para poder dar un significado al problema con nodoscoalescentes.

Definición. Una sucesión de nodos x0, x1,… , xn, no necesariamente distintosrecibe el nombre de una sucesión extendida de nodos. La multiplicidad de unnodo en la sucesión extendida x0,… , xn se define como el número de veces queel nodo xi aparece en dicha sucesión,

m(xi; x0,… , xn) ∶= #{j ∣ xj = xi}.

60

Page 61: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Definición. En relación con una sucesión extendida de nodos x0,… , xn con-sideramos que una función continua es suficientemente diferenciable si admiteen cada nodo xi derivadas hasta orden m(xi; x0,… , xn) − 1 y esas derivadasson continuas en un entorno de xi. Se dice que una función f suficientementediferenciable se anula en la sucesión extendida de nodos x0,… , xn, si

f (j)(xi) = 0, j = 0,… , m(xi; x0,… , xn) − 1, i = 0,… , n,

es decir, f se anula m(xi; x0,… , xn) veces en cada nodo xi, i = 0,… , n. De-cimos que los valores de dos funciones f y g suficientemente diferenciablescoinciden en una sucesión extendida de nodos si la diferencia f − g se anula endicha sucesión.

El problema de interpolación de Hermite consiste en encontrar un polino-mio p ∈ Pn que coincida con una función suficientemente diferenciable f enuna sucesión extendida de nodos x0,… , xn. Por tanto, el problema de inter-polación de Hermite puede describirse en términos de las las condiciones deinterpolación

p(j)(xi) = f (j)(xi), j = 0, 1,… , m(xi) − 1, i = 0,… , n.

Una forma equivalente de formular el problema de interpolación de Her-mite consiste en introducir la sucesión funcionales de Hermite asociados a unasucesión extendida.

Definición. Dada una sucesión extendida de nodos x0,… , xn, se definen losfuncionales de Hermite

�if ∶= f (ri−1)(xi), ri ∶= m(xi, x0,… , xi) i = 0,… , n,

donde m(xi, x0,… , xi) es la multiplicidad de xi en la sucesión extendida parcialx0,… , xi.

De la definición de los funcionales de Hermite, se deduce que f se anula enla sucesión extendida parcial x0,… , xk con k ≤ n si y solo si

�if = 0, i = 0,… , k.

Los funcionales de Hermite permiten simplificar la descripción del proble-ma de interpolación de Hermite.

61

Page 62: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Problema de Hermite. Hallar una función p tal que

�ip = �i, i = 0,… , n,

donde �i, i = 0,… , n, son los funcionales de Hermite asociados a una sucesiónextendida de nodos x0,… , xn ∈ ℝ y �0,… , �n ∈ ℝ.

En el caso de que ningún punto esté repetido más de dos veces, el problemade Hermite puede interpretarse geométricamente como el problema de determi-nar una curva que pase por puntos dados, prescribiendo en algunos de ellos larecta tangente. Más generalmente, si los nodos están repetidos varias veces, lacurva debe ajustarse de modo que las gráficas de los polinomios de Taylor cons-truidos con los datos tengan orden de contacto igual o superior a la multiplicidaden cada nodo.

Para deducir la unicidad de solución del problema de Hermite utilizaremosel siguiente resultado que puede considerarse como una reformulación del Teo-rema del Resto generalizado.

Lema 3.6. Sea x0,… , xn ∈ ℝ una sucesión extendida de nodos y sea k ∈{0,… , n}. El conjunto de los polinomios p ∈ P que se anulan en la sucesiónextendida x0,… , xk es el ideal generado por el polinomio

!k+1(x) ∶= (x − x0)⋯ (x − xk),

es decir,

{p ∈ P ∣ �ip = 0, i = 0,… , k} = !k+1P = {!k+1q ∣ q ∈ P }.

Demostración. Sea mi,k la multiplicidad de xi como cero en la sucesión exten-dida x0,… , xk,

mi,k ∶= m(xi; x0,… , xk) = #{j ∈ {0,… , k} ∣ xj = xi}, i = 0,… , k.

Si p ∈ P es un polinomio tal que

�ip = 0, i = 0,… , k.

entonces p tiene en cada xi un cero de multiplicidad mayor o igual que mi,k.Observamos que en el producto

!k+1(x) ∶= (x − x0)⋯ (x − xk)

cada factor x − xi aparece repetido exactamente mi,k veces. Por el Teorema delResto generalizado, !k+1 divide al polinomio p.

62

Page 63: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Recíprocamente si !k+1 divide a p, entonces el polinomio (x−xi)mi,k dividea p. Por el Teorema ??, p tiene en xi un cero de multiplicidad mayor o igual quemi,k. Como

ri ∶= #{j ∈ {0,… , i} ∣ xj = xi} ≤ #{j ∈ {0,… , k} ∣ xj = xi} = mi,k,

se deduce que�ip = p(ri−1)(xi) = 0, i = 0,… , k,

es decir, p se anula en la sucesión extendida parcial x0,… , xk.

Veamos que el problema de Hermite polinómico siempre admite una únicasolución.

Teorema 3.7 (Existencia y unicidad de solución del problema de Hermite). Seax0,… , xn ∈ ℝ una sucesión extendida de nodos y sean �0,… , �n los funciona-les de Hermite correspondientes. El problema de interpolación de Hermite

�ip = �i, i = 0,… , n,

tiene una única solución en Pn para datos �0,… , �n ∈ ℝ cualesquiera.

Demostración. Demostremos primero la unicidad. Si p1, p2 ∈ Pn son dos solu-ciones del problema de Hermite entonces

�i(p2 − p1) = 0, i = 0,… , n.

Por el Lema ??, p2− p1 ∈ Pn ∩!n+1P , donde !n+1P es el ideal generado por elpolinomio !n+1. Como !n+1 tiene grado n + 1, Pn ∩ !n+1P = 0, luego p1 = p2.

Para la existencia, consideremos la aplicación lineal

� ∶ p ∈ Pn →

�0p

�np

∈ ℝn+1.

Como los funcionales �i son lineales, queda definida una aplicación lineal entredos espacios vectoriales de la misma dimensión.

El problema de Hermite equivale a encontrar para (�0,… , �n) ∈ ℝn+1 unaantiimagen p ∈ Pn tal que �p = (�0,… , �n). La unicidad de solución del pro-blema de interpolación de Hermite equivale a afirmar que la aplicación � esinyectiva. Como los espacios Pn y ℝn+1 tienen la misma dimensión, la aplica-ción es biyectiva, es decir, dado un vector (�0,… , �n) ∈ ℝn+1, existe un únicop ∈ Pn, tal que �p = (�0,… , �n). En otras palabras, para datos cualesquieraexiste un único interpolante de Hermite en Pn.

63

Page 64: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

La única solución del problema de interpolación de Hermite recibe el nom-bre de polinomio de interpolación de Hermite. El polinomio de interpolaciónde Hermite de una función suficientemente diferenciable f en la sucesión ex-tendida x0,… , xn se denotará mediante P (f ; x0,… , xn).

Fórmula de Lagrange del problema de Hermite clásicoLa solución de un problema de Hermite puede expresarse en términos de

polinomios fundamentales. Para obtener una fórmula de este tipo, extenderemosla definición de polinomio fundamental a problemas de Hermite. El polinomiofundamental de un problema de Hermite se define como el único polinomiolj ∈ Pn que verifica las condiciones de interpolación

�jli = �ij .

De acuerdo con el Teorema de existencia y unicidad de solución de los proble-mas de Hemite, lj queda únicamente determinado. Podemos considerar (l0,… , ln)y (�0,… , �n) como bases duales de los espacios de polinomios Pn y de funcio-nales lineales L = ⟨�i|i = 0,… , n⟩. Teniendo en cuenta la dualidad de ambasbases, se demuestra sin dificultad que el interpolante viene dado por una fórmulade Lagrange

P (f ; x0,… , xn)(x) =n∑

j=0�jf lj(x).

Aunque podemos afirmar que el polinomio∏

j∶xj≠xi

(x − xj)

divide al polinomio li(x), esta propiedad no proporciona explícitamente el po-linomio fundamental, salvo en el caso de que el punto xi no esté repetido en lasucesión extendida de nodos.

El problema de Hermite clásico es el caso particular en el que todos lospuntos tienen multiplicidad exactamente 2, siendo el espacio de interpolación degrado impar P2k+1, n = 2k+1. Reordenando los nodos si es necesario podemostomar una sucesión extendida x0,… , xn tal que

x0 < x1 < ⋯ < xk, xk+1+i = xi, i = 0,… , k.

Podemos expresar los polinomios fundamentales del problema de Hermiteclásico en términos de polinomios de Lagrange

Li(x) =∏

j∈{0,…,k}⧵{i}

x − xjxi − xj

∈ Pk,

64

Page 65: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

correspondientes al problema de Lagrange en los nodos distintos

x0 < x1 < ⋯ < xk.

Los polinomios fundamentales del problema de Hermite li, i = 0,… , k,verifican

li(xj) = l′i(xj) = 0, j ≠ i,

li(xi) = 1, l′i(xi) = 0.

Por tanto∏

j∈{0,…,n}⧵{i}(x − xj)2 divide al polinomio li, luego Li(x)2 divide alpolinomio li(x), obteniéndose la relación

li(x)Li(x)2

= ai − bi(x − xi).

Evaluando en x = xi, se deduce el valor ai = 1. Derivando en la expresiónobtenida para li

li(x) = (1 − bi(x − xi))Li(x)2

tenemosl′i(x) = 2(1 − bi(x − xi))Li(x)L′

i(x) − biLi(x)2

y, evaluándola en x = xi, obtenemos

0 = l′i(xi) = 2L′i(xi) − bi

De donde podemos despejar bi

bi = 2L′i(xi),

obteniendo la fórmula

li(x) = [1 − 2L′i(xi)(x − xi)]Li(x)2.

Los polinomios de Lagrange lk+1+i, i = 0,… , k, verifican

lk+1+i(xj) = l′k+1+i(xj) = 0, j ≠ i, lk+1+i(xi) = 0, l′k+1+i(xi) = 1,

de donde deducimos que (x − xi)∏

j∈{0,…,n}⧵{i}(x − xj)2 divide al polinomiolk+1+i. Por tanto

lk+1+i(x) = ci(x − xi)Li(x)2.Derivando la expresión anterior

l′k+1+i(x) = ciLi(x)2 + 2ci(x − xi)Li(x)L′i(x)

65

Page 66: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

y evaluando en xi, obtenemos

1 = l′k+1+i(xi) = ci,

lo que permite determinar la función

lk+1+i(x) = (x − xi)Li(x)2.

Por lo tanto, la fórmula de Lagrange para el problema de Hermite clásico es

p(x) =k∑

i=0[f (xi)(1 − 2L′

i(xi)(x − xi)) + f ′(xi)(x − xi))]Li(x)2.

Derivando Li(x), podemos obtener explícitamente los valores

L′i(xi) =

j∈{0,…,n}⧵{i}

1xi − xj

, i = 0,… , k,

que aparecen en la fórmula anterior.Un ejemplo importante es el interpolante cúbico de Hermite, correspondien-

te a k = 1. En ese caso los polinomios de Lagrange se reducen a

l0(x) =(

1 + 2x − x0x1 − x0

)( x1 − xx1 − x0

)2, l2(x) = (x − x0)

( x1 − xx1 − x0

)2,

l1(x) =(

1 + 2x1 − xx1 − x0

)( x − x0x1 − x0

)2, l3(x) = −(x1 − x)

( x − x0x1 − x0

)2.

Introduciendo las coordenadas baricéntricas del intervalo [x0, x1]

�0(x) =x1 − xx1 − x0

, �1(x) =x − x0x1 − x0

,

la expresión de los polinomios de Lagrange admite la forma simplificada

l0(x) = (1 + 2�1(x))�0(x)2, l2(x) = (x1 − x0)�1(x)�0(x)2,l1(x) = (1 + 2�0(x))�1(x)2, l3(x) = −(x1 − x0)�0(x)�1(x)2.

A continuación describimos sin demostración la fórmula de los polinomiosfundamentales de un problema de Hermite general dada por A. Spitzbar en 1960.Definiendo

pi(x) ∶=!n+1(x)(x − xi)mi

, gi(x) ∶=1

pi(x),

mi ∶= m(xi; x0,… , xn) = #{j ∈ {0,… , n} ∣ xj = xi},ri ∶= m(xi; x0,… , xi) = #{j ∈ {0,… , i} ∣ xj = xi},

66

Page 67: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

-0.2

0

0.2

0.4

0.6

0.8

1

l0

l1

l3

l2

Figura 3.1. Polinomios fundamentales de Lagrange para el problemade interpolación cúbica de Hermite

podemos expresar los polinomios fundamentales en la forma

li(x) =(x − xi)ri−1

(ri − 1)!pi(x)

mi−ri∑

j=0

g(j)i (xi)j!

(x − xi)j , i = 0,… , n.

Diferencias divididas y fórmula de NewtonPara poder demostrar la fórmula de Newton, necesitamos definir diferen-

cias divididas en el caso de puntos coincidentes. Una posibilidad sería definirdiferencia dividida a través de la recurrencia

[x0, x1,… , xn−1, xn]f ∶=[x1,… , xn−1, xn]f − [x0, x1,… , xn−1]f

xn − x0

y en el caso en que x0 = xn, definir

[x0, x1,… , xn−1, xn]f ∶= lımxn→x0

[x1,… , xn−1, xn]f − [x0, x1,… , xn−1]fxn − x0

.

Comprobar que la definición anterior es correcta, implica demostrar la exis-tencia de determinados límites, una discusión que se complica cuando variospuntos son coincidentes. Por ese motivo, preferimos utilizar la definición de

67

Page 68: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

diferencia dividida propuesta por Gerhard Kowalewski en 1932. La diferenciadividida en n + 1 nodos, se define como el coeficiente en xn del polinomio deinterpolación. La Proposición ?? (a) demuestra que esta definición coincide conla propuesta anteriormente para puntos distintos.

Definición. Sea x0,… , xn ∈ ℝ una sucesión extendida de nodos y f una fun-ción suficientemente diferenciable, es decir, la función f admite derivadas deorden hasta m(xi; x0,… , xn)−1 en un entorno de cada nodo xi y esas derivadasson continuas, i = 0,… , n. La diferencia dividida de f de orden n en los puntosx0,… , xn,

[x0,… , xn]f

se define como el coeficiente en xn de P (f ; x0,… , xn), el polinomio de inter-polación de Hermite de f en x0,… , xn.

De la definición se deduce que la diferencia dividida no depende del ordende sus argumentos.

Teorema 3.8 (Fórmula de Newton). Sea x0,… , xn ∈ ℝ una sucesión extendidade nodos y f una función suficientemente diferenciable, entonces

P (f ; x0,… , xn)(x) =n∑

i=0[x0,… , xk]f ⋅ !k(x),

donde !k(x) =∏k−1

i=0 (x − xi), k = 0,… , n.

Demostración. La demostración se realiza por inducción. Si n = 0 es evidente.Para n > 0, notemos que

r(x) ∶= P (f ; x0,… , xn−1, xn)(x) − P (f ; x0,… , xn−1)(x)

es un polinomio de grado menor o igual que n tal que �ir = 0, i = 0,… , n − 1.Por el Lema ??, !n(x) ∶= (x−x0)⋯ (x−xn−1) divide al polinomio r(x). Comograd r ≤ n, tenemos

r(x) = an!n(x),

siendo an el coeficiente en xn del polinomio r, que coincide con el coeficienteen xn de P (f ; x0,… , xn). Por la definición de diferencia dividida, tenemos an =[x0,… , xn]f , de donde se deduce la fórmula de recurrencia

P (f ; x0,… , xn−1, xn)(x) = P (f ; x0,… , xn−1)(x) + [x0,… , xn]f !n(x),

que permite completar la demostración por inducción.

68

Page 69: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Fórmula de Aitken-NevilleLa recurrencia de Aitken-Neville se generaliza inmediatamente

Teorema 3.9 (Fórmula de Aitken-Neville).

(xn − x0)P (f ; x0,… , xn)(x)= (xn − x)P (f ; x0,… , xn−1)(x) + (x − x0)P (f ; x1,… , xn)(x).

Demostración. Sean

p1 ∶= P (f ; x0,… , xn) − P (f ; x0,… , xn−1),p2 ∶= P (f ; x0,… , xn) − P (f ; x1,… , xn).

Como p1 ∈ Pn es un polinomio que se anula en la sucesión extendida de nodosx0,… , xn−1, deducimos del Lema ?? que

p1(x) = [x0,… , xn]f (x − x0)⋯ (x − xn−1).

Análogamente tenemos

p2(x) = [x0,… , xn]f (x − x1)⋯ (x − xn).

Por tanto

(xn − x0)P (f ; x0,… , xn)(x) − (xn − x)P (f ; x0,… , xn−1)(x)

−(x − x0)P (f ; x1,… , xn)(x) = (xn − x)p1(x) + (x − x0)p2(x) = 0.

El cálculo del polinomio de interpolación de Hermite puede hacerse por re-currencia utilizando las fórmulas de Aitken-Neville. Para introducir el algoritmode Neville, notemos que los nodos se pueden ordenar en la sucesión extendidade modo que las coalescencias estén agrupadas, es decir, los índices de los no-dos coincidentes deben ser consecutivos. Por tanto, se tiene que si xi+k = xi,entonces xi = xi+1 = ⋯ = xi+k−1 = xi+k y el polinomio de interpolación degrado k en los nodos xi, xi+1,… , xi+k es precisamente el polinomio de Taylor

Tk(f ; xi) =k∑

j=0f (j)(xi)

(x − xi)j

j!

En el algoritmo de Neville se obtienen los interpolantes

pi,k ∶= P (f ; xi,… , xi+k), i = 0,… , n − k, k = 1,… , n.

69

Page 70: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

En el último paso del algoritmo se obtiene p0,n, el polinomio de interpolaciónen todos los nodos x0,… , xn.

La fórmula de recurrencia de Aitken-Neville permite calcular los interpo-lantes mediante las recurrencias

pi,k(x) ∶=xi+k − xxi+k − xi

pi,k−1(x) +x − xi

xi+k − xipi+1,k−1(x), i = 0,… , n − k,

para k = 1,… , n. Cuando los puntos xi,… , xi+k coinciden, teniendo en cuentaque pi,k y pi,k−1 son polinomios de Taylor, se deduce que

pi,k(x) ∶= pi,k−1(x) +f (k)(xi)

k!(x − xi)k.

La fórmula anterior puede considerarse como el límite de la recurrencia expre-sada en la forma

pi,k(x) ∶= pi,k−1(x) +pi+1,k−1(x) − pi,k−1(x)

xi+k − xi(x − xi)

cuando los nodos xi,… , xi+k tienden a coincidir.Si los nodos de la sucesión extendida están ordenados de modo que los ín-

dices de nodos coincidentes son consecutivos, podemos calcular la tabla de va-lores pi,k, i = 0,… , n− k, k = 0,… , n, mediante el uso reiterado de la fórmulade recurrencia o utilizando la fórmula de Taylor cuando todos los puntos coin-ciden. Esta observación nos permite reformular el algoritmo de Neville paraproblemas de Hermite.

Algoritmo de Neville (coalescencias agrupadas)Para i = 0,… , n

pi,0(x) ← f (xi)Para k = 1,… , n

Para i = 0,… , n − kSi xi+k = xi entonces

pi,k(x) ← pi,k−1(x) +f (k)(xi)

k!(x − xi)k

en caso contrariopi,k(x) ←

xi+k − xxi+k − xi

pi,k−1(x) +x − xi

xi+k − xipi+1,k−1(x)

La fórmula de recurrencia de Aitken-Neville implica que es posible realizarel cálculo de diferencias divididas por recurrencia.

70

Page 71: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Proposición 3.10. Sea f una función suficientemente diferenciable respecto ala sucesión extendida de nodos x0,… , xn.

(a) Si x0 = ⋯ = xn, entonces

[x0,… , xn]f = [x[n+1]0 ]f =f (n)(x0)

n!

(b) Si x0 ≠ xn, entonces

[x0, x1,… , xn−1, xn]f =[x1,… , xn−1, xn]f − [x0, x1,… , xn−1]f

xn − x0.

Demostración. (a) Cuando todos los puntos coinciden, el polinomio de interpo-lación de Hermite es precisamente el n-ésimo polinomio de Taylor. Por tanto,la diferencia dividida en n + 1 puntos coincidentes es f (n)(x0)∕n!. (b) Se ob-tiene inmediatamente tomando coeficientes directores en la fórmula de Aitken-Neville.

El cálculo de las diferencias divididas puede hacerse utilizando las fórmu-las anteriores siguiendo el mismo esquema que en el algoritmo de Neville. Paraque el cálculo sea eficiente conviene que las coalescencias estén agrupadas, esdecir, los nodos de la sucesión extendida deben estar ordenados de modo quelos índices de nodos coincidentes sean consecutivos. Esto permite proporcionarel siguiente algoritmo para el cálculo de la tabla de diferencias divididas

di,k ∶= [xi,… , xi+k]f, i = 0,… , n − k, k = 0,… , n,

basado en el algoritmo de Neville descrito anteriormente.

Algoritmo Cálculo de las diferencias divididas (coalescencias agrupadas)Para i = 0,… , n

di,0(x) ← f (xi)Para k = 1,… , n

Para i = 0,… , n − kSi xi+k = xi entonces

di,k(x) ← f (k)(xi)∕k!en caso contrario

pi,k(x) ← (di+1,k−1 − di,k−1)∕(xi+k − xi)

71

Page 72: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Evaluación de la fórmula de NewtonUna vez obtenidas las diferencias divididas podemos utilizar la fórmula

de Newton para evaluar el interpolante en un punto t. Se suman los términosdk,0!k(t), desde k = 0,… , n, observando que los valores !k(t) pueden calcu-larse sucesivamente partiendo de !0(t) = 1, mediante la recurrencia

!k(t) = (t − xk−1)!k−1(t), k = 1,… , n.

Observemos que la evaluación de la fórmula de Newton con nodos posible-mente coincidentes contiene un caso especialmente notable: cuando todos losnodos coinciden x0 = ⋯ = xn, la fórmula de Newton se reduce a la fórmula deTaylor

p(x) =n∑

k=0

f (k)(x0)k!

(x − x0)k,

dando lugar al desarrollo del polinomio respecto a la base de potencias centradasen x0. En el caso de que x0 = ⋯ = xn = 0, tenemos el polinomio expresado entérminos de la base de monomios

mk(x) = xk, k = 0,… , n,

para cuya evaluación se utiliza el algoritmo de Horner. Como la fórmula deNewton generaliza al desarrollo de un polinomio en términos de la base de mo-nomios, parece razonable extender al algoritmo de Horner para poder aplicarloa la fórmula de Newton.

El siguiente algoritmo de tipo Horner corresponde a la evaluación de losparéntesis de la expresión anidada

d0,0 + (t − x0)(

d0,1 +⋯ + (t − xn−2)(d0,n−1 + (t − xn−1)d0,n)⋯)

,

de la fórmula de Newton, comenzando con el paréntesis interno hasta llegar alparéntesis externo. El resultado del algoritmo es el valor del polinomio en x = t,c0 = p(t).

Algoritmo Evaluación de la fórmula de Newtoncn ← d0,nPara k = n − 1,… , 1, 0

ck ← d0,k + (t − xk)ck+1

El algoritmo descrito es idéntico al propuesto para la interpolación de La-grange. Los cálculos intermedios ck del algoritmo pueden identificarse con di-ferencias divididas que incluyen el punto de evaluación.

72

Page 73: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Proposición 3.11. Sea x0,… , xn una sucesión extendida de nodos y sea

!k(x) ∶= (x − x0)⋯ (x − xk−1), k = 0,… , n,

la base de Newton correspondiente. Sea p el polinomio de interpolación de fen los nodos x0,… , xn y di,k ∶= [xi,… , xi+k]f , i = 0,… , n − k, k = 0,… , n,los elementos de la tabla de diferencias divididas en nodos con índices conse-cutivos. Para t ∈ ℝ, definimos cn+1 ∶= 0 y calculamos sucesivamente

ck ∶= d0,k + (t − xk)ck+1, k = n, n − 1,… , 0.

Entonces se tiene que

ck = [t, x0,… , xk−1]p, k ∈ {0,… , n, n + 1}.

El resto de la división de p(x) para x − t es c0 = p(t)

p(x) = c0 + (x − t)[t, x]p,

y el cociente [t, x]p = (p(x) − p(t))∕(x − t) admite la representación

[t, x]p =n−1∑

k=0ck+1!k(x).

Demostración. Por la Proposición ?? (a) [t, x0,… , xn]p es el coeficiente en xn+1del polinomio de interpolación de p en los nodos t, x0,… , xn. Veamos por in-ducción sobre k que ck = [t, x0,… , xk−1]p. Como el polinomio de interpolaciónde p ∈ Pn en t, x0,… , xn es el propio p de grado menor estrictamente que n+1,se deduce que [t, x0,… , xn]p = 0 = cn+1. Sea ahora k ∈ {0,… , n}. Si t = xk,tenemos

ck = d0,k = [x0,… , xk−1, xk]p = [t, x0,… , xk−1]p

ya que el valor de una diferencia dividida no depende del orden de los argumen-tos. Consideremos ahora el caso t ≠ xk. Por hipótesis de inducción tenemosck+1 = [t, x0,… , xk]p, luego

ck = d0,k + (t − xk)ck+1 = [x0,… , xk−1, xk]p + (t − xk)[t, x0,… , xk]p

Usando la relación de recurrencia de la Proposición ?? (a)

[t, x0,… , xk]p =[x0,… , xk−1, xk]p − [t, x0,… , xk−1]p

xk − t

73

Page 74: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

se deduce que

ck = [x0,… , xk−1, xk]p + (t − xk)[t, x0,… , xk]p = [t, x0,… , xk−1]p.

Por último la fórmula de Newton del interpolante en la sucesión de nodost, x0,… , xn−1

p(x) = c0 + c1(x − t) + c2(x − t)(x − x0) +⋯ + cn(x − t)(x − x0)⋯ (x − xn−2)

proporciona la representación propuesta de p, extrayendo el factor común x− ten todos los sumandos a partir del segundo.

Podemos disponer los cálculos del algoritmo anterior en forma de tabla. Paraque la tabla corresponda a una tabla de diferencias divididas en nodos con índi-ces consecutivos, el punto de evaluación debe tener índice anterior al primero,por lo que les asignamos índices negativos x−1 ∶= t, y d−1,k ∶= ck, k = 0,… , n.

Ejemplo. Queremos obtener el polinomio de interpolación p(x) de f (x) =sen(�x)∕� en x0 = x1 = x2 = 0, x3 = x4 = x5 = 1. Sea dik ∶= [xi,… , xi+k]f ,i = 0,… , 5 − k, k = 0,… , 5. Observemos que los valores

d00 = d10 = d20 = 0, d01 = d11 = 1, d02 = 0,d30 = d40 = d50 = 0, d31 = d41 = −1, d32 = 0,

son datos del problema de interpolación propuesto. Completamos la tabla dediferencias diferencias divididas

xi di0 di1 di2 di3 di4 di50 0 1 0 −1−0

1−0= −1 0−(−1)

1−0= 1 1−1

1−0= 0

0 0 1 0−11−0

= −1 −1−(−1)1−0

= 0 1−01−0

= 1

0 0 0−01−0

= 0 −1−01−0

= −1 0−(−1)1−0

= 1

1 0 −1 0

1 0 −1

1 0

y la fórmula de Newton del interpolante es

p(x) = x − x3 + x3(x − 1).

74

Page 75: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Para evaluar el polinomio en x = 1∕6 podemos sustituir directamente en lafórmula

p(16

)

= 16− 1216

− 51296

= 2051296

o utilizar el algoritmo tipo Horner

c5 = 0, c4 = 1,

c3 = −1 − 56= −11

6, c2 =

16× −11

6= −11

36c1 = 1 + 1

6× −11

36= 205

236, c0 =

16× 205236

= 2051296

,

que resumimos en la siguiente tabla

xi di0 di1 di2 di3 di4 di516

2051296

205216

−1136

−116

1 0

0 0 1 0 −1 1 0

0 0 1 −1 0 1

0 0 0 −1 1

1 0 −1 0

1 0 −1

1 0

Obtenemos la representación

p(x) = 2051296

+(

x − 16

)[16, x]

p,[16, x]

p = 205216

− 1136

x − 116x2 + x3.

La Proposición ?? puede utilizarse reiteradamente para obtener valores dediferencias divididas del interpolante correspondientes a diferentes representa-ciones de Newton del interpolante. Utilizando índices negativos para introducirnodos adicionales auxiliares previos a x0,… , xn, podemos disponer los cálculosdel algoritmo en una tabla de diferencias divididas.

Sean x0,… , xn una sucesión extendida de nodos, p ∈ Pn un polinomio degrado menor o igual que n y

d0,k ∶= [x0,… , xk]p, k = j − 1,… , n.

75

Page 76: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Para los nodos adicionales x−1,… , x−j , con j ≤ n, llevamos a cabo el siguientealgoritmo para calcular

d−i,k ∶= [x−i,… , x−1, x0,… , xk−i]p, k = j − 1,… , n, i = 1,… , j.

En el último paso se obtiene la diferencia dividida del polinomio en los nodosnuevos x−1,… , x−j

d−j,j−1∶ = [x−j ,… , x−1]p.

Algoritmo Cálculo de diferencias divididas de un polinomio en la forma deNewton.

Para i = 1,… , jd−i,n+1 ← 0Para k = n,… , j, j − 1

d−i,k ← d−i+1,k + (xi − xk+1−i)d−i,k+1

En el caso particular de que todos los nodos adicionales sean coincidentes

x−1 = ⋯ = x−j = t,

el algoritmo proporciona las derivadas sucesivas de p en t ya que

p(j−1)(t) = (j − 1)![t,… , t]f = (j − 1)!d−j,j−1.

Ejemplo. Consideramos de nuevo el polinomio de grado cuarto que interpola asen(�x)∕� en los nodos 0, 0, 0, 1, 1 expresado mediante la fórmula de Newton

p(x) = x − x3 + x3(x − 1),

Aplicamos el algoritmo anterior con x−1 = x−2 = x−3 = x−4 = 1∕6, obteniendola tabla siguiente

76

Page 77: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

xi di0 di1 di2 di3 di416

2051296

2327

−56

−43

116

2051296

2327

−56

−32

116

2051296

2327

− 712

−53

116

2051296

205216

−1136

−116

1

0 0 1 0 −1 1

0 0 1 −1 0 1

0 0 0 −1 1

1 0 −1 0

1 0 −1

1 0La primera fila corresponde a la representación

p(x) = 2051296

+ 2327

(

x − 16

)

− 56

(

x − 16

)2− 43

(

x − 16

)3+(

x − 16

)4,

lo que permite obtener las derivadas sucesivas del polinomio p en x = 1∕6

p(16

)

= 2051296

, p′(16

)

= 2327

,

p′′(16

)

= −53, p(3)

(16

)

= −8,

p(4)(16

)

= 24.

El Teorema del valor medio generalizadoDefinición. Sean x0 ≤ x1 ≤ ⋯ ≤ xn. Decimos que una sucesión de nudos�0,… , �n−1 está intercalada en la sucesión x0,… , xn si se verifica

xi < �i < xi+1,

para todo i ∈ {0,… , n − 1} tal que xi < xi+1 y

xi = �i = xi+1

si xi = xi+1.

77

Page 78: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

El Teorema de Rolle permite concluir que entre dos ceros de una funciónderivable en un intervalo, siempre existe un cero de la derivada. La siguientegeneralización del Teorema de Rolle será útil en la discusión de los problemasde Hermite.

Teorema 3.12 (Teorema de Rolle generalizado). Sean x0 ≤ x1 ≤ ⋯ ≤ xnen un intervalo I y f ∈ C1(I) una función suficientemente diferenciable quese anula en la sucesión extendida x0,… , xn. Entonces existe una sucesión denodos �0,… , �n−1 intercalada en x0,… , xn tal que f ′ se anula en �0,… , �n−1.Si además f ∈ Cn(I), entonces existe � ∈ I tal que f (n)(�) = 0.

Demostración. Construyamos la sucesión de la siguiente manera. Si xi = xi+1,tomamos �i = xi. Si xi < xi+1, por el Teorema de Rolle, existe �i ∈ (xi, xi+1)tal que f ′(�i) = 0. Por construcción, f ′ se anula en la sucesión extendida�0,… , �n−1. Si f ∈ Cn(I) utilizamos inducción sobre n. Si n = 1, la suce-sión extendida se reduce a un punto � tal que f ′(�) = 0. Suponiendo cierto elresultado para n−1 y tomando f ∈ Cn(I), sabemos que f ′ ∈ Cn−1(I) se anulaen una sucesión extendida �0,… , �n−1 de I , por tanto la derivada (n− 1)-ésimade f ′ se anula en algún punto � ∈ I , es decir f (n)(�) = 0.

Las diferencias divididas tienen cierta similitud con las derivadas. El Teo-rema del valor medio generalizado de H. A. Schwarz proporciona una relaciónentre diferencias divididas de orden n y derivadas de orden n.

Teorema 3.13 (Teorema del valor medio de Lagrange generalizado). Sea I unintervalo y f ∈ Cn(I). Dados x0,… , xn ∈ I , existe � ∈ I tal que

[x0,… , xn]f =f (n)(�)n!

.

Demostración. La función f −P (f ; x0,… , xn) se anula en la sucesión extendi-da x0,… , xn. Aplicando el Teorema de Rolle generalizado, se deduce que existe� ∈ I tal que la derivada n-ésima de f −P (f ; x0,… , xn) en � se anula, es decir,f (n)(�) − n![x0,… , xn]f = 0.

El Teorema del valor medio de Schwarz puede considerarse como una ge-neralización del Teorema del valor medio de Lagrange. En efecto, para n = 1,x0 < x1, f ∈ C1[x0, x1], el Teorema del valor medio generalizado se reduce alTeorema del valor medio de Lagrange

f (x1) − f (x0)x1 − x0

= f ′(�).

78

Page 79: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Del Teorema del valor medio generalizado se deduce que si f ∈ Cn(I),entonces

lımx0,…,xn→�

[x0,… , xn]f =f (n)(�)n!

.

Expresando el polinomio de interpolación mediante la fórmula de Newton, sededuce que el polinomio de Taylor es límite puntual de polinomios de Lagrangecuando todos los puntos tienden a coincidir

lımx0,…,xn→�

P (f ; x0,… , xn)(x) = Tn(f ; �)(x), x ∈ ℝ.

Fórmula de LeibnizLa Proposición ?? (a) muestra que la diferencia dividida de orden n es en

cierto sentido una generalización de la derivada n-ésima. El Teorema del valormedio generalizado muestra una relación entre las diferencias divididas de ordenn y las derivadas de orden n. La fórmula de Leibniz para la derivada n-ésima deun producto de funciones

dn

dxn(f (x)g(x)) =

n∑

j=0

(

nj

)

f (j)(x)g(n−j)(x),

admite una generalización para diferencias divididas.Proposición 3.14 (Fórmula de Leibniz para diferencias divididas). Si f, g sonsuficientemente diferenciables, x0,… , xn ∈ I , entonces

[x0,… , xn](fg) =n∑

j=0[x0,… , xj]f [xj ,… , xn]g.

Demostración. Por inducción sobre n. Si n = 0, entonces tenemos

[x0](fg) = f (x0)g(x0) = [x0]f [x0]g.

Si x0 = ⋯ = xn entonces la regla de Lebiniz para diferencias divididas coincidecon la regla clásica para derivadas.

[x0,… , xn](fg) = [x[n+1]0 ](fg) = 1n!

dn

dxn|

|

|x=x0(f (x)g(x))

= 1n!

n∑

j=0

(

nj

)

f (j)(x0)g(n−j)(x0) =n∑

j=0

f (j)(x0)j!

g(n−j)(x0)(n − j)!

=n∑

j=0[x[j+1]0 ]f [x[n−j+1]0 ]g =

n∑

j=0[x0,… , xj]f [xj ,… , xn]g.

79

Page 80: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Para el caso general supondremos que x0 ≠ xn y que la fórmula de Leibniz esválida para diferencias divididas de orden menor que n. Por la Proposición ?? (b)y, aplicando la hipótesis de inducción, tenemos

(xn − x0)[x0,… , xn](fg) = [x1,… , xn](fg) − [x0,… , xn−1](fg) =

=n∑

j=1[x1,… , xj]f [xj ,… , xn]g −

n∑

j=1[x0,… , xj−1]f [xj−1,… , xn−1]g.

Si sumamos y restamos∑n

j=1[x0,… , xj−1]f [xj ,… , xn]g a la expresión obte-nida anteriormente podemos organizar los términos de manera apropiada parapoder aplicar de nuevo la Proposición ?? (b)

n∑

j=1([x1,… , xj]f − [x0,… , xj−1]f ) [xj ,… , xn]g

+n∑

j=1[x0,… , xj−1]f ([xj ,… , xn]g − [xj−1,… , xn−1]g) =

n∑

j=1(xj − x0)[x0,… , xj]f [xj ,… , xn]g+

+n∑

j=1(xn − xj−1)[x0,… , xj−1]f [xj−1,… , xn]g,

Dividiendo para xn − x0, obtenemos

[x0,… , xn](fg) =n−1∑

j=1

xj − x0xn − x0

[x0,… , xj]f [xj ,… , xn]g + [x0,… , xn]f [x0]g+

[x0]f [x0,… , xn]g +n−1∑

j=1

xn − xjxn − x0

[x0,… , xj]f [xj ,… , xn]g =

n∑

j=0[x0,… , xj]f [xj ,… , xn]g.

80

Page 81: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Fórmula de Genocchi-HermiteLas diferencias divididas admiten una representación integral llamada fór-

mula de Genocchi-Hermite. Para obtener dicha representación integral necesi-tamos considerar integrales simpliciales.

Recordemos que un símplex n-dimensional es la cápsula convexa de n + 1puntos independientes P0,… , Pn de un espacio afin, es decir

[P0,… , Pn] ∶={

n∑

i=0tiPi ∣ t0,… , tn ≥ 0,

n∑

i=0ti = 1

}

,

donde P1−P0,… , Pn−P0 son vectores linealmente independientes. Los puntosP0,… , Pn reciben el nombre de vértices del simplex. Si elegimos como vérticesP0 = 0 el origen y Pi = ei = (0,… , 0, 1, 0,… , 0) el i-ésimo vector canónico seobtiene el símplex estándar en ℝn

Sn = {(t1,… , tn) ∈ ℝn ∣ t1,… , tn ≥ 0,n∑

i=1ti ≤ 1}.

Observemos que todo simplex n-dimensional es la imagen afín del simplex es-tándar a través del cambio de variables afín

(t1,… , tn) ∈ ℝn → P0 +n∑

i=1t1(Pi − P0).

SiP0, P1,… , Pn ∈ ℝn, podemos expresar el volumen n-dimensional del simplex[P0, P1,… , Pn] en términos del volumen n-dimensional del símplex estándar

voln[P0, P1,… , Pn] = det(P1 − P0,… , Pn − P0) voln(Sn).

Para calcular

voln(Sn) = ∫Sn

dt1⋯ dtn = ∫

1

0 ∫

1−t1

0⋯∫

1−(t1+⋯+tn−1)

0dtn⋯ dt1

utilizaremos el cambio de variables

sj =n∑

i=jti, j = 1,… , n,

cuyo cambio inverso es

tj = sj − sj+1, j = 1,… , n − 1, tn = sn.

81

Page 82: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Entonces tenemos

Sn = {(s1 − s2,… , sn−1 − sn, sn) ∣ 0 ≤ sn ≤ sn−1 ≤ ⋯ ≤ s1 ≤ 1}

El cambio de variables es lineal con determinante 1, lo que implica que no seproduce un cambio de volumen, es decir,

voln Sn = voln{(s1, s2,… , sn) ∣ 0 ≤ sn ≤ sn−1 ≤ ⋯ ≤ s1 ≤ 1}.

Por tanto, tenemos

voln Sn = ∫

1

0 ∫

s1

0⋯∫

sn−1

0dsn⋯ ds1.

Para calcular la integral del segundo miembro, introducimos la función auxiliar

vn(s) ∶= ∫

s

0 ∫

s1

0⋯∫

sn−1

0dsn⋯ ds1.

Veamos por inducción que vn(s) = sn∕n!. Si n = 1, tenemos

v1(s) = ∫

s

0ds1 = s.

Supongamos que la fórmula es válida para n − 1, entonces

vn(s) = ∫

s

0vn−1(s1)ds1 = ∫

s

0

sn−11

(n − 1)!ds1 =

sn

n!.

De ahí deducimos quevoln Sn = vn(1) =

1n!.

Nota. El volumen del símplex estándar puede deducirse a través de un argu-mento geométrico. El hipercubo [0, 1]n puede dividirse en n! simplices

{(s1, s2,… , sn) ∣ 0 ≤ s�(n) ≤ s�(n−1) ≤ ⋯ ≤ s�(1) ≤ 1}, � ∈ Σn,

donde Σn denota el grupo simétrico de todas las permutaciones de las cifras{1,… , n}. La suma de los volúmenes de todos esos símplices debe ser igual alvolumen del hipercubo [0, 1]n. Observemos que la permutación de coordenadasT�(x1,… , xn) = (x�(1),… , x�(n)) es un movimiento euclídeo (directo si y sola-mente si la permutación utilizada es par). Por tanto, todos estos símplices tienenque tener el mismo volumen, que coincide con voln Sn, el volumen del símplexestándar. Deducimos que el volumen del símplex estándar es

voln Sn =voln[0, 1]n

n!= 1

n!82

Page 83: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Definición. La integral simplicial de una función g cuyo dominio de definicióncontiene a [x0,… , xn] se define mediante

∫[x0,…,xn]g ∶= ∫(t1,…,tn)∈Sn

g(x0 + t1(x1 − x0) +⋯ + tn(xn − x0))dt1⋯ dtn.

Con frecuencia se introduce la variable auxiliar t0 = 1 − (t1 +⋯ + tn) paraobtener una fórmula simétrica

∫[x0,…,xn]g = ∫t0,…,tn≥0,t0+⋯+tn=1

g(t0x0 + t1x1 +⋯ + tnxn)dt1⋯ dtn,

que permite deducir que la integral simplicial no depende del orden en que apa-recen x0,… , xn. La integral simplicial admite diferentes expresiones como in-tegrales reiteradas

1

0 ∫

1−t1

0⋯∫

1−(t1+⋯+tn−1)

0g(x0 + t1(x1 − x0) +⋯ + tn(xn − x0))dtn⋯ dt1.

Si aplicamos el cambio sj =∑n

i=j ti, j = 1,… , n, entonces la integral simplicialse transforma en

∫0≤sn≤⋯≤s1≤0g(x0 + s1(x1 − x0) +⋯ + sn(xn − xn−1))ds1⋯ dsn,

de donde deducimos otra expresión de dicha integral en términos de integralesreiteradas

1

0 ∫

s1

0⋯∫

sn−1

0g(x0 + s1(x1 − x0) +⋯ + sn(xn − xn−1))dsn⋯ ds1.

Nota. Sean P0,… , Pn ∈ ℝn tales que P1 − P0,… , Pn − P0 son vectores inde-pendientes. Si g es una función integrable definida en el simplex [P0,… , Pn],podemos relacionar la integral simplicial de la función g con la integral sobreel simplex de g respecto de la medida de Lebesgue. Teniendo en cuenta el Ja-cobiano det(P1 − P0,… , Pn − P0) del cambio de variables que permite definirla integral simplicial

(t1,… , tn) → P0 +n∑

i=1ti(Pi − P0),

se deduce que

∫[P0,…,Pn]g(x)dx1⋯ dxn = det(P1 − P0,… , Pn − P0)∫[P0,…,Pn]

g.

83

Page 84: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

En particular se tiene

∫[P0,…,Pn]1 = voln(Sn) =

1n!.

mientras que

∫[P0,…,Pn]dx1⋯ dxn = voln[P0,… , Pn] =

det(P1 − P0,… , Pn − P0)n!

.

La fórmula de Genocchi-Hermite puede expresarse de forma compacta usan-do integrales simpliciales.Teorema 3.15 (Fórmula de Genocchi-Hermite). Si x0,… , xn ∈ I y f ∈ Cn(I),entonces

[x0,… , xn]f = ∫[x0,…,xn]f (n)

Demostración. Por inducción sobre n. Si n = 1, tenemos para x0 ≠ x1

∫[x0,x1]f ′ = ∫

1

0f ′((1 − t)x0 + tx1)dt =

1x1 − x0 ∫

x1

x0f ′(�)d�

=f (x1) − f (x0)

x1 − x0= [x0, x1]f.

Si x0 = x1 tenemos

∫[x0,x0]f ′ = ∫

1

0f ′(x0)dt = f ′(x0)∫

1

0dt = f ′(x0) = [x0, x0]f.

Supongamos cierta la fórmula para diferencias divididas de orden n−1 y veamosque se verifica para diferencias divididas de orden n. Si x0 = ⋯ = xn, entonces

∫[x0,…,xn]f (n) = ∫(t1,…tn)∈Sn

f (n)(x0)dt1⋯ dtn = f (n)(x0) voln(Sn)

=f (n)(x0)

n!= [x0,… , xn]f.

Si hay dos puntos distintos, podemos suponer sin pérdida de generalidad quexn−1 ≠ xn. Entonces tenemos

[x0,… , xn]f =[x0,… , xn−2, xn]f − [x0,… , xn−2, xn−1]f

xn − xn−1=

1

0 ∫

s1

0⋯∫

sn−2

0[xn−1, xn]g(⋅; s1,… , sn−1)dsn−1dsn−2⋯ ds1,

84

Page 85: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

donde

g(x; s1,… , sn−1) = f (n−1)(

x0 +n−2∑

i=1si(xi − xi−1) + sn−1(x − xn−2)

)

.

Aplicando la fórmula de Genocchi-Hermite para n = 1, y llamando sn = tsn−1tenemos

[xn−1, xn]g(⋅; s1,… , sn) =

sn−1 ∫

1

0f (n)

(

x0 +n−1∑

i=1si(xi − xi−1) + tsn−1(xn − xn−1)

)

dt =

sn−1

0f (n)

(

x0 +n−1∑

i=1si(xi − xi−1) + sn(xn − xn−1)

)

dsn.

Por tanto [x0,… , xn]f admite la expresión

1

0 ∫

s1

0⋯∫

sn−2

0 ∫

sn−1

0f (n)

(

x0 +n∑

i=1si(xi − xi−1))

)

dsn dsn−1 ⋯ ds1,

lo que muestra que[x0,… , xn]f = ∫[x0,…,xn]

f (n).

Como consecuencia de la fórmula de Genocchi-Hermite se deduce la conti-nuidad de las diferencias divididas respecto a sus argumentos y la del polinomiode interpolación respecto a los nodos.

Proposición 3.16. Sea f ∈ Cn(I).(a) La función (x0,… , xn) ∈ In+1 → [x0,… , xn]f ∈ ℝ es continua.(b) La función (x0,… , xn, x) ∈ In+2 → P (f ; x0,… , xn)(x) es continua.

Demostración. (a) De la fórmula de Genocchi-Hermite, deducimos que la dife-rencia dividida [x0,… , xn]f puede expresarse mediante la integral paramétrica

1

0 ∫

s1

0⋯∫

sn−1

0f (n)(x0 + s1(x1 − x0) +⋯ + sn(xn − xn−1))dsn⋯ ds1.

Como f (n) ∈ C(I), deducimos de los teoremas de dependencia de una in-tegral respecto a sus parámetros que [x0,… , xn]f depende continuamente de

85

Page 86: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

x0,… , xn. Para demostrar (b), basta con comprobar que cada uno de los térmi-nos de la fórmula de Newton del interpolante

P (f ; x0,… , xn)(x) =n∑

k=0[x0,… , xk]f (x − x0)⋯ (x − xk),

son funciones continuas de (x0,… , xn, x).

Diferencias divididas como funcionalesSea I un intervalo, x0, x1,… , xn ∈ I una sucesión extendida de nodos,

m ∶= maxi=0,…,n

m(xi; x0,… , n), m(x; x0,… , xn) = #{i ∈ {0,… , n} ∣ xi = x}.

Los funcionales de Hermite

�i ∶ f ∈ Cm−1(I) → f (ri−1)(xi) ∈ ℝ, ri = #{j ∈ {0,… , i} ∣ xj = xi},

son funcionales lineales y continuos. Como el problema de interpolación deHermite siempre tiene solución única, sabemos que existen polinomios funda-mentales, lj ∈ Pn, j = 0,… , n, determinados por la propiedad

�ilj = �ij , i, j = 0,… , n,

que permiten expresar el polinomio de interpolación mediante la fórmula deLagrange

P (f ; x0,… , xn) =n∑

j=0f (xj) lj .

Tenemos que (l0,… , ln) y (�0,… , �n) forman un par dual. Se deduce que lospolinomios lj , j = 0,… , n, forman una base de Pn. Otra consecuencia intere-sante es la independencia del conjunto de funcionales lineales �i, i = 0,… , n,que generan el espacio vectorial

L ∶= ⟨�0,… , �n⟩.

La fórmula de Newton

P (f ; x0,… , xn) =n∑

i=0[x0,… , xi]f !i

86

Page 87: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

expresa la solución del problema de interpolación de Hermite en términos dela base de Newton !i(x) = (x − x0)⋯ (x − xi−1), i = 0… , n, y las diferenciasdivididas. Tengamos en cuenta que las funciones de la base de Newton se anulancada vez en más puntos. Deducimos que

[x0,… , xi]!j = �ij , i, j = 0,… , n,

de donde (!0,… , !n), ([x0],… , [x0,… , xn]) forman un par dual. Por tanto,(!0,… , !n) forma una base de Pn y ([x0],… , [x0,… , xn]) son funcionales li-nealmente independientes.

Aplicando a la base de Newton, la fórmula de Lagrange deducimos que lasbases de Lagrange y de Newton están relacionadas mediante un cambio trian-gular

!i(x) =n∑

j=i�j!i lj(x), i = 0,… , n.

El cambio inverso se obtiene al aplicar a la base de Lagrange, la fórmula deNewton

lj(x) =n∑

i=j[x0,… , xi]lj !i(x), j = 0,… , n.

Aplicando los funcionales [x0,… , xi] a la fórmula de Lagrange obtenemos

[x0,… , xi] =i

j=0[x0,… , xi]lj �j , i = 0,… , n,

es decir, las diferencias divididas son funcionales que pueden expresarse comocombinación lineal de los funcionales de Hermite. Por tanto, [x0,… , xi], i =0,… , n, son funcionales del espacio L = ⟨�0,… , �n⟩ y, como son funcionalesindependientes, forman una base de L.

Si aplicamos los funcionales �j a la fórmula de Newton obtenemos la rela-ción inversa

�j =j∑

i=0�j!i ⋅ [x0,… , xi], j = 0,… , n.

Los problemas de interpolación de Hermite-BirkhoffUna generalización de los problemas de Hermite polinómicos son los lla-

mados problemas de Hermite-Birkhoff.

87

Page 88: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Problema de interpolación de Hermite-Birkhoff. Dados x0,… , xn ∈ ℝ yenteros no negativos m0,… , mn ∈ ℕ0, encontrar un polinomio p ∈ Pn, tal que

�ip = �if, i = 0,… , n,

donde�if ∶= f (mi)(xi), i = 0,… , n,

son los funcionales que evalúan las derivadas de cierto orden mi de una funciónen los nodos xi, i = 0,… , n.

En los problemas de Hermite-Birkhoff, a diferencia de los problemas deHermite, se permite que aparezcan datos derivada de un orden dado en un puntosin que aparezcan todas las derivadas de menor orden.

Los problemas de Hermite-Birkhoff con polinomios de grado menor o igualque n no tienen por qué tener solución única. El problema de establecer condi-ciones sobre los funcionales que permitan garantizar existencia y unicidad desolución de los problemas de Hermite-Birkhoff no está resuelto y todavía hoyes objeto de estudio.

Afortunadamente es posible demostrar la existencia y unicidad en Pn de al-gunos problemas de Hermite-Birkhoff que aparecen en la práctica.

La deflexión de una viga apoyada en dos soportes y sometida a una densidadde carga w(x) es aproximadamente la solución del problema de contorno deLidstone

y(4)(x) = w(x),y(x0) = y(x1) = 0,y′′(x0) = y′′(x1) = 0,

con x0 < x1.La solución general de la ecuación de cuarto orden es de la forma

f − p, p ∈ P3,

donde f es una solución particular de la ecuación diferencial. Imponer las con-diciones de contorno equivale a plantear el problema de interpolación cúbica deLidstone.Problema de interpolación cúbica de Lidstone. Dada f ∈ C2[x0, x1], en-contrar p ∈ P3 tal que

p(x0) = f (x0), p(x1) = f (x1),p′′(x0) = f ′′(x0), p′′(x1) = f ′′(x1).

88

Page 89: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

-0.2

0

0.2

0.4

0.6

0.8

1

l0 l1

l0 l1^ ^

Figura 3.2. Polinomios de Lagrange para el problema de interpolaciónde Lidstone en el intervalo [0, 1].

Veamos primero la unicidad de solución del problema de interpolación. Su-pongamos que p1, p2 ∈ P3 son soluciones del mismo problema y sea d = p2−p1.Entonces el polinomio d′′ ∈ P1 verifica d′′(x0) = d′′(x1) = 0. Se deduce que(x−x0)(x−x1) divide al polinomio d′′(x), luego d′′(x) = 0 para todo x, lo queimplica que d ∈ P1. Como d(x0) = d(x1) = 0, tenemos (x− x0)(x− x1) divideal polinomio d(x), luego d(x) = 0. Esto muestra la unicidad de solución.

Demostraremos la existencia de solución del problema obteniendo la fór-mula de Lagrange del polinomio de interpolación

p(x) = f (x0)l0(x) + f (x1)l1(x) + f ′′(x0)l0(x) + f ′′(x1)l1(x).

en términos de los polinomios fundamentales del problema

l0(x0) = 1, l0(x1) = l′′0 (x0) = l′′0 (x1) = 0,l1(x1) = 1, l1(x0) = l′′1 (x0) = l′′1 (x1) = 0,l′′0 (x0) = 1, l0(x0) = l0(x1) = l′′0 (x1) = 0,l′′1 (x1) = 1, l1(x0) = l1(x1) = l′′1 (x0) = 0.

Primero resolveremos el problema en el intervalo estándar t ∈ [0, 1] y, me-diante el cambio de variables x = x0 + t(x1 − x0), expresaremos la fórmula deLagrange en un intervalo cualquiera. Claramente l0, l1 deben ser polinomios de

89

Page 90: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

primer grado. De las condiciones de interpolación que verifican estos polino-mios se deduce que

l0(t) = 1 − t, l1(t) = t.Determinaremos ahora l1 y la expresión de l0 se deducirá de la simetría delproblema. Claramente l′′1 (t) = l1(t) y por tanto l1(t) es solución del problema decontorno

y′′(t) = t, y(0) = y(1) = 0.Integrando dos veces vemos que

y(t) = t3

6− p(t),

siendo p(t) el polinomio de primer grado que interpola a la función t3∕6 en lospuntos 0 y 1, es decir

p(t) = t6.

Por tanto tenemosl1(t) =

t3 − t6

Por simetría, deducimos la expresión de

l0(t) = l1(1 − t) =(1 − t)3 − (1 − t)

6.

El polinomio

Λ(t) ∶= t3 − t6

,

recibe el nombre de polinomio cúbico de Lidstone y la fórmula de Lagrangepara el problema de Lidstone

p(0) = y0, p(1) = y1,p′′(0) = z0, p′′(1) = z1,

en el intervalo [0,1] puede expresarse en la forma

p(t) = y0(1 − t) + y1t + z0Λ(1 − t) + z1Λ(t).

Ahora podemos proporcionar la fórmula de Lagrange en un intervalo arbi-trario. Sea p(x) la solución del problema de Lidstone

p(x0) = y0, p(x1) = y1,p′′(x0) = z0, p′′(x1) = z1,

90

Page 91: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Entonces el polinomio q(t) ∶= p(x0 + t(x1 − x0)) verifica las condiciones deinterpolación

q(0) = y0, q(1) = y1,q′′(0) = ℎ2z0, q′′(1) = ℎ2z1,

donde ℎ = x1 − x0 denota la longitud del intervalo [x0, x1]. Obtenemos el po-linomio q resolviendo el problema de interpolación de Lidstone en el intervalo[0, 1]

q(t) = y0(1 − t) + y1t + ℎ2[z0Λ(1 − t) + z1Λ(t)].Deshaciendo el cambio t = (x − x0)∕(x − x1) podemos expresar la solución entérminos de las coordenadas baricéntricas

�0(x) =x1 − xx1 − x0

, �1(x) =x − x0x1 − x0

,

obteniendo la fórmula de Lagrange del interpolante

p(x) = y0�0(x) + y1�1(x) + ℎ2[z0Λ(�0(x)) + z1Λ(�1(x))].

Se deduce de lo anterior la forma de los polinomios fundamentales en un inter-valo cualquiera

l0(x) = �0(x), l1(x) = �1(x),l0(x) = ℎ2Λ(�0(x)), l1(x) = ℎ2Λ(�1(x)),

Teniendo en cuenta que el polinomio cúbico de Lidstone admite la factorización

Λ(t) =−t(1 − t)(1 + t)

6podemos sacar factores comunes en la expresión de la fórmula de Lagrange delinterpolante obteniendo

p(x) = y0�0(x) + y1�1(x) −ℎ2

6�0(x)�1(x)

(

z0(1 + �0(x)) + z1(1 + �1(x)))

.

Interpolación histográmicaUn problema de interpolación que no pertenece a la categoría de los pro-

blemas de Hermite-Birkhoff es el problema de interpolación histográmica. Unhistograma viene expresado por una función escalonada del tipo

s(x) =n∑

i=0yi�[xi,xi+1)(x),

91

Page 92: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

siendo x0 < x1 < ⋯ < xn+1 y �[xi,xi+1)(x) la función característica del interva-lo [xi, xi+1), i = 0,… , n. Los valores yi son valores medios de la magnitud ymedida sobre el intervalo [xi, xi+1],

yi =1

xi+1 − xi ∫

xi+1

xiy(x)dx.

En cierta manera podemos decir que s(x) interpola a la función y(x) en el sentidode que ambas tienen el mismo valor medio sobre el intervalo

1xi+1 − xi ∫

xi+1

xis(x)dx = yi =

1xi+1 − xi ∫

xi+1

xiy(x)dx, i = 0,… , n.

El problema de interpolación histográmica mediante polinomios trata de susti-tuir s(x) por una función suave p ∈ Pn que verifique las condiciones integrales

xi+1

xip(x)dx = yi(xi+1 − xi) = ∫

xi+1

xiy(x)dx, i = 0,… , n.

El problema de interpolación histográmica se reduce a un problema de La-grange. Para ello consideramos P (x) ∶= ∫ x

x0p(t)dt, que es un polinomio de

grado menor o igual que n + 1. Las condiciones de interpolación se reducenentonces a

P (xi) = Ai, i = 0, 1,… , n + 1,siendo A0 = 0 y

Ai =i−1∑

j=0yj(xj+1 − xj) = ∫

xi

x0s(x)dx, i = 1,… , n,

las áreas acumuladas del histograma. El polinomio P verifica las condicionesde interpolación de Lagrange P (xi) = Ai, i = 0,… , n + 1, por lo que quedaunívocamente determinado por la fórmula

P (x) =n∑

i=1Aili(x), li(x) =

j≠i

x − xjxi − xj

.

Por tanto, el problema de interpolación histográmica admite siempre una únicasolución, la derivada de la función P

p(x) = P ′(x) =n∑

i=1Ail

′i(x).

92

Page 93: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

0

1

2

3

4

5

0 1 2 3

Figura 3.3. Polinomio cuadrático de interpolación histográmica

Ejemplo. Se pretende encontrar la función cuadrática que interpola al histo-grama con alturas 2, 1 y 3 sobre los intervalos [0, 1], [1, 2] y [2, 3]. Las áreasacumuladas son A0 = 0, A1 = 2, A2 = 3 y A3 = 6. Obtenemos la tabla dediferencias divididas

xi di0 di1 di2 di30 0 2 −1

212

1 2 1 1

2 3 3

3 6

y calculamos

P (x) = 2x − 12x(x − 1) + 1

2x(x − 1)(x − 2).

Derivando obtenemos el polinomio cuadrático de interpolación histográmica

p(x) = P ′(x) = 2 − 12(2x − 1) + 1

2(3x2 − 6x + 2) = 3x2 − 8x + 7

2.

El problema general de interpolación linealLos problemas de interpolación de Lagrange y de Hermite mediante poli-

nomios admiten diversas generalizaciones. En primer lugar podemos conside-

93

Page 94: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

rar espacios de interpolación U de dimensión finita diferentes de Pn. Los da-tos de interpolación no tienen que ser valores o derivadas sino que pueden serotros funcionales lineales como, por ejemplo, funcionales integrales del tipof → ∫ b

a f (x)w(x)dx.Problema de interpolación lineal general. Dados funcionales lineales �0,… , �ny valores �0,… , �n, encontrar una función u ∈ U tal que

�iu = �i, i = 0,… , n.

Observamos que los problemas de Hermite-Birkhoff y los problemas de in-terpolación histográmica son un caso particular de esta formulación general.

Si fijamos una base (u0,… , un) del espacio vectorial U , entonces toda fun-ción u ∈ U , es de la forma u(x) =

∑nj=0 cjuj(x). Al imponer las condiciones de

interpolación en x0,… , xn tenemosn∑

j=0cj�iuj = �i, i = 0,… , n,

o en forma matricialM

( u0,… , un�0,… , �n

)

c = �

donde c = (c0,… , cn), � = (�0,… , �n) y la matriz de coeficientes es

M( u0,… , un�0,… , �n

)

∶=

�0u0 �0u1 ⋯ �0un�1u0 �1u1 ⋯ �1un⋮ ⋮ ⋱ ⋮

�nu0 �nu1 ⋯ �nun

Por tanto, la existencia y unicidad de solución del problema de interpolaciónlineal general en el espacio U se reduce a discutir si la correspondiente matrizde colocación es no singular, hecho que no depende de la elección de la base(u0,… , un) de U .

El problema continuo de mínimos cuadradosEn algunos problemas no resulta natural imponer la coincidencia de la fun-

ción f definida en un intervalo [a, b] y el interpolante p en unos puntos determi-nados. En cambio, se pretende que el error f−p tenga un buen comportamiento.

94

Page 95: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

El error cuadrático medio en el intervalo [a, b] se define como

1b − a ∫

b

a(f (x) − p(x))2dx.

El problema de determinar una aproximación que minimice el error cuadráticomedio recibe el nombre de problema continuo de mínimos cuadrados.Problema continuo de mínimos cuadrados. Dada f ∈ C[a, b], encontrarp ∈ Pn tal que

b

a(f (x) − p(x))2dx ≤ ∫

b

a(f (x) − q(x))2dx, para todo q ∈ Pn.

Veamos que el problema continuo de mínimos cuadrados puede formularsecomo un problema de mejor aproximación en un espacio normado.

Definición (Mejor aproximación en un espacio normado). Sea F un espaciovectorial de funciones dotado de una norma y sea U un subespacio de F . Seadist(f, g) ∶= ‖f − g‖ la distancia asociada a la norma de dicho espacio. Ladistancia de f al espacio U se define como

dist(f,U ) ∶= ınfu∈U

dist(f, u)

Si u0 ∈ U verificadist(f, u0) = dist(f,U ),

entonces u0 es la mejor aproximación de f en el subespacio U .

La mejor aproximación no existe necesariamente, ya que el ínfimo que de-fine la distancia de una función f a un subespacio U no siempre es accesible.Tampoco tiene que ser única.

Para formular el problema de mínimos cuadrados como un problema de me-jor aproximación introducimos el producto escalar

⟨f, g⟩ ∶= ∫

b

af (x)g(x)dx, f , g ∈ C[a, b],

que da lugar a la norma

‖f‖2 ∶= ⟨f, f ⟩1∕2, f ∈ C[a, b].

Puesto que el error cuadrático medio es ‖f − p‖22∕(b − a), vemos que el pro-blema de mínimos cuadrados puede formularse como un problema de mejoraproximación en F = C[a, b] con la norma ‖ ⋅ ‖2 en el subespacio U = Pn.

95

Page 96: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

El polinomio p es la aproximación de f ∈ C[a, b] que resuelve el problemade mínimos cuadrados si y solamente si ‖f − (p + td)‖22 ≥ ‖f − p‖22 para todot ∈ ℝ y todo d ∈ Pn. Teniendo en cuenta que

‖f − (p + td)‖22 − ‖f − p‖22 = t(2⟨f − p, d⟩ − t‖d‖22), ∀t ∈ ℝ,

la condición anterior equivale a

⟨f − p, d⟩ = 0, ∀d ∈ Pn,

lo cual lleva a la condición de ortogonalidad. El error de aproximación f − pdebe ser ortogonal al espacio de los polinomios de grado menor o igual que n(véase el Teorema ?? para una deducción de la condición de ortogonalidad enun contexto más general). Eligiendo la base de Pn de potencias centradas en unpunto c ∈ [a, b], vemos que la condición de ortogonalidad puede expresarse enla forma

b

ap(x)(x − c)idx = ∫

b

af (x)(x − c)idx, i = 0,… , n.

Sea�if ∶= ∫

b

af (x)(x − c)idx

el momento i-ésimo de f respecto al punto c en el intervalo [a, b]. Entoncesvemos que el problema de mínimos cuadrados equivale al siguiente problema deinterpolación en el que la coincidencia de valores se sustituye por la coincidenciade momentos:.Problema de ajuste de momentos. Encontrar p ∈ Pn tal que

�ip = �if, i = 0,… , n.

El problema continuo de aproximación por mínimos cuadrados en Pn ilustracómo algunos problemas variacionales y de aproximación cuya solución de-pende linealmente de los datos pueden formularse como un problema generalde interpolación lineal.

4. Error de interpolaciónAlgunas funciones son difíciles de manipular. Precisamente, el interpolante

de una función se utiliza como un sustituto de la dicha función, ya que suele ser

96

Page 97: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

más fácil de evaluar, derivar o integrar. Al sustituir una función por su interpo-lante, se comete un error que deseamos estimar o acotar. De ahora en adelantedescribiremos el error como la diferencia f (x) − p(x) entre el valor exacto dela función f (x) y el valor de su aproximación p(x), obtenida mediante interpo-lación. El error será positivo si el valor del interpolante es inferior al valor della función y negativo si lo supera.

El error de dos funciones diferentes que tienen exactamente el mismo inter-polante debe ser distinto. Como ilustración de este hecho, sea p(x) es el polino-mio de interpolación de una función f (x). El error cometido es f (x) − p(x). Elpolinomio de interpolación de la función f (x) = 2f (x) − p(x) es también p(x),pero el error para esta función es ahora el doble f (x) − p(x) = 2(f (x) − p(x)).

Los argumentos anteriores indican que la acotación del error debe dependerde la función que se interpola.

Fórmula del errorLa fórmula de Newton nos permite dar una primera expresión para el error

de interpolación de un problema de Hermite en términos de la derivada (n+1)-ésima de la función que interpolamos.

Teorema 4.1 (Fórmula del error de interpolación). Sea f ∈ Cn+1(I), donde Ies un intervalo que contiene a x0,… , xn. Entonces para cada x ∈ I , el errorde interpolación

E(f ; x0,… , xn)(x) ∶= f (x) − P (f ; x0,… , xn)(x),

puede expresarse en la forma

E(f ; x0,… , xn)(x) = [x0,… , xn, x]f !n+1(x),

donde !n+1(x) ∶=∏n

i=0(x−xi). Además, para cada x ∈ I , existe � ∈ I tal que

E(f ; x0,… , xn)(x) =f (n+1)(�)(n + 1)!

!n+1(x).

Demostración. Añadamos un nuevo nodo y a los nodos x0,… , xn. De la fór-mula de Newton se deduce que

P (f ; x0,… , xn, y)(x) = P (f ; x0,… , xn)(x) + [x0,… , xn, y]f!n+1(x).

Teniendo en cuenta que P (f ; x0,… , xn, y) interpola a f en y, se deduce que

P (f ; x0,… , xn, y)(y) = f (y),

97

Page 98: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

de donde obtenemos

f (y) = P (f ; x0,… , xn)(y) + [x0,… , xn, y]f !n+1(y),

luego

E(f ; x0,… , xn)(y) = f (y) − P (f ; x0,… , xn)(y) = [x0,… , xn, y]f !n+1(y).

La segunda parte se deduce del Teorema del valor medio generalizado, ya que

[x0,… , xn, y]f =f (n+1)(�)(n + 1)!

,

siendo � un punto del menor intervalo que contiene a x0,… , xn y a y.

Cotas del errorLa función que deseamos interpolar puede no estar acotada o su dominio de

definición puede ser un intervalo no acotado, por lo que el interpolante puede noestar acotado. Para acotar el error consideraremos un intervalo compacto [a, b]en el que se encuentran todos los nodos y los puntos en los que queremos acotarel error.

Para describir cotas del error utilizaremos

‖f‖∞ ∶= supx∈[a,b]

|f (x)|

para denotar la norma del supremo de una función acotada en el intervalo [a, b].El teorema anterior nos permite acotar puntual y uniformemente el error en

un intervalo [a, b].Teorema 4.2 (Cotas del error de interpolación). Sean x0,… , xn, x ∈ [a, b],f ∈ Cn+1[a, b],

Mn+1 ∶= maxx∈[a,b]

|f (n+1)(x)| = ‖f (n+1)‖∞

y !n+1(x) =∏n

i=0(x − xi). Entonces el error admite la siguiente acotaciónpuntual

|E(f ; x0,… , xn)(x)| ≤Mn+1

(n + 1)!|!n+1(x)|, x ∈ [a, b].

Además se tiene la cota uniforme

‖E(f ; x0,… , xn)‖∞ ≤Mn+1

(n + 1)!‖!n+1‖∞. (4.1)

Ambas cotas se alcanzan cuando f = !n+1.

98

Page 99: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Demostración. Partiendo de la expresión del error obtenida en el Teorema ??,tenemos

|E(f ; x0,… , xn)(x)| =|f (n+1)(�)|(n + 1)!

|!n+1(x)|.

Las acotaciones se obtienen teniendo en cuenta que

|f (n+1)(�)| ≤ Mn+1, |!n+1(x)| ≤ ‖!n+1‖∞ ∶= maxx∈[a,b]

n∏

i=0|x − xi|.

En el caso de que f = !n+1, tenemos E(!n+1; x0,… , xn) = !n+1 y !(n+1)n+1 (x) =

(n + 1)!, lo que implica que ambas cotas se alcanzan.

Notemos que el tamaño del primer factor en la fórmula (4.1) depende dela función f y de la elección del intervalo [a, b] donde queremos establecerla acotación, mientras que el segundo factor depende de la distribución de lospuntos de interpolación en el intervalo [a, b].

Con frecuencia obtendremos cotas uniformes del error de interpolación deltipo

‖E(f ; x0,… , xn)‖∞ ≤ K‖f (n+1)

‖∞

(n + 1)!.

Tomando f = !n+1, tenemosE(!n+1; x0,… , xn) = !n+1(x), luego ‖!(n+1)n+1 ‖∞ =

(n + 1)!, de donde se deduce que

‖!n+1‖∞ = ‖E(!n+1; x0,… , xn)‖∞ ≤ K.

Por tanto, la constante K = ‖!n+1‖∞ es la mejor constante posible en una cotauniforme del error del tipo K‖f (n+1)

‖∞∕(n+1)! para una distribución de nodosdada x0,… , xn. Sin embargo, el máximo valor de |!n+1(x)| no siempre es fácilde encontrar y nos vemos obligados a proponer en la práctica cotas uniformesmenos ajustadas.

Como x0,… , xn, x ∈ [a, b], tenemos que

|x − xi| ≤ b − a, i = 0,… , n.

Por tanto,‖!n+1‖∞ = max

x∈[a,b]|!n+1(x)| ≤ (b − a)n.

Sustituyendo la cota anterior en (4.1), obtenemos la siguiente cota uniforme delerror

‖E(f ; x0,… , xn)‖∞ ≤Mn+1

(n + 1)!(b − a)n+1, (4.2)

99

Page 100: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

donde Mn+1 ∶= maxx∈[a,b] |f (n+1)(x)| y f ∈ Cn+1[a, b]. Notemos que la cota(4.2) es independiente de la posición de los nodos en el intervalo [a, b].

Las cota anterior da una idea del grado (orden) de aproximación de los inter-polantes de Hermite de una función cuya derivada n+1 está acotada. Si tomamosx0,… , xn, x en un intervalo [a, b] de longitud " ∶= b − a suficientemente pe-queña, entonces el error está uniformemente acotado por Mn+1"n+1∕(n + 1)! yel error tiende a cero cuando " → 0, con un orden de convergencia de gradon + 1.

Ejemplo. En el caso de interpolación en dos nodos a = x0 < x1 = b mediantepolinomios de grado 1, tenemos

E(f ; a, b)(x) = f (x) − f (a) +f (b) − f (a)

ℎ(x − a) = [a, b, x]f (x − a)(x − b).

Llamando M2 = maxx∈[a,b] |f ′′(x)| podemos acotar el error

|E(f ; a, b)(x)| ≤M2

2(x − a)(b − x).

El producto (x − a)(b − x) siempre puede acotarse por (b − a)2 para x ∈ [a, b]como en la fórmula (4.2). La cota puede mejorarse calculando el valor exacto demaxx∈[a,b](x−a)(b−x). Como los nodos coinciden con los extremos del intervalo[a, b], tenemos!2(x) = (x−a)(x−b). Teniendo en cuenta que!′

2(x) = 2x−a−by !′′(x) = 2, deducimos que !2(x) alcanza su máximo valor absoluto en x =(a + b)∕2, lo que permite obtener maxx∈[a,b](x − a)(b − x) = (b − a)2∕4. Portanto, una cota uniforme del error en el intervalo [a, b] es

‖E(f ; a, b)‖∞ ≤M2

2maxx∈[a,b]

(x − a)(b − x) =M2(b − a)2

8.

Ejemplo. Queremos acotar el error de interpolación del polinomio p(x) = x −2x3 + x4 que interpola a la función f (x) = sen(�x)∕� en x0 = x1 = x2 = 0,x3 = x4 = x5 = 1. Teniendo en cuenta que f (6)(x) = −�5 sen(�x), podemosaplicar el Teorema ?? y expresar el error en la forma

e(x) ∶= f (x) − p(x) =�5 sen(��)

720x3(1 − x)3.

Vemos que el error en todos los puntos del intervalo [0, 1] es positivo. Por tan-to, el polinomio de interpolación proporciona valores menores que la función.

100

Page 101: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Teniendo en cuenta que M6 ∶= maxx∈[0,1] |f (6)(x)| = �5, el Teorema ?? nosproporciona la siguiente cota puntual del error

|e(x)| ≤ �5

720x3(1 − x)3.

La aproximación decimal �5∕720 ≈ 0.4250273 nos da una idea del tamaño deesta cota del error. Como la función x(1 − x) alcanza su valor máximo 1∕4 enx = 1∕2, se deduce la siguiente cota global del error

‖e‖∞ ≤ �5

720× 143

= �5

46080≈ 6.641052 × 10−3.

Los errores pueden ser considerablemente menores si el punto está próximo alos extremos del intervalo. Si, por ejemplo, tomamos x = 1∕6, entonces la cotapuntual adopta el valor

|e(1∕6)| ≤ �5

720× 53

66≈ 1.138726 × 10−3.

Evaluando el error exacto

e(1∕6) = 12�

− 2051296

≈ 0.9759307 × 10−3,

podemos comprobar que la cota se verifica.

Error de interpolación en nodos equidistantesVeamos el comportamiento del error de interpolación en el caso de nodos

equidistantes.

Lema 4.3. Sean xi = x0 + iℎ, i = 0,… , n, puntos igualmente espaciados conℎ > 0 y n ≥ 1. Sea !n+1(x) ∶=

∏ni=0(x − xi), entonces

|!n+1(x)| ≤n!4ℎn+1, x ∈ [x0, xn].

Además se tiene

(n − 1)!4

ℎn+1 ≤ maxx∈[x0,xn]

|!n+1(x)| ≤n!4ℎn+1.

101

Page 102: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Demostración. Demostramos la validez de la cota superior por inducción sobren. Para n = 1 tenemos !2(x) = (x − x0)(x − x1), esta función es negativa, nulaen los extremos y alcanza su valor mínimo en x = (x0 + x1)∕2, de donde sededuce que

|!2(x)| ≤ −!2

(x0 + x12

)

=(x1 − x0)2

4= ℎ2

4, max

x∈[x0,x1]|!2(x)| =

ℎ2

4.

Supongamos que la propiedad es cierta para n, y veámosla para n + 1. Comox ∈ [x0, xn+1], tenemos que |x − x0|, |x − xn+1| son menores que xn+1 − x0 =(n + 1)ℎ. Si x ∈ [x0, xn], podemos aplicar la hipótesis de inducción

|!n+2(x)| ≤ |x − xn+1|n

i=0|x − xi| ≤ (n + 1)ℎn!

4ℎn+1 =

(n + 1)!4

ℎn+2,

y si x ∈ [x1, xn], podemos razonar análogamente y deducir que

|!n+2(x)| ≤ |x − x0|n

i=1|x − xi| ≤ (n + 1)ℎn!

4ℎn+1 =

(n + 1)!4

ℎn+2,

en cualquier caso la desigualdad se verifica para un punto más.Por último, tenemos

maxx∈[x0,xn]

|!n+1(x)| ≥ |!n+1(x0 + ℎ∕2)| = 14ℎn+1

n∏

i=2

(

i − 12)

≥ (n − 1)!4

ℎn+1.

Consideremos ahora nodos uniformemente distribuidos en el intervalo [a, b],

xi = a + iℎ i = 0,… , n, ℎ = (b − a)∕n.

Aplicando el Lema ??, tenemos

(n − 1)!4

(b − an

)n+1≤ ‖!n+1‖∞ = max

x∈[a,b]|!n+1(x)| ≤

n!4

(b − an

)n+1.

Sustituyendo la cota superior obtenida para ‖!n+1‖∞ en la fórmula (4.1), pode-mos mejorar la cota (4.2) obteniendo

‖E(f ; x0,… , xn)‖∞ ≤Mn+1

4(n + 1)

(b − an

)n+1, (4.3)

102

Page 103: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

donde Mn+1 ∶= maxx∈[a,b] |f (n+1)(x)| y f ∈ Cn[a, b].Tomando límites en las desigualdades

b − an

((n − 1)!4

)1∕(n+1)≤ ‖!n+1‖

1∕(n+1)∞ ≤ b − a

n

(n!4

)1∕(n+1),

deducimos el crecimiento exponencial de la sucesión de normas ‖!n+1‖∞

lımn→∞

‖!n+1‖1∕(n+1)∞ = b − a

e

para nodos equidistantes en el intervalo [a, b].

Mejor aproximación uniformeLa cota del error del interpolante para distribuciones especiales de los puntos

de interpolación puede mejorarse considerablemente. Estas distribuciones depuntos están relacionadas con las propiedades de aproximación uniforme de lospolinomios.

Definición. Sea U un subconjunto de C[a, b]. Se dice que u∗ ∈ U es la mejoraproximación uniforme (o mejor aproximación en el sentido de Chebyshev) def en U si

‖f − u∗‖∞ = dist∞(f,U ) ∶= ınfu∈U

‖f − u‖∞.

Veamos que siempre existe una mejor aproximación uniforme en espaciosde dimensión finita.

Teorema 4.4. Sea U ⊂ C[a, b] un espacio de dimensión finita y f ∈ C[a, b].Entonces existe, al menos, una mejor aproximación uniforme de f en U .

Demostración. Sea u1,… , un una base cualquiera de U , dimU = n. Entoncesla aplicación lineal

L ∶ (c1,… , cn) ∈ ℝn →n∑

i=1ciui ∈ U

es biyectiva. Observemos que esta aplicación lineal induce una norma en ℝn

‖c‖L ∶= ‖

n∑

i=1ciui

‖∞, c ∈ ℝn.

103

Page 104: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

El problema de encontrar la mejor aproximación uniforme equivale a minimizarla función no negativa

d(c) ∶= ‖

f −n∑

i=1ciui

‖∞, c ∈ ℝn.

De la desigualdad triangular deducimos que

|d(c) − d(b)| ≤ ‖c − b‖L

y, como todas las normas de ℝn son equivalentes, d es una función continua.Sea

K ∶= {c ∈ ℝn ∣ d(c) ≤ d(0)}.

Como d es continua, K = d−1[0, d(0)] es un conjunto cerrado. Aplicando denuevo la desigualdad triangular deducimos que

‖c‖L ≤ d(c) + d(0) ≤ 2d(0), ∀c ∈ K,

y, como todas las normas son equivalentes, K es un conjunto acotado. Por elTeorema de Heine-Borel, K es un compacto. Como 0 ∈ K , vemos que K no esvacío. Aplicando el Teorema de Weierstrass, deducimos que d alcanza su valormínimo en K en algún vector c∗ ∈ K . Observemos que si c ∉ K , entoncesd(c) ≥ d(0) ≥ d(c∗), por lo que

d(c∗) = mınc∈ℝn

d(c).

La propiedad de mínimo de c∗ implica que u∗ =∑n

i=1 c∗i ui es la mejor aproxi-

mación uniforme de f en U .

Aplicando el resultado anterior al espacio U = Pn de los polinomios degrado menor o igual que n, vemos que la mejor aproximación uniforme de unafunción por polinomios de Pn en un intervalo [a, b] siempre existe.

Estudiemos ahora el problema de aproximación uniforme en P0, el espaciode funciones constantes. Sea

d(c) ∶= ‖f − c‖∞ = maxx∈[a,b]

|f (x) − c|.

Consideremos los valores extremos de la función f (x) en el intervalo [a, b]

M ∶= maxx∈[a,b]

f (x), m ∶= mınx∈[a,b]

f (x).

104

Page 105: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Entonces los valores extremos de f (x) − c son M − c y m − c, de donde sededuce que

d(c) = max(|M − c|, |m − c|), c ∈ ℝ.Observemos que si c ∉ [m,M], tenemos d(c) ≥ M − m, mientras que

d(c) = max(M − c, c − m) ≤ M − m, c ∈ [m,M].

Por tanto, la mínima distancia d(c) se encuentra para c ∈ [m,M]. La funciónd(c) es lineal a trozos en [m,M]

d(c) ={

M − c si c ∈ [m, (M + m)∕2],c − m si c ∈ [(M + m)∕2,M],

decreciente en el intervalo [m, (M + m)∕2] y creciente en el intervalo [(M +m)∕2,M]. Así que el valor mínimo de d se alcanza para c = (M + m)∕2 y es(M − m)∕2.

De esta manera queda resuelto el problema de encontrar la mejor aproxi-mación uniforme por constantes. La constante c que mejor aproxima a f en elintervalo [a, b] es

c =maxx∈[a,b] f (x) + mınx∈[a,b] f (x)

2,

siendodist(f, P0) =

maxx∈[a,b] f (x) − mınx∈[a,b] f (x)2

.

En la resolución del problema de mejor aproximación uniforme por constan-tes están involucrados los extremos de la función que pretendemos aproximar.El análisis de las oscilaciones extremas del error es una herramienta clave paraobtener soluciones de este problema. P. L. Chebyshev obtuvo caracterizacionesde la mejor aproximación uniforme en términos de las propiedades de oscilacióndel error.

Definición. Sea e ∶ I → ℝ y x0 < x1 < … < xn < xn+1 puntos de I quedenominaremos nodos. Se dice que e tiene una oscilación o alternancia fuerteen los nodos x0,… , xn+1, si existe s ∈ {−1, 1} tal que

s(−1)ie(xi) > 0, i = 0,… , n + 1.

Se dice que la función e tiene una oscilación o alternancia débil en los nodosx0,… , xn+1, si existe s ∈ {−1, 1} tal que

s(−1)ie(xi) ≥ 0, i = 0,… , n + 1.

105

Page 106: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Si e es una función acotada y ‖e‖∞ ∶= supx∈I |e(x)|, decimos que e tiene unaequioscilación extrema o alternancia de Chebyshev en los nodos x0,… , xn+1,si existe s ∈ {−1, 1} tal que

s(−1)ie(xi) = ‖e‖∞, i = 0,… , n + 1.

Toda alternancia fuerte es una alternancia débil. También toda alternanciade Chebyshev es una alternancia débil. Si e es una función no nula, una alter-nancia de Chebyshev en n+2 nodos significa que la restricción de e al conjuntode puntos en los que la función toma su valor extremo

{x ∈ I ; |e(x)| = ‖e‖∞}

tiene una alternancia fuerte en n + 2 nodos.Veamos que los polinomios no nulos de grado menor o igual que n no pueden

tener alternancias en más de n + 1 nodos.

Lema 4.5 (Propiedades de oscilación de los polinomios). Sea p ∈ Pn un poli-nomio de grado menor o igual que n.

(a) Si p tiene una alternancia fuerte en k + 1 nodos, entonces k ≤ n.(b) Si p tiene una alternancia débil en n + 2 nodos, entonces p = 0.

Demostración. (a) Supongamos que p tiene una alternancia fuerte en k+1 nodosx0 < ⋯ < xk. Como p(xi) ≠ 0, i = 0,… , k, p es un polinomio no nulo. Por elTeorema de Bolzano, existen �i ∈ (xi, xi+1), i = 0,… , k−1, tales que p(�i) = 0.Así que (x− �0)⋯ (x− �k−1) divide al polinomio p(x), de donde se deduce quek ≤ grad p ≤ n.

(b) Sean x0 < ⋯ < xn+1 y s ∈ {−1, 1} tales que

s(−1)ip(xi) ≥ 0, i = 0,… , n + 1.

Supongamos que existe j ∈ {0,… , n + 1} tal que s(−1)jp(xj) > 0. Sea d ∈ Pnla solución del problema de interpolación

d(xi) = s(−1)i, i ∈ {0,… , n + 1} ⧵ {j}.

Tomando " > 0 tal que "|d(xj)| < |p(xj)|, el polinomio q(x) ∶= p(x) + "d(x)verifica

s(−1)jq(xj) = s(−1)jp(xj) + "s(−1)jd(xj) ≥ |p(xj)| − "|d(xj)| > 0,

ys(−1)iq(xi) = s(−1)ip(xi) + "s(−1)id(xi) = |p(xi)| + " > 0,

106

Page 107: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

para todo i ∈ {0,… , n + 1} ⧵ {j}. Por lo tanto, el polinomio q ∈ Pn tiene unaalternancia fuerte en los nodos x0,… , xn+1, en contradicción con (a). Por tanto

p(xi) = 0, i = 0,… , n + 1,

y p ∈ Pn tiene n + 2 ceros distintos. Por el teorema fundamental del álgebra, elpolinomio p debe ser nulo.

El Teorema de alternancia caracteriza a la mejor aproximación uniforme deuna función f ∈ C[a, b] por polinomios de Pn en términos de equioscilacio-nes extremas del error. Chebyshev sugirió la propiedad de alternancia en 1854.Más tarde, en 1905, E. Borel proporcionó la primera demostración rigurosa delTeorema de alternancia.

Teorema 4.6 (Teorema de alternancia). Sea f ∈ C[a, b] y p ∈ Pn. Si el errorf −p tiene una alternancia de Chebyshev en n+2 nodos, entonces p es la únicamejor aproximación uniforme de f por polinomios de grado menor o igual quen. Recíprocamente, la mejor aproximación uniforme p∗ de una función continuaf ∈ C[a, b] por polinomios de Pn, existe, es única y el error de la aproximaciónf − p∗ presenta una alternancia de Chebyshev en n + 2 nodos.

Demostración. Sean x0 < x1 < ⋯ < xn < xn+1 los nodos correspondientes ala alternancia de Chebyshev de f − p. Sea s ∈ {−1, 1} tal que

s(−1)i(f (xi) − p(xi)) = ‖f − p‖∞, i = 0,… , n + 1.

Sea q ∈ Pn una aproximación mejor que p, es decir,

‖f − q‖∞ ≤ ‖f − p‖∞.

Llamando d = q − p, vemos que d ∈ Pn presenta una alternacia débil en losnodos x0 < x1 < ⋯ < xn < xn+1 con los mismos signos que f − p

s(−1)id(xi) = s(−1)i(f (xi) − p(xi)) − s(−1)i(f (xi) − q(xi))≥ ‖f − p‖∞ − ‖f − q‖∞ ≥ 0, i = 0,… , n + 1.

Por el Lema ?? (b), d = 0. Así que q = p, lo que muestra que p es la mejor apro-ximación y además es el único polinomio de Pn tal que ‖f−p‖∞ = dist∞(f, Pn).

Para la demostración del recíproco, en vista del Teorema ??, es suficientecon ver que, si f − p no tiene una alternancia de Chebyshev en n + 2 nodos,entonces p no puede ser una mejor aproximación uniforme de f . Sea

X ∶= {x ∈ [a, b]; |f (x) − p(x)| = ‖f − p‖∞},

107

Page 108: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

el conjunto de puntos en los que el error toma el valor extremo. Como f − p notiene alternancias de Chebyshev en n + 2 nodos, ‖f − p‖∞ ≠ 0 y el número decambios de signo estricto de la función f − p en el conjunto X es un número kmenor que n + 1. Entonces podemos elegir

a < �1 < ⋯ < �k < b

con �1,… , �k ∈ (a, b) ⧵ X de modo que f − p tiene signo constante en cadasubconjunto

X ∩ [a, �1), X ∩ (�i, �i+1), i = 1,… , k − 1, X ∩ (�k, b].

Por tanto, existe s ∈ {1,−1} tal que

d(x) ∶= s(x − �1)⋯ (x − �k) ∈ Pn

es un polinomio tal que

sign(f (x) − p(x)) = sign d(x), x ∈ X.

El hecho de que podamos encontrar un polinomio d(x) cuyos signos coincidencon los de f (x) − p(x) sobre el conjunto X nos permite deducir que existe unpolinomio de la forma p(x) + "d(x), con " > 0 suficientemente pequeño, queaproxima a f (x) mejor que p(x).

Seag(x) ∶= d(x)(f (x) − p(x)), x ∈ [a, b].

Por definición, g es una función continua en [a, b] y positiva sobre X. Como Xes compacto, la función g alcanzará su valor mínimo en X. Sea

m = mınx∈X

g(x) > 0.

Entonces el conjunto

Y ∶= {x ∈ [a, b] ∣ g(x) ≤ m∕2}

es un compacto disjunto con X. Por tanto

maxx∈Y

|f (x) − p(x)| < ‖f − p‖∞.

Sear ∶= ‖f − p‖∞ − max

x∈Y|f (x) − p(x)| > 0,

108

Page 109: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

y " tal que0 < " < mın(m∕‖d‖2∞, r∕‖d‖∞).

Entonces tenemos

(f (x) − p(x) − "d(x))2 = (f (x) − p(x))2 − "(2g(x) − "d(x)2).

Teniendo en cuenta que "d(x)2 ≤ "‖d‖2∞ < m, se deduce la desigualdad

(f (x) − p(x) − "d(x))2 < (f (x) − p(x))2 − "(2g(x) − m).

Si x ∈ [a, b] ⧵ Y , entonces g(x) > m∕2, de donde deducimos que

|f (x) − p(x) − "d(x)| < |f (x) − p(x)|, ∀x ∈ [a, b] ⧵ Y .

Por otro lado, como "|d(x)| ≤ "‖d‖∞ < r, tenemos

|f (x) − p(x) − "d(x)| ≤ |f (x) − p(x)| + "|d(x)| < |f (x) − p(x)| + r.

Deducimos de la definición de r que

|f (x) − p(x)| + r ≤ ‖f − p‖∞, ∀x ∈ Y ,

obteniendo la desigualdad

|f (x) − p(x) − "d(x)| < ‖f − p‖∞, ∀x ∈ Y .

Por tanto, existe " > 0 tal que ‖f − p − "d‖∞ < ‖f − p‖∞ y p no es la mejoraproximación de f en Pn.

A veces no es fácil encontrar la mejor aproximación uniforme ni obtener elvalor de dist∞(f, Pn). Para muchos propósitos es suficiente encontrar una buenaaproximación que permita estimar dist∞(f, Pn). El Teorema de de la Vallée-Poussin permite deducir cotas inferiores de dist∞(f, Pn).

Teorema 4.7 (Teorema de de la Vallée-Poussin). Sea f ∈ C[a, b] y p ∈ Pn talque f − p tiene una alternancia fuerte en n + 2 nodos x0 < ⋯ < xn de [a, b].Entonces dist∞(f, Pn) ≥ mıni=0,…,n+1 |f (xi) − p(xi)|.

Demostración. Si la conclusión fuera falsa, entonces existiría un polinomiop0 ∈ Pn tal que

‖f − p0‖∞ < mıni=0,…,n+1

|f (xi) − p(xi)|.

109

Page 110: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Sea s = sign(f (x0) − p(x0)), entonces s(−1)i(f (xi) − p(xi)) = |f (xi) − p(xi)|,para i = 0,… , n + 1. Teniendo en cuenta que p0 − p = (f − p) − (f − p0),deducimos que

s(−1)i(p0(xi) − p(xi)) = s(−1)i(f (xi) − p(xi)) − s(−1)i(f (xi) − p0(xi))> |f (xi) − p(xi)| − ‖f − p0‖∞ > 0, i = 0,… , n + 1.

Por tanto p0 − p tiene una alternancia fuerte en x0,… , xn+1, en contradiccióncon el Lema ?? (a).

Ejemplo. Se busca encontrar la mejor aproximación uniforme de la función

f (x) = sen �x2, x ∈ [0, 1]

por polinomios de grado 1.Antes de determinarla, observamos que la función p(x) = x+ 1

10parece una

buena estimación de la mejor aproximación uniforme. Vamos a proporcionaruna estimación de la distancia de p a f . Como f−p es una función estrictamentecóncava alcanza el valor mínimo −1∕10 en los extremos y el único máximo seencuentra en el punto crítico de f − p. Derivando tenemos

f ′(x) − p′(x) = �2cos �x

2− 1.

Al igualar a cero obtenemos la posición del punto crítico

� = 2�arc cos 2

�≈ 0.56066418,

de donde deducimos que

‖f − p‖∞ = f (�) − p(�) = 1�

�2 − 4 − 2�arc cos 2

�− 1∕10 ≈ 0.11051366.

Utilizando el Teorema de La Vallée-Poussin con la alternancia 0, �, 1 deducimosque dist(f, P1) > mın(1∕10, |f (�) − p(�)|) = 1∕10. Por tanto, la aproximaciónpropuesta está próxima a la mejor aproximación uniforme.

Si queremos determinar la mejor aproximación uniforme, debemos imponerla existencia de una alternancia de Chebyshev en 3 nodos. Como la función fes estrictamente cóncava, se deduce que f − p∗ deberá alcanzar su mínimo enlos extremos y su máximo en un punto interior. Llamando b = ‖f − p∗‖∞,deducimos que

p∗(0) = f (0) + b = b, p∗(1) = f (1) + b = 1 + b,

110

Page 111: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

0

0.2

0.4

0.6

0.8

1

1.2

0 0.2 0.4 0.6 0.8 1

sin(pi*x/2)x+0.10525683

Figura 4.1. La mejor aproximación uniforme de la función sin(�x∕2) en [0, 1]por polinomios de primer grado

lo que implica que p∗(x) = x+b. Como p∗ difiere de p en una constante, el puntocrítico de f − p∗ coincide con el de f − p, � = 2 arc cos(2∕�)∕�, obteniéndosela relación

b = f (�) − p∗(�) = 1�

�2 − 4 − 2�arc cos 2

�− b,

lo que permite obtener

‖f − p∗‖∞ = b = 12�

�2 − 4 − 1�arc cos 2

�≈ 0.10525683,

mejorando la aproximación inicialmente propuesta.

Nodos de ChebyshevUn problema clásico de aproximación consiste en encontrar la mejor apro-

ximación uniforme en el intervalo [−1, 1] de xn+1 por polinomios de Pn. Esteproblema fue resuelto por P. Chebyshev. Observamos primero que el problemaequivale a encontrar el polinomio mónico de grado n + 1 cuyo máximo valorabsoluto sea mínimo.

Veamos que el Teorema de alternancia nos permite encontrar la solucióna este problema. Sea p∗ la mejor aproximación uniforme en [−1, 1] a xn+1 porpolinomios de Pn. Entonces tenemos que

t(x) ∶= xn+1 − p∗(x)

111

Page 112: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

es un polinomio mónico de grado n + 1 que verifica

m ∶= ‖t‖∞ = dist∞(xn+1, Pn).

Si t tiene una alternancia de Chebyshev en n + 2 nodos del intervalo [−1, 1],entonces p∗(x) = xn+1 − t(x) será la única solución del problema.

La existencia y unicidad de la mejor aproximación uniforme implica queexiste un único polinomio mónico t(x) de grado n+1 que tiene una alternanciade Chebyshev en n + 2 nodos. Veamos que la solución de este problema puedeexpresarse en términos del polinomio de Chebyshev de grado n + 1

Tn+1(x) ∶= cos((n + 1) arc cos x), x ∈ [−1, 1].

De la relaciónTn+1(cos �) + Tn−1(cos �) = cos((n + 1)�) + cos((n − 1)�)

= 2 cos � cos(n�) = 2 cos �Tn(cos �),

deducimos queTn+1(x) = 2xTn(x) − Tn−1(x),

lo que permite demostrar, partiendo de T0(x) = 1, y de T1(x) = x, que Tn+1(x)es un polinomio de grado n + 1 con coeficiente director 2n, para n ≥ 0.

Supongamos que t tiene una alternancia de Chebyshev en la sucesión denodos x0 < ⋯ < xn+1 del intervalo [−1, 1]. Los nodos x1 < ⋯ < xn seencuentran en el interior del intervalo [−1, 1]. Entonces la función t debe tenern extremos relativos en x1 < ⋯ < xn, que serán ceros de la derivada t′(x), esdecir,

t′(xi) = 0, i = 1,… , n.Como t′ es un polinomio de grado n con coeficiente director n + 1, se deduceque

t′(x) = (n + 1)(x − x1)⋯ (x − xn).En particular x0 y xn+1 no pueden ser ceros del polinomio t′(x),

t′(x0) ≠ 0, t′(xn+1) ≠ 0,

y los puntos x0 y xn+1 no pueden encontrase en el interior del intervalo, luego

x0 = −1, xn+1 = 1.

El polinomio m2− t(x)2 ∈ P2n+2 se anula en x0, x1,… , xn+1. Además x1,… , xnson ceros dobles porque t′(xi) = 0, i = 1,… , n. Por tanto

m2 − t(x)2 = (1 − x2)(x − x1)2⋯ (x − xn)2 =(1 − x2)t′(x)2

(n + 1)2.

112

Page 113: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Como t′(1) > 0, deducimos que t(1) = m. Encontremos la solución de la ecua-ción diferencial

t′(x)2 =(n + 1)2

1 − x2(m2 − t(x)2),

que verifica t(1) = m, t′(1) > 0, en un entorno a la izquierda x = 1. Tomandoraíces cuadradas y teniendo en cuenta que t′(1) > 0, deducimos que

t′(x) =(n + 1)

m2 − t(x)2√

1 − x2.

Separando las variables e integrando obtenemos

arc cos(t(x)∕m) = ∫

m

t(x)

d�√

m2 − �2= (n + 1)∫

1

x

d�√

1 − �2= (n + 1) arc cos(x).

Y obtenemos que t(x) coincide con

m cos((n + 1) arc cos x) = mTn+1(x)

en un entorno de x = 1. Como t(x) y Tn+1 son polinomios de Pn+1, se deduceque

t(x) = mTn+1(x), x ∈ [−1, 1].

El coeficiente director de Tn+1 es 2n, luego m = 2−n y t(x) = 2−nTn+1(x).Enunciamos a continuación la propiedad de minimización de los polinomios

de Chebyshev.

Teorema 4.8 (Propiedad de alternancia de los polinomios de Chebyshev). Entretodos los polinomios mónicos de grado n + 1, n ≥ 0, el polinomio 2−nTn+1(x)es el único polinomio que tiene una alternancia de Chebyshev en n + 2 nodos.Además, es el único polinomio entre todos los polinomios mónicos de gradon + 1 que tiene la menor norma uniforme en el intervalo [−1, 1]

2−n = maxx∈[−1,1]

|2−nTn+1(x)| = mınp∈Pn

maxx∈[−1,1]

|xn+1 − p(x)|.

Demostración. Veamos primero que el polinomio de Chebyshev Tn+1(x) tieneuna alternancia de Chebyshev en n + 2 nodos. Como el cambio de variablesx = cos �, � ∈ [0, �], es estrictamente decreciente, basta con comprobar laexistencia de dicha alternancia en la función

cos(n + 1)� = Tn+1(cos �), � ∈ [0, �].

113

Page 114: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Eligiendo �k = k�∕(n + 1), k = 0,… , n + 1, vemos que

cos(n + 1)�k = cos(k�) = (−1)k, k = 0,… , n + 1,

y la función cos(n+1)� tiene una alternancia de Chebyshev en �0,… , �n+1. Portanto, 2−nTn+1(x) es un polinomio mónico de grado n + 1 con una alternanciade Chebyshev en n + 2 nodos.

El hecho de que t(x) sea el polinomio mónico de grado n + 1 con la menornorma ‖⋅‖∞ equivale a afirmar que p∗(x) = xn+1−t(x) es la mejor aproximaciónuniforme a la función xn+1 por polinomios de Pn. Por el Teorema de alternancia,solamente existe un único polinomio t(x) = xn+1 − p∗(x) con esta propiedad, ycoincide con el único polinomio mónico que tiene una alternancia de Chebysheven n + 2 nodos, luego t(x) = 2−nTn+1(x).

Haciendo un cambio de variables, el resultado de Chebyshev implica que elpolinomio

(b − a)n+1

22n+1Tn+1

(2x − a − bb − a

)

es el polinomio mónico de grado n+1 de menor norma uniforme en el intervalo[a, b]. Los ceros de este polinomio son distintos y reales y reciben el nombre denodos de Chebyshev del intervalo [a, b]

xi,n =a + b2

− b − a2

cos( 2i + 12n + 2

�)

, i = 0,… , n.

La elección de los nodos de Chebyshev para un problema de interpolaciónpermite garantizar que !n+1(x) =

∏ni=0(x − xi) tiene la menor norma uniforme

posible.

Proposición 4.9. Sean x0,… , xn ∈ [a, b] y !n+1(x) ∶=∏n

i=0(x− xi). Entoncesse verifica

‖!n+1‖∞ ∶= maxx∈[a,b]

|!n+1(x)| ≥(b − a)n+1

22n+1.

La igualdad se tiene si y solo si x0,… , xn son los nodos de Chebyshev del in-tervalo [a, b], en cuyo caso

!n+1(x) =(b − a)n+1

22n+1Tn+1

(2x − a − bb − a

)

,

donde Tn+1 es el polinomio de Chebyshev de grado n + 1.

114

Page 115: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Demostración. Sean x0,… , xn nodos cualesquiera en [a, b], entonces

ti ∶=2xi − a − b

b − a∈ [−1, 1], i = 0,… , n,

de donde se deduce que

!n+1

(a + b2

+ b − a2

t)

=(b − a

2

)n+1 n∏

i=0(t − ti).

Por tanto

‖!n+1‖∞ =(b − a)n+1

2n+1max

t∈[−1,1]

|

|

|

n∏

i=0(t − ti)

|

|

|

.

Ahora podemos utilizar el resultado demostrado por Chebyshev, 2−nTn+1(t) esel polinomio cuyo maximo valor absoluto en [−1, 1] es el menor posible entretodos los polinomios mónicos de grado n + 1. Así que

maxt∈[−1,1]

|

|

|

n∏

i=0(t − ti)

|

|

|

≥ 2−n maxt∈[−1,1]

|Tn+1(t)| = 2−n,

lo que permite garantizar que

‖!n+1‖∞ ≥ (b − a)n+1

22n+1.

La igualdad se tiene solamente si∏n

i=0(t − ti) = 2−nTn+1(t), lo que equivale aafirmar que

2nn

i=0

2(x − xi)b − a

= Tn+1(2x − a − b

b − a

)

.

Por tanto x0,… , xn son los nodos de Chebyshev del intervalo [a, b] y

!n+1(x) =(b − a)n+1

22n+1Tn+1

(2x − a − bb − a

)

.

Si tomamos los nodos de Chebyshev x0,n… , xn,n, la sucesión de normas‖!n+1(x)‖∞ tiene un crecimiento exponencial

lımn→∞

‖!n+1(x)‖1∕(n+1)∞ = b − a4

,

115

Page 116: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

La tasa de crecimiento (b−a)∕4 es inferior al valor (b−a)∕e que se obtuvo paranodos equidistantes.

Aplicando el resultado anterior a la fórmula (4.1) obtenemos la cota unifor-me del error de interpolación en los nodos de Chebyshev

‖E(f ; x0,… , xn)‖∞ ≤Mn+1

(n + 1)!(b − a)n+1

22n+1, (4.4)

conMn+1 ∶= ‖f (n+1)

‖∞ = maxx∈[a,b]

|f (n+1)(x)|.

Veamos que la cota del error de interpolación en los nodos de Chebyshev (4.4)es la mejor posible entre todas las cotas uniformes del error de interpolación dela forma

‖E(f ; x0,… , xn)‖∞ ≤ Kn‖f (n+1)

‖∞

(n + 1)!que puedan obtenerse al interpolar en nodos x0,… , xn arbitrarios del intervalo[a, b]. En efecto, tomando f = !n+1 y aplicando la Proposición ??, deducimosque

Kn ≥ ‖!n+1‖∞ ≥ (b − a)n+1

22n+1y la igualdad solamente será posible cuando x0,… , xn coincidan con los nodosde Chebyshev del intervalo [a, b].

Comparemos ahora la cota uniforme del error (4.4) con la cota para puntosequidistantes (4.3). Usando la fórmula de Stirling n!∕nn ≈ e−n

2�n, podemosdar una aproximación asintótica de la cota (4.3)

Mn+1

4(n + 1)

(b − an

)n+1≈

Mn+1

4(n + 1)n

2�nn!en

(b − a)n+1

=Mn+1

(n + 1)!(b − a)n+1

22n+1(4e

)n√

�2n

que permite establecer una comparación entre el error cometido al usar los no-dos de Chebyshev y el error cometido con nodos equidistantes (4.3). Se confir-ma que la cota uniforme para nodos de Chebyshev (4.4) es mucho menor que lacorrespondiente para puntos equidistantes (4.3). El factor (4∕e)n se debe al dife-rente crecimiento exponencial que presenta ‖!n+1‖∞ para nodos equidistantesen relación con los nodos de Chebyshev.

La relación anterior entre las cotas del error se traduce en la práctica en unmejor comportamiento de los interpolantes en los nodos de Chebyshev respecto

116

Page 117: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

-4 -2 0 2 4

"equidistantes""Chebyshev"

Figura 4.2. Comparación de los errores de interpolacióncon nodos equidistantes y nodos de Chebyshev

a otras distribuciones de nodos. La Figura 4.2 muestra los errores cometidos porlos interpolantes de grado 7 de la función f (x) = x3∕(1 + x2) en el intervalo[−5, 5] utilizando los nodos equidistantes y nodos de Chebyshev. Observamosque el máximo error de interpolación es menor con nodos de Chebyshev quecon nodos equidistantes. Los nodos equidistantes dan lugar a un menor error enla zona central del intervalo pero los errores son mayores cerca de los extremos.

Los nodos de Chebyshev son las proyecciones sobre el ejeXX′ de los puntosde división de la semicircunferencia de centro ((a + b)∕2, 0) y radio (b − a)∕2en arcos igualmente espaciados (véase Figura 4.3).

Esta interpretación geométrica de los nodos de Chebyshev indica que los no-dos de Chebyshev tienden a concentrarse en los extremos del intervalo cuandon → ∞. La función arco coseno transforma los nodos de Chebyshev del inter-valo [−1, 1] en una sucesión de nodos equidistantes en el intervalo [0, �] (véaseFigura 4.4). Por ello decimos que los nodos de Chebyshev tienen la distribuciónarco coseno.

En general, las elecciones de nodos xi ∈ [−1, 1], i = 0,… , n, tales que

arc cos xi, i = 0,… , n,

117

Page 118: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

a bx0

x1

x2

x3

x4

x5

Figura 4.3. Interpretación geométrica de los nodos de Chebyshev.

0

0.5

1

1.5

2

2.5

3

-1 -0.5 0 0.5 1

Figura 4.4. Distribución arc cos de los nodos de Chebyshev.

118

Page 119: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

tienen una distribución casi uniforme son de gran interés en teoría de aproxima-ción. Por ejemplo, los ceros de los polinomios ortogonales de Legendre Pn+1(x)presentan una distribución próxima a la distribución arco coseno para valoresgrandes de n.

En el estudio de la distribución de puntos de interpolación se utiliza la mé-trica de Dubiner del intervalo [a, b]

d(x, x′) ∶= |

|

|

arc cos 2x − a − bb − a

− arc cos 2x′ − a − bb − a

|

|

|

,

que define distancias proporcionales a las longitudes de los arcos de la semi-circunferencia de centro ((a + b)∕2, 0) y radio (b − a)∕2 comprendidos entrelas abscisas x y x′. Observemos que los nodos de Chebyshev son equidistantesrespecto a la métrica de Dubiner del intervalo [a, b].

Convergencia del interpolante a la funciónPara cada n, elegimos x0,n ≤ ⋯ ≤ xn,n una sucesión extendida de nodos en

[a, b]. Seapn(x) ∶= P (f ; x0,n,… , xn,n)(x),

la sucesión de los polinomios de interpolación. Nos preguntamos si es posibledemostrar que pn → f en cierto sentido. Sea

en(x) ∶= E(f ; x0,n,… , xn,n)(x) = f (x) − pn(x)

el error de interpolación del interpolante pn. La convergencia puntual se produ-cirá si podemos garantizar que en(x) → 0, condición equivalente a

[x0,n,… , xn,n, x]f !n+1(x) → 0, !n+1(x) ∶=n

i=0(x − xi,n).

Si la función es C∞[a, b], podemos deducir la condición suficiente de conver-gencia

lımn→∞

Mn+1

(n + 1)!!n+1(x) → 0, Mn+1 ∶= max

x∈[a,b]|f (n+1)(x)|.

De la fórmula anterior vemos que la convergencia depende de dos factores.Por un lado, el crecimiento asintótico de la sucesión de constantes Mn+1 =‖f (n+1)

‖∞ depende de la función f . Por otro lado, el tamaño de la función !n+1depende de la elección de los nodos de interpolación y de su distribución asin-tótica.

119

Page 120: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

-20

0

20

40

60

80

100

120

140

160

-6 -4 -2 0 2 4 6

grado 3grado 4grado 5

Figura 4.5. Convergencia de los interpolantes de la función exponencial.

Ejemplo (Error al interpolar la función exponencial). Consideremos la funciónexponencial f (x) = exp(x), x ∈ [a, b]. Sea x0,n,… , xn,n una sucesión extendidade nodos en [a, b] y

pn(x) ∶= P (f ; x0,n,… , xn,n)(x), en(x) ∶= f (x) − pn(x).

Entonces tenemos

‖en‖∞ ≤Mn+1

(n + 1)!(b − a)n+1 = exp(b)

(b − a)n+1

(n + 1)!.

Definamos ahora en ∶= exp(b)(b − a)n+1∕(n + 1)!. Teniendo en cuenta queen+1∕en = (b − a)∕(n + 1), vemos que en+1 < en∕2 y en < en02

n0−n para todon ≥ n0 ∶= ⌊2(b − a)⌋. Así que lımn→∞ ‖en‖∞ = 0 y el error de interpolaciónconverge uniformemente a cero, independientemente del intervalo elegido y dela distribución de los nodos en el intervalo.

La Figura 4.5 ilustra la rápida convergencia de los interpolantes de f (x) =exp(x), x ∈ [−5, 5], en puntos equidistantes al aumentar el grado.

El argumento utilizado en el ejemplo anterior muestra que la convergenciauniforme de los interpolantes a la función interpolada cuando elevamos el gra-do sin imponer ninguna condición a la distribución asintótica de los nodos se

120

Page 121: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

garantiza si f ∈ C∞[a, b] y se verifica

lımn→∞

maxx∈[a,b]

|f (n+1)(x)|(b − a)n+1

(n + 1)!= 0. (4.5)

Teniendo en cuenta la fórmula de Lagrange del resto de Taylor, la condición(4.5) implica que f puede desarrollarse en serie de Taylor alrededor de cual-quier punto c ∈ [a, b] con radio de convergencia mayor o igual que |b − a|. Enparticular, f tiene que ser una función analítica en un dominio que contenga alintervalo [a, b].El ejemplo de Runge. En 1901, C. Runge publicó un artículo sobre la inter-polación en puntos equidistantes y llegó a la conclusión de que la sucesión depolinomios de interpolación en puntos equidistantes de un intervalo podía noconverger a la función, incluso aunque la función fuera C∞ o incluso analíticaen dicho intervalo.

La función f (x) = (1 + x2)−1, x ∈ [−5, 5], es analítica en ℂ ⧵ {i,−i},dominio del plano complejo que contiene al intervalo [−5, 5]. Runge demostróque el interpolante en nodos equidistantes diverge. Para cada grado n, tomamos

xi = −5 +10jn

, i = 0,… , n,

y construimos el interpolante pn(x) en dichos puntos. Sea k = ⌊n∕2⌋.Si consideramos el caso de grado par n = 2k, puede demostrarse que la

diferencia dividida de la función (1 + x2)−1 en puntos x0,… , x2k, x es

[x0,… , x2k, x]f =(−1)k−1x

(1 + x2)∏k

j=0(1 + x2j ),

y, si n = 2k + 1, tenemos

[x0,… , x2k+1, x]f =(−1)k−1

(1 + x2)∏k

j=0(1 + x2j ).

Sustituyendo la fórmula anterior en la fórmula del error obtenemos

|

|

|

11 + x2

− pn(x)|

|

|

= 11 + x2

k∏

j=0

|x2 − x2j |

1 + x2j.

Y teniendo en cuenta que

lımk→∞

10nlog

(

k∏

j=0

|x2 − x2j |

1 + x2j

)

= q(x) ∶= ∫

5

0log

(

|x2 − t2|1 + t2

)

dt,

121

Page 122: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

-3

-2

-1

0

1

2

3

4

0 1 2 3 4 5

q

Figura 4.6. La función q(x) = ∫ 50 log

(

|x2−t2|1+t2

)

dt determina la convergencia delinterpolante del ejemplo de Runge.

la convergencia depende del signo de la función q(x).Si q es negativa entonces el producto infinito converge, mientras que si q

es positiva tenemos divergencia. Puede mostrarse que q(x) cambia exactamenteuna vez de signo en el intervalo [0, 5] y que el único cero de la función q en elintervalo [0, 5] es � ≈ 3.6333843. Por tanto, si |x| < �, la sucesión de valorespn(x) converge al polinomio, mientras que si |x| > � diverge.

La Figura 4.7 muestra las gráficas de los interpolantes de grados 2, 8 y 14con objeto de ilustrar este comportamiento de los interpolantes.

La divergencia de la sucesión de interpolantes puede achacarse a la elecciónde los nodos de interpolación. Veamos que para cada función es posible elegirnodos de modo que el interpolante es la mejor aproximación uniforme.

Proposición 4.10 (Propiedad de interpolación de la mejor aproximación unifor-me). Para cada función f ∈ C[a, b] y n ≥ 0, existen nodos x0,n < ⋯ < xn,n en(a, b) tales que P (f ; x0,n,… , xn,n) es la mejor aproximación uniforme de f porpolinomios de Pn en [a, b], es decir,

‖f − P (f ; x0,n,… , xn,n)‖∞ = dist(f, Pn).

Demostración. El teorema de Chebyshev sobre aproximación uniforme de fun-

122

Page 123: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

-4

-3.5

-3

-2.5

-2

-1.5

-1

-0.5

0

0.5

1

-6 -4 -2 0 2 4 6

grado 4grado 8

grado 12

Figura 4.7. El ejemplo de Runge.

ciones por polinomios nos permite garantizar que la mejor aproximación uni-forme p∗n de una función f ∈ C[a, b] por polinomios de Pn siempre existe y esúnica. Además existen n+2 nodos en los que f − p∗n presenta una alternacia deChebyshev. Del Teorema de Bolzano se deduce que f−p∗n se anula en n+1 pun-tos de (a, b). Por tanto, existen puntos x0,n < ⋯ < xn,n en [a, b] (dependientesde f ) tales que p∗n = P (f ; x0,n,… , xn,n).

Determinar elecciones de nodos que nos lleven a la mejor aproximaciónuniforme puede ser una tarea ardua. Para muchos efectos prácticos basta condeterminar sucesiones de nodos próximas a estos, de manera que el interpolantepolinómico sea suficientemente próximo a la mejor aproximación.

Marcinkiewicz en 1936 observó que la convergencia de la sucesión de inter-polantes a una función continua dada puede conseguirse mediante la selecciónapropiada de los nodos. Para demostrar este resultado, usaremos el Teoremade aproximación de Weierstrass, cuyo enunciado sin demostración se ofrece acontinuación.

Teorema 4.11 (Teorema de aproximación de Weierstrass). Para cada f ∈ C[a, b],existe una sucesión de polinomios pn tal que lımn→∞ ‖f − pn‖∞ = 0.

123

Page 124: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

El Teorema de aproximación de Weierstrass equivale a afirmar que

lımn→∞

dist∞(f, Pn) = 0, ∀f ∈ C[a, b].

Aplicando el Teorema de aproximación de Weierstrass al problema de in-terpolación de Lagrange, podemos deducir el resultado de Marcinkiewicz.

Teorema 4.12 (Marcinkiewicz). Para cada f ∈ C[a, b], existen puntos x0,n <⋯ < xn,n tales que la sucesión de interpolantes P (f ; x0,n,… , xn,n) convergeuniformemente a f en [a, b].

Demostración. Por la Proposición ??, existen x0,n,… , xn,n tales que

‖f − P (f ; x0,n,… , xn,n)‖∞ = dist(f, Pn).

Por el Teorema de aproximación de Weierstrass, dist∞(f, Pn) → 0. Por tanto, lasucesión de interpolantes P (f ; x0,n,… , xn,n) converge uniformemente a f .

Constante de Lebesgue de operadores de interpolaciónEl ejemplo de Runge muestra que la interpolación por polinomios de grado

alto puede dar lugar a interpolantes con oscilaciones de amplitud elevada. Estefenómeno se manifiesta en los polinomios de Lagrange

li(x) =∏

j∈{0,…,n}⧵{i}

x − xjxi − xj

, i = 0,… , n,

cuyo valor máximo en valor absoluto tiende a incrementarse al aumentar el nú-mero de puntos. Este comportamiento oscilatorio implica inestabilidad de lainterpolación de Lagrange para un elevado número de puntos.

Dada una sucesión de nodos x0,… , xn distintos, el operador de interpola-ción

L ∶ f ∈ C[a, b] → P (f ; x0,… , xn) ∈ C[a, b]asocia a cada función f su interpolante. Observemos que la imagen de L es elespacio de polinomios Pn de grado menor o igual que n. Además si p ∈ Pn,entonces

L[p] = P (p; x0,… , xn) = p,

es decir el operador L fija los elementos de Pn. Por tanto, el operador de inter-polación es una proyección lineal, ya que

L[L[f ]] = L[f ], ∀f ∈ C[a, b].

124

Page 125: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

El operador error es el operador E = I − L, es decir

E[f ] = f − L[f ],

de modo que toda función f admite la descomposición

f = L[f ] + E[f ].

Observemos que E es también una proyección lineal sobre el espacio de fun-ciones nulas sobre los datos. En efecto

E[E[f ]] = f−L[f ]−L[f−L[f ]] = f−2L[f ]+L[L[f ]] = f−L[f ] = E[f ].

La estabilidad de la interpolación está relacionada con la norma del operadorde interpolación

‖L‖∞ ∶= sup‖f‖∞

‖L[f ]‖∞.

En efecto, supongamos que los datos no proceden de una función f sino de unafunción próxima f . Entonces podemos acotar uniformemente la diferencia delos interpolantes mediante

‖L[f ] − L[f ]‖∞ = ‖L[f − f ]‖∞ ≤ ‖L‖∞‖f − f‖∞.

Pero si ‖L‖∞ es muy grande, podemos tener grandes diferencias entre interpo-lantes procedentes de funciones muy próximas.

Definición. La función de Lebesgue �(x; x0,… , xn) asociada al problema deinterpolación de Lagrange en nodos distintos x0,… , xn se define como la sumade los módulos de las funciones de Lagrange

�(x; x0,… , xn) ∶=n∑

i=0|li(x)|.

Proposición 4.13. Sean x0,… , xn puntos distintos de [a, b]. La función de Le-besgue verifica

�(x; x0,… , xn) ≥ 1,

y alcanza su valor mínimo en los nodos,

�(xj; x0,… , xn) = 1, j = 0,… , n.

125

Page 126: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Demostración. Teniendo en cuenta los polinomios de Lagrange suman 1, (véa-se (1.1)), se deduce que

1 = |

|

|

n∑

i=0li(x)

|

|

|

≤n∑

i=0|li(x)| = �(x; x0,… , xn).

Para evaluar la función de Lebesgue en los nodos, utilizamos li(xj) = �ij obte-niendo

�(xj; x0,… , xn) =n∑

i=0|li(xj)| = 1.

Figura 4.8. Función de Lebesgue de grado 10 para nodos equidistantes.

Definición. El valor máximo de la función de Lebesgue en el intervalo [a, b]

Λ(x0,… , xn) ∶= maxx∈[a,b]

n∑

i=0|li(x)|

recibe el nombre de constante de Lebesgue.

126

Page 127: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Veamos que la constante de Lebesgue es la norma del operador de interpo-lación.

Teorema 4.14. Sea L ∶ C[a, b] → C[a, b] el operador de interpolación enpuntos distintos x0,… , xn de [a, b] dado por

L[f ] = P (f ; x0,… , xn), f ∈ C[a, b],

Entonces

|L[f ](x)| ≤ �(x; x0,… , xn)max(|f (x0)|,… , |f (xn)|)

y la norma de L es la constante de Lebesgue

‖L‖∞ = max‖f‖∞=1

‖L[f ]‖∞ = Λ(x0,… , xn).

Demostración. De la fórmula de Lagrange, deducimos que

|L[f ](x)| = |

|

|

n∑

i=0f (xi)li(x)

|

|

|

≤ max(|f (x0)|,… , |f (xn)|)n∑

i=0|li(x)|,

lo que prueba la primera desigualdad. Entonces tenemos que

‖L[f ]‖∞ ≤ maxx∈[a,b]

�(x; x0,… , xn)max(|f (x0)|,… , |f (xn)|)

= Λ(x0,… , xn)max(|f (x0)|,… , |f (xn)|) ≤ Λ(x0,… , xn)‖f‖∞,

luego ‖L‖∞ ≤ Λ(x0,… , xn).Sea � ∈ [a, b] el punto donde la función de Lebesgue alcanza su valor má-

ximo Λ(x0,… , xn) = �(�; x0,… , xn) y sea s la función lineal a trozos tal ques(xi) = sign(li(�)), i = 0,… , n, que verifica s(a) = s(x0), s(b) = s(xn). Ob-servemos que no todos los valores s(xi) son nulos porque

∑ni=0 li(�) = 1. Por

construcción, tenemos ‖s‖∞ = 1 y además

L[s](�) =n∑

i=0s(xi)li(�) =

n∑

i=0sign(li(�))li(�) = �(�; x0,… , xn),

luego

‖L‖∞ ≥‖L[s]‖∞‖s‖∞

= �(�; x0,… , xn) = Λ(x0,… , xn).

Por tanto ‖L‖∞ = Λ(x0,… , xn) y el supremo que define la norma de L sealcanza para la función s(x) de norma 1.

127

Page 128: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Teniendo en cuenta la Proposición ??, vemos que Λn ≥ 1. La norma deloperador error también puede expresarse en términos de la constante de Lebes-gue

Teorema 4.15. Sean x0,… , xn puntos distintos de [a, b]. La norma del operadorerror de interpolación E ∶ C[a, b] → C[a, b],

E[f ] = f − P (f ; x0,… , xn), f ∈ C[a, b],

es ‖E‖∞ = 1 + Λ(x0,… , xn).

Demostración. Sea L[f ] = P (f ; x0,… , xn). Entonces tenemos

‖E[f ]‖∞ = ‖f − L[f ]‖∞ ≤ ‖f‖∞ + ‖L[f ]‖∞ ≤ (1 + ‖L‖∞)‖f‖∞,

lo que implica que

‖E‖∞ ≤ 1 + ‖L‖∞ = 1 + Λ(x0,… , xn).

Veamos que ‖E‖∞ = 1+Λ(x0,… , xn). Para ello, sea � ∈ [a, b] el punto dondela función de Lebesgue alcanza su valor máximo. Utilizando una función lineala trozos que tome valores s(xi) = − sign(li(�)), i = 0,… , n, y s(�) = 1, tenemosque

E[s](�) = s(�) +n∑

i=0sign(li(�))li(�) = 1 + Λ(x0,… , xn),

de donde se deduce que ‖E‖∞ ≥ |E[s](�)| = 1 + Λ(x0,… , xn).

Estabilidad del problema de interpolaciónLa constante de Lebesgue sirve para estudiar la estabilidad del problema de

interpolación en puntos distintos. Supongamos que los datos yi no son exactossino más bien valores yi próximos a los valores de la función que interpolamos

|yi − yi| ≤ �i, i = 0,… , n.

El interpolante de los datos perturbados p(x) ∶=∑n

i=0 yili(x) puede diferir con-siderablemente del interpolante de la función p(x) ∶=

∑ni=0 yili(x). Acotando

la diferencia

|p(x) − p(x)| ≤ |

|

|

n∑

i=0(yi − yi)li(x)

|

|

|

≤n∑

i=0�i|li(x)|,

128

Page 129: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

se deduce que

|p(x) − p(x)| = �(x; x0,… , xn)max(�0,… , �n),

de modo que la diferencia de los interpolantes en cada punto queda acotada poruna cantidad proporcional a la función de Lebesgue en ese punto por el máximodiferencia entre los datos. De ahí se deduce la siguiente cota uniforme del errorde la perturbación

‖p − p‖∞ ≤ Λ(x0,… , xn)max(�0,… , �n).

Analicemos ahora el comportamiento del error relativo. La propagación delos errores relativos en aritmética de coma flotante depende de la unidad de re-dondeo u. Cuanto menor es la unidad de redondeo, más precisos son los cálcu-los. Por tanto, conviene describir el error de los datos iniciales mediante lasdesigualdades

|yi − yi| ≤ kiu|yi|, i = 0,… , n.

El valor kiu es una cota del error relativo de yi para cada i = 0,… , n. Tomando�i = kiu|yi| en las desigualdades anteriores tenemos

|p(x) − p(x)| ≤ ku�(x; x0,… , xn)‖(y0,… , yn)‖∞,

donde k ∶= max(k0,… , kn). Se deduce que

|p(x) − p(x)||p(x)|

≤ ku�(x; x0,… , xn)‖(y0,… , yn)‖∞

|p(x)|.

La fórmula anterior muestra los tres factores que inciden en el error relativo enel cálculo de un interpolante. En primer lugar, el factor ku en la fórmula co-rresponde a los errores relativos de los datos iniciales. Los valores de ku gran-des pueden conducir a un error relativo excesivo. Esta fuente de error aparececuando se trabaja con aritmética de precisión baja (u grande) o con datos muyimprecisos respecto a la aritmética (k grande). Una segunda fuente de error sur-ge al tener una función de Lebesgue �(x; x0,… , xn) con valores elevados. Estefactor está asociado al operador de interpolación y depende del número y de ladistribución de los nodos. Por último, si el valor del polinomio p(x) en el puntox es muy pequeño respecto al tamaño de los datos, el error relativo en el cálculopuede ser muy grande.

La interpolación de Lagrange da una posible respuesta al problema de re-construir una función a través de sus valores. En el caso de interpolación polinó-mica, la reconstrucción debería ser perfecta si la función dada es un polinomio

129

Page 130: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

de grado menor o igual que n. Desgraciadamente no siempre es posible disponerde datos exactos. Además los algoritmos de evaluación e interpolación llevadosa la práctica cometen necesariamente un error. Este error se debe principalmen-te a la truncación de decimales en la aritmética de coma flotante y dependen delalgoritmo o fórmula elegida ya que estos errores de truncación pueden acumu-larse de manera distinta según el tipo y el orden de las operaciones aritméticasrealizadas. Si partimos de un polinomio p(x), el algoritmo de evaluación nosllevará a valores yi = yi + �i (exactamente la misma situación que si los datosde partida fueran inexactos). Podemos hacer �i suficientemente pequeño incor-porando mejoras en nuestros métodos de evaluación o incluyendo aritmética demayor precisión. En general, no podemos conseguir que �i sea cero ni dedu-cir el valor exacto de �i. Solamente podemos esperar obtener una estimación ouna cota de estos valores. Si ahora queremos reconstruir el polinomio original,obtendremos en su lugar

p(x) =n∑

i=0(yi + �i)li(x) + �(x),

donde la función �(x) puede hacerse muy pequeña mejorando nuestros métodosde interpolación o la precisión de nuestros cálculos. El error en la reconstrucciónp será

p(x) − p(x) = �(x) +n∑

i=0�ili(x).

Podemos escribir

|p(x) − p(x)| ≤ |�(x)| + Λ(x0,… , xn)max(|�0|,… , |�n|)

El signo y tamaño de los errores cometidos es difícil de controlar por lo quees posible que en algunos puntos el error en la reconstrucción llegue a tomarvalores próximos a dicha cota. Por tanto, si Λ(x0,… , xn) es de gran tamaño,puede ser inviable la reconstrucción exacta de un polinomio a través de valorescalculados aunque los algoritmos de evaluación e interpolación cometan en cadapaso errores pequeños y se utilice aritmética de alta precisión.

Condicionamiento e interpolación de LagrangeComo el problema de interpolación de Lagrange es un problema lineal, po-

demos describir dicho problema en términos de aplicaciones lineales. El condi-cionamiento permite comprender cómo se amplifica el tamaño de los errores en

130

Page 131: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

una transformación lineal en términos de una norma. El número de condiciónde una aplicación lineal T biyectiva continua y de inversa continua entre dosespacios normados se define como �(T ) ∶= ‖T ‖‖T −1

‖.Sean x0 < ⋯ < xn una sucesión de nodos distintos en el intervalo [a, b]. La

aplicación evaluación permite asociar a cada polinomio de Pn los valores en losnodos mediante

X ∶ p ∈ Pn →

p(x0)

p(xn)

∈ ℝn+1.

Si dotamos al espacio de polinomios Pn de la norma

‖p‖∞ ∶= maxx∈[a,b]

|p(x)|

y al espacio ℝn+1 de la norma

‖(y0,… , yn)‖∞ ∶= maxi=0,…,n

|yi|,

podemos establecer la relación

‖X[p]‖∞ ≤ ‖p‖∞

y, teniendo en cuenta que ‖X[1]‖∞ = 1 = ‖1‖∞, se deduce que

‖X‖∞ ∶= sup‖p‖∞=1

‖Xp‖∞ = 1.

La existencia y unicidad de solución del problema de interpolación de La-grange nos muestra que X es una aplicación biyectiva, lo que permite construirla aplicación inversa que asocia a cada conjunto de valores su polinomio deinterpolación

X−1 ∶

y0⋮

yn

∈ ℝn+1 →n∑

i=0yili(x) ∈ Pn.

Observemos que

‖X−1(y0,… , yn)‖∞ = maxx∈[a,b]

|

|

|

n∑

i=0yili(x)

|

|

|

≤ ‖(y0,… , yn)‖∞ maxx∈[a,b]

n∑

i=0|li(x)|,

131

Page 132: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

lo que muestra que ‖X−1‖∞ ≤ Λ(x0,… , xn).

Sea � ∈ [a, b], entonces, ‖(sign l0(�),… , sign ln(�))‖∞ = 1 y tenemos ladesigualdad

‖X−1‖∞ ≥ ‖X−1(sign l0(�),… , sign ln(�))‖∞ = max

x∈[a,b]

|

|

|

n∑

i=0sign li(�) li(x)

|

|

|

≥n∑

i=0sign li(�) li(�) =

n∑

i=0|li(�)| = �(�; x0,… , xn).

Elijamos � el punto de [a, b] donde la función de Lebesgue �(x; x0,… , xn) tomasu valor máximo. Entonces tenemos

‖X−1‖∞ ≥ �(�; x0,… , xn) = Λ(x0,… , xn).

Deducimos que‖X−1

‖∞ = Λ(x0,… , xn),

es decir, la constante de Lebesgue es la norma de la inversa de la aplicaciónevaluación en los nodos x0,… , xn para polinomios del espacio Pn.

La norma de X y de X−1 proporcionan una relación entre el tamaño delvector de datos (y0,… , yn) y el tamaño del interpolante correspondiente. Sea(y0,… , yn) el vector de datos y p el polinomio de interpolación correspondiente.Teniendo en cuenta que (y0,… , yn) = X(p) y que p = X−1(y0,… , yn), tenemos

‖(y0,… , yn)‖∞ ≤ ‖p‖∞ ≤ Λ(x0,… , xn)‖(y0,… , yn)‖∞.

Esta misma consideración puede aplicarse al tamaño de la diferencia de datos yal tamaño de los errores �i = yi − yi

‖(�0,… , �n)‖∞ ≤ ‖p − p‖∞ ≤ Λ(x0,… , xn)‖(�0,… , �n)‖∞.

El tamaño de la perturbación del interpolante ‖p − p‖∞ es siempre mayor queel tamaño del error de los datos. Si los datos no son muy precisos, el error quecometemos al calcular el interpolante p−p será muy amplio, incluso aunque losalgoritmos de evaluación e interpolación no cometan error alguno. La máximaamplificación del tamaño de la perturbación del interpolante en términos deerror puede acotarse mediante la constante de Lebesgue Λ(x0,… , xn).

En el caso de la aplicación evaluación X ∶ Pn → ℝn+1, el condicionamientoen norma infinito viene dado por

�∞(X) ∶= ‖X‖∞‖X−1‖∞ = Λ(x0,… , xn).

132

Page 133: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Por tanto, la constante de Lebesgue es el condicionamiento de la aplicación eva-luación en los nodos. Por definición de número de condición �∞(X−1) = �∞(X)y la constante de Lebesgue puede interpretarse como el condicionamiento de laaplicación X−1 ∶ ℝn+1 → Pn, que asocia a cada conjunto de datos su interpo-lante polinómico.

Divergencia de la constante de LebesgueEn el estudio de las series de Fourier trigonométricas encontramos funcio-

nes continuas f tales que la aproximación trigonométrica de grado n, Sn[f ]toma valores de tamaño mucho mayor que ‖f‖∞. Esta propiedad indica que lanorma del operador Sn que asocia a cada función f ∈ C[a, b] su suma trigono-métrica de Fourier de grado n puede tomar valores muy grandes. H. Lebesgue en1909 dedujo la divergencia de ‖Sn‖∞ y a través de esta propiedad de las seriesde Fourier trigonométricas pudo deducir la existencia de funciones continuastales que la serie de Fourier trigonométrica no está acotada, y por tanto, no con-verge uniformemente. En honor de Lebesgue, ‖Sn‖∞ y, en general, las normasde diversos operadores de aproximación e interpolación reciben el nombre deconstantes de Lebesgue.

Este resultado puede extenderse a otras situaciones más generales, dandolugar al resultado de S. Banach y H. Steinhaus (1927), conocido como principiode acotación uniforme que enunciamos a continuación.Principio de acotación uniforme. Sea F un espacio normado completo y Gun espacio normado. Sea Ln ∶ F → G una sucesión de operadores lineales ycontinuos y sea

‖Ln‖ ∶= sup‖f‖=1

‖Ln[f ]‖, n = 0, 1,…

Si lımn→∞ ‖Ln‖ = +∞, entonces existe una función f ∈ F tal que la sucesión‖Ln[f ]‖ no está acotada.

Veamos cómo se aplica el principio de acotación uniforme al estudio de lasseries de Fourier trigonométricas. La sucesión de normas de los operadores desuma de Fourier trigonométrica

‖Sn‖∞ = 2� ∫

−�

| sen[(n + 1∕2)�]|| sen(�∕2)|

d� ≥ 4�2

log(n + 1), n = 0, 1,… ,

está acotada inferiormente por una sucesión de crecimiento logarítmico. Aplicandoel principio de acotación uniforme a la sucesión de operadores Sn, se deduce la

133

Page 134: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

existencia de funciones continuas para las que la serie de Fourier no convergeuniformemente.

Georg Faber en 1914 dedujo que la constante de Lebesgue para el proble-ma de interpolación de Lagrange en una sucesión de n + 1 nodos distintos estáacotada inferiormente por una sucesión de crecimiento logarítmico y basó sudemostración en la propiedad análoga que presentan las normas asociadas alas sumas de Fourier trigonométricas. De la divergencia de la constante de Le-besgue en los procesos de interpolación dedujo su resultado negativo sobre laconvergencia de los interpolantes.

Teorema 4.16 (Teorema de Faber). Sea x0,n,… , xn,n una selección de nodosdistintos en [a, b] para cada n ≥ 0. Entonces existe una función continua f ∈C[a, b] tal que la sucesión ‖f − P (f ; x0,n,… , xn,n)‖∞ no está acotada.

La demostración del teorema de Faber puede generalizarse a otros procesosde aproximación como aproximación por mínimos cuadrados. El siguiente re-sultado general apareció por primera vez en 1948 en un artículo de S. Lozinski.

Teorema 4.17 (Teorema de Kharshiladze-Lozinski). Sea Ln ∶ C[a, b] → Pnuna proyección lineal y continua sobre el espacio de los polinomios de gradomenor o igual que n, para cada n ≥ 0. Entonces existe una función continuaf ∈ C[a, b] tal que la sucesión ‖f − Ln[f ]‖∞ no está acotada.

La demostración se basa en una fórmula integral de Marcinkiewicz que re-laciona proyecciones lineales y continuas con una suma de Fourier n-ésima,dando lugar a la desigualdad

‖I − Ln‖∞ ≥1 + ‖Sn‖∞

2≥ 2

�2log(n + 1) + 1

2.

Del principio de acotación uniforme, se deduce la existencia de una funcióncontinua f ∈ C[a, b] tal que f − Ln[f ] no está acotada.

Continuando el análisis de Faber sobre las normas de los operadores de in-terpolación de Lagrange, varios autores han proporcionado cotas inferiores másprecisas de las constantes de Lebesgue del problema de interpolación de La-grange en n + 1 nodos. En 1978, L. Brutman obtuvo la siguiente cota inferiorde las constantes de Lebesgue de un problema de interpolación de grado n in-dependiente de la distribución de los nodos

Λn >2�

(

log n + log(4�)

+ )

≈ 2�log n + 0.5212516264554,

donde ≈ 0.5772156649015 es la constante de Euler-Mascheroni.

134

Page 135: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

La divergencia de la constante de Lebesgue implica que el condicionamientodel problema de interpolación, la inestabilidad de los algoritmos y la propaga-ción de errores de redondeo aumentan al aumentar el grado del interpolante,por lo que la búsqueda de interpolantes polinómicos con buenas propiedades deaproximación pero de grado muy alto no conduce necesariamente a aproxima-ciones fiables en la práctica.

Los nodos de Chebyshev dan lugar a una elección de nodos de interpolaciónpara los cuales el comportamiento de la constante de Lebesgue es casi óptimo,como muestra la cota dada por T. J. Rivlin

Λn <2�log n + 1.

Por el contrario, para nodos equidistantes la constante de Lebesgue tiene uncrecimiento exponencial.

Proposición 4.18. La constante de Lebesgue Λn correspondiente a la sucesiónde nodos equidistantes

xi,n = a + i(b − a)∕n, i = 0,… , n,

verifica2n−1

n(2n − 1)≤ Λn ≤ 2n.

Demostración. Sea ℎ = (b−a)∕n. Los polinomios de Lagrange correspondien-tes verifican

li,n(a + tℎ) = (−1)n−i(

ni

)

j∈{0,…,n}⧵{i}(t − j)n!

, i = 0,… , n.

Veamos por inducción sobre n que

gi,n(t) ∶=∏

j∈{0,…,n}⧵{i}|t − j| ≤ n!, t ∈ [0, n].

Si n = 1, tenemos que

maxt∈[0,1]

|t| = maxt∈[0,1]

|1 − t| = 1.

Supongamos que la desigualdad es cierta para n − 1 y veamos que se verificapara n. Si t ∈ [0, n − 1], tenemos

gn,n(t) =n−1∏

j=0|t − j| = (n − 1 − t)

n−2∏

j=0|t − j| ≤ (n − 1)gn−1,n−1(t).

135

Page 136: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Si i ≤ n − 1 y t ∈ [0, n − 1], tenemos

gi,n(t) =∏

j∈{0,…,n}⧵{i}|t − j| = (n − t)

j∈{0,…,n−1}⧵{i}|t − j| ≤ ngi,n−1(t).

En ambos casos, podemos usar la hipótesis de inducción y deducir que

gi,n(t) ≤ n!, t ∈ [0, n − 1], i ∈ {0,… , n}.

El caso en que t ∈ [1, n], puede reducirse al anterior, teniendo en cuenta lapropiedad de simetría

gi,n(n − t) = gn−i,n(t), t ∈ [0, n].

Utilizando la desigualdad gi,n(t) ≤ n!, t ∈ [0, n], deducimos que

‖li,n‖∞ = maxx∈[a,b]

|li,n(x)| =(

ni

)

maxt∈[0,n]

gi,n(t)n!

≤(

ni

)

.

de donde se obtiene

Λn ≤n∑

i=0‖li‖∞ ≤

n∑

i=0

(

ni

)

= 2n.

Para la cota inferior partimos de la siguiente fórmula de la constante deLebesgue

Λn = maxt∈[0,n]

�n(t), �n(t) ∶=

∏nj=0 |t − j|

n!

n∑

i=0

(ni

)

|t − i|.

Tomando t = 1∕2, obtenemos

maxt∈[0,n]

�n(t) ≥ �n(1∕2) =14n!

n∏

j=2(j − 1∕2)

n∑

i=0

(ni

)

|i − 1∕2|.

Utilizando las desigualdadesn

j=2(j − 1∕2) ≥ (n − 1)!,

n∑

i=0

(ni

)

|i − 1∕2|≥ 1

n − 1∕2

n∑

i=0

(

ni

)

= 2nn − 1∕2

,

136

Page 137: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

0

10

20

30

40

50

60

70

80

90

1 2 3 4 5 6 7 8 9 10 11 12

n

Λn

Figura 4.9. Crecimiento de la constante de Lebesgue en puntos equidistantes.

deducimos que

Λn ≥(n − 1)!4n!

2nn − 1∕2

= 2n−1n(2n − 1)

.

Una fórmula asintótica para la constante de Lebesgue en puntos equidistan-tes fue obtenida por A. H. Turetskii en 1940

Λn ∼2n+1

en log n, n → ∞.

A. Schönhage en 1961 dedujo independientemente la siguiente fórmula asintó-tica algo más precisa

Λn ∼2n+1

en(log n + ), n → ∞,

donde ≈ 0.5772156649015 es la constante de Euler-Mascheroni.La Figura 4.8 ilustra el crecimiento exponencial de la constante de Lebesgue

correspondiente a nodos equidistantes para grados desde 1 hasta 12.

137

Page 138: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

La Tabla 4.1 muestra los valores de la constante de Lebesgue correspondien-te a puntos equidistantes para grados hasta 70, dando una idea del crecimientode la constante de Lebesgue. A partir de grado 30 toma el tamaño del inversode la unidad de redondeo en precisión simple y a partir de grado 60 el tamañodel inverso de la unidad de redondeo en doble precisión. Si nos conformamossolo con unas pocas cifras significativas y los algoritmos de evaluación e inter-polación no propagan los errores de redondeo en exceso la tabla nos indica queno son recomendables grados superiores a 20 en simple precisión ni superioresa 50 en doble precisión.

n Λn n Λn n Λn

1 1.00 11 51.2 25 2.61×105

2 1.25 12 89.3 30 6.60×106

3 1.63 13 1.58×102 35 1.73×108

4 2.21 14 2.83×102 40 4.67×109

5 3.11 15 5.12×102 45 1.27×1011

6 4.55 16 9.33×102 50 3.63×1012

7 6.93 17 1.72×103 55 1.03×1014

8 10.9 18 3.17×103 60 2.93×1015

9 17.8 19 5.89×103 65 8.30×1016

10 29.9 20 1.10×104 70 2.39×1018

Tabla 4.1. Constante de Lebesgue para puntos equidistantes

El lema de LebesgueLa divergencia de la constante de Lebesgue dificulta el estudio de la con-

vergencia de un interpolante a la función como indica el Teorema de Faber. Lamera continuidad no implica la convergencia y es necesario apelar a la existenciade buenas aproximaciones polinómicas de una función para deducir la conver-gencia. La constante de Lebesgue permite establece una comparación entre elgrado de aproximación del polinomio de interpolación y otras aproximacionespolinómicas mejores del mismo grado. Para deducirlo, demostraremos el Lemade Lebesgue.

138

Page 139: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Teorema 4.19 (Lema de Lebesgue). Sea F un espacio normado y L ∶ F → Uuna proyección lineal y continua sobre el subespacio U de F . Para cada f ∈ Fse tiene

dist(f,U ) ≤ ‖f − L[f ]‖ ≤ ‖I − L‖ dist(f,U ),

dondedist(f,U ) ∶= ınf

u∈U‖f − u‖

es la distancia de f al subespacio U .

Demostración. Como L[f ] ∈ U , se tiene

‖f − L[f ]‖ ≥ ınfu∈U

‖f − u‖ = dist(f,U ).

Por otro lado, dado u ∈ U cualquiera, como L es una proyección lineal sobreU , tenemos que L[u] = u y, por tanto,

(I − L)[f − u] = f − L[f ] − u + L[u] = f − L[f ]

Por definición de norma de un operador, se tiene que

‖f − L[f ]‖ ≤ ‖(I − L)[f − u]‖ ≤ ‖I − L‖ ‖f − u‖,

y, como u ∈ U es arbitrario, se deduce que

‖f − L[f ]‖ ≤ ‖I − L‖ ınfu∈U

‖f − u‖ = ‖I − L‖ dist(f,U ).

Si u∗ ∈ U verifica

‖f − u∗‖ = mınu∈U

‖f − u‖ = dist(f,U ),

entonces u∗ es la mejor aproximación de f en el subespacio U . Observamosque caso de existir la mejor aproximación de f en un subespacio, el Lema deLebesgue nos permite comparar la distancia de una función f a su proyecciónL[f ] en U con la distancia de f a su mejor aproximación u∗ ∈ U

‖f − u∗‖ ≤ ‖f − L[f ]‖ ≤ ‖I − L‖ ‖f − u∗‖.

El siguiente resultado proporciona un criterio para decidir la convergenciade una sucesión de proyecciones de una función f .

139

Page 140: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Teorema 4.20 (Teorema de Lebesgue). Sea F un espacio normado y Ln ∶ F →Un una sucesión de proyecciones lineales y continuas sobre subespacios

0 ≠ U0 ⊂ U1 ⊂ ⋯ ⊂ Un ⊂ ⋯

y sea f ∈ F dada. Si ‖Ln‖ dist(f,Un) → 0, entonces la sucesión Lnf convergea f en norma.

Demostración. Teniendo en cuenta que Ln es una proyección no nula, tenemosque ‖Ln‖ ≥ 1 y

‖I − Ln‖ ≤ 1 + ‖Ln‖ ≤ 2‖Ln‖.

Por el Lema de Lebesgue

‖f − Ln[f ]‖ ≤ ‖I − Ln‖ dist(f,Un) ≤ 2‖Ln‖ dist(f,Un) → 0.

Los resultados de Lebesgue pueden aplicarse a una gran variedad de si-tuaciones tales como interpolación, series de Fourier, aproximación por míni-mos cuadrados, en las que el aproximante se obtiene como una proyección dela solución sobre un subespacio. Aplicando el Lema de Lebesgue al operadorde interpolación L[f ] = P (f ; x0,… , xn) en nodos distintos con ‖I − L‖∞ =1+Λ(x0,… , xn), vemos que la constante de Lebesgue permite comparar el errorde interpolación con dist∞(f, Pn), el error cometido por la mejor aproximaciónuniforme.

Teorema 4.21. Sean f ∈ C[a, b], x0 < ⋯ < xn nodos en [a, b] y Λ(x0,… , xn)la constante de Lebesgue correspondiente. Entonces

dist∞(f, Pn) ≤ ‖f − P (f ; x0,… , xn)‖∞ ≤ (1 + Λ(x0,… , xn)) dist∞(f, Pn).

El Teorema de Lebesgue aplicado a una sucesión de operadores de interpola-ción Ln[f ] ∶= P (f ; x0,n,… , xn,n) proporciona un criterio para la convergenciade una sucesión de interpolantes.

Teorema 4.22. Sea x0,n,… , xn,n una selección de nodos distintos en [a, b] y seaΛn ∶= Λ(x0,n,… , xn,n) la constante de Lebesgue correspondiente para cadan ≥ 0. Sea f ∈ C[a, b] tal que

lımn→∞

dist∞(f, Pn)Λn = 0.

Entonces P (f ; x0,n,… , xn,n) converge uniformemente a f en [a, b].

140

Page 141: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Por tanto, la convergencia de la sucesión de interpolantes depende del pro-ducto de dos factores: Λn cuya velocidad de divergencia depende de la distribu-ción de los nodos y dist∞(f, Pn) cuya velocidad de convergencia a cero dependede la existencia de buenas aproximaciones polinómicas a la función f .

El Teorema de Lebesgue también nos indica que, si la constante de Lebes-gue tiene un crecimiento lento, será posible demostrar la convergencia uniformedel interpolante para un conjunto de funciones más amplio que para una distri-bución de nodos arbitraria.

La capacidad de los polinomios de grado menor o igual que n para apro-ximar una función continua dada f ∈ C[a, b] no parece fácil de estimar, loque constituye un obstáculo para la aplicación del Teorema de Lebesgue. Pre-sentamos a continuación el Teorema de Jackson que permite acotar la distanciadist∞(f, Pn) en términos del módulo de continuidad de la función

!(f ;ℎ) ∶= supx,y∈[a,b];|x−y|≤ℎ

|f (x) − f (y)|,

dando una idea la velocidad de convergencia de la sucesión dist∞(f, Pn).

Teorema 4.23 (Teorema de Jackson). Para toda función f ∈ C[a, b], se verificala desigualdad

dist∞(f, Pn) ≤ 6!(

f ; b − a2n

)

, f ∈ C[a, b].

Nota. El Teorema de aproximación de Weierstrass puede deducirse como unaconsecuencia del Teorema de Jackson. Como toda función f ∈ C[a, b] es uni-formemente continua, se tiene que

lımℎ→0+

!(f ;ℎ) = 0

y, aplicando el Teorema de Jackson, se deduce que

dist∞(f, Pn) ≤ 6!(

f ; b − a2n

)

→ 0, n → ∞.

Convergencia de los polinomios de interpolación en los nodosde Chebyshev

La condición de Dini-Lipschitz se utiliza en el estudio de la convergencia desucesiones de interpolantes en determinadas distribuciones de nodos. Tambiénaparece en el estudio de las series de Fourier trigonométricas.

141

Page 142: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Definición. Una función f ∈ C[a, b] es lipschitziana, si existe L ≥ 0 tal que

|f (x) − f (y)| ≤ L|x − y|, x, y ∈ [a, b]

o equivalentemente, si

!(f ;ℎ) ≤ Lℎ, ℎ ≤ b − a.

Se dice que f ∈ C[a, b] verifica la condición de Dini-Lipschitz si

lımℎ→0+

!(f ;ℎ) log(ℎ−1) = 0.

De la definición se deduce que toda función lipschitziana, verifica la condi-ción de Dini-Lipschitz, ya que

!(f ;ℎ) log(ℎ−1) ≤ −Lℎ logℎ → 0, ℎ → 0+.

El recíproco no es cierto, como puede comprobarse con la función f (x) =|x|� con 0 < � < 1. Si el intervalo [a, b] contiene el origen, entonces !(f ;ℎ) =ℎ� y se verifica la condición de Dini-Lipschitz

lımℎ→0+

!(f ;ℎ) log(ℎ−1) = − lımℎ→0+

ℎ� log(ℎ) = 0,

pero comolımℎ→0+

!(f ;ℎ)ℎ

= lımℎ→0+

1ℎ1−�

= +∞,

no se verifica la condición de Lipschitz.El lento crecimiento de la constante de Lebesgue del problema de interpo-

lación en los nodos de Chebyshev permite obtener interpolantes de grado mo-deradamente alto con ciertas garantías de estabilidad. Además la condición deDini-Lipschitz garantiza la convergencia de la sucesión de interpolantes en losnodos de Chebyshev.

Teorema 4.24. Si f ∈ C[a, b] verifica la condición de Dini-Lipschitz

lımℎ→0+

!(f ;ℎ) log(ℎ−1) = 0,

entonces la sucesión de aproximaciones obtenidas al interpolar f en los nodosde Chebyshev converge uniformemente a f .

142

Page 143: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Demostración. Sea Λn la constante de Lebesgue en los nodos de Chebyshev de[a, b]. En este caso la constante de Lebesgue tiene un crecimiento logarítmicoy se verifica la desigualdad

Λn < 1 + 2�log n.

Por el Teorema de Jackson,

dist∞(f, Pn) ≤ 6!(

f ; b − a2n

)

Por tanto

dist∞(f, Pn)Λn ≤ 6!(

f ; b − a2n

)(

1 + 2�log n

)

= 6!(f, ℎn)(

1 + 2�log b − a

2+ 2�logℎ−1

n

)

,

donde ℎn =b−a2n

→ 0. De la condición de Dini-Lipschitz se deduce que

lımn→∞

dist∞(f, Pn)Λn = 0,

y por el Teorema ??, tenemos la convergencia de la sucesión de interpolantes.

Podemos aplicar el resultado anterior a la función del ejemplo de Runge. Lafunción f (x) = (1 + x2)−1, x ∈ [−5, 5], es una función lipschitziana. Por tanto,la selección de los nodos de Chebyshev da lugar a una sucesión de polinomiosque converge uniformemente a f .

5. Interpolación y funciones splinePuesto que los microprocesadores son capaces de realizar las operaciones

aritméticas elementales: sumas, restas, multiplicaciones, divisiones y tomar de-cisiones, un conjunto natural de funciones definibles mediante instrucciones bá-sicas de los microprocesadores son las funciones racionales a trozos. Dentro deesta clase las funciones polinómicas a trozos juegan un importante papel. Un in-terpolante polinómico a trozos de grado bajo no presenta oscilaciones de tamañomuy superior a los datos, como sucede en el caso polinómico. Esta flexibilidadde las funciones polinómicas a trozos viene acompañada de un condicionamien-to relativamente bajo de los problemas de interpolación por mucho que aumen-temos el número de nodos. Por este motivo, las funciones polinómicas a trozos

143

Page 144: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Figura 5.1. Función interpolante cúbica a trozos.

se utilizan con frecuencia en la resolución de problemas de interpolación conun elevado número de datos. La figura 5.1 ilustra la flexibilidad de un interpo-lante cúbico a trozos correspondiente a datos que alternan variaciones suaves yrápidas de la pendiente.

Interpolación lineal a trozosEl interpolante lineal a trozos, cuya gráfica es la línea poligonal que une los

puntos más cercanos, es una solución apropiada al problema de interpolaciónen el caso de que queramos interpolar un gran número de datos (por ejemplo,una tabla de una función).

Para el conjunto de nodos x0 < ⋯ < xn, sea s(x) el interpolante lineal atrozos de una función f ∈ C2[x0, xn]. Entonces la función s(x) está definida

144

Page 145: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Figura 5.2. Interpolante lineal a trozos.

mediante

s(x) ∶=

x1 − xx1 − x0

f (x0) +x − x0x1 − x0

f (x1), si x ∈ [x0, x1],

x2 − xx2 − x1

f (x1) +x − x1x2 − x1

f (x2), si x ∈ [x1, x2],

⋮xn − x

xn − xn−1f (xn−1) +

x − xn−1xn − xn−1

f (xn), si x ∈ [xn−1, xn],

Para expresar el interpolante, introducimos las llamadas funciones sombreronormalizadas

N0(x) ∶=

x1 − xx1 − x0

, si x0 ≤ x < x1,

0, si x ≥ x1,

145

Page 146: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

N2N1 N3 N4 N5 N6 N7N0

x2x1 x3 x4 x5 x6 x7x0

Figura 5.3. Funciones de Lagrange para interpolación lineal a trozos.

para i = 1,… , n − 1,

Ni(x) ∶=

0, si x0 ≤ x < xi−1,x − xi−1xi − xi−1

, si xi−1 ≤ x < xi,

xi+1 − xxi+1 − xi

, si xi ≤ x < xi+1,

0, si xi+1 ≤ x < xn,

y

Nn(x) ∶=

0, si x < xn−1,x − xn−1xn − xn−1

, si xn−1 ≤ x < xn.

Utilizando las funciones sombrero, el interpolante lineal a trozos queda descritomediante una fórmula compacta

s(x) =n∑

i=0f (xi)Ni(x),

Notemos que las funciones sombrero verifican

Ni(xj) = �ij , i, j ∈ {0, 1,… , n}

por lo que pueden considerarse las funciones fundamentales (también llamadasde Lagrange) del problema de interpolación lineal a trozos.

146

Page 147: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

El error de la aproximación lineal a trozos tiene un análisis muy simple, yaque se reduce al estudio del error de interpolación lineal en cada uno de lossubintervalos.

Para expresar el comportamiento local el error en los subintervalos, deno-taremos mediante

‖f‖[a,b] ∶= supx∈[a,b]

|f (x)|

la norma del supremo de una función acotada en el intervalo [a, b].

Teorema 5.1. Sea a = x0 < x1 < ⋯ < xn = b, una partición del intervalo[a, b] cuya norma es

ℎ ∶= maxi=0,…,n

|xi+1 − xi|.

Sea f ∈ C2[a, b], s el interpolante lineal a trozos en x0,… , xn y E(x) = f (x)−s(x) el error de interpolación. Entonces

‖E‖[xi,xi+1] ≤(xi+1 − xi)2

8‖f ′′

‖[xi,xi+1], i = 0,… , n − 1,

y

‖E‖[a,b] ≤ℎ2

8‖f ′′

‖[a,b].

Demostración. Como s(x) coincide en cada subintervalo [xi, xi+1] con el poli-nomio de interpolación de primer grado en los nodos xi, xi+1, tenemos

|E(x)| ≤(xi+1 − xi)2

8max

x∈[xi,xi+1]|f ′′(x)|, x ∈ [xi, xi+1].

Del resultado anterior, se deduce la convergencia uniforme del interpolan-te lineal a trozos a una función de clase C2 cuando la norma de la particiónasociada a los nodos tiende a cero.

Espacios de funciones splineAhora consideraremos funciones polinómicas a trozos de manera que en

cada subintervalo tengamos un polinomio de grado menor o igual que k conconexión entre subintervalos de clase Ck−1.

147

Page 148: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Definición. Dada una partición del intervalo [a, b]

a = �0 < �1 < ⋯ < �n−1 < �n = b

definimos el espacio de funciones spline de grado k

Sk(�0,… , �n) = {s ∈ Ck−1[a, b] ∶ s|(�i,�i+1) ∈ Pk, i = 0,… , n − 1}.

Los puntos �1,… , �n−1 que determinan la partición reciben el nombre de nudosde la función spline. Los extremos del intervalo �0 = a y �n = b también puedenconsiderarse nudos, por lo que distinguiremos entre nudos interiores y nudosextremos.

En el caso de que k = 0, consideramos que las funciones spline de gradocero son

S0(�0,… , �n) = {s ∶ s|(�i,�i+1) ∈ P0, i = 0,… , n − 1}

funciones constantes a trozos, también llamadas funciones escalonadas.No está claro qué valor debe asignarse a un spline de grado cero en los

puntos de discontinuidad de una función escalonada. Utilizaremos el conveniode continuidad a la derecha, que permite asignar un valor a la función splineen cada punto (incluso en los nudos interiores) y agiliza algunas discusiones.En los extremos del intervalo, el valor del spline será el correspondiente límitelateral para poder tener continuidad en ambos extremos a, b.

Observamos que las funciones características de los intervalos [�i, �i+1), i =0,… , n − 2, y [�n−1, �n]

�[�i,�i+1), i = 0,… , n − 2, �[�n−1,�n],

forman una base del espacio S0(�0,… , �n). Por tanto,

dimS0(�0,… , �n) = n

y toda función escalonada puede expresarse de manera única en la forma

s(x) =n−2∑

i=0ci�[�i,�i+1) + cn−1�[�n−1,�n]

Para n = 1 hemos visto que toda función spline puede expresarse en térmi-nos de la base de funciones sombrero

s(x) =n∑

i=0ciNi(x),

148

Page 149: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

3x+

x+

2x+

0-1 1

0x+

Figura 5.4. Potencias truncadas de grados 0, 1, 2 y 3.

luegodimS1(�0,… , �n) = n + 1.

Nuestro objetivo es demostrar que dimSk(�0,… , �n) = n+k y describir unabase de este espacio para grado arbitrario.

Para expresar una base del espacio de funciones spline, introduzcamos laspotencias truncadas de grado k

xk+ ∶={0, si x < 0,xk, si x ≥ 0.

La potencia truncada de grado 0, es una función discontinua

H(x) ∶= x0+ ={

0, si x < 0,1, si x ≥ 0,

que recibe el nombre de función escalón unitario o función de Heaviside. La fun-ción de Heaviside coincide con la función característica del intervalo [0,+∞),es decir, H(x) = �[0,+∞).

Teorema 5.2 (Dimensión del espacio de funciones spline y base de potenciastruncadas). Sean �0 < �1 < ⋯ < �n. Entonces una base del espacioSk(�0,… , �n)es

1, x,… , xk, (x − �1)k+,… , (x − �n−1)k+. (5.1)

y dimSk(�0,… , �n) = n + k.

Demostración. Procederemos por inducción sobre el número de nudos. Sea a =�0 y b = �n. Como punto de partida recordaremos si no hay ningun nudo interior

149

Page 150: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

(n = 1), entoncesSk(a, b) = Pk[a, b] es el conjunto de las funciones polinómicasde grado menor o igual que k sobre el intervalo [a, b]. Una base de dicho espacioes la base de monomios

1, x,… , xk.luego dimSk(�0, �1) = dimPk[a, b] = k + 1.

Analicemos el caso n = 2 en que solamente hay un nudo interior. En primerlugar observemos que dos polinomios de grado k pueden acoplarse con suavidadCk−1 a la izquierda y derecha de un nudo interior �1. En principio, debemosconsiderar los polinomios p, q ∈ Pk a cada lado del nudo

s(x) ∶={

p(x), si x < �1,q(x), si x ≥ �1,

junto con las condiciones

p(i)(�1) = q(i)(�1), i = 0,… , k − 1.

Para incluir el caso k = 0, consideraremos, por convenio, que un enlace C−1 noconlleva ninguna condición, por lo que la función spline puede ser discontinua.Con objeto de simplificar nuestro problema, consideramos la función

s(x) − p(x) ∶={

0, si x < �1,d(x), si x ≥ �1,

con d(x) ∶= q(x) − p(x). Las condiciones de empalme equivalen a decir queel polinomio d(x) tiene en �1 una raíz de multiplicidad mayor o igual que k, dedonde se deduce que (x − �1)k divide a d(x), luego

d(x) = �1(x − �1)k.

Así que podemos escribir

s(x) = p(x) + �1(x − �1)k+.

Luego toda función spline de grado k y suavidad Ck−1 con un solo nudo puedeexpresarse en la forma

s(x) =k∑

i=0cix

i + �(x − �1)k+.

Esto muestra que 1, x,… , xk, (x−�1)k+, forman un sistema generador del espaciode funciones spline de grado k con un solo nudo, lo que permite deducir que

150

Page 151: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

k + 2 es una cota superior para la dimensión de este espacio. Para deducir laindependencia, consideremos una combinación lineal igual a la función nula

k∑

i=0cix

i + �1(x − �1)k+ = 0, x ∈ [a, b], (5.2)

Teniendo en cuenta que la restricción de sobre el intervalo [a, �1) coincide conun polinomio, tenemos

k∑

i=0cix

i = 0, x ∈ [a, �1].

Como los monomios forman una base de Sk(a, �1) = Pk[a, �1], todos los coefi-cientes ci deben ser nulos por lo que (5.2) implica que

�1(x − �1)k+ = 0, x ∈ [a, b],

y evaluando en x = b tenemos

�1(b − �1)k = 0,

luego �1 = 0. Así vemos que (5.1) es una base del espacio cuando n = 2.Supongamos cierta la propiedad para n − 2 nudos interiores. Dado s ∈

Sk(a, �1… , �n−1, b), su restricción al intervalo [a, �n−1] es una función splinecon un nudo menos excepto en el caso de que k = 0. Si k = 0, el valor coin-cidirá en todos los puntos salvo quizás en �n−1, ya que la función puede serdiscontinua en dicho nudo.

Aplicando la hipótesis de inducción tenemos

s(x) =k∑

i=0cix

i +n−2∑

j=1�j(x − �j)k+, x ∈ [a, �n−1).

Se deduce de las condiciones de empalme en el nudo x = �n−1 que

s(x) −k∑

i=0cix

i −n−2∑

j=1�j(x − �j)k+ = �n−1(x − �n−1)k+,

luego (5.1) es un sistema generador.Para la independencia, considerar una combinación lineal de las funciones

(5.1) que sea idénticamente nula en el intervalo [a, b], es decirk∑

i=0cix

i +n−1∑

j=1�j(x − �j)k+ = 0, x ∈ [a, b].

151

Page 152: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Definamos

s(x) ∶=k∑

i=0cix

i +n−2∑

j=1�j(x − �j)k+.

Entonces tenemos

s(x) + �n−1(x − �n−1)k+ = 0, x ∈ [a, b]. (5.3)

Considerando los x ∈ [a, �n−1), deducimos de (5.3) que s|[a,�n−1] = 0. Por hipó-tesis de inducción, los coeficientes respecto a la base de potencias truncadas enel espacio Sk(a, �1,… , �n−1) son nulos, es decir

ci = 0, i = 0,… , k, �j = 0, j = 1,… , n − 2,

de donde se deduce que la función s es idénticamente nula en [a, b]. Por lo tantola fórmula (5.3) se reduce a

�n−1(x − �n−1)k+ = 0, x ∈ [a, b],

y, evaluando en x = b, tenemos

�n−1(b − �n−1)k = 0,

luego �n−1 = 0. Por tanto, las funciones (5.1) son linealmente independientes.

Nota. Si se requiere que la base contenga potencias centradas en un punto c delintervalo de definición [�0, �n], se pueden sustituir los k+1 primeros elementosde la base por 1, x − c, (x − c)2,… , (x − c)k. La elección de c = �0, permiteidentificar la función básica (x− �0)k con la correspondiente potencia truncada(x − �0)k+, ya que ambas funciones coinciden sobre el dominio [�0, �n].

Elasticidad de barras flexibles y funciones cúbicas a trozosLas funciones spline tienen buenas propiedades de interpolación, son bue-

nos aproximantes y una herramienta flexible para el diseño de curvas. Una jus-tificación de la versatilidad de estas funciones proviene del hecho de que lasfunciones spline cúbicas de clase C2 son un modelo para la forma que adoptauna barra flexible apoyada en sus extremos o empotrada bajo la acción de cargasconcentradas.

Un precedente de los sistemas de diseño que usan un control basado en laelasticidad se encuentra en los métodos tradicionales de ingeniería. La palabra

152

Page 153: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

inglesa spline hace referencia a una barra o varilla flexible sujeta mediante car-gas de plomo empleada en el diseño de curvas. En el caso del diseño de cascosde barcos, las variaciones de la forma se obtenían mediante la acción de cargascontroladas sobre listones o tablones de madera. Algunas de las propiedades delas funciones spline pueden comprenderse mejor analizando las propiedades delos materiales elásticos.

Cuando sobre un cuerpo sólido se ejercen fuerzas cuya resultante es nulade modo que la suma de los momentos de las fuerzas sobre cualquier puntoes cero, el cuerpo se halla en equilibrio estático y no se detectan movimientosperceptibles tales como desplazamientos netos de todo el material en la mismadirección ni movimientos de rotación. Sin embargo, las fuerzas en equilibrio es-tático ejercidas sobre puntos de aplicación diferentes crean un estado de tensiónque se distribuye en el medio elástico. El material sufre deformaciones: se estiraen algunas zonas, en otras se comprime y también puede doblarse o retorcersepara acomodarse al estado de tensión. Los esfuerzos en el material describen elestado de tensión de un sólido elástico y permiten deducir las deformaciones.

El estado de tensión de un sólido puede describirse en cada punto del ma-terial mediante diferentes tipos de esfuerzos. Dependiendo de la acción de lasfuerzas que se ejercen en un entorno del punto, los esfuerzos del material reci-ben nombres diferentes: esfuerzos de tensión, compresión, expansión, flexión,torsión, etc. Los esfuerzos pueden clasificarse en dos tipos fundamentales: es-fuerzos tensiles y esfuerzos cortantes (o de cizalladura). Los esfuerzos tensilescorresponden a la componente de la fuerza normal a la superficie sobre la queactúan y tienden a expandir o comprimir el material a lo largo de esa dirección.Los esfuerzos cortantes corresponden a la componente de la fuerza paralela ala superficie sobre la que actúan y tienden a separar capas paralelas del ma-terial. Entre los esfuerzos cortantes podemos distinguir el esfuerzo flector y elesfuerzo torsor, que normalmente aparecen combinados. Si las fuerzas paralelasa la superficie considerada actúan aproximadamente en el mismo plano pode-mos despreciar los efectos de la torsión y considerar solamente los esfuerzosflectores.

Existen varios tipos de deformaciones. Las dilataciones o contracciones seproducen cuando la variación del desplazamiento se mide a lo largo de la direc-ción del desplazamiento. Las flexiones, torsiones y, en general, cizalladuras sonmedidas de la variación del desplazamiento a lo largo de direcciones perpendi-culares al desplazamiento.

La deformación unitaria en un sólido proporciona una idea precisa del estadode constricción del material y puede medirse a lo largo de cualquier direccióncalculando derivadas direccionales del desplazamiento del material.

153

Page 154: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

La proporcionalidad entre esfuerzo y deformación unitaria constituye unode los principios básicos de la teoría de la elasticidad y tiene validez en cual-quier trozo pequeño del material cuando los esfuerzos y las deformaciones sonrelativamente pequeños. Este principio nos permite deducir relaciones entre losesfuerzos y las deformaciones.

El estudio de la relación entre fuerzas de tensión y deformaciones produ-cidas en una barra puede ser complicado, ya que hay que tener en cuenta losmúltiples factores que pueden intervenir: tipo de materiales, forma del sólidoelástico, tipos de fuerzas que actúan. Para simplificar la descripción se suelenimponer unas hipótesis muy restrictivas. Si estas hipótesis fallan, podemos com-plicar el modelo para incluir en la descripción los factores cuya influencia nosinteresa resaltar.

Supongamos que tenemos una barra larga y delgada con sección constantey formada por un material isótropo. Esta hipótesis implica que si no queremosdetalles muy precisos podemos describir las deformaciones en la barra a travésde la forma de la la línea formada por los centros de masa de las secciones,llamada línea neutra. Si suponemos que la línea neutra en estado de reposo esun segmento de longitud l, podemos elegir coordenadas para que la posicióninicial de la barra venga descrita por (x, 0, 0), x ∈ [0, l].

Analicemos la deformación de una barra sometida a esfuerzos de flexión.Para eliminar en nuestro estudio los efectos de la tensión y de la torsión su-pondremos que todas las fuerzas que se ejercen sobre la barra son ortogonalesa la línea neutra y actúan en un único plano ejerciendo flexión pura. Fijamoscoordenadas para que la posición inicial de la línea neutra sea

(x, 0, 0), x ∈ [0, l].

Como todas las fuerzas son paralelas, podemos suponer que son de la forma

(0, Fi, 0), i = 1,… , n − 1,

y que sus puntos de aplicación respectivos son

(xi, 0, 0), i = 0,… , n − 1,

donde0 = x0 = x1 < ⋯ < xn−1 < xn = l.

Debido al carácter del problema, la barra sufrirá desplazamientos cuya compo-nente en el eje OZ será nula, así que la nueva posición de la línea neutra de labarra deformada será

(x + d(x), y(x), 0), x ∈ [0, l].

154

Page 155: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Figura 5.5. Fuerzas flectoras sobre una barra biapoyada.

Los desplazamientos en la dirección de las fuerzas y(x) reciben el nombre dedeflexiones.

Queremos determinar la deflexión y(x) en términos de las fuerzas ejercidas.En el caso en que todas las fuerzas tengan el mismo signo

Fi < 0, i = 1,… , n − 1,

la solución de nuestro problema describe la deflexión de una barra debido acargas puntuales situadas sobre ella.

Supongamos que nuestra barra se encuentra apoyada en ambos extremos.De las condiciones de equilibrio estático

n∑

i=0Fi = 0,

n∑

i=0xiFi = 0,

donde x0 = 0, xn = l, podemos deducir la magnitud de las fuerzas de reacción(0, F0, 0) y (0, Fn, 0) en ambos extremos (0, 0, 0), (l, 0, 0):

F0 =−1l

n−1∑

i=1(l − xi)Fi, Fn =

−1l

n−1∑

i=1xiFi.

Consideremos una superficie de separación normal a la línea neutra en elpunto (x, y(x), 0). La resultante de los momentos de las fuerzas flectoras queactúan en un punto desde un lado de la barra es igual y de sentido contrario ala resultante de los momentos de las fuerzas flectoras que actúan desde el otrolado dando lugar a un momento flector neto en cada punto

M(x) ∶=∑

xi<xFi(x − xi) = −

xi>xFi(x − xi).

155

Page 156: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Si la barra se encuentra empotrada, el material circundante puede ejerceren ambos extremos fuerzas de reacción F0, Fn y momentos M0,Mn, que debenverificar las condiciones de equilibrio estático

F0 + Fn = −n−1∑

i=1Fi, lFn +M0 +Mn = −

n−1∑

i=1xiFi.

En ese caso la expresión del momento flector puede contener un término adi-cional

M(x) = M0 +∑

xi<xFi(x − xi).

Se deduce que M(x) es una función lineal a trozos tal que M(x0) = M0,M ′(x0) = F0, y puede expresarse en términos de la base de potencias truncadasmediante la fórmula

M(x) = M(x0) +M ′(x0)x +n−1∑

i=1Fi(x − xi)+.

La ley de Euler-Bernoulli permite relacionar las fuerzas flectoras y las de-flexiones en una barra sometida a esfuerzos de flexión puros

�(x) = 1RM(x),

donde �(x) es la curvatura del eje neutro, M(x) el momento flector y R unaconstante, llamada rigidez flexural, que depende de la geometría de la seccióny del material de la barra.

Con objeto de simplificar el estudio, supondremos que todas las fuerzas ejer-cidas sobre la barra son suficientemente pequeñas y que los momentos flectoresson también pequeños respecto a la rigidez flexural, dando lugar a deflexionesy(x) relativamente pequeñas

|y(x)| ≪ l, |y′(x)| ≪ 1, x ∈ [0, l].

Como la barra es larga, podemos despreciar los desplazamientos longitudinalesd(x) ya que son mucho menores que las deflexiones |d(x)| ≪ |y(x)|.

Teniendo en cuenta que la posición del eje neutro de la barra es (x+d(x), y(x), 0),se obtiene la siguiente fórmula para la curvatura del eje neutro de una barra so-metida a flexión

�(x) =(1 + d′(x))y′′(x) − d′′(x)y′(x)

((1 + d′(x))2 + y′(x)2)3∕2.

156

Page 157: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Teniendo en cuenta que las fuerzas que intervienen no producen deflexionesde gran magnitud y que los desplazamientos longitudinales son despreciables,podemos suponer que d′(x) ≈ 0, y′(x) ≈ 0, de donde se deduce

�(x) ≈ y′′(x).

Por lo tanto, podemos sustituir la ley de Euler-Bernoulli por la ecuación apro-ximada

y′′(x) = 1RM(x), x ∈ [0, l].

Observemos que M(x) es una función spline de grado 1 en [0, l] con nudosinteriores en x1,… , xn−1. Se deduce que la deflexión y es aproximadamenteuna función cúbica a trozos de clase C2 con nudos en los puntos x1,… , xn−1 deaplicación de las cargas.

La deflexión queda completamente determinada adjuntando a la ecuacióndiferencial anterior información sobre la posición de la barra en los extremos,dando lugar a las condiciones de contorno y(0) = y(l) = 0. Si la barra se encuen-tra biapoyada, entonces los momentos de las fuerzas ejercidos sobre los extre-mos son nulos M0 = Mn = 0, lo que lleva a las condiciones y′′(0) = y′′(l) = 0,llamadas condiciones naturales.

En el caso de una barra empotrada además de la posición en los extremosy(0) = y0, y(l) = yn, necesitaremos conocer los momentos en los extremos pa-ra poder determinar la deflexión, obteniendo las condiciones y′′(0) = M0∕R,y′′(l) = Mn∕R. Desgraciadamente los momentos flectores en los extremosson difíciles de medir, aunque pueden determinarse indirectamente teniendo encuenta la dirección tangente en los extremos, dando lugar a las condiciones decontorno y′(0) = m0, y′(l) = mn.

La experiencia muestra que se puede forzar al eje neutro a pasar por determi-nados puntos controlando la magnitud de las cargas concentradas en posicionesx1 < ⋯ < xn−1. La descripción matemática de esta propiedad conduce al aná-lisis del problema de interpolación

y(xi) = yi, i = 0,… , n,

junto con las condiciones de contorno

y′′(x0) = z0, y′′(xn) = zn,

en el caso de una barra biapoyada z0 = zn = 0 o cuyos momentos en los extre-mos sean conocidos. En el caso de que los datos sean las direcciones de empo-tramiento, tendremos las condiciones de contorno

y′(x0) = m0, y′(xn) = mn.

157

Page 158: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Interpolación mediante funciones cúbicas a trozosSean a = �0 < �1 < ⋯ < �n−1 < �n = b una sucesión de nudos. Con-

sideremos el problema de interpolación de Lagrange mediante funciones deS3(�0,… , �n). Aunque pueden formularse problemas de interpolación con solu-ción única para puntos de interpolación diferentes de los nudos, restringiremosnuestro estudio al caso en que los puntos de interpolación x0,… , xn coincidencon los nudos �0,… , �n, caso motivado por su interpretación física. En primerlugar, notemos que el problema de interpolación

s(xi) = yi, i = 0,… , n, s ∈ S3(x0,… , xn), (5.4)

no puede tener solución única ya que

dimS3(x0,… , xn) = n + 3

y solamente se imponen n + 1 condiciones. Por tanto, añadiremos al problemados condiciones adicionales, típicamente en los extremos, para obtener proble-mas con solución única. Una de las condiciones de contorno más usadas son lascondiciones naturales de interpolación

s′′(a) = s′′(b) = 0,

que corresponden físicamente al simple apoyo en los extremos sin que el mate-rial circundante ejerza momentos en los extremos. Otras condiciones que apa-recen en la práctica son las condiciones de empotramiento o de grapa

s′(a) = m0, s′(b) = mn.

Utilizando la fórmula de interpolación de Lidstone, obtenemos una expre-sión de toda función spline cúbica s ∈ S3(x0,… , xn) en cada subintervalo[xi, xi+1]

s(x) = yi(1 − �i(x)) + yi+1�i(x) + ℎ2i [ziΛ(1 − �i(x)) + zi+1Λ(�i(x))],

x ∈ [xi, xi+1], �i(x) ∶=x − xiℎi

, ℎi ∶= xi+1 − xi, Λ(t) ∶= t3 − t6

,

en términos de los valores y las derivadas segundas del spline en los nudos

yi ∶= s(xi), zi ∶= s′′(xi), i = 0,… , n.

Sea

pi(x) ∶= yi(1 − �i(x)) + yi+1�i(x) + ℎ2i [ziΛ(1 − �i(x)) + zi+1Λ(�i(x))]

158

Page 159: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

el polinomio de grado menor o igual que 3 que coincide con s(x) en el intervalo[xi, xi+1], i = 0,… , n − 1. Derivando respecto a x tenemos

p′i(x) = di + ℎi[−ziΛ′(1 − �i(x)) + zi+1Λ′(�i(x))],p′′i (x) = ziΛ′′(1 − �i(x)) + zi+1Λ′′(�i(x)),

dondedi ∶=

yi+1 − yiℎi

, i = 0,… , n − 1,

denota la diferencia dividida del interpolante en xi, xi+1, prefijada por las con-diciones de interpolación.

Sustituyendo

Λ(t) = −t(1 − t)(1 + t)

6, Λ′(t) = 3t2 − 1

6, Λ′′(t) = t,

en las relaciones anteriores obtenemos

pi(x) = yi(1 − �i(x)) + yi+1�i(x)

− 16ℎ2i �i(x)(1 − �i(x))[zi(2 − �i(x)) + zi+1(1 + �i(x))],

(5.5)

y las correspondientes expresiones para la derivada primera

p′i(x) = di+ℎi

6[zi(1− 3(1−�i(x))2) + zi+1(3�i(x)2−1)], x ∈ [xi, xi+1], (5.6)

y la derivada segunda

p′′i (x) = zi(1 − �i(x)) + zi+1�i(x), x ∈ [xi, xi+1].

Veamos bajo qué condiciones el polinomio cúbico a trozos es de claseC2[x0, xn].Por construcción queda garantizada la continuidad de la función en los nudosinteriores

lımx→x−i

s(x) = pi−1(xi) = yi = pi(xi) = lımx→x+i

s(x) = s(xi), i = 1,… , n − 1.

Imponer la continuidad de la derivada primera equivale a imponer las siguientescondiciones

p′i−1(xi) = p′i(xi), i = 1,… , n − 1.Evaluando pi en los extremos xi y xi+1 obtenemos

p′i(xi) = di −ℎi

6(2zi + zi+1), p′i(xi+1) = di +

ℎi

6(zi + 2zi+1),

159

Page 160: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

para todo i = 0,… , n − 1, lo que da lugar a las ecuaciones

di−1 +ℎi−1

6(zi−1 + 2zi) = di −

ℎi

6(2zi + zi+1), i = 1,… , n − 1,

que pueden escribirse en la forma

ℎi−1zi−1 + 2(ℎi−1 + ℎi)zi + ℎizi+1 = 6(di − di−1), i = 1,… , n − 1. (5.7)

Por último, si se verifica (5.7), queda garantizada la continuidad de la derivadasegunda, ya que

p′′i−1(xi) = zi = p′′i (xi), i = 1,… , n − 1.

Por tanto la función s(x) cúbica a trozos es de clase C2 si y solo si las constantesz0,… , zn verifican el sistema de n − 1 ecuaciones con n + 1 incógnitas (5.7).

Para determinar el interpolante se imponen condiciones de contorno apro-piadas. En el siguiente Teorema, deducimos la existencia y unicidad de los pro-blemas de contorno más usuales: naturales, de empotramiento y periódicas.

Teorema 5.3. Sea a = x0 < ⋯ < xn = b una sucesión de nudos. Entonceslos siguientes problemas de interpolación mediante funciones spline cúbicass ∈ S3(x0,… , xn) admiten una única solución

(a) s(xi) = yi, i = 0,… , n, s′′(a) = z0, s′′(b) = zn,(b) s(xi) = yi, i = 0,… , n, s′(a) = m0, s′(b) = mn,(c) s(xi) = yi, i = 0,… , n, s′(a) = s′(b), s′′(a) = s′′(b).

Demostración. Una función cúbica a trozos dada por (5.5) es de clase C2[a, b]si y solo si se verifican las ecuaciones (5.7), que pueden ser descritas en formamatricial

M

z0⋮

zn

= 6

d1 − d0⋮

dn−1 − dn−2

con

M ∶=

ℎ0 2(ℎ0 + ℎ1) ℎ1 0 ⋯ 0

0 ℎ1 2(ℎ1 + ℎ2) ℎ2 ⋱ ⋮

⋮ ⋱ ⋱ ⋱ ⋱ 0

0 ⋯ 0 ℎn−2 2(ℎn−2 + ℎn−1) ℎn−1

,

160

Page 161: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

donde ℎi = xi+1 − xi, di = (yi+1 − yi)∕ℎi i = 0,… , n − 1.(a) Si nos dan z0 y zn, entonces el sistema (5.7) se reduce a un sistema de

n − 1 ecuaciones con n − 1 incógnitas

M

z1⋮

zn−1

=

6(d1 − d0) − ℎ0z06(d2 − d1)

6(dn−2 − dn−3)

6(dn−1 − dn−2) − ℎn−1zn

donde M es la submatriz de M que se obtiene al suprimir la primera y últimacolumnas

M ∶=

2(ℎ0 + ℎ1) ℎ1 0 ⋯ 0

ℎ1 2(ℎ1 + ℎ2) ℎ2 ⋱ ⋮

0 ⋱ ⋱ ⋱ 0

⋮ ⋱ ℎn−3 ⋱ ℎn−2

0 ⋯ 0 ℎn−2 2(ℎn−2 + ℎn−1)

. (5.8)

Observemos que la matriz M es estrictamente diagonal dominante, de donde sededuce que det M ≠ 0.

Por lo tanto, el problema de interpolación

s(xi) = yi, i = 0,… , n, s′′(a) = z0, s′′(b) = zn,

tiene una única solución s ∈ S3(x0,… , xn). La matriz M es tridiagonal y si-métrica, lo que se traduce en un menor número de operaciones al resolver elsistema.

Notemos que en el caso particular en que n = 2, el sistema de ecuacionesanterior se reduce a una sola ecuación

2(ℎ0 + ℎ1)z1 = 6(d1 − d0) − ℎ0z0 − ℎ1z2.

(b) Evaluando la fórmula (5.6) de s′(x) en x0 = a y xn = b, obtenemos

m0 = s′(a) = d0 −ℎ0

6(2z0 + z1), mn = s′(b) = dn−1 +

ℎn−1

6(zn−1 + 2zn),

161

Page 162: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

e incorporando las condiciones

2ℎ0z0 + ℎ0z1 = 6(d0 − m0), ℎn−1zn−1 + 2ℎn−1zn = 6(mn − dn−1),

obtenemos un sistema de n + 1 ecuaciones con n + 1 incógnitas

M

z0z1⋮

zn−1zn

= 6

d0 − m0

d1 − d0⋮

dn−1 − dn−2mn − dn−1

donde M se obtiene de M añadiendo una fila al principio y otra al final

M ∶=

2ℎ0 ℎ0 0 0 ⋯ 0

ℎ0 2(ℎ0 + ℎ1) ℎ1 0 ⋯ 0

0 ℎ1 2(ℎ1 + ℎ2) ℎ2 ⋱ ⋮

⋮ ⋱ ⋱ ⋱ ⋱ 0

0 ⋯ 0 ℎn−2 2(ℎn−2 + ℎn−1) ℎn−1

0 ⋯ 0 0 ℎn−1 2ℎn−1

. (5.9)

Como la matriz M es estrictamente diagonal dominante, det M ≠ 0, se deduceque el problema de interpolación

s(xi) = yi, i = 0,… , n, s′(a) = m0, s′(b) = mn,

tiene una única solución s ∈ S3(x0,… , xn). La matriz M es también tridiago-nal y simétrica, lo que puede utilizarse para reducir el número de operacionesnecesarias para resolver el sistema.

(c) Evaluando (5.6) en x0 = a y xn = b, se deduce que la condición s′(a) =s′(b) equivale a

d0 −ℎ0

6(2z0 + z1) = dn−1 +

ℎn−1

6(zn−1 + 2zn),

mientras que s′′(a) = s′′(b) se traduce en la igualdad z0 = zn. Podemos añadirla ecuación

ℎn−1zn−1 + 2(ℎn−1 + ℎ0)zn + ℎ0z1 = 6(d0 − dn−1)

162

Page 163: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

y eliminar la incógnita z0 = zn para obtener el siguiente sistema de n ecuacionescon n incógnitas

Mp

z1⋮

zn−1zn

= 6

d1 − d0⋮

dn−1 − dn−2d0 − dn−1

donde Mp es la matriz

2(ℎ0 + ℎ1) ℎ1 0 ⋯ 0 ℎ0

ℎ1 2(ℎ1 + ℎ2) ℎ2 ⋱ ⋱ 0

0 ℎ2 ⋱ ⋱ ⋱ ⋮

⋮ ⋱ ⋱ ⋱ ℎn−1 0

0 ⋯ 0 ℎn−2 2(ℎn−2 + ℎn−1) ℎn−1

ℎ0 ⋯ 0 0 ℎn−1 2(ℎn−1 + ℎ0)

.

Como esta matriz es estrictamente diagonal dominante, detMp ≠ 0, y el pro-blema

s(xi) = yi, i = 0,… , n, s′(a) = s′(b), s′′(a) = s′′(b),

tiene solución única. En este caso la matriz es simétrica pero no tiene estructurade banda.

Nota. Una consecuencia del hecho de que la matriz M dada por (5.8) verifiquedet M ≠ 0 es que la matriz M tiene rango n− 1 y que el sistema de ecuaciones(5.7) siempre es compatible y tiene infinitas soluciones. Por tanto el conjuntode soluciones del problema de interpolación (5.4) es un espacio vectorial tras-ladado de dimensión 2.

Condiciones de interpolación para funciones splineYa hemos mencionado anteriormente el papel que juegan las condiciones

de contorno s′′(a) = s′′(b) = 0 para la descripción de la deflexión de una barrabiapoyada.

163

Page 164: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Definición. Una función spline cúbica s ∈ S3(x0,… , xn) recibe el nombre despline natural si verifica las condiciones de contorno s′′(a) = s′′(b) = 0.

Del apartado (a) de la proposición anterior se deduce que el conjunto de lasfunciones spline cúbicos naturales

Snat3 (x0… , xn) ∶= {s ∈ S3(x0… , xn) ∣ s′′(x0) = s′′(xn) = 0}

es un subespacio vectorial de S3(x0,… , xn) de dimensión n + 1 en el que elproblema de Lagrange

s(xi) = yi, i = 0,… , n,

siempre tiene solución única. Las condiciones s′′(a) = s′′(b) = 0 implican quela función spline en los extremos admite conexiones de clase C2 con funcionesde primer grado cuyas gráficas son líneas rectas, es decir

s(x) ∶=

s(x0) − s′(x0)(x0 − x), si x < x0,s(x), si x ∈ [x0, xn],s(xn) + s′(xn)(x − xn), si x > xn,

es una función C2(−∞,∞).Las condiciones de contorno de la Teorema ?? (b), reciben el nombre de

condiciones de grapado o de empotramiento. Si una viga está empotrada en unapared, la pared reacciona sobre la viga con los momentos de fuerzas s′′(a) = z0,s′′(b) = zn que permiten alinear la dirección de la tangente en los extremos conel trozo empotrado y la línea neutra de la viga estará sujeta a ligaduras s′(a) = m0y s′(b) = mn.

Las condiciones de contorno de la Teorema ??(c), reciben el nombre decondiciones de contorno periódicas y permiten definir una función extensiónde s a toda la recta real que sea una función periódica de periodo b − a.

Además de las condiciones de interpolación naturales, de empotramiento yperiódicas existen una gran variedad de condiciones de contorno que se usan enla práctica.

Una crítica que puede hacerse a las condiciones naturales o periódicas esque imponemos al interpolante una condición que no tiene por qué verificar lafunción interpolada f . Como consecuencia de esta observación, el interpolantede una función C2 cúbica a trozos no tiene que coincidir con la propia función.En particular, los polinomios cúbicos no coinciden con sus interpolantes.

164

Page 165: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Definición. Sea a = x0 < x1 < ⋯ < xn = b una sucesión de nodos. La funciónspline s ∈ S3(x0,… , xn) que verifica

s(xi) = f (xi), i = 0,… , n,

con condiciones de empotramiento

s′(a) = f ′(a), s′(b) = f ′(b).

recibe el nombre de interpolante spline completo.

En el caso de un interpolante spline completo las condiciones de empotra-miento proporcionan interpolantes que reproducen polinomios cúbicos, ya quela propia función interpolada f verifica las condiciones de contorno impuestas.

Ejemplo. Queremos encontrar el spline completo s que interpola al polinomiox4 − x2 en el intervalo [−1, 1] en −1, 0, 1. La función s es la única función delespacio S3(−1, 0, 1) que verifica simultáneamente las condiciones de interpola-ción

s(−1) = s(0) = s(1) = 0,

y las condiciones de grapa

s′(−1) = −2, s′(1) = 2.

Los valores z0 = s′′(−1), z1 = s′′(0) y z2 = s′′(1) verifican el sistema deecuaciones

2 1 0

1 4 1

0 1 2

z0z1z2

=

12

0

12

,

cuya solución es (z0, z1, z2) = (8,−4, 8). Aplicamos la fórmula (5.5) en cadasubintervalo para obtener

s(x) = 16x(1 + x)(8(1 − x) − 4(2 + x)) = −2x2(1 + x), x ∈ [−1, 0],

s(x) = −16x(1 − x)(−4(2 − x) + 8(1 + x)) = −2x2(1 − x), x ∈ [0, 1],

de donde se deduce que

s(x) = −2x2(1 − |x|).

165

Page 166: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

-0.35

-0.3

-0.25

-0.2

-0.15

-0.1

-0.05

0

-1 -0.5 0 0.5 1

x4-x2

s(x)

Figura 5.6. Interpolante spline completo de x4 − x2.

Observamos que la función spline s es par, es decir s(−x) = s(x), para todox ∈ [−1, 1]. Esta propiedad puede deducirse directamente de la simetría delas condiciones de interpolación y permite reducir la discusión del problema.En efecto, si llamamos r(x) ∶= s(−x), x ∈ [−1, 1], vemos que la función r ∈C2[−1, 1] coincide con un polinomio cúbico en cada subintervalo [−1, 0] y [0, 1]y además verifica las condiciones de interpolación

r(−1) = s(1) = 0, r(0) = s(0) = 0, r(1) = s(−1) = 0

y las condiciones de contorno

r′(−1) = −s′(1) = −2, r′(1) = −s′(−1) = 2.

Por tanto r y s son soluciones del mismo problema de interpolación con condi-ciones de grapa. Como el problema de interpolación con condiciones de grapatiene solución única, deducimos que r = s. Por la definición de r, tenemos ques(x) = s(−x), para todo x ∈ [−1, 1].

Con objeto de dibujar la gráfica de s(x), vamos a estudiar sus extremos ysus puntos de inflexión. Primero calculamos

s′(x) = −4x + 6x|x|, s′′(x) = −4 + 12|x|.

Teniendo en cuenta que s′ se anula en −2∕3, 0, 2∕3, podemos deducir que lafunción s es decreciente en los subintervalos [−1,−2∕3] y [0, 2∕3] y crecienteen los subintervalos [−2∕3, 0] y [2∕3, 0]. Tenemos un máximo relativo en x = 0

166

Page 167: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

correspondiente al valor 0 y dos mínimos relativos en ±2∕3, correspondientesal valor −8∕27. Evaluando en x = ±1, vemos que el valor máximo es 0 y sealcanza para x ∈ {−1, 0, 1}, por lo que s(x) ≤ 0, x ∈ [−1, 1]. La derivadasegunda cambia de signo en x = ±1∕3, deduciéndose que (±1∕3,−4∕27) sonlos dos puntos de inflexión de la gráfica de s.

Para trazar la gráfica de la función f (x) = x2(x2 − 1), tengamos en cuentaque f (x) es una función par menor o igual que cero en [−1, 1], por lo que sugráfica es una función simétrica por debajo del eje de las XX′. Los valoresmáximos de f se encuentran en las raíces 1,−1, 0. En x = 0 la función alcanzaun máximo relativo y la pendiente es nula. Los puntos críticos x = ±

2∕2, 0se obtienen de las raíces de f ′(x) = 2x(2x2−1). Se deduce que el valor mínimo−1∕4 se alcanza en x = ±

2∕2. Hallando las raíces de f ′′(x) = 12x2 − 2,encontramos los puntos de inflexión de la gráfica en (±

6∕6, 5∕36). Podemoscomparar las gráficas de la función x4− x2 y su interpolante spline en la Figura5.6.

La reproducción de polinomios de grado alto es una propiedad de gran in-terés para analizar el error de la interpolación mediante funciones spline. Des-graciadamente es frecuente que conozcamos solamente valores de la función fy no de sus derivadas por lo que necesitamos estimaciones de éstas. Por ello,es frecuente sustituir la condición de empotramiento por otra restricción quepermita mejorar el comportamiento del interpolante spline en los extremos ypermita reproducir polinomios cuadráticos o cúbicos.

Las condiciones not-a-knot consisten en imponer en x1 y xn−1 suavidadde clase C3. Esto equivale a imponer que s pertenezca al subespacio (n + 1)-dimensional S3(x0, x2,… , xn−2, xn) de S3(x0, x1, x2… , xn−2, xn−1, xn), es decirque x1 y xn−1 no sean nudos de la función spline. Las condiciones not-a-knotpueden escribirse en la forma

z1 − z0ℎ0

=z2 − z1ℎ1

,zn−1 − zn−2

ℎn−2=

zn − zn−1ℎn−1

Una forma de imponer estas condiciones es añadir al sistema (5.7) las ecuacio-nes suplementarias

− ℎ1z0 + (ℎ0 + ℎ1)z1 − ℎ0z2 = 0,− ℎn−1zn−2 + (ℎn−2 + ℎn−1)zn−1 − ℎn−2zn = 0.

Para resolver el sistema podemos eliminar las incógnitas z0 y zn, obteniéndoseun sistema de n−1 ecuaciones con incógnitas z1,… , zn−1. Puede comprobarseque la matriz cuadrada de coeficientes de este sistema es diagonal dominante y,

167

Page 168: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

por tanto no singular. Esto implica la existencia y unicidad de solución de losproblemas de interpolación con condiciones not-a-knot. Las condiciones not-a-knot permiten la reproducción exacta de un polinomio cúbico a través de losdatos.

Las condiciones cuadráticas imponen que los polinomios en un entorno deambos extremos sean de segundo grado o equivalentemente

s′′′(a) = s′′′(b) = 0,

lo que equivale a añadir al sistema (5.7) las ecuaciones suplementarias

z0 = z1, zn−1 = zn.

Al eliminar las incógnitas z0 y zn se obtiene un sistema tridiagonal y diagonaldominante, lo que permite deducir la existencia y unicidad del interpolante concondiciones cuadráticas.

Las condiciones de contorno de Bessel consisten en imponer que la derivadaen el extremo inferior (resp., superior) coincida con la derivada del interpolantecuadrático que interpola a f en x0, x1, x2 (resp., en xn−2, xn−1, xn). En el extremoinferior el interpolante cuadrático es

q0(x) = y0 + d0(x − x0) +d1 − d0ℎ0 + ℎ1

(x − x0)(x − x1)

derivando y evaluando en x0 tenemos

q′0(x0) = d0 −d1 − d0ℎ0 + ℎ1

ℎ0

Análogamente la derivada en xn de

qn(x) = yn + dn−1(x − xn) +dn−2 − dn−1ℎn−2 + ℎn−1

(x − xn)(x − xn−1)

esq′(xn) = dn−1 +

dn−2 − dn−1ℎn−2 + ℎn−1

ℎn−1,

lo que permite expresar las condiciones de Bessel en forma de condiciones degrapa

s′(x0) = d0 −ℎ0

ℎ0 + ℎ1(d1 − d0), s′(xn) = dn−1 +

ℎn

ℎn−1 + ℎn(dn−2 − dn−1).

Las condiciones cuadráticas y las condiciones de contorno de Bessel permi-ten garantizar la reproducción exacta de polinomios cuadráticos a través de losdatos de interpolación.

168

Page 169: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Funciones spline cúbicas e interpolación de HermiteSean a = �0 < �1 < ⋯ < �n−1 < �n = b una sucesión de nudos. Definimos

el espacio de funciones spline de grado k y clase Cr

Srk(�0,… , �n) = {s ∈ Cr[a, b] ∶ s|[�i,�i+1) ∈ Pk, i = 0,… , n − 1}.

Observemos que el espacio de funciones spline de grado k más habitual es el delas funciones de clase Ck−1, Sk(�0,… , �n) = Sk−1

k (�0,… , �n), correspondientesal mayor orden de suavidad posible.

Observemos que el espacio S3(�0,… , �n) de funciones spline cúbicas declase C2 considerado en la sección previa es un subespacio de S1

3 (�0,… , �n). Denuevo supondremos que los puntos de interpolación coinciden con los nudos.Planteamos ahora el problema de interpolación de Hermite clásico en el espacioS13 (x0,… , xn) con puntos de interpolación x0,… , xn.

Proposición 5.4. El problema de interpolación de Hermite

s(xi) = yi, s′(xi) = mi, i = 0,… , n,

admite una única solución en S13 (x0,… , xn).

Demostración. Teniendo en cuenta que el problema clásico de Hermite median-te polinomios cúbicos siempre admite una única solución, la función s(x) quedadeterminada en cada subintervalo [xi, xi+1]. Utilizando la fórmula de Lagrangepara el polinomio cúbico de Hermite clásico obtenemos la expresión

s(x) = yi(1 − �i(x))2(1 + 2�i(x)) + yi+1�i(x)2(3 − 2�i(x))+ ℎi�i(x)(1 − �i(x))

[

mi(1 − �i(x)) − mi+1�i(x)]

, x ∈ [xi, xi+1],(5.10)

donde�i(x) ∶=

x − xiℎi

, ℎi ∶= xi+1 − xi, i = 0,… , n − 1.

Por las condiciones de interpolación impuestas tenemos que

lımx→x+i

s(x) = s(xi) = yi = lımx→x−i

s(x),

lımx→x+i

s′(x) = s′(xi) = mi = lımx→x−i

s′(x), i = 1,… , n − 1,

lo que implica que s es una función cúbica a trozos de clase C1.

169

Page 170: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Como consecuencia de la existencia y unicidad de solución del problema deinterpolación de Hermite con 2n+2 datos, obtenemos la dimensión del espaciode funciones spline cúbicas de clase C1, dimS1

3 (x0,… , xn) = 2n + 2.A través de la fórmula (5.10), podemos obtener una demostración alterna-

tiva del Teorema ?? (b). Una forma de obtener la solución del problema concondiciones de grapa

s(xi) = yi, i = 0,… , n, s′(a) = m0, s′(b) = mn,

mediante funciones spline cúbicas de S3(x0,… , xn) consiste en considerar laspendientesm1,… , mn−1 como incógnitas del problema e imponer al interpolantes ∈ C1[x0, xn] dado por (5.10) las condiciones de suavidad extra

lımx→x+i

s′′(x) = lımx→x−i

s′′(x), i = 1,… , n − 1.

Derivando sucesivamente la expresión (5.10) obtenemos

s′(x) = �i(x)(1 − �i(x))(6di − mi − mi+1)+ (1 − 2�i(x))

[

mi(1 − �i(x)) − mi+1�i(x)]

, x ∈ [xi, xi+1],

y

s′′(x) = 2ℎi

[

(3di − mi − mi+1)(1 − 2�i(x)) − mi(1 − �i(x)) + mi+1�i(x)]

,

x ∈ (xi, xi+1),

donde di ∶= (yi+1 − yi)∕ℎi, i = 0,… , n − 1. Entonces tenemos

lımx→x−i

s′′(x) = 2ℎi−1

(mi−1 + 2mi − 3di−1), lımx→x+i

s′′(x) = 2ℎi(3di − 2mi − mi+1).

Por lo que las condiciones de continuidad de la derivada segunda se traducenen

mi−1

ℎi−1+ 2

( 1ℎi−1

+ 1ℎi

)

mi +mi+1

ℎi= 3

(di−1ℎi−1

+diℎi

)

, i = 1,… , n − 1.

Teniendo en cuenta que m0 y mn son datos, obtenemos el siguiente sistema de

170

Page 171: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

ecuaciones

M

m1

mn−1

=

3(ℎ−10 d0 + ℎ−1

1 d1) − ℎ−10 m0

3(ℎ−11 d1 + ℎ−1

2 d2)

3(ℎ−1n−3dn−3 + ℎ−1

n−2dn−2)

3(ℎ−1n−2dn−2 + ℎ−1

n−1dn−1) − ℎ−1n−1mn

,

donde M es la matriz

M ∶=

2(ℎ−10 + ℎ−1

1 ) ℎ−11 0 ⋯ 0

ℎ−11 2(ℎ−1

1 + ℎ−12 ) ℎ−1

2 ⋱ ⋮

0 ⋱ ⋱ ⋱ 0

⋮ ⋱ ℎ−1n−3 ⋱ ℎ−1

n−2

0 ⋯ 0 ℎ−1n−2 2(ℎ−1

n−2 + ℎ−1n−1)

.

Como M es estrictamente diagonal dominante, se deduce que el problema deinterpolación en los nudos mediante funciones spline cúbicas de clase C2 concondiciones de grapa tiene una única solución.

Observemos que en el caso particular en que n = 2, las condiciones sereducen a una sola ecuación

2(ℎ−10 + ℎ−1

1 )m1 = 3(ℎ−10 d0 + ℎ−1

1 d1) − ℎ−10 m0 − ℎ−1

1 m1.

Si en lugar de prescribir las derivadas primeras en los extremos se prescribenlas derivadas segundas como en el caso del spline cúbico natural

s(xi) = yi, i = 0,… , n, s′′(a) = z0, s′′(b) = zn,

obtenemos las condiciones

2ℎ0

(3d0 − 2m0 − m1) = z0,2

ℎn−1(mn−1 + 2mn − 3dn−1) = zn,

171

Page 172: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

que dan lugar al sistema de ecuaciones

M

m0

m1

mn−1

mn

=

3ℎ−10 d0 − z0∕2

3(ℎ−10 d0 + ℎ−1

1 d1)

3(ℎ−1n−2dn−2 + ℎ−1

n−1dn−1)

3ℎ−1n−1dn−1 + zn∕2

,

donde M es la matriz

M ∶=

2ℎ−10 ℎ−1

0 0 ⋯ 0

ℎ−10 2(ℎ−1

0 + ℎ−11 ) ℎ−1

1 ⋱ ⋮

0 ⋱ ⋱ ⋱ 0

⋮ ⋱ ℎ−1n−2 2(ℎ−1

n−2 + ℎ−1n−1) ℎ−1

n−1

0 ⋯ 0 ℎ−1n−1 2ℎ−1

n−1

.

La matriz M es estrictamente diagonal dominante. Por tanto, el problema deinterpolación en los nudos mediante funciones spline cúbicas de clase C2 concondiciones de contorno naturales tiene una única solución.

Propiedades variacionales del spline cúbico naturalLa energía de flexión de una barra es el trabajo que realizan todas las fuerzas

que actúan para llevar a la barra desde la posición de equilibrio a una posicióndada. De la ley de Euler-Bernoulli, puede deducirse que la energía de flexión deuna barra admite la siguiente expresión

= R2 ∫

l

0�(s)2ds,

donde R es la rigidez flexural y �(s) es la curvatura expresada en términos dela longitud de arco s.

Es bien conocido que ciertos problemas de mecánica pueden resolverse siconocemos las fuerzas que intervienen. En el caso de tener problemas con li-gaduras, la determinación de las fuerzas de ligadura puede resultar tediosa por

172

Page 173: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

lo que se prefieren formulaciones variacionales en las que las ligaduras puedenincluirse de modo natural. Puede demostrarse que la ley de Euler-Bernoulli pue-de reemplazarse por un principio variacional: la forma que adopta una barraforzada a pasar por una serie de puntos minimiza la energía elástica.

Hemos visto que si las deflexiones son pequeñas, el eje neutro puede serrepresentado por (x, y(x), 0), x ∈ [0, l], con |y′(x)| ≪ 1. En este caso la energíade flexión puede expresarse en la forma

= R2 ∫ �(s)2ds = R

2 ∫

l

0

y′′(x)2(

1 + y′(x)2)5∕2

dx ≈ R2 ∫

l

0y′′(x)2dx

y el valor de la integral ∫ l0 y′′(x)2dx es aproximadamente 2∕R. Esta simplifi-

cación es común en el estudio de las flexiones de vigas, obteniéndose solucionesmuy aproximadas a la realidad.

Si la barra soporta cargas concentradas en posiciones x1 < ⋯ < xn−1, po-demos alterar su forma, controlando la magnitud de las cargas y/o modificandola posición en los extremos a = x0, b = xn para forzar al eje neutro a pasar pordeterminados puntos. Esto lleva a las condiciones de interpolación (5.4), quepueden considerarse como ligaduras del problema. Por tanto, la posición de labarra corresponde aproximadamente a la gráfica de la función que minimiza elfuncional cuadrático

J ∶ f ∈ C2[a, b] → ∫

b

af ′′(x)2dx,

sujeta a las condiciones de interpolación f (xi) = yi, i = 0,… , n. El funcionalcuadrático J proviene de la forma bilineal

j ∶ (f, g) ∈ C2[a, b] × C2[a, b] → ∫

b

af ′′(x)g′′(x)dx.

Demostraremos que la solución de este problema variacional es precisamen-te el interpolante spline cúbico natural, propuesto para describir la forma de unabarra biapoyada. Demostraremos primero el siguiente resultado auxiliar.

Lema 5.5. Sean a = x0 < x1 < ⋯ < xn = b y s ∈ S3(x0,… , xn). Si v ∈C2[a, b] verifica v(xi) = 0, i = 0,… , n, entonces

b

as′′(x)v′′(x)dx = s′′(b)v′(b) − s′′(a)v′(a).

173

Page 174: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Demostración. Descompongamos la integral como suma de integrales en lossubintervalos [xi, xi+1]

j[s, v] ∶= ∫

b

as′′(x)v′′(x)dx =

n−1∑

i=0∫

xi+1

xis′′(x)v′′(x)dx.

Como cada una de las restricciones s|[xi,xi+1] ∈ C4[xi, xi+1], i = 0,… , n − 1,podemos integrar por partes y obtener

j[s, v] =n−1∑

i=0

(

s′′(xi+1)v′(xi+1) − s′′(xi)v′(xi) − ∫

xi+1

xis′′′(x)v′(x)dx

)

= s′′(b)v′(b) − s′′(a)v′(a) −n−1∑

i=0∫

xi+1

xis′′′(x)v′(x)dx.

Integrando de nuevo por partes y teniendo en cuenta que v(xi) = 0, para todoi = 0,… , n, y que s(4)(x) = 0 en cada intervalo (xi, xi+1), i = 0,… , n − 1,deducimos que

n−1∑

i=0∫

xi+1

xis′′′(x)v′(x)dx

=n−1∑

i=0

(

−s′′′(x−i+1)v(xi+1) + s′′′(x+i )v(xi) + ∫

xi+1

xis(4)(x)v(x)dx

)

= 0,

luego j[s, v] = s′′(b)v′(b) − s′′(a)v′(a).

Demostremos ahora que el interpolante spline cúbico natural minimiza elfuncional f → ∫ b

a f ′′(x)2dx.

Teorema 5.6. Sean los datos y0, y1,… , yn correspondientes a los puntos a =x0 < x1 < ⋯ < xn = b. El problema de minimizar el funcional J [f ] ∶=∫ ba f ′′(x)2dx sobre el conjunto de todos los interpolantes

V ∶= {f ∈ C2[a, b] ∣ f (xi) = yi, i = 0,… , n}

admite una única solución. Esta solución es el interpolante spline cúbico natu-ral, s ∈ Snat

3 (x0,… , xn) ∩ V .

174

Page 175: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Demostración. Como la integral de una función no negativa es también no ne-gativa, tenemos

J [f ] = ∫

b

af ′′(x)2dx ≥ 0, ∀f ∈ C2[a, b].

Veamos ahora que la restricción de J sobre el espacio

V0 ∶= {v ∈ C2[a, b] ∣ v(xi) = 0, i = 0,… , n}

es definida positiva. Para ello, supongamos que v ∈ V0 verifica J [v] = 0. En-tonces tenemos

b

av′′(x)2dx = 0.

Como v′′ es continua, se deduce que v′′(x) = 0 y v es un polinomio de primergrado. Como v(a) = v(b) = 0, vemos que v(x) = 0 para todo x ∈ [a, b].

Por el Teorema ?? (a), existe una única función s ∈ Snat3 (x0,… , xn) que

verifica s(xi) = yi, i = 0,… , n. Por construcción s ∈ V verifica s′′(a) =s′′(b) = 0. Por el Lema ??

j[s, v] = ∫

b

as′′(x)v′′(x)dx = s′′(b)v′(b) − s′′(a)v′(a) = 0, ∀v ∈ V0.

Si f ∈ V , tenemos que f − s ∈ V0, de donde j[s, f − s] = 0. Por tanto

J [f ] − J [s] = J [f − s] + 2j[s, f − s] = J [f − s] ≥ 0, ∀f ∈ V .

Luego J [s] es el valor mínimo de J sobre V .Si J [f ] = J [s] para cierta f ∈ U , entonces J [f − s] = 0, y como J es

definido positivo sobre V0, deducimos que f − s = 0. Esto prueba que s es elúnico mínimo de J en V .

Veamos que el interpolante spline grapado minimiza la energía elástica deuna barra flexible sometida a condiciones de empotramiento.

Teorema 5.7. Sean los valores y0, y1,… , yn correspondientes a los puntos a =x0 < x1 < ⋯ < xn = b y m0, mn las pendientes en los extremos. Entonces elproblema de minimizar el funcional J [f ] ∶= ∫ b

a f ′′(x)2dx sobre el conjunto

W ∶= {f ∈ C2[a, b] ∣ f (xi) = yi, i = 0,… , n, f ′(a) = m0, f′(b) = mn}

admite una única solución. Esta solución es el interpolante spline cúbico queverifica las condiciones de empotramiento, s ∈ S3(x0,… , xn) ∩W .

175

Page 176: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Demostración. El espacio

W0 ∶= {f ∈ C2[a, b] ∣ f (xi) = 0, i = 0,… , n, f ′(a) = f ′(b) = 0}

es un subespacio de V0 ∶= {v ∈ C2[a, b] ∣ v(xi) = 0, i = 0,… , n} donde laforma J es definida positiva. Por tanto, la restricción de J sobre W0 es tambiéndefinida positiva.

Por el Teorema ?? (b), existe una única función s ∈ S3(x0,… , xn) ∩ W .Del Lema ??, se deduce que si s ∈ S3(x0,… , xn) ∩ W y v ∈ W0, entoncesj[s, v] = 0 y

J [f ] − J [s] = J [f − s] ≥ 0, f ∈ W .Por tanto, J alcanza su valor mínimo en s ∈ W Como J es definida positivasobre W0, s debe ser el único mínimo.

Error de la interpolación spline cúbicaEn esta sección obtendremos una fórmula para el el error del interpolan-

te spline completo. Comenzaremos mostrando que el error puede acotarse entérminos de la derivada segunda del error.

Proposición 5.8. Sea a = x0 < ⋯ < xn = b, y sea s ∈ S3(x0,… , xn) unafunción spline que interpola a f ∈ C2[a, b] en los nodos x0,… , xn. Entoncesel error de interpolación E(x) ∶= f (x) − s(x) verifica

‖E‖[a,b] ≤ℎ2

8‖E′′

‖[a,b],

donde ℎ ∶= maxi=0,…,n |xi+1 − xi| es la norma de la partición.

Demostración. Teniendo en cuenta que E(xi) = 0, i = 0,… , n, tenemos

E(x) = [xi, xi+1, x]E (x − xi)(x − xi+1).

Tomando x ∈ [xi, xi+1], deducimos que existe � ∈ [xi, xi+1] tal que

|E(x)| =|E′′(�)|

2(x − xi)(xi+1 − x), x ∈ [xi, xi+1].

El valor |E′′(�)| puede acotarse por ‖E′′‖[a,b], obteniéndose

|E(x)| ≤‖E′′

‖[a,b]

2(x − xi)(xi+1 − x), x ∈ [xi, xi+1].

Como el máximo de la función (x − xi)(xi+1 − x) en x ∈ [xi, xi+1] se alcanzaen el punto medio, obtenemos la acotación propuesta.

176

Page 177: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

El siguiente resultado muestra una propiedad de estabilidad del spline com-pleto, el tamaño de la derivada segunda del interpolante está controlado por eltamaño de la derivada segunda de la función.Lema 5.9. Sea a = x0 < ⋯ < xn = b, y sea s ∈ S3(x0,… , xn) el interpolantespline completo de f ∈ C2[a, b] en los nodos x0,… , xn. Entonces

‖s′′‖[a,b] ≤ 3‖f ′′‖[a,b].

Demostración. Sabemos que s′′(x) es la función lineal a trozos que verifica

s′′(xi) = zi, i = 0,… , n,

siendo z = (z0,… , zn) la solución del sistema

z0 +12z1 = 3[x0, x0, x1]f,

ℎi−1zi−12(ℎi−1 + ℎi)

+ zi +ℎizi+1

2(ℎi−1 + ℎi)= 3[xi−1, xi, xi+1]f, i = 1,… , n − 1,

12zn−1 + zn = 3[xn−1, xn, xn]f.

De la primera ecuación deducimos que

|z0| ≤ 3|[x0, x0, x1]f | +12|z1| ≤

32‖f ′′

‖[a,b] +12‖z‖∞.

Para las siguientes ecuaciones tenemos

|zi| ≤ 3|[xi−1, xi, xi+1]f +|ℎi−1zi−1 + ℎizi+1|

2(ℎi−1 + ℎi)≤ 3

2‖f ′′

‖[a,b] +12‖z‖∞,

i = 1,… , n − 1, y para la última ecuación tenemos

|zn| ≤ 3|[xn−1, xn, xn]f | +12|zn−1| ≤

32‖f ′′

‖[a,b] +12‖z‖∞.

Por tanto‖z‖∞ ≤ 3

2‖f ′′

‖[a,b] +12‖z‖∞,

de donde deducimos la desigualdad

‖z‖∞ ≤ 3‖f ′′‖[a,b].

Como s′′ es lineal a trozos con nudos en x0,… , xn, tenemos

‖s′′‖[a,b] = maxi=0,…,n

|s′′(xi)| ≤ ‖z‖∞ ≤ 3‖f ′′‖[a,b].

177

Page 178: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

La aplicación que a la derivada segunda de cada función de clase C2[a, b]le hace corresponder la derivada segunda de su interpolante spline completo esuna proyección lineal de C[a, b] → S1(x0,… , xn). El resultado anterior implicaque esa proyección lineal tiene norma menor o igual que 3. Usando la idea delLema de Lebesgue, podemos acotar la derivada segunda del error de interpo-lación en términos de la mejor aproximación de f ′′ for funciones del espacioS1(x0,… , xn).

Lema 5.10. Sea a = x0 < ⋯ < xn = b, y sea s ∈ S3(x0,… , xn) el interpolantespline completo de f ∈ C2[a, b] en los nodos x0,… , xn. Entonces el error deinterpolación E(x) ∶= f (x) − s(x) verifica

‖E′′‖[a,b] ≤ 4 dist∞(f ′′, S1(x0,… , xn)).

Demostración. Sea � ∈ S1(x0,… , xn) cualquiera. Definamos

r1(x) ∶= f ′(x0) + ∫

x

x0� (t)dt, r(x) ∶= f (x0) + ∫

x

x0r1(t)dt.

Por construcción r ∈ S3(x0,… , xn) verifica r′(x) = r1(x). Derivando una se-gunda vez, se obtiene r′′(x) = � (x). Observemos que el interpolante splinecompleto de f − r es s − r. Aplicando el Lema ?? a f − r, tenemos

‖s′′ − r′′‖[a,b] ≤ 3‖f ′′ − r′′‖[a,b].

Por tanto,

‖f ′′ − s′′‖[a,b] ≤ ‖f ′′ − r′′‖[a,b] + ‖s′′ − r′′‖[a,b] ≤ 4‖f ′′ − �‖[a,b],

para toda función � ∈ S1(x0,… , xn). Se deduce que

‖E′′‖[a,b] ≤ 4 ınf

�∈S1(x0,…,xn)‖f ′′ − �‖[a,b] = 4 dist∞(f ′′, S1(x0,… , xn)).

Teorema 5.11 (Cotas del error del interpolante spline completo). Sea

a = x0 < ⋯ < xn = b,

una sucesión de nudos y sea s ∈ S3(x0,… , xn) el interpolante spline completode f ∈ C4[a, b] en los nodos x0,… , xn. Entonces el error de interpolaciónE(x) ∶= f (x) − s(x) verifica

‖E′′‖[a,b] ≤

ℎ2

2‖f (4)

‖[a,b],

178

Page 179: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

y

‖E‖[a,b] ≤ℎ4

16‖f (4)

‖[a,b],

dondeℎ ∶= max

i=0,…,n|xi+1 − xi|

es la norma de la partición.

Demostración. Considerando la función lineal a trozos � que interpola a f ′′ enlos nudos x0,… , xn, deducimos del Teorema ?? la siguiente desigualdad

dist∞(f ′′, S1(x0,… , xn)) ≤ ‖f ′′ − �‖∞ ≤ ℎ2

8‖f (4)

‖[a,b]

y por el Lema ?? tenemos

‖E′′‖[a,b] ≤ 4 dist∞(f ′′, S1(x0,… , xn)) ≤

ℎ2

2‖f (4)

‖[a,b],

obteniéndose la primera desigualdad. Para la segunda, aplicamos la Proposición??

‖E‖[a,b] ≤ℎ2

8‖E′′

‖[a,b] ≤ℎ4

16‖f (4)

‖[a,b].

El Teorema anterior implica que si tomamos particiones con un número cre-ciente de nudos a = x0,n < x1,n < ⋯ < xn,n = b de modo que

maxi=0,…,n−1

|xi+1,n − xi,n| → 0,

entonces el spline de interpolación completo sn de una función f ∈ C4[a, b] enla sucesión de nodos x0,n < ⋯ < xn,n converge uniformemente a f ,

lımn→∞

‖f − sn‖∞ = 0.

Nota. La cota de error obtenida puede mejorarse. La siguiente desigualdad me-jorada fue obtenida en 1968 por C. A. Hall

‖E‖[a,b] ≤5ℎ4

384‖f (4)

‖[a,b].

C. A. Hall y W. W. Meyer demostraron en 1976 que la constante 5∕384 es lamejor constante que puede dar lugar a una cota del error de este tipo.

179

Page 180: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Ejemplo. Pretendemos acotar el error del interpolante spline completo de f (x) =x4 − x2 en x = −1, 0, 1. La fórmula de Hall nos proporciona la cota

‖E‖[−1,1] ≤5384

× 24 = 516

≈ 0.3125.

En este caso especialmente simple, podemos acotar el error de modo más preci-so usando fórmulas de error de interpolación polinómica. Debido a la simetríadel problema, el interpolante es una función par. Por tanto, ‖E‖[−1,1] = ‖E‖[0,1]y basta con acotar el error en [0, 1]. En dicho intervalo, vemos que s(0) = f (0),s(1) = f (1), s′(1) = f ′(1). Además, se deduce de la simetría del problema ques′(0) = 0 = f ′(0). Por tanto, la restricción de s al intervalo [0, 1] es el poli-nomio de interpolación cúbico de Hermite en 0, 1. Teniendo en cuenta que fes un polinomio de grado 4 y la derivada cuarta de f es constante, vemos que[0, 0, 1, 1, x]f = 1 y la fórmula del error se simplifica notablemente

E(x) = [0, 0, 1, 1, x]f x2(x − 1)2 = x2(1 − x)2, x ∈ [0, 1].

Como la función x2(1 − x)2 alcanza su valor máximo 1∕16 en x = 1∕2, sededuce que

‖E‖[−1,1] = ‖E‖[0,1] =116

= 0.0625.

Funciones spline de suavizadoUn problema variacional propuesto por I. J. Schoenberg consiste en mini-

mizar el funcional cuadrático

E[f ] + qJ [f ], f ∈ C2[a, b],

donde

E[f ] ∶=n∑

i=0wi(yi − f (xi))2, J [f ] ∶= ∫

b

af ′′(x)2dx.

para nodos a = x0 < x1 < ⋯ < xn = b. Los wi ≥ 0, i = 0,… , n, son pesosasociados a cada nodo y q > 0 es el parámetro de suavizado.

La solución de este problema no es un interpolante sino una aproximación.La gráfica es una curva suave que pasa cerca de los puntos (xi, yi), i = 0,… , n.De hecho, cuando q → +∞ la solución del problema tiende a la recta de regre-sión. Uno de los motivos por los que podemos requerir una aproximación que nopase necesariamente por los puntos dados es que los datos estén contaminados

180

Page 181: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

con un error. Por ejemplo, si los datos proceden de una medición de una funciónsuave s(x) tendremos

yi = s(xi) + �i, i = 0,… , n.

La elección de los pesos puede guiarse por consideraciones estadísticas delcomportamiento del error. Si disponemos de una estimación Vi de la varianzadel error �i en cada punto xi, una sugerencia razonable consiste en elegir pesoswi inversamente proporcionales a las varianzas del error Vi, i = 0,… , n.

Enunciamos a continuación el resultado de Schoenberg.

Teorema 5.12. El problema de minimizar el funcional

E[f ] + qJ [f ] =n∑

i=0wi(yi − f (xi))2 + q ∫

b

af ′′(x)2dx, f ∈ C2[a, b].

admite una única solución. Esta solución pertenece a Snat3 (x0,… , xn), el espa-

cio de las funciones spline cúbicas naturales con nudos en x0,… , xn.

Como la solución de este problema siempre se encuentra en el mismo es-pacio Snat

3 (x0,… , xn), se deduce que cuando q → 0+, la solución converge alúnico interpolante spline cúbico natural.

La Figura 5.7 muestra diferentes tipos de splines de suavizado correspon-dientes a parámetros q = 0, 0.01, 0.1, 1, 100. El interpolante corresponde aq = 0, mientras que la aproximación correspondiente a q = 100 está próxi-ma a la recta de regresión.

Utilizando el Lema ?? y siguiendo argumentos similares a los expuestos enla demostración del Teorema ?? puede demostrarse que si el problema de mini-mizar J en el espacio Snat

3 (x0,… , xn) admite una solución s, esta función será laúnica solución del problema de minimizar el funcional J en el espacio más am-plio de todas las funciones de C2[a, b]. Por tanto, para demostrar el Teorema ??,basta con demostrar que el problema de minimizar J en Snat

3 (x0,… , xn) admiteuna solución. Presentamos a continuación la resolución del problema propuestapor C. Reinsch.

Sea s ∈ Snat3 (x0,… , xn) cualquiera, entonces tenemos

�i ∶= yi − s(xi), zi ∶= s′′(xi), i = 0,… , n.

Observemos que z0 = zn = 0 porque s es una función spline cúbica natural. Sea

z ∶= (z1,… , zn−1)T ∈ ℝn−1, � ∶= (�0,… , �n) ∈ ℝn+1.

181

Page 182: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

-0.2

0

0.2

0.4

0.6

0.8

1

0 1 2 3 4 5 6 7 8

Figura 5.7. Aproximaciones spline de suavizado

Como s ∈ Snat3 (x0,… , xn) interpola los datos

s(xi) = yi − �i, i = 0,… , n,

podemos establecer una relación entre el vector z y el vector y − � como en lademostración del Teorema ?? (a)

Mz = 6N(y − �), (5.11)

donde M ∈ ℝ(n−1)×(n−1) es la matriz dada en (5.8) y N ∈ ℝ(n−2)×n es la matriztridiagonal dada por

N =

ℎ−10 −ℎ−1

0 − ℎ−11 ℎ−1

1 0 ⋯ 0

0 ℎ−11 −ℎ−1

1 − ℎ−12 ℎ−1

2 ⋱ ⋮

⋮ ⋱ ⋱ ⋱ ⋱ 0

0 ⋯ 0 ℎ−1n−2 −ℎ−1

n−2 − ℎ−1n−1 ℎ−1

n−1

.

Teniendo en cuenta que s′′(x) es lineal a trozos, podemos calcular el valorde J [s] sumando las contribuciones de las integrales de cada subintervalo

J [s] =n−1∑

i=0∫

xi+1

xis′′(x)2dx = 1

3

n−1∑

i=0ℎi(z2i + zizi+1 + z2i+1) =

16zTMz.

182

Page 183: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Por otro ladoE[s] = �TW �,

donde W ∶= diag(w0,… , wn). Para expresar el funcional en términos de �,despejamos z en (5.11),

z = 6M−1N(y − �)

y sustituimos obteniendo

E[s] + qJ [s] = �TW � + 6q(y − �)TNTM−1N(y − �).

El vector � que minimiza la expresión anterior debe verificar las ecuacionesnormales

W � − 6qNTM−1N(y − �) = 0. (5.12)

Podemos despejar directamente y − � de (5.12), resolviendo el sistema

(I + 6qW −1NTM−1N)(y − �) = y

y luego resolver (5.11) para calcular el spline cúbico de interpolación que inter-pola los datos y − �.

El algoritmo de Reinsch propone evitar la resolución sucesiva de dos siste-mas y la construcción explícita de la matriz W −1NTM−1N , planteando direc-tamente el sistema de ecuaciones que conduce a la obtención del vector z, cuyascomponentes son las derivadas segundas del spline de suavizado que buscamos,

zi = s′′(xi), i = 0,… , n.

Teniendo en cuenta que z = 6M−1N(y− �), deducimos de (5.12) que el vectorz verifica

W � − qNTz = 0. (5.13)

Esta relación permite expresar � en términos del vector z y obtener un sistemade ecuaciones cuyo vector de incógnitas es z. Para ello eliminamos � en (5.11),utilizando la relación

� = qW −1NTz

obtenida de (5.13)Mz = 6N(y − qW −1NTz),

obteniendo el siguiente sistema de ecuaciones

(M + 6qNW −1NT )z = 6Ny.

183

Page 184: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

La matriz del sistema anterior es una matriz definida positiva, por lo que elsistema tiene una única solución. Una vez obtenido z, se determina � mediantela relación

� = qW −1NTz.

Finalmente, la función spline de suavizado se determina utilizando fórmulassimilares a (5.5), teniendo en cuenta que el valor del spline en los nodos vienedado por el vector y − �.

s(x) = (yi − �i)(1 − �i(x)) + (yi+1 − �i+1)�i(x)

−ℎ2i

6�i(x)(1 − �i(x))[zi(2 − �i(x)) + zi+1(1 + �i(x))], x ∈ [xi, xi+1],

donde �i(x) = (x − xi)∕ℎi, i = 0,… , n − 1.

6. Derivación numéricaEn la práctica no siempre se necesita aproximar una función en todo un

intervalo sino estimar el valor de la función o de su derivada en algún punto ola integral en algún intervalo.

Teniendo en cuenta que

f ′(c) = lımℎ→0

f (c + ℎ) − f (c)ℎ

,

parece lógico obtener aproximaciones de f ′(c), calculando el cociente incre-mental de ℎ−1(f (c + ℎ) − f (c)), utilizando varios valores de ℎ, cada vez máspequeños, hasta que el valor de f ′(c) se aproxime suficientemente en el sentidode que el error cometido

R[f ] ∶= f ′(c) −f (c + ℎ) − f (c)

ℎ,

sea pequeño en valor absoluto. Como veremos al final de la sección, no podemoselegir valores de ℎ arbitrariamente pequeños, ya que los errores de redondeotienden a ∞ cuando ℎ → 0. Por ello, debemos proponer un valor concreto de ℎy estudiar si la fórmula proporciona una buena aproximación de la derivada.

En la fórmula anterior hemos considerado la información procedente de laevaluación de la función en dos puntos f (c) y f (c + ℎ). Parece lógico que siconsideramos la información de la evaluación en más de dos puntos, podamosmejorar el grado de aproximación de la fórmula.

184

Page 185: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

El problema de la derivación numérica trata de estimar el valor de la deri-vada de una función en algún punto x = c, combinado adecuadamente valoresde la función

f ′(c) ≈n∑

i=0aif (xi),

siendo x0,… , xn puntos distintos, llamados nodos de la fórmula.Aunque se tenga la igualdad para algunas funciones, siempre existirán fun-

ciones f derivables en c para las que f ′(c) no coincida con∑n

i=0 aif (xi). Esnecesario tener en cuenta el error (también llamado residuo o resto) de la fór-mula

R[f ] ∶= f ′(c) −n∑

i=0aif (xi),

lo que permite describir cualquier fórmula de derivación numérica a través dela igualdad

f ′(c) =n∑

i=0aif (xi) + R[f ].

Una cuestión de interés para el análisis del error consiste en identificar con-juntos de funciones para los que el residuo de la fórmula es nulo.

Definición. Una fórmula de derivación numérica

f ′(c) =n∑

i=0aif (xi) + R[f ].

es exacta en un conjunto de funciones F , si

f ′(c) =∑

i=0aif (xi), ∀f ∈ F ,

es decir, R[f ] = 0 para toda función f ∈ F .

Observemos que la linealidad de la fórmula de derivación implica que

R[

m∑

j=0cjfj

]

=m∑

j=0cjR[fj],

por lo que el conjunto de funciones para los que una fórmula es exacta es unespacio vectorial. Por tanto, si una fórmula es exacta en un conjunto F tambiénserá exacta en el espacio vectorial generado por el conjunto de funciones F . Asíque, para que la fórmula sea exacta en un espacio vectorial de funciones, bastacon imponer la exactitud de la fórmula en una base de dicho espacio.

185

Page 186: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Definición. Una fórmula de derivación numérica

f ′(c) =n∑

i=0aif (xi) + R[f ]

tiene grado precisión k si es exacta en Pk pero no es exacta en Pk+1.

De la definición se deducen las condiciones necesarias y suficientes de exac-titud. Eligiendo como base (x − c)j , j = 0,… , k, vemos que la fórmula

f ′(c) =n∑

i=0aif (xi) + R[f ]

es exacta en Pk sin∑

i=0ai(xi − c)j = �j1, j = 0,… , k.

Tomando k = 0, vemos que una fórmula de derivación numérica es exacta paralas constantes si y solo si los coeficientes de la fórmula suman cero

n∑

i=0ai = 0,

Si queremos que el grado de precisión sea por lo menos uno añadiremos lacondición

n∑

i=0ai(xi − c) = 1,

y para grados más altos tenemos las condicionesn∑

i=0ai(xi − c)j = 0, j = 2,… , k.

El conjunto de condiciones de exactitud en Pk puede escribirse en forma matri-cial

1 1 ⋯ 1

x0 − c x1 − c ⋯ xn − c

⋮ ⋮ ⋱ ⋮

(x0 − c)k (x1 − c)k ⋯ (xn − c)k

a0a1⋮

an

=

0

1

0

0

. (6.1)

186

Page 187: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Para que la fórmula tenga grado de precisión exactamente k es necesarioque se verifique la condición adicional

n∑

i=0ai(xi − c)k+1 ≠ 0.

Veamos que el grado de precisión de una fórmula de derivación numéricaestá definido y es siempre menor o igual que n + 1.

Proposición 6.1. El grado de precisión de una fórmula de derivación numéricacon n + 1 nodos es menor o igual que n + 1. Si además c ∈ {x0,… , xn}, elgrado de precisión es menor o igual que n.

Demostración. Supongamos que c ∉ {x0,… , xn} y sea p ∈ Pn+2 el polinomiode interpolación de Hermite

p(xi) = 0, i = 0,… , n, p(c) = 0, p′(c) = 1.

Entonces tenemosR[p] = 1 ≠ 0,

y la fórmula no es exacta para p ∈ Pn+2 por lo que el grado de precisión esmenor que n+ 2. En el caso en que c ∈ {x0,… , xn}, hay un dato repetido en elproblema de Hermite anterior. Por tanto, dicho problema admite una soluciónen p ∈ Pn+1 con R[p] = 1 ≠ 0, de donde se deduce que el grado de precisión esmenor que n + 1.

Fórmulas de tipo interpolatorioUna idea básica para construir una fórmula de derivación numérica consiste

en sustituir f por una función p más simple que f que la aproxime. Si p es unabuena aproximación de f , parece razonable que p′(c) sea una buena aproxima-ción de f ′(c). El cálculo de derivadas es particularmente simple para polino-mios, por lo que resulta natural proponer la elección de p = P (f ; x0,… , xn).Además, aplicando fórmulas del error de los interpolantes polinómicos, es po-sible deducir cotas para el error f ′(c) − p′(c) de la aproximación p′(c) de f ′(c).

Para expresar la idea anterior consideremos la fórmula de Lagrange del po-linomio de interpolación

p(x) =n∑

i=0f (xi)li(x),

187

Page 188: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

derivando el polinomio de interpolación y evaluando en x = c, obtenemos elvalor

p′(c) =n∑

i=0l′i(c)f (xi).

Comparando la fórmula anterior con

f ′(c) =n∑

i=0aif (xi) + R[f ],

vemos que la elección particular de ai = l′i(c), i = 0,… , n, da lugar a una fór-mula de derivación numérica tal que la aproximación de f ′(c) es precisamentela derivada en x = c del polinomio de interpolación de Lagrange en x0,… , xn.

Definición. Una fórmula de derivación numérica

f ′(c) =n∑

i=0aif (xi) + R[f ].

se dice de tipo interpolatorio si la aproximación de f ′(c) coincide con la de-rivada en c del polinomio de interpolación de f en los nodos x0,… , xn de lafórmula, es decir,

n∑

i=0aif (xi) =

ddx

|

|

|x=cP (f ; x0,… , xn)(x)

o, equivalentemente, si la fórmula tiene como coeficientes las derivadas en c delos polinomios de Lagrange en los nodos x0,… , xn

ai = l′i(c), i = 0,… , n.

Veamos quel′i(c) =

k≠i

1xi − xk

j≠i,k

c − xjxi − xj

.

Si c ∉ {x0,… , xn} ⧵ {xi}, entonces li(c) ≠ 0 y, derivando en la fórmula

log |li(x)| =∑

k≠ilog ||

|

x − xjxi − xj

|

|

|

,

obtenemosl′i(c)li(c)

=∑

k≠i

1c − xk

, l′i(c) = li(c)∑

k≠i

1c − xk

188

Page 189: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

es decir

l′i(c) =∏

j≠i

c − xjxi − xj

k≠i

1c − xj

=∑

k≠i

1xi − xk

j≠i,k

c − xjxi − xj

.

En caso contrario c = xk, k ≠ i,

li(x) =x − xkxi − xk

j≠i,k

x − xjxi − xj

, l′i(c) = l′i(xk) =1

xi − xk

j≠i,k

xk − xjxi − xj

,

y la fórmula también se verifica en ese caso.Nuestro próximo objetivo consiste en establecer una propiedad acerca del

grado de precisión de las fórmulas de tipo interpolatorio. Observemos que, sik = n, la matriz de coeficientes del sistema de ecuaciones que proporciona elcálculo de los coeficientes de una fórmula exacta en Pk es cuadrada y coincidecon la traspuesta de una matriz de Vandermonde y el sistema (6.1) admite unaúnica solución. El siguiente resultado identifica la única fórmula que es exactapara Pn en un conjunto de nodos dado.

Teorema 6.2. Una fórmula de derivación numérica

f ′(c) =n∑

i=0aif (xi) + R[f ]

es exacta en Pn si y solo si es de tipo interpolatorio.

Demostración. Supongamos que la fórmula es de tipo interpolatorio. Entoncesn∑

i=0aif (xi) =

ddx

|

|

|x=cP (f ; x0,… , xn)(x).

Si p ∈ Pn, tenemos que P (p; x0,… , xn)(x) = p(x), de donde

n∑

i=0aip(xi) =

ddx

|

|

|x=cP (p; x0,… , xn)(x) = p′(c).

Por tanto R[p] = 0 para toda función p ∈ Pn y la fórmula es exacta en Pn.Recíprocamente, sea una fórmula exacta en Pn. Como

p ∶= P (f ; x0,… , xn)

189

Page 190: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

es un polinomio de grado menor o igual que n tal que

p(xi) = f (xi), i = 0,… , n,

tenemosn∑

i=0aif (xi) =

n∑

i=0aip(xi) = p′(c) = d

dx|

|

|x=cP (f ; x0,… , xn)(x),

lo que muestra que la fórmula es de tipo interpolatorio.

El teorema anterior ofrece la posibilidad de obtener los coeficientes de lasfórmulas de tipo interpolatorio resolviendo el sistema de ecuaciones (6.1) conk = n como alternativa a la fórmula directa ai = l′i(c), i = 0,… , n.

Del teorema anterior también se deduce el siguiente resultado.

Corolario 6.3. Entre todas las fórmulas de derivación numérica que usan losmismos nodos, la de tipo interpolatorio es la que alcanza mayor grado de pre-cisión.

Demostración. Por el Teorema ??, la fórmula de tipo interpolatorio es la únicaque alcanza un grado de precisión mayor o igual que n. Recíprocamente todafórmula que alcance un grado de precisión mayor o igual que n, es exacta en Pny, por el Teorema ??, debe coincidir con la fórmula de tipo interpolatorio.

Podemos deducir el grado de precisión de una fórmula de derivación numé-rica de tipo interpolatorio utilizando la siguiente proposición.

Proposición 6.4. Una fórmula de derivación numérica con nodos x0,… , xndistintos alcanza grado de precisión n + 1 si y solo si es una fórmula de tipointerpolatorio y !′

n+1(c) = 0, donde !n+1(x) ∶=∏n

i=0(x − xi).

Demostración. Por el Teorema ??, tenemos que una fórmula de derivación nu-mérica es de tipo interpolatorio si y solo si es exacta en Pn. Por tanto, se alcan-zará el máximo grado de precisión n+1 si y solo si la fórmula es exacta para elpolinomio !n+1(x) ∶=

∏ni=0(x − xi). Como !n+1 se anula en todos los nodos,

!n+1(xi) = 0, i = 0,… , n, la condición de exactitud para este polinomio dalugar a la relación

!′n+1(c) =

n∑

i=0ai!n+1(xi) = 0.

190

Page 191: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Como todos los nodos son distintos, la función !n+1(x) =∏n

i=0(x − xi) notiene ceros dobles. Por tanto, si se verifica la condición !′

n+1(c) = 0, tenemosque !n+1(c) ≠ 0. Derivando log |!n+1(x)| en un entorno de c, obtenemos

!′n+1(c)

!n+1(c)=

n∑

i=0

1c − xi

. (6.2)

La condición !′n+1(c) = 0 equivale

n∑

i=0

1c − xi

= 0

con c ∉ {x0,… , xn}.Si el número de puntos es par y están simétricamente distribuidos respecto

a c, entonces∑n

i=0(c − xi)−1 = 0 y se verifica la condición para que la fórmulade derivación numérica de tipo interpolatorio alcance grado de precisión n+ 1.

Desarrollos de Taylor y orden de convergenciaLa técnica de desarrollos de Taylor puede ser útil para determinar fórmulas

de orden de convergencia alto. Queremos analizar qué condiciones son nece-sarias para tener convergencia de

∑ni=0 aif (xi) a la derivada f ′(c) cuando los

puntos x0,… , xn están cada vez más cerca de c.Partimos de una fórmula de derivación con centro c = 0, escrita en la forma

f ′(0) =n∑

i=0aif (ti) + R[f ].

Para cada c y cada ℎ ≠ 0 consideramos fórmulas de derivación numérica de laforma

f ′(c) = 1ℎ

n∑

i=0aif (c + tiℎ) + Rc,ℎ[f ].

Pretendemos determinar cómo deben ser los coeficientes ai para poder garanti-zar convergencia

lımℎ→0

1ℎ

n∑

i=0aif (c + tiℎ) = f ′(c),

e imponer condiciones adicionales para que la convergencia sea rápida. En elsiguiente resultado establecemos una relación entre las condiciones de exactitudy la convergencia de la fórmula.

191

Page 192: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Teorema 6.5. Sea

f ′(0) =n∑

i=0aif (ti) + R[f ]

una fórmula de derivación numérica exacta en Pk, k ≥ 1, y sea f una funciónde clase Ck+1 en un entorno de c, entonces

lımℎ→0

∑ni=0 aif (c + tiℎ)

ℎ= f ′(c)

y

lımℎ→0

f ′(c) − ℎ−1∑ni=0 aif (c + tiℎ)ℎk = K

f (k+1)(c)(k + 1)!

,

donde K ∶= −∑n

i=0 aitk+1i . Además el error de la fórmula de derivación numé-

rica

f ′(c) = 1ℎ

n∑

i=0aif (c + tiℎ) + Rc,ℎ[f ].

verifica

Rc,ℎ[f ] =Kf (k+1)(c)(k + 1)!

ℎk + o(ℎk) (ℎ → 0).

Demostración. Para obtener una expresión asintótica del residuo, consideramosel desarrollo de Taylor de cada término

f (c + tiℎ) = f (c) + f ′(c)tiℎ +⋯ +f (k)(c)k!

tki ℎk +

f (k+1)(ci(ℎ))(k + 1)!

tk+1i ℎk+1,

donde ci(ℎ) es un punto intermedio entre c y c+tiℎ. Sustituyendo los desarrollosanteriores en

Rc,ℎ[f ] = f ′(c) − 1ℎ

n∑

i=0aif (c + tiℎ),

deducimos que

−Rc,ℎ[f ] =f (c)ℎ

n∑

i=0ai + f ′(c)

(

− 1 +n∑

i=0aiti

)

+f ′′(c)ℎ

2!

n∑

i=0ait

2i

+⋯ +f (k)(c)ℎk−1

k!

n∑

i=0ait

ki +

ℎk

(k + 1)!

n∑

i=0f (k+1)(ci(ℎ))aitk+1i .

(6.3)

192

Page 193: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Para cancelar los primeros k+ 1 términos de este desarrollo, debemos imponern∑

i=0ai = 0,

n∑

i=0aiti = 1,

n∑

i=0ait

ji = 0, j = 2,… , k.

Estas condiciones son precisamente las condiciones (6.1) de exactitud en Pk dela fórmula

f ′(0) =n∑

i=0aif (ti) + R[f ].

Por tanto, los primeros términos en (6.3) se cancelan y se tiene

Rc,ℎ[f ] = − ℎk

(k + 1)!

n∑

i=0f (k+1)(ci(ℎ))aitk+1i ,

donde ci(ℎ) es un punto intermedio entre c y c + tiℎ. Se deduce que

lımℎ→0

ℎ−kRc,ℎ[f ] = −f (k+1)(c)(k + 1)!

n∑

i=0ait

k+1i = K

f (k+1)(c)(k + 1)!

.

Definiendog(ℎ) ∶= ℎ−kRc,ℎ[f ] −K

f (k+1)(c)(k + 1)!

,

tenemos que lımℎ→0 g(ℎ) = 0 y podemos escribir

Rc,ℎ[f ] = Kf (k+1)(c)(k + 1)!

ℎk + g(ℎ)ℎk = Kf (k+1)(c)(k + 1)!

ℎk + o(ℎk).

Finalmente, como k ≥ 1, tenemos lımℎ→0Rc,ℎ[f ] = 0, es decir

lımℎ→0

∑ni=0 aif (c + tiℎ)

ℎ= f ′(c).

193

Page 194: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Si la fórmula tiene grado de precisión exactamente k, entonces la constante

K ∶= −n∑

i=0ait

k+1i ≠ 0.

En ese caso, el términoKf (k+1)(c)(k + 1)!

ℎk

recibe el nombre de término principal del error, ya que es el término predomi-nante en la representación asintótica

Rc,ℎ[f ] =Kf (k+1)(c)(k + 1)!

ℎk + o(ℎk) (ℎ → 0),

El término principal del error proporciona una buena aproximación del errorcometido por la fórmula cuando ℎ es suficientemente pequeño. La potencia ℎk

en este término da una idea del orden de convergencia de la fórmula.Vemos que exactitud y orden de convergencia están relacionadas, ya que un

grado de precisión k implica un orden de convergencia de grado k. Recíproca-mente, si la fórmula tiene un orden de convergencia de grado k, entonces

Rc,ℎ[f ] = O(ℎk), (ℎ → 0),

para toda f suficientemente diferenciable. Aplicando la fórmula a los polino-mios (x − c)j ,

Rc,ℎ[f ] =(

�1,j −n∑

i=0ait

j)ℎj−1,

se deduce que Rc,ℎ[f ] es un polinomio en ℎ de grado menor o igual que j − 1y que ℎk divide a dicho polinomio. Por tanto Rc,ℎ[(⋅ − c)j] = 0, j = 0,… , k, yla fórmula es exacta en Pk.

En ciertas ocasiones es posible proporcionar una fórmula del error exacto.Para ello utilizaremos el siguiente resultado

Lema 6.6 (Teorema del valor medio). Sea f ∈ C[a, b], x0,… , xn ∈ [a, b],w0,… , wn ≥ 0 entonces existe � ∈ [a, b] tal que

n∑

i=0wif (xi) = f (�)

n∑

i=0wi.

194

Page 195: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Demostración. Trivial si w0 = ⋯ = wn = 0. Si∑n

i=0wi > 0, tenemos

mın(f (x0),… , f (xn)) ≤∑n

i=0wif (xi)∑n

i=0wi≤ max(f (x0),… , f (xn)).

Del Teorema de Bolzano se deduce que toda función continua en un intervalo to-ma cualquier valor intermedio entre dos valores dados (propiedad de Darboux).Por tanto f tomará en algún punto � el valor

f (�) =∑n

i=0wif (xi)∑n

i=0wi.

El Lema anterior puede ser útil para deducir expresiones del error de unafórmula de derivación numérica de grado de precisión k para una función f ∈Ck+1[a, b]. Recordemos que el error de una fórmula de derivación numéricaexacta en Pk puede escribirse en la forma

Rc,ℎ[f ] = − ℎk

(k + 1)!

n∑

i=0f (k+1)(ci(ℎ))aitk+1i ,

donde ci(ℎ) es un punto intermedio entre c y xi = c+ tiℎ. Si todos los productosaitk+1i son del mismo signo no estricto podremos aplicar el Lema ?? a la funcióncontinua f (k+1) y deducir que existe � ∈ [a, b] tal que

n∑

i=0f (k+1)(ci(ℎ))aitk+1i = f (k+1)(�)

n∑

i=0ait

k+1i .

Notemos que � depende de f de c y de ℎ. En este caso, tenemos la siguienteexpresión del error de derivación numérica

Rc,ℎ[f ] = Kf (k+1)(�)(k + 1)!

ℎk, K ∶= −n∑

i=0ait

k+1i .

En el caso general, separando los sumandos con coeficientes positivos y los quetienen coeficientes negativos tendremos

Rc,ℎ[f ] =K1f (k+1)(�1) −K2f (k+1)(�2)

(k + 1)!ℎk,

195

Page 196: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

dondeK1 ∶= −

aitk+1i <0

aitk+1i , K2 ∶=

aitk+1i >0

aitk+1i ,

verifican

K ∶= −n∑

i=0ait

k+1i = K1 −K2, K ∶=

n∑

i=0|ait

k+1i | = K1 +K2.

Tomando valores absolutos, podemos deducir una cota del error

|Rc,ℎ[f ]| ≤KMk+1

(k + 1)!ℎk, Mk+1 = max

x∈[a,b]|f (k+1)(x)|.

Error de una fórmula de tipo interpolatorioPara una fórmula de tipo interpolatorio

R[f ] = f ′(c) − ddx

|

|

|x=cP (f ; x0,… , xn)(x)

Recordemos que el error de interpolación venía definido por

E(x) ∶= f (x) − P (f ; x0,… , xn)(x),

luego el error de una fórmula de derivación numérica de tipo interpolatorio seobtiene derivando el error de interpolación

R[f ] = E′(c).

Partiendo de la fórmula del error de interpolación

E(x) = [x0,… , xn, x]f !n+1(x)

con !n+1(x) =∏n

j=0(x−xj), vemos que es preciso derivar diferencias divididascuyos argumentos son variables. Ofreceremos una solución de este problema enel apéndice.

Puede evitarse derivar explícitamente diferencias divididas respecto a susargumentos. La fórmula de Newton permite expresar la solución del problemade Hermite con nodos x0,… , xn, c, c en la forma

P (f ; x0,… , xn, c, c)(x) = P (f ; x0,… , xn)(x) + [x0,… , xn, c]f!n+1(x)+ [x0,… , xn, c, c]f (x − c)!n+1(x),

196

Page 197: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

donde !n+1(x) =∏n

j=0(x − xj). Como el nodo c está repetido en la sucesiónx0,… , xn, c, c, tenemos que

ddx

|

|

|x=cP (f ; x0,… , xn, c, c)(x) = f ′(c).

Por tanto

f ′(c) = ddx

|

|

|x=cP (f ; x0,… , xn)(x) + [x0,… , xn, c]f!′

n+1(c)

+ [x0,… , xn, c, c]fddx

|

|

|x=c[(x − c)!n+1(x)].

Derivandoddx

[(x − c)!n+1(x)] = (x − c)!′n+1(x) + !n+1(x),

y evaluando en x = c, obtenemos

ddx

|

|

|x=c[(x − c)!n+1(x)] = !n+1(c),

de donde se deduce la siguiente expresión del error de una fórmula de derivaciónnumérica de tipo interpolatorio

R[f ] = [x0,… , xn, c]f !′n+1(c) + [x0,… , xn, c, c]f !n+1(c).

El siguiente resultado presenta diferentes fórmulas del error según la po-sición relativa de los nodos x0,… , xn y el punto de evaluación de la derivadac.

Proposición 6.7 (Error de una fórmula de derivación numérica de tipo interpo-latorio). Sea una fórmula de derivación numérica

f ′(c) =n∑

i=0aif (xi) + R[f ]

de tipo interpolatorio. Sea I el menor intervalo que contiene a los nodos x0,… , xny a c.

(a) Si c = xi para algún i, entonces fórmula de derivación numérica tienegrado de precisión n y, para cada f ∈ Cn+1(I), existe � ∈ I tal que

R[f ] =f (n+1)(�)(n + 1)!

j∈{0,…,n}⧵{i}(c − xj).

197

Page 198: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

(b) Si c ∉ {x0,… , xn} y∑n

i=0(c−xi)−1 = 0, entonces fórmula de derivaciónnumérica tiene grado de precisión n+1 y, para cada f ∈ Cn+2(I), existe� ∈ I tal que

R[f ] =f (n+2)(�)(n + 2)!

n∏

j=0(c − xj).

(c) En el caso general c ∉ {x0,… , xn} y∑n

i=0(c − xi)−1 ≠ 0, la fórmulaalcanza grado de precisión n y para cada f ∈ Cn+2(I) existen �1, �2 ∈ Itales que

R[f ] =n

j=0(c − xj)

(f (n+1)(�1)(n + 1)!

n∑

i=0

1c − xi

+f (n+2)(�2)(n + 2)!

)

.

Demostración. El grado de precisión se deduce en cada caso del Teorema ?? yla Proposición ??. Si c coincide con un nodo c = xi entonces

!n+1(x) = (x − c)∏

j∈{0,…,n}⧵{i}(x − xj),

de donde se deduce que

!n+1(c) = 0, !′n+1(c) =

j∈{0,…,n}⧵{i}(c − xj) ≠ 0

y la fórmula del error se reduce a

R[f ] = [x0,… , xn, c]f∏

j∈{0,…,n}⧵{i}(c − xj).

Aplicando el Teorema del valor medio generalizado deducimos que para cadaf ∈ Cn+1(I), existe � tal que

R[f ] =f (n+1)(�)(n + 1)!

j∈{0,…,n}⧵{i}(c − xj).

En caso contrario, c ∉ {x0,… , xn}. Suponiendo que f ∈ Cn+2(I), podemosaplicar el Teorema del valor medio generalizado y deducir que existen �1, �2 ∈ Itales que

R[f ] =f (n+1)(�1)(n + 1)!

!′n+1(c) +

f (n+2)(�2)(n + 2)!

!n+1(c).

198

Page 199: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Aplicando la fórmula (6.2), tenemos

!′n+1(c) = !n+1(c)

n∑

i=0

1c − xi

, !n+1(c) =n

j=0(c − xj).

Si además∑n

i=0(c − xi)−1 = 0, entonces !′n+1(c) = 0 y la expresión del error se

reduce a un solo término.

Algunas fórmulas de derivación de tipo interpolatorioExpresaremos las fórmulas de derivación numérica más comunes en la for-

ma

f ′(c) = ℎ−1n∑

i=0aif (c + tiℎ) + Rc,ℎ[f ].

Modificando c y ℎ cambiaremos el punto de evaluación de la derivada y la escaladel problema. En el caso de tener dos nodos xi = c + tiℎ, i = 0, 1, la fórmula esdel tipo

f ′(c) =f (c + t1ℎ) − f (c + t0ℎ)

(t1 − t0)ℎ+ Rc,ℎ[f ].

y la estimación de la derivada coincide con la diferencia dividida [x0, x1]f enambos puntos, siendo el error

Rc,ℎ[f ] = −f ′′(�1)

2(t0 + t1)ℎ +

f ′′′(�2)6

t0t1ℎ2,

donde �1, �2 denotan a puntos del menor intervalo que contiene a c, x0, x1.Se alcanzará grado de precisión 2, cuando t0 + t1 = 0, o equivalentemente

cuando c sea el punto medio de x0, x1. Tomando t0 = −1, t1 = 1 obtenemos lafórmula de derivación en términos de diferencias centrales

f ′(c) =f (c + ℎ) − f (c − ℎ)

2ℎ−f ′′′(�)

6ℎ2.

Tomando t0 = 0, t1 = 1, tenemos la fórmula de derivación progresiva

f ′(c) =f (c + ℎ) − f (c)

ℎ−f ′′(�)2

ℎ,

mientras que la elección t0 = −1, t1 = 0 da lugar a la fórmula de derivaciónregresiva

f ′(c) =f (c) − f (c − ℎ)

ℎ+f ′′(�)2

ℎ,

199

Page 200: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

ambas con grado de precisión 1.En el caso de tres nodos (n = 2), podemos construir las fórmulas derivando

el polinomio de interpolación o eliminando los primeros términos en el desarro-llo de Taylor, aunque lo más práctico es determinar los coeficientes utilizandolas condiciones de exactitud en P2. Por ejemplo, la fórmula progresiva que uti-liza nodos equidistantes t0 = 0, t1 = 1, t2 = 2, da lugar a las condiciones deexactitud

a0 + a1 + a2 = 0, a1 + 2a2 = 1, a1 + 4a2 = 0.

Resolviendo el sistema se obtiene a0 = −3∕2, a1 = 2, a2 = −1∕2, de donde sededuce la fórmula de grado de precisión 2

f ′(c) =−3f (c) + 4f (c + ℎ) − f (c + 2ℎ)

2ℎ+f ′′′(�)

3ℎ2.

La fórmula regresiva correspondiente (t0 = −2, t1 = −1, t2 = 0) es

f ′(c) =f (c − 2ℎ) − 4f (c − ℎ) + 3f (c)

2ℎ+f ′′′(�)

3ℎ2.

La fórmula centrada con tres nodos t0 = −1, t1 = 0, t2 = 1, lleva a lascondiciones de exactitud

a0 + a1 + a2 = 0, −a0 + a2 = 1, a0 + a2 = 0.

De donde a1 = 0. Eso significa que la fórmula solamente usa 2 nodos y, dehecho, coincide con la fórmula basada en los nodos c − ℎ y c + ℎ, descritaanteriormente.

Por último discutiremos una fórmula de tipo interpolatorio en cuatro nodossimétricos respecto al centro que alcanza un grado de precisión 4. Tomamost0 = −2, t1 = −1, t2 = 1, t3 = 2. La simetría del problema permite deducir quea3 = −a0 y a2 = −a1 y las condiciones de exactitud se reducen a

a2 + 2a3 = 1∕2, a2 + 8a3 = 0.

Resolviendo el sistema, se obtiene −a0 = a3 = −1∕12 y −a1 = a2 = 2∕3 y lafórmula correspondiente es

f ′(c) =f (c − 2ℎ) − 8f (c − ℎ) + 8f (c + ℎ) − f (c + 2ℎ)

12ℎ+f (5)(�)30

ℎ4.

200

Page 201: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Error de redondeo y derivación numéricaEl error de redondeo aparece al tener que representar números reales en la

memoria del ordenador. Al ser la memoria física finita, la representación nece-sariamente utiliza un número de cifras finito. Las diferentes representaciones encoma flotante intenta extraer un subconjunto finito de números reales de maneraque el número representable en coma flotante más próximo f l(x) a un númeroreal dado x (dentro de un amplio rango de valores reales rmın ≤ |x| ≤ rmax)tenga un error relativo acotado, es decir,

|x − f l(x)||x|

< u,

donde u es la llamada unidad de redondeo.La representación en coma flotante típica en los ordenadores se basa en la

representación binaria. Todo número real admite una representación binaria

x = s 2e∞∑

k=1

ak2k,

donde s ∈ {−1, 1} es el signo de la representación, e el exponente de la repre-sentación y ak ∈ {0, 1}, k ≥ 1, es la sucesión de sus cifras en representaciónbinaria. La representación no es única. Si x ≠ 0, s queda determinado por elsigno de x; la sucesión de cifras (ak)k≥1, y el exponente e quedan determina-dos si la representación binaria verifica la condición de normalización a1 ≠ 0y la condición adicional de que no todos los términos de la sucesión (ak)k≥1sean iguales a 1. Cuando queremos representar un número real en el ordenador,debemos limitar los exponentes

emın ≤ e ≤ emax

y el número de cifras utilizadas de modo que los números representables enaritmética de coma flotante son de la forma

s 2ep∑

k=1

ak2k,

donde p es la precisión de la aritmética, es decir, el número de cifras binariasque almacenamos. El cero se representa usando el exponente mínimo y todaslas cifras nulas a1 = ⋯ = ap = 0, admitiendo dos representaciones con signos = 1 y con signo s = −1.

201

Page 202: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Los números normalizados son aquellos números no nulos que se represen-tan con exponentes emın ≤ e ≤ emax y a1 ≠ 0. Además un exponente reservadose utiliza para representar desbordamiento aritmético (también llamado over-flow) representadas como +∞, −∞ y valores no numéricos NAN, resultado deexcepciones aritméticas. En los modelos aritméticos actuales se permite poderexpresar algunos números reales con 0 < |x| < rmın mediante una representa-ción no normalizada con e = emın y a1 = 0, de manera que se rellena la sepa-ración entre 0 y el resto de números normalizados consiguiendo un underflowgradual.

El mayor número positivo normalizado expresable en la aritmética es

rmax = 2emax−1p∑

k=12−k = 2emax−1(1 − 2−p)

y el menor número positivo normalizado es

rmın = 2emın−1.

Notemos que si x es un número real representable en la aritmética, entonces

2p−ex = sp∑

k=1ak2p−k

es un número entero.El redondeo es una aplicación que transforma todo número real x en el nú-

mero más próximo en coma flotante f l(x). Seam = ⌊2p−ex⌋ ∈ ℤ. El número real2p−ex se encuentra entre los enteros m y m+1, de modo que m2e−p y (m+1)2e−pson los únicos candidatos para f l(x). Tenemos

f l(x) = m2e−p, si 2p−e − m ∈ [0, 1∕2),f l(x) = (m + 1)2e−p, si 2p−e − m ∈ (1∕2, 1),

Si 2p−ex−m = 1∕2, hay dos posibles elecciones para f l(x) porque x es el puntomedio del intervalo determinado por las representaciones en coma flotante máspróximas a derecha y a izquierda de x.

Dado un número real x con rmın ≤ |x| ≤ rmax , cualquier selección delnúmero en coma flotante más próximo verifica

2p−e(x − f l(x)) ≤ 12,

Definiendo la unidad de redondeo en esta aritmética u ∶= 2−p , tenemos

|x − f l(x)| ≤ 2e−p−1 = 2e−1u.

202

Page 203: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Si |x| = 2e−1, entonces f l(x) = x y el error de la representación en comaflotante es nulo. En caso contrario, tenemos |x| > 2e−1, y el error relativo de laaproximación en coma flotante verifica la acotación

|x − f l(x)||x|

< u.

Por tanto, en un modelo aritmético de coma flotante, podemos suponer que

f l(x) = x(1 + �), |�| < u.

En simple precisión, el valor de la unidad de redondeo es u = 2−24 ≈ 5.96×10−8y en doble precisión u = 2−53 ≈ 1.11 × 10−16.

Si x0, x1 son representables exactamente en aritmética de coma flotante, lasoperaciones aritméticas en el ordenador verifican

f l(x0⊥x1) = (x0⊥x1)(1 + �), |�| ≤ u,

donde ⊥ denota cualquiera de las operaciones +,−,×, ∕.Una fórmula de derivación numérica puede expresarse en la forma

f ′(c) = ℎ−1n∑

i=0aif (c + tiℎ) + Rc,ℎ[f ],

donde el error verifica una acotación del tipo

|Rc,ℎ[f ]| ≤KMk+1ℎk

(k + 1)!, Mk+1 = max

x∈[a,b]|f k+1(x)|, K ∶=

n∑

i=0|ait

k+1i |,

donde [a, b] es un intervalo que contiene a todos los nodos para los valores de ℎconsiderados. La fórmula converge cuando ℎ → 0, lo que parece indicar que laelección de ℎ tan pequeño como sea posible será ventajosa. Esta consideraciónno tiene en cuenta el error de redondeo.

Cuando se evalúa una fórmula de derivación numérica

d(ℎ) ∶=∑n

i=0 aif (c + tiℎ)ℎ

cometemos un error debido al redondeo y el valor d(ℎ) calculado por el orde-nador no será el mismo que el valor d(ℎ) que hubiéramos obtenido realizandocálculos exactos partiendo de valores exactos de la función. Por tanto, el error

203

Page 204: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

0

0.0002

0.0004

0.0006

0.0008

0.001

0.005 0.01 0.015 0.02 0.025 0.03 0.035 0.04 0.045 0.05

Figura 6.1. Cota de la suma de errores de redondeo y de truncaciónen función de ℎ para f ′(c) ≈ (2ℎ)−1(f (c + ℎ) − f (c − ℎ)).

cometido al aplicar la fórmula puede descomponerse como suma de dos erroresde distinta interpretación

f ′(c) − d(ℎ) = Rc,ℎ[f ] − (d(ℎ) − d(ℎ)).

El primer término Rc,ℎ[f ] hace referencia al error de la fórmula de derivación,suponiendo que la fórmula se haya evaluado exactamente. El segundo términod(ℎ) − d(ℎ) es el error del algoritmo de evaluación de la fórmula, teniendo encuenta la acumulación sucesiva de los correspondientes errores de redondeo yla imposibilidad de partir de valores exactos. Tomando valores absolutos obte-nemos una cota del error total que incorpora ambas fuentes de error

|f ′(c) − d(ℎ)| ≤KMk+1ℎk

(k + 1)!+ |d(ℎ) − d(ℎ)|.

Típicamente |d(ℎ) − d(ℎ)| aumenta al disminuir ℎ y una elección de un pará-metro ℎ demasiado pequeño, da lugar a errores de gran tamaño. La elección deℎ debe equilibrar ambas fuentes de error: el error de aproximación y el error deredondeo.

Para ilustrar este hecho consideremos la fórmula de derivación numérica

f ′(c) =f (c + ℎ) − f (c − ℎ)

2ℎ+ Rc,ℎ[f ],

204

Page 205: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

con Rc,ℎ[f ] = −f ′′′(�)ℎ2∕6. Llamando M3 ∶= maxx∈[a,b] |f ′′′(x)|, se deducela siguiente cota del residuo de la fórmula

|Rc,ℎ[f ]| ≤M3

6ℎ2.

Para simplificar nuestro análisis supondremos que partimos de valores ℎ,x0 = c−ℎ y x1 = c+ℎ exactos y representables en aritmética de coma flotante.Por muy estable que sea un algoritmo de evaluación de una función, siemprehabrá una diferencia entre los valores y0 ∶= f (x0), y1 ∶= f (x1) y los valorescalculados yi, de manera que las diferencias �i ∶= yi − yi verifican

|�i| ≤ Lu|yi|, i = 0, 1, (6.4)

donde u es la unidad de redondeo de la aritmética y L una constante mayoro igual que 1, que depende de f , c y ℎ y también del método de evaluaciónutilizado para calcular los valores de la función f . En el caso de algoritmosestables, esta constante L no será demasiado grande. Si la función f puedeevaluarse con gran precisión en un intervalo que contiene a c − ℎ, c, c + ℎ,tendremos L ≈ 1.

Vamos a acotar la diferencia entre el valor teórico de la fórmula de deriva-ción numérica

d(ℎ) ∶=y1 − y02ℎ

y el obtenido sustituyendo los valores y0, y1 por los efectivamente calculadosy0, y1. Usando (6.4) y llamando M0 ∶= maxx∈[a,b] |f (x)|, obtenemos

|

|

|

y1 − y02ℎ

− d(ℎ)|||

=|�1 − �0|

2ℎ≤ Lu

|y0| + |y1|2ℎ

≤M0Luℎ

. (6.5)

Debido al error de los cálculos en aritmética de coma flotante, el valor cal-culado d(ℎ) será diferente del valor (2ℎ)−1(y1 − y0). Como ℎ es representableexactamente en aritmética de coma flotante tenemos

d(ℎ) = f l(f l(y1 − y0)

2ℎ

)

.

Los modelos de aritmética en coma flotante nos permiten deducir que

d(ℎ) = f l(f l(y1 − y0)

2ℎ

)

=y1 − y02ℎ

(1 + �1)(1 + �2), |�1|, |�2| < u,

y el error de redondeo las operaciones de resta y división

r(ℎ) ∶= d(ℎ) −y1 − y02ℎ

=y1 − y02ℎ

(�1 + �2 + �1�2)

205

Page 206: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

verifica la siguiente cota

|r(ℎ)| ≤ u(2 + u)|y1 − y0|

2ℎ. (6.6)

Usando (6.5) y teniendo en cuenta que y1− y0 = y1−y0+�1−�0, obtenemos

|y1 − y0|2ℎ

≤|y1 − y0|

2ℎ+|�1 − �0|

2ℎ≤ M1 +

M0Luℎ

,

donde M1 ∶= maxx∈[a,b] |f ′(x)|. Utilizando la desigualdad anterior en (6.6),obtenemos la cota

|r(ℎ)| ≤ u(2 + u)(

M1 +M0Luℎ

)

. (6.7)

Para acotar la diferencia entre la aproximación de la derivada d(ℎ) y el valorcalculado d(ℎ), observamos que

d(ℎ) − d(ℎ) =y1 − y02ℎ

− d(ℎ) + d(ℎ) −y1 − y02ℎ

=�1 − �02ℎ

+ r(ℎ),

y combinando las desigualdades (6.5) y (6.7), deducimos la siguiente acotación

|d(ℎ) − d(ℎ)| ≤M0Luℎ

+ u(2 + u)(

M1 +M0Luℎ

)

= u(

(2 + u)M1 + (1 + u)2M0Lℎ

)

.

Por tanto el error total de la fórmula puede acotarse

|f ′(c)−d(ℎ)| ≤ |Rc,ℎ[f ]|+|d(ℎ)−d(ℎ)| ≤M3ℎ2

6+u

(

(2+u)M1+(1+u)2M0Lℎ

)

.

Queremos obtener un valor de ℎ que nos permita dar una cota del erroróptima, lo que equivale a minimizar la función

M3ℎ2

6+ u(1 + u)2

M0Lℎ

.

Derivando respecto a ℎ e igualando a cero obtenemos

M3ℎ3

− u(1 + u)2M0Lℎ2

= 0,

206

Page 207: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

que corresponde a

ℎ0 =3

3u(1 + u)2M0LM3

en donde la cota del error total se hace mínima.En los modelos aritméticos usuales u ≪ 1 y

ℎ0 ≈3√

3uLM0∕M3.

En simple precisión, u = 2−24, y

ℎ0 ≈ 2−8 3√

3LM0∕M3 ≈ 0.00563 3√

LM0∕M3.

Del análisis anterior, se deduce la siguiente recomendación práctica para cálcu-los en simple precisión: no deben utilizarse valores deℎmucho menores que cin-co milésimas en la fórmula de derivación numérica (2ℎ)−1(f (c+ℎ)−f (c−ℎ)),a no ser que LM0 ≪ M3. En el caso LM0 ≪ M3, el error de aproximacióntodavía puede ser grande en comparación con el de redondeo, lo que abre la po-sibilidad de considerar valores de ℎ menores que 0.00563 para mejorar el errortotal.

Apéndice: derivada de una diferencia divididaPara poder derivar el error de interpolación en la fórmula

E(x) = [x0,… , xn, x]f !n+1(x),

demostraremos el siguiente resultado.

Proposición 6.8.

dk

dxk[x0,… , xn, x]f = k![x0,… , xn, x

[k+1]]f,

donde x[k+1] indica que el punto x está repetido k + 1 veces como argumentode la diferencia dividida.

Demostración. Por definición de derivada tenemos

ddx

[x0,… , xn, x]f = lımℎ→0

[x0,… , xn, x + ℎ]f − [x0,… , xn, x]fℎ

= lımℎ→0

[x0,… , xn, x, x + ℎ]f.

207

Page 208: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

La fórmula de Genocchi-Hermite demuestra que las diferencias divididas sonfunciones continuas de sus argumentos, luego

lımℎ→0

[x0,… , xn, x, x + ℎ]f = [x0,… , xn, x, x]f,

y por tantoddx

[x0,… , xn, x]f = [x0,… , xn, x, x]f,

que corresponde al caso k = 1.Supongamos ahora que la fórmula es válida para k − 1, entonces tenemos

dk

dxk[x0,… , xn, x]f

= (k − 1)! lımℎ→0

[x0,… , xn, (x + ℎ)[k]]f − [x0,… , xn, x[k]]fℎ

Para deducir el valor del límite, basta con tener en cuenta que

[x0,… , xn, xn+1 + ℎ,… , xn+k + ℎ]f − [x0,… , xn, xn+1,… , xn+k]fℎ

coincide conk∑

j=1[x0,… , xn+1,… , xn+j , xn+j + ℎ,… , xn+k + ℎ]f,

y utilizando la continuidad de las diferencias divididas respecto a sus argumen-tos, vemos que la expresión anterior converge a

k∑

j=1[x0,… , xn+1,… , xn+j , xn+j ,… , xn+k]f,

cuando ℎ → 0. Por tanto

lımℎ→0

[x0,… , xn, (x + ℎ)[k]]f − [x0,… , xn, x[k]]fℎ

= k[x0,… , xn, x[k+1]]f.

El resultado anterior nos proporciona fórmulas del error en derivación nu-mérica. Aplicando la fórmula de derivada de un producto a la expresión del errorde interpolación

E(x) = [x0,… , xn, x]f!n+1(x),

208

Page 209: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

obtenemos

E′(x) = [x0,… , xn, x]f!′n+1(x) + [x0,… , xn, x, x]f!n+1(x)

y, evaluando en x = c, deducimos la expresión del resto de una fórmula dederivación numérica de tipo interpolatorio

R[f ] = E′(c) = [x0,… , xn, c]f!′n+1(c) + [x0,… , xn, c, c]f!n+1(c).

7. Cuadratura NuméricaLa interpolación se revela útil no solamente en la aproximación de valores

de derivadas sino también en el problema de aproximar otros funcionales, comovalores de derivadas de orden más alto, o integrales ponderadas.

Una regla de cuadratura numérica es una fórmula del tipo

∫If (x)w(x)dx =

n∑

i=0wif (xi) + R[f ],

donde w(x) es una función no negativa e integrable sobre I y no nula en casitodo punto. Los valores w0,… , wn se llaman pesos, de la fórmula, los puntosx0,… , xn reciben el nombre de nodos y R[f ] es el residuo o error de la fórmulade cuadratura.

En el caso en que I = [a, b] es un intervalo compacto y w(x) = 1, tene-mos una regla de cuadratura numérica que estima el valor de la integral de fen el intervalo [a, b]. El caso en el que I es un intervalo no acotado o w(x)contiene singularidades permite establecer reglas de cuadratura para integralesimpropias.

Algunos autores utilizan el término de regla de cuadratura mecánica parareferirse a las reglas de cuadratura numérica. Los pesos ambién reciben el nom-bre de números de Cotes en honor al matemático Roger Cotes que estudió estetipo de fórmulas.

El nombre de pesos parece sugerir que todos los valores w0,… , wn son ma-yores o iguales que cero. Aunque las fórmulas más utilizadas tienen todos suspesos positivos, algunas fórmulas pueden tener pesos negativos. Observemosque la presencia de un peso nulo wi = 0 corresponde a una fórmula en la que nointerviene el nodo xi. Eliminando los nodos con pesos nulos puede suponerseen caso necesario que todos los pesos de la fórmula son no nulos. Por otro lado,añadir nodos con pesos nulos a una fórmula de cuadratura permite dar interpre-taciones diferentes de la misma fórmula con diferentes valores de n que puedenconducir a diferentes fórmulas del error.

209

Page 210: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Las fórmulas de cuadratura utilizan generalmente nodos x0,… , xn del in-tervalo de integración I . La mayoría de los resultados se extienden fácilmenteal caso en que algún nodo esté situado fuera del intervalo de integración. Seadvertirá en su caso cuándo la hipótesis de que xi ∈ I , para todo i = 0,… , n,es necesaria para que se verifique una fórmula o un teorema.

Aplicaremos la regla de cuadratura a funciones continuas definidas en unintervalo J que contenga a I y a todos los nodos de la fórmula. La continuidades necesaria para dotar de sentido numérico a la evaluación en los nodos. Algu-nas fórmulas del error requieren que la función tenga derivadas continuas hastacierto orden en el intervalo J .

Para poder aproximar el valor de la integral ∫I f (x)w(x)dx, la función fwdebe ser integrable, es decir,

∫I|f (x)|w(x)dx < +∞.

Si f es una función continua y acotada en el intervalo I , la función fw estáacotada en módulo por la función Mw no negativa e integrable, donde M ∶=supx∈I |f (x)|. Por tanto, fw es una función integrable. En particular, si I =[a, b] es un intervalo cerrado y acotado, la integrabilidad de fw es automáticapara cualquier f ∈ C[a, b], ya que toda función continua en [a, b] está acotada.

En el caso general de funciones continuas en intervalos no cerrados o noacotados, la integrabilidad no es automática y es necesario imponer la integra-bilidad de |f |w.

Condiciones de exactitudDecimos que la fórmula es exacta en Pk si |p|w es integrable en I y R[p] =

0, para todo p ∈ Pk. Si |p|w es integrable en I para todo p ∈ Pk+1, la fórmulaes exacta en Pk pero no es exacta en Pk+1, decimos que el grado de precisión dela fórmula es k.

La fórmula es exacta para constantes si y solo si se verifica la condiciónn∑

i=0wi = ∫I

w(x)dx.

Sea � la medida correspondiente a la densidad w, es decir, d�(x) = w(x)dx.La densidad w debe ser no negativa, integrable y no nula en casi todo punto,

por lo que � es una medida no negativa y finita con

�(I) = ∫Iw(x)dx > 0.

210

Page 211: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Por tanto la suma de los pesos de una fórmula exacta para constantes es positiva.En el caso de que k > 0 y, si la integral que aproximamos es una integral

impropia, conviene identificar espacios de polinomios Pk para los que se puedegarantizar la condición de integrabilidad.

Lema 7.1. Sea w una función medible no negativa. La condición necesaria ysuficiente para que |p|w sea una función integrable en I para todo p ∈ Pk esque

∫I(1 + |x|k)w(x)dx < +∞.

Demostración. Si |p|w, para todo p ∈ Pk, entonces tomando p(x) = 1 y p(x) =xk, tenemos que w(x) y w(x)|xk| son funciones integrables, y por tanto su sumaserá integrable.

Recíprocamente, si 0 ≤ j ≤ k

|xj| ≤ 1 ≤ 1 + |x|k, |x| ≤ 1,

y|xj| ≤ |x|k ≤ 1 + |x|k, |x| ≥ 1.

Por tanto todos los elementos de la base de monomios xj , j = 0,… , k, estánacotados en módulo por la función 1 + |x|k, lo que implica que

∫I|xk|w(x)dx < +∞.

Se deduce que |p|w es integrable en I , para todo p ∈ Pk.

Las condiciones de exactitud en Pk equivalen a imponer la exactitud de cual-quier base de Pk. Tomando la base

1, x − c,… , (x − c)k

las condiciones se reducen an∑

i=0wi(xi − c)j = ∫I

(x − c)jw(x)dx.

El valormj ∶= ∫I

(x − c)jw(x)dx,

recibe el nombre de momento j-ésimo de la medida d�(x) = w(x)dx respectoal punto c en el intervalo I .

211

Page 212: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Podemos expresar estas condiciones en la forma

1 1 ⋯ 1

x0 − c x1 − c ⋯ xn − c

⋮ ⋮ ⋱ ⋮

(x0 − c)k (x1 − c)k ⋯ (xn − c)k

w0

w1

wn

=

m0

m1

mk

.

Observamos que si k = n, la matriz del sistema es la traspuesta de una matriz deVandermonde y por lo tanto, es una matriz no singular. En ese caso, los pesosquedan determinados por los nodos. La elección de un centro c apropiado puedesimplificar los cálculos. En la práctica el sistema adopta una forma más simplesi c coincide con uno de los extremos del intervalo o si tomamos c como elcentro de gravedad del intervalo

c =∫I xw(x)dx∫I w(x)dx

,

condición sobre c equivalente a imponer que el momento m1 sea nulo.

Fórmulas de cuadratura de tipo interpolatorio y su errorUna fórmula de integración numérica es de tipo interpolatorio si |w|p es

integrable para cualquier p ∈ Pk yn∑

i=0wif (xi) = ∫I

P (f ; x0,… , xn)(x)w(x)dx.

Es decir, la regla de cuadratura se obtiene calculando la integral ponderada delpolinomio de interpolación de f en los nodos de la fórmula.

Observamos que si la fórmula es de tipo interpolatorio, entonces los pesosquedan unívocamente determinados por los nodos. En efecto, integrando la fór-mula de Lagrange

P (f ; x0,… , xn)(x)dx =n∑

i=0f (xi)li(x),

obtenemos

∫IP (f ; x0,… , xn)(x)w(x)dx =

n∑

i=0f (xi)∫I

li(x)w(x)dx,

212

Page 213: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

lo que determina los pesos de la fórmula de tipo interpolatorio

wi = ∫Ili(x)w(x)dx, i = 0,… , n.

Teniendo en cuenta que

li(x) =!n+1(x)

!′n+1(xi)(x − xi)

con !n+1(x) = (x − x0)⋯ (x − xn), podemos expresar los pesos mediante lafórmula alternativa

wi =1

!′n+1(xi) ∫

b

a

!n+1(x)x − xi

w(x)dx, i = 0,… , n.

Como en el caso de fórmulas de derivación numérica, tenemos que una fórmulaes de tipo interpolatorio si y solo si alcanza un grado de precisión mayor o igualque n.

Teorema 7.2. Una fórmula de cuadratura numérica

∫If (x)w(x)dx =

n∑

i=0wif (xi) + R[f ]

es exacta en Pn si y solo si es de tipo interpolatorio.

Demostración. Supongamos que la fórmula de cuadratura es de tipo interpola-torio. Entonces

n∑

i=0wif (xi) = ∫I

P (f ; x0,… , xn)(x)w(x)dx.

Si p ∈ Pn, tenemos que P (p; x0,… , xn)(x) = p(x), de donde

n∑

i=0wip(xi) = ∫I

P (p; x0,… , xn)(x)w(x)dx = ∫Ip(x)w(x)dx.

Por tanto R[p] = 0 para toda función p ∈ Pn y la fórmula es exacta en Pn.Recíprocamente, sea una fórmula exacta en Pn. Como

p ∶= P (f ; x0,… , xn)

213

Page 214: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

es un polinomio de Pn tal que p(xi) = f (xi), i = 0,… , n, tenemosn∑

i=0wif (xi) =

n∑

i=0wip(xi) = ∫I

p(x)w(x)dx = ∫IP (f ; x0,… , xn)(x)w(x)dx,

lo que muestra que la fórmula es de tipo interpolatorio.

Si una fórmula es de tipo interpolatorio tenemos

R[f ] ∶= ∫If (x)w(x)dx−

n∑

i=0wif (xi) = ∫I

(f (x)−P (f ; x0,… , xn)(x))w(x)dx,

es decir, el error de las fórmulas de tipo interpolatorio se obtiene integrando elerror de interpolación.

Por tanto, tenemos

R[f ] = ∫I[x0,… , xn, x]f!n+1(x)w(x)dx,

donde !n+1(x) = (x − x0)⋯ (x − xn).De esta fórmula se deducen cotas del error. Estas cotas son útiles si el grado

de precisión es exactamente n. En el siguiente resultado ofrecemos una cota delerror que refleja el verdadero orden de la fórmula si el grado de precisión esmayor que n.Teorema 7.3 (Error de una fórmula de tipo interpolatorio). Si una regla de cua-dratura numérica

∫If (x)w(x)dx =

n∑

i=0wif (xi) + R[f ]

es exacta en Pk con k ≥ n, entonces es de tipo interpolatorio respecto al pro-blema de Hermite correspondiente a cualquier sucesión extendida de nodos deinterpolación x0,… , xn, xn+1,… , xk que contenga a los nodos x0,… , xn y elerror admite la expresión

R[f ] = ∫I[x0,… , xk, x]f (x − x0)⋯ (x − xk)w(x)dx.

Sea J el menor intervalo que contiene a I y a todos los nodos x0,… , xk. Si∏k

i=0 |x − xi|w(x) es integrable, entonces el error verifica la siguiente cota

|R[f ]| ≤Mk+1

(k + 1)! ∫I

k∏

i=0|x − xi|w(x)dx, Mk+1 ∶= sup

x∈J|f (k+1)(x)|,

para toda f ∈ Ck+1(J ) tal que f (k+1) está acotada en J .

214

Page 215: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Demostración. Como el interpolante

p(x) ∶= P (f ; x0,… , xn, xn+1,… , xk)(x)

pertenece al espacio Pk. Teniendo en cuenta que p(xi) = f (xi), i = 0,… , n, laexactitud de la fórmula implica que

n∑

i=0wif (xi) =

n∑

i=0wip(xi) = ∫I

p(x)w(x)dx.

y la fórmula es de tipo interpolatorio respecto al problema de Hermite con nodosx0,… , xk. El error de la regla de cuadratura admite la expresión

R[f ] = ∫If (x)w(x)dx−

n∑

i=0wif (xi) = ∫I

(f (x)−P (f ; x0,… , xk)(x))w(x)dx,

cualesquiera que sean los nodos adicionales xn+1,… , xk.Si f ∈ Ck+1(J ), por el Teorema del valor medio de Lagrange generalizado

tenemos que

|[x0,… , xk, x]f | =|f (k+1)(�)|(k + 1)!

, � ∈ J .

y si f (k+1) está acotada en J con Mk+1 = supx∈J |f (k+1)(x)|, entonces

|[x0,… , xn, x]f | ≤Mk+1

(k + 1)!.

Se deduce la siguiente cota del error

|R[f ]| ≤Mk+1

(k + 1)! ∫I

k∏

i=0|x − xi|w(x)dx.

Para obtener una expresión exacta del error en términos de derivadas de fde orden superior, utilizaremos el Teorema del Valor Medio del cálculo integralcuya demostración esbozamos.

Teorema 7.4 (Primer Teorema del valor medio del Cálculo Integral). Sea w unafunción integrable en un intervalo I y continua en el interior de I . La función wno cambia de signo en el interior del intervalo I si y solo si para cada f ∈ C(I)tal que fw integrable, existe � ∈ I tal que

∫If (x)w(x)dx = f (�)∫I

w(x)dx.

215

Page 216: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Demostración. Si la propiedad se verifica para w también se verifica para −w.Por tanto, no hay pérdida de generalidad en suponer que w ≥ 0.

Si ∫I w(x)dx = 0, entonces w es nula en casi todo punto y tenemos que∫I f (x)w(x)dx = 0. Por tanto, se verifica la propiedad cualquiera que sea laelección de � ∈ I .

Supondremos que w ≥ 0 y que ∫I w(x)dx > 0. Sea m ∶= ınfx∈I f (x) ∈[−∞,+∞), M ∶= supx∈I f (x) ∈ (−∞,+∞].

De la monotonía de la integral se deduce que

m∫Iw(x)dx ≤ ∫I

f (x)w(x)dx ≤ M ∫Iw(x)dx.

Como ∫I w(x)dx > 0, tenemos

m ≤∫I f (x)w(x)dx∫I w(x)dx

≤ M

Si alguna desigualdad no es estricta

∫I f (x)w(x)dx∫I w(x)dx

= m o∫I f (x)w(x)dx∫I w(x)dx

= M,

entonces

∫I(M − f (x))w(x)dx = 0 o ∫I

(f (x) − m)w(x)dx = 0

entonces f (x) será constante casi en todo punto del conjunto de medida no nulade {x ∈ I|w(x) ≠ 0}, coincidiendo con su valor ínfimo m o supremo M enalgún conjunto de medida no nula. Por tanto, existe � ∈ {x ∈ I|w(x) ≠ 0} talque

∫I f (x)w(x)dx∫I w(x)dx

= f (�), ∀� ∈ I.

Si las desigualdades son estrictas, tenemos por definición de ínfimo y desupremo que

∫I f (x)w(x)dx∫I w(x)dx

se encuentra entre dos valores de la función. Aplicando el Teorema de Bolzano,se deduce que toda función continua toma cualquier valor intermedio entre dos

216

Page 217: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

valores dados. Por tanto, existirá � ∈ I tal que

∫I f (x)w(x)dx∫I w(x)dx

= f (�).

Para el recíproco, supongamos que w toma un valor no nulo en x0 ∈ Int(I).Sea s ∈ {−1, 1} tal que sw(x0) > 0. Como w es continua, existirá � > 0 tal que(x0 − �, x0 + �) ⊂ Int(I) y

sw(x) >sw(x0)

2> 0, x ∈ (x0 − �, x0 + �).

Considerando la función continua f0(x) = max(� − |x − x0|, 0), tenemos

sf0(�)∫Iw(x)dx = ∫I

sf0(x)w(x)dx >sw(x0)

2 ∫If0(x) =

sw(x0)2

�2 > 0,

y como f0 es no negativa, se deduce que

s∫Iw(x)dx > 0,

es decir ∫I w(x)dx es no nula y s = sign(w(x0)) coincide con el signo de∫ ba w(x)dx. Como x0 era un punto arbitrario del intervalo, vemos que todos

los valores de w tienen el mismo signo no estricto s.

El teorema anterior puede aplicarse de la siguiente forma para deducir fór-mulas exactas del error de una regla de cuadratura de tipo interpolatorio congrado de precisión k ≥ n. Sea x0,… , xk una sucesión extendida de nodos quecontiene a los nodos de la fórmula x0,… , xn y J un intervalo que contiene a Iy a todos los nodos x0,… , xk. Definamos

!k+1(x) ∶=k∏

i=0(x − xi)

y!+k+1(x) ∶= max(!k+1(x), 0), !−

k+1(x) ∶= max(−!k+1(x), 0).

Por tanto, tenemos

!k+1(x) = !+k+1(x) − !−

k+1(x), |!k+1| = !+k+1(x) + !−

k+1(x)

217

Page 218: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Por el Teorema ??,

R[f ] = ∫I[x0,… , xk, x]f!k+1(x)w(x)dx

= ∫I[x0,… , xk, x]f!+

k+1(x)w(x)dx − ∫I[x0,… , xk, x]f!−

k+1(x)w(x)dx.

Si f ∈ Ck+1(J ), entonces [x0,… , xk, x]f es una función continua de x. Apli-cando el primer teorema del valor medio del cálculo integral en cada término,obtenemos

R[f ] = [x0,… , xk, c1]f ∫I!+k+1(x)w(x)dx

− [x0,… , xk, c2]f ∫I!−k+1(x)w(x)dx

y en virtud del Teorema del valor medio de Lagrange generalizado, para todaf ∈ Ck+1(J ), existen �1, �2 ∈ J tales que

R[f ] =f (k+1)(�1)(k + 1)! ∫I

!+k+1(x)w(x)dx −

f (k+1)(�2)(k + 1)! ∫I

!−k+1(x)w(x)dx.

Cambio de intervaloLas fórmulas de cuadratura en un intervalo pueden aplicarse a otros inter-

valos. Supongamos que tenemos una fórmula de cuadratura de la forma

∫If (x)w(x)dx =

n∑

i=0wif (xi) + RI[f ],

y � ∶ ℝ → ℝ es una aplicación afín biyectiva cualquiera, cuya derivada cons-tante y no nula denotamos por �′.

Mediante el cambio de variables

t = �(x), x = �−1(t),

podemos transformar toda función f ∈ C(I) en una función g ∈ C(J ), conJ ∶= �(I) que toma los mismo valores en puntos correspondientes, definiendo

g(t) ∶= f (�−1(t)), t ∈ J .

Se deduce la relación inversa

f (x) = g(�(x)), x ∈ I.

218

Page 219: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Los nodos se transforman a través del cambio de variables en

ti = �(xi), i = 0,… , n,

y el cambio de variables en las integrales da lugar a

∫If (x)w(x)dx = 1

|�′|∫J

g(t)w(�−1(t))dt.

Por tanto,

∫Jg(t)w(�−1(t))dt = |�′

|∫If (x)w(x)dx = |�′

|

n∑

i=0wif (xi) + |�′

|RI[f ]

Llamando

w(t) ∶= w(�−1(t)), t ∈ J , wi ∶= |�′|wi, i = 0,… , n,

obtenemos la fórmula transformada

∫Jg(t)w(t)dt =

n∑

i=0wig(ti) + RJ [g], RJ [g] ∶= |�′

|RI[g◦�].

En el cambio de intervalo, los nodos se transforman a través de la aplicaciónafín � y los pesos coinciden salvo escalado positivo.

La relación establecida entre los residuos permite deducir que la regla decuadratura transformada tiene el mismo grado de precisión que la fórmula ini-cial. En efecto, si la fórmula original es exacta en Pk, tenemos

RJ [p] = |�′|RI[p◦�] = 0, ∀p ∈ Pk,

ya que p◦� es un polinomio del mismo grado que p. Recíprocamente si la fór-mula transformada es exacta en Pk, entonces

RI[p] =1|�′

|

RJ [p◦�−1] = 0, ∀p ∈ Pk,

porque p◦�−1 es también un polinomio del mismo grado. Por tanto el grado deprecisión se conserva al aplicar una transformación afín.

En el caso en que el intervalo de partida sea I = [a, b] y el intervalo dellegada J = [c, d], podemos tomar la aplicación afín creciente

�(x) = c + d − cb − a

(x − a), x ∈ [a, b]

219

Page 220: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

con �′ = (d − c)∕(b − a) y cuya inversa es

�−1(t) = a + b − ad − c

(t − c), t ∈ [c, d].

El cambio de variablest = �(x)

asocia a cada punto x del intervalo [a, b] un punto t del intervalo [c, d] tal quela razón simple de t en [c, d] coincide con la de x en [a, b]

�(t; c, d) = t − cd − c

= x − ab − a

= �(x; a, b).

Llamandoti = �(xi) = c + d − c

b − a(xi − a), i = 0,… , n,

a los puntos cuyas distancias relativas a los extremos del intervalo [c, d] corres-ponden a las mismas que las de los puntos xi respecto al intervalo [a, b]

�(ti; c, d) = �(xi; a, b),

tenemos tenemos que el cambio de variable transforma la regla de cuadratura

b

af (x)w(x)dx =

n∑

i=0wif (xi) + R[a,b][f ].

en la regla de cuadratura

d

cg(t)w(t)dt =

n∑

i=0wig(ti) + R[c,d][g].

con

w(t) = w(

a + b − ad − c

(t − c))

, t ∈ [c, d], wi =d − cb − a

wi, i = 0,… , n,

yR[c,d][g] ∶=

d − cb − a

R[a,b][g◦�].

El cambio de intervalo permite transformar las fórmulas en un intervalocualquiera a fórmulas en un intervalo estándar y recíprocamente. Normalmentese elige como intervalo estándar el intervalo [0, 1]. En ciertos contextos, el inter-valo estándar es [−1, 1]. Por ejemplo, en la teoría de los polinomios ortogonaleses conveniente resaltar la simetría respecto al origen, por lo que la elección deun intervalo cuyo centro es el origen presenta ciertas ventajas.

220

Page 221: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

El teorema del Núcleo de PeanoLas consideraciones anteriores sobre la exactitud de fórmulas de cuadratura

pueden extenderse sin dificultad al problema de aproximar un funcional linealarbitrario � por funcionales �i, i = 0,… , n, correspondientes a un problema deHermite cuya sucesión extendida de nodos es x0,… , xn. La fórmula

� ≈n∑

i=0ai�i,

es exacta en Pk si se verifica la igualdad

�(p) =n∑

i=0ai�i(p), p ∈ Pk,

y es de tipo interpolatorio sin∑

i=0ai�i(f ) = �P (f ; x0,… , xn).

Observamos que si la fórmula es de tipo interpolatorio los coeficientes ai quedandeterminados por los nodos

ai = �(li).Toda fórmula de tipo interpolatorio es exacta en Pn, ya que

p = P (p; x0,… , xn), p ∈ Pn

lo que implica la exactitud en Pn de la fórmula de tipo interpolatorion∑

i=0ai�i(p) = �P (p; x0,… , xn) = �p.

Recíprocamente una fórmula exacta en Pn coincide necesariamente con la únicafórmula de tipo interpolatorio ya que �if = �iP (f ; x0,… , xn), para todo i =0,… , n, luego

n∑

i=0ai�i(f ) =

n∑

i=0ai�iP (f ; x0,… , xn) = �P (f ; x0,… , xn).

El errorR[f ] = �f−∑n

i=0 �if de una fórmula de grado de precisión k puedeexpresarse en términos de la derivada (k+1)-ésima como muestra un importante

221

Page 222: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

resultado sobre representación de funcionales lineales, conocido como Teoremadel núcleo de Peano.

Comenzaremos con un caso particular importante, el error del polinomio deTaylor de grado k admite una representación como una integral de la derivada(k + 1)-ésima.

Teorema 7.5 (Fórmula de Taylor con resto integral). Sea f ∈ Ck+1(I), c ∈ I ,entonces

f (t) =k∑

j=0

(t − c)j

j!f (j)(c) + 1

k! ∫

t

c(t − x)kf (k+1)(x)dx.

Demostración. Para cada t ∈ I , consideremos la dependencia del resto de lafórmula de Taylor respecto a c

g(c) ∶= f (t) −k∑

j=0

(t − c)j

j!f (j)(c).

Entonces tenemos que g(t) = 0 y

g′(c) =k∑

j=1

(t − c)j−1

(j − 1)!f (j)(c) −

k∑

j=0

(t − c)j

j!f (j+1)(c) = −

(t − c)k

k!f (k+1)(c).

Integrando la relación anterior obtenemos

g(c) = ∫

c

tg′(x)dx = −1

k! ∫

c

t(t− x)kf (k+1)(x)dx = 1

k! ∫

t

c(t− x)kf (k+1)(x)dx.

Se dice que una sucesión de funciones fn ∈ Ck[a, b] converge uniforme-mente en Ck[a, b] a una función f ∈ Ck[a, b] si fn converge uniformemente ytodas las derivadas f (j)

n convergen uniformemente a f (j), j ≤ k, es decir,

lımn→∞

‖f (j)n − f (j)

‖∞ = 0, j = 0,… , k.

Un funcional lineal R ∶ Ck[a, b] → ℝ se dice continuo si

lımn→∞

R[fn] = R[f ],

para cualquier sucesión de funciones fn ∈ Ck[a, b] que converge uniformemen-te en Ck[a, b] a f ∈ Ck[a, b].

222

Page 223: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Utilizando el resto integral de Taylor podemos deducir la representación dePeano de los funcionales lineales continuos enCk[a, b] y nulos sobre polinomiosde grado k.Teorema 7.6 (Teorema del núcleo de Peano). Todo funcional lineal continuoR ∶ Ck[a, b] → ℝ y nulo sobre Pk admite una representación integral de laforma

R[f ] = ∫

b

aK(x)f (k+1)(x)dx, f ∈ Ck+1[a, b],

donde K(x) es una función de variación acotada y continua por la derecha talque K(a) = K(b) = 0, llamada núcleo de Peano del funcional R, dada por

K(x) = 1k!R[

(⋅ − x)k+]

.

El Teorema del núcleo de Peano admite una demostración elemental en elcaso de funcionales que son combinaciones lineales de evaluaciones en puntosdel intervalo, evaluaciones de derivadas de orden menor o igual que k e integra-les ponderadas de la función o de sus derivadas. Precisamente, la mayoría de losfuncionales que describen el error en problemas de interpolación, derivación ointegración numérica son funcionales de este tipo. Esbozamos a continuaciónlas líneas fundamentales de esta demostración elemental.

Sea R un funcional lineal nulo sobre polinomios de grado k. Si t ∈ [a, b], lafórmula de Taylor con resto integral centrada en a puede expresarse en la forma

f (t) =k∑

j=0

(t − a)j

j!f (j)(a) + 1

k! ∫

b

a(t − x)k+f

(k+1)(x)dx, t ∈ [a, b].

Sea

E(t) ∶= f (t) −k∑

j=0

(t − a)j

j!f (j)(a) = 1

k! ∫

b

a(t − x)k+f

(k+1)(x)dx, t ∈ [a, b],

la función error del problema de interpolación de Taylor. Aplicando R a la fór-mula anterior tenemos

R[f ] = R[E] = R∫

b

a

(⋅ − x)k+k!

f (k+1)(x)dx.

Por tanto, si R es una combinación lineal de funcionales � que pueden inter-cambiarse con la integral

�∫

b

a

(⋅ − x)k+k!

f (k+1)(x)dx = ∫

b

a�[(⋅ − x)k+

k!

]

f (k+1)(x)dx,

223

Page 224: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

podemos afirmar que

R[f ] = ∫

b

aK(x)f (k+1)(x)dx, K(x) ∶= 1

k!R[

(⋅ − x)k+]

.

Para concluir la demostración basta con comprobar que para los funcionalesevaluación, evaluación de derivadas, integrales ponderadas de la función o susderivadas, podemos intercambiar el funcional con la integral, es decir

�[E] = ∫

b

a�[(⋅ − x)k+

k!

]

f (k+1)(x)dx

Comencemos con el caso en que es un funcional de la forma

�[f ] = f (t),

con t ∈ [a, b]. Entonces tenemos

�[E] = E(t) = ∫

b

a

(t − x)k+k!

f (k+1)(x)dx = ∫

b

a�[(⋅ − x)k+

k!

]

f (k+1)(x)dx.

Si�[f ] = f ′(t),

con t ∈ [a, b], tenemos

�[E] = E′(t) = ddt ∫

b

t

(t − x)k

k!f (k+1)(x)dx.

La función (t − x)k∕k!, x ∈ [a, b], es una función continua y acotada. Su de-rivada respecto al parámetro t es (t − x)k−1∕(k − 1)! y también está acotada.Por tanto el integrando (t− x)kf (k+1)(x)∕k! y la derivada respecto al parámetro(t − x)k−1f (k+1)(x)∕(k − 1)! pueden dominarse por funciones constantes, queson integrables. De acuerdo con el teorema de derivación de integrales paramé-tricas, se deduce que

ddt ∫

b

t

(t − x)k

k!f (k+1)(x)dx = ∫

b

t

ddt

(t − x)k

k!f (k+1)(x)dx

= ∫

b

t

(t − x)k−1

(k − 1)!f (k+1)(x)dx = ∫

b

a�[(⋅ − x)k+

k!

]

f (k+1)(x)dx.

224

Page 225: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Aplicando sucesivamente el teorema de derivación de integrales respecto a pa-rámetros vemos que puede intercambiarse R y el signo integral cuando � es unfuncional de la forma

�[f ] = f (j)(t),

con j ≤ k y t ∈ [a, b].El teorema de Fubini permite intercambiar R con el signo integral si R es

un funcional de la forma

�[f ] = ∫

b

aw(t)f (t)dt.

Finalmente, usando conjuntamente los teoremas de derivación de integrales pa-ramétricas y el Teorema de Fubini podemos intercambiarR con el signo integralsi

�[f ] = ∫

b

aw(t)f (j)(t)dt,

siendo w una función integrable y j ≤ k.Por tanto, queda demostrado que el Teorema del núcleo de Peano es válido

para funcionales que son combinaciones lineales de evaluaciones en puntos delintervalo, evaluaciones de derivadas de orden menor o igual que k e integralesponderadas de la función o de sus derivadas de orden menor o igual que k.

El caso general del Teorema del núcleo de Peano se deduce del siguienteresultado que proporciona una representación de cualquier funcional continuoen Ck[a, b].

Teorema 7.7. Sea L ∶ Ck[a, b] → ℝ un funcional lineal y continuo, entoncesexisten constantes c0,… , ck y una función K(x) de variación acotada, continuapor la derecha con K(a) = K(b) = 0, tal que

L[f ] =k∑

j=0cjf

(j)(a) + ∫

b

aK(x)f (k+1)(x)dx, ∀f ∈ C (k+1)[a, b],

donde

cj =1j!L[

(⋅ − a)j]

, j = 0,… , k, K(x) = 1k!L[

(⋅ − x)k+]

.

Demostración. Veamos primero el caso k = 0. Por el Teorema de representa-ción de Riesz, para cada funcional lineal y continuo L ∶ C[a, b] → ℝ, existe

225

Page 226: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

una función de variación acotada �(x), continua por la derecha tal que �(a) = 0de modo que

L[f ] = ∫

b

af (x)d�(x), f ∈ C[a, b].

Sea K(x) ∶= �(b)−�(x) = ∫ bx d�(x). Entonces K(a) = �(b)−�(a) = L[1] = 0

y K(b) = 0 y podemos representar el funcional

L[f ] = −∫

b

af (x)dK(x), f ∈ C[a, b]

en términos de K . Si f ∈ C1[a, b], podemos integrar por partes, obteniendo larepresentación

L[f ] = L[1]f (a) + ∫

b

aK(x)f ′(x)dx.

Observemos que

L[(⋅ − x)0+] = ∫

b

xd�(t) = K(x),

y el caso k = 0 queda demostrado.Supongamos ahora que k > 0. Aplicando el funcional L a la representación

de Taylor con resto integral centrada en a

f (t) =k−1∑

j=0

(t − a)j

j!f (j)(a) + 1

(k − 1)! ∫

b

a(t − x)k−1+ f (k)(x)dx, t ∈ [a, b],

obtenemos

L[f ] =k−1∑

j=0

1j!L[(⋅ − a)j]f (j)(a) + 1

(k − 1)!L[

b

a(⋅ − x)k−1+ f (k)(x)dx

]

.

El operador

T ∶ g ∈ C[a, b] → 1(k − 1)! ∫

b

a(t − x)k−1+ g(x)dx ∈ Ck[a, b],

transforma una función continua g en otra función ℎ = T [g] tal que ℎ(k) = g,ℎ(a) = ℎ′(a) = ⋯ = ℎ(k−1)(a) = 0. Utilizando el Teorema de la ConvergenciaDominada, puede deducirse que el operador T ∶ C[a, b] → Ck[a, b] transforma

226

Page 227: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

sucesiones de funciones uniformemente convergentes en sucesiones de funcio-nes convergentes en Ck[a, b]. Por tanto, el operador T ∶ C[a, b] → Ck[a, b] escontinuo y

g → L[T [g]]es un funcional continuo en C[a, b]. Aplicando la representación, obtenida enel caso k = 0, deducimos que

L[T [g]] = −∫

b

ag(x)dK(x) = ckg(a) + ∫

b

aK(x)g′(x), ∀g ∈ C1[a, b],

para cierta función K de variación acotada y continua por la derecha tal queK(a) = K(b) = 0. Observemos que

ck = L[T [1]] =L[(⋅ − a)k]

k!Llamando

cj =L[(⋅ − a)j]

j!, = 0, 1… , k − 1,

tenemos

L[f ] =k−1∑

j=0cjf

(j)(a) + L[T [f (k)]] =k∑

j=0cjf

(j)(a) + ∫

b

aK(x)f (k+1)(x)dx

para toda f ∈ Ck+1[a, b] y

1k!L[(⋅ − x)k+] = L[T [(⋅ − x)0+]] = −∫

b

a(t − x)0+dK(t)dt

= −∫

b

xdK(t)dt = K(x),

lo que demuestra el resultado.

Nota. El enunciado del Teorema del núcleo de Peano puede parecer contradic-torio, ya que (⋅ − x)k+ no es una función de clase Ck[a, b] y no podría aplicarsea esta función el funcional L. En realidad, todos los funcionales lineales y con-tinuos sobre Ck[a, b] admiten una extensión natural al conjunto de funciones fcuya derivada k-ésima es medible y está esencialmente acotada y, por tanto, f (k)

es integrable respecto a la medida de Borel real dK(x). En particular, aunquela derivada k-ésima de la potencia truncada (⋅ − x)k+ no es continua,

1k!

dk

dtk(t − x)k+ = (t − x)0+,

227

Page 228: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

es la función característica del intervalo (x, b] y por tanto es medible y estáesencialmente acotada. La expresión R[(⋅− x)k+∕k!] debe interpretarse como lamedida del subintervalo (x, b] respecto a la medida dK(x). Si la definición delfuncional R no proporciona una clara idea de esta extensión, siempre podemosdefinir para cada x ∈ [a, b] el valor deR[(⋅−x)k+∕k!] como lımn→∞R[fn], dondefn es una sucesión de funciones enCk[a, b] que converge a la función (⋅−x)k+∕k!,tales que las funciones f (k)

n (t) están uniformemente acotadas y convergen a lafunción escalón unitario (⋅ − x)0+.

Núcleo de Peano de reglas de cuadratura numéricaEl Teorema del Núcleo de Peano se utiliza para expresar el error R[f ] de

fórmulas de cuadratura numérica

b

af (x)w(x)dx =

n∑

i=0wif (xi) + R[f ]

con grado de precisión k. Sea [c, d] el menor intervalo que contiene a [a, b]y a los nodos x0,… , xn y k el grado de precisión de la fórmula. Entonces elerror define un funcional en Ck[c, d], nulo sobre Pk, que puede expresarse co-mo combinación lineal de la integral cuyo peso es w(x)�[a,b], y de funcionalesevaluación en los nodos. Aplicando el Teorema del núcleo de Peano, tenemosla siguiente representación integral del error

R[f ] = ∫

d

cK(x)f (k+1)(x)dx,

con

K(x) = 1k!

(

b

a(t − x)k+w(t)dt −

n∑

i=0wi(xi − x)k+

)

, x ∈ [c, d].

De la representación integral del error, deducimos la siguiente cota

|R[f ]| ≤ Mk+1 ∫

b

a|K(x)|dx, Mk+1 = max

x∈[c,d]|f (k+1)(x)|.

Veamos que si el núcleo de Peano no cambia de signo, podemos deducir unafórmula del error más simple.

228

Page 229: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Proposición 7.8. Sea la regla de cuadratura numérica

b

af (x)w(x)dx =

n∑

i=0wif (xi) + R[f ]

con w continua e integrable en (a, b) y grado de precisión k. Sea [c, d] el menorintervalo que contiene a [a, b] y a todos los nodos. El núcleo de Peano del error

K(x) = 1k!

(

b

a(t − x)k+w(t)dt −

n∑

i=0wi(xi − x)k+

)

, x ∈ [c, d],

no cambia de signo en el intervalo [c, d] si y solo si para cada f ∈ Ck+1[c, d],existe � ∈ [c, d], tal que el error satisface

R[f ] =Kk+1

(k + 1)!f (k+1)(�),

donde

Kk+1 ∶= ∫

b

axk+1w(x)dx −

n∑

i=0wix

k+1i

es el error de la fórmula para la función xk+1.

Demostración. Aplicando el primer teorema de la media a la representación dePeano

R[f ] = ∫

d

cK(x)f (k+1)(x)dx,

vemos que es equivalente afirmar que el núcleo de Peano no cambia de signo aafirmar que para cada función f ∈ Ck+1[c, d], existe � ∈ [c, d], tal que

R[f ] = f (k+1)(�)∫

b

aK(x)dx.

Para obtener el valor de ∫ ba K(x)dx, no es necesario integrar la complicada ex-

presión del núcleo de Peano. Aplicando la fórmula anterior a la función xk+1 seobtiene,

(k + 1)!∫

b

aK(x)dx = R[xk+1] = ∫

b

axk+1w(x)dx −

n∑

i=0wix

k+1i = Kk+1,

229

Page 230: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

de donde se deduce que

R[f ] =Kk+1

(k + 1)!f (k+1)(�).

En el caso particular de que el grado de precisión sea exactamente n, pode-mos aplicar la fórmula del error anterior a la función f (x) = !n+1(x),

(n + 1)!∫

b

aK(x)dx = R[!n+1] = ∫

b

a!n+1(x)w(x)dx,

obteniéndose la siguiente fórmula para la constante

Kn+1 = ∫

b

a!n+1(x)w(x)dx.

Si el grado de precisión es k > n, podemos deducir la siguiente fórmula para laconstante

Kk+1 = ∫

b

a!n+1(x)p(x)w(x)dx,

donde p es un polinomio mónico arbitrario de grado exactamente k − n,.Consideremos el importante caso particular w(x) = 1, x ∈ [a, b]. Teniendo

en cuenta que

b

a(t − x)k+dt =

(b − x)k+1+ − (a − x)k+1+

k + 1el núcleo de Peano del error de una fórmula de cuadratura con w(x) = 1 es

K(x) =(b − x)k+1+ − (a − x)k+1+

(k + 1)!− 1k!

n∑

i=0wi(xi − x)k+, x ∈ [c, d].

Por tanto, el núcleo de Peano de una regla de cuadratura con peso unitario esuna función polinómica a trozos de grado menor o igual que k + 1 y de claseCk−1[c, d].

Si además todos los nodos se encuentran en el intervalo [a, b], podemostomar [c, d] = [a, b] y la expresión del núcleo de Peano se simplifica

K(x) =(b − x)k+1

(k + 1)!− 1k!

n∑

i=0wi(xi − x)k+, x ∈ [a, b].

230

Page 231: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

a b x0

Figura 7.1. Fórmula del rectángulo.

La regla del rectánguloEstudiaremos ahora las reglas de cuadratura más simples con función peso

w(x) = 1, con el objeto de encontrar aproximaciones numéricas de integrales yestimar su error.

Si se utiliza un único nodo x0 ∈ [a, b], tenemos la llamada regla del rectán-gulo

b

af (x)dx = (b − a)f (x0) + R[f ].

El nombre de la fórmula proviene del hecho de que se aproxima el área deltrapecio mixtilíneo que corresponde a la integral por la de un rectángulo cuyabase el intervalo y su altura es el valor de la función en x0. La figura 7.1 ilustrala fórmula del rectángulo.

El error de la fórmula del rectángulo será

R[f ] = ∫

b

a[x, x0]f (x − x0)dx.

Podemos deducir una expresión del error, separando la integral en dos

R[f ] = ∫

x0

a[x, x0]f (x − x0)dx + ∫

b

x0[x0, x]f (x − x0)dx.

Aplicando a cada término el primer teorema del valor medio del Cálculo integral

231

Page 232: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

y el Teorema del valor medio de Lagrange generalizado, deducimos que

x0

a[x, x0]f (x − x0)dx = [c1, x0]f ∫

x0

a(x − x0)dx = −

f ′(�1)(x0 − a)2

2,

b

x0[x0, x]f (x − x0)dx = [x0, c2]f ∫

b

x0(x − x0)dx =

f ′(�2)(b − x0)2

2,

donde �1 es un punto del intervalo [a, x0] y �2 un punto del intervalo [x0, b]. Porlo tanto, tenemos

R[f ] =f ′(�2)(b − x0)2 − f ′(�1)(x0 − a)2

2.

La discusión del error se simplifica notablemente con la elección de x0 = a ox0 = b, obteniéndose las fórmulas de grado de precisión 0

b

af (x)dx = (b − a)f (a) +

f ′(�)(b − a)2

2, � ∈ [a, b],

b

af (x)dx = (b − a)f (b) −

f ′(�)(b − a)2

2, � ∈ [a, b].

En el caso de elegir x0 = (a + b)∕2, la fórmula es exacta en P1.

b

adx = b − a, ∫

b

a

(

x − a + b2

)

dx = 0.

El grado de precisión es 1 ya que la fórmula no es exacta en P2

b

a

(

x − a + b2

)2dx =

(b − a)3

12≠ 0.

Para deducir una fórmula del error en términos de la derivada segunda, integra-mos la fórmula de Taylor centrada en (a + b)∕2

f (x) = f(a + b

2

)

+f ′(a + b

2

)(

x− a + b2

)

+[a + b

2, a + b

2, x]

f(

x− a + b2

)2

obteniendo

b

af (x)dx = (b − a)f

(a + b2

)

+ ∫

b

a

[a + b2

, a + b2

, x]

f(

x − a + b2

)2dx.

232

Page 233: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

a b (a+b)/2

Figura 7.2. Fórmula del punto medio.

Aplicando el primer teorema del valor medio del Cálculo integral y el Teoremadel valor medio de Lagrange generalizado al último término, deducimos que

R[f ] = ∫

b

a

[a + b2

, a + b2

, x]

f(

x − a + b2

)2dx

=[a + b

2, a + b

2, c]

f ∫

b

a

(

x − a + b2

)2dx

=f ′′(�)2 ∫

b

a

(

x − a + b2

)2dx =

f ′′(�)24

(b − a)3,

donde � es un punto del intervalo [a, b] y la regla del punto medio adopta laexpresión

b

af (x)dx = (b − a)f

(a + b2

)

+f ′′(�)24

(b − a)3. (Regla del punto medio)

La regla del trapecioUna de las reglas de cuadratura de tipo interpolatorio con dos nodos más

usadas es la fórmula del trapecio, que corresponde a la elección x0 = a, x1 = b.Partiendo de la fórmula del interpolante de grado 1 en los extremos

f (x) = f (a)b − xb − a

+ f (b)x − ab − a

+ f [a, b, x](x − a)(x − b),

e integrando término a término obtenemos

b

af (x)dx = (b − a)

f (a) + f (b)2

− ∫

b

af [a, b, x](x − a)(b − x)dx

233

Page 234: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

a b

Figura 7.3. Fórmula del trapecio.

Utilizando el Teorema del valor medio del cálculo integral y el Teorema delvalor medio de Lagrange generalizado, obtenemos

R[f ] = −∫

b

af [a, b, x](x − a)(b − x)dx = −

f ′′(�)2 ∫

b

a(x − a)(b − x)dx,

con � ∈ [a, b]. Haciendo el cambio x = a + (b − a)t en la integral, obtenemos

b

a(x − a)(b − x)dx = (b − a)3 ∫

1

0t(1 − t)dt =

(b − a)3

6,

luego

R[f ] = −(b − a)3f ′′(�)

12,

de donde deducimos

b

af (x)dx = (b − a)

f (a) + f (b)2

−f ′′(�)12

(b − a)3. (Regla del Trapecio)

El nombre de la fórmula se debe a que sustituimos el área bajo la gráfica por ladel trapecio formado por los puntos situados entre el eje de las XX′ y la líneaque pasa por (a, f (a)) y (b, f (b)).

La regla de SimpsonLa regla de Simpson es regla de cuadratura de tipo interpolatorio con nodos

en a, (a + b)∕2 y b

b

af (x)dx ≈ w0f (a) +w1f

(a + b2

)

+w2f (b).

234

Page 235: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Seanwi =

wi

b − a, i = 0, 1, 2,

los pesos de la fórmula correspondiente al intervalo estándar [0, 1]

1

0f (t)dt ≈ w0f (0) + w1f (1∕2) + w2f (1).

Las condiciones de exactitud en P2 son

w0 + w1 + w2 = 1,w1

2+ w2 =

12,

w1

4+ w2 =

13,

y resolviendo el sistema de ecuaciones anterior obtenemos w0 = w2 = 1∕6,w1 = 2∕3. Para determinar el grado de precisión, comprobamos las condicionesde exactitud de grados 3 y 4, obteniendo

w1

8+ w2 =

14,

w1

16+ w2 =

524

≠ 15.

Por tanto, el grado de precisión de la fórmula de Simpson es 3. Para obteneruna fórmula del error aplicamos el Teorema ?? con el nodo adicional (a+ b)∕2,obteniendo

R[f ] = −∫

b

a

[

a, a + b2

, a + b2

, b, x]

f (x − a)(b − x)(

x − a + b2

)2dx.

Como la función (x − a)(b − x)(x − (a + b)∕2)2 no cambia de signo, podemosaplicar el primer teorema del valor medio del cálculo integral y el teorema delvalor medio de Lagrange generalizado y deducir

R[f ] = −f (4)(�)4! ∫

b

a(x − a)(b − x)

(

x − a + b2

)2dx,

con � ∈ [a, b]. Para simplificar el cálculo de la integral anterior, hacemos elcambio x = ((a + b) + t(b − a))∕2

b

a(x− a)(b− x)

(

x− a + b2

)2dx =

(b − a2

)5

1

−1t2(1 − t2)dt =

(b − a2

)5 415

,

y por tanto

R[f ] = −f (4)(�)90

(b − a2

)5= −

f (4)(�)2880

(b − a)5,

235

Page 236: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

a b (a+b)/2

Figura 7.4. Fórmula de Simpson.

A B

C

M C’

A B11

Figura 7.5. Cuadratura de la parábola.

La fórmula de Simpson con su término de error es

b

af (x)dx = b − a

6

(

f (a) + 4f(a + b

2

)

+ f (b))

−f (4)(�)2880

(b − a)5.

(Regla de Simpson)

La figura 7.4 muestra una interpretación geométrica de la fórmula de Simpson,la estimación de la integral es el área de la parábola que pasa por los puntos(a, f (a)), ((a + b)∕2, f ((a + b)∕2) y (b, f (b)).

Podemos dar una interpretación de la fórmula de Simpson en términos delresultado obtenido por Arquímedes en su libro Sobre la cuadratura de la pará-bola. En dicho trabajo Arquímedes demuestra que el área de un segmento deparábola es 4/3 del área del triángulo inscrito ABC , donde C es el punto deintersección de la parábola con la recta paralela al eje que pasa por el puntomedio M de la base AB.

En el punto C , la recta tangente A1B1 es paralela al segmento base AB delongitud l. Por tanto si C ′ es la proyección ortogonal de C sobre AB, podemosconsiderar que la longitud CC ′ es la altura ℎ del segmento de parábola. Ob-servemos que el área del rectángulo A1ABB1 que circunscribe al segmento deparábola es lℎ, el doble del área del triánguloABC . Luego el área del segmento

236

Page 237: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

de parábola esS = 2

3lℎ.

Veamos que el resultado de Arquímedes equivale a afirmar que la regla de Sim-pson es una regla de cuadratura exacta para polinomios cuadráticos.

Como la propiedad descrita por Arquímedes es invariante por movimientosno hay pérdida de generalidad en suponer que el eje de la parábola es paralelo aleje coordenado Y Y ′. Si el eje de la parábola no coincide con Y Y ′, mediante unmovimiento de rotación apropiado alinearemos el segmentoMC en la direccióndel eje de Y Y ′. En ese caso la parábola será la gráfica de una función cuadráticaq y tendremos que

A = (a, q(a)), B = (b, q(b)),

C =(a + b

2, q(a + b

2

))

, M =(a + b

2,q(a) + q(b)

2

)

,

como se indica en la Figura 7.6. El área del triángulo ABC es la mitad delproducto de la longitud del segmento MC , por la longitud de la proyecciónA′B′ del segmento AB sobre el eje de las XX′. Por tanto

S = 23(b − a)MC.

dondeMC = q

(a + b2

)

−q(a) + q(b)

2,

es la longitud orientada del segmento MC , de modo que el área es positiva o ne-gativa dependiendo de la orientación del triángulo ABC o del correspondientesegmento parabólico.

Observemos que la integral ∫ ba q(x)dx es el área orientada del trapecio mix-

tilíneo limitado por los segmentos AA′, A′B′, BB′ y el segmento de parábolaBCA. Teniendo en cuenta que esta área es la suma de las áreas del trapecioAA′B′B y del segmento de parábola tenemos

b

aq(x)dx = (b − a)

q(a) + q(b)2

+ 23(b − a)

(

q(a + b

2

)

−q(a) + q(b)

2

)

,

y simplificando el segundo miembro se obtiene la regla de Simpson.Recíprocamente, partiendo de la Regla de Simpson, se deduce que, el área

del segmento de parábola es

S = b − a6

(

q(a) + 4q(a + b

2

)

+ q(b))

− (b − a)q(a) + q(b)

2,

237

Page 238: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

M’=((a+b)/2,0)

A

C

B

M

y=q(x)

A’=(a,0) B’=(b,0)

Figura 7.6. Fórmula de Simpson y área de un segmento de parábola.

luego3S

2(b − a)= q

(a + b2

)

−q(a) + q(b)

2= MC,

donde C es la intersección de la parábola con la recta x = (a+ b)∕2, paralela aleje Y Y ′ que pasa por M , el punto medio del segmento base AB.

Veamos que el punto C es el único punto del segmento de parábola en elque la tangente es paralela al segmento base AB. Para ello, tengamos en cuentaque un punto arbitrario de la parábola es de la forma (x, q(x)). Utilizando larepresentación de Newton

q(x) = q(a) + [a, b]q(x − a) + [a, b, (a + b)∕2]q(x − a)(x − b)

y derivando obtenemos

q′(x) = [a, b]q + [a, b, (a + b)∕2]q (2x − a − b).

Para imponer que la tangente sea paralela a AB, igualamos las pendientes

q′(x) = [a, b]q,

obteniendo la condición 2x = a + b. Por tanto x = (a + b)∕2 y el único puntodel segmento de parábola en el que la tangente es paralela a la base es C , laintersección de la parábola con la recta paralela al eje de que pasa por el puntomedio M del segmento base AB.

Así queda establecido el resultado de Arquímedes en el caso particular deque el eje de la parábola sea paralelo a Y Y ′. Como el enunciado tiene una for-mulación invariante por movimientos, una rotación apropiada permite concluirque se verifica el resultado en general.

238

Page 239: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Fórmulas de Newton-CotesReciben el nombre de fórmulas de Newton-Cotes aquellas reglas de cuadra-

tura basadas en nodos equidistantes obtenidos al realizar una partición uniformedel intervalo [a, b]. Se distinguen dos clases de fórmulas: las fórmulas cerradasbasadas en los nodos (incluyendo los extremos)

xi = a + iℎ, i = 0,… , n, ℎ ∶= b − an

,

y las fórmulas abiertas, basadas en los nodos (sin incluir los extremos)

xi = a + (i + 1)ℎ, i = 0,… , n, ℎ ∶= b − an + 2

.

Los valores de la función en los nodos Newton-Cotes suelen expresarse en no-tación abreviada

fi = f (xi), i = 0,… , n.

El error de una fórmula de integración numérica en puntos equidistantes seexpresa en la forma

R[f ] = ∫

b

a[x0, x0 + ℎ… , x0 + nℎ, x]f

n∏

i=0(x − x0 − iℎ)dx.

Introduciendo el cambio de variables x = x0 + tℎ, ta = ℎ−1(a − x0), tb =ℎ−1(b − x0) y el polinomio �(t) ∶= t(t − 1)⋯ (t − n), obtenemos

R[f ] = ℎn+2∫

tb

ta[x0, x0 + ℎ… , x0 + nℎ, x0 + tℎ]f �(t)dt,

Consideremos la parte positiva y la parte negativa de �(t)

�+(t) = max(�(t), 0), �−(x) = max(−�(t), 0),

de modo que �(t) = �+(t) − �−(t), esto nos permite dividir el error en dostérminos a los que podemos aplicar los teoremas del valor medio, obteniendo

E(x) = K1f (n+1)(�1)ℎn+2

(n + 1)!−K2

f (n+1)(�2)ℎn+2

(n + 1)!.

conK1 ∶= ∫

tb

ta�+(t)dt, K2 ∶= ∫

tb

ta�−(t)dt.

239

Page 240: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

En el caso de las fórmulas de Newton-Cotes se pueden deducir fórmulas delerror de la forma

R[f ] =Kf (k+1)(�)ℎk+2

(k + 1)!,

con k = n y K = ∫ tbta�(t)dt, si n es impar o k = n+ 1 y K = ∫ tb

tat�(t)dt, si n es

par.Demostremos esta propiedad en el caso de la fórmula de Newton-Cotes

abierta con 2 puntos

b

af (x)dx = b − a

2(f (x0) + f (x1)) + R[f ]

donde x0 = a + ℎ y x1 = a + 2ℎ, ℎ = (b − a)∕3. El grado de precisión de lafórmula es 1, ya que R[1] = R[x − a] = 0 y

R[(x − a)2] =(b − a)3

3− b − a

2(ℎ2 + 4ℎ2) = 3

2ℎ3 ≠ 0.

En principio, para expresar el error de esta fórmula, deberíamos calcular

K1 = ∫

2

−1(t2 − t)+dt =

53, K2 = ∫

2

−1(t − t2)+dt =

16,

obteniendo la expresión

R[f ] =(5f ′′(�1)

6−f ′′(�2)12

)

ℎ3 =(b − a)3

324(10f ′′(�1) − f ′′(�2)).

Para deducir una fórmula del error más simple, acudimos al Teorema del núcleode Peano. El núcleo de Peano del error de la fórmula es

K(x) =(b − x)2 − (b − a)(x0 − x)+ − (b − a)(x1 − x)+

2.

Haciendo el cambio x = a + tℎ, ℎ = (b − a)∕3, tenemos

K(a + tℎ) = ℎ2

2((3 − t)2 − 3(1 − t)+ − 3(2 − t)+), t ∈ [0, 3].

Si t ∈ (0, 1], tenemos

K(a + tℎ) = ℎ2

2((3 − t)2 − 3(1 − t) − 3(2 − t)) = ℎ2t2

2> 0.

240

Page 241: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Para t ∈ [1, 2), la fórmula es

K(a + tℎ) = ℎ2

2((3 − t)2 − 3(2 − t)) = ℎ2

2(3 − 3t + t2) > 0.

Finalmente para t ∈ [2, 3), tenemos que

K(a + tℎ) = ℎ2

2(3 − t)2 > 0.

Por tanto el núcleo de Peano del error no cambia de signo. Así que podemosaplicar el primer teorema de la media en la representación del núcleo de Peanodel error

R[f ] = ∫

b

aK(x)f ′′(x)dx = f ′′(�)∫

b

aK(x)dx.

Para determinar el valor de la integral, aplicamos la fórmula anterior a f (x) =(x − a)2, obteniendo

2∫

b

aK(x)dx = R[(x − a)2] = 3

2ℎ3,

de donde se deduce que

b

aK(x)dx = 3ℎ3

4=

(b − a)3

36.

Obteniéndose la fórmula del error

R[f ] = 3ℎ3

4f ′′(�) =

(b − a)3

36f ′′(�).

Enunciamos a continuación los resultados sobre el error de las fórmulas deNewton-Cotes. No incluimos las demostraciones porque son demasiado técnicaspara mostrarlas con detalle.

Teorema 7.9. El error de una fórmula de Newton-Cotes cerrada de n+1 nodoses

R[f ] ∶=

Cn+1

(n + 1)!f (n+1)(�)ℎn+2, si n es impar,

Cn+1

(n + 2)!f (n+2)(�)ℎn+3, si n es par,

241

Page 242: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

donde ℎ ∶= (b − a)∕n y

Cn+1 ∶=

n

0t(t − 1)⋯ (t − n)dt < 0, si n es impar,

n

0t2(t − 1)⋯ (t − n)dt < 0, si n es par.

Teorema 7.10. El error de una fórmula de Newton-Cotes abierta de n+1 nodoses

R[f ] ∶=

C ′n+1

(n + 1)!f (n+1)(�)ℎn+2, si n es impar,

C ′n+1

(n + 2)!f (n+2)(�)ℎn+3, si n es par,

donde ℎ ∶= (b − a)∕(n + 2) y

C ′n+1 ∶=

n+1

−1t(t − 1)⋯ (t − n)dt > 0, si n es impar,

n+1

−1t2(t − 1)⋯ (t − n)dt > 0, si n es par.

Ofrecemos a continuación las fórmulas de Newton-Cotes más comunes consus correspondientes términos de error.

La fórmula cerrada con n = 1 es la Regla del trapecio y con n = 2 es laRegla de Simpson. La fórmula cerrada con n = 3 es la llamada Regla de los 3∕8en referencia a sus pesos centrales, también recibe el apelativo de pulcherrima yse atribuye a Newton. La fórmula cerrada con n = 4 recibe el nombre de Reglade Boole o Regla de Milne.

Fórmulas de Newton-Cotes cerradas ℎ = (b − a)∕nℎ2(f0 + f1) −

ℎ3

12f (2)(�) Regla del trapecio (n = 1)

ℎ3(f0 + 4f1 + f2) −

ℎ5

90f (4)(�) Regla de Simpson (n = 2)

3ℎ8(f0 + 3f1 + 3f2 + f3) −

3ℎ5

80f (4)(�) Regla de los 3/8 (n = 3)

2ℎ45

(7f0 + 32f1 + 12f2 + 32f3 + 7f4) −8ℎ7

945f (6)(�) Regla de Boole (n = 4)

242

Page 243: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Las fórmulas abiertas se utilizan con menos frecuencia que las cerradas. Lafórmula abierta con n = 0 es la Regla del punto medio.

Fórmulas de Newton-Cotes abiertas ℎ = (b − a)∕(n + 2)

2ℎf0 +ℎ3

3f (2)(�) Regla del punto medio (n = 0)

3ℎ2(f0 + f1) +

3ℎ3

4f (2)(�) (n = 1)

4ℎ3(2f0 − f1 + 2f2) +

14ℎ5

45f (4)(�) (n = 2)

5ℎ24

(11f0 + f1 + f2 + 11f3) +95ℎ5

144f (4)(�) (n = 3)

Las fórmulas de Newton-Cotes no se utilizan en problemas en los que se re-quiere un grado de precisión elevado. En primer lugar, la determinación de lospesos es un problema mal condicionado por lo que los algoritmos simples basa-dos en imponer las condiciones de exactitud producen resultados poco fiables.En segundo lugar, para valores elevados de n, el cálculo de la integral mediantela regla de cuadratura produce grandes cancelaciones de valores, amplificandoconsiderablemente el error de redondeo. En el tratamiento de problemas en losque se requiere un grado de precisión elevado se utilizan las reglas de cuadraturagaussianas que se describirán más adelante. También proporcionan buenos re-sultados para altos grados de precisión las reglas de Fejér y de Clenshaw-Curtis,basadas en nodos que son ceros o extremos de polinomios de Chebyshev.

Fórmulas de cuadratura compuestasLa idea principal de las reglas de cuadratura compuestas consiste en apro-

ximar la integral en un gran intervalo sumando las contribuciones de reglas decuadratura sobre los subintervalos de una partición. Si partimos de una regla decuadratura en el intervalo [0, 1]

1

0f (t)dt ≈

n∑

i=0wif (ti)

podemos obtener fórmulas correspondientes en un intervalo [a, b] cualquiera

b

af (x)dx = (b − a)

n∑

i=0wif (a + ti(b − a)) + R[a,b][f ].

243

Page 244: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Como las cotas del error R[a,b][f ] son funciones crecientes de la longitud b− a,siempre tendremos intervalos suficientemente amplios para los que la aplicaciónde una fórmula simple no proporcione resultados fiables.

Si ahora consideramos una partición del intervalo [a, b] generada por losnudos

a = x0 < x1 < ⋯ < xN−1 < xN = b,

en N subintervalos [xj , xj+1], de modo que ℎj ∶= xj+1 − xj , j = 0,… , N − 1sea suficientemente pequeña, la fórmula de cuadratura nos dará aproximacionesde mayor precisión en ese subintervalo

xj+1

xjf (x)dx ≈ ℎj

n∑

i=0wif (xj + tiℎj).

Como la integral en el intervalo completo es suma de las integrales en los subin-tervalos de la partición

b

af (x)dx =

N−1∑

j=0∫

xj+1

xjf (x)dx

parece lógico proponer una fórmula de cuadratura del tipo

b

af (x)dx =

N−1∑

j=0ℎj

n∑

i=0wif (xj + tiℎj) + R[f ].

Este tipo de fórmulas reciben el nombre de reglas de cuadratura compuestas.Llamando xij ∶= xj + tiℎj , la regla de cuadratura compuesta puede expresarseen la forma

b

af (x)dx =

N−1∑

j=0ℎj

n∑

i=0wif (xij) + R[f ].

Observemos que el error de una regla compuesta es la suma de los erroresen todos los subintervalos

R[f ] =N−1∑

j=0R[xj ,xj+1][f ],

y que estos errores serán pequeños si la norma de la partición

ℎ = maxj=0,…,N−1

xj+1 − xj

244

Page 245: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

es suficientemente pequeña. Pero si el número de subintervalos es demasiadogrande

R[f ] =N−1∑

j=0R[xj ,xj+1][f ]

podría acumularse excesivamente el error.Mostremos que el error puede controlarse efectivamente eligiendo un núme-

ro de subintervalos adecuado y que tenemos convergencia a la integral cuandoℎ → 0 con las reglas de cuadratura más comunes.

Del Teorema ?? se deduce la siguiente cota del error de una fórmula sim-ple de grado de precisión k ≥ n cuyos nodos se encuentran en el intervalo deintegración

|R[a,b][f ]| ≤Kk+1maxx∈[a,b] |f (k+1)(x)|

(k + 1)!(b−a)k+2, Kk+1 ∶= ∫

1

0

k∏

i=0|t−ti|dt,

siendo t0,… , tn los nodos de la fórmula en el intervalo [0, 1] y tn+1,… , tk nodosadicionales arbitrarios en [0, 1]. Al considerar la contribución al error en cadasubintervalo, se deduce que

|R[f ]| ≤N−1∑

j=0|R[xj ,xj+1][f ]| ≤

Kk+1

(k + 1)!

N−1∑

j=0ℎk+2j max

x∈[xj ,xj+1]|f (k+1)(x)|,

llamando Mk+1 ∶= maxx∈[a,b] |f (k+1)(x)|, y ℎ = maxj=0,…,N−1 ℎj , tendremos

|R[f ]| ≤Kk+1Mk+1

∑N−1j=0 ℎk+2

j

(k + 1)!≤ (b − a)

Kk+1Mk+1ℎk+1

(k + 1)!,

que tiende a cero, cuando ℎ → 0. Así que el orden de convergencia de una fór-mula compuesta se reduce en una unidad respecto a la correspondiente fórmulasimple por la acumulación de los errores correspondientes a cada sumando. Siconocemos una cota de la derivada (k + 1)-ésima de la función que vamos aintegrar, podemos determinar la norma de la partición que garantiza un errormenor que �

ℎ ≤ k+1

�(k + 1)!(b − a)Kk+1Mk+1

.

En aras de una mayor simplicidad, consideraremos reglas compuestas sobreparticiones uniformes del intervalo

xj ∶= a + j b − aN

, i = 0,… , N,

245

Page 246: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

de modo que todos los subintervalos tienen la misma longitud

ℎ ∶= xj+1 − xj .

También supondremos que los nodos de la fórmula simple asociada son puntosdel intervalo de integración 0 ≤ t0 < ⋯ < tn ≤ 1. En ese caso los nodos de lasfórmulas son

xj + tiℎ = a + (j + ti)ℎ, i = 0,… , n, j = 0,… , N − 1,

y la fórmula de cuadratura numérica puede expresarse en la forma

b

af (x)dx = ℎ

N−1∑

j=0

n∑

i=0wif (a + (j + ti)ℎ) + R[f ].

Para expresar las reglas compuestas, utilizaremos la notación de índices frac-cionarios para los nodos

xj+ti ∶= a + (j + ti)ℎ, i = 0,… , n, j = 0,… , N − 1,

y la sucesión de valores correspondientes

fj+ti ∶= f (a + (j + ti)ℎ), i = 0,… , n, j = 0,… , N − 1.

Observemos que si ambos extremos de los intervalos son nodos de la fór-mula

t0 = 0, tn = 1,entonces el último sumando de un intervalo está basado en el mismo nodo queel primer sumando del siguiente intervalo y puede reducirse el número de su-mandos de la regla de cuadratura.

Para ilustrar esta idea, describamos la regla del trapecio compuesta

b

af (x)dx ≈ ℎ

2

N−1∑

j=1

(

f (xj) + f (xj+1))

= ℎ(f (a) + f (b)

2+

N−1∑

j=1f (xj)

)

,

cuyo error es

R[f ] = −ℎ3

12

N−1∑

j=0f ′′(�j),

donde �j ∈ [xj , xj+1], j = 0,… , N − 1. Utilizando el Lema ??, podemosexpresar el error en la forma

R[f ] = −Nℎ3

12f ′′(�) = −(b − a)

f ′′(�)12

ℎ2, � ∈ [a, b],

246

Page 247: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

lo que da un orden de convergencia O(ℎ2). Utilizando la notación de subíndicespodemos expresar la regla del trapecio compuesta en la forma abreviada

b

af (x)dx = ℎ

(f0 + fN2

+N−1∑

j=1fj)

− (b − a)f ′′(�)12

ℎ2.

Este análisis se puede aplicar a la mayoría de fórmulas estudiadas anterior-mente, obteniendo para la fórmula del rectángulo compuesta

b

af (x)dx = ℎ

N−1∑

j=0fj + (b − a)

f ′(�)2

ℎ,

para la del punto medio compuesta

b

af (x)dx = ℎ

N−1∑

j=0fj+1∕2 + (b − a)

f ′′(�)24

ℎ2,

y para la de Simpson compuesta

b

af (x)dx = ℎ

(f0 + fN6

+ 13

N−1∑

j=1fj +

23

N−1∑

j=0fj+1∕2

)

− (b − a)f (4)(�)2880

ℎ4.

Extrapolación y método de RombergSea F ∶ (0, R] una función tal que

F (ℎ) = a0 + a1ℎm1 +⋯ + akℎ

mk + Rk+1(ℎ),

donde Rk+1(ℎ) = O(ℎmk+1), es decir verifica una acotación de la forma

|Rk+1(ℎ)| ≤ Ck+1ℎmk+1,

con 0 = m0 < m1 < ⋯ < mk < mk+1. Observemos que lımℎ→0+ F (ℎ) =a0. Frecuentemente ℎ es un parámetro de discretización que no puede tomarseigual a 0. Típicamente, aparece en la fórmula de F (ℎ) un denominador quetiende a cero cuando ℎ → 0+. En otras ocasiones, complejidad del problemaque hay que resolver para evaluar ℎ es inversamente proporcional al tamaño deℎ. En cualquier caso, es imposible disponer del valor del límite a0. Pretendemosaproximar el valor del límite a0 utilizando valores de F en puntos ℎ y rℎ con

247

Page 248: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

0 < r < 1. La extrapolación de Richardson permite obtener funciones conmayor velocidad de convergencia que F .

Comparando los valores de F (ℎ) y F (rℎ) obtenemos

F (rℎ) = a0 + a1rm1ℎm1 +⋯ + akr

mkℎmk + Rk+1(rℎ)

Así que

F (rℎ) − rm1F (ℎ) = (1 − rm1)a0 + (rm2 − rm1)a2ℎm2 +⋯+ (rmk − rm1)akℎmk + O(ℎmk+1).

Por tanto la función

F1(ℎ) ∶=F (rℎ) − rm1F (ℎ)

1 − rm1= a0 +

rm2 − rm1

1 − rm1a1ℎ

m2 +⋯

+ rmk − rm1

1 − rm1akℎ

mk + O(ℎmk+1)

proporciona aproximaciones a a0, que convergen más rápidamente a 0 cuandoℎ → 0+. Observemos que la función F1(ℎ) es una función del tipo anterior conun término menos, así que el proceso puede repetirse hasta obtener una funciónFk(ℎ) = a0 + O(ℎmk+1) que converge a a0 con una velocidad O(ℎmk+1).

Recordemos que los pesos de una fórmula de cuadratura numérica de tipointerpolatorio pueden determinarse resolviendo un sistema de ecuaciones. Si elgrado de precisión es alto, nos enfrentamos a la resolución de sistemas de altadimensión que pueden estar mal condicionados y cuyo cálculo puede ser labo-rioso con resultados poco precisos. La extrapolación de Richardson nos permiteconstruir implícitamente fórmulas de alto grado de precisión (no necesariamen-te de tipo interpolatorio) partiendo de una fórmula dada. El método de Rombergconsiste en aplicar la extrapolación de Richardson a la fórmula del trapecio.

Sea T (ℎ) el valor de la aproximación a la integral de f en [a, b] utilizandoN subintervalos con ℎ = (b − a)∕N

T (ℎ) ∶= ℎ(12f (a) +

N−1∑

i=1f (a + iℎ) + 1

2f (b)

)

.

La fórmula de sumación de Euler-MacLaurin implica que la fórmula del trape-cio compuesta admite la representación

T (ℎ) = ∫

b

af (x)dx +

m∑

k=1

B2k(f (2k−1)(b) − f (2k−1)(a))(2k)!

ℎ2k

+B2m+2f (2m+2)(�)

(2m + 2)!(b − a)ℎ2m+2.

248

Page 249: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Los Bn son los llamados números de Bernoulli, que pueden definirse partiendode B0 = 1 mediante la recurrencia

∑nk=0

(n+1k

)

Bk = 0. Los primeros númerosde Bernoulli de índice par son

B2 =16, B4 =

−130

, B6 =142

, B8 =−130

,…

Podemos aplicar la extrapolación de Richardson para la sucesión de expo-nentes 2, 4, 6,… y r = 1∕2. La fórmula que obtenemos aplicando el primer pasode extrapolación

T1(ℎ) =4T (ℎ∕2) − T (ℎ)

3corresponde a la fórmula de Simpson compuesta. Los sucesivos pasos dan lugara las fórmulas compuestas correspondientes a fórmulas simples cada vez conmayor grado de precisión

Tk(ℎ) =22kTk−1(ℎ∕2) − Tk−1(ℎ)

22k − 1.

La fórmula anterior puede escribirse en la forma

Tk(ℎ) = Tk−1(ℎ) +Tk−1(ℎ∕2) − Tk−1(ℎ)

22k − 1.

Puesto que la fórmula Tk(ℎ) ha sido obtenida mediante extrapolación, puedeconsiderarse más precisa que Tk−1(ℎ), por lo que el valor

Tk−1(ℎ∕2) − Tk−1(ℎ)22k − 1

puede interpretarse como una estimación del error cometido por Tk−1(ℎ) para ℎsuficientemente pequeño.

Convergencia de las reglas de cuadraturaUna cuestión que se plantea tras considerar fórmulas de cuadratura de grado

de precisión cada vez más alto es el problema de la convergencia de una sucesiónde reglas de cuadratura al valor de la integral. El siguiente resultado muestra quela acotación de los pesos es crucial para deducir la convergencia.

Teorema 7.11 (Teorema de convergencia de Pólya). Sea w una función no ne-gativa e integrable en [a, b]. Sea

b

af (x)w(x)dx =

nk∑

i=0wi,kf (xi,k) + Rk[f ], k = 0, 1,…

249

Page 250: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

una sucesión de reglas de cuadratura con

xi,k ∈ [a, b], i = 0,… , nk, k = 0, 1,… ,

de manera que la regla de cuadratura k-ésima sea exacta en Pk. Entonces

b

af (x)w(x)dx = lım

k→∞

nk∑

i=0wi,kf (xi,k)

para cualquier función continua f ∈ C[a, b] si y solo si existe una constante Ktal que

nk∑

i=0|wi,k| ≤ K, ∀k ≥ 0,

Demostración. Supongamos que∑nk

i=0 |wi,k| ≤ K para todo k. Por el Teore-ma de Aproximación de Weierstrass, el conjunto de polinomios P es denso enC[a, b], es decir, para cada función f ∈ C[a, b]. Por lo tanto, dada f existeuna sucesión de polinomios qk ∈ Pk tal que qk converge uniformemente a f .Entonces tenemos que

|Rk[f − qk]| =|

|

|∫

b

a(f (x) − qk(x))w(x)dx −

nk∑

i=0wi,k(f (xi,k) − qk(xi,k))

|

|

|

≤ ∫

b

aw(x)dx ‖f − qk‖∞ +

nk∑

i=0|wi,k|‖f − qk‖∞

Como, por hipótesis∑nk

i=0 |wi,k| ≤ K , deducimos que

|Rk[f − qk]| ≤(

b

aw(x)dx +K

)

‖f − qk‖∞,

luego lımk→∞Rk[f − qk] = 0. Por la exactitud de la fórmula k-ésima en Pktenemos Rk[qk] = 0, de donde se deduce que

Rk[f ] = Rk[f − qk] → 0,

cuando k → ∞.Recíprocamente, teniendo en cuenta que

‖Rk‖∞ = ∫

b

aw(x)dx +

nk∑

i=0|wi,k|,

250

Page 251: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

vemos que si la sucesión de valores∑nk

i=0 |wi,k|, k = 0, 1,… no está acota-da, tampoco lo estará la sucesión de normas ‖Rk‖∞. Del principio de acotaciónuniforme (Teorema de Banach-Steinhaus) se deduce que existe una función con-tinua f ∈ C[a, b] para la que Rk[f ] no está acotada, lo que implica que la su-cesión de valores

∑nki=0wi,kf (xi,k) no será convergente para dicha función.

Para las fórmulas de Newton-Cotes no es posible acotar la suma de los pesosal aumentar el grado de precisión y no podemos garantizar la convergencia a laintegral. Por ello introduciremos más adelante fórmulas de cuadratura cuyospesos son todos positivos. Para fórmulas con pesos positivos está garantizada laconvergencia como ya observaron V. Steklov y L. Fejér.

Corolario 7.12. Sea w una función no negativa e integrable en [a, b]. Sea unasucesión de reglas de cuadratura

b

af (x)w(x)dx =

nk∑

i=0wi,kf (xi,k) + Rk[f ], k = 0, 1,…

con nodos en [a, b] y pesos no negativos de manera que la regla de cuadraturak-ésima sea exacta en Pk. Entonces

b

af (x)w(x)dx = lım

k→∞

nk∑

i=0wi,kf (xi,k).

Demostración. Como los pesos son no negativosnk∑

i=0|wi,k| =

nk∑

i=0wi,k = ∫

b

aw(x)dx.

Aplicando el Teorema de convergencia de Pólya, deducimos que las aproxima-ciones obtenidas con la sucesión de reglas de cuadratura convergen a la integralpara cualquier función continua.

8. Aproximación por mínimos cuadradosEn la aproximación de funciones es indispensable poder contar con un cri-

terio de distancia que permita seleccionar una buena aproximación. Un criteriomuy utilizado para valorar la calidad de una aproximación es que el valor delerror cuadrático medio sea pequeño. En dicho caso, el tamaño del error de unaaproximación se mide mediante una norma procedente de un producto escalar

251

Page 252: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

y la búsqueda de la mejor aproximación se reduce a un problema lineal. En laaproximación por mínimos cuadrados se distinguen dos casos: la aproximacióncontinua y la discreta.

En la aproximación por mínimos cuadrados continua la distancia entre dosfunciones se mide utilizando una norma

d(u, v) = ‖u − v‖

procedente de un producto escalar

‖u‖ ∶=√

⟨u, u⟩

de la forma⟨u, v⟩ ∶= ∫

b

au(x)v(x)dx,

o más generalmente

⟨u, v⟩ ∶= ∫Iu(x)v(x)w(x)dx,

siendo w una función peso no negativa e integrable en el intervalo I .La aproximación por mínimos cuadrados discreta utiliza normas proceden-

tes de productos escalares discretos, es decir, de la forma

⟨u, v⟩ ∶=N∑

i=0wiu(xi)v(xi),

con w0,… , wN > 0 y x0,… , xN un conjunto de puntos de [a, b], llamadosnodos.

Más generalmente podemos considerar productos escalares que combinentérminos continuos y discretos

⟨u, v⟩ =N∑

i=0wiu(xi)v(xi) + ∫I

w(x)u(x)v(x)dx,

donde w es una función no negativa integrable en I y wi ≥ 0, i = 0,… , N .La teoría de la medida nos permite abordar todos casos a la vez, sin más queconsiderar un producto escalar

⟨u, v⟩ = ∫Iu(x)v(x)d�(x)

252

Page 253: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

respecto a una medida de Borel finita y no negativa sobre I .En determinados contextos tienen interés productos escalares más generales

que utilizan valores de derivadas y también integrales ponderadas de derivadasde orden superior de la función.

Espacios dotados de un producto escalar semidefinido positivoConsiderar solamente formas cuadráticas definidas positivas en los proble-

mas de mínimos cuadrados es una fuerte restricción.En el caso de la mejor aproximación continua ponderada correspondiente a

una función peso no negativa, pueden surgir algunas dificultades. Si la funciónpeso w es nula en un subintervalo J de I y u es una función no nula del espacioF tal que

{x ∈ I ∣ u(x) ≠ 0} ⊆ J,

entonces x ∈ I → u(x)2w(x) es una función idénticamente nula en I y

∫Iu(x)2w(x)dx = 0,

lo que implica que la forma bilineal ⟨u, v⟩ ∶= ∫I u(x)v(x)w(x)dx no define unproducto escalar.

Este mismo problema también aparece en la aproximación discreta. No po-demos esperar tener un producto escalar discreto ⟨u, v⟩ ∶=

∑Ni=0wiu(xi)v(xi),

definido en el espacio de todos los polinomios, ni siquiera en PN+1. El polino-mio !N+1(x) =

∏Ni=0(x − xi) es no nulo y verifica ⟨!N+1, !N+1⟩ = 0.

Las observaciones anteriores motivan el estudio de los problemas de míni-mos cuadrados en el contexto de espacios dotados de una forma bilineal simé-trica semidefinida positiva.

Definición. Una seminorma ‖ ⋅ ‖ una aplicación de un espacio vectorial F enlos números reales, semidefinida positiva, subaditiva, simétrica y positivamentehomogénea, es decir, verifica las siguientes propiedades

(a) ‖f‖ ≥ 0, ∀f ∈ F(b) ‖f + g‖ ≤ ‖f‖ + ‖g‖, ∀f, g ∈ F(c) ‖tf‖ = |t| ‖f‖, ∀t ∈ ℝ, f ∈ F .

Dada una forma bilineal simétrica semidefinida positiva ⟨⋅, ⋅⟩, queda defi-nida una forma cuadrática u → ⟨u, u⟩ semidefinida positiva y una seminormamediante ‖u‖ ∶=

⟨u, u⟩. En el caso de que la forma sea definida positiva, es

253

Page 254: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

decir un producto escalar, ‖u‖ ∶=√

⟨u, u⟩ define una norma del espacio. Poranalogía, podemos establecer la siguiente definición de semiproducto escalar,si bien advertimos que esta terminología no es estándar.

Definición. Un semiproducto escalar es una forma bilineal simétrica semidefi-nida positiva.

Definición. Si F es un espacio dotado de un semiproducto escalar, diremos quedos vectores u, v son ortogonales, u ⟂ v, si ⟨u, v⟩ = 0 o equivalentemente si‖u ± v‖ =

‖u‖2 + ‖v‖2.

Es frecuente utilizar la notación ⟂ para indicar la ortogonalidad entre vec-tores y subespacios, de modo que

v ⟂ U

significa que v es ortogonal al subespacio U de F , en el sentido de que v esortogonal a todos los vectores de dicho subespacio. También se introduce elcomplemento ortogonal de un espacio

U⟂ ∶= {v ∈ F ∣ v ⟂ U},

que es un espacio vectorial.

Definición. Sea F es un espacio dotado de un semiproducto escalar. Un vectoru ∈ F es isótropo si ⟨u, u⟩ = 0.

Notemos que como la forma bilineal es semidefinida un vector no nulo pue-de ser isótropo. Los vectores isótropos son precisamente aquellos que tienenseminorma nula.

Aproximación por mínimos cuadradosDefinición. Sea F un espacio dotado de un semiproducto escalar y U un subes-pacio de F . Decimos que u0 ∈ U es la mejor aproximación de f ∈ F porelementos de U si

‖f − u0‖ ≤ ‖f − u‖, ∀u ∈ U,

es decir,‖f − u0‖ = mın

u∈U‖f − u‖.

254

Page 255: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Observemos que la mejor aproximación u0 es la solución de un problemade mínimos cuadrados en el sentido de que u0 hace mínimo el error cuadrático‖f − u‖2.

En el siguiente resultado utilizamos las relaciones de ortogonalidad paracaracterizar las mejores aproximaciones de una función en un subespacio.

Teorema 8.1. Sea U un subespacio vectorial de un espacio F dotado de unsemiproducto escalar y sea f ∈ F . Entonces u0 ∈ U es una mejor aproximaciónf en U si y solo si se verifica

u0 − f ∈ U⟂.

Demostración. Sea u0 una mejor aproximación de f en U . Sea v ∈ U , v ≠ 0,cualquiera. Entonces tenemos que

p(t) ∶= ‖u0 + tv − f‖2 = ‖v‖2t2 + 2⟨u0 − f, v⟩t + ‖u0 − f‖2,

alcanza su valor mínimo en t = 0, es decir p(t) − p(0) ≥ 0 para todo t.

p(t) − p(0) = (‖v‖2t + 2⟨u0 − f, v⟩)t ≥ 0,

lo que implica que ⟨u0 − f, v⟩. Como v es un vector arbitrario de U ⧵ {0},deducimos que u0 − f ∈ U⟂.

Recíprocamente si u0 − f ∈ U⟂, tenemos

‖u − f‖2 = ‖(u − u0) + (u0 − f )‖2 = ‖u − u0‖2 + ‖u0 − f‖2 ≥ ‖u0 − f‖2,

lo que muestra que u0 es la mejor aproximación por elementos de U .

Mejor aproximación en espacios de dimensión finitaVeamos cómo podemos obtener la mejor aproximación en el sentido de mí-

nimos cuadrados de f ∈ F por elementos de un subespacio de dimensión finitaU . En primer lugar se escoge una base u1,… , un del espacio y todo elemento deU se puede expresar de manera única como combinación lineal de elementosde la base.

Por el Teorema ??, si u0 es la mejor aproximación deben verificarse las re-laciones

⟨u0, ui⟩ = ⟨f, ui⟩, i = 1,… , n. (8.1)Las condiciones (8.1) son también suficientes ya que todo u ∈ U puede expre-sarse como combinación lineal de los elementos de la base

u = c1u1 +⋯ + cnun,

255

Page 256: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

luego

⟨u0 − f, u⟩ =n∑

i=1ci⟨u0 − f, ui⟩ = 0

y por el Teorema ??, u0 es la mejor aproximación de f en U .La mejor aproximación, si existe, puede expresarse mediante sus coordena-

das (c1,… , cn) respecto a la base (u1,… , un) en la forma

u0 =n∑

j=1cjuj .

Imponiendo las relaciones (8.1) se obtiene el sistema de ecuaciones normalesn∑

j=1⟨uj , ui⟩cj = ⟨f, ui⟩, i = 1,… , n,

que puede expresarse en forma matricial

⟨u1, u1⟩ ⋯ ⟨un, u1⟩

⋮ ⋱ ⋮

⟨u1, un⟩ ⋯ ⟨un, un⟩

c1⋮

cn

=

⟨f, u1⟩

⟨f, un⟩

.

Definición. La matriz de Gram o gramiana de un sistema de vectores (u1,… , un)es la matriz

G(u1,… , un) ∶=

⟨u1, u1⟩ ⋯ ⟨u1, un⟩

⋮ ⋱ ⋮

⟨un, u1⟩ ⋯ ⟨un, un⟩

.

Nota. Teniendo en cuenta la simetría del semiproducto escalar, la matriz gra-miana siempre es simétrica. Además es semidefinida positiva, ya que

cTG(u1,… , un)c =‖

n∑

j=1cjuj

2≥ 0 ∀c ∈ ℝn.

La matriz de coeficientes del sistema de ecuaciones normales es precisa-mente la matriz de Gram de la base (u1,… , un) del espacio U . Para poder deter-minar una solución necesitamos que la matriz gramiana sea definida positiva.A continuación vemos que la matriz gramiana es definida positiva si y solo si larestricción de la seminorma al espacio U es una norma del espacio

256

Page 257: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Proposición 8.2. Sea U un subespacio vectorial de dimensión finita de un espa-cioF dotado de un semiproducto escalar ⟨⋅, ⋅⟩ y sea ‖⋅‖ la seminorma asociada.Las siguentes condiciones son equivalentes

(a) La restricción de ‖ ⋅ ‖ al subespacio U es una norma.(b) El espacio U no contiene vectores isótropos, es decir, U ∩ U⟂ = 0.(c) La matriz de Gram de una base cualquiera es simétrica y definida posi-

tiva.

Demostración. Veamos que (a) y (b) son equivalentes

u ∈ U ∩ U⟂ ⇔ ⟨u, u⟩ = 0 ⇔ ‖u‖ = 0.

Por tanto hay vectores no nulos con seminorma nula si y solo si U ∩U⟂ contienevectores no nulos.

Veamos que (a) implica (c). Dada una base u1,… , un y c ∈ ℝn⧵{0} tenemos∑n

j=1 cjuj ≠ 0, luego ‖

∑nj=1 cjuj‖ > 0, de donde

cTG(u1,… , un)c =‖

n∑

j=1cjuj

2> 0.

Por tanto, G(u1,… , un) es definida positiva.Finalmente veamos que (c) implica (a). Si G(u1,… , un) es definida positiva,

como todo vector no nulo u ∈ U⧵{0} tiene coordenadas c ∈ ℝn⧵{0}, podremosdeducir que la seminorma de u =

∑nj=1 cjuj es

n∑

j=1cjuj

=√

cTG(u1,… , un)c > 0.

Si ‖ ⋅ ‖ es una norma sobre U , entonces la gramiana de cualquier base esuna una matriz simétrica y definida positiva. Esto permite deducir la existenciay unicidad de solución del problema de mejor aproximación en subespacios dedimensión finita.

Teorema 8.3 (Existencia y unicidad de la mejor aproximación). Sea un espacioF dotado de una seminorma ‖ ⋅‖ que proviene de un semiproducto escalar ⟨⋅, ⋅⟩y sea f ∈ F . Sea U un subespacio vectorial de dimensión finita tal que ‖ ⋅ ‖define una norma sobre U . Entonces la mejor aproximación f en el subespacioU existe y es única.

257

Page 258: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Demostración. Por el Teorema ??, la mejor aproximación se caracteriza porser la solución del sistema de ecuaciones normales. Por la Proposición ??, lamatriz del sistema de ecuaciones normales es definida positiva. Por tanto, elsistema de ecuaciones normales tiene una matriz de coeficientes no singular yadmite siempre una solución única, lo que implica la existencia y unicidad dela solución del problema de mejor aproximación.

Sistemas ortogonales y sumas de FourierLa construcción de los coeficientes del sistema de ecuaciones normales su-

pone evaluar el producto escalar. La resolución del sistema de ecuaciones nor-males puede dar lugar a resultados con grandes errores debido al mal condicio-namiento de las matrices de Gram.

Una matriz relevante en la aproximación por mínimos cuadrados es la matrizde Hilbert

Hn =(

1i+j−1

)

i,j=1,…,n.

Esta matriz es la matriz de Gram de la base (1, x,… , xn−1) del espacio Pn−1,respecto al producto escalar ⟨u, v⟩ ∶= ∫ 1

0 u(x)v(x)dx. Para n = 10, el condi-cionamiento de la matriz de Hilbert es �2(H10) ≈ 1.6 × 1013 y, para n = 15,�2(H15) ≈ 6.1 × 1020.

Una alternativa a la resolución de sistemas normales es el uso de bases or-togonales. En ese caso, la resolución del sistema de ecuaciones normales estrivial, ya que la matriz del sistema es diagonal. En algunos casos, las basesortogonales están completamente descritas y pueden ser evaluadas con ciertosalgoritmos. En el caso de no disponer de una base ortogonal es preciso seguirun proceso de ortogonalización. Desarrollaremos estas ideas en el contexto deespacios dotados de un semiproducto escalar.

Definición. Sea F un espacio dotado de un semiproducto escalar. El sistemade vectores (q1,… , qn), qi ∈ F , i = 1,… , n, es ortogonal si ⟨qi, qj⟩ = 0, paratodo i ≠ j. El sistema se dice ortonormal si es ortogonal y ‖qi‖ = 1, para todoi = 1,… , n.

Veamos que los vectores con seminorma no nula de un sistema ortogonalson independientes.

Teorema 8.4. Sea (q1,… , qn) un sistema ortogonal de vectores con seminormano nula de un espacioF dotado de un semiproducto escalar yU ∶= ⟨q1,… , qn⟩.Entonces

258

Page 259: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

(a) Los vectores q1,… , qn son independientes y forman una base de U .(b) El semiproducto escalar define una norma sobre U .(c) La mejor aproximación de f ∈ F en U es

n∑

j=1

⟨f, qj⟩‖qj‖2

qj .

(d) Si f ∈ U , entonces

f =n∑

j=1

⟨f, qj⟩‖qj‖2

qj .

Demostración. Suponer que una combinación lineal de los vectores es nulan∑

j=1cjqj = 0,

multiplicando por qi obtenemos ci⟨qi, qi⟩ = 0. Como la seminorma de cadavector qi es no nula, se deduce que ⟨qi, qi⟩ > 0 y ci = 0, para todo i = 1,… n.Para demostrar (b), tengamos en cuenta que la ortogonalidad implica que

n∑

j=1cjqj

2=

n∑

j=1c2j ‖qj‖

2,

de donde se deduce que los vectores de U no nulos deben tener seminorma nonula. Para demostrar (c) y (d), multipliquemos el vector

f −m∑

j=1

⟨qj , f ⟩‖qj‖2

qj

por los vectores qi, i = 1,… , n, obteniendo

⟨f, qi⟩ −⟨f, qi⟩‖qi‖2

⟨qi, qi⟩ = 0,

lo que implica que∑n

i=1 ⟨qi, f ⟩∕‖qi‖2qi es la mejor aproximación de f por ele-

mentos de U .

La expresión de la mejor aproximación de un vector f respecto a una baseortogonal q1,… , qn del espacio,

Sn[f ] ∶=n∑

i=1

⟨qi, f ⟩‖qi‖2

qi

259

Page 260: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

recibe el nombre de suma de Fourier. Si la base es ortonormal, la expresión dela suma de Fourier se simplifica,

Sn[f ] =n∑

i=1⟨qi, f ⟩ qi,

de modo que los coeficientes de Fourier son precisamente los productos escala-res de los elementos de la base por el vector dado f .

Si tenemos una sucesión de ortogonal de vectores q1,… , qn,… con semi-norma no nula, podemos considerar la serie formal

S[f ] ∶=∞∑

i=1

⟨qi, f ⟩‖qi‖2

qi,

llamada serie de Fourier de f respecto al sistema ortogonal q1,… , qn,… Latruncación de esta serie de lugar a la mejor aproximación de f en el subespacio⟨q1,… , qn⟩.

Un ejemplo clásico de este tipo de series son las series de Fourier trigono-métricas en C[−�, �] o L2[−�, �] respecto al producto escalar

⟨u, v⟩ ∶= 12� ∫

−�u(x)v(x)dx,

asociado a la norma en media cuadrática

‖u‖22 =12� ∫

−�u(x)2dx.

Estas series se obtienen del sistema ortonormal de funciones

1,√

2 cos x,√

2 sen x,√

2 cos(2x),√

2 sen(2x),…

del espacio de los polinomios trigonométricos. La serie de Fourier trigonomé-trica es

a02+

∞∑

k=1(ak cos(kx) + bk sen(kx)),

donde

ak =1� ∫

−�cos(kx)f (x)dx, bk =

1� ∫

−�sen(kx)f (x)dx, k = 1, 2,…

y

a0 =1� ∫

−�f (x)dx.

260

Page 261: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

La truncación de la serie anterior

a02+

n∑

k=1(ak cos(kx) + bk sen(kx)),

es la suma de Fourier trigonométrica completa y expresa la mejor aproximaciónde f por polinomios trigonométricos de grado n respecto a la norma en mediacuadrática.

OrtogonalizaciónYa hemos mencionado que muchas bases ortogonales importantes de fun-

ciones están descritas y que existen algoritmos que permiten calcular y evaluardichas bases. En el caso de que no conozcamos una descripción de la base or-togonal, podemos calcularla a través de un proceso de ortogonalización.

Teorema 8.5 (Ortogonalización de Gram-Schmidt). Sean u1,… , un vectores li-nealmente independientes de un espacio F dotado con un semiproducto escalary sea Un ∶= ⟨u1,… , un⟩. Si el semiproducto escalar define una norma sobre elsubespacio Un, entonces existe una base ortonormal de (q1,… , qn) de Un talque

uj =j∑

i=1rijqi, j = 1,… , n,

donde rjj ≠ 0, j = 1,… , n.

Demostración. Vamos a demostrar el resultado por inducción sobre n. Si n = 1,tomamos

q1 ∶=1

‖u1‖u1

yr11 ∶= ⟨q1, u1⟩.

Sea 2 ≤ k ≤ n y supongamos que hemos construido vectores q1,… , qk−1 orto-gonales y escalares

rij , 1 ≤ i ≤ j ≤ k − 1,

tales que que se verifica

uj =j∑

i=1rijqi, j = 1,… , k − 1.

261

Page 262: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Searik ∶= ⟨qi, uk⟩, i = 1,… , k − 1.

Entonces∑k−1

i=1 rikqi es la suma de Fourier que proporciona la mejor aproxima-ción de uk por elementos de Uk−1 = ⟨u1,… , uk−1⟩ de donde se deduce que

uk −k−1∑

i=1rikqi ∈ Uk ∩ U⟂

k−1.

Como los vectores u1,… , un son linealmente independientes, tenemos que uk ∉Uk−1, luego

rkk ∶=‖

uk −k−1∑

i=1rikqi

‖2≠ 0.

El vector

qk ∶= r−1kk(

uk −k−1∑

i=1rikqi

)

∈ Uk ∩ U⟂k−1

tiene norma 1 y se verifica uk =∑k

i=1 rikqi.

El resultado anterior puede expresarse como un cambio de base

(u1,… , un) = (q1,… , qn)R,

donde R = (rij)i,j=1,…,n es la matriz triangular superior cuyos elementos sonrij . La matriz de Gram de la base ortonormal (q1,… , qn) es la matriz identi-dad, G(q1,… , qn) = In. Además G(u1,… , un) = RTR, por lo que la matriz Rproporciona la factorización de Choleski de la matriz gramiana de la base departida G(u1,… , un).

El proceso de ortogonalización puede describirse en forma de algoritmo.El sistema dado u1,… , un se modifica sucesivamente hasta convertirse en unsistema ortogonal.

Algoritmo Método de ortogonalización de Gram-SchmidtPara j = 1,… , n

Para i = 1,… , j − 1rij ← ⟨ui, uj⟩uj ← uj − rijui

rjj ← ‖uj‖uj = r−1jj uj

262

Page 263: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Este algoritmo presenta problemas de estabilidad de cálculo. Una modifica-ción de este algoritmo mejora considerablemente las propiedades de estabilidad.En este algoritmo de Gram-Schmidt modificado, se normaliza el primer vectorq1 ∶= r−111 u1, r11 ∶= ‖u1‖, y luego se obtienen las proyecciones ortogonalesu(1)j ∶= uj − r1jq1, r1j ∶= ⟨q1, uj⟩, j = 2,… , n, de los vectores ui sobre elsubespacio U⟂

1 . Estas proyecciones (u(1)2 ,… , u(1)n ) forman una base del espacioUn ∩ U⟂

1 al cual se le aplica de nuevo el proceso de ortogonalización. En cadapaso la dimensión disminuye y el proceso termina al obtener un espacio unidi-mensional, cuyo único vector básico solamente requiere una normalización.

Algoritmo Método de Gram-Schmidt modificadoPara i = 1,… , n

rii ← ‖ui‖ui = r−1ii uiPara j = i + 1,… , n

rij ← ⟨ui, uj⟩uj ← uj − rijui

El proceso de ortogonalización también puede aplicarse a un sistema nume-rable de vectores independientes de un espacio F de dimensión infinita

u1,… , un,…

Sea Un = ⟨u1,… , un⟩. El espacio engendrado por la sucesión de vectores esU = ∪∞

n=1Un. Asociada a esta sucesión puede construirse una base ortonormalde U , mediante un proceso de ortogonalización

q1,… , qn,…

de forma que q1,… , qn es base ortonormal de Un para todo n ≥ 1.

Ortogonalización y resolución de problemas discretosEn el caso de que el producto escalar sea discreto

⟨u, v⟩ =N∑

i=1wiu(xi)v(xi),

el proceso de ortogonalización de una base admite una formulación matricial.Sea u1,… , un la base de partida y sea q1,… , qn la base ortonormal tal que

263

Page 264: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

(u1,… , un) = (q1,… , qn)R, donde R ∈ ℝn×n es una matriz triangular supe-rior. La matriz de Gram de la base (q1,… , qn) es la identidad, propiedad quepuede expresarse mediante la ecuación matricial

M(

q1,… , qnx1,… , xN

)T

WM(

q1,… , qnx1,… , xN

)

= In,

donde W = diag(w1,… , wN) y

M(

q1,… , qnx1,… , xN

)

=

q1(x1) ⋯ qn(x1)

⋮ ⋱ ⋮

q1(xN) ⋯ qn(xN)

∈ ℝN×n

es la matriz de colocación de la base q1,… , qn en los puntos x1,… , xN . Defi-niendo

W 1∕2 ∶= diag(√

w1,… ,√

wN),

la matrizQ = W 1∕2M

(

q1,… , qnx1,… , xN

)

∈ ℝN×n,

es una matriz isométrica en el sentido de que QTQ = In. Teniendo en cuentaque

M(

u1,… , unx1,… , xN

)

= M(

q1,… , qnx1,… , xN

)

R,

deducimos que

W 1∕2M(

u1,… , unx1,… , xN

)

= QR,

es decir la matriz de cambio de base R puede obtenerse a través de la factoriza-ción QR reducida de la matriz

A ∶= W 1∕2M(

u1,… , unx1,… , xN

)

.

La matriz de colocación de la base ortonormal es

M(

q1,… , qnx1,… , xN

)

= W −1∕2Q.

264

Page 265: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

La resolución de un problema discreto también puede describirse en formamatricial. Sea u =

∑nj=1 cjuj la mejor aproximación de f respecto al produc-

to escalar discreto. Podemos traducir el problema de encontrar la mejor apro-ximación discreta al problema de encontrar c = (c1,… , cn) que minimice laexpresión

f −n∑

j=1cjuj

2=

N∑

i=1wi

(

f (xi) −n∑

j=1cjuj(xi)

)2.

El problema corresponde a minimizar la norma euclídea del vector r(c) ∈ ℝN ,dado por

r(c) ∶=(

wif (xi) −√

wi

n∑

j=1cjuj(xi)

)

i=1,…,N.

El vector r(c) es el residuo del sistema de ecuaciones sobredeterminado Ac = b,donde

A ∶= W 1∕2M(

u1,… , unx1,… , xN

)

, b ∶= W 1∕2

f (x1)

f (xN)

.

El sistema de ecuaciones normales ATAc = AT b adopta la forma

M(

u1,… , unx1,… , xN

)T

WM(

u1,… , unx1,… , xN

)

c = M(

u1,… , unx1,… , xN

)T

W

f (x1)

f (xN)

.

En lugar de resolver este sistema, es preferible expresar la mejor aproximaciónen términos de la base ortogonal u =

∑nj=1 djqj . Los coeficientes dj son coefi-

cientes de Fourier respecto a la base (q1,… , qn)

dj = ⟨qj , f ⟩, j = 1,… , n,

lo que permite obtener la siguiente expresión explícita del vector de coeficientesen términos de los datos

d = M(

q1,… , qnx1,… , xN

)T

W

f (x1)

f (xN)

= QTW 1∕2

f (x1)

f (xN)

= QT b.

265

Page 266: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

En algunos casos la base ortonormal del problema discreto coincide con labase ortonormal de un problema continuo cuya base es bien conocida y de la quedisponemos de algoritmos eficientes de evaluación. En otros casos la base or-tonormal goza de buenas propiedades y podemos manipular con comodidad lasfunciones obtenidas al combinar los elementos de la base. En estos casos espe-ciales resulta ventajoso expresar la solución en términos de la base ortonormal∑n

j=1 djqj .También es posible que la base ortonormal obtenida dé lugar a un sistema

de funciones de complicada descripción, dificultando la manipulación y evalua-ción de las funciones. Si la base inicial (u0,… , un) es apropiada para expresarlas funciones del espacio y permite la evaluación eficiente de las funciones, po-demos plantearnos la posibilidad de expresar la mejor aproximación en térmi-nos de la base de partida

∑nj=1 cjuj . Observemos que la relación entre las bases

(u1,… , un) = (q1,… , qn)R conduce a la siguiente relación entre los vectores decoeficientes

Rc = d.

Por tanto, si hemos obtenido d y queremos encontrar el vector de coeficientes crespecto a la base inicial, bastará con resolver el sistema triangular de ecuacionesRc = d.

Polinomios ortogonalesDado un semiproducto escalar en un espacio de funciones que contiene a los

polinomios (o a polinomios hasta un grado determinado), llamamos polinomiosortogonales a aquellos polinomios con seminorma no nula que son ortogonalesa todos los de grado inferior.

De la definición se deduce que para que exista el polinomio ortogonal degrado n, la restricción del semiproducto escalar al espacio Pn debe ser un pro-ducto escalar o equivalentemente Pn ∩ P ⟂

n = 0.Los polinomios ortogonales quedan determinados salvo una constante de

proporcionalidad. Además de imponer que el vector tenga norma unitaria, tam-bién se utilizan otros criterios de normalización. Con frecuencia se prescribeel coeficiente director, la norma o el valor del polinomio en algún extremo delintervalo.

Los polinomios ortogonales pueden construirse mediante un proceso de or-togonalización partiendo de la base de monomios

1, x, x2,… , xn.

266

Page 267: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

El proceso de Gram-Schmidt conduce a un sistema ortonormal de polinomios

q0, q1, q2,… , qn,

tales que qj tiene grado exactamente j y es ortogonal a Pj−1, para cada j =0, 1,… , n, es decir, cada qj es un polinomio ortogonal de grado j con normaunitaria.

Consideraremos semiproductos escalares de la forma

⟨u, v⟩ ∶= ∫Iu(x)v(x)d�(x)

donde � es una medida de Borel no negativa. El caso particular en que la medidaproviene de una densidad d� = w(x)dx con w una función continua en Int(I),no negativa, integrable y no idénticamente nula es de particular interés.

El siguiente resultado es útil para demostrar la existencia de polinomios or-togonales asociados a ciertos problemas de aproximación por mínimos cuadra-dos.

Lema 8.6. Sea w una función continua en Int(I), no negativa, integrable talque ∫I w(x)dx > 0. Si r es un polinomio no negativo en I y no idénticamentenulo tal que rw es integrable en I , entonces

∫Ir(x)w(x)dx > 0.

Demostración. Sea x0 ∈ Int(I) tal que w(x0) > 0. Por continuidad, existe� > 0 tal que w(x) > w(x0)∕2, para todo x ∈ (x0 − �, x0 + �). El polinomior solamente puede anularse en un número finito de puntos de (x0 − �, x0 + �).Luego existirá � ∈ (x0 − �, x0 + �) tal que r(�) ≠ 0 y podremos encontrar �′ talque (�−�′, �+�′) ⊂ (x0−�, x0+�) y r(x) > r(�)∕2 para todo x ∈ (�−�′, �+�′).Se deduce que

∫Ir(x)w(x)dx ≥ ∫

�+�′

�−�′r(x)w(x)dx ≥

r(�)w(x0)�′

2> 0.

Nota. El resultado es válido aunque w no sea una función continua. Si rw es nonegativa y tiene integral nula, entonces puede deducirse que rw es nula en casitodo punto. Como r se anula a lo sumo en un número finito de puntos, se tieneque w es nula en casi todo punto. Por tanto ∫I w(x)dx = 0, en contradiccióncon la hipótesis.

267

Page 268: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Consideramos el semiproducto escalar

⟨u, v⟩ = ∫Iu(x)v(x)w(x)dx,

donde la función peso w es una función continua en Int(I), no negativa, inte-grable y no idénticamente nula. Para que el semiproducto escalar esté definidoen el espacio de polinomios es necesario imponer que

∫I|p(x)|w(x)dx < +∞,

para todo polinomio p. Del Lema ?? se deduce que

∫Ip(x)2w(x)dx > 0

para todo polinomio p. Por tanto, la restricción del semiproducto escalar al es-pacio de polinomios es definida positiva y tiene sentido definir polinomios or-togonales respecto a ese semiproducto escalar.

El intervalo I más utilizado es el intervalo [−1, 1]. Pueden definirse polino-mios ortogonales en intervalos no acotados, usualmente [0,∞) o incluso todala recta real (−∞,∞). Los polinomios ortogonales se calculan en uno de es-tos intervalos. Si el problema se formula en algún otro intervalo, se realiza uncambio de variables que transforme el problema al intervalo estándar. Tambiénhay que notar que si los intervalos son ilimitados o las funciones peso tienensingularidades en el intervalo, las integrales son impropias.

Los polinomios ortogonales clásicos reciben diferentes nombres dependien-do de la función peso w(x) y del intervalo elegido. Los polinomios ortogonalesen [−1, 1] respecto a la función peso w(x) = 1 reciben el nombre de polino-mios de Legendre. Otros polinomios ortogonales utilizados con frecuencia sonlos polinomios de Chebyshev de primera especie en [−1, 1] correspondientes ala función pesow(x) = 1∕

1 − x2 y los de segunda especie, correspondientes aw(x) =

1 − x2. Los casos anteriores son casos particulares de los polinomiosde Jacobi, que son polinomios ortogonales respecto al producto escalar

⟨u, v⟩ ∶= ∫

1

−1u(x)v(x)(1 − x)�(1 + x)�dx, �, � > −1.

Mediante un cambio de variables podemos definir polinomios de Jacobi en cual-quier intervalo acotados.

268

Page 269: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Otros ejemplos notables en intervalos ilimitados son los polinomios de La-guerre en (0,+∞), ortogonales respecto a producto escalar

⟨u, v⟩ ∶= ∫

+∞

0u(x)v(x) exp(−x)dx.

y los polinomios de Hermite que son polinomios ortogonales en la recta realrespecto al producto escalar

⟨u, v⟩ ∶= ∫

+∞

−∞u(x)v(x) exp(−x2)dx.

Los polinomios ortogonales clásicos están sujetos a diferentes normalizacio-nes. Podemos partir de una base ortonormal q0,… , qn,… En ese caso el criteriode normalización utilizado es la norma del espacio asociada al producto escalar

‖qn‖ ∶=(

∫Iq2n(x)w(x)dx

)1∕2= 1.

Como qn(x) y −qn(x) son polinomios de la misma norma, se toma como poli-nomio ortogonal normalizado el que tiene coeficiente en xn positivo.

Una transformación que juega un papel importante en la construcción depolinomios ortogonales es la multiplicación por la variable x y que permiteasociar a cada polinomio p(x) el polinomio xp(x). Esta transformación preservael coeficiente director del polinomio, aumentando el grado en una unidad. Porello, algunas fórmulas resultan más simples si las expresamos en términos de lasucesión de polinomios ortogonales p0,… , pn,… cuyo coeficiente director es1. De las relaciones

pn(x) =1

coeff(qn(x), xn)qn(x), qn(x) =

1‖pn‖

pn(x),

se deduce que coeff(qn(x), xn) = ‖pn‖−1.El problema del cálculo de polinomios ortogonales puede verse como un

problema de minimización en un subespacio trasladado.

Teorema 8.7. Sea pn el polinomio ortogonal de grado n y coeficiente director1. Entonces, para todo polinomio p ∈ Pn con coeficiente director 1, se tiene

‖pn‖ ≤ ‖p‖

Demostración. Por definición de polinomio ortogonal, sabemos que pn es orto-gonal a todo polinomio de Pn−1. Si p ∈ Pn tiene coeficiente director 1, entoncesp − pn ∈ Pn−1 y

⟨pn, p − pn⟩ = 0,

269

Page 270: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

de donde se obtiene que

‖p‖2 = ‖pn‖2 + ‖p − pn‖

2 ≥ ‖pn‖2.

Entre las propiedades de los polinomios ortogonales destacan las propie-dades de oscilación. El polinomio ortogonal de grado n cambia de signo en elintervalo en el que está definido el producto escalar n veces.

Teorema 8.8. Sea w una función continua en Int(I), no negativa, integrable yno idénticamente nula, tal que |p|w es integrable en I , para todo p ∈ P2n, demodo que

⟨u, v⟩ = ∫Iu(x)v(x)w(x)dx

define un producto escalar sobre Pn. Sea pn un polinomio ortogonal de grado n.Entonces pn tiene exactamente n raíces reales y distintas y todas se encuentranen Int(I).

Demostración. Sean �1,… , �r, r ≤ n, las raíces de pn(x) de multiplicidad imparen Int(I). Entonces el polinomio

pn(x)(x − �1)⋯ (x − �r)

no cambia de signo en el intervalo I . Sea s ∈ {−1, 1} el signo de dicho polino-mio en I . Del Lema ??, se deduce que

∫Is pn(x)(x − �1)⋯ (x − �r)w(x)dx > 0.

Por tanto, pn no es ortogonal al polinomio (x − �1)… (x − �r). Como pn esortogonal a todos los polinomios de grado menor que n, se deduce que r =n.

Mostremos una propiedad notable de los polinomios ortogonales: es posibleobtenerlos mediante una relación de recurrencia a tres términos. Deduciremosestas relaciones para los polinomios ortogonales con norma unitaria y luego lasaplicaremos a sucesiones de polinomios ortogonales no necesariamente norma-lizados.

Teorema 8.9 (Relaciones de recurrencia a tres términos). Sea � una medida deBorel no negativa, tal que

⟨u, v⟩ ∶= ∫Iu(x)v(x)d�(x)

270

Page 271: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

define un producto escalar en PN . Sea q0, q1,… , qN la sucesión de polino-mios ortogonales con norma unitaria y coeficiente director positivo. Para n =0,… , N − 1, definimos

�n ∶= ∫Ixqn(x)2d�(x),

�n ∶= ∫Ixqn(x)qn+1(x)d�(x) =

coeff(qn(x), xn)coeff(qn+1(x), xn+1)

> 0,

Entonces tenemos�0q1(x) = (x − �0)q0(x),

y para todo 1 ≤ n ≤ N − 1, se verifica la siguiente relación de recurrencia atres términos

�nqn+1(x) = (x − �n)qn(x) − �n−1qn−1(x).

Demostración. El primer polinomio ortogonal es q0(x) = ⟨1, 1⟩−1∕2. En generaltenemos que xqn(x) ∈ Pn+1 puede expresarse en términos de la base q0,… , qn+1mediante una suma de Fourier

xqn(x) =n+1∑

j=0⟨xqn, qj⟩qj(x).

Si n = 0, tenemos

xq0(x) = �0q1(x) + �0q0(x).

Para n ≥ 1 y j < n − 1, se tiene xqj(x) ∈ Pn−1, luego qn ⟂ xqj . Por tanto,

⟨xqn, qj⟩ = 0, j = 0,… , n − 2,

y se anulan todos los sumandos de la suma de Fourier, excepto los tres últimos.Teniendo en cuenta que

�n−1 = ⟨xqn, qn−1⟩, �n = ⟨xqn, qn⟩, �n = ⟨xqn, qn+1⟩,

la suma de Fourier se reduce a

xqn(x) = �nqn+1(x) + �nqn(x) + �n−1qn−1.

Finalmente, comparando los coeficientes directores en las relaciones ante-riores deducimos que

�n =coeff(qn(x), xn)

coeff(qn+1(x), xn+1)> 0.

271

Page 272: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Observemos que las relaciones anteriores permiten expresar los coeficientesen xn de qn(x) en términos de las constantes �0,… , �n−1

coeff(qn(x), xn) =q0

�0⋯ �n−1.

Vamos a establecer la relación de recurrencia a tres términos de los poli-nomios ortogonales p0,… , pn con coeficiente director 1. Teniendo en cuenta larelación

qn(x) =1

‖pn‖pn.

y el Teorema ??, obtenemos

�n1

‖pn+1‖pn+1(x) =

1‖pn‖

(x − �n)pn(x) − �n−11

‖pn−1‖pn−1(x).

Comparando los coeficientes directores de pn y qn

coeff(qn(x), xn) =1

‖pn‖,

podemos expresar los coeficientes de la relación de recurrencia en términos delos polinomios pn

�n =⟨xpn, pn⟩‖pn‖2

, �n−1 =‖pn‖‖pn−1‖

,

obteniendo la relación de recurrencia para polinomios mónicos

pn+1(x) = (x − �n)pn(x) − �2n−1pn−1(x),

que permite calcular la sucesión de polinomios ortogonales partiendo de

p0(x) = 1, p1(x) = x − �0.

Finalmente si rn denota a un polinomio ortogonal cuyo coeficiente direc-tor es an, podemos definir kn = an+1∕an para cada n. Teniendo en cuenta quern(x)∕an es el polinomio ortogonal con coeficiente director 1, podemos apli-car las fórmulas anteriores. Los coeficientes de la recurrencia se expresan en laforma

�n =⟨xrn, rn⟩⟨rn, rn⟩

, �n−1 =1

|kn−1|‖rn‖‖rn−1‖

.

y la relación de recurrencia adopta la forma general

rn+1(x) = kn(x − �n)rn(x) − knkn−1�2n−1rn−1(x).

272

Page 273: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

La identidad de Christoffel-DarbouxDefinición. Sea p0, p1,… , pn una sucesión de polinomios ortogonales respectoa un respecto a un semiproducto escalar ⟨u, v⟩ ∶= ∫I u(x)v(x)d�(x) asociado auna medida de Borel no negativa �. Se define el núcleo de Christoffel-Darbouxde grado n como

Kn(x, y) ∶=n∑

j=0

pj(x)pj(y)‖pj‖2

,

La suma de Fourier n-ésima respecto a un sistema ortogonal de polinomios

Sn[f ](x) =n∑

j=0

⟨pj , f ⟩‖pj‖2

pj(x)

puede expresarse como una integral respecto al núcleo de Christoffel-Darboux

Sn[f ](x) =n∑

j=0

∫I pj(y)f (y)d�(y)‖pj‖2

pj(x) = ∫IKn(x, y)f (y)d�(y)

o equivalentementeSn[f ](x) = ⟨Kn(x, ⋅), f ⟩.

Nota. El núcleo de Christoffel-Darboux es un núcleo reproductor del espacioPn, en el sentido de que podemos obtener los valores de p ∈ Pn mediante unproceso de integración

p(x) = ∫IKn(x, y)p(y)d�(y), p ∈ Pn.

El funcional que a cada p ∈ Pn le asocia su valor en x puede expresarse como elproducto escalar de p por la función Kn(x, ⋅) que también pertenece al espacioPn

p(x) = ⟨Kn(x, ⋅), p⟩, p ∈ Pn.

La expresión del núcleo respecto al sistema ortonormal qj = pj∕‖pj‖ sereduce a

Kn(x, y) ∶=n∑

j=0qj(x)qj(y).

La identidad de Christoffel-Darboux proporciona una fórmula para el núcleoasociado a una suma de Fourier y permite deducir algunas fórmulas que invo-lucran a integrales y derivadas de polinomios ortogonales.

273

Page 274: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Proposición 8.10 (Identidad de Christoffel-Darboux). Sea � una medida de Bo-rel no negativa, tal que

⟨u, v⟩ ∶= ∫Iu(x)v(x)d�(x)

define un producto escalar en Pn+1. Sean q0,… , qn, qn+1 los polinomios orto-gonales con norma unitaria y coeficiente director positivo. Entonces se tieneque

n∑

j=0qj(x)qj(y) = �n

qn+1(x)qn(y) − qn+1(y)qn(x)x − y

,

donde �n = ⟨xqn(x), qn+1(x)⟩.

Demostración. Demostraremos la identidad por inducción sobre n. Para n =0 tenemos que q0 es una constante y �0q1(x) = (x − �0)q0(x), donde �0 =⟨xq0(x), q0(x)⟩. Por tanto

�0q1(x)q0(y) − q1(y)q0(x)

x − y=

q20x − y

[(x − �0) − (y − �0)] = q20 = q0(x)q0(y).

Para el caso general, supondremos la identidad cierta para n − 1. Insertando larelación de recurrencia �nqn+1(x) = (x − �n)qn(x) − �n−1qn−1(x) en el miembroderecho de la identidad obtenemos

�nqn+1(x)qn(y) − qn+1(y)qn(x)

x − y

=(x − �n) − (y − �n)

x − yqn(x)qn(y) − �n−1

qn−1(x)qn(y) − qn−1(y)qn(x)x − y

= qn(x)qn(y) + �n−1qn(x)qn−1(y) − qn(y)qn−1(x)

x − y

y aplicando la hipótesis de inducción obtenemos el resultado.

La identidad de Christoffel-Darboux admite la siguiente expresión en tér-minos de los polinomios ortogonales pn con coeficiente director 1

n∑

j=0

pj(x)pj(y)‖pj‖2

= 1‖pn‖2

pn+1(x)pn(y) − pn+1(y)pn(x)x − y

.

La identidad de Christoffel-Darboux permite establecer relaciones entre lospolinomios ortogonales y sus derivadas. Tomando límites cuando y → x en la

274

Page 275: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

identidad de Christoffel-Darboux obtenemosn∑

j=0qj(x)2 = �n(q′n+1(x)qn(x) − qn+1(x)q′n(x)).

Por tanto la matriz wronskiana de dos polinomios ortogonales consecutivos tie-ne determinate positivo

detW (qn, qn+1)(x) = det⎛

qn(x) qn+1(x)

q′n(x) q′n+1(x)

= �−1n

n∑

j=0qj(x)2 > 0.

La función de ChristoffelLa función de Christoffel permite relacionar el tamaño de un polinomio p(x)

de grado menor o igual que n en un punto x ∈ I con la norma de dicho poli-nomio ‖p‖2. Sea Sn[f ] el operador que a cada función f ∈ L2(�), le asocia sumejor aproximación en el sentido de mínimos cuadrados. Entonces

Sn[f ](x) = ∫IKn(x, y)p(y)d�(y),

donde Kn(x, y) es el núcleo de Christoffel-Darboux. Aplicando la desigualdadde Cauchy-Schwartz tenemos

(Sn[f ](x))2 ≤ ∫IKn(x, y)2d�(y)∫I

f (y)2d�(y) = ‖f‖22 ∫IKn(x, y)2d�(y).

Para estimar ‖Kn(x, ⋅)‖2, utilizamos la expresión del núcleo en términos de unabase ortonormal q0,… , qn

∫IKn(x, y)2d�(y) = ‖Kn(x, ⋅)‖22 = ‖

n∑

i=0qi(x)qi‖22 =

n∑

i=0qi(x)2 = Kn(x, x).

Por tanto tenemos la desigualdad

(Sn[f ](x))2 ≤ Kn(x, x)‖p‖22.

Por otro lado, la igualdad de alcanza para el polinomio p = Kn(x, ⋅) =∑n

i=0 qi(x)qide Pn, ya que

‖p‖22 =n∑

i=0qi(x)2 = Kn(x, x) = p(x) = Sn[p](x).

275

Page 276: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Se deduce quemax‖f‖2=1

Sn[f ](x)2 = Kn(x, x).

La fórmula anterior nos permite relacionar las normas ‖p‖2 y el valor de|p(x)| de un polinomio arbitrario de Pn. Para deducir esta relación consideramosel hecho de que el núcleo de Chistoffel-Darboux es un núcleo reproductor en Pn

p(x) = Sn[p] = ∫IKn(x, y)p(y)d�(y), p ∈ Pn.

Por tanto, para todo polinomio de grado menor o igual que n tenemos la des-igualdad

p(x)2 ≤ Kn(x, x)‖p‖22y la igualdad se alcanza para el polinomio p = Kn(x, ⋅)∕Kn(x, x) ∈ Pn, conp(1) = 1 y ‖p‖22 = 1∕Kn(x, x). Definiendo la función de Christoffel

�n(x) ∶=1

Kn(x, x)= 1

∑ni=0 qi(x)2

,

se deduce que�n(x) = max

p∈Pn,p(x)=1‖p‖22.

Observemos que las funciones de Christoffel forman una sucesión monónotadecreciente de funciones positivas que están acotadas por la constante �(I)

�n(x) ≤ ⋯ ≤ �1(x) ≤ �0(x) =1q20

= �(I).

En el caso de que el intervalo I sea compacto, la relación entre p(x) y ‖p‖2da lugar a una relación entre las normas ‖p‖2 y ‖p‖∞ de un polinomio cualquierade Pn. Partiendo de la desigualdad p(x)2 ≤ Kn(x, x)‖p‖22, se deduce que

‖p‖2∞ ≤ maxx∈I

Kn(x, x)‖p‖22 =‖p‖22

mınx∈I �n(x).

Teniendo en cuenta que

‖p‖22 = ∫Ip(x)2d�(x) ≤ ‖p‖2∞ ∫I

d�(x) = �(I)‖p‖2∞,

se obtiene la siguiente relación de equivalencia de normas en el espacio Pn

mın �n(x)‖p‖2∞ ≤ ‖p‖22 ≤ �(I)‖p‖2∞, p ∈ Pn.

276

Page 277: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

La función de Christoffel, puede utilizarse para obtener una cota superior dela norma infinito del operador Sn[f ], que a cada función f , le asocia su mejoraproximación en Pn en el sentido de mínimos cuadrados

‖Sn[f ]‖2∞ ≤‖Sn[f ]‖22

mınx∈I �n(x)≤

‖f‖22mınx∈I �n(x)

≤ �(I)mınx∈I �n(x)

‖f‖2∞.

Por tanto, tenemos‖Sn‖

2∞ ≤ �(I)

mınx∈I �n(x).

Propiedades de separación de cerosLos ceros de un polinomio ortogonal se encuentran separados por los ceros

del polinomio ortogonal de grado inferior en una unidad. Podemos utilizar larelación de recurrencia a tres términos para demostrar esta importante propiedadque permite localizar los ceros de los polinomios ortogonales y aplicar el métodode bisección para determinarlos.

Proposición 8.11. Sea � una medida de Borel no negativa, tal que

⟨u, v⟩ ∶= ∫Iu(x)v(x)d�(x)

define un producto escalar en Pn. Sean pk, k = 0, 1,… , n, una sucesión depolinomios ortogonales. Entonces pk+1 tiene k + 1 ceros reales y simples queestán separados por los ceros de pk, k = 1,… , n − 1.

Demostración. Sin pérdida de generalidad podemos suponer que el polinomiopk(x) tiene coeficiente en xk igual a 1. Si k = 1, el único cero x0,1 = �0 de p1verifica en virtud de la relación de recurrencia la desigualdad

p2(x0,1) = (x0,1 − �1)p1(x0,1) − �20p0(x0,1) = �20 < 0

y, como lımx→−∞ p2(x) = lımx→+∞ p2(x) = +∞, se deduce que p2 tiene 2 ce-ros simples uno a cada lado de x0,1. Por hipótesis de inducción podemos supo-ner que los ceros x0,k−1,… , xk−2,k−1 de pk−1 son simples y separan a los cerosx0,k,… , xk−1,k de pk, es decir

x0,k < x0,k−1 < x1,k < x1,k−1 < ⋯ < xk−2,k < xk−2,k−1 < xk−1,k.

Como los ceros de pk−1 son simples, pk−1 cambia de signo entre cada dos cerosconsecutivos de pk, y como

pk+1(xi,k) = −�2k−1pk−1(xi,k), i = 0,… , k − 1,

277

Page 278: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

se deduce que pk+1 cambia de signo entre cada dos ceros consecutivos de pk.Como pk−1 toma valores positivos en (xk−2,k−1,+∞), vemos que

pk+1(xk−1,k) = −�2k−1pk−1(xk−1,k) < 0

y como lımx→∞ pk+1(x) = +∞ y , se deduce que pk+1 tiene al menos un cero a laderecha de xk−1,k. Análogamente, como (−1)k−1pk−1(x) > 0, x ∈ (−∞, x0,k−1),tenemos la desigualdad

(−1)k+1pk+1(x0,k) = −�2k−1(−1)k−1pk−1(x0,k) < 0

y, como lımx→∞(−1)k+1pk+1(x) = +∞, se deduce que pk+1 tiene al menos uncero a la izquierda de x0,k. Se deduce que pk+1 tiene k+1 ceros reales y simples,separados por los de pk.

A continuación presentamos algunos ejemplos de polinomios ortogonales

Polinomios de LegendreLos polinomios de Legendre son los polinomios ortogonales respecto al pro-

ducto escalar ∫ 1−1 u(x)v(x)dx.

Pueden definirse mediante la fórmula

Pn(x) =1n!

dn

dxn

(

x2 − 12

)n

. (Fórmula de Rodrigues)

Se deduce de la fórmula de Rodrigues que Pn(x) es un polinomio de grado concoeficiente director

an =(2n)!2n(n!)2

.

También se deduce que Pn es un polinomio par si n es par e impar si n es impar.Apliquemos la regla de Leibniz

dn

dxn[

(x − 1)n(x + 1)n]

=n∑

k=0

n!k!(n − k)!

dk

dxk(x + 1)n dn−k

dxn−k(x − 1)n

para obtener el desarrollo

Pn(x) =1

2nn!dn

dxn[

(x − 1)n(x + 1)n]

= 2−nn∑

k=0

1k!(n − k)!

n!k!(x + 1)n−k n!

(n − k)!(x − 1)k

= 2−nn∑

k=0

(

nk

)2

(x + 1)n−k(x − 1)k

278

Page 279: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

y evaluando en x = 1 obtenemos Pn(1) = 1, mientras que Pn(−1) = (−1)n.Sea ahora

In ∶= ∫

1

−1

(

x2 − 12

)n

dx.

Integrando por partes tenemos

In = −∫

1

−1x ddx

(

x2 − 12

)n

dx = −n∫

1

−1x2

(

x2 − 12

)n−1

dx

= −n∫

1

−1

(

x2 − 12

)n−1 [

2(

x2 − 12

)

+ 1]

dx = −2nIn − nIn−1.

Es decirIn = − n

2n + 1In−1

y partiendo de I0 = 2, obtenemos por recurrencia

In = (−1)nn(n − 1)⋯ 1

(2n + 1)(2n − 1)⋯ 32 = (−1)n

(n!)22n+1

(2n + 1)!.

La ortogonalidad de los polinomios de Legendre puede deducirse de la fórmulade Rodrigues. Suponiendo que m ≥ 1 tenemos

1

−1Pn(x)Pm(x)dx = 1

n!m! ∫

1

−1

dn

dxn

(

x2 − 12

)n dm

dxm

(

x2 − 12

)m

dx

= −1n!m! ∫

1

−1

dn+1

dxn+1

(

x2 − 12

)n dm−1

dxm−1

(

x2 − 12

)m

dx.

Si m ≥ n, podemos reiterar el proceso de integración por partes y deducir

1

−1Pn(x)Pm(x)dx =

(−1)n

n!m! ∫

1

−1

d2n

dx2n

(

x2 − 12

)n dm−n

dxm−n

(

x2 − 12

)m

dx.

Teniendo en cuenta que

d2n

dx2n

(

x2 − 12

)n

= 2−n(2n)!,

obtenemos

1

−1Pn(x)Pm(x)dx =

(−1)n(2n)!2nn!m! ∫

1

−1

dm−n

dxm−n

(

x2 − 12

)m

dx.

279

Page 280: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Si n < m, la integral es nula

1

−1Pn(x)Pm(x)dx =

(−1)n(2n)!2nn!m!

dm−n−1

dxm−n−1

(

x2 − 12

)m|

|

|

|

1

−1= 0,

lo que muestra la ortogonalidad de los polinomios Pn respecto a la función pesow(x) = 1. Si m = n, tenemos

1

−1Pn(x)2dx =

(−1)n(2n)!2n(n!)2 ∫

1

−1

(

x2 − 12

)n

dx =(−1)n(2n)!2n(n!)2

In

y sustituyendo el valor obtenido de In, tenemos

1

−1Pn(x)2dx = 2

2n + 1.

La relación de recurrencia a tres términos para los polinomios de Legendrees

Pn+1(x) = kn(x − �n)Pn(x) − knkn−1�2n−1Pn−1(x),

dondekn =

an+1an

=(2n + 2)(2n + 1)

2(n + 1)2= 2n + 1

n + 1.

Como xPn(x)2 es un polinomio impar

⟨xPn, Pn⟩ = ∫

1

−1xPn(x)2dx = 0,

y

�n =⟨xPn, Pn⟩

⟨Pn, Pn⟩= 0.

Por otro lado

�n−1 =1

|kn−1|‖Pn‖

‖Pn−1‖= n

2n − 1

2n + 1√

2n − 1= n

4n2 − 1

luego

knkn−1�2n−1 =

n2

(2n − 1)(2n + 1)(2n − 1)(2n + 1)

n(n + 1)= n

n + 1.

Por tanto la relación de recurrencia a tres términos puede expresarse en la forma

Pn+1(x) =2n + 1n + 1

xPn(x) −n

n + 1Pn−1(x). (8.2)

280

Page 281: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Partiendo de P0(x) = 1, P1(x) = x, podemos obtener una lista de los primerospolinomios de Legendre

P2(x) =32x2 − 1

2, P3(x) =

52x3 − 3

2x, P4(x) =

358x4 − 15

4x2 + 3

8.

Veamos que el polinomio de Legendre de grado n es la solución de la ecua-ción diferencial de Legendre

(1 − x2)p′′(x) − 2xp′(x) + �np(x) = 0,

que verifica p(1) = 1, con �n = n(n+1). Primero definimos el polinomio auxiliar

un(x) ∶=(

x2 − 12

)n

.

de modo que Pn(x) = u(n)n (x)∕n!. Derivando tenemos u′n(x) = nxun−1(x) dedonde se obtiene

x2 − 12

u′n(x) = nxun(x).

Hallando la derivada de orden n + 1 de los dos miembros de mediante la reglade Leibniz tenemos

x2 − 12

u(n+2)n (x) + (n + 1)xu(n+1)n (x) +n(n + 1)

2u(n)n (x)

= nxu(n+1)n (x) + n(n + 1)u(n)n (x).

De donde se obtiene

x2 − 12

u(n+2)n (x) + xu(n+1)n (x) −n(n + 1)

2u(n)n (x) = 0

y, teniendo en cuenta que Pn(x) = u(n)n (x)∕n!, deducimos que el polinomio deLegendre Pn, verifica la llamada ecuación diferencial de Legendre

(1 − x2)P ′′n (x) − 2xP ′

n(x) + n(n + 1)Pn(x) = 0.

Polinomios de ChebyshevLos polinomios de primera especie Tn son los polinomios ortogonales res-

pecto al producto escalar ∫ 1−1 u(x)v(x)(1 − x2)−1∕2dx, normalizados por la con-

dición Tn(1) = 1. Definamos

Tn(x) ∶= cos(n arc cos x), x ∈ [−1, 1].

281

Page 282: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

De la definición se deduce que

Tn+1(x) = cos(n arc cos x) cos(arc cos x) − sen(n arc cos x) sen(arc cos x),Tn−1(x) = cos(n arc cos x) cos(arc cos x) + sen(n arc cos x) sen(arc cos x).

Sumando las ecuaciones anteriores obtenemos la relación de recurrencia a trestérminos

Tn+1(x) + Tn−1(x) = 2xTn(x).

Teniendo en cuenta que T0(x) = 1 y que T1(x) = x podemos deducir por in-ducción sobre n que Tn es un polinomio de grado n, que su coeficiente directores 2n−1 para n ≥ 1 y que además Tn(1) = 1 para todo n ≥ 0. La relación derecurrencia permite calcular los primeros polinomios de Chebyshev

T2(x) = 2x2 − 1, T3(x) = 4x3 − 3x, T4(x) = 8x4 − 8x2 + 1.

Veamos ahora que son ortogonales en (−1,+1) respecto a la función pesow(t) = (1 − x2)−1∕2. Un cambio de variables muestra que

+1

−1

Tm(x)Tn(x)√

1 − x2dx = ∫

0cosm� cos n�d� = 0,

para m ≠ n, confirmando la ortogonalidad de los polinomios de Chebyshev. Sin = m = 0, tenemos

‖T0‖2 = ∫

+1

−1

1√

1 − x2dx = ∫

0d� = �.

y si n = m > 0

‖Tn‖2 = ∫

+1

−1

Tn(x)2√

1 − x2dx = ∫

0cos2 n� d� = �

2.

Los polinomios de Chebyshev satisfacen la ecuación diferencial deChebyshev

(1 − x2)p′′(x) − xp′(x) + �np(x) = 0,

donde �n = n2. Para comprobarlo, hacemos el cambio de variable independientex = cos � y la ecuación de Chebyshev se transforma en

d2pd�2

+ n2p = 0.

282

Page 283: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

que admite como solución Tn(cos �) = cos(n�).Los polinomios de Chebyshev de segunda especie

Un(x) ∶=sen((n + 1) arc cos x)

sen(arc cos x)

verifican una relación de recurrencia a tres términos

Un+1(x) + Un−1(x) = 2xUn(x),

y, teniendo en cuenta que U0(x) = 1, U1(x) = 2x, puede demostrarse por induc-ción que son polinomios de grado n y coeficiente director 2n para todo n ≥ 0.El cambio de variables x = cos �, permite comprobar que estos polinomios sonortogonales respecto a la función peso w(x) = (1 − x2)1∕2. El valor de Un(x) enx = 1 puede obtenerse calculando el límite

Un(1) = lım�→0

sen(n + 1)�sen �

= n + 1.

Polinomios de JacobiLos polinomios de Jacobi son los polinomios P (�,�)

n (x) ortogonales respectoal producto escalar con función peso w(x) = (1 − x)�(1 + x)� , x ∈ [−1, 1],�, � > −1 y normalizados con la condición P (�,�)

n (1) =(n+�

n

)

. Los polinomiosde Jacobi pueden expresarse mediante la fórmula de Rodrigues

P (�,�)n (x) =

(−1)n

2nn!(1 − x)−�(1 + x)−� dn

dxn[

(1 − x)n+�(1 + x)n+�]

Los polinomios de Legendre son un caso particular de los polinomios de Jacobi

Pn(x) = P (0,0)n (x).

También los polinomios de Chebyshev Tn y Un convenientemente normalizadospueden expresarse en términos de los polinomios de Jacobi P (−1∕2,−1∕2)

n (x) yP (1∕2,1∕2)n (x), respectivamente

P (−1∕2,−1∕2)n (x) =

(

n − 1∕2n

)

Tn(x), P (1∕2,1∕2)n (x) = 1

n + 1

(

n + 1∕2n

)

Un(x).

283

Page 284: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Polinomios de HermiteLos polinomios de Hermite son los polinomios ortogonales respecto al pro-

ducto escalar ∫ ∞−∞ u(x)v(x) exp(−x2)dx con coeficiente director 2n. Sea

Hn(x) ∶= (−1)n exp(x2) dn

dxnexp(−x2).

Derivando la ecuación

exp(−x2)Hn(x) = (−1)n dn

dxnexp(−x2)

obtenemos

exp(−x2)(H ′n(x) − 2xHn(x)) = −(−1)n+1 dn+1

dxn+1exp(−x2)

y multiplicando la ecuación anterior por exp(x2),

Hn+1(x) = 2xHn(x) −H ′n(x). (8.3)

Como H0(x) = 1, esta fórmula permite demostrar por inducción que Hn(x) esun polinomio de grado n con coeficiente director 2n.

Usando la definición de Hn+1 y la fórmula de Leibniz, podemos escribir

Hn+1(x) = (−1)n+1 exp(x2) dn

dxn(−2x exp(−x2))

= (−1)n exp(x2)(

2x dn

dxnexp(−x2) + 2n dn−1

dxn−1exp(−x2)

)

.

Sustituyendo por las definiciones de Hn y Hn+1, se deduce la siguiente relaciónde recurrencia:

Hn+1(x) = 2xHn(x) − 2nHn(x). (8.4)

Aplicando la relación de recurrencia anterior podemos calcular los primerospolinomios de Hermite partiendo de H0(x) = 1, H1(x) = 2x

H2(x) = 4x2 − 2, H3(x) = 8x3 − 12, H4(x) = 16x4 − 48x2 + 12.

Si igualamos las expresiones de Hn+2 que se deducen de las fórmulas (8.3)y (8.4), obtenemos

2xHn+1(x) − 2(n + 1)Hn(x) = 2xHn+1(x) −H ′n+1(x),

284

Page 285: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

y simplificandoH ′

n+1(x) = 2(n + 1)Hn(x).Si comparamos la fórmula anterior con la obtenida al derivar (8.3)

2(n + 1)Hn(x) = H ′n+1(x) = 2Hn(x) + 2xH ′

n(x) −H ′′n (x),

se deduce queH ′′

n (x) − 2xH ′n(x) + 2nHn(x) = 0.

Luego Hn es solución de la ecuación de diferencial de Hermite

p′′(x) − 2xp′(x) + �np(x) = 0,

con �n = 2n.Finalmente, para comprobar la ortogonalidad hay que verificar

+∞

−∞exp(−x2) Hn(x) Hm(x)dx = 0, m ≠ n.

Usando la fórmula de integración por partes podemos escribir

+∞

−∞exp(−x2)H ′

n(x) H′m(x)dx = lım

x→+∞exp(−x)2H ′

n(x)Hm(x)

− lımt→−∞

exp(−x)2H ′n(x)Hm(x) + ∫

+∞

−∞(− exp(−x2)H ′

n(x))′Hm(x)dx,

y, como Hn(x) y Hm(x) son polinomios,

lımx→+∞

exp(−x2)H ′n(x)Hm(x) = 0, lım

x→−∞exp(−x2)H ′

n(x)Hm(x) = 0,

obteniendose la relación

+∞

−∞exp(−x2)H ′

n(x)H′m(x)dx = ∫

+∞

−∞(− exp(−x2)H ′

n(x))′Hm(x)dx. (8.5)

Ahora tengamos en cuenta que la ecuación de Hermite puede expresarse enforma autoadjunta

(− exp(−x2)H ′n(x))

′ = 2n exp(−x2)Hn(x),

que, sustituida en la integral del segundo miembro de (8.5), da lugar a la fórmula

+∞

−∞exp(−x2)H ′

n(x) H′m(x)dx = 2n∫

+∞

−∞exp(−x2)Hn(x) Hm(x)dx.

285

Page 286: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Intercambiando los papeles de n y m obtenemos dos expresiones distintas parala misma integral

2n∫

+∞

−∞exp(−x2)Hn(x)Hm(x)dx = 2m∫

+∞

−∞exp(−x2)Hn(x)Hm(x)dx,

y, como n ≠ m, deducimos que

+∞

−∞exp(−x2)Hn(x)Hm(x)dx = 0.

Por lo tanto, hemos deducido la ortogonalidad de los polinomios de Hermiterespecto a la función peso exp(−x2).

Si n = m tenemos

+∞

−∞exp(−x2)Hn(x)2dx = 1

2n ∫

+∞

−∞exp(−x2)H ′

n(x)2dx

y, como H ′n(x) = 2nHn−1(x), podemos deducir que

+∞

−∞exp(−x2)Hn(x)2dx = 2n∫

+∞

−∞exp(−x2)Hn−1(x)2dx.

Por lo tanto,

+∞

−∞exp(−x2)Hn(x)2dx = 2nn!∫

+∞

−∞exp(−x2)dx

y como

+∞

−∞exp(−x2)dx = Γ(1∕2) =

obtenemos

+∞

−∞exp(−x2)Hn(x)2dx = 2nn!

�.

Polinomios de LaguerreEl polinomio de Laguerre Ln(x) es el polinomio ortogonal de grado n en

(0,+∞) respecto al producto escalar ∫ ∞0 u(x)v(x) exp(−x)dx que verificaLn(0) =

1. Estos polinomios pueden definirse a través de la fórmula

Ln(x) ∶=exp(x)n!

dn

dxn(exp(−x)xn), n ≥ 0.

286

Page 287: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Aplicando la fórmula de Leibniz, se deduce la siguiente expresión explícita delos polinomios de Laguerre

Ln(x) =n∑

k=0

(−1)k

k!

(

nk

)

xk,

que nos permite describir los primeros polinomios de Laguerre

L0(x) = 1, L1(x) = 1 − x,

L2(x) = 1 − 2x + x2

2, L3(x) = 1 − 3x + 3x2

2− x3

6,

L4(x) = 1 − 4x + 3x2 − 2x33

+ x4

24.

Mediante integración por partes sucesiva y, suponiendo que n ≤ m, obtene-mos

0Ln(x)Lm(x) exp(−x)dx = 1

m! ∫

0

dm

dxm(xm exp(−x))Ln(x)dx

=(−1)n

m! ∫

0

dm−n

dxm−n(xm exp(−x))L(n)

n (x)dx.

Teniendo en cuenta que el coeficiente en xn de Ln(x) es (−1)n∕n!, deducimosque L(n)

n (x) = (−1)n y

0Ln(x)Lm(x) exp(−x)dx = 1

m! ∫

0

dm−n

dxm−n(xm exp(−x))dx.

Si n < m la integral es nula y si n = m

1m! ∫

0xm exp(−x)dx = 1

m!Γ(m + 1) = 1.

Se deduce que los polinomios de Laguerre forman una base ortonormal

0Ln(x)Lm(x) exp(−x)dx = �n,m.

La relación de recurrencia a tres términos para estos polinomios es de la forma

(−1)n+1�nLn+1(x) = (x − �n)(−1)nLn(x) − �n−1(−1)n−1Ln−1(x).

Como�n = −

coeff(Ln(x), xn)coeff(Ln+1(x), xn)

= n + 1,

287

Page 288: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

se tiene(n + 1)Ln+1(x) = (�n − x)Ln(x) − nLn−1(x).

Y, teniendo en cuenta Ln(0) = 1 para todo n, se deduce que �n = 2n + 1, dedonde se obtiene la relación de recurrencia a tres términos para los polinomiosde Laguerre

(n + 1)Ln+1(x) = (2n + 1 − x)Ln(x) − nLn−1(x).

9. Fórmulas de cuadratura gaussianasBuscamos fórmulas de cuadratura

∫If (x)w(x)dx =

n∑

i=0wif (xi) + R[f ],

en un intervalo I que alcancen el mayor grado de precisión posible. En estecapítulo supondremos que la función peso w es una función continua en Int(I),no negativa, y no idénticamente nula, tal que

∫I|p(x)|w(x)dx < +∞

para todo polinomio p. El Lema ?? permite deducir que

⟨p, q⟩ ∶=(

∫Ip(x)q(x)w(x)dx

)1∕2,

define un producto escalar en el espacio de los polinomios y tiene sentido con-siderar polinomios ortogonales respecto a dicho producto escalar.

Para cada sucesión de nodos x0 < ⋯ < xn, los pesos de la fórmula de tipointerpolatorio dan lugar a una regla de cuadratura exacta en Pn. Bajo determi-nadas condiciones sobre los nodos, puede afirmarse que la regla de cuadraturaes exacta en espacios de polinomios Pk con k > n.Teorema 9.1 (Condiciones de exactitud y ortogonalidad). La fórmula de cua-dratura

∫If (x)w(x)dx =

n∑

i=0wif (xi) + R[f ],

es exacta en Pn+m+1, m ≥ 0 si y solo si es una fórmula de tipo interpolatoriobasada en nodos tales que !n+1(x) =

∏ni=0(x − xi) verifica

∫Ixj!n+1(x)w(x)dx = 0, j = 0,… , m,

288

Page 289: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

es decir !n+1 ⟂ Pm.

Demostración. Supongamos que la fórmula es exacta en Pn+m+1 con m ≥ 0.Por el Teorema ??, debe ser de tipo interpolatorio. Además, la fórmula debe serexacta para todo polinomio de la forma !n+1q, con q ∈ Pm, luego

∫I!n+1(x)q(x)w(x)dx =

n∑

i=0wiq(xi)!(xi) = 0.

de donde se deduce que !n+1 ⟂ Pm.Recíprocamente, supongamos que la fórmula es de tipo interpolatorio y

!n+1 ⟂ Pm. Sea p ∈ Pn+m+1. Entonces dividiendo este polinomio para !n+1tenemos

p(x) = !n+1(x)q(x) + r(x),

donde r ∈ Pn y q ∈ Pm. Claramente

r(xi) = p(xi), i = 0,… , n,

por lo que podemos afirmar que r = P (p; x0,… , xn) es el polinomio de interpo-lación de Lagrange de p en x0,… , xn. Como la fórmula es de tipo interpolatoriotenemos

∫Ir(x)w(x)dx =

n∑

i=0wip(xi).

De la condición de ortogonalidad !n+1 ⟂ Pm, deducimos que

∫I!n+1(x)q(x)w(x)dx = 0.

Sumando las relaciones anteriores obtenemos

∫Ip(x)w(x)dx =

n∑

i=0wip(xi),

es decir la regla de cuadratura es exacta para el polinomio p.

Veamos que el grado de precisión de una regla de cuadratura numérica conn nodos es menor que 2n + 1.

Proposición 9.2. El grado de precisión de una regla de cuadratura con n + 1nodos es menor o igual que 2n + 1.

289

Page 290: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Demostración. Sea !n+1(x) = (x − x0)⋯ (x − xn). Por el Lema ??,

R[!2n+1] = ∫I

!n+1(x)2w(x)dx > 0

y la regla de cuadratura no es exacta para el polinomio !2n+1 ∈ P2n+2.

Sea pn+1 el polinomio ortogonal de grado n + 1 y coeficiente director 1 ysean x0,… , xn los ceros de pn+1. Por el Teorema ??, los ceros de pn+1 son reales,distintos y se encuentran en Int(I).

Definición. La fórmula de cuadratura gaussiana de n + 1 nodos es la fórmulade tipo interpolatorio cuyos nodos son los ceros del polinomio ortogonal pn+1.

Notemos que la fórmula gaussiana puede presentarse con diferentes ordena-ciones de los nodos. Por ello, cuando hablamos de la unicidad de las reglas decuadratura gaussianas, consideramos que la fórmula obtenida al reordenar losnodos es esencialmente la misma

Veamos que las reglas de cuadratura gaussiana alcanzan grado de precisión2n + 1.

Teorema 9.3. La única regla de cuadratura que alcanza grado de precisión2n + 1 es la regla de cuadratura gaussiana.

Demostración. Para la regla gaussiana !n+1(x) =∏n

i=0(x − xi) coincide conpn+1(x), el polinomio ortogonal mónico de grado n. Por el Teorema ??, la reglaes exacta en P2n+1. Recíprocamente, si una regla de cuadratura es exacta enP2n+1, por el Teorema ??, tiene que ser de tipo interpolatorio y !n+1 ⟂ Pn. Portanto !n+1(x) = pn+1(x) y la regla de cuadratura coincide con la gaussiana.

Las fórmulas gaussianas reciben varios nombres, dependiendo del pesow(x).En el intervalo [−1, 1], las fórmulas de Gauss-Legendre corresponden a w(x) =1. La elección dew(x) = (1−x2)−1∕2 da lugar a las fórmulas de Gauss-Chebysheven [−1, 1]. Más generalmente w(x) = (1 − x)�(1 + x)� da lugar a las llamadasfórmulas de Gauss-Jacobi. En el intervalo [0,+∞), el peso w(x) = exp(−x)corresponde a las fórmulas de Gauss-Laguerre. En el intervalo (−∞,+∞) tene-mos las fórmulas de Gauss-Hermite correspondientes a w(x) = exp(−x2). Cadauna de estas fórmulas tiene asociados un sistema de polinomios ortogonales.

Veamos que los pesos de las fórmulas gaussianas son positivos.

Teorema 9.4. Los coeficientes de una fórmula de cuadratura gaussiana sonpositivos.

290

Page 291: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Demostración. Como la fórmula tiene grado de precisión 2n+1, la fórmula decuadratura es exacta para los polinomios de Lagrange lk(x)2 ∈ P2n, luego

∫Ilk(x)2w(x)dx =

n∑

i=0wilk(xi)2 = wk, (9.1)

por tanto wk = ‖lk‖2 > 0.

Del Teorema de Pólya y teniendo en cuenta la positividad de los pesos de lasfórmulas gaussianas se deduce el siguiente resultado de convergencia debido aStieltjes

Teorema 9.5 (Teorema de Stieltjes). Sea w ∈ C(a, b), w ≥ 0 e integrable en[a, b]. Para cualquier función continua f ∈ C[a, b], el error de la sucesión dereglas de cuadratura gaussianas

Rn[f ] ∶= ∫

b

af (x)w(x)dx −

n∑

i=0wi,nf (xi,n)

tiende a cero.

Consideremos ahora el problema de determinar los pesos de una fórmulagaussiana. Como las fórmula gaussianas son de tipo interpolatorio, los pesosson las integrales de los polinomios fundamentales de Lagrange

wk = ∫Ilk(x)w(x)dx, k = 0,… , n.

Teniendo en cuenta que !n+1(x) ∶= (x− x0)⋯ (x− xn) = pn+1(x) es el polino-mio ortogonal de grado n + 1, deducimos que

lk(x) =pn+1(x)

p′n+1(xk)(x − xk), k = 0,… , n,

de donde se obtiene la siguiente fórmula para los pesos de una regla de cuadra-tura gaussiana

wk =1

p′n+1(xk) ∫I

pn+1(x)x − xk

w(x)dx, k = 0,… , n.

De la fórmula (9.1) se deduce la siguiente fórmula alternativa para los pesosde una fórmula gaussiana

wk =1

p′n+1(xk)2 ∫I

pn+1(x)2

(x − xk)2w(x)dx, k = 0,… , n.

291

Page 292: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Aunque la fórmula anterior permite deducir que los pesos son positivos, nosimplifica el cálculo de los mismos. Para expresar los pesos de las reglas decuadratura gaussiana, definimos la función de Christoffel

�n(x) ∶=1

∑nj=0 qj(x)2

,

donde q0,… , qn+1 son polinomios polinomios ortogonales de norma unitariay coeficiente director positivo. Por definición �n es una función positiva. Losvalores de la función de Christoffel en los ceros x0,… , xn de qn+1 reciben elnombre de números de Christoffel

�n(xi) =1

∑nj=0 qj(xi)2

, i = 0,… , n.

Utilizando la identidad de Christoffel-Darboux, podemos expresar la función deChristoffel en la forma

�n(x) =1

�n(q′n+1(x)qn(x) − qn+1(x)q′n(x))

y, como qn+1(xi) = 0, los números de Christoffel verifican

�n(xi) =1

�nq′n+1(xi)qn(xi), i = 0,… , n.

Los números de Christoffel también pueden expresarse en términos de los po-linomios ortogonales con coeficiente director 1 mediante la fórmula

�n(xi) =1

∑nj=0

pj(xi)2

‖pj‖2

=‖pn‖2

p′n+1(xi)pn(xi), i = 0,… , n.

Teorema 9.6. Los pesos de una regla de cuadratura gaussiana son los númerosde Christoffel.

Demostración. Sean q0(x),… , qn(x), qn+1(x) los polinomios ortogonales de nor-ma unitaria y coeficiente director positivo y sea

K(x, y) ∶=n∑

j=0qj(x)qj(y).

292

Page 293: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Como qn+1(xi) = 0, se deduce de la identidad de Christoffel-Darboux que

K(x, xi) =n∑

j=0qj(x)qj(xi) = �n

qn+1(x)qn(xi)x − xi

y, tomando límites cuando x → xi, tenemos

K(xi, xi) =n∑

j=0qj(xi)2 = �nq

′n+1(xi)qn(xi).

Por tanto, podemos expresar los polinomios de Lagrange en la forma

li(x) =qn+1(x)

(x − xi)q′n+1(xi)=

K(x, xi)K(xi, xi)

= �n(xi)K(x, xi).

La fórmula anterior proporciona una fórmula explícita del desarrollo de Fourierde los polinomios de Lagrange

li(x) = �n(xi)(

q20 +n∑

j=1qj(xi)qj(x)

)

.

Como la regla es de tipo interpolatorio, los pesos se obtienen integrando lospolinomios de Lagrange correspondientes. Integrando la relación anterior obte-nemos

wi = ∫Ili(x)w(x)dx = �n(xi), i = 0,… , n.

El resultado anterior también puede deducirse teniendo en cuenta que

∫Ili(x)(qj(x)−qj(xi))w(x)dx = 1

q′n+1(xi) ∫Iqn+1(x)

qj(x) − qj(xi)x − xi

w(x)dx = 0,

para todo j ∈ {0,… , n}, ya que qn+1 es ortogonal al polinomio de grado j − 1dado por (qj(x) − qj(xi))∕(x − xi). Por tanto, los coeficientes de Fourier de lafunción li(x) son

∫Ili(x)qj(x)w(x)dx = qj(xi)∫I

li(x)w(x)dx = wiqj(xi), j = 0,… , n,

293

Page 294: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

0

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

0.1

0.11

-1 -0.5 0 0.5 1

Figura 9.1. Función de Christoffel y números de Christoffelde la fórmula de Gauss-Legendre con 16 nodos.

obteniéndose la siguiente fórmula para el desarrollo en suma de Fourier de li(x)

li(x) = wi

n∑

j=0qj(xi)qj(x).

Evaluando en x = xi la fórmula anterior, obtenemos

1 = li(xi) = wi

n∑

j=0qj(xi)2,

es decirwi =

1∑n

j=0 qj(xi)2= �n(xi).

En la Figura 9.1 está representada la función de Christoffel de la fórmulade Gauss-Legendre de 16 nodos correspondiente a n = 15. Las líneas verti-cales tienen abscisas correspondientes a los nodos de la fórmula y las alturascorrespondientes son los números de Christoffel.

Al alcanzar grado de precisión 2n+ 1, las fórmulas gaussianas admiten unafórmula del error en términos de la derivada (2n + 2)-ésima de f .

Teorema 9.7 (Error de las reglas de cuadratura gaussianas). Para cada f ∈C2n+2(I), existe � ∈ I , tal que el error de la regla de cuadratura gaussiana

R[f ] ∶= ∫If (x)w(x)dx −

n∑

i=0wif (xi),

294

Page 295: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

verifica

R[f ] = ‖pn+1‖2 f (2n+2)(�)(2n + 2)!

,

donde pn+1 es el polinomio ortogonal de grado n + 1 y coeficiente director 1.

Demostración. Consideremos un problema de interpolación de Hermite clásicoen los puntos x0,… , xn de Int(I) mediante polinomios de grado 2n + 1. Cadanodo se encuentra exactamente dos veces en la sucesión extendida

x0 = x0 < x1 = x1 < ⋯ < xn = xn.

Sea p(x) = P (f ; x0, x0, x1, x1,… , xn, xn)(x). Como la fórmula de cuadraturatiene grado de precisión 2n + 1 obtendremos al aplicarla a p ∈ P2n+1

∫Ip(x)w(x)dx =

n∑

i=0wip(xi) =

n∑

i=0wif (xi).

Por tanto

R[f ] = ∫If (x)w(x) −

n∑

i=0wif (xi) = ∫I

(f (x) − p(x))w(x)dx.

Integrando la fórmula del error de interpolación

f (x) − p(x) = [x0, x0,… , xn, xn, x]fn

i=0(x − xi)2.

obtenemos

R[f ] = ∫I[x0, x0,… , xn, xn, x]f

n∏

i=0(x − xi)2w(x)dx.

Si f ∈ C2n+2(I), entonces [x0, x0,… , xn, xn, x]f es una función continua dex. Teniendo en cuenta que

∏ni=0(x − xi)2w(x) es una función no negativa con

integral positiva, podemos aplicar el primer teorema del valor medio del cálculointegral para deducir que existe c ∈ I tal que

R[f ] = [x0, x0,… , xn, xn, c]f ∫I

n∏

i=0(x − xi)2w(x)dx.

295

Page 296: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

y, aplicando el Teorema del valor medio de Lagrange generalizado, se obtiene

R[f ] =f (2n+2)(�)(2n + 2)! ∫I

n∏

i=0(x − xi)2w(x)dx.

Finalmente observamos que

∫I

n∏

i=0(x − xi)2w(x)dx = ‖pn+1‖

2 = 1coeff(qn+1(x), xn+1)2

.

Fórmulas de Gauss-LobattoA menudo algunos nodos están prefijados y otros pueden elegirse. Una elec-

ción de los nodos libres que haga que!n+1(x) = (x−x0)⋯ (x−xn) sea ortogonalal espacio de polinomios de mayor grado posible Pk puede dar lugar a fórmulasque presentan cierta similitud a las gaussianas. Las fórmulas de Gauss-Lobattoson las que alcanzan mayor grado de precisión entre aquellas que usan comonodos los extremos del intervalo de integración I = [a, b].

Teorema 9.8. Seaw una función peso continua en (a, b), no negativa, integrabley no idénticamente nula. Dados x0 = a y xn = b, existen x1,… , xn−1 en (a, b) ypesos w0,… , wn positivos tales que la fórmula de cuadratura

b

af (x)w(x)dx =

n∑

i=0wif (xi) + R[f ],

alcanza el máximo grado de precisión posible 2n − 1. Además las únicas fór-mulas que alcanzan grado de precisión 2n−1 son aquellas fórmulas de tipo in-terpolatorio cuyos nodos son los ceros del polinomio ortogonal de grado n−1,respecto de la función peso w(x) ∶= w(x)(x − a)(b − x).

Demostración. Veamos que una fórmula con nodos x0,… , xn, donde x0 = a yxn = b, no puede ser exacta en P2n. Sea

p(x) ∶= (x − a)(b − x)(x − x1)2⋯ (x − xn−1)2 ∈ P2n.

Por construcción, p se anula en todos los nodos y∑n

i=0wip(xi) = 0. Como p esun polinomio no negativo, se deduce del Lema ?? que ∫ b

a p(x)w(x)dx > 0. Portanto

R[p] = ∫

b

ap(x)w(x)dx −

n∑

i=0wip(xi) > 0,

296

Page 297: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

y la fórmula no es exacta para el polinomio p. Por tanto el grado de precisiónde la fórmula está bien definido y es menor que 2n.

La función w(x) = (b − x)(x − a)w(x) es una función continua en (a, b)no negativa e integrable y puede utilizarse como función peso de un productoescalar, dando lugar a una sucesión de polinomios ortogonales

p0, p1,… , pn,…

con coeficiente director unitario, diferentes de los polinomios ortogonales res-pecto al peso w(x). Sean x1,… , xn−1 los ceros de pn−1, de modo que pn−1(x) =(x− x1)⋯ (x− xn−1). Por el Teorema ??, x1,… , xn−1 son reales, distintos y seencuentran en el intervalo abierto (a, b). Veamos que la fórmula de tipo inter-polatorio

b

af (x)w(x)dx =

n∑

i=0wif (xi) + R[f ],

basada en los nodos a = x0 < x1 < ⋯ < xn−1 < xn = b tiene grado de precisión2n − 1. Por la ortogonalidad de pn−1 respecto a la función peso w, tenemos

b

a!n+1(x)q(x)w(x)dx = −∫

b

apn−1(x)q(x)w(x)dx = 0, ∀q ∈ Pn−2,

donde

!n+1(x) = (x − x0)⋯ (x − xn) = −(x − a)(b − x)pn−1(x).

Por el Teorema ??, la fórmula de tipo interpolatorio basada en los nodos a =x0 < x1 < ⋯ < xn−1 < xn = b es exacta en P2n−1 y, como no puede ser exactaen P2n, el grado de precisión será 2n − 1.

Recíprocamente, si una regla de cuadratura basada en los nodos a = x0 <x1 < ⋯ < xn−1 < xn = b alcanza el mayor grado de precisión posible 2n −1, deducimos del Teorema ?? que la fórmula es de tipo interpolatorio y que!n+1(x) = (x − x0)⋯ (x − xn) es ortogonal a Pn−2. Entonces

b

a(x − x1)⋯ (x − xn−1)q(x)w(x)dx = −∫

b

a!n+1(x)q(x)w(x)dx = 0,

para todo q ∈ Pn−2, lo que implica que (x− x1)⋯ (x− xn−1) coincide con pn−1,el polinomio ortogonal de grado n − 1 respecto a la función peso w(x). Comolos pesos de una fórmula de tipo interpolatorio están determinados, deducimosla unicidad de la fórmula de Gauss-Lobatto.

297

Page 298: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

La positividad de los pesos se deduce construyendo polinomios no negativosenP2n−1 cuyos valores en los nodos coincidan con los polinomios fundamentalesde Lagrange. Aplicando el Lema ?? tendremos

w0 = ∫

b

a

(x − x1)2⋯ (x − xn−1)2(b − x)(x1 − a)2⋯ (xn−1 − a)2(b − a)

w(x)dx > 0,

wi = ∫

b

a

(x − a)(b − x)∏

j∈{0,…,n}⧵{i}(x − xj)2

(xi − a)(b − xi)∏

j∈{0,…,n}⧵{i}(xi − xj)2w(x)dx > 0, 0 < i < n,

wn = ∫

b

a

(x − a)(x − x1)2⋯ (x − xn−1)2

(b − a)(b − x1)2⋯ (b − xn−1)2w(x)dx > 0.

Análogamente a las fórmulas de cuadratura gaussiana se deduce la siguientefórmula del error

R[f ] = −f (2n)(�)(2n)! ∫

b

a

n−1∏

i=1(x − xi)2 (x − a)(b − x)w(x)dx.

En el caso de w(x) = 1, x ∈ [−1, 1], tenemos que los nodos interiores dela fórmula de Gauss-Lobatto x1,… , xn−1 son los ceros del polinomio de JacobiP (1,1)n−1 , que es el polinomio ortogonal de grado n−1, respecto de la función peso

w(x) = 1 − x2, x ∈ [−1, 1].En este caso los polinomios de Jacobi P (1,1)

n−1 pueden expresarse en términosde los polinomios de Legendre. Teniendo en cuenta que Pn−1 y Pn+1 toman elmismo valor en x = −1 y x = 1, se puede deducir que x2−1 divide a Pn+1(x)−Pn−1(x) y es ortogonal a todos los polinomios de grado menor o igual que n−2.Por tanto, el polinomio (x2 − 1)P (1,1)

n−1 (x) es proporcional a Pn+1(x) − Pn−1(x).Teniendo en cuenta que P ′

n(1) = n(n + 1)∕2, para todo n ≥ 0, deducimos que

lımx→1

2x2 − 1

(Pn+1(x) − Pn−1(x)) = P ′n+1(1) − P ′

n−1(1) = 2n + 1.

La condición de normalización de los polinomios de Jacobi P (1,1)n−1 (1) = n nos

permite deducir que

(x2 − 1)P (1,1)n−1 (x) =

2n2n + 1

(Pn+1(x) − Pn−1(x)).

Por tanto, los nodos de la fórmula de Gauss-Lobatto son los ceros del polinomioPn+1(x) − Pn−1(x). Utilizando la relación de recurrencia a 3 términos de los

298

Page 299: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

polinomios de Legendre (8.2), obtenemos la fórmula alternativa

P (1,1)n−1 (x) =

2nn + 1

Pn−1(x) − xPn(x)1 − x2

.

Veamos ahora que los nodos interiores de la fórmula de Gauss-Lobatto coin-ciden con los ceros de P ′

n(x), la derivada del n-ésimo polinomio de Legendre.Integrando por partes obtenemos

1

−1P ′n(x)(x

2 − 1)q(x)dx = −∫

1

−1Pn(x)(2xq(x) + (x2 − 1)q′(x))dx = 0

para todo q ∈ Pn−2, de donde deducimos que P ′n(x) es proporcional a P (1,1)

n−1 (x)y como P ′

n(1) = n(n + 1)∕2, tenemos que

P ′n(x) =

n + 12

P (1,1)n (x) =

n(Pn−1(x) − xPn(x))1 − x2

. (9.2)

Por tanto, los nodos interiores de la fórmula de Gauss-Lobatto son precisamen-te los lugares en los que Pn alcanza sus extremos relativos. Por el Teorema deRolle, entre dos nodos de la fórmula de Gauss-Legendre con n nodos, siem-pre tenemos exactamente un nodo interior de la fórmula de Gauss-Lobatto den + 1 nodos. Recíprocamente vemos que entre cada dos nodos de la fórmulade Gauss-Lobatto de n + 1 nodos se encuentra exactamente un nodo de la fór-mula de Gauss-Legendre. Esta propiedad puede ser útil para localizar y estimarnuméricamente los nodos de las fórmulas de Gauss-Lobatto.

Cálculo eficiente de los nodos y pesos de una fórmula gaussianaQueremos obtener una expresión de los pesos de la fórmula de cuadratura

de Gauss-Legendre en términos de los nodos. Teniendo en cuenta que

‖Pn‖ =√

22n + 1

,

tenemos que los polinomios de Legendre con norma unitaria son

qn(x) =√

2n + 12

Pn,

y la función de Christoffel es

�n(x) =1

∑nj=0 qj(x)2

= 2∑n

j=0(2j + 1)Pj(x)2.

299

Page 300: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Sea xi el i-ésimo cero de Pn+1(x), entonces

wi = �n(xi) =2

∑nj=0(2j + 1)Pj(xi)2

.

El cálculo requiere evaluar todos los polinomios de Legendre en xi. Pero siutilizamos la fórmula de Christoffel-Darboux, teniendo en cuenta que

�n =n + 1

(2n + 1)(2n + 3),

tendremoswi =

1�nq′n+1(xi)qn(xi)

= 2(n + 1)P ′

n+1(xi)Pn(xi).

Utilizando la identidad (9.2)

P ′n+1(x) =

n + 11 − x2

(Pn(x) − xPn+1(x))

y evaluando en x = xi, tenemos Pn+1(xi) = 0 y

(n + 1)Pn(xi) = (1 − x2i )P′n+1(xi),

de donde podemos eliminar P ′n+1(xi), obteniendo

wi =2(1 − x2i )

(n + 1)2Pn(xi)2.

Esta fórmula solamente requiere evaluar el polinomio n-ésimo de Legendre enlos nodos. También podemos eliminar Pn(xi) y expresar los pesos en términosde P ′

n+1(xi)

wi =2

(1 − x2i )P′n+1(xi)

2

y teniendo en cuenta que

P ′n+1(xi) = an+1

n∏

j≠i(xi − xj), an+1 =

(2n + 2)!2n+1(n + 1)!2

,

se deduce la siguiente expresión explícita de los pesos de la fórmula de Gauss-Legendre en términos de los nodos

wi =2

a2n+1(1 − x2i )∏

j≠i(xj − xi)2, an+1 =

(2n + 2)!2n+1(n + 1)!2

.

300

Page 301: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Con este ejemplo vemos que el cálculo de los pesos está relacionado con laevaluación eficiente de los polinomios ortogonales en los nodos. Por otro ladola determinación de los propios nodos como ceros de los polinomios ortogona-les también está ligado a la evaluación eficiente de los polinomios ortogonales.Cuando el grado crece, la evaluación de los polinomios ortogonales a través dela recurrencia a tres términos es cada vez más inestable, lo que puede incidir enla exactitud de nodos y pesos.

El algoritmo de Golub-Welsch para el cálculo de los nodos y pesos de lafórmula de Gauss-Legendre pretende evitar esta dificultad traduciendo el cálcu-lo de pesos y nodos a un problema matricial. El algoritmo puede extenderse aotros tipos de fórmulas de cuadratura gaussiana, utilizando apropiadamente larelación de recurrencia a tres términos de los polinomios ortogonales asociados.

Proposición 9.9. Sea � una medida de Borel no negativa, tal que

⟨u, v⟩ ∶= ∫Iu(x)v(x)d�(x)

define un producto escalar en Pn+1. Sea q0, q1,… , qn+1 la sucesión de polino-mios ortogonales con norma unitaria y coeficiente director positivo. Sean

�j ∶= ∫Ixqj(x)2d�(x), j = 0,… , n + 1,

�j ∶= ∫Ixqj(x)qj+1(x)d�(x), j = 0,… , n.

La matriz tridiagonal simétrica

Tn+1 =

�0 �0 0 ⋯ 0

�0 �1 �1 ⋱ 0

0 �1 ⋱ ⋱ 0

⋮ 0 ⋱ �n−1 �n−10 ⋯ 0 �n−1 �n

tiene n + 1 valores propios reales distintos x0 < x1 < ⋯ < xn en (−1, 1), quecoinciden con los ceros del polinomio ortogonal qn+1. El vector propio asociadoa xj , normalizado para que su primera componente sea q0, es

(q0(xj),… , qn(xj))T .

301

Page 302: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

Demostración. Las relaciones de recurrencia

(x − �0)q0 = �0q1(x),(x − �j)qj(x) = �jqj+1(x) + �j−1qj−1(x), j = 1,… , n,

pueden expresarse matricialmente en la forma

x

q0(x)

qn−1(x)

qn(x)

= Tn+1

q0(x)

qn−1(x)

qn(x)

+ �n

0

0

qn+1(x)

.

Sean x0,… , xn los ceros de qn+1. La fórmula anterior nos permite deducir quexj es un valor propio de Tn+1 y que (q0(xj),… , qn(xj)) es el vector propio co-rrespondiente. Como una matriz (n+ 1) × (n+ 1) tiene a lo sumo n+ 1 valorespropios distintos, se deduce que los valores propios de Tn+1 coinciden con losceros de qn+1.

En el siguiente resultado mostramos la relación entre los vectores propiosnormalizados y los números de Christoffel.

Proposición 9.10. La matriz

Qn+1 ∶=( qi(xj)√

∑ni=0 qi(xj)2

)

i,j=0,…,n,

es una matriz ortogonal cuyas columnas son los vectores propios de Tn+1 nor-malizados y con primera componente positiva. El número de Christoffel

�(xj) ∶=1

∑nj=0 qi(xj)2

,

coincide con el cuadrado del primer elemento del vector propio normalizadocorrespondiente al valor propio xj , multiplicado por q−20 = ∫I d�(x) = �(I).

Demostración. Como la matriz Tn+1 es simétrica, los vectores propios asocia-dos a valores propios distintos son ortogonales. Por la definición de la matrizQn+1, sus columnas son los vectores propios normalizados, lo que demuestra

302

Page 303: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

que la matriz Qn+1 es una matriz ortogonal. Los elementos de la primera filaelevados al cuadrado son

q20∑n

i=0 qi(xj)2= q20�(xj), j = 0,… , n.

Consideremos reglas de cuadraturas gaussianas asociadas a una función pe-so w. Hemos visto anteriormente que pesos de la regla de cuadratura gaus-siana son los números de Christoffel. Utilizando los resultados anteriores cond� = w(x)dx, podemos obtener una demostración alternativa de este hecho.

En efecto, las condiciones de exactitud en Pn dan lugar an∑

j=0wjqi(xj) = ∫I

qi(x)w(x)dx =�i0q0

, i = 0,… , n.

Por tanto el vector de pesos es la solución del sistema de ecuaciones

M( q0,… , qnx0,… , xn

)T

w0

w1

wn

=

1∕q00

0

,

donde

M( q0,… , qnx0,… , xn

)

=

q0(x0) ⋯ qn(x0)

⋮ ⋱ ⋮

q0(xn) ⋯ qn(xn)

es la matriz de colocación de los polinomios ortogonales con norma unitariaq0,… , qn en los ceros del polinomio ortogonal qn+1. Por tanto, el vector de pesos(w0,… , wn)T es la primera columna de la inversa de M

( q0,…,qnx0,…,xn

)T dividida parala constante q0.

La matriz Qn+1 es la matriz que se obtiene al normalizar cada columna de

M(

q0,…,qnx0,…,xn

)T, es decir

Qn+1 = M( q0,… , qnx0,… , xn

)TD

303

Page 304: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

con

D = diag

(

1√

∑ni=0 qi(x0)2

,… , 1√

∑ni=0 qi(xn)2

)

.

Debido a la ortogonalidad de la matriz Qn+1 deducimos que(

M( q0,… , qnx0,… , xn

)T)−1= DQT

n+1.

Los pesos son los elementos de la primera columna de esta matriz divididospara el factor q0, es decir,

w0

wn

= 1q0D

q0√

∑ni=0 qi(x0)2

⋮q0

∑ni=0 qi(xn)2

=

1∑n

i=0 qi(x0)2

⋮1

∑ni=0 qi(xn)2

=

�(x0)

�(xn)

,

lo que confirma matricialmente que los pesos coinciden con los números deChristoffel.

Como la matriz Tn+1 es tridiagonal simétrica podemos aplicar la mayoría demétodos usuales para el cálculo de valores y vectores propios. Además los algo-ritmos más generales como el método QR admiten una formulación simplificadagracias a la simetría y la estructura de banda. Los nodos de la regla de cuadra-tura gaussiana son los valores propios de Tn+1 y los pesos son los cuadrados delas primeras componentes de los vectores propios normalizados, multiplicadaspor el factor q−20 .

Describamos ahora el algoritmo de Golub-Welsch para el cálculo de los pe-sos y nodos de la fórmula de cuadratura de Gauss-Legendre. Sean

qn(x) =√

2n + 12

Pn(x), n ≥ 0,

los polinomios de Legendre de norma unitaria. Tenemos que �n−1 = 0, �n−1 =n(4n2−1)−1∕2, n ≥ 1, y q0 = 1∕

2. La matriz tridiagonal simétrica Tn+1 adopta

304

Page 305: Análisis Numéricopcmap.unizar.es/~carni/AnalisisNumerico2.pdf · 2021. 3. 10. · Análisis Numérico por Jesús Carnicer Álvarez, Departamento de Matemática Aplicada, Universidad

la forma

Tn+1 =

0 1√

30 ⋯ 0

1√

30 2

15⋱ 0

0 2√

15⋱ ⋱ 0

⋮ 0 ⋱ 0 n√

4n2−1

0 ⋯ 0 n√

4n2−10

.

Los valores propios de Tn+1 son los nodos de la regla de cuadratura gaussianay los pesos correspondientes el doble de los cuadrados de las primeras compo-nentes de los vectores propios normalizados.

305