24
1 Q-4043 Análisis Numérico Agosto 2010 Errores. El concepto de error (o incertidumbre) se refiere a la diferencia entre el valor obtenido en una medida y el valor supuesto correcto. En muchas ocasiones, el valor correcto no se conoce (o no se puede conocer) exactamente. Lo que se puede estimar es la porción de una medida numérica en la cual tenemos confianza. Todos los decimales después de esta porción se consideran más y más dudosos hasta que se vuelven irrelevantes. Este tipo de error puede ser más o menos constante, y se llama error sistemático, o puede fluctuar al azar, en este caso se llama aleatorio. Además de este efecto, hay errores que resultan simplemente de la ausencia de dígitos conocidos después de una cierta posición. Un voltímetro digital, por ejemplo, podría indicar 1.224 V. Cualquier dígito después del 4 se desconoce completamente. Muy similar es la digitalización que el observador aplica a una medida. El hecho de retener solamente un número de dígitos al leer la escala de un termómetro, genera automáticamente la incertidumbre sobre todos los dígitos siguientes. Toda medida o lectura tomada en el laboratorio tiene un error o incertidumbre. Llámese x a lo que se esté midiendo y )x al error de esa medida. Ese error lo determina el observador al hacer la lectura. El observador debe tomar en consideración la escala, pantalla o registro que se esté leyendo, al igual que su apreciación de la precisión de la lectura. La lectura de una escala deberá hacerse a una cifra significativa más allá de la división más pequeña marcada en la escala. La incertidumbre de la lectura es adjudicada por el observador y afectará solamente el último dígito de la lectura. Ejemplo: se va a determinar la temperatura de un líquido con un termómetro. Ese termómetro tiene una escala cuyas marcas la dividen en grados centígrados, (Fig. 1). El observador nota que la columna de mercurio del termómetro pasa de la marca de 25 °C pero no llega hasta 26 °C. Para determinar la temperatura a un sitio decimal el observador divide (en su mente) el intervalo 25°C - 26 °C en cinco partes iguales y estima el alcance de la columna de mercurio. El observador anota en su libreta (25.4 ± 0.2) °C. La incertidumbre (± 0.2 °C) es el límite de la discernibilidad de la vista de ese observador. Otra persona, con mejor visión quizás, escribió (25.4 ± 0.1) NC porque ella, en su mente, dividió el intervalo en diez partes iguales. En ambos casos la incertidumbre fue una evaluación discrecional (pero honrada) de cada observador. Los dos observadores están correctos. Fig. 1 Sección de un termómetro con una escala en la cual las divisiones más pequeñas son de 1°C. La lectura deberá hacerse a una décima de grado. Cuando una medida se lleva a cabo repetidas veces, bajo las mismas condiciones, es deseable usar

analisis numerico

Embed Size (px)

DESCRIPTION

mathematics

Citation preview

  • 1Q-4043 Anlisis Numrico Agosto 2010

    Errores.

    El concepto de error (o incertidumbre) se refiere a la diferencia entre el valor obtenido en una mediday el valor supuesto correcto. En muchas ocasiones, el valor correcto no se conoce (o no se puedeconocer) exactamente. Lo que se puede estimar es la porcin de una medida numrica en la cualtenemos confianza. Todos los decimales despus de esta porcin se consideran ms y ms dudososhasta que se vuelven irrelevantes. Este tipo de error puede ser ms o menos constante, y se llamaerror sistemtico, o puede fluctuar al azar, en este caso se llama aleatorio. Adems de este efecto,hay errores que resultan simplemente de la ausencia de dgitos conocidos despus de una ciertaposicin. Un voltmetro digital, por ejemplo, podra indicar 1.224 V. Cualquier dgito despus del 4se desconoce completamente. Muy similar es la digitalizacin que el observador aplica a una medida.El hecho de retener solamente un nmero de dgitos al leer la escala de un termmetro, generaautomticamente la incertidumbre sobre todos los dgitos siguientes.

    Toda medida o lectura tomada en el laboratorio tiene un error o incertidumbre. Llmese x alo que se est midiendo y )x al error de esa medida. Ese error lo determina el observador al hacerla lectura. El observador debe tomar en consideracin la escala, pantalla o registro que se estleyendo, al igual que su apreciacin de la precisin de la lectura. La lectura de una escala deberhacerse a una cifra significativa ms all de la divisin ms pequea marcada en la escala. Laincertidumbre de la lectura es adjudicada por el observador y afectar solamente el ltimo dgito dela lectura. Ejemplo: se va a determinar la temperatura de un lquido con un termmetro. Esetermmetro tiene una escala cuyas marcas la dividen en grados centgrados, (Fig. 1). El observadornota que la columna de mercurio del termmetro pasa de la marca de 25 C pero no llega hasta 26C. Para determinar la temperatura a un sitio decimal el observador divide (en su mente) el intervalo25C - 26 C en cinco partes iguales y estima el alcance de la columna de mercurio. El observadoranota en su libreta (25.4 0.2) C. La incertidumbre ( 0.2 C) es el lmite de la discernibilidad dela vista de ese observador. Otra persona, con mejor visin quizs, escribi (25.4 0.1) NC porqueella, en su mente, dividi el intervalo en diez partes iguales. En ambos casos la incertidumbre fue unaevaluacin discrecional (pero honrada) de cada observador. Los dos observadores estn correctos.

    Fig. 1 Seccin de un termmetro con una escala en la cual las divisiones ms pequeas son de 1C.La lectura deber hacerse a una dcima de grado.

    Cuando una medida se lleva a cabo repetidas veces, bajo las mismas condiciones, es deseable usar

  • 2(1)

    (2)

    (4)

    (5)

    el promedio de las lecturas. Ese promedio tambin tendr su error. Se indica el promedio con unai ibarra sobre la cantidad promediada. Sea x el valor de la isima lectura y )x el error. El promedio,

    o media aritmtica, de n lecturas de la variable x est definido por la relacin (1).

    El error asociado con ese promedio se estima con la desviacin estndar F .

    i iEn la relacin (2), d es la desviacin, la diferencia entre el valor de la lectura x y el promedio. Enqumica se utilizan valores publicados en la literatura, bien sea R (la constante del gas ideal), h (laconstante de Planck), la densidad de agua a una temperatura especfica, o cualquier otro dato. Losdatos obtenidos de la literatura no son necesariamente exactos, aunque pueden tener una altsimaprecisin. Esos datos se usan para llevar a cabo clculos, junto a cantidades que se han medido enel laboratorio. Por ejemplo: supongamos que se desea calcular la masa molar de un gas cuya densidadse determin a una temperatura y presin conocida. La frmula es:

    (3)

    En el laboratorio se ha obtenido D,T y P con sus respectivas incertidumbres. El valor de R en (3) NOes exacto a pesar de que se le llama "la constante del gas ideal". El valor de R que se encuentra enla literatura tiene su error y a veces ese error es especificado. En una publicacin de la dcada del 80aparece(1)

    Este valor de R tiene una gran precisin (42 partes en 82,056,235) y lo ms probable es que nointroduzca error alguno en el clculo de M, si es que D, T y P tienen incertidumbres mucho msgrandes. An as, se nota que )R 0. En algunas publicaciones el valor de esas cantidades que senecesitan para hacer clculos aparecen sin incertidumbres. Eso no quiere decir que la incertidumbresea cero. La densidad de agua a 25.0C y 1 atmsfera es 0.997044 gm/cm , de acuerdo al3"Handbook". No aparece el error de ese nmero explcitamente. Por convencin se le adjudica unaincertidumbre de una unidad en el ltimo dgito escrito. Se puede escribir,

  • 3(6)

    (7)

    Regla 1. A cualquier valor (de la literatura o en un informe) que no tenga el error explcitamentedado, se le adjudicar una incertidumbre de una unidad en la ltima cifra escrita.

    Regla 2. A cualquier lectura hecha con un instrumento que tenga un registro digital, se le asignaruna incertidumbre de una unidad en el ltimo dgito del registro.

    Sin embargo, hay ciertos nmeros (sin unidades) que son exactos y tienen incertidumbres de cero.Ejemplos son: , B, e, etc. Estos nmeros aparecen en las expresiones de energa cintica (mv ),2el rea de un crculo (Br ), en la ecuacin de Arrhenius y en otros lugares. Sin embargo, si el usuario2emplea solamente un nmero limitado de dgitos, por ejemplo 3.14159, la incertidumbre apareceautomaticamente despus de la ltima cifra considerada.

    Propagacin de errores

    En la gran mayora de los clculos en qumica se necesita determinar una cantidad que NO se puedemedir directamente. Por ejemplo, se desea determinar la energa cintica (E.C.) a partir de la masam y la velocidad v. Estas cantidades tienen errores de )m y )v, respectivamente. La energa cinticaes una funcin de dos variables (m y v) y se desea saber la incertidumbre en E.C. debido a los erroresen m y v. Parece razonable creer que mientras mayores sean los errores en m y v mayor ser el erroren E.C. De hecho, as es, y se dice que el error de las variables independientes se propaga (searrastra) hasta causar un error en la determinacin final (la variable dependiente). Si los errores enlas variables independientes son grandes, stos pueden causar que la determinacin final seaprcticamente inservible. Para determinar el error de la variable dependiente, causado por los erroresde las variables independientes, se usan resultados de clculo elemental. Sea f(x,y,z,...) una funcinde las variables independientes x,y,z,...etc. En el laboratorio (o de la literatura) se obtuvieron losvalores de las variables independientes con las respectivas incertidumbres. Por lo tanto, se conocenx )x, y )y, z )z, etc. Se desea buscar el error en la funcin. Sea ese error )f. La diferencialtotal de la funcin es

    Pasando de infinitesimales a diferencias finitas se obtiene,

    La expresin (7) dice que el error en la funcin, )f, es la suma de errores. Cada trmino en la sumaes un producto de la derivada de la funcin y una incertidumbre. La derivada de la funcin nos dicecmo est cambiando la funcin, con respecto a pequeos cambios en la variable independiente. Almultiplicar la derivada de la funcin por la incertidumbre de la variable independiente, se obtiene lacontribucin a )f de esa variable independiente. Ahora, las incertidumbres pueden ser positivas o

  • 4(8)

    (9)

    (10)

    (11)

    negativas. Si se deja la expresin (7) como est, puede ocurrir una cancelacin fortuita de lostrminos de la derecha en la expresin (7). Eso podra dar un valor de )f muy bajo, o cero. Desuceder esa cancelacin fortuita, no quiere decir que )f sea realmente pequea. Para evitar lacancelacin fortuita de los trminos en (7) se ponen barras de valor absoluto a la derecha e izquierdade cada trmino. Se reescribe (7) como sigue

    En la relacin (8) todos los trminos en la suma sern positivos. Las barras de valor absolutoaseguran que la incertidumbre )f sea el valor ms alto (el mximo). Se le llama al )f, definido por(8), el error mximo propagado y se abrevia como )f(EMP). Cuando la funcin f(x,y,z,...) es unafuncin de 2 ms variables se debe tomar en cuenta que las incertidumbres )x, )y, )z, etc.,ocurren con igual probabilidad con signos negativos y positivos. Esto es en realidad una suposicin:se supone tcitamente que los errores son aleatorios (al azar o estocsticos). Esto quiere decir quelos errores NO son sistemticos. Como resultado de esta cancelacin, la relacin (8) sobreestima.Qu se puede hacer? Cudrese ambos lados de (7). El resultado es

    En la expresin (9) hay trminos al cuadrado. Esos trminos sern positivos. Los trminos cruzados(mixtos) pueden ser positivos o negativos. Si las incertidumbres son aleatorias, habr tantos trminoscruzados con valores positivos como negativos. Esos trminos cruzados, por lo tanto, cancelarn.Los trminos cuadrados, al ser positivos, no cancelan. Se ignoran los trminos cruzados. Se obtienede (9)

    Se toma la raz cuadrada de ambos lados de (10) para obtener la expresin que aplica cuando lafuncin f(x,y,z...) depende de tres o ms variables independientes.

    La expresin en (11) se le llama el error ms probable propagado y se abrevia a )f(EMPP).Ntese que , necesariamente, para cualquier funcin (1,2,3, ms variables)

  • 5 (12)

    .

    REGLA 3. Se usar )f(EMPP) para todos los casos.

    Grficas y barras de error

    Es comn en el laboratorio obtener una tabla de valores como el resultado de un experimento.Ejemplo: si se mide el voltaje de una celda galvnica como funcin de la temperatura, el voltaje sepuede considerar como la variable dependiente y la temperatura como la variable independiente. Lamedicin del voltaje no es exacta, no importa cul potencimetro se use. Tampoco lo es la medicinde la temperatura. La tabla de valores de voltaje versus temperatura debe incluir, no solamente laslecturas individuales, sino los errores de cada medida. Para el caso general, se obtiene una tabla devalores de y(variable dependiente) versus x(variable independiente). Cada valor de x tiene su propia

    i iincertidumbre y cada valor de y tiene su propia incertidumbre tambin. El punto i se designa: x )x ,i iy )y . Se desea una grfica de los datos experimentales para ver el comportamiento de y versus

    x. Una grfica es una representacin visual (dibujo) de una funcin. Cada medida tiene su propiai iincertidumbre que debe incluirse en la grfica. Esto es as, ya que si la lectura es x )x , se entiende

    i i i i ique el valor de x cay entre x - )x y x + )x con una alta probabilidad. Por lo tanto, el dibujo deila funcin debe reflejar el alcance del valor de x en cada punto. Eso se logra dibujando una lnea

    i i ihorizontal de largo )x a la derecha e izquierda del punto x . Para el punto y se usan barras verticaleside extensin )y . Vea la Fig. 2.

    i iFig. 2 Dibujo de las barras de error para el punto (x ,y ). a) Barras de error horizontales, b) Barrasde error verticales.

  • 6Cambio de variable

    Si los datos del laboratorio estn en trminos de (x,y) y se desea un cambio de variables, se debencalcular los errores en trminos de las nuevas variables. Para ese fin se usa la frmula del errormximo propagagado, )f(EMP). Un ejemplo quizs aclare la situacin. Supngase que en ellaboratorio se determin la tensin de vapor de etanol como funcin de temperatura. Se obtuvo lasiguiente tabla de valores:

    Tabla 1. Datos experimentales para la tensin de vapor de etanol. Note que se han dado lasincertidumbres de todas las lecturas.

    Medida P/mm Hg )P/mm Hg T/K )T/K

    1 128.0 0.4 311.6 0.42 171.1 0.3 318.0 0.43 271.4 0.4 330.1 0.34 358.0 0.7 335.2 0.35 560.3 0.7 346.7 0.76 656.3 0.9 348 1

    Una grfica de los valores en la Tabla 1 aparece en la Fig. 3.

    Fig. 3. Grficas de los datos de la Tabla 1. a) P versus T, b) ln P versus T-1

    Se nota en la Fig. 3a que la tensin de vapor aumenta con T y que la curvatura es bastantepronunciada. Esta curva se puede enderezar si en vez de dibujar P versus T se dibuja el logaritmo deP versus el recproco de T, Fig. 3b. Aqu hay DOS cambios de variables: a) se cambi P a ln P y

    i i ib) se cambi T a T . Para cada valor P habr un valor de ln P . Para cada incertidumbre )P habr-1

    i i iuna incertidumbre )(lnP ). Similarmente para T y T . Cmo se obtienen las incertidumbres de las-1nuevas variables? Se usa la expresin (8). Sea f(x) = ln x. De clculo elemental se sabe que

  • 7(13)

    (14)

    (15)

    (16)

    (17)

    (18)

    (19)

    Cambiando (13) a diferencias finitas y usando (8)

    iSe identifica a x con P y se escribe

    1Para P de la Tabla 1 se obtiene

    Hay varios comentarios que se deben hacer acerca del resultado obtenido en (16). En primer lugar,1 1ln P no tiene unidades y tampoco las puede tener )(ln P ). Ninguna cantidad logartmica puede tener

    unidades. En segundo lugar, ntese que se han retenido todas las cifras significativas que dio lacalculadora de mano. Obviamente no todas las cifras significativas en el clculo (16) se deben retener.De eso se hablar luego. El cambio de variable para la temperatura lo tratamos de forma similar. Seaf(x) = 1/x. De clculo

    Pasando a diferencias finitas

    1Para el punto T de la Tabla 1

  • 8(20)

    (21)

    (22)

    Con las nuevas variables (ln P y T ) se construye una nueva tabla de valores (Tabla 2).-1

    Tabla 2. Comportamiento de ln P versus T para etanol. Los valores de esta tabla fueron obtenidos-1con una calculadora de mano. No todas las cifras dadas son significativas.

    Medida ln P (1/T)/ K-1

    1 4.85203027 3.20924262 x 10-32 5.14224818 3.14465409 x 10 -33 5.60359375 3.02938504 x 10-34 5.88053299 2.98329356 x 10-35 6.32847236 2.88433804 x 10 -36 6.48661801 2.87356322 x 10-3

    Cifras significativas

    El error o incertidumbre de un valor le permite a uno indicar cuntos dgitos del valor debeninformarse. El nmero de cifras significativas del error no debe ser ms de dos. Si el error es F, oalguna otra cantidad calculada con F, la costumbre dicta que se d el error a dos cifras significativas.Si no hay suficiente informacin para calcular la desviacin estndar se usa una cifra significativa enel error. Para ilustrar estas dos situaciones imagnese que en un laboratorio se determin el valor deR muchas veces. Se obtuvo el promedio y la desviacin estndar. Se redonde la desviacin estndara dos cifras significativas y se inform

    En otro laboratorio, otra persona determin el valor de R una sla vez. Esa persona obtuvo

    Cmo se debe informar R )R en el caso (21)? El valor de R y de )R tienen las mismas unidades.Note que el valor de R tiene ms sitios decimales que la incertidumbre )R. El dgito 7 de laincertidumbre aparece en el tercer sitio decimal. Si )R fuese sumado o restado a R, ese 7 afectarala milsima de R, o sea, el primer 4 en R. Ese primer 4 es obviamente incierto. Y el segundo 4 enR? Ese segundo 4 no vale un centavo. Hay que descartarlo, ya que el nmero antes que l ya esincierto. Se debe truncar el valor de R en (21) y se informa

  • 9(23)

    (24)

    Regla 4. Si el error )x tiene solamente una cifra significativa el valor de x ser redondeado aldgito que sea afectado por el )x.

    Cundo debe )x tener ms de una cifra significativa? Solamente cuando el nmero dedeterminaciones de x sea grande y permita un clculo confiable de la desviacin estndar. En este(2)curso no se harn suficientes medidas para justificar asignarle ms de UNA cifra significativa al error.Por lo tanto, en este curso:

    Regla 5. Todas las incertidumbres sern redondeadas a una cifra significativa.

    Imagnese que se llevan a cabo 6 mediciones de una distancia, la variable x. Se obtuvo el promedioy la desviacin estndar. Digamos que tenemos

    Qu se informa? Ya que no se hicieron suficientes medidas para justificar asignarle dos cifrassignificativas a la desviacin estndar, se redondea la desviacin estndar a una cifra significativa. Seobtiene F = 0.002 cm. Se usa este nmero para truncar el valor de 6x. Se eliminan todos los nmerosdespus del 7 para lograr 6x = 8.397 cm. Se informa

    Al aplicar las reglas 4 y 5 a los valores de la Tabla 2, se obtiene la Tabla 3. Las incertidumbres queaparecen en la Tabla 3 son las barras de error que se deben dibujar cuando se dibuja ln P versus 1/T.Si las barras de error son muy pequeas para poderse dibujar en la grfica, mencinelo claramenteen algn lugar del informe.

    Tabla 3. Comportamiento de ln P vs T para etanol. Note que todas las incertidumbres han sido-1redondeadas a UNA cifra significativa. Los valores de ln P y de T han sido debidamente-1truncados. Estos valores fueron usados para la grfica en la Fig. 3b.

    Medida ln P )(ln P) 10 (1/T)/K 10 )(1/T)/K3 -1 6 -1

    1 4.852 0.003 3.209 42 5.142 0.002 3.144 43 5.603 0.001 3.029 34 5.880 0.002 2.983 35 6.328 0.001 2.884 66 6.486 0.001 2.873 8

    Pueden surgir ocasiones en que la desviacin estndar de un nmero reducido de medidas seaMENOR que la incertidumbre del instrumento usado en las mediciones. En ese caso la incertidumbrea usarse con el promedio de las medidas es la incertidumbre del instrumento. Ahora, si el nmero de

  • 10

    (25)

    (26)

    (27)

    (28)

    medidas es grande, entonces la desviacin estndar toma precedencia sobre la incertidumbre delinstrumento.

    Cuadrados mnimos o regresin lineal

    Casi todas las funciones que se usan en qumica son analticas. Esto es, son funciones continuas,univaluadas, con derivadas continuas, etc. Esas funciones tambin pueden expresarse como seriesinfinitas (serie de Taylor).

    Si a = 0, se obtiene la serie de Maclaurin.

    La relacin (26) se puede escribir como un polinomio en x

    Bajo ciertas condiciones exigentes la serie (27) puede ser truncada en el ensimo trmino,incurrindose en un error estimable a base del primer trmino descartado. Esto equivale a aproximarla funcin con polinomio de grado (n - 1).

    o 1 n-1Si se conocen los valores de los n coeficientes a , a , ..., a en este polinomio, la funcin f(x) se1 2puede evaluar para valores de x , x ,..., etc. Esto convierte a la funcin en una tabla de valores: Por

    i icada x hay un valor de f(x ). En el laboratorio, sin embargo, muchas veces se obtiene la tabla devalores, pero no se conoce la funcin. El problema es buscar f(x), si lo que se tiene es una tabla devalores para empezar. Se desea obtener una funcin que pase por los puntos experimentales lo mscerca posible. Si se acepta que los datos experimentales pueden ser expresados por un polinomio

    icomo (28), entonces el problema se reduce a buscar los n coeficientes a . En la Tabla 4 aparecen losdatos de un experimento.

  • 11

    (29)

    (30)

    Tabla 4. Resultados de un experimento en el cual se hicieron n medidas de y versus x.

    i i i iMedida y )y x )x

    1 1 1 1 1 y )y x )x2 2 2 2 2 y )y x )x3 3 3 3 3 y )y x )x

    . . . . . . . . . .

    n n n n n y )y x )x

    Uno desea representar esa tabla de valores con alguna funcin algebraica (analtica). Se desea lamejor funcin, que pase lo ms cerca posible de todos los valores experimentales. Hay numerosasformas de lograr ese objetivo. Se tratarn solamente 2 casos: la lnea recta y un polinomio de grado2. La extensin del tratamiento a un polinomio de grado n aparece en la literatura. En la literaturatambin se encuentra cmo representar una tabla de valores por funciones que no sean polinomios.(3)Antes de comenzar a hacer clculos uno debe llevar a grfica los valores obtenidos en el laboratorio.Uno examina la grfica para ver qu tipo de representacin se desea. Si uno nota que los puntosexperimentales demuestran linearidad, entonces quizs una lnea recta es la representacin apropiada.Si uno nota alguna curvatura, se puede intentar la representacin por un polinomio, del grado queuno desee. A veces la grfica dibujada demuestra un reguero de puntos sin ton ni son (dispersin).Cuando hay mucha dispersin (scatter) bien puede ser que los datos experimentales deban serdescartados totalmente. En ese caso, se debe repetir el experimento. Se supone que los datos de laTabla 4 no demuestran gran dispersin.

    Caso 1. Lnea recta

    Despus de dibujar la grfica se nota que los puntos experimentales dan una recta, o algo parecido(ya que las barras de error deben ser incluidas en nuestro escrutinio visual). La funcin (28) para unalnea recta consta de dos trminos solamente.

    1 0En la expresin (29) a es la pendiente y a es el intercepto. La forma usual de expresar la funcinen (29) es

    En la ecuacin (30) la pendiente m y el intercepto b son las desconocidas. Se desea la mejorpendiente y el mejor intercepto, tal que la lnea recta (30) pase lo ms cerca posible de todos lospuntos experimentales simultneamente. La distancia vertical de la mejor lnea recta (30) al punto

    i iexperimental (x ,y ) est dada por la cantidad llamada residuo (tambin se le llama desviacin). El

  • 12

    (31)

    (32)

    iresiduo r est definido por

    Para entender lo que es el residuo refirase a la Fig. 4. En esa grfica las barras de error no han sidoincluidas para simplificar el dibujo.

    Fig. 4. Los primeros 3 puntos experimentales de la Tabla 4. Las flechas indican la distancia verticalde la mejor lnea recta a los puntos experimentales. Las barras de error han sido omitidas.

    Cada punto experimental tiene su residuo. Los valores de los residuos pueden ser positivos onegativos, dependiendo de si el punto experimental est por debajo o por encima de la mejor recta.

    iSe desea que r sea lo menor posible para todos los puntos simultneamente. Parece razonable sumaritodos los r y hacer esa suma un mnimo. Pensndolo bien, sin embargo, esa no es la forma correcta

    de buscar la mejor lnea. Si se suman los residuos, stos pueden cancelarse fortuitamente, ya que ellosipueden ser positivos o negativos. Individualmente los r podran ser grandes y la suma dar cero. La

    isuma de los r no debe dar cero a menos que todos los puntos experimentales caigan exactamente eniuna lnea recta. Para evitar la cancelacin fortuita se toma el cuadrado de cada r y se suman todos

    ilos r . Se define esa suma de los cuadrados de los residuos con la letra S.(4)

    Para que la lnea recta pase lo ms cerca de todos los puntos la suma S debe ser lo ms pequeaiposible. Ahora, el valor de y (mejor recta) no se conoce, ya que todava no hemos determinado m

    ini b. Est claro que el valor de x que aparece en la expresin de la mejor recta es idntico al valoridel x de los puntos experimentales. Esto se debe a que el residuo es la distancia vertical de la mejor

    i irecta al punto experimental. Son los y (mejor recta) los que difieren de los y (experimental). Por

  • 13

    (33)

    (34)

    (35)

    (36)

    (37)

    (38)

    lo tanto, se puede escribir

    Se sustituye (33) en (31) para obtener

    i iEn (34) se ha omitido la designacin (experimental) ya que los valores de x y de y son los valoresde la Tabla 4. La pendiente m y el intercepto b son las desconocidas. De (34) y (32) se obtiene

    Como S depende de dos variables se escribe S(m,b). Las condiciones necesarias para que S(m,b)tenga un mnimo son

    De esas dos condiciones se obtienen dos ecuaciones simultneas

    Se obtiene de (37)

  • 14

    (39)

    (40)

    (41)

    En las expresiones (38) las desconocidas son m y b. Las sumas en (38) se pueden obtener de la Tabla4. Para la solucin de las dos ecuaciones simultneas en (38) empleamos la regla de Cramer yobtenemos

    Los resultados (39) han sido obtenidos con dos suposiciones tcitas: a) la mejor recta es aquella parala cual S(m,b) es un mnimo, b) la variable independiente x fue medida exactamente. La primerasuposicin es debatible, pero est apoyada por extensas investigaciones estadsticas basadas en la Leyde Errores de Gauss. La segunda suposicin es una enorme caballada y se eliminar ms tarde. Porqu es esa segunda suposicin una barbarie? Porque los valores de x tienen incertidumbres. No son

    i iexactos. Al tomar r como la distancia vertical, se supone tcitamente que los valores de x sonexactos. Los valores de m y de b calculados con las expresiones en (39) tampoco pueden ser exactosya que los residuos no son todos cero. Las incertidumbres en la pendiente y en el intercepto estndadas por )m y )b. Los valores de )m y de )b se redondean a una cifra significativa (Regla 5).Los valores de m y de b deben ser truncados usando )m y )b como gua (Regla 4). Las relaciones(40) no son las nicas que aparecen en la literatura para el error en la pendiente y en el intercepto.

    Una manera de establecer cun bien se ajustan los valores experimentales a una lnea recta esmediante el coeficiente de correlacin, r.

  • 15

    (42)

    Un valor de r cerca de + 1 ( mayor que 0.99) quiere decir dos cosas: una excelente correlacin ypendiente positiva. Un valor de r cerca de - 1 quiere decir pendiente negativa y excelente correlacin.Qu es excelente correlacin? Excelente correlacin quiere decir que los puntos experimentales sonrepresentados muy bien por una lnea recta. El valor de *r* no puede exceder 1. Nota: aunque elcriterio de r es vlido en la mayora de las situaciones, a veces da resultados errneos. Otra forma dedecidir cun bien los datos son representados por una recta es el llamado parmetro de error o factorde error E. El factor de error representa el error fraccional de la linearidad de los puntos. Esto(5)significa que 100 E es el % de error asociado con la lnea recta calculada.Las expresiones (39), (40) y (41) auguran una enorme cantidad de trabajo numrico cuando la tabla

    de valores experimentales es extensa. Este trabajo numrico debe hacerse con computadora(ordenadores). Si estos clculos se van a hacer con calculadora de mano, el trabajo se puede agilizarconstruyendo una tabla de siete columnas (ver tabla 5) .

    Tabla 5. Tabla de trabajo para el clculo manual de m, b, )m, )b, r y E.

    i i i i i i i iMedida y x y x x y r r2 2 2

    1 1 1 1 1 1 1 1 1 y x y x x y r r2 2 2

    2 2 2 2 2 2 2 2 2 y x y x x y r r2 2 2

    3 3 3 3 3 3 3 3 3 y x y x x y r r2 2 2 . . . . . . . . . . . . . . . .

    n n n n n n n n 6 y x y x x y r r2 2 2__________________________________________________________________

    i i i i i i i iSuma Ey Ex Ey Ex Exy Er Er2 2 2 Las primeras dos columnas de la Tabla 5 son idnticas a las que aparecen en la Tabla 4. Las columnas3, 4, etc., hay que generarlas usando los valores en las primeras dos columnas. El nmero de cifras

    i isignificativas en las columnas 1 y 2 est determinado por las incertidumbres )x y )y . Para las otrascolumnas no se aplican las reglas de cifras significativas. Se deben retener todas las cifrassignificativas que d el registro de la calculadora de mano. Normalmente 8 cifras significativas suelenser suficientes. En ciertos casos, sin embargo, 8 cifras significativas no sern suficientes. En general,los valores de m y de b que se calculen con las relaciones (39) dependern del nmero de cifrassignificativas usadas en el clculo. La razn de ser de este sorprendente resultado tiene que ver con

  • 16

    (43)

    las restas que hay que hacer al usar las relaciones (39). Los nmeros que van a restarse a veces soni icasi iguales y se pierden cifras significativas. Para calcular las columnas r y r hay que conocer los2

    ivalores de m y de b. Los valores de r deben salir positivos y negativos. Si sucediera que los valoreside r salen todos positivos, o todos negativos, es casi cierto que no se ha usado el nmero de cifras

    isignificativas requerido para un clculo confiable. El clculo de r se hace con la expresin (34). Alhacer ese clculo los valores de m y de b deben usarse con todas las cifras significativas obtenidas.

    iEs en este clculo de r en donde se amplifican los errores debido al uso de pocas cifras significativas.Los valores de m y de b pueden salir totalmente irreales si no se ha usado el nmero correcto decifras significativas. Regresando a la Tabla 5: al sumar las columnas de esa tabla se obtienen las sumasque se necesitan para las ecuaciones (39), (40) y (41). Los datos de la Tabla 3 se pueden usar parailustrar la construccin de las primeras cinco columnas de la Tabla 5. Ya se not de la Fig. 3b que losdatos producen una lnea recta con pendiente negativa.

    Tabla 6. Ejemplo de la construccin de la tabla de valores para un clculo manual usando elmtodo de cuadrados mnimos (modelo lneal). Los valores en esta tabla fueron obtenidos con unacalculadora de mano. Note que no se han usado las reglas de cmputos para los valores en lasltimas tres columnas.

    i i i i i i i iMedida y =lnP x =T y 10 x 10 x y-1 2 6 2 2

    1 4.852 3.209x10 23.541904 10.297681 1.5570068-3

    2 5.142 3.144x10 26.440164 9.884736 1.6166448-3

    3 5.603 3.029x10 31.393609 9.174841 1.6971487-3

    4 5.880 2.983x10 34.574400 8.898289 1.7540040 -3

    5 6.328 2.884x10 40.043584 8.317456 1.8249952-3

    6 6.486 2.873x10 42.068196 8.254129 1.8634278-3_________________________________________________________________

    Suma 34.291 18.122x10 198.061857 54.827132x10 0.103132273 -3 -6

    Los resultados obtenibles de la Tabla 6 son

  • 17

    (45)

    (46)

    (47)

    Como se obtuvo un valor de r igual a - 0.996 los datos parecen ser representados bastante bien poriuna lnea recta con pendiente negativa. Un comentario adicional: en el clculo, los valores de r

    salieron positivos y negativos, como debe ser.

    En el caso de la lnea recta que se ha presentado en bastante detalle, la pendiente y el intercepto seconsideraron como variables. Hay casos, empero, en que se desea una lnea recta con un interceptofijo. Esto es, el valor de b est determinado de antemano. Por ende, b no es una variable. Ese es elcaso que se encuentra al llevar a grfica la absorbencia versus la concentracin (Ley de Beer-Lambert). Otro caso ocurre cuando el intercepto es fijo. Por lo tanto m no es una variable. Se le dejaal estudiante derivar las dos expresiones correspondientes.

    Caso 2. Polinomio de grado dos

    Si despus de trazar los datos de la Tabla 4 se nota que el dibujo muestra una curvatura, se puedeintentar un cambio de variable para enderezar la curva, como se hizo en el caso de la tensin de vaporde etanol. Esto no siempre es deseable. Si no se puede o no se desea enderezar la curva, se puedetratar de representar los datos experimentales por un polinomio. Si se cree que una funcin cuadrticaes adecuada para representar los datos, la expresin algebraica tendr 3 desconocidas.

    0 1 2Las cantidades desconocidas son los coeficientes del polinomio (45): a , a y a . La desviacin oresiduo tiene una forma similar a la anterior

    i iDe nuevo, los valores (x ,y ) son los valores experimentales. La funcin S depende ahora de 3cantidades, los tres coeficientes desconocidos.

    Se desea buscar la curva que pase lo ms cerca posible de todos los datos experimentales. Esto0 1 2quiere decir que se desea el mnimo en S(a ,a ,a ). Habr tres derivadas parciales, cada una igualada

    a cero. De ellas se obtienen tres ecuaciones simultneas.

  • 18

    (48)

    (49)

    Estas tres ecuaciones simultneas se pueden resolver sin dificultad usando el mtodo de Cramer. Losvalores de los coeficientes obtenibles no son exactos. En este caso de un polinomio de grado 2, las

    0 1 2expresiones para las incertidumbres )a , )a y )a son algo complicadas y no se presentarn.Tampoco se presentan las expresiones para el coeficiente de correlacin, ni para el error fraccionalE. Estas cantidades se pueden conseguir en la literatura. El tratamiento dado hasta ahora tiene una

    iseria falla: la suposicin de que las x eran exactas. Para mejorar ese aproximacin es necesariointroducir el concepto de peso estadstico.

    Caso 3. Lnea recta - con peso estadstico

    iEn una tabla de valores experimentales las incertidumbres )y no son necesariamente iguales todas.i iHay valores de y con incertidumbres relativamente grandes, mientras que habr otros y con

    i iincertidumbres ms pequeas. Similarmente para x )x . Se le debe dar mayor PESO (entindaseimportancia) a los valores que tengan menor error. Esto se puede lograr introduciendo el "peso

    i i iestadstico" w en la funcin S. El peso estadstico para el par ordenado (x ,y ) est definido por lasiguiente expresin

    i iNtese que la expresin para el peso estadstico incluye los errores )y y )x . Esos errores bienipodran ser las desviaciones estndar. Note tambin que si los errores son pequeos, entonces w ser

    igrande (y viceversa). Un punto con un error pequeo tiene un valor de w grande y tendr mayor pesoque otro punto con un error grande. En la expresin (49) aparece la derivada de la funcin f(x) con

    irespecto a x. La funcin f(x) corresponde a y. Despus de tomar la derivada de f(x), se evalua f* (x )iy se lleva al cuadrado. Para el caso de una lnea recta w tiene una expresin sencilla. La derivada de

    0 1 1la funcin f(x) = a + a x, con respecto a la variable x, es el coeficiente a , o sea, es la pendiente m.iPor lo tanto, f* (x ) = m. Entonces,

  • 19

    (50)

    (51)

    iEl factor estadstico w se multiplica por el cuadrado del residuo y se suma de i=1 a n. La expresinpara S es ahora

    Se desea buscar el mnimo de S, pero las dos ecuaciones resultantes no son independientes y no sepuede usar el mtodo de Cramer. Las soluciones de esas ecuaciones se conocen y aparecen en laliteratura. Las soluciones exactas han sido publicadas por Powell y Macdonald y son algo(6)complicadas. Para usarlas se requiere bastante pericia en programacin, al igual que una buena yrpida computadora. Existen soluciones aproximadas que dan resultados casi igual de buenos que losresultados exactos. (7) Eliminacin de datos

    iCuando se hacen n mediciones de una cantidad x, se toma el promedio de los x como un mejor ndicedel valor real de x. Se supone, desde luego, que la incertidumbre de cada medida es una magnitudaleatoria. Si se han hecho n medidas, todas bajo las mismas condiciones, y n es un nmero grande,entonces la desviacin estndar ofrece una forma confiable de asignarle al promedio unaincertidumbre. Ahora, para n grande, la desviacin estndar vara con el recproco de n . Parece quesi n es bien grande, entonces F puede hacerse ridculamente pequea. Hasta cierto grado es cierto queal aumentar n, el error asociado con el promedio puede disminuir. Como en este curso n NO sergrande, esta situacin no es de inters.

    iEl inters ahora es saber qu criterio usar para descartar un valor x que se aleje marcadamente delvalor promedio. Existen en la literatura varias pruebas numricas que se pueden usar como criteriopara la eliminacin de un valor errante: la prueba Q, el criterio de Chauvenet, etc. En este curso seutilizar la siguiente prueba sencilla:

    i i jRegla 6. Si la desviacin *d* del valor x es 4 veces o ms mayor que el promedio de las #d # deilos otros valores, el valor x se debe descartar.

    Es importante sealar que al aplicar la Regla 6 se deben seguir los siguientes pasos: 1) se calcula elpromedio usando todos los valores, 2) se calcula la desviacin de cada uno de los valores, 3) seselecciona el valor de mayor desviacin, 4) se calcula la desviacin promedio de los otros valores,y 5) se hace la comparacin de la desviacin del valor sospechado con respecto a la desviacinpromedio de los otros valores.

  • 20

    Advertencia: Es imperativo que uno sepa cmo interpretar los resultados de un clculo de cuadradosmnimos, de una incertidumbre o de cualquier otra cantidad. O sea, despus de llevar a cabo unclculo uno debe preguntarse si el resultado obtenido es razonable o no. Por ejemplo, si el nmeroobtenido sale negativo, cuando debe ser positivo, uno debe cotejar los pasos en el clculo paraencontrar el error. Esta breve introduccin a anlisis numrico no debe tomarse como la ltimapalabra de este vasto tema. Informacin adicional se puede obtener de varias fuentes. En espaol serecomienda la publicacin de Spiridonov y Lopatkin o la de Cernuschi y Greco. (8) (9)

    Unidades

    La Unin Internacional de Qumica Pura y Aplicada ha recomendado que se use el sistema deunidades conocido por las siglas SI. En ese sistema internacional existen siete unidades bsicas, veala Tabla 7.

    Tabla 7. Las siete unidades bsicas en el sistema internacional

    Variable Fisicoqumica Nombre de la Unidad Smbolomasa kilogramo kgtiempo segundo sdistancia metro mtemperatura kelvin Kcantidad de una sustancia mol molcorriente elctrica amperio Aintensidad luminosa candela cd

    Adems de esas siete unidades bsicas, existen dos cantidades adicionales, para el ngulo plano y elngulo slido. Para el ngulo plano se usa el grado o radin. Para el ngulo slido la costumbre dictausar el estereoradin. Todas las variables fisicoqumicas pueden ser expresadas en trminos de lassiete unidades bsicas en la Tabla 7. El estudiante notar que en la Tabla 7 no aparecen las unidadespara presin o para carga elctrica. Eso se debe a que las unidades de presin (pascal) y la unidad decarga (culombio) son unidades derivadas. El pascal (Pa) est definido como newton@m y el-2culombio como A@s (amperio@segundo). Se usar el punto (@) como el operador para multiplicacin.La Tabla 8 contiene algunas de las variables fisicoqumicas ms comunes.

  • 21

    Tabla 8. Variables fisicoqumicas comunes

    Variable Fisicoqumica Unidades Smbolo SIrea metro m2 2volumen metro m3 3frecuencia hertz o segundo Hz o s-1 -1rapidez (velocidad) metro/segundo m@s-1aceleracin metro/segundo m@s2 -2fuerza newton Npresin pascal Padensidad kg/metro kg@m3 -3energa julio kg"m @s2 -2capacidad calorfica julio/mol@K entropa julio/mol@Kcarga culombio Cpotencial elctrico voltio J/Cresistencia elctrica ohmio Smomento dipolar culombio@metroviscosidad kilogramo@metro @segundo-1 -1campo elctrico newton/culombio N/Ccampo magntico tesla Tmomento lineal masa@velocidad momento angular masa@velocidad@distanciapotencial qumico julio/mol J@mol-1conductancia elctrica siemens Sconcentracin molar mol/decmetro M3concentracin molal mol/kg de disolvente m

    Adems de conocer las unidades del Sistema Internacional se deben conocer las conversiones a otrossistemas de unidades usados otrora. En particular, el sistema cegesimal, vstago del sistema mtrico,todava es usado. En el sistema cegesimal (gaussiano o cgs) las unidades bsicas son: centmetro,gramo, segundo, kelvin, mol, amperio y candela. No recomendadas estn la calora, el equivalente,la atmsfera (como unidad de presin), la dina, el ergio, el voltio@electrn y otras unidades. Debidoa que esas unidades, supuestamente en desuso, aparecen en miles de publicaciones (aun en algunasrecientes) uno debe familiarizarse con ellas. En la Tabla 9 aparece una breve lista de los factores deconversin. La Tabla 10 contiene valores recientes de algunas constantes fsicas. Ms informacinse puede obtener del "Handbook". El uso de las unidades correctas para las variables fisicoqumicasen una ecuacin debe reducir la ecuacin a una identidad. Esto es, si se han usado las unidadesapropiadas en ambos lados de la expresin, las unidades deben cancelarse en su totalidad para dar laexpresin trivial 1 = 1. Como ejemplo, la expresin de Clausius-Clapeyron para la tensin de vaporde un lquido puro como funcin de temperatura es

  • 22

    (52)

    (53)

    evEn esta relacin )H es la entalpa molar de evaporacin, R es la constante del gas ideal y T es latemperatura. Ahora, ninguna expresin logartmica puede tener unidades. Por lo tanto, el ladoizquierdo de la expresin (52) no tiene unidades. La constante tiene que ser adimensional. Igualmente,

    ev evla expresin )H /RT debe ser adimensional. Si se expresa )H en julios/mol entonces el valor deR debe ser 8.314 J/mol@K y T debe estar en kelvin. Solamente as se obtendr la cancelacin deunidades y se logra la identidad trivial 1 = 1. Consideraciones similares aplican cuando se eleva unnmero a una potencia. Por ejemplo, en los estudios de viscosidad aparece la expresin de deGuzmn.

    Como el nmero trascendental e no tiene unidades, la potencia a la cual se eleva tampoco puede teneraunidades. Por lo tanto, las unidades de E y de RT deben cancelarse. La unidades de 0 y de A deben

    ser las mismas. Tabla 9. Algunos factores de conversin

    atmsfera 101.325 kPa 1.01325 barcalora 4.184 julios 4.184x10 ergios7angstrom 100 picmetros 10 cm-8umar (dalton) 1.66056x10 kg 1.66056x10 gramo-27 -24litro 10 metro (decmetro)-3 3 3cm 285.94 cal@mol-1 -1dina 10 newton-5debye 10 ues@cm 3.335641x10 C@m-18 -30gauss 10 tesla-4libra 453.6 gramosmetro 39.37 pulgadasradin 5717'44"

  • 23

    Tabla 10. Valores recientes de algunas constantes.

    velocidad de la luz(vaco) 2.9979x10 m@s8 -1

    carga del protn 1.60219x10 C -19

    4.80324x10 ues-10

    masa del protn(reposo) 1.67265x10 kg-27

    masa del electrn(reposo) 9.10953x10 kg-31

    masa del neutrn(reposo) 1.67495x10 kg-27

    masa del deutern(reposo) 2.01345 umares

    constante de Planck 6.62618x10 J@s-34

    constante de Boltzmann 1.38066x10 J@K-23 -1

    constante de Avogadro 6.02204x10 mol23 -1

    constante del gas ideal 8.31442 J/[email protected] cal/K@mol

    0.08206 atm@L/K@mol

    constante de Faraday 96,484.6 C@mol-1

    e 2.718281828...

    B 3.141592654...

  • 24

    Referencias

    1. "Handbook of Chemistry and Physics", 61 Edicin, CRC Press, Boca Ratn, Florida(1980), pg.raF-248.

    2. Normalmente se requiere que el nmero de determinaciones sea alrededor de 30 para que ladesviacin estndar pueda informarse con dos cifras significativas. Vea a Shoemaker, D. P., et al.,"Experiments in Physical Chemistry", 4 Edicin, McGraw-Hill, Nueva York(1981), pg. 34. ta

    3. Shavers, C. L., Parsons, M. L. y Deming, S. N., J. Chem. Ed. 56, 307(1979). Vea tambin aSchwarz, L. M., J. Chem. Ed. 62, 693(1985).

    4. Esta no es la nica forma de hacerlo. Tambin se puede lograr usando el mtodo del valor absolutode los residuos o el mtodo de Chebyshef. Vea a Valk, P. y Vadja, S., "Advanced scientificcomputing in BASIC ...",Elsevier, Nueva York(1989), pg.51 y 54.; El mtodo de cuadradosmnimos est discutido en mayor detalle en Mortimer, R. G., "Mathematics for Physical Chemistry",Macmillan, Nueva York (1981), pg. 296.

    5. Noggle, J. H., "Physical Chemistry on a Microcomputer", Little & Brown, Boston(1985), pg. 65.

    6. Powell, D. R. y Macdonald, J. R., Computer Journal 15, 148(1972).

    7. Irvin, J. A. y Quickenden, T. I., J. Chem. Ed. 60, 711(1983).

    8. Spiridonov, V. P. y Lopatkin, A. A., "Tratamiento Matemtico de Datos Fisicoqumicos",Traduccin de A. Grdian, Editorial Mir, Mosc(1973).

    9. Cernuschi, F. y Greco, F. I., "Teora de Errores de Medicin", Editorial Universitario de BuenosAires, Buenos Aires(1968).

    Page 1Page 2Page 3Page 4Page 5Page 6Page 7Page 8Page 9Page 10Page 11Page 12Page 13Page 14Page 15Page 16Page 17Page 18Page 19Page 20Page 21Page 22Page 23Page 24