Ir en La Petroquimica

Embed Size (px)

Citation preview

  • 8/6/2019 Ir en La Petroquimica

    1/222

    UU NIVERSITATNIVERSITAT RROVIRA IOVIRA I VVIRGILIIRGILIDD epartamentepartament de Qumica Analtica i Qumicade Qumica Analtica i Qumica OrgnicaOrgnica

    Tesis DoctoralSantiago Macho Aparicio

    Tarragona, 2002

    METODOLOGAS ANALTICAS BASADAS ENESPECTROSCOPIA DE INFRARROJO Y

    CALIBRACIN MULTIVARIANTE. APLICACINA LA INDUSTRIA PETROQUMICA

  • 8/6/2019 Ir en La Petroquimica

    2/222

  • 8/6/2019 Ir en La Petroquimica

    3/222

    Metodologas analticas basadas en espectroscopia de

    infrarrojo y calibracin multivariante. Aplicacin a la

    industria petroqumica.

    Tesis Doctoral UNIVERSITATROVIRA IVIRGILI

  • 8/6/2019 Ir en La Petroquimica

    4/222

  • 8/6/2019 Ir en La Petroquimica

    5/222

    UNIVERSITATROVIRA IVIRGILI Departament de Qumica Analtica i Qumica Orgnica

    rea de Qumica Analtica

    METODOLOGAS ANALTICAS BASADAS ENESPECTROSCOPIA DE INFRARROJO Y CALIBRACIN

    MULTIVARIANTE. APLICACIN A LA INDUSTRIAPETROQUMICA.

    Memoria presentada porSantiago Macho Apariciopara conseguir el grado de

    Doctor en QumicaTarragona, 2002

  • 8/6/2019 Ir en La Petroquimica

    6/222

  • 8/6/2019 Ir en La Petroquimica

    7/222

    Dra. MARIA SOLEDAD LARRECHI GARCA, profesora titular delDepartament de Qumica Analtica i Qumica Orgnica de la Facultat deQumica de la Universitat Rovira i Virgili,

    CERTIFICA: Que la presente memoria que tiene por ttulo:

    METODOLOGAS ANALTICAS BASADAS ENESPECTROSCOPIA DE INFRARROJO YCALIBRACIN MULTIVARIANTE. APLICACIN ALA INDUSTRIA PETROQUMICA, ha sido realizadapor SANTIAGO MACHO APARICIO bajo mi direccinen el rea de Qumica Analtica i Qumica Orgnica deesta Universidad y que todos los resultados presentadosson fruto de las experiencias realizadas por dicho

    doctorando.

    Tarragona, abril de 2002

    Dra. M Soledad Larrechi

    UNIVERSITATROVIRA IVIRGILI DEPARTAMENT DEQUMICAANALTICAI QUMICAORGNICA

    Plaa Imperial Trraco, 143005 TarragonaTel. 34 977 55 81 37Fax 34 977 55 95 63e-mail: [email protected]

  • 8/6/2019 Ir en La Petroquimica

    8/222

  • 8/6/2019 Ir en La Petroquimica

    9/222

    A GRADECIMIENTOS

    Quisiera que las prximas lneas sirvan como reconocimiento a las personas einstituciones que han hecho posible la realizacin de esta tesis. A todas ellas, quieroagradecer de todo corazn la ayuda dispensada:

    A mi directora, M Soledad Larrechi Garca, por su gua y sus valiosas aportaciones, sinlas que este trabajo no hubiera sido posible.

    Al director del grupo de Quimiometra y Cualimetra, F. X. Rius Ferrs, por laoportunidad que me brind de realizar este trabajo, y lo mucho que me ha enseado.

    A los miembros del grupo con los que he trabajado de forma ms estrecha, que tanto me

    han aportado: Pili, Antoni, Florenci y Ricard. Al resto de miembros actuales del Grupo, as como a los antiguos miembros, que me hanayudado y ofrecido su amistad, afortunadamente la lista es larga, pero sentira muchodejarme a alguien: Itziar, Jordi, Joan, Jaume, Javi, Angel, Alicia P., Alicia M., Josep Llus, Mari, Enric, Esther, Paquita, Gemma, Nria, Alberto, Pablo, Sara, Barbara...

    A los compaeros y laborantes del rea de Qumica Analtica, del resto del Departamento y del Departamento de Fsica i Inorgnica, especialmente a mis compaeros de promocin: Alex, Pere y Ramn.

    A la Universitat Rovira i Virgili, a la Fundacin REPSOL y al Departament dUniversitats Recerca i Societat de la Informaci de la Generalitat de Catalunya por el soporteeconmico que ha permitido realizar esta tesis.

    Mi ms sincero agradecimiento a todos aquellos miembros de las empresas con las que hetenido contacto en el transcurso de esta tesis: Repsol Petrleo Tarragona yTransformadora de Propileno, muchas son las personas han ayudado a hacer posible estetrabajo, pero quisiera nombrar a E. Moratinos y C. Garca.

    A mi familia y amigos, que tambin han puesto su grano de arena y me han apoyadoincondicionalmente.

    A Inma, muy especialmente, siempre a mi lado y dispuesta a ayudarme. Gracias por elnimo y el apoyo que me has dado.

  • 8/6/2019 Ir en La Petroquimica

    10/222

  • 8/6/2019 Ir en La Petroquimica

    11/222

    A Inma

  • 8/6/2019 Ir en La Petroquimica

    12/222

  • 8/6/2019 Ir en La Petroquimica

    13/222

    NDICEObjetivo................................................................................................ 1

    Objetivo...............................................................................................3 1 Introduccin................................................................................. 5

    1.1 Presentacin de los contenidos .....................................................7 1.2 Casos prcticos estudiados .........................................................10

    1.2.1 Determinacin de PIONA en nafta ......................................10 1.2.2 Determinacin de etileno, viscosidad e ndice de fluidez en

    polipropileno......................................................................12

    1.3 Estructura de la tesis ..................................................................15 2 Fundamentos tericos................................................................. 19

    2.1 Espectroscopia de infrarrojo .......................................................21 2.1.1 Aspectos fundamentales......................................................21 2.1.2 Regiones espectrales...........................................................22 2.1.3 Tipos de medidas en infrarrojo ............................................22

    2.2 Interpretacin de espectros .........................................................28

    2.2.1 Asignacin de bandas.........................................................28 2.2.2 Segunda derivada de los espectros.......................................30 2.3 Fundamentos quimiomtricos .....................................................32

    2.3.1 Introduccin.......................................................................32 2.3.2 Descomposicin en componentes principales (PCA).............32 2.3.3 Tcnicas de pretratamiento de datos.....................................35 2.3.4 Etapas de la calibracin multivariante ..................................42

    3 Parte experimental..................................................................... 69 3.1 Presentacin de los conjuntos de muestras estudiados ..................71

    3.1.1 Muestras............................................................................71 3.1.2 Anlisis de referencia .........................................................72 3.1.3 Medidas espectroscpicas...................................................73 3.1.4 Anlisis de los espectros obtenidos ......................................74

  • 8/6/2019 Ir en La Petroquimica

    14/222

    4 Modelos de calibrado..................................................................79 4.1 Introduccin..............................................................................81

    4.2 Modelos de calibracin de polmeros derivados del polipropileno.82 4.2.1 Agrupacin de las muestras.................................................82 4.2.2 Determinacin del porcentaje de etileno en EPR/PP..............83 4.2.3 Determinacin del porcentaje de etileno en EPR...................87 4.2.4 Determinacin del ndice de fluidez en copolmeros de

    EPR/PP, EPR y PP y viscosidad en EPR/PP y EPR...............90 4.3 Multivariate determination of several compositional parameters

    related to the content of hydrocarbon in naphtha by MIRspectroscopy..............................................................................92

    4.4 Ampliacin de aspectos experimentales.....................................108 4.5 Conclusiones...........................................................................109

    5 Control y estandarizacin.........................................................113 5.1 Introduccin............................................................................115 5.2 Monitoring ethylene content in heterophasic copolymers by near-

    infrared spectroscopy. Standardisation of the calibration model..117 5.3 Ampliacin de resultados .........................................................135 5.4 Conclusiones...........................................................................139

    6 Outliers en prediccin...............................................................143 6.1 Introduccin............................................................................145 6.2 Outlier detection in the ethylene content determination in propylene

    copolymer by near-infrared spectroscopy and multivariate

    calibration...............................................................................147 6.3 Ampliacin de algunos aspectos experimentales ........................163 6.4 Conclusiones...........................................................................166

    7 Evaluacin de las posibilidades de esta metodologa................. 169 7.1 Introducin..............................................................................171

  • 8/6/2019 Ir en La Petroquimica

    15/222

    7.2 Near infrared spectroscopy and multivariate calibration for thequantitative determination of certain properties in the petrochemical

    industry...................................................................................173 7.3 Conclusiones...........................................................................189 8 Anlisis espectral para la seleccin de variables ....................... 191

    8.1 Introduccin............................................................................193 8.2 Wavelength selection of naphtha near infrared spectra using

    conventional spectral analysis and PCA....................................194 8.3 Conclusiones...........................................................................209

    9 Conclusiones generales............................................................. 211 9.1 Conclusiones...........................................................................213 9.2 Perspectivas futuras.................................................................217

  • 8/6/2019 Ir en La Petroquimica

    16/222

  • 8/6/2019 Ir en La Petroquimica

    17/222

    OBJETIVO

  • 8/6/2019 Ir en La Petroquimica

    18/222

  • 8/6/2019 Ir en La Petroquimica

    19/222

    Objetivo

    3

    OBJETIVO

    El objetivo general de la presente tesis doctoral ha sido el desarrollo yaplicacin de metodologas analticas basadas en la combinacin de medidasespectroscpicas de infrarrojo medio y cercano con mtodos quimiomtricos deanlisis multivariante. Las aplicaciones desarrolladas estn enfocadas a ladeterminacin cuantitativa de diferentes propiedades fsicas y qumicas de intersen la industria petroqumica.

    Este objetivo general, enunciado arriba, se puede desglosar en los siguientesobjetivos ms detallados:

    1 Desarrollo de modelos de calibrado multivariantes basados en medidasespectroscpicas.

    2 Estudio de la estabilidad en el tiempo de los modelos desarrollados y sutransferencia a nuevas situaciones experimentales.

    3 Deteccin de situaciones anmalas, no contempladas en el proceso decalibrado (deteccin de muestras discrepantes).

    Las aplicaciones sobre las que se ha trabajado han sido:

    a) La determinacin del contenido de las diferentes familias de hidrocarburosque constituyen la nafta.

    b) El anlisis del contenido en etileno y otras propiedades mecnicas, como laviscosidad o el ndice de fluidez, de diferentes tipos de polmeros ycopolmeros de polipropileno.

    Estos dos tipos de muestras, la nafta y el polipropileno, constituyen dosproblemas industriales diferentes entre s, tanto por el diferente estado fsico de lamuestra como por las diferencias en los procesos industriales involucrados. La

  • 8/6/2019 Ir en La Petroquimica

    20/222

    Objetivo

    4

    nafta es una fraccin lquida del petrleo, obtenida por destilacin, cuyacomposicin depende de la procedencia del petrleo de partida as como de las

    operaciones de separacin que se han aplicado a este crudo. Los copolmeros depolipropileno son slidos, producto de la polimerizacin de propileno en presenciade otros polmeros, y sus caractersticas finales dependern de la naturaleza yproporcin de los polmeros aadidos.

  • 8/6/2019 Ir en La Petroquimica

    21/222

    1. INTRODUCCIN

  • 8/6/2019 Ir en La Petroquimica

    22/222

  • 8/6/2019 Ir en La Petroquimica

    23/222

    Introduccin

    7

    1.1 PRESENTACIN DE LOS CONTENIDOS

    Desde el punto de vista industrial existe gran inters en el desarrollo demetodologas analticas que proporcionen gran cantidad de informacin, que stasea de calidad y que adems lo hagan en el menor tiempo posible. Esta idea, que esaplicable a cualquier proceso industrial, cobra especial relevancia en un sectorcomo el de la industria petroqumica, en la que es habitual la monitorizacin ycontrol de los procesos basndose en la informacin que proporciona el laboratoriode anlisis.

    Normalmente los mtodos de anlisis utilizados en estos laboratorios sonmtodos normalizados por organismos oficiales, especficos para cada propiedad oanalito a determinar. Frecuentemente tienen ciertas caractersticas que los hacenpoco eficaces en el entorno industrial, como puede ser un elevado tiempo deanlisis o la necesidad de una manipulacin intensiva de la muestra previa alanlisis. Estas caractersticas hacen que sean tcnicas poco adecuadas para un

    control en lnea de los procesos industriales, tanto por la demora en obtener elresultado, como porque es tcnicamente difcil acoplarlas a la lnea de produccin.

    La espectroscopia de infrarrojo, tanto en la zona del infrarrojo medio como elinfrarrojo cercano, resulta una tcnica atractiva en el mbito industrial porque:

    a) Proporciona una informacin qumica muy verstil. La espectroscopia

    molecular, como consecuencia del tipo de transiciones propias de estazona, aporta informacin de una gran cantidad de compuestos qumicos.Esta propiedad, combinada a las tcnicas multivariantes, permiteconsiderar la determinacin simultnea de ms de un analito o propiedadde inters a partir del espectro registrado de la muestra.

  • 8/6/2019 Ir en La Petroquimica

    24/222

    Captulo 1

    8

    b) La obtencin del espectro se hace de una forma rpida y no es necesario unpretratamiento de la muestra, lo que facilita el acoplamiento de esta tcnica

    a la lnea de produccin (anlisis en lnea).

    La falta de especificidad de la seal analtica registrada, caracterstica ventajosadesde el punto de vista de la versatilidad, tiene como inconveniente que obliga alempleo de tcnicas de anlisis multivariante, en concreto tcnicas de calibradomultivariante. Estos mtodos extraen eficazmente la informacin de los datos,aunque necesitan un adecuado estudio del problema abordado y una etapa de

    desarrollo de la metodologa ms laboriosa que los anlisis clsicos.

    En esta tesis doctoral se ha abordado la determinacin del contenido total enparafinas, isoparafinas, naftenos y aromticos, as como del contenido desglosadopor nmero de tomos de carbonos de cada una de estas familias de hidrocarburos,en muestras de nafta, utilizando la seal registrada tanto en la zona del infrarrojomedio como en el infrarrojo cercano. Tambin se ha abordado la determinacin del

    contenido en etileno, viscosidad e ndice de fluidez de muestras de polipropileno apartir de la seal registrada en la zona del infrarrojo cercano.

    La tcnica de calibracin multivariante que se ha utilizado ha sido la calibracinmultivariante por mnimos cuadrados parciales (PLS). Las diferentes propiedadesde las muestras se han determinado en los propios laboratorios de las industriascolaboradoras, utilizando los mtodos de anlisis habituales y que son la

    cromatografa de gases en el caso de la nafta y la espectroscopia IR, as como otrosanlisis fsicos, en el caso de los polmeros. Los resultados de estos anlisis se hanutilizado para construir y comprobar la validez de los modelos de calibracindesarrollados.

    En la etapa de validacin de los modelos de calibrado se realiza una estimacindel error de prediccin futuro. Habitualmente esta estimacin consiste en un nico

  • 8/6/2019 Ir en La Petroquimica

    25/222

    Introduccin

    9

    valor de error promedio que da una informacin de las caractersticas predictivasglobales del modelo, aunque en algunas situaciones, como por ejemplo el mbito

    industrial, puede ser preferible proporcionar un error de prediccin especfico paracada muestra, equivalente a los intervalos de prediccin habituales en la calibracinunivariante. En el campo de la calibracin multivariante por mtodos que utilizanla descomposicin en factores existen varias expresiones propuestas para calcularel error de prediccin especfico, aunque no existe una comnmente aceptada, porlo que se ha estudiado el uso de diferentes expresiones en algunas de lasaplicaciones tratadas en esta tesis.

    El establecimiento de esta metodologa analtica no acaba con el desarrollo yposterior validacin del modelo de calibrado propiamente dicho, si no que esnecesario establecer un procedimiento de control de su validez con el tiempo. Conesta finalidad se ha abordado el tema de la deteccin de situaciones anmalas deutilizacin de los modelos, no contempladas en el proceso de calibrado, as como laestabilidad de los sistemas con el tiempo. Estos dos aspectos se han abordado tanto

    mediante tcnicas de control de tipo univariante, como los grficos de Shewhart,cmo mediante tcnicas de control de tipo multivariante, como el estadsticoT 2 deHotelling o el estadsticoQ.

    Cuando se detecta la perdida de validez del modelo, es posible la aplicacin demtodos de correccin que permiten seguir utilizando el modelo. Esta modificacindel modelo requiere una cierta experimentacin, pero que sera mucho menor de la

    que comportara un proceso de recalibrado completo, lo que se traduce en unimportante ahorro de trabajo y tiempo. Con esta finalidad se han aplicadodiferentes tcnicas de transferencias de modelos, como la correccin de lapendiente y el sesgo (slope-bias correction , SBC) o la estandarizacin directa porpartes ( piecewise direct standardisation , PDS).

  • 8/6/2019 Ir en La Petroquimica

    26/222

    Captulo 1

    10

    La aplicacin prctica de estas metodologas ha permitido comprobar que enocasiones no se tienen en cuenta algunas consideraciones bsicas que ayudan a

    evaluar las posibilidades de xito de la aplicacin propuesta, como por ejemplo larelacin entre el espectro infrarrojo y la propiedad a determinar, la existencia deagrupaciones en las muestras o el hecho de trabajar en intervalos de la propiedad deinters muy estrechos en comparacin con la reproducibilidad de la tcnica dereferencia. Otros aspectos como las distintas estrategias para estandarizar oactualizar el modelo, son de vital importancia en el caso de la aplicacin de lacalibracin multivariante a problemticas industriales y que hay que planificar

    desde el mismo momento del desarrollo del modelo. Todos estas consideracioneshan sido aplicadas a las aplicaciones desarrolladas en la presente tesis doctoral.

    Otro aspecto importante de la calibracin multivariante es la seleccin devariables, en contraposicin a la utilizacin del espectro completo para construir elmodelo. Cuando el nmero de longitudes de onda es muy grande se puedenintroducir mejoras en el modelo de calibrado reduciendo el nmero de stas,

    eliminando las que contienen un mayor grado de ruido, informacin no relevante otrminos no lineales y trabajando nicamente con aquellas que estn directamenterelacionadas con el analito o la propiedad de inters. La seleccin de longitudes deonda que permite construir modelos ms simples y por tanto ms sencillos deinterpretar ha sido aplicada al desarrollo de modelos en naftas.

    1.2 CASOS PRCTICOS ESTUDIADOS

    1.2.1 Determinacin de PIONA en nafta

    La nafta es el producto de partida para la produccin de alquenos (olefinas) quese realiza a travs del proceso decracking (Fig. 1), base de la industriapetroqumica [1]. Como su nombre indica (en ingls rotura,cracking ) consiste enla reduccin del tamao de las molculas del producto de partida, para obtenerproductos ms ligeros. La nafta se introduce en el horno en presencia de vapor para

  • 8/6/2019 Ir en La Petroquimica

    27/222

    Introduccin

    11

    evitar la formacin de coque, por lo que estas unidades se denominansteamcrackers (crackers con vapor). Las condiciones de operacin de los hornos de la

    unidad deben adaptarse a las caractersticas qumicas de la nafta de alimentacinpara obtener un resultado ptimo. Estas caractersticas qumicas de la nafta varandebido a cambios en el origen del producto, cambios en las etapas productivasprevias (destilacin) o en las condiciones de almacenaje, etc.

    olefinasdestilacin

    petrleonafta

    GLP

    queroseno

    gas-oil

    residuo

    steam cracker

    etilenopropileno...

    olefinasdestilacin

    petrleonafta

    GLP

    queroseno

    gas-oil

    residuo

    steam cracker

    etilenopropileno...

    Fig. 1.Esquema general de la produccin de olefinas a partir de la nafta del petrleo.

    Para caracterizar la nafta de alimentacin se debe determinar el contenido encada una de las familias de los diferentes hidrocarburos presentes. Estoshidrocarburos son alcanos lineales (n-parafinas), alcanos ramificados(isoparafinas), alcanos cclicos (naftenos), alquenos (olefinas) y aromticos. Esteanlisis se conoce comnmente como determinacin de PIONA.

    El nmero de constituyentes de la nafta es tan amplio que un sistemacromatogrfico con una nica columna no puede separarlos todos en un tiemporazonable. Para realizar este anlisis, en la mayora de laboratorios de refineras seutiliza un sistema cromatogrfico multicolumna comercial [2]. Este sistema utilizadiversas columnas acopladas mediante vlvulas para separar secuencialmente todos

  • 8/6/2019 Ir en La Petroquimica

    28/222

    Captulo 1

    12

    los componentes de la muestra. Un esquema de un sistema de este tipo se puedeobservar en la Fig. 2.

    OV-275v

    vtrampa

    D

    olefinas

    saturados

    OV-101

    Pt 5 13X

    v

    v v

    v

    trampa

    H2He

    Fig. 2.Esquema bsico del sistema multicolumna para anlisis de PIONA (Adaptado deBeens y col. [3]).

    Este sistema proporciona la composicin (% en peso) de n-parafinas,isoparafinas, naftenos, olefinas y aromticos, segn el nmero de carbonos de cadacomponente. Este anlisis est ampliamente extendido en la industria petroqumicapara el anlisis de composicin de gasolina y nafta. Un importante inconvenienteque presenta esta tcnica es el elevado tiempo de anlisis, ya que son necesarias

    entre 3 y 4 horas para llevarlo a cabo. La relativa lentitud del anlisis no permiteuna optimizacin adecuada delcracker , por lo que la posibilidad de emplear unatcnica ms rpida, como la espectroscpica de infrarrojo producira importantesbeneficios en el control y optimizacin de la produccin de olefinas.

    1.2.2 Determinacin de etileno, viscosidad e ndice de fluidez en polipropileno

    El polipropileno (PP) es uno de los polmeros termoplsticos comerciales ms

    importantes del mercado, con una demanda en continua expansin. Se obtiene porpolimerizacin de propileno, obtenido a su vez como subproducto en el proceso deobtencin de etileno por craqueo con vapor, o bien del proceso decracking cataltico para la obtencin de gasolina. Es un producto de coste relativamentebajo, que puede ser fcilmente modificado mediante la copolimerizacin paraadecuar sus propiedades fsicas a diferentes aplicaciones.

  • 8/6/2019 Ir en La Petroquimica

    29/222

    Introduccin

    13

    R e a c t o r

    B

    ReactorA Extrusor

    Extrusor

    propileno

    etilenopropilenohidrgeno

    PP granza

    PP/EPRgranzaPP/EPRpolvo

    PPpolvo

    R e a c t o r

    B

    ReactorA Extrusor

    Extrusor

    propileno

    etilenopropilenohidrgeno

    PP granza

    PP/EPRgranzaPP/EPRpolvo

    PPpolvo

    Fig. 3.Esquema de la produccin de polipropileno homopolmero (PP) y copolmero deetileno-propileno (PP/EPR o iPP).

    La copolimerizacin ms corriente consiste en aadir un elastmero alpolipropileno para modificar su cristalinidad, ya que se introducen irregularidadesen la macromolcula. El producto resultante de la copolimerizacin tiene unamayor dureza a bajas temperaturas y una menor tendencia a la fractura. El

    elastmero ms utilizado es a su vez un copolmero, de etileno-propileno (EPR, delinglsethylene-propylene rubber ). El polipropileno producido se denominaimpact resistant (resistente al impacto), y contiene entre un 10-30% de EPR. Aunque esteproducto se denomina habitualmente copolmero heterofsico, debido a laconvivencia de una fase cristalina y otra amorfa, no existen enlaces qumicos entreel PP y el EPR aadido, por lo que en realidad se trata de una mezcla fsica de losdos polmeros y no de un verdadero copolmero. En la actualidad este copolmero

    de PP se produce directamente en un proceso multietapa, consistente en unacopolimerizacinin situ de propileno y etileno en presencia del homopolmero dePP con un sistema cataltico de TiCl3-AlEt3 (Fig. 3).

    El copolmero de impacto formado (impact PP o PP/EPR) posee una matriz dehomopolmero de PP en la que se halla disperso el EPR en forma de pequeaspartculas discretas. Estas partculas protegen la matriz contra la propagacin de

  • 8/6/2019 Ir en La Petroquimica

    30/222

    Captulo 1

    14

    grietas disipando grandes cantidades de energa en el material que rodea lapartcula [4]. La caracterizacin de la compleja estructura de este material se ha

    llevado a cabo por diferentes tcnicas: resonancia magntica nuclear (RMN),fraccionamiento por elucin a temperatura variable cromatografa de exclusinpor tamaos (TREF-SEC, del inglsTemperature rising elution fraction - Size

    Exclusin Chromatography ) y la microscopia electrnica (TEM) [5, 6].

    En la planta de produccin de polipropileno se llevan a cabo anlisis mssencillos para comprobar la calidad del producto, como por ejemplo la

    determinacin del % de etileno aadido, del ndice de fluidez o la viscosidad. En elcaso del % de etileno, el mtodo de determinacin es la espectroscopia deinfrarrojo medio. Para llevar a cabo este anlisis, la muestra debe ser calentada a150 C y prensada para obtener una lmina fina de material, adecuada para unanlisis por transmisin de infrarrojo. El ndice de fluidez (melt flow index , MFI, eningls) se mide por la cantidad (peso en gramos) de polmero fundido y extruidodurante 10 min. a travs de un orificio de longitud y dimetro interno normalizado,

    en unas condiciones especficas de presin y temperatura [7] (Fig. 4). Laviscosidad intrnseca (olimiting viscosity number segn la nomenclatura IUPAC)se obtiene extrapolando la viscosidad reducida a concentracin cero y requiere ladisolucin del polmero en tetrahidronaftaleno a 135C [8].

    masa M

    9.57 mm

    8.0 mm

    2.09 mm

    Fig. 4.Esquema del sistema para la medicin del ndice de fluidez. Adaptado de ref. 9

  • 8/6/2019 Ir en La Petroquimica

    31/222

    Introduccin

    15

    Como se puede ver, los diferentes anlisis del polipropileno requierenpretratamientos de la muestra: fundido y prensado para obtener una lmina,

    fundido y extrusin o disolucin a altas temperaturas. Estos pretratamientosrepresentan una porcin considerable del tiempo total de anlisis, planteanproblemas de reproducibilidad y son una fuente de errores sistemticos si no serealizan correctamente, ya que pueden alterar fcilmente la muestra y afectar alresultado del anlisis. Por estos motivos, representa una alternativa muy atractiva eluso de un nico anlisis espectroscpico (un solo espectro) por muestra, paradeterminar rpidamente las mltiples propiedades que se analizan rutinariamente

    en este tipo de polmeros.

    1.3 ESTRUCTURA DE LA TESIS

    El trabajo desarrollado en la presente tesis doctoral, ha sido consecuencia de lainteraccin entre el grupo de investigacin en el cual he trabajado con dosempresas del polgono industrial de Tarragona; la empresa Repsol-YPF y la

    empresa Transformadora de propileno (TDP), lo que ha permitido un conocimientode los aspectos de carcter prctico que entraa el desarrollo de esta metodologa.La secuencia del trabajo efectuado responde a la necesidad de compaginar las

    actividades de organismos tan diferenciados como son la Empresa y laUniversidad. Por este motivo y con la finalidad de exponer de la forma mssencilla posible el trabajo efectuado, la presente tesis se ha estructurado de la formaque se detalla a continuacin:

    En primer lugar se describen los principales objetivos de la tesis as comosu justificacin.

    En el captulo 1 se presentan los contenidos de la tesis y el inters de lasaplicaciones industriales sobre las que se ha trabajado. Por ltimo seexpone un esquema de la tesis.

  • 8/6/2019 Ir en La Petroquimica

    32/222

    Captulo 1

    16

    En el captulo 2 se hace una introduccin a los fundamentos tericos,espectroscpicos y quimiomtricos, utilizados.

    En el captulo 3 se presenta la parte experimental de este trabajo. En los captulos 4 a 8 se presentan los resultados obtenidos. En el captulo 9 se presentan las conclusiones generales de la tesis.

    El captulo 2, en el que se presentan los fundamentos tericos, y el captulo3, donde se presentan aspectos experimentales, tienen contenidos que tambinse incluyeron en algunas de las publicaciones presentadas, aunque se ha

    mantenido esta duplicidad por motivos de claridad y para tener una visinconjunta del trabajo.

    Los captulos 4 a 8 tienen una estructura similar: un apartado introductorioque da paso a la publicacin realizada, con una ampliacin de algunos aspectosexperimentales o de los resultados que no estn suficientemente tratados en lapublicacin, para terminar con las conclusiones de cada apartado.

    El captulo 4 contiene un apartado introductorio ms extenso que el resto decaptulos de resultados, en el que se presentan los modelos de calibradodesarrollados para el polipropileno, ya que ciertos aspectos de este modelo setratan en sucesivos captulos (cap. 5 y 6). Los modelos de nafta utilizando laespectroscopia de infrarrojo medio, fueron objeto de una publicacin que sepresentada en este captulo.

    En los captulos 5 y 6 se trata el tema del control y transferencia (cap. 5) y dela deteccin de muestras discrepantes (cap. 6) del modelo desarrollado paradeterminar el contenido en etileno en muestras de polipropileno. Estos aspectosfueron objeto de sendas publicaciones que se presentan en estos captulos.

  • 8/6/2019 Ir en La Petroquimica

    33/222

    Introduccin

    17

    El captulo 7 presenta consideraciones de carcter general y prctico de lautilizacin de la calibracin multivariante y los mtodos espectroscpicos en la

    industria petroqumica, que tambin fue objeto de una publicacin.

    En el captulo 8 se presenta un aspecto importante de la calibracinmultivariante que no se haba desarrollado antes en esta tesis, como es laseleccin de variables. La seleccin de las variables (longitudes de onda en estecaso) que aportan ms informacin de la propiedad de inters, si bienseguramente no comportar una mejora sensible de la exactitud de los modelos,

    puede aportar otras posibles mejoras como podra ser una mayor sencillez,robustez y facilidad de actualizacin y estandarizacin del modelo.

    Por ltimo, en el captulo 9 se presentan las conclusiones generales de latesis y las perspectivas de futuro de estas metodologas analticas en el campode la industria petroqumica.

  • 8/6/2019 Ir en La Petroquimica

    34/222

    Captulo 1

    18

    BIBLIOGRAFA 1 R. E. Kirk and D. F. Othmer,Kirk-Othmer concise encyclopedia of chemical

    technology, Wiley, New York,1985.2 P. van Arkel, J. Beens, J. Spaans, D. Grutterink and R. Verbeek, J.

    Chromatogr. Sci. 26 , 1988, 267.3 J. Beens, U.A.Th. BrinkmanTrends Anal. Chem. 19 , 2000,260.4 M. Francis, Jr. Mirabella, J. Appl. Polym. Science: Appl. Polym. Symp. 51,

    1992, 117.5 T. Usami, Y. Gotoh, H. Umemoto, and S. Takayama, J. Appl. Polym.

    Science: Appl. Polym. Symp. 52 , 1993, 145.6 Z. S. Petrovic, J. Budinski-Simendic, V. Divjakovic, and Z. Skrbic, J. Appl.

    Polym. Science 59 , 1996, 301.7 The American Society for Testing and Materials (ASTM), Test Method

    D1238-01. ASTM Annual Book of Standards, vol. 08.01, West

    Conshohocken, PA, USA,2001.8 The American Society for Testing and Materials (ASTM), Test Method

    D2857-95(2001). ASTM Annual Book of Standards, vol. 08.02, WestConshohocken, PA, USA,2001.

    9 N.G. McCrum, C.P. Buckey and C. B. Bucknall,Principles of Polymer Engineering , 2nd Ed. Oxford University Press, Oxford,1997.

  • 8/6/2019 Ir en La Petroquimica

    35/222

    2. FUNDAMENTOS TERICOS

  • 8/6/2019 Ir en La Petroquimica

    36/222

  • 8/6/2019 Ir en La Petroquimica

    37/222

    Fundamentos tericos

    21

    2.1 ESPECTROSCOPIA DE INFRARROJO

    2.1.1 Aspectos fundamentales

    La espectroscopia molecular se basa en la interaccin entre la radiacinelectromagntica y las molculas. Dependiendo de la regin del espectro en la quese trabaje y por tanto de la energa de la radiacin utilizada (caracterizada por sulongitud o nmero de onda), esta interaccin ser de diferente naturaleza:excitacin de electrones, vibraciones moleculares y rotaciones moleculares [1]. La

    molcula, al absorber la radiacin infrarroja, cambia su estado de energavibracional y rotacional. Las transiciones entre dos estados rotacionales requieremuy poca energa, por lo que solo es posible observarlas especficamente en el casode muestras gaseosas. En el caso del estudio del espectro infrarrojo (IR) demuestras slidas y lquidas slo se tienen en cuenta los cambios entre estados deenerga vibracional [2].

    Utilizando la mecnica quntica y el modelo del oscilador anarmnico pararepresentar los enlaces, se demuestra que las bandas en el infrarrojo se producencomo consecuencia de transiciones entre niveles de energa en los que el nmerocuntico vibracional () cambia en una unidad (=1), denominada bandafundamental, o en ms de una unidad (=2, 3, ... ), que se denominansobretonos [3]. Aunque tericamente son posiblesuperiores, en la prctica slose observan estas tres transiciones. Las bandas de absorcin aparecenaproximadamente (existen otros trminos despreciables) a frecuencias: (la bandafundamental), 2 y 3 (los sobretonos) [2]. Estos ltimos tienen una menorintensidad que la banda fundamental. Tambin se producen bandas comoconsecuencia de la interaccin de dos vibraciones diferentes:

    ...2211 = nncomb

  • 8/6/2019 Ir en La Petroquimica

    38/222

    Captulo 2

    22

    Una molcula poliatmica (n tomos) tiene 3n-6 modos de vibracin diferentes(3n-5 si la molcula es lineal). Cada uno de estos modos de vibracin viene

    representado por una curva de energa potencial diferente y da lugar a una bandafundamental y sus correspondientes sobretonos en el infrarrojo. Los modos devibracin que se pueden producir incluyen: cambios en la distancia de enlace(elongaciones ostretching , que pueden ser simtricas o asimtricas) y cambios enel ngulo de enlace, obending (simtricas en el plano, asimtricas en el plano,simtricas fuera del plano y asimtricas fuera del plano) [4].

    2.1.2 Regiones espectrales

    Aunque el espectro infrarrojo se extiende desde 10 a 14 300 cm-1, desde unpunto de vista funcional se divide en tres zonas: IR lejano, donde se producen lasabsorciones debidas a cambios rotacionales, el IR medio (MIR o simplemente, IR),donde tienen lugar las vibraciones fundamentales y el IR cercano (near infrared, NIR), donde se producen absorciones debidas a sobretonos y combinaciones de lasbandas fundamentales.

    Tabla 1.Divisin del espectro IR, adaptado de ref. 2, pag 21.

    Regin Transicin caractersticaLongitud de onda

    (nm)Nmero de onda

    (cm-1)Infrarrojo cercano (NIR) Sobretonos y combinaciones 700-2500 14300-4000Infrarrojo medio (IR) Vibraciones fundamentales 2500 5 x 104 4000-200Infrarrojo lejano Rotaciones 5x104 106 200-10

    2.1.3 Tipos de medidas en infrarrojo

    Cuando la radiacin incide en la muestra (Fig. 5), sta puede sufrir diferentesfenmenos: absorcin, transmisin y reflexin. La intensidad de la luz transmitidaa travs de la muestra (P T ) es menor que la intensidad incidente (P 0). Una parte deesta intensidad incidente se ha reflejado (P R), mientras que otra parte ha sidoabsorbida por la sustancia (P A ).

  • 8/6/2019 Ir en La Petroquimica

    39/222

    Fundamentos tericos

    23

    P0

    PR PT

    1 2PA

    RT A PPPP ++=0 Fig. 5 Fenmenos de absorcin, transmisin y reflexin de la radiacinelectromagntica al interaccionar con la materia.

    La medida ms comn en el infrarrojo es la que se basa en la absorcin (o laintensidad transmitida), aunque tambin se han desarrollado espectroscopiasbasadas en el fenmeno de la reflexin como son la reflectancia total atenuada y lareflectancia difusa. A continuacin se describen estas tcnicas, que son las que sehan utilizado en el transcurso de la presente tesis.

    2.1.3.1 Absorcin/Transmisin

    El espectro por transmisin a travs de la muestra determinaP A, ya que estaprdida en la intensidad luminosa incidente est relacionada con la concentracinde la muestra. La transmitancia,T , se calcula como la fraccin de radiacin (P T /P 0)transmitida a travs de la muestra. La intensidad de absorcin de la luz,absorbancia ( A) se calcula como:

    T PP

    T A 0loglog ==

    La representacin de la transmitancia o de la absorbancia como una funcin de

    la longitud de onda,, o del nmero de onda , , es lo que conforma el espectro dela muestra. La relacin que existe entre la concentracin y la absorbancia estdescrita por la ley de Lambert-Beer:

    lc A =

  • 8/6/2019 Ir en La Petroquimica

    40/222

    Captulo 2

    24

    La absorcin de la radiacin por parte de la muestra es proporcional a lalongitud del camino ptico (anchura de la celda,l ) [en cm], a la concentracin de

    la solucin [mol/L] y a una constante proporcional especfica de cada muestra,, denominada absortividad molar, [L mol-1 cm-1]. Esta ley lineal se cumplenicamente para disoluciones diluidas (c a 0.1 M), pudindose producirdesviaciones de la linealidad a concentraciones ms elevadas al variar comoconsecuencia de cambios en el ndice de refraccin de la disolucin. Otrasdesviaciones de la linealidad tienen su origen en la propia instrumentacin:presencia de luz reflejada y dispersada, luz no estrictamente monocromtica o

    detectores de respuesta no lineal [5].

    2.1.3.2 Reflectancia total atenuada (attenuated total relflectance, ATR)

    El principio de esta medida se basa en el fenmeno de la reflexin total internay la transmisin de la luz a travs de un cristal con un elevado ndice de refraccin(Fig. 6). La radiacin penetra (unosm) ms all de la superficie del cristal donde

    se produce la reflexin total, en forma de onda evanescente [6]. Si en el ladoexterior del cristal se coloca un material absorbente (muestra), la luz que viaja atravs del cristal se ver atenuada (de ah el nombre de la tcnica) y se puederegistrar el espectro de la muestra.

    El ngulo de la luz incidente y la geometra del cristal facilitan que seproduzcan sucesivas reflexiones en sus caras internas. El espectro medido tiene una

    apariencia similar al espectro de transmisin, excepto por ciertas variaciones en laintensidad en funcin de la longitud de onda que se producen.

  • 8/6/2019 Ir en La Petroquimica

    41/222

    Fundamentos tericos

    25

    cristal

    (SeZn)muestra

    IRE

    reflectado

    crt

    crt

    normal

    incidente

    superficie

    aire cristal

    (SeZn)muestra

    IRE

    cristal

    (SeZn)muestra

    IRE

    reflectado

    crt

    crt

    normal

    incidente

    superficie

    aire

    reflectado

    crt

    crt

    normal

    incidente

    superficie

    aire

    Fig. 6. Reflexin total interna y elemento de reflexin interna (IRE) utilizado en elsistema ATR. Adaptado de ref. 6 pag. 321 y 324.

    La profundidad de penetracin [6],d p, depende de la longitud de onda de laradiacin,, del ndice de refraccin del cristal,n p, del ndice de refraccin de lamuestra,n s, y del ngulo de incidencia del haz de radiacin del cristal,, deacuerdo con la ecuacin:

    2 / 122 )(2 sp p p

    nsennd

    =

    donde n sp =n s / n p (n s

  • 8/6/2019 Ir en La Petroquimica

    42/222

    Captulo 2

    26

    2.1.3.3 Reflectancia difusa

    Otra medida que se basa en el fenmeno de la reflexin es la reflectancia difusa.

    Cuando la luz incide sobre una muestra opaca y no absorbente tiene lugar elfenmeno de la reflexin especular regido por las ecuaciones de Fresnel (Fig. 7a).

    a b ca b c Fig. 7.Procesos de reflexin en un material especular (a) o irregular (b). Fenmeno dereflectancia difusa (c). Adaptado de ref 2, pag. 44-45.

    La intensidad reflejada sobre el total incidente depende de los ndices derefraccin del aire y la muestra (n1 , n 2). Para el caso de un ngulo de incidenciaigual a cero la expresin es [2]:

    212

    212

    )()(

    nnnn

    PP

    O

    R

    +

    =

    Cuando la luz incide sobre una superficie irregular, se puede considerar que lafrontera entre el medio y la muestra est formado por una serie de pequeasinterfases orientadas en todos los ngulos posibles (Fig. 7b). De esta forma aunquecada una de estas pequeas interfases refleja la luz siguiendo la ley de Fresnel, elefecto global es una reflexin de la luz a cualquier ngulo (reflectancia difusa).

    La radiacin que se transmite a travs de la primera interfase (Fig. 7c) puedesufrir absorcin por parte de la muestra, por lo que la intensidad de la luz se veratenuada segn la ley de Beer. Esta radiacin que ha atravesado la primera capa departculas se difunde a las siguientes capas a travs de reflexiones aleatorias,refracciones y dispersin y puede sufrir nuevos fenmenos de atenuacin. Lalongitud de camino ptico seguido por la luz es muy difcil de describir

  • 8/6/2019 Ir en La Petroquimica

    43/222

    Fundamentos tericos

    27

    matemticamente, sobre todo si las partculas de la muestra tienen tamaosheterogneos, por lo que no se ha desarrollado una teora rigurosa de la reflectanciadifusa. S que existen teoras basadas en la prctica, la ms conocida la de Kubelka-Munk [7]. Esta teora propone para una capa completamente opaca y de grosorinfinito:

    sc

    sk

    R

    R ==

    2)1( 2

    donde

    R es la reflectancia de la capa infinitamente gruesa, yk y s son las

    constantes descattering y absorcin, respectivamente. El coeficiente de absorcin(k ), es igual a la concentracin multiplicada por la absortividad definida en la leyde Beer ( c).

    En la prctica la reflectancia difusa se mide respecto a un estndar noabsorbente y a continuacin se calcula el logaritmo para llegar a una relacin lineal

    con la concentracin [8]:

    sc

    R R R

    R += standstand log

    1loglog

    R y stand R representan la reflectancia de la muestra y del estndar respectivamente

    (siendo mayor la reflectancia del estndar que la de la muestra). Para la luz

    monocromtica standlog R es constante y puede ser ignorado. Si se cumple la

    condicin de aditividad del espectro, la expresin anterior puede ser reescritacomo:

    Rs

    k c1log

    +=

  • 8/6/2019 Ir en La Petroquimica

    44/222

    Captulo 2

    28

    Con lo que, cmo en el caso de la ley de Beer, existe una relacin entre laconcentracin y la radiacin medida en el espectro. Aunque existe el inconveniente

    de ques no es constante y depende de varias propiedades de la muestra, como eltamao de partcula y el contenido de humedad. Al aumentar el tamao medio de

    partcula ( d s / 1 ) se produce una reduccin delscattering y la radiacin penetrams profundamente en la muestra, con lo que el log(1/R) aumenta. El efecto es undesplazamiento a lo largo del eje de ordenadas como funcin del tamao departcula. Adems elscattering de las partculas pequeas depende de la longitudde onda, lo que provoca que el desplazamiento debido al tamao de partcula no

    sea constante en todo el espectro.

    La presencia de agua en el espectro provoca la aparicin de bandascaractersticas, y adems afecta a la totalidad del espectro debido a la variacin quese introduce en el ndice de refraccin del medio (no), provocando un aumento delog(1/R). Puesto que el grado de humedad puede variar entre muestras, en laprctica la constante descattering (s) se convierte en una incgnita para cada una

    de las nuevas muestras, por lo que no se puede llevar a cabo el anlisis cuantitativo.

    2.2 INTERPRETACIN DE ESPECTROS

    2.2.1 Asignacin de bandas

    En el espectro infrarrojo medio, entre 4000 y 1300 cm-1 (regin de frecuenciasde grupo) se observan una serie de bandas asignadas a vibraciones de slo dos

    tomos de la molcula. En este caso la banda de absorcin se asocia nicamente aun grupo funcional y a la estructura molecular completa, aunque hay influenciasestructurales que provocan desplazamientos significativos en la frecuencia de lavibracin. Esta vibraciones derivan de grupos que contienen hidrgeno (C-H, O-H,y N-H) o grupos con dobles y triples enlaces aislados. Entre 1300 y 400 cm-1 ( fingerprint region ) la asignacin a grupos funcionales determinados es ms difcildebido a la multiplicidad de bandas, pero es una zona de espectro muy til para la

  • 8/6/2019 Ir en La Petroquimica

    45/222

    Fundamentos tericos

    29

    identificacin de compuestos especficos [9]. La Fig. 8 muestra un cuadro resumende las frecuencias de absorcin de los grupos funcionales ms comunes en el IRmedio. En el espectro de infrarrojo cercano, predominan las bandas debidas asobretonos y combinaciones de enlaces en los que participa el hidrgeno (debido aque aumenta el grado de anarmonicidad de la vibracin), en la Fig. 9 se muestra uncuadro resumen de las absorciones ms habituales en el infrarrojo cercano.

    2 4 6 8 10 12 14 16

    Regin de frecuenciasde grupo

    Fingerprint region

    flexin C-H

    flexin N-H

    tensin C-C

    tensin C-N

    tensin C-O

    flexin O-H

    flexin C-H

    flexin N-H

    tensin CC

    tensin C=N

    tensin C=O

    tensin CC, CN

    tensin C-H

    tensin O -H, N-H

    4004000 2000 1500 1000 800

    25

    Nmero de onda (cm-1)

    Long. de onda (m)2 4 6 8 10 12 14 16

    Regin de frecuenciasde grupo

    Fingerprint region

    flexin C-H

    flexin N-H

    tensin C-C

    tensin C-N

    tensin C-O

    flexin O-H

    flexin C-H

    flexin N-H

    tensin CC

    tensin C=N

    tensin C=O

    tensin CC, CN

    tensin C-H

    tensin O -H, N-H

    4004000 2000 1500 1000 800

    25

    Nmero de onda (cm-1)

    Long. de onda (m) Fig. 8.Frecuencias de vibracin en el infrarrojo medio. Adaptado de ref. 9, pag. 556.

    1000 1500 2000 2500

    CH3

    CH

    C-H aromtico

    CH2

    CH

    C=CH

    R CH CH2CH2

    Long. de onda (nm)1000 1500 2000 2500

    CH3

    CH

    C-H aromtico

    CH2CH2

    CHCH

    C=CH

    C=CH

    R CH CH2CH2

    R CH CH2CH2

    Long. de onda (nm) Fig. 9.Frecuencias de vibracin en el infrarrojo cercano. Adaptado de ref. 2, pag. 28.

    En el NIR las bandas de absorcin no estn tan bien definidas como en elinfrarrojo medio, apareciendo en forma de bandas ancha y solapadas entre si, por lo

  • 8/6/2019 Ir en La Petroquimica

    46/222

    Captulo 2

    30

    que es ms difcil realizar una asignacin a un componente o grupo funcionalconcreto de la muestra. Las bandas tienen una menor intensidad (la absortividad de

    la muestra es menor), por lo que se debe trabajar con caminos pticos ms largos,de 0.5 a 10 mm, frente a los 10-50m utilizados en el infrarrojo medio.

    50010001500200025003000350040000

    0.5

    1

    nmero de onda (cm-1)

    a b s o r b a n c i a

    70008000900010000110000

    0.5

    1

    nmero de onda (cm-1)

    a b s o r b a n c i a IR cercano

    IR medio

    Fig. 10.Comparacin entre el espectro IR y NIR del ciclohexano.

    2.2.2 Segunda derivada de los espectros

    Una aproximacin alternativa al problema de la superposicin de picos y a la

    correccin de la lnea base es el uso de la segunda derivada del espectro. Laprimera derivada del espectro se puede calcular muy fcilmente restando lasabsorbancias a longitudes de onda adyacentes (en el caso de longitudes de ondaequidistantes). La segunda derivada se obtiene aplicando de nuevo este proceso. Lasegunda derivada tiene ciertas caractersticas muy interesantes: tiene mnimos en laposicin de las bandas de absorcin del espectro original, facilitando en granmedida la resolucin de los picos solapados. Adems, tambin elimina problemas

  • 8/6/2019 Ir en La Petroquimica

    47/222

    Fundamentos tericos

    31

    en la lnea de base. Sus principales desventajas son que disminuye la relacinseal/ruido y aumenta la complejidad del espectro. Debido a que la diferenciacines una operacin lineal, la ley de Lambert-Beer sigue siendo vlida en el espectroderivado, por lo que ste puede ser utilizado para determinaciones cuantitativas.

    longitud de onda

    a b s o r b a n c i a

    longitud de onda

    2 a d e r i v a

    d a

    Fig. 11.Resolucin de dos bandas solapadas a travs de la segunda derivada.

  • 8/6/2019 Ir en La Petroquimica

    48/222

    Captulo 2

    32

    2.3 FUNDAMENTOS QUIMIOMTRICOS

    2.3.1 Introduccin

    El progresivo aumento de la complejidad de la instrumentacin analtica hapermitido obtener volmenes de datos cada vez mayores. La conversin de estosdatos en informacin til requiere del uso de herramientas matemticas yestadsticas, que se han agrupado en la disciplina denominada Quimiometra [10,11, 12, 13, 14]. Este apartado presenta brevemente la base terica de lasherramientas quimiomtricas utilizadas en la presente tesis.

    En primer lugar se introduce la descomposicin en componentes principales (oPCA, del ingls principal components analysis ) ya que es una tcnica conmltiples aplicaciones quimiomtricas, como la calibracin (regresin sobrecomponentes principales, PCR), el preprocesado de la respuesta, el anlisis deagrupaciones, etc. Despus se hace un repaso de los pretratamientos de losespectros utilizados a lo largo de la tesis y por ltimos se presentan losfundamentos as como otros aspectos de carcter ms prctico de la calibracinmultivariante, como el control estadstico o la estandarizacin de los modelosdesarrollados.

    2.3.2 Descomposicin en componentes principales (PCA)

    Al utilizar mtodos espectroscpicos se obtienen respuestas de cada muestrapara cientos o miles de variables, en este caso longitudes de onda. La matriz,R I x J ( I filas por J columnas) representa las respuestas de I muestras analizadas a J longitudes de onda diferentes. El elevado nmero de variables J que caracterizancada muestra impiden un anlisis y representacin grfica sencillos de las muestras.

    En este caso, el mtodo de descomposicin en componente principales [15] esmuy til, porque permite representar la variabilidad presente enR, en unos pocos

  • 8/6/2019 Ir en La Petroquimica

    49/222

    Fundamentos tericos

    33

    factores (o componentes principales) que son combinaciones lineales de lasvariables originales.

    Variable 1

    Variable 2

    PC 2PC 1

    Fig. 12.Representacin grfica de la descomposicin en componentes principales de unconjunto de muestras definidas por dos nicas variables. En este sencillo ejemplo ladescomposicin consiste en un simple cambio de ejes (componentes principales).

    El anlisis en componentes principales proporciona una aproximacin a lamatrizR como un producto de dos matrices: la matriz descores , T y la matriz deloadings , P, que capturan la estructura de los datos deR. Losscores capturan laestructura de las filas o lo que es lo mismo, las relaciones entre objetos (muestras)y losloadings retienen la relacin existente entre las variables.

    ETPR += T

  • 8/6/2019 Ir en La Petroquimica

    50/222

    Captulo 2

    34

    = +R T E

    I I I

    J J J

    PT

    A

    A

    = +R T E

    I I I

    J J J

    PT

    A

    A

    Fig. 13.Notacin matricial de la descomposicin en componentes principales.

    El anlisis de componentes principales (PCA) se aplica frecuentemente cuandose trabaja con datos colineales. Esta colinealidad en los datos significa que lainformacin principal de las variablesR se puede condensar en un conjunto mspequeo de A variables. Cada una de estas nuevas A variables se denominacomponente principal o factor. El conjunto de factores se puede ver ms

    claramente si se representa el producto TTP como la suma de A trminos de la

    forma Taa pt , que corresponden a cada una de las A columnas de las matricesT y

    P.

    EptptptR ++++= TT22T11 ... A A

    = ++R

    p1T

    t At1 E

    I I I I

    J J J J

    t2

    I

    J

    +...+

    p2T p AT

    = ++R

    p1T

    t At1 E

    I I I I

    J J J J

    t2

    I

    J

    +...+

    p2T p AT

    Fig. 14. Notacin matricial extendida de la descomposicin en componentesprincipales.

    El primer componente principal es aqul que explica una mayor cantidad de la

    informacin contenida enR (maximiza 1T11TT1 ttRpRp = ). El siguiente factor

    2p , explica la mxima informacin deR no contenida enp1 (maximiza

  • 8/6/2019 Ir en La Petroquimica

    51/222

    Fundamentos tericos

    35

    2T22

    TT2 ttRpRp = y es ortogonal al primer componente principal, esto es

    02T1 =tt ). Los sucesivos factores explican cada vez menos informacin y son

    ortogonales a los anteriores. Las condiciones de ortogonalidad descores y loadings se pueden resumir como:

    IPP =T )(diagT a=TT o bien Aaaaa ...2,1T == tt

    Si la matrizR est centrada, entoncesa representa los valores propios de la

    matriz RRT , y los vectores ap representan sus vectores propios. Esto significa

    que losloadings satisfacen la ecuacin:

    aaa pRpR T =

    La magnitud de los valores propios indica la cantidad de variabilidad(informacin) que retiene cada uno de los componentes principales.

    El anlisis en componentes principales es muy til para la interpretacin dedatos multivariantes. Por un lado, la representacin de losscores permite establecerrelaciones entre las muestras, permitiendo as la deteccin de muestras discrepantesy agrupaciones. Por otra parte, losloadings permiten comparar y estudiar lainfluencia de las distintas variables (longitudes de onda en este caso).

    2.3.3 Tcnicas de pretratamiento de datos

    El pretratamiento de la seal es uno de los primeros pasos que se lleva a cabo enel anlisis de datos multivariantes. Consiste en manipulaciones matemticas que seaplican antes de cualquier otro tipo de anlisis y tratan de anular o, al menosreducir, fuentes de variabilidad en la seal, ya sea de carcter aleatorio (como el

  • 8/6/2019 Ir en La Petroquimica

    52/222

    Captulo 2

    36

    ruido) o de carcter sistemtico (variaciones en la lnea base, etc.), que no estnrelacionadas con el analito o la propiedad de inters.

    2.3.3.1 Centrado

    El centrado de una variable consiste en la sustraccin del valor medio a todossus elementos. En el caso de los datos espectrales el centrado consiste en restar alespectro de cada una de las muestras el espectro medio. Este pretratamiento ponede relieve las diferencias entre espectros, al haber eliminado la tendencia comn (elespectro medio). Se utiliza tanto en PCA como en PCR o PLS.

    -1 0 1-1

    0

    1

    -1 0 1-1

    0

    1

    1500 2000 2500-2

    0

    2

    long. de onda (nm)

    l o g

    ( 1 / R )

    1500 2000 2500-0.2

    0

    0.2

    long. de onda (nm)

    l o g

    ( 1 / R ) dc

    ba

    Fig. 15.Centrado por columnas. a) Objetos definidos por dos variables. b) Los mismosobjetos centrados. c) Espectro de 12 muestras de alcohol polivinlico (PVA). d) Los

    mismos espectros de PVA centrados.

    2.3.3.2 Suavizado

    La aplicacin de tcnicas de suavizado tienen el objeto de reducirmatemticamente el ruido aleatorio que acompaa a la seal analtica. Aunqueexisten otros mtodos ms sencillos como el de la media mvil, en esta tesis se ha

  • 8/6/2019 Ir en La Petroquimica

    53/222

    Fundamentos tericos

    37

    utilizado una herramienta basada en un ajuste polinmico mvil, como es el filtrode Savitzki-Golay [16]. Este suavizado consiste en interpolar un polinomio degradon cada serie dem puntos de la seal, de forma que el valor de la respuesta encada punto se reemplaza por una combinacin lineal de los puntos vecinos. Estemtodo, al requerir el uso de 2m+1 valores para el clculo de cada valor de la sealcorregida, provoca el truncamiento del espectro en sus extremos, perdiendo 2m+1valores en cada aplicacin. Este problema se resuelve en la generalizacinpresentada por P. A. Gorry [17], que es el mtodo utilizado en el transcurso de estatesis.

    long. de onda

    s e a l

    seal originalseal suavizada

    Fig. 16. Suavizado de una seal espectroscpica utilizando una ventana de 21puntos y un polinomio de 3er grado.

    2.3.3.3 Correccin de la lnea base

    Aparte de fuentes de variabilidad de alta frecuencia, como sera el ruido, laseal medida puede contener fuentes de variabilidad de baja frecuencia, norelacionadas con la propiedad de inters, y que se denominan variaciones de lalnea base. A continuacin se presentan las diferentes herramientas que se hanutilizado en la presente tesis para corregir la variacin de la lnea base.

  • 8/6/2019 Ir en La Petroquimica

    54/222

  • 8/6/2019 Ir en La Petroquimica

    55/222

    Fundamentos tericos

    39

    la Fig. 18 se muestra un ejemplo esquemtico de una correccin utilizando unpolinomio de 1er grado.

    sealcorregida- =

    sealmedida

    lnea base

    y = bo + b1 xseal

    corregidaseal

    corregida- =sealmedida

    lnea base

    y = bo + b1 x

    lnea base

    y = bo + b1 x

    Fig. 18. Esquema del proceso de correccin de la lnea base utilizando un modeloexplcito lineal (detrendig ).

    Derivadas

    El uso de derivadas [20] consigue diferenciar mejor picos solapados y eliminadesplazamientos lineales y cuadrticos de la lnea base. La primera derivada seobtiene como la diferencia entre las absorbancias, A, a dos longitudes de onda

    consecutivas (1 y 1+):

    = +11 A AdA

    La derivada reduce la correlacin entre variables y el efecto la dispersindebido al tamao de las partculas. Presenta el inconveniente de magnificar el ruidoen la seal, por lo que habitualmente se utiliza en combinacin con mtodos de

    suavizado de la seal, como el del ajuste polinmico mvil, presentado en elapartado 2.3.3.2. Derivadas de orden superior se obtienen aplicando sucesivamentela derivada, aunque no suelen utilizarse superiores a orden 2 (segunda derivada), yaque decrece la relacin seal-ruido (S/N).

  • 8/6/2019 Ir en La Petroquimica

    56/222

    Captulo 2

    40

    1150 1200 1250 1300 1350 1400 1450 1500 1550-0.02

    0

    0.02

    long. de onda (nm)

    S G - d e r

    i v a d a

    1150 1200 1250 1300 1350 1400 1450 1500 15500

    0.20.4

    0.6

    A b s o r b a n c i a

    1150 1200 1250 1300 1350 1400 1450 1500 1550-0.02

    0

    0.02

    D e r

    i v a d a

    Fig. 19. Ejemplo de la derivada de un espectro de nafta (arriba), sin utilizar unsuavizado (en medio) y utilizando un suavizado de Savitzki-Golay (abajo).

    2.3.3.4 Correccin del ligth scatteingEn la familia de preprocesados que corrigen los efectos multiplicativos (ligth

    scatteing ), que se producen en la espectroscopia por reflectancia comoconsecuencia de la variacin en el tamao de partcula, se encuentran dostransformaciones, lastandard normal variate (SNV) [21] y lamultiplicative scatter correction (MSC) [22, 12,23, 24]. La principal diferencia entre ambos mtodos esque el SNV se aplica a cada espectro independientemente, mientras el MSC

    requiere que se defina un espectro de referencia. La transformacin SNV estdefinida como:

    1)( 2,

    ,,

    = J

    r r

    r r r

    ji ji

    i jiSNV ji

  • 8/6/2019 Ir en La Petroquimica

    57/222

    Fundamentos tericos

    41

    donde jir , representa la respuesta (absorbancia) de la muestrai a la longitud de

    onda j , ir , representa la media de las respuestas de la muestrai, J el nmero totalde longitudes de onda ySNV jir , representa el espectro corregido.

    La transformacin MSC se basa en el hecho emprico que, para un conjunto demuestras similares, el valor de la absorbancia est linealmente relacionado con lamedia de los valores espectrales (con la media tomada sobre todas las muestras).Primero se realiza una regresin de la respuesta de cada muestra a la longitud de

    onda j , jir , , sobre la respuesta media de todas las muestra a esa longitud de onda,

    jr :

    ji jii ji er bcr ,, ++= con =i

    ji j

    I

    r r ,

    Y la seal transformada final, MSC ji

    r ,

    , se obtiene como:

    i

    i ji MSC

    b

    cr r

    ji ,

    ,

    =

    Hellandet al. [25] realizan una comparacin de estos dos mtodos y concluyen

    que estn ntimamente relacionados, y que los resultados de aplicar una u otracorreccin son muy similares en trminos de habilidad de prediccin.

  • 8/6/2019 Ir en La Petroquimica

    58/222

    Captulo 2

    42

    1200 1400 1600 1800 2000 2200 2400-0.2

    0

    0.2

    long. de onda (nm)

    S N V + D T

    l o g

    ( 1 / R )

    1200 1400 1600 1800 2000 2200 2400-0.1

    0

    0.1

    long. de onda (nm)

    M S C + D T l o g

    ( 1 / R )

    Fig. 20. Comparacin de las transformaciones SNV (arriba) y MSC (abajo), en lasmuestras de alcohol polivinlico.

    2.3.4 Etapas de la calibracin multivariante

    Entre los mtodos quimiomtricos que mayor xito han tenido en lasaplicaciones industriales se encuentra los dirigidos a cuantificar (calibracinmultivariante). Las etapas para llevar a cabo una regresin multivariante a partir dedatos espectroscpicos propuestas por la ASTM en sus prcticas estndar [26] son:

    1. Seleccin del conjunto de muestras de calibracin.2. Establecimiento del modelo.3. Validacin del modelo de calibracin.4. Prediccin de muestras desconocidas.5. Monitorizacin y transferencia.

    2.3.4.1 Seleccin del conjunto de calibracin

    El conjunto de calibracin, tambin denominado conjunto de entrenamientodebe contemplar todas las fuentes de variabilidad del sistema [27], tanto fsicascomo qumicas. Para conseguir este objetivo de una forma rigurosa, se ha

  • 8/6/2019 Ir en La Petroquimica

    59/222

    Fundamentos tericos

    43

    propuesto el uso de estrategias de diseo de experimentos [27], aunque lacomplejidad de las muestras reales raramente permite aplicar esta aproximacin.

    La situacin ms comn es contar con un amplio conjunto de muestrascandidatas a las que se ha medido el espectro y la propiedad de inters. En estecaso se han propuesto tcnicas de seleccin de muestras basadas en el anlisis deagrupaciones (cluster analysis ) [28], o algoritmos de seleccin de muestras como elde Kenard-Stone [29], para decidir qu espectros NIR representan mejor lapoblacin total.

    La presencia de agrupaciones destacadas en el conjunto de calibracin puedeconducir a errores, por lo que es importante analizar los datos y si se detecta unaagrupacin severa se debe evaluar si es ms adecuado construir un modelo globalpara todas las muestras, o bien es necesario dividir en grupos las muestras y crearmodelos diferentes para cada grupo. La deteccin de agrupaciones se puederealizar mediante una simple inspeccin visual de losscores PCA. Tambin se hanpropuesto criterios grficos para detectar agrupaciones, como las curvas dedistancias (distance curves ) [30] o criterios numricos, como el estadstico deHopkins, H , [31, 32], que se aplica a losscores de la descomposicin PCA y sebasa en la comparacin de la distancia euclidiana entre un objeto y su vecino msprximo (W ) y la distancia entre un objeto artificial, distribuido aleatoriamente enel espacio, y el objeto real ms prximo (U ). La eleccin del objeto real y artificialse realiza varias veces (iteraciones) para un porcentaje de la poblacin total deobjetos.

    ==

    =

    += N

    ee

    N

    ee

    N

    ee

    W U

    U H

    11

    1

  • 8/6/2019 Ir en La Petroquimica

    60/222

    Captulo 2

    44

    El valor de H oscila entre 0.5 para un conjunto de objetos distribuidoshomogneamente (las distancias U y W son muy parecidas) hasta 1 para un

    conjunto con agrupaciones muy marcadas (U>>W).

    -1 -0.5 0 0.5 1-1

    -0.5

    0

    0.5

    1H=0.50 (0.45-0.55)

    -1 -0.5 0 0.5 1-1

    -0.5

    0

    0.5

    1H=0.91 (0.89-0.92)

    Fig. 21.Estadstico de Hopkins en el caso de un conjunto de muestras homogneo(H=50) y en el caso de un conjunto de muestras agrupadas H prximo a 1.

    2.3.4.2 Establecimiento del modelo

    En los modelos multivariantes inversos, la concentracin (o cualquier otrapropiedad de la muestra) se modela en funcin de la respuesta (en este caso elespectro IR) de la forma:

    k

    J

    jk j jk ebr c +=

    =1,

    donde k c es la concentracin del analitok en la muestra, jr es la respuesta de la

    muestra en la variable j , k jb , es el coeficiente que relaciona la variable j con laconcentracin del analitok y k e es el trmino del error no modelado por el

    modelo. Utilizando una notacin matricial, en la etapa de calibracin con I muestras, este modelo se puede escribir como:

    eRbc +=

  • 8/6/2019 Ir en La Petroquimica

    61/222

    Fundamentos tericos

    45

    = +c R

    I I

    1 J

    b

    J

    1

    e

    I

    1

    dondec es el vector de las concentraciones del analito para las I muestras decalibracin,R es la matriz de las respuestas de las I muestras en las J variables,b

    el vector de los coeficientes de regresin ye el vector de los errores o residuales.

    El vector de coeficientes de regresin se obtiene en la etapa de calibracincomo:

    cRb +=

    dondeR+ es la matriz pseudoinversa deR. La forma en la que se calcula estamatriz pseudoinversa difiere segn el mtodo de calibracin utilizado. Por ejemplo,en el caso de la calibracin multivariante inversa (ILS),R+ se obtiene por la

    solucin de mnimos cuadrados clsicos, T1T RR)(RR + = .

    Los mtodos de descomposicin sobre factores o componentes principales,como la regresin por mnimos cuadrados parciales (Partial Least Squares , PLS),

    solucionan el problema de la colienealidad en los datos (muy habitual en datosespectroscpicos) ya que descomponen la matriz de respuestas,R, en una serie defactores ortogonales entre s, lo que evita los problemas de la inversin de la matrizRTR.

  • 8/6/2019 Ir en La Petroquimica

    62/222

    Captulo 2

    46

    A continuacin se presenta muy brevemente el algoritmo de obtencin delmodelo PLS, la forma en que se selecciona el nmero ptimo de factores as como

    las herramientas para detectar observaciones anmalas (deteccin deoutliers ).

    Regresin por mnimos cuadrados parciales (PLS)

    La regresin por mnimos cuadrados parciales realiza una descomposicin enfactores, como el anlisis de componentes principales (PCA), pero utiliza lainformacin de la concentracin en la descomposicin de la matriz de respuestas,R. El primer factor describe la direccin de mxima varianza enR, que al mismo

    tiempo se correlaciona con la concentracin.

    El procedimiento para realizar la descomposicin de la matriz de las respuestas,consta de los pasos siguientes:

    1) Calcular los,loadings y scores ,:

    cRcR

    p TT

    1h

    h

    h =+

    1

    11

    +

    ++ =

    hh

    hhh pR

    pRt

    donde representa la norma del vector.

    2) Calcular la matriz residualRh+1 segn:

    )()( T 11T 111 +++++ = hh J hhh I h ppIRttIR

    dondeI es la matriz identidad de dimensin I .

  • 8/6/2019 Ir en La Petroquimica

    63/222

    Fundamentos tericos

    47

    Estos dos pasos iniciales se calculan desdeh = 0 hasta el nmero decomponentes principales que se quiere calcular. Para el casoh = 0 , R0 es la matrizde datos original.

    Los vectorest y p calculados para cada valor deh forman, respectivamente, lascolumnas de las matrices ortonormalesT y P, que se utilizan a continuacin parainvertir la matrizR.

    3) Calcula una nueva matriz,Q, de la forma siguiente:

    Q = TT R P

    a la que se le aplica la descomposicin en valores singulares (SVD) [33], demanera que:

    Q = U VT

    ComoT y P son ortonormales se cumple tambin que:

    R = T Q PT

    Por tanto, la matriz originalR se puede reconstruir como:

    R = TUT VPT

    y la pseudoinversa se obtiene a partir de la ecuacin siguiente:

    R+ = PV -1 (TU)T

  • 8/6/2019 Ir en La Petroquimica

    64/222

    Captulo 2

    48

    Factores a incluir en el modelo

    Se debe decidir el nmero de factores o componentes principales que ser

    utilizado en el modelo final, o lo que es lo mismo, determinar el tamao ptimo delmodelo. Esta eleccin se basa en el clculo de un error de prediccin medio paramodelos que incluyen cada vez ms factores (1, 2 ... A) y en el estudio de laevolucin de este error de prediccin medio. Si se dispone de un conjuntoindependiente de muestras, no utilizado en la calibracin, se puede calcular la razcuadrada del error medio de prediccin ( Root-Mean-Square Error of Prediction ,RMSEP), para el conjunto de I P muestras que no han participado en la calibracin:

    P

    1

    2)(

    I

    cc RMSEP

    I

    iii

    =

    =

    donde ic y ic representan la concentracin determinada de forma independiente y

    la concentracin predicha por el modelo respectivamente. Si no se dispone de unconjunto independiente de muestras se puede utilizar el mtodo de la validacincruzada ocross-validation [34, 35], en la que sucesivamente se va dejando unaparte de las muestras fuera del conjunto de calibracin, se realiza el modelo con lasmuestras restantes y se predicen las muestras descartadas.

    Este proceso permite obtener predicciones independientes sin renunciar al usode toda la informacin (muestras) disponible en el conjunto de calibracin. En estecaso se obtiene un error de prediccin similar al RMSEP, que se denomina razcuadrada del error medio de validacin cruzada (o Root-Mean-Square Error of Cross-validation , RMSECV) :

  • 8/6/2019 Ir en La Petroquimica

    65/222

    Fundamentos tericos

    49

    I

    cc

    RMSECV

    I

    iii

    =

    =1

    2)(

    Existen en la literatura diferentes criterios para la seleccin del nmero ptimode factores en los modelos de calibracin. Un primer criterio muy simple consisteen representar el RMSEP (o el RMSECV) frente al nmero de factores del modeloy tomar como ptimo el primer mnimo local o el mnimo absoluto. Este es un

    criterio que puede conducir fcilmente a sobreajustes y subajustes, por lo que no esrecomendable usarlo. Existen otros criterios de seleccin ms formales [36]basados en comparacionesF [37, 38] que proporcionan una base ms fiable para laseleccin del nmero de factores a incluir en el modelo.

    Deteccin de outliers

    Una de las ventajas de los mtodos multivariantes sobre los tradicionales

    univariantes, es la capacidad que tienen de detectar la observacin u observacionesinconsistentes con el resto de los datos [39]. En la etapa de establecimiento delmodelo se puede utilizar informacin de la influencia de los objetos en el conjuntode calibracin (leverage ) y de los residuales, tanto en la propiedad de inters comoen la respuesta instrumental [12]. La deteccin de losoutlier en esta etapa esimportante porque la inclusin de estas muestras discrepantes en el modelo degradasu capacidad predictiva.

    Leverage . Es una medida de la posicin (o influencia) de una muestra en relacinal modelo. Muestras con un elevado valor deleverage estn muy alejadas delcentro del modelo, por lo que tendrn una influencia muy alta sobre el mismo. Estevalor se calcula como:

    iii I

    h tTTt 1TT )(1 +=

  • 8/6/2019 Ir en La Petroquimica

    66/222

    Captulo 2

    50

    dondeti representa el vector descores de la muestrai, T, la matriz descores delmodelo y I el nmero de muestras de calibracin. Se proponen diferentes niveles

    umbral, los ms aceptados son dos o tres veces elleverage medio de calibracin,que es igual a 1+ A / I [12], siendo A el nmero de componentes principales ofactores utilizados en el modelo.

    Residuales en la respuesta instrumental. Los residuales en la respuesta (oresiduales espectrales) reflejan la falta de ajuste entre las respuestas experimentalesutilizadas en la calibracin,R, y las respuestas reconstruidas por el modelo con A

    factores (T

    TPR = ).

    TTPRE =

    long. onda

    a b s o r b a n c i a

    espectro real

    long. onda

    a b s o r b a n

    c i a

    reconstruido con 4 factores

    -4

    0

    4

    8x 10 3

    long. onda

    a b s o r b a n c i a

    residuales espectrales

    Fig. 22.Ejemplo del clculo del residual de un espectro NIR. Al espectro original se leresta el espectro reconstruido con 4 factores para obtener el residual espectral.

    Los residuales en la respuesta se pueden utilizar de diferentes formas. La ms

    habitual es, para el error en la respuesta de la muestrai, ei, realizar una suma decuadrados extendida a las J longitudes de onda y dividir por los grados de libertad

    (df) adecuados, para obtener una desviacin estndar de la muestrai, 2)( is e .

  • 8/6/2019 Ir en La Petroquimica

    67/222

    Fundamentos tericos

    51

    I

    e

    s

    J

    j ji

    i / df

    )(1

    2

    2

    =

    =e con df = I J J A (max ( I , J ))

    Tambin se utilizan los residuales en la respuesta para realizar distintos testF ,que comparan la suma de cuadrados de los residuales para el conjunto decalibracin y para la muestrai [37,14]

    Residuales en la concentracin. En la etapa de establecimiento del modelo sedispone del valor de la concentracin (o la propiedad de inters) determinado por elmtodo de referencia. Los residuales en la concentracin comparan el valorpredicho por el modelo multivariantec con el valor considerado verdadero,c, queproporciona el mtodo de referencia.

    ccf =

    Muchas veces la deteccin deoutliers se realiza combinando estasherramientas, como en el grfico que se representa el residual (espectral o deconcentraciones) frente alleverage de las muestras [40, pag. 114].

  • 8/6/2019 Ir en La Petroquimica

    68/222

    Captulo 2

    52

    0 0.25 0.5 0.75 10

    0.25

    0.5

    0.75

    1

    leverage

    v a r . r e s i

    d u a l

    c

    ba

    Fig. 23. Grfico del residual frente alleverage . (a) Objetos con una varianza residualelevada se consideranoutliers , (b) si adems tienen unleverage alto son outliers peligrosos para el modelo, debido a que tienen mucha influiencia sobre l. Las muestrascon unleverage alto (c) son muestras influyentes y no necesariamenteoutliers .

    2.3.4.3 Validacin del modelo

    Los mtodos de calibracin sesgados, como PCR o PLS, no se apoyandirectamente en un modelo terico y pueden incorporar variabilidad de los datos nonecesariamente relacionada con la propiedad de inters, por lo que deben sercuantitativa o cualitativamente validados.

    La validacin consiste en el anlisis de un grupo de muestras independiente alutilizado en la calibracin y comprueba que no existe un error sistemtico (bias )entre las predicciones que realiza el modelo y los valores proporcionados por elmtodo de referencia. Tambin se mide el grado de concordancia entre laspredicciones del modelo y los valores del mtodo de referencia.

  • 8/6/2019 Ir en La Petroquimica

    69/222

    Fundamentos tericos

    53

    Test de la ausencia de sesgo

    La presencia de error sistemtico se comprueba mediante una regresin linealentre las concentraciones (u otra propiedad) reales, medidas por la tcnica dereferencia y las concentraciones predichas por el modelo multivariante. Si no existeerror sistemtico el resultado de esta regresin debera ser una recta de pendiente(b1) igual a 1 y ordenada en el origen (bo) igual a 0. Debido a la existencia de loserrores aleatorios se obtendrn valores deb1 y b0 ligeramente diferentes a losesperados. El test conjunto de la pendiente y la ordenada en el origen [41]comprueba si hay diferencia significativa entre los valores deb1 y b0 encontrados ylos valores esperados (1 y 0). Como tanto la concentracin determinada por elmtodo de referencia como la determinada por el modelo de calibracin est sujetaa un cierto error se puede modificar el test conjunto para que tenga en cuenta lapresencia de errores en ambos ejes [42].

    0 5 10 150

    5

    10

    15

    conc. real

    c o n c . p

    r e d i c h a

    y = 1.02 x -0.33

    -1.5 -1 -0.5 0 0.5 10.9

    0.95

    1

    1.05

    1.1

    1.15

    ordenada en el origen

    p e n d

    i e n t e

    (0.0,1.0)

    (-0.33,1.02)

    Fig. 24.Test conjunto de la pendiente y ordenada en el origen.

    Concordancia con el mtodo de referencia

    En la prctica, esta comparacin se realiza a travs de un error medio deprediccin, como el RMSEP. En caso de no disponer de un conjunto independientede muestras se puede utilizar el error obtenido por validacin cruzada, RMSECV.El valor de RMSEP o el RMSECV proporciona una estimacin de la exactitud

  • 8/6/2019 Ir en La Petroquimica

    70/222

    Captulo 2

    54

    (accuracy ) del modelo. Tanto el RMSEP como el RMSECV proporcionan unaestimacin del error que se comete al predecir muestras futuras [43].

    Error de prediccin individual o especfico

    Aunque en la mayora de aplicaciones se utiliza un nico valor de error(RMSEP o RMSECV) para representar la habilidad predictiva global del modelo,en la prctica, es interesante poder proporcionar una estimacin del error especficode cada determinacin, tal como se hace en la calibracin nivariante con losintervalos de prediccin. Se han propuesto diferentes aproximaciones para el

    clculo de este error especfico, como la utilizada en el programa Unscrambler [40,pag. 436, 44], que fue corregida por De Vries y col. [45] o la propuesta por Faber[46]:

    ( ) 2222222 1 uuu A Auc h I RRc bb ++++

    +=

    donde I es el nmero de muestras de calibracin,uh el leverage de la muestradesconocida. La varianza del anlisis de referencia (2c ), la varianza de la

    respuesta en calibracin (2R ) y para la nueva muestra (2

    uR ) se pueden calcular

    a partir de repeticiones; Ab es la norma euclidiana del vector de regresin para el

    modelo PCR o PLS de A factores; 2 y2u

    representan la varianza de la parte no

    modelada dec (los residuales del modelo) para la calibracin y la prediccin denuevos objetos respectivamente, y que pueden ser determinados a partir del error alcuadrado medio de calibracin (MSEC):

    2222MSEC Rc b ++= A

  • 8/6/2019 Ir en La Petroquimica

    71/222

    Fundamentos tericos

    55

    con

    1)(MSEC 1

    2

    ==

    A I

    cc

    I

    iii

    Faber y col. [47] utilizan esta expresin en una aplicacin prctica para ladeterminacin de compuestos oxigenados en gasolina. Algunos autores hancriticado esta expresin, planteando problemas como la falta de trminos

    especficos de la muestra (slo el leverage,uh , lo es) [44], o que no tiene en cuenta

    el sesgo [48]. Estas crticas han sido rebatidas por Faber [49].

    2.3.4.4 Prediccin de muestras desconocidas

    Una vez el modelo ha sido aceptado, ya puede ser utilizado para el anlisis denuevas muestras. En esta etapa se deben seguir utilizando los test para detectarmuestras discrepantes,outliers , con el fin de detectar la presencia deextrapolaciones al modelo, presencia de nuevos interferentes, fallos instrumentales,etc. En este caso se pueden utilizar medidas delleverage de las muestras, y delresidual espectral. Herramientas para el control estadstico multivariante, como elestadsticoT 2 de Hotelling y el estadsticoQ, que sern introducidas a continuacinpara su uso en el control estadstico del modelo multivariante, se pueden utilizartambin para la deteccin deoutliers , ya que proporcionan una informacin similaral leverage (el T 2) y al residual espectral (el estadsticoQ). Los residuales de laconcentracin (u otra propiedad de inters) no estn disponibles ya que estasmuestras no han sido analizadas por el mtodo de referencia. La deteccin de losoutliers en esta etapa es muy importante porque la prediccin de estas muestraspuede diferir significativamente del valor verdadero.

    2.3.4.5 Monitorizacin y transferencia

    Control de la estabilidad con el tiempo

    Para que este mtodo proporcione resultados vlidos no es suficiente con

  • 8/6/2019 Ir en La Petroquimica

    72/222

    Captulo 2

    56

    asegurar la exactitud del modelo en el momento de su desarrollo, sino que esnecesario controlar su estabilidad con el tiempo. Para llevar a cabo este control,

    una posible estrategia es realizar peridicamente comparaciones entre laspredicciones del modelo y los valores de referencia determinados por la tcnica dereferencia.

    Se pueden utilizar otras estrategias, que no requieren utilizar el mtodo dereferencia, si se dispone de una muestra estable. En ese caso se puede analizarperidicamente una muestra de control [50] y utilizar herramientas de control

    estadstico de procesos (statistical process control , SPC) [51] en el caso demedidas univariantes o de control estadstico de procesos multivariantes(multivariate statistical process control , MSPC) [52] en el caso de mltiplesmedidas.

    La base de cualquier grfico de control es la representacin del valor medido(directamente o despus de algn tipo de transformacin) respecto al tiempo. La

    decisin de si el sistema est bajo control estadstico o no, se realiza con la ayudade unos lmites de control, representados tambin en el grfico.

    SPC. Grficos de control de Shewhart

    Un grfico de control muy sencillo para respuestas univariantes es el grfico Xde control de Shewhart [53]. En este grfico se representan las observaciones ( xi)en el orden que se obtienen, el valor verdadero () o el x en una lnea central, y

    los lmites de control y aviso se sitan en3 y 2 respectivamente, donde representa la desviacin estndar de la poblacin . Este grfico puede ser utilizado,por ejemplo, para monitorizar la prediccin de una muestra de control por elmodelo multivariante.

  • 8/6/2019 Ir en La Petroquimica

    73/222

    Fundamentos tericos

    57

    MSPC. Estadsticos T 2 y Q

    Los grficos de control univariantes no aprovechan la potencialidad de lainstrumentacin analtica ya que no sirven para monitorizar al mismo tiempomltiples respuestas. Los grficos de control multivariante proporcionaninformacin adicional y son capaces de detectar situaciones de fuera de controldonde los grficos univariantes no pueden hacerlo. Esta metodologa dispone lasrespuestas multivariante de los sucesivos anlisis de la muestra en forma de matriz(X), cada fila representa una muestra y las columnas son las variables. Esta matrizse descompone mediante un anlisis de componentes principales (PCA). A partirde las matrices de losscores y losloadings se calculan diferentes estadsticos paracada muestra.

    Estadstico T 2 de Hotelling . Fue propuesto originariamente por Hotelling [54] ymide la variacin de cada muestra dentro del modelo PCA. Se calcula como lasuma de los cuadrados de losscores segn la ecuacin siguiente:

    TT-1ik k i

    2iT xPPx =

    dondexi es el vector de respuestas para la muestrai,Pk es la matriz deloadings y es una matriz diagonal que contiene los valores propios asociados a los vectorespropios incluidos en el modelo PCA. El lmite de control del grficoT 2 se calculasegn:

    ( )T

    k m

    m k F k m k m k , , , , 2 1

    =

    dondem es el nmero de anlisis de la muestra de control que se han utilizado paraconstruir el modelo PCA,k el nmero de componentes principales o factoresincluidos en el modelo PCA yF k,m-k, el valor de la distribucinF para k y m-k gados de libertad y una probabilidad de cometer un error de tipo I.

  • 8/6/2019 Ir en La Petroquimica

    74/222

    Captulo 2

    58

    El grficoT 2 monitoriza la distancia de una nueva medida al valor de referenciaen el espacio reducido de los factores PCA. Permite detectar si la variacin incluidaen los componentes principales considerados es ms grande que la que lecorrespondera si solo influyeran variaciones aleatorias. La interpretacin de estegrfico es la misma que cualquier grfico univariante; las muestras fuera de controlposeen un valor deT 2superior al lmite, y aparecen ms all de la lnea de control.

    Estadstico Q . Mide la falta de ajuste de la nueva muestra al modelo PCAdesarrollado. Se calcula mediante la ecuacin siguiente [55]:

    TTT )( ik k iiiiQ xPPIxee ==

    donde ie es la filai de la matriz de los residuales (E), I es la matriz identidad,Pk lamatriz de losk vectores deloadings incluidos en el modelo PCA yxi es el vectorfila de la respuesta de la muestrai.

    El lmite de control del grficoQ [56] se calcula segn:

    ( )Q

    c h h h h

    = + +

    1

    2 02

    1

    2 0 0

    12

    1

    21

    1 0

    donde

    3,2,1para1

    == +=

    in

    k j

    i ji

    y

    22

    310 3

    21=h

  • 8/6/2019 Ir en La Petroquimica

    75/222

    Fundamentos tericos

    59

    k es el nmero de componentes principales retenidos en el modelo, j el valorpropio asociado al componente principal j , n el nmero total de componentesprincipales yc la desviacin estndar normal correspondiente a un error de tipo I() fijado. El valor deQ indica el grado de ajuste de cada muestra al modelo PCAy da una medida de la variacin de la muestra no incluida en el modelo.

    Algoritmo de identificacin de sensores por eliminacin en sentido inverso

    (BESI). Una desventaja de la monitorizacin multivariante frente a la univariante esla dificultad que existe para determinar, en caso de una muestra fuera de control,que respuestas han sido las responsables de este comportamiento. Una posiblesolucin es el estudio de grficos de contribucin [57] o del vector de residuales. Elmtodo BESI, publicado por Stork y col. [58], es un algoritmo que detecta lasvariables con respuesta anmala que provocan el fuera de control en la variacinno explicada por el modelo. Este mtodo calcula una relacin entre valores deQ eliminando las variables sospechosas y el valorQ del lmite de control. Lasvariables sospechosas son eliminadas secuencialmente hasta que la muestra vuelvea estar bajo control estadstico.

    Mantenimiento de los modelos multivariantes

    El desarrollo de modelos de calibracin multivariantes supone un esfuerzoexperimental muy grande, ya que se requiere un elevado nmero de muestrasrepresentativas que deben ser analizadas por el mtodo instrumental y por el dereferencia. Por este motivo el periodo de validez y la sensibilidad a los cambios enlas condiciones experimentales de un modelo son parme