Upload
veronica-maynard
View
221
Download
0
Embed Size (px)
Citation preview
8/12/2019 Marcia_Val_Springer_doutorado.pdf
1/100
APLICAO DE INTELIGNCIA COMPUTACIONAL NA CARACTERIZAO
GEOQUMICA DE LEOS
Marcia Val Springer
Tese de Doutorado apresentada ao Programa de
Ps-graduao em Engenharia Civil, COPPE,
da Universidade Federal do Rio de Janeiro,como parte dos requisitos necessrios
obteno do ttulo de Doutor em Engenharia
Civil.
Orientador(es): Dbora de Almeida Azevedo
Luiz Landau
Rio de Janeiro
Dezembro de 2012
8/12/2019 Marcia_Val_Springer_doutorado.pdf
2/100
APLICAO DE INTELIGNCIA COMPUTACIONAL NA CARACTERIZAO
GEOQUMICA DE LEOS
Marcia Val Springer
TESE SUBMETIDA AO CORPO DOCENTE DO INSTITUTO ALBERTO LUIZ
COIMBRA DE PS-GRADUAO E PESQUISA DE ENGENHARIA (COPPE)
DA UNIVERSIDADE FEDERAL DO RIO DE JANEIRO COMO PARTE DOS
REQUISITOS NECESSRIOS PARA A OBTENO DO GRAU DE DOUTOR
EM CINCIAS EM ENGENHARIA CIVIL.
Examinada por:
________________________________________________Profa. Dbora de Almeida Azevedo, D.Sc.
________________________________________________Prof. Luiz Landau, D.Sc.
________________________________________________Dr. Eugnio Vaz dos Santos Neto
________________________________________________Profa. Celeste Yara dos Santos Siqueira, D.Sc.
________________________________________________Prof. Nelson Francisco Favilla Ebecken
RIO DE JANEIRO, RJ - BRASIL
DEZEMBRO DE 2012
8/12/2019 Marcia_Val_Springer_doutorado.pdf
3/100
8/12/2019 Marcia_Val_Springer_doutorado.pdf
4/100
iv
Dedico esta tese aos meus pais, ao meu querido irmo, a minha querida Tia Marizete,ao meu querido esposo Antonio pela pacincia do dia a dia e incansvel apoio, e
todas as pessoas que amo.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
5/100
v
"No existe sorte. Sorte quando a preparao encontra oportunidade".
(autor desconhecido)
8/12/2019 Marcia_Val_Springer_doutorado.pdf
6/100
vi
AGRADECIMENTOS
A Deus, graas sempre.
Aos meus pais, Luiz e Juara, por tudo sempre.
Ao meu esposo, Antonio, por seu amor, com amor sempre. Ele que foi o maissacrificado pelas minhas frequentes ausncias e indisponibilidades. Pelo apoioincondicional que me deu desde sempre.
Ao meu querido irmo, Marcus, um dos grandes incentivadores desta jornada.
A minha querida Tia Marizete, por seu apoio e carinho incondicional, estando
sempre ao meu lado.
A minha querida dinda, Regina, e prima, Juju, pelo incentivo.
A minha orientadora Dbora pela orientao, dedicao, compreenso e confianaprestadas a mim durante todos esses anos. Todo meu crescimento profissional,Mestrado e agora doutorado, foi regido por ela.
Ao coordenador do curso Sistemas Petrolferos Luiz Landau, pelo empenho deoferecer um curso altamente qualificado e por todo apoio fornecido.
A todos os professores que compartilharam os conhecimentos e experinciasprofissionais.
A minha querida amiga Tatiana, pelo incentivo, apoio e animao diria,indispensveis, e por nunca permitir que eu desanimasse.
A minha amiga Kaza, por todo apoio e carinho.
Ao amigo Jean, pelo companheirismo e pacincia.
Aos funcionrios do LAMCE e LAB2M, em especial Mnica, Srgio, Marcos eVernica.
Aos funcionrio do PEC, em especial Beth e ao Jairo, por seu excelente trabalho,carinho e ateno.
Aos meus amigos do IFRJ, toda a equipe de fsico-qumica, e a amiga Regina pela
torcida e incentivo.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
7/100
vii
Aos membros da banca.
Gostaria de agradecer ao Programa de Formao de Recursos Humanos da AgnciaNacional de Petrleo (PRH-02).
A todos vocs que moram no meu corao um sincero Obrigado......
8/12/2019 Marcia_Val_Springer_doutorado.pdf
8/100
viii
Resumo da Tese apresentada COPPE/UFRJ como parte dos requisitos necessrios
para a obteno do grau de Doutor em Cincias (D.Sc.)
APLICAO DE INTELIGNCIA COMPUTACIONAL NA CARACTERIZAO
GEOQUMICA DE LEOS
Marcia Val Springer
Dezembro/2012
Orientadores: Dbora de Almeida Azevedo
Luiz Landau
Programa: Engenharia Civil
Durante os ltimos anos, em funo da demanda da explorao de petrleo,
tem-se verificado um crescimento substancial da quantidade e complexidade de dados
armazenados na forma digital na rea da geoqumica orgnica. Diante deste cenrio,
busca-se testar o desempenho do mtodo de descoberta do conhecimento no apoio ao
agrupamento de amostras de leos a partir de parmetros geoqumicos, para estimar a
maturao trmica e identificar a origem. Em vista disso, o presente trabalho teve
como objetivo propor um mtodo para extrao de informaes desconhecidas a partir
de uma base de dados, contendo parmetros geoqumicos envolvendo biomarcadores
e diamantides e tendo como resultados a visualizao de agrupamentos fuzzy de
amostras de leos. Este mtodo foi desenvolvido sobre dados envolvendo baciassedimentares brasileiras e a bacia sedimentar colombiana,Llanos Orientales. Segundo
esse mtodo, as amostras foram agrupadas em cinco grupos diferentes quanto ao
parmetro de maturao trmica. Na caracterizao do ambiente deposicional,
observou-se que as amostras puderam ser divididas em quatro grupos principais:
grupo 1 possui uma contribuio marinha; grupo 2 indicativos de uma mistura
(marinho e terrestre); grupo 3 possui caractersticas de uma mistura contendo,
tambm, uma contribuio marinha e grupo 4 possui caractersticas terrestres.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
9/100
ix
Abstract of Thesis presented to COPPE/UFRJ as a partial fulfillment of the
requirements for the degree of Doctor of Science (D.Sc.)
APPLICATION OF COMPUTATIONAL INTELLIGENCE IN GEOCHEMICAL
CHARACTERIZATION OF OILS
Marcia Val Springer
December/2012
Advisors: Dbora de Almeida Azevedo
Luiz Landau
Department: Civil Engineering
Organic Geochemistry is a powerful tool to aid oil exploration. During recent
years, due to the demand of oil, there has been a substantial increase in the amount
and complexity of data stored in digital form. Given this scenario, we seek to test the
performance of the method of knowledge discovery in supporting the grouping of oil
samples from geochemical parameters to evaluate thermal maturity and identify
source. Therefore, the present work aimed to propose a method to extract unknown
information from a database, with the results to visualize fuzzy clusters of oil samples
from geochemical parameters, involving biomarkers and diamondoid. This method
was developed on data using Brazilian sedimentary basins and the Colombian
sedimentary basin, named Llanos Orientales. Under this method, the samples weregrouped into five different groups as the parameter of thermal maturation. In the
characterization of the depositional environment, it was observed that the samples
could be divided into four main groups: group 1 has a marine contribution, group 2
indicating a mixture (marine and terrestrial), group 3 has characteristics of a mixture
containing a marine contribution, and group 4 has terrestrial features.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
10/100
x
ndice
Captulo1.......................................................................................................................1
1.1) Introduo e Motivao ................................................................................................1
1.2) Objetivo......................................................................................................................6
Captulo 2: rea de Estudo .........................................................................................
Captulo3: Parmetros Geoqumicos ....................................................................... 14
Captulo4: Fundamentao Terica ........................................................................26
4.1) Anlise de agrupamento Clustering....................................................................26
4.2) Mtodo de AgrupamentoFuzzy .................................................................................29
4.2.1) Mtodo de ClusterizaoFuzzy c-means (FCM) ...............................................324.2.2) Ajuste dos parmetros .........................................................................................36
Captulo5: Materiais e Mtodos ...............................................................................40
5.1) Procedimentos Analticos ...........................................................................................40
5.1.1) Tcnicas Analticas Utilizadas.............................................................................42
5.2) Avaliao Estatstica dos dados .................................................................................44
Captulo6: Base de Dados - Descrio......................................................................47
Captulo7: Resultados e Discusso ...........................................................................50
7.1) Parmetros de Maturao ..........................................................................................50
7.1.1) Interpretao dos resultados pela caracterizao de Biomarcadores eDiamantides ..................................................................................................................50
7.1.2) Anlise de agrupamento FCM fuzzy c-means.................................................60
7.2) Parmetros de Ambientes Deposicionais (Origem)..................................................66
7.2.1) Interpretao dos resultados pela caracterizao de Biomarcadores eDiamantides ..................................................................................................................66
7.2.2) Anlise de agrupamento FCM fuzzy c-means.................................................73
Captulo 8: Concluso................................................................................................ 80
Captulo 9: Recomendaes ......................................................................................82
Captulo 10: Referncias Bibliogrficas...................................................................83
8/12/2019 Marcia_Val_Springer_doutorado.pdf
11/100
1
Captulo 1.
1.1) Introduo e Motivao
Atualmente as organizaes tm-se mostrado extremamente eficientes em
obter, organizar e armazenar grandes quantidades de dados, obtidos de suas operaes
dirias ou pesquisas cientficas, porm a maioria no usa adequadamente essa
gigantesca quantidade de dados para transform-la em conhecimentos e que poderiam
ser utilizados em suas prprias atividades, sejam elas comerciais ou cientficas.
Para explorar e extrair informaes teis de um banco de dados foi proposto,
em 1989, o processo de KDD(Knowledge Discovery Database). Este processo refere-
se s etapas que produzem conhecimento a partir de dados e, principalmente, etapa
de minerao de dados, que a fase que transforma dados em informao (FAYYAD
et al.,1996). O conceito deData-Mining(minerao de dados) est se tornando cada
vez mais popular como uma ferramenta de descoberta de informaes, que podem
revelar estruturas de conhecimentos, que possam guiar decises em condies de
certeza limitada. Este processo de obter informaes a partir de um banco de dadosno uma tarefa trivial, pois envolve algumas etapas com muitas decises realizadas
pelo analista (Figura 1), como: Criao de um conjunto de dados alvos (SELEO);
Pr-processamento e limpeza dos dados; Reduo de dados e projeo
(TRANSFORMAO); Busca por padres e/ou associaes (MINERAO DE
DADOS); Interpretao dos padres minerados.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
12/100
2
Figura 1: Processo de extrao de conhecimento em bases de dados e suas etapas (adaptadoFAYAAD et al. 1996)
A seleo de dados tem como objetivo identificar as origens internas e externas
da informao, extraindo um subconjunto de dados necessrio para a aplicao da
minerao de dados, selecionando apenas atributos relevantes aos objetivos do
processo de extrao de conhecimento (MACEDO et al.,2010).
A etapa de processamento dos dados visa assegurar a qualidade dos dados
selecionados. Como o resultado do processo de extrao possivelmente ser utilizado
no processo de tomada de deciso, a qualidade dos dados um fator extremamente
importante. Esta fase inicia-se com uma reviso geral da estrutura dos dados e a
definio de medidas de qualidade, utilizando uma combinao de mtodos
estatsticos e tcnicas de visualizao de dados. A seguir encontram-se descritos os
problemas tratados na etapa de processamento dos dados, segundo BOENTE &
GOLDSCHMIDT & ESTRELA (2008):
Eliminao de dados duplicados - so removidos dados duplicados e/ou
corrompidos;
Tratamento de outliers- so valores significantemente fora do esperado
para uma varivel;
Valores faltantes - valores que no esto presentes no conjunto
selecionado e valores invlidos que foram eliminados durante a detecode outliers.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
13/100
3
A etapa de transformao de dados tem como objetivo converter o conjunto
bruto de dados em uma forma padro de uso, tornando os dados teis para a
minerao (BOENTE, OLIVEIRA & ROSA, 2007). Devido s restries de espao
em memria e tempo de processamento, o nmero de atributos disponveis para
anlise pode inviabilizar a minerao de dados. Com isso, tcnicas de reduo de
dados so aplicadas, sendo feitas de trs modos:
Reduo do nmero de exemplos deve ser feita mantendo as caractersticas
do conjunto de dados original, por meio da gerao de amostras
representativas dos dados;
Reduo do nmero de atributos realizada pelo especialista do domnio,seleciona-se um subconjunto dos atributos de forma que no tenha impacto na
qualidade do conjunto final;
Reduo do nmero de valores de um atributo consiste na reduo do
nmero de valores de um atributo, geralmente utilizando-se tcnicas de
discretizao e suavizao de valores. A discretizao de um atributo consiste
na substituio de um atributo contnuo por um atributo discreto, por meio do
agrupamento de seus valores. A suavizao de valores agrupa determinados
atributos em um valor numrico que o represente, podendo ser, por exemplo, a
mdia ou a mediana.
Essa etapa auxilia na reduo do tempo de processamento para a tcnica de
minerao, diminuindo o espao de busca. As transformaes devem, entretanto,
preservar ao mximo, nas amostras geradas, as informaes presentes nos dadosbrutos.
A minerao de dados a etapa mais importante do processo de KDD e
caracteriza-se pela existncia de uma tcnica de minerao capaz de extrair
conhecimento implcito de um banco de dados em funo de um objetivo proposto
(JACKSON, 2002).
8/12/2019 Marcia_Val_Springer_doutorado.pdf
14/100
4
As tcnicas de minerao de dados podem ter gerado uma quantidade enorme
de padres, dos quais podem no ser relevantes ou interessantes ao usurio. Um dos
objetivos principais do processo de KDD que o usurio possa compreender e utilizar
o conhecimento descoberto (FAYAAD et al., 1996). Mas, podem ocorrer casos em que
os modelos so muito complexos ou no fazem sentido para os especialistas. Existem
algumas formas de se caracterizar a qualidade dos resultados obtidos, como a
compreensibilidade e a interessabilidade. A compreensibilidade de um
conjunto de regras relaciona-se com a facilidade de interpretao dessas regras por um
ser humano. Assim, quanto menor a quantidade de regras de um dado modelo e menor
o nmero de condies por regra, maior ser a compreensibilidade das regras
descobertas. A interessabilidade uma medida de qualidade que tenta estimar o
quanto de conhecimento interessante ou inesperado existe, e deve combinar fatores
numa medida que reflete como o especialista julga o padro.
Aps a anlise do conhecimento, caso esse no seja de interesse do usurio final
ou no cumpra os objetivos propostos, o processo de extrao pode ser repetido,
ajustando-se os parmetros ou melhorando o processo de escolha dos dados, para a
obteno de melhores resultados em uma prxima iterao.
Diferentes modelos podem ser aplicados aos bancos de dados para dar o suporte
necessrio aos distintos problemas nas mais diversas reas. Estes modelos so
divididos de acordo com a natureza da atividade, e os principais so: predio,
agrupamento (Clustering) e classificao. No captulo 4 sero apresentadas em
maiores detalhes as tcnicas de anlise de cluster (agrupamento), que o foco
principal deste trabalho.
Para a obteno destes modelos, diferentes tcnicas computacionais baseadas
em paradigmas da inteligncia computacional tm sido empregadas na indstria do
petrleo. Dentre estas tcnicas esto as Redes Neurais, Lgica Fuzzy, Regras de
Associao, rvores de deciso, Algoritmos Genticos, entre outros.
A construo de modelos determinsticos e de interpretao tem sido
crescentemente substituda por estes mtodos computacionais. A diversidade destas
aplicaes de minerao de dados usadas nos problemas de campos de leo e gs e a
8/12/2019 Marcia_Val_Springer_doutorado.pdf
15/100
5
aceitao destas metodologias tm se manifestado em grande interesse principalmente
por parte de engenheiros e cientistas em todo o mundo.
Durante os ltimos anos, em funo no apenas da demanda da explorao de
petrleo, mas tambm do desenvolvimento das tcnicas analticas, tem-se verificado
um crescimento substancial da quantidade e complexidade de dados armazenados na
forma digital na geoqumica orgnica. Este grande volume de dados acaba sendo
invivel de ser analisado por especialistas atravs de mtodos convencionais, tais
como planilhas de clculo e relatrios informativos operacionais, onde o especialista
testa sua hiptese contra a base de dados. Estatsticas tradicionais so limitadas se
levarmos em conta que a anlise se torna bastante trabalhosa quando o nmero de
variveis a serem investigadas cresce seguidamente. Tais mtodos possuem condies
que limitam o nmero de casos a utilizar, fazendo com que apenas uma pequena parte
do universo esteja disponvel para a anlise e, quando os relacionamentos dos dados
no so lineares, torna-se difcil empregar os mtodos estatsticos tradicionais.
Na Geoqumica Orgnica, as pesquisas envolvendo Inteligncia Artificial tm
sua atuao de forma pontual. De um modo geral, as pesquisas baseadas em grandes
volumes de dados na rea de Geoqumica Orgnica vm sendo norteadas a partir de
uma perspectiva descritiva e preditiva, onde a estatstica a ferramenta.
Diante deste cenrio, busca-se testar o desempenho do mtodo de descoberta do
conhecimento no apoio ao agrupamento de amostras de leos a partir de parmetros
geoqumicos, como maturao e ambiente deposicional (origem).
A anlise de agrupamento tem por objetivo agrupar dados semelhantes emconjunto para que possam ser generalizadas como um grupo. H muitos algoritmos
para anlise de cluster, com base em estatsticas, redes neurais e dos conjuntos fuzzy.
Em vista disso, o presente trabalho tem como proposta a introduo da tcnica de
Minerao de Dados baseados em Sistemas Fuzzy. O processo de clusterizao
(agrupamento) escolhido para desenvolver o trabalho foi o algoritmo Fuzzy C-means
(FCM).
8/12/2019 Marcia_Val_Springer_doutorado.pdf
16/100
6
1.2) Objetivo
No presente trabalho, foram analisadas amostras de leos provenientes de bacias
sedimentares brasileiras e da bacia sedimentar colombianaLlanos Orientales.
O principal objetivo deste estudo propor um mtodo para extrao de
informaes desconhecidas a partir de uma base de dados, tendo como resultado a
visualizao de agrupamentos fuzzy de amostras de leo a partir de parmetros
geoqumicos para avaliar a maturao trmica e identificar a origem.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
17/100
7
Captulo 2.
rea de estudo
O banco de dados para a realizao deste estudo apresenta parmetros
geoqumicos de maturao e ambiente deposicional para amostras provenientes de
bacias sedimentares da margem continental brasileira e da bacia sedimentar
colombiana Llanos Orientales. As amostras de leo provenientes de bacias
sedimentares brasileiras, exploradas neste presente trabalho, foram caracterizadas
geoquimicamente nos trabalhos: JESUINO (2005), TAMANQUEIRA (2006),
CALDAS (2009) e SILVA (2010). J as amostras de leo provenientes da bacia
colombiana foram caracterizadas previamente no trabalho desenvolvido por
SPRINGER (2007). A seguir, ser apresentada uma breve descrio das reas de
estudo envolvidas.
- Bacias sedimentares brasileiras da margem continental
O Brasil um pas com uma das maiores extenses de margem continental do
mundo, englobando diversos segmentos com bacias sedimentares com caractersticas
geolgicas distintas e diferentes graus de conhecimento do potencial exploratrio,
figura 2 (MELLO, 1988; MELLO et al., 1988a, b). A origem das bacias sedimentares
da margem continental brasileira est diretamente relacionada ao processo de ruptura
e separao das placas tectnicas africana e sul-americana, figura 3 (BIZZI et al.,
2003).
A margem divergente da Amrica do Sul, estendendo-se por mais de 12.000 kmdesde o Delta do Orinoco no Oriente Venezuelano at a Terra do Fogo, no extremo
sul da Argentina, inclui um sistema contnuo de bacias sedimentares originadas pelos
mecanismos de distenso litosfrica que, a partir do Mesozico, conduziram ruptura
do paleocontinente Gondwana, e separao definitiva das placas Africana e Sul-
Americana, acompanhando a formao do Oceano Atlntico Sul.
Considerando-se a natureza e a orientao dos campos de tenses regionaisdurante a fase de rifteamento e a dinmica das placas Africana e Sul-Americana
8/12/2019 Marcia_Val_Springer_doutorado.pdf
18/100
8
durante a fase de deriva continental, trs domnios distintos podem ser reconhecidos
ao longo da margem: uma regio dominantemente distensiva, entre o sul da Argentina
e o extremo nordeste da costa brasileira; um segmento de natureza transformante,
correspondente ao Atlntico Equatorial; e a regio ao norte da Foz do Amazonas,
onde novamente operaram processos de carter dominantemente distensional
(MILANI & THOMAZ FILHO, 2000).
No domnio distensivo meridional, o estilo estrutural durante a fase rift foi
marcado pela atividade de falhas normais orientadas principalmente na direo
paralela costa. Este estilo pode ser observado em cada uma das bacias individuais ao
longo da margem. Falhas de transferncia ocorrem a altos ngulos em relao
direo regional de desenvolvimento das falhas normais. O conjunto de falhas
normais evoluiu e acabou por definir a orientao regional de abertura da margem
passiva, e as zonas de transferncia do riftnuclearam as grandes falhas transformantes
do assoalho ocenico, cuja projeo contra a borda do continente se d em ngulo reto
(MILANI et al., 2000).
O estilo tectnico da margem adjacente ao Atlntico Equatorial foi diferente.
Cisalhamento dextrgiro foi o mecanismo responsvel pela ruptura crustal, originando
um padro de falhas oblquas subverticais que controlaram o rifteamentoe evoluram
para grandes zonas de fratura ocenicas paralelas costa entre as quais se incluem
Fernando de Noronha, Chain, Romanche e So Paulo.
Uma terceira regio na margem divergente da Amrica do Sul corresponde ao
trecho situado ao norte da Foz do Amazonas. Tal domnio faz parte de outro contexto
distensivo, o do Oceano Atlntico Central, mais antigo que o restante da margem umavez que l se encontram documentados processos de ruptura ativos j no Trissico.
Os vrios setores individuais ou bacias ao longo da extensa e contnua
margem divergente do continente compartilham algumas caractersticas comuns,
como por exemplo, os clssicos estgios tectono-sedimentares evolutivos que incluem
o rift, a fase transicional e a marinha aberta (MILANI et al.,2000).
8/12/2019 Marcia_Val_Springer_doutorado.pdf
19/100
9
Como resultado de sua histria evolutiva, o registro sedimentar dessas bacias
pode ser subdividido em quatro grandes seqncias: pr-rift, rift, transicional, e drift.
A sequncia pr-rift, depositada do final do Jurssico ao inicio do Cretceo,
caracterizada por sedimentos continentais, principalmente lacustres, fluviais e
delticos. A seqncia rift, de idade Neocomiana a Barremiana, se depositou na fase
de extenso crustal e caracterizada pelo predomnio de sedimentos lacustres de gua
doce/salobra a salina, e secundariamente, por depsitos flvio-delticos. A seqncia
transicional, de idade Aptiana, depositou-se entre o final da fase rift e o incio do
estgio drift, sendo caracterizada por depsitos fluviais, delticos e lacustres com
influncia marinha e alta salinidade. Finalmente, a seqncia drift depositou-se do
Albiano ao presente, em resposta ao processo de separao entre as placas africana e
sul-americana e formao do oceano Atlntico, sendo que seus depsitos so
essencialmente marinhos (BIZZI et al., 2003).
8/12/2019 Marcia_Val_Springer_doutorado.pdf
20/100
10
Figura 2: Mapa de localizao das bacias sedimentares da margem continental brasileira(modificado de MELLO et al., 1988b).
8/12/2019 Marcia_Val_Springer_doutorado.pdf
21/100
11
Figura 3: Mapa com a distribuio das bacias marginais dos litorais brasileiro e africano,apresentando reconstruo tectnica das bacias sedimentares na configurao pr-derivacontinental, ajustado a reconstruo paleogrfica de 124Ma. (BIZZI et al., 2003).
8/12/2019 Marcia_Val_Springer_doutorado.pdf
22/100
12
- Bacia sedimentar colombiana,Llanos Orientales
A bacia sedimentar colombiana Llanos Orientales est localizada no final
norte de uma longa srie de bacias subandinas, estendidas desde a Argentina at a
Venezuela (Figura 4). A maior parte da bacia est localizada na Colmbia, cobrindo
uma rea de aproximadamente 200.000 Km2, com uma pequena poro no sudeste da
Venezuela. A bacia dos Llanos Orientales cercada ao oeste pela Cordilheira
Oriental; ao norte pela bacia Apure e pela Cordilheira de Mrida na Venezuela; a leste
pelo escudo cratnico Guiana e ao sul pela Bacia Amaznica. A bacia dos Llanos
Orientales, situada na Colmbia, tem sua historia geolgica ligada ao
desenvolvimento da parte norte dos Andes. Embora a formao desta bacia e o
preenchimento inicial com sedimentos tenham sido provocados por mecanismos de
subsidncia tectnica e termal associados com eventos de extenso litosfrica (rift
intracratnico e back-arc), a geometria atual e os processos de carga do petrleo esto
associados a mecanismos compressivos que provocaram inverso tectnica e o
soerguimento dos Andes no Negeno.
Esses ltimos eventos criaram novas estruturas ou transformaram
drasticamente aquelas mais antigas, modificando os regimes termal e de presses e
tendo importantes implicaes no funcionamento dos sistemas petrolferos,
principalmente na distribuio e qualidade das acumulaes (BAUTISTA, 2008).
A ltima seo do Cretceo do nordeste da Amrica Latina contm excelentes
rochas geradoras, que tem originado a maioria dos leos encontrados na Colmbia,
Equador e Venezuela. Os sedimentos ricos em matria orgnica da formaoLa Luna
so descritos como de fontes marinhas, alglicas e carbonticas (ZUMBERGE, 1983).Entretanto, reconstrues estratigrficas e paleogeogrficas mostram que este
esquema um pouco simplista. A complexa evoluo tectnica do nordeste da
Amrica do Sul resulta em uma grande variedade de ambientes deposicionais e
condies paleogeogrficas, que controlam o tipo e a quantidade de matria orgnica
preservada. Essas mudanas nas caractersticas da rocha geradora resultam em
diferentes tipos de leos (BAUTISTA, 2008).
8/12/2019 Marcia_Val_Springer_doutorado.pdf
23/100
13
Figura 4: Mapa de localizao da bacia sedimentar colombiana Llanos Orientales,apresentando os campos explorados ( ).
"Bacia
Llanos Orientales
10 N
80 W 75 WN
1120000 1140000 1160000 1180000 1200000 1220000 1240000 1260000 1280000 1300000 1320000 13400001000000
1020000
1040000
1060000
1080000
1100000
1120000
YOPAL
LA GLORIA NORTE
EL PALMARJUNCAL
CUPIAGUA
CUSIANALA GLORIA
FLORENA
SARDINAS
CONCESIONTRINIDAD
TOCARIA
CANO GARZA LAS ABEJAS
0 m 25000 m 50000 m
BUENOS AIRES
RIO CHITAMENA
PAUTO SUR
CaribbeanSea
PacificOcean "
BaciaLlanos Orientales
10 N
80 W 75 WNN
1120000 1140000 1160000 1180000 1200000 1220000 1240000 1260000 1280000 1300000 1320000 13400001000000
1020000
1040000
1060000
1080000
1100000
1120000
YOPAL
LA GLORIA NORTE
EL PALMARJUNCAL
CUPIAGUA
CUSIANALA GLORIA
FLORENA
SARDINAS
CONCESIONTRINIDAD
TOCARIA
CANO GARZA LAS ABEJAS
0 m 25000 m 50000 m
BUENOS AIRES
RIO CHITAMENA
PAUTO SUR
1120000 1140000 1160000 1180000 1200000 1220000 1240000 1260000 1280000 1300000 1320000 13400001120000 1140000 1160000 1180000 1200000 1220000 1240000 1260000 1280000 1300000 1320000 13400001000000
1020000
1040000
1060000
1080000
1100000
1120000
1000000
1020000
1040000
1060000
1080000
1100000
1120000
YOPALYOPAL
LA GLORIA NORTE
EL PALMARJUNCAL
CUPIAGUA
CUSIANALA GLORIA
FLORENA
SARDINAS
CONCESIONTRINIDAD
TOCARIA
CANO GARZA LAS ABEJAS
0 m 25000 m 50000 m
BUENOS AIRES
RIO CHITAMENA
PAUTO SUR
Mar do Caribe
OceanoPacfico
8/12/2019 Marcia_Val_Springer_doutorado.pdf
24/100
8/12/2019 Marcia_Val_Springer_doutorado.pdf
25/100
15
A diagnese o processo inicial de alterao fsica, qumica e biolgica da
matria orgnica sob condies de soterramento incipiente e baixas temperaturas. Ao
final dessa etapa, a biomassa de origem sedimentar se transforma em querognio,
constituinte orgnico das rochas sedimentares, insolvel em solventes orgnicos
(TISSOT & WELTE, 1984). Com o aumento da presso e temperatura (soterramento
progressivo), o querognio degradado para a formao do petrleo, iniciando o
estgio denominado catagnese, e a matria orgnica passa por uma srie de
transformaes qumicas, tais como reaes de isomerizao, aromatizao e
craqueamento, que resultam na converso do querognio em leo. Sob condies de
soterramento ainda maiores, chega-se ao estdio denominado metagnese, onde
mudanas mais severas no material orgnico ocasionam a formao de metano e
restando apenas resduos carbonosos.
O grupo dos hidrocarbonetos saturados constitui o grupo mais abundante e a
classe mais investigada, pois onde se encontram os biomarcadores (terpanos e
esteranos) e os diamantides.
A concentrao de hidrocarbonetos saturados no petrleo depende das suas
geradoras que por sua vez esto relacionadas ao tipo de matria orgnica e seu
respectivo ambiente deposicional. leos mais pesados e leos originados de matria
orgnica de origem continental possuem maior proporo destes compostos, enquanto
que leos derivados de matria orgnica de origem marinha, ou uma mistura destes
dois tipos de matria orgnica geram um petrleo mais rico em compostos cclicos
(TISSOT & WELTE, 1984).
A caracterizao dos sistemas petrolferos, atravs de parmetros de geoqumica
orgnica, fundamental para o desenvolvimento de modelos preditivos para a
explorao de petrleo nas bacias sedimentares. A maturao trmica e o tipo da
matria orgnica constituem as principais variveis que controlam a gerao de
hidrocarbonetos nas bacias sedimentares. So vrios os parmetros geoqumicos
utilizados para avaliar o nvel de evoluo trmica e para caracterizar o ambiente
deposicional das rochas geradoras (PETERS & MOLDOWAN, 1993); os mais
8/12/2019 Marcia_Val_Springer_doutorado.pdf
26/100
16
utilizados se baseiam nas reaes de isomerizao de biomarcadores, particularmente
das famlias dos esteranos e terpanos, e na concentrao de diamantides.
Os biomarcadores so compostos orgnicos complexos que apresentam tomos
de carbono e hidrognio, e so encontrados em rochas e sedimentos. So fsseis
moleculares derivados de substncias presentes em organismos vivos, que mostram
pequenas mudanas na estrutura herdada das molculas orgnicas originais
(ZUNBERGE, 1987a; PETERS & MOLDOWAN, 1993). Durante a diagnese, as
molculas dos precursores, os triterpenides e esterides, que contm um ou mais
tomos de oxignio e que frequentemente apresentam ligaes duplas, passam por
reaes qumicas nas quais perdem os tomos de oxignio. Suas ligaes duplas so
reduzidas para produzir o biomarcador saturado mais estvel, preservado nas amostras
geolgicas. Estes compostos representam uma pequena frao do petrleo, porm so
de grande importncia, pois permitem a correlao entre leo e a rocha geradora, a
avaliao do grau de evoluo trmica e do nvel de biodegradao que o leo foi
submetido (WAPLES & MACHIHARA, 1991).
Os parmetros de biomarcadores tm sido amplamente utilizados para a
caracterizao de ambientes deposicionais das rochas geradoras de petrleo. Vrios
autores descrevem a distribuio dos biomarcadores como uma ferramenta til para
distinguir rochas geradoras depositadas em diferentes ambientes. As razes de
biomarcadores, quando comparadas com outros parmetros, so teis na inferncia do
tipo de rocha geradora mesmo quando apenas amostras de leos esto disponveis
(PETERS et al., 2005). Os organismos que apresentam os precursores biolgicos dos
biomarcadores vivem em determinadas condies ambientais. Logo, os
biomarcadores podem ser utilizados como indicadores dessas condies de vida(WALPES & MACHIHARA, 1991).
A seguir, esto listados os parmetros mais utilizados na caracterizao de
ambientes deposicionais:
8/12/2019 Marcia_Val_Springer_doutorado.pdf
27/100
8/12/2019 Marcia_Val_Springer_doutorado.pdf
28/100
18
Razo Hopano/Esteranos
Um dos principais parmetros de biomarcadores para anlise de origem a
razo entre os hopanos/esteranos. Esta razo foi obtida abrangendo os esteranos C27
-
C29(20S+20R) + esteranos C27-C29(20S+20R) e os hopanos C29, C30,
C31-C33 (22S+22R). Esta razo mostra a maior contribuio de organismos
eucariticos (especialmente algas) ou contribuio de organismos procariticos
(bactrias). Em geral, altas concentraes de esteranos e baixos valores da razo
hopanos/esteranos (menor ou igual a 4) indicam deposio de matria orgnica
marinha com maior contribuio de organismos planctnicos e/ou algas.
Diferentemente, baixas concentraes de esteranos e altos valores de razo
hopano/esterano (maior que 7) indicam deposio de matria orgnica continental
e/ou microbiana retrabalhada (PETERS et al., 2005).
Razo TPP/DIA
Outro importante parmetro de origem a razo dos poliprenides tetracclicos
(TPPs) / Diasteranos C27 13(H),17(H) (20S+20R). HOLBA et al. (2000, 2003)
mostraram que indicadores especficos, os tetracclicos poliprenides (TPP),
permitem uma melhor diferenciao entre os ambientes lacustres e marinhos. A
caracterizao desses ambientes mais complexa porque eles possuem uma enorme
variedade de condies deposicionais. Estes autores mostraram que a abundncia
destes compostos no petrleo reflete a natureza do ambiente. Altas concentraes
relativas de TPPs em leos e rochas geradoras em relao aos disteranos indicam
deposio em ambientes marinhos.
Razo Diasteranos/Esteranos
A razo disteranos/esteranos dada por [(C27 13, 17(H) 20S + 20R)/(C27
5,14,17(H) 20S + 20R)]. Os diasteranos esto presentes em quantidades
significativas em leos que apresentam alta maturao trmica (WAPLES &
MACHIHARA, 1991). So formados facilmente emsedimentos clsticos, logo a razo
disteranos/esteranos frequentemente usada para diferenciar rochas geradorascarbonticas de clsticas (WALPES & MACHIHARA, 1991; PETERS et al., 2005).
8/12/2019 Marcia_Val_Springer_doutorado.pdf
29/100
8/12/2019 Marcia_Val_Springer_doutorado.pdf
30/100
20
Esta razo bastante utilizada na caracterizao de ambientes deposicionais, e
de acordo com alguns estudos, as maiores abundncias do terpano tetracclico C24
foram encontradas em ambientes marinho deltaicose lacustres salinos (MELLO,
1988). No entanto, este autor afirma que na ausncia de outras evidncias a alta
abundncia relativa do terpano tetracclico C24indica abundante deposio de matria
orgnica terrestre.
Razo Ts/Tm
SEIFERT & MOLDOWAN. (1980), mostraram que esta razo s era afetada
pela maturao trmica. Porm, alguns estudos posteriores mostraram a correlao de
Ts e Tm com condies diagenticas. Apesar da relao entre Ts/Tm e a litologia
ainda no ser bastante clara, vrios estudos j mostraram que os valores de Ts/Tmso
menores em ambientes hipersalinos e maiores em carbonticos (RULLKOTTER &
MARZI, 1988; WAPLES & MACHIHARA, 1991). ROBINSON, (1987), mostrou
tambm que em leos de origem terrestre os valores de Tmso maiores e nos leos de
origem lacustre so baixos.
O avano das transformaes qumicas sofridas pelo querognio e o petrleo sob
condies crescentes de soterramento e temperatura resultam na formao de
hidrocarbonetos mais leves que podem ser monitorados por uma srie de indicadores
geoqumicos, conhecidos como parmetros de maturao trmica (TISSOT &
WELTE, 1984).
Distribuies de biomarcadores so amplamente utilizados na avaliao da
maturidade do leo (PETERS & MOLDOWAN, 1993). Muitos dos parmetros de
maturao, envolvendo biomarcadores, atingem o equilbrio antesda janela de leo, e
em alguns casos, mostram inverso em nveis elevados de maturidade.
Consequentemente, estas propores no so eficazes como indicadores de maturao
para leos de alta maturidade (FARRIMOND et al., 1998).
Os parmetros de maturao trmica mais usados so:
8/12/2019 Marcia_Val_Springer_doutorado.pdf
31/100
21
22S/(22S+22R); razo de isomerizao dos homohopanos
Isomerizao no C22dos 17(H)-hopanos C31a C35ocorre antes que muitas razes
de biomarcadores usados para estimar a maturao trmica de leos e sedimentos. O
precursor biolgico possui a configurao 22R que gradualmente convertida em
uma mistura de diastereoismeros 22R e 22S. As propores de 22R e 22S podem ser
calculadas para todos ou apenas um homohopano. Porm, como os homlogos C33,
C34e C35podem apresentar problemas de coeluio de picos, os mais utilizados para
calcular esta razo so os homlogos C31e C32 (PETERS et al., 2005).
A razo 22S/(22S+22R) varia de 0 a 0,6 (valor de equilbrio 0,57 a 0,62) durante
o processo de maturao trmica. Alguns estudos mostram que essa razo sofre
influncia de alguns fatores, como por exemplo, a litologia da bacia. Portanto, essa
razo deve ser utilizada com cautela (PETERS et al., 2005).
Terpanos Tricclicos/17(H)-hopanos
Esta razo aumenta com o aumento da maturao trmica. Isto ocorre porque
mais tricclicos so liberados do querognio em altos nveis de maturao. A origem
dos terpanos tricclicos pode ser o resultado da diagnese de vrios precursores
biolgicos; logo esta razo pode variar consideravelmente entre leos de diferentes
rochas geradoras ou diferentesfcies orgnicas da mesma rocha geradora (PETERS et
al., 2005).
Ts/(Ts+Tm)
Durante a catagnese, C2717(H)-trisnorhopano (Tm ou 17(H)-22,29,30-
trisnorhopano) apresenta menor estabilidade do que o C27 18(H)-trisnorhopano II (Ts
ou 18 (H)-22,29,30-trisnorneohopano).
Esta razo deveras dependente quanto maturidade e quanto origem. Por
isso, um bom indicador de maturao quando utilizada para avaliar leos de mesma
origem com fcies orgnicas compatveis (PETERS et al., 2005).
8/12/2019 Marcia_Val_Springer_doutorado.pdf
32/100
22
20S/(20S+20R), razo de isomerizao dos esteranos
Devido facilidade na anlise usando os cromatogramas de massa do on m/z
217, as razes de isomerizao dos esteranos so calculadas nos compostos C29
(24-
etilcolestanos, estigmastanos ou sistostanos), visto que os compostos C27 e C28
apresentam interferncia de coeluio de picos (PETERS et al., 2005).
medida que aumenta a maturao trmica, a configurao R no C20, existente
nos precursores esteroidais presentes nos organismos vivos, convertida em uma
mistura de configuraes R e S. A isomerizao no C20do C295(H),14(H),17(H)
aumenta a razo de zero para aproximadamente 0,5, sendo o valor de equilbrio entre
0,52 e 0,55.
Alguns fatores como variaes organofcies e a biodegradao podem afetar
razes de esteranos. No caso da biodegradao, h a remoo seletiva dos epmeros
resultando no aumento da razo para valores acima de 0,55 (PETERS et al., 2005).
/(+), C29esteranos
A isomerizao no C-14 e C-17 nos C29esteranos regulares 20S e 20S gera um
aumento na razo /(+), que varia de valores prximos de zero at 0,7 (valores
de equilbrio 0,67 a 0,71). O grfico /(+) versus 20S/(20S+20R) para os
esteranos C29 so eficazes na caracterizao da maturao trmica das rochas
geradoras e leos, sendo muito utilizado no estudo de sistemas petrolferos (SEIFERT
& MOLDOWAN, 1986).
Geralmente, os parmetros de maturao baseados em biomarcadores saturados
no podem ser aplicados em amostras de leo altamente maturo como dito
anteriormente. Sendo assim, utiliza-se uma anlise integrada dos parmetros de
biomarcadores e diamantides, j que estes so mais estveis degradao trmica.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
33/100
23
Os diamantides j foram identificados em vrios leos brutos (WEI et al.,
2007; AZEVEDO etal., 2008e referncias, SPRINGERetal., 2010; FANG et al.,
2012).Elesso rgidos,emais estveis do queos hidrocarbonetos: uma vez formados,
eles so resistentes destruio trmicae biolgica (WINGERT, 1992). Variaes na
estabilidade trmica de diamantides metil-substitudos levaram utilizao de
determinadas propores de ismeroscomo parmetrosde maturaode leos brutos
e rochasgeradoras, especialmenteem fasesde alta gerao dehidrocarboneto(CHEN
etal., 1995;1996).
Usando as relaes de diamantides em combinao com os biomarcadores,
podemos efetuar uma avaliao mais refinada de maturidade e de ambiente
deposicional (DAHL et al., 1999; AZEVEDO et al., 2008; SPRINGER et al., 2010).
Os parmetros de diamantides empregados na avaliao das amostras de leo
do presente estudo foram os ndices IMA (ndice metil-adamantano) e IMD (ndice
dimetiladamantano), proposto por CHEN et al. (1996), e os ndices do grfico de
DAHL et al. (1999) para avaliao do grau de maturao trmica, apresentados a
seguir.
Os estudos de DAHL et al. (1999) propuseram que a estabilidade trmica dos
diamantides conduz sua concentrao progressiva durante o craqueamento do leo,
enquanto a concentrao de biomarcadores diminui. Este mtodo particularmente
til para condensados altamente maturos, onde outros mtodos podem no ser
confiveis. Os biomarcadores, por geralmente apresentarem ligaes que podem ser
rompidas, com o aumento da maturao trmica, sua concentrao decresce antes do
craqueamento da maioria dos componentes de leos. Os diamantides, queapresentam estrutura molecular bastante estvel quando comparada a outros
componentes do petrleo, tendem a ter concentraes maiores no leo residual. Desta
forma, o craqueamento intenso de um leo acarreta a destruio da maioria dos
componentes e o aumento da concentrao de diamantides. Segundo DAHL et al.
(1999), diferentes biomarcadores apresentam comportamentos diferentes frente
estabilidade trmica.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
34/100
8/12/2019 Marcia_Val_Springer_doutorado.pdf
35/100
25
Esses parmetros de maturao foram escolhidos por serem mais resistentes ao
estresse trmico, e j terem sido amplamente estudados (PETERS & MOLDOWAN,
1993; AZEVEDO et al., 2008;SPRINGER et al., 2010).
8/12/2019 Marcia_Val_Springer_doutorado.pdf
36/100
26
Captulo 4.
Fundamentao Terica
4.1) Anlise de agrupamento Clustering
A anlise de agrupamento uma das etapas na minerao de dados que
rotineiramente utilizada como um primeiro passo para descobrir a estrutura oculta
do conjunto de dados no ordenados, criando grupos com certa similaridade, ou seja,
cria grupos associados a uma funo de pertinncia (HLLERMEIER, 2005). Por
esse critrio: sendo um conjunto de dados representados pelos registros e valores das
variveis, deseja-se criar uma funo que determine qual grupo cada registro pertence.
O objetivo desta tcnica dividir o conjunto de dados em subconjuntos homogneos.
A anlise de agrupamento possui diversas etapas:
representao dos padres (podendo incluir extrao ou seleo de
caractersticas): envolve definio do nmero, tipo e modo de apresentao
dos atributos que descrevem cada padro;
seleo de caractersticas: processo de identificao do subconjunto mais
efetivo dos atributos disponveis para descrever cada padro;
extrao de caractersticas: uso de uma ou mais transformaes junto aos
atributos de entrada de modo a salientar uma ou mais caracterstica dentre
aquelas que esto presentes nos dados.
medida de similaridade: fornecida por uma funo de distncia definida entre
pares de dados ou padres. possvel incluir na medida de distncia aspectos
conceituais (qualitativos) ou ento numricos (quantitativos).
agrupamento: os grupos podem ser definidos como conjuntos crisp (um
padro pertence ou no-pertence a um dado grupo) oufuzzy(um padro pode
apresentar graus de pertinncia aos grupos). O processo de agrupamento pode
8/12/2019 Marcia_Val_Springer_doutorado.pdf
37/100
8/12/2019 Marcia_Val_Springer_doutorado.pdf
38/100
28
Sendo um ramo da estatstica, a clusterizaotem sido vastamente estudada por
muitos anos, baseando-se na introduo de uma medida de distncia entre os objetos.
A partir da utilizao dessa medida, determina-se um critrioque expressa a ideia da
clusterizao, isto , que particiona o conjunto de objetos em nclustersindividuais e
homogneos, nos quais elementos de um cluster so to similares entre si quanto
possvel, e to diferentes quanto possvel, dos elementos dos outros clusters. Segundo
BRAILOVSKY (1991), a minimizao desse critrio resulta em clusters timos.
A anlise de agrupamentos lida com a descoberta de estruturas e grupos de um
conjunto de dados, e para melhor proveito, dados multivariados. Assim sendo,
dificilmente algum poder afirmar que a descoberta de determinado grupo ser
perfeita. De fato, rudos ou imprecises no podem ser completamente eliminados
(HOPPNER et al., 2000).
Na anlise de agrupamento clssica, cada objeto atribudo a um clusterde
uma maneira inequvoca. Consequentemente, os grupos individuais so separados por
uma fronteira acentuada, abrupta. Na prtica, tais limites no so frequentemente
muito naturais. Na verdade, a fronteira entre os clusterse a transio entre eles so
geralmente suave e no abrupta. Isso pode ser feito por meio do uso da Teoria de
Conjuntos Fuzzy (TCF) para representar valores imprecisos. Nos mtodos de
agrupamentofuzzy, um objeto pode pertencer a diferentes grupos ao mesmo tempo, o
grau que cada objeto pertence a um grupo particular expresso em termos de uma
funo de pertinncia (HLLERMEIER, 2005).
No presente trabalho, o algoritmo adotado o fuzzy c-means (FCM), que
pertence ao grupo de algoritmos para agrupamentos fuzzy, desenvolvido segundo
EVSUKOFF et al., 2004. A seguir ser apresentado o mecanismo de agrupamento via
fuzzy c-means.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
39/100
29
4.2) Mtodo de AgrupamentoFuzzy
Como visto anteriormente, na anlise de clusterclssica (crisp), essas classes
devem formar uma partio de X; indivduos que pertencem ao mesmo bloco (classe)
da partio esto totalmente relacionados (so indistinguveis) e indivduos que
pertencem a blocos distintos no esto relacionados. Em outras palavras, indivduos
esto totalmente relacionados entre si ou no esto relacionados. Em muitas
aplicaes prticas, no entanto, uma partio crisppode ser muito restritiva e invivel,
devido, muitas vezes, impreciso ou a no completeza dos dados.
Segundo BEZDEK & PAL (1992), a impreciso nos dados pode surgir de
diversas fontes. Por exemplo, erros em instrumentos ou rudos no experimento podem
levar a valores parcialmente confiveis de determinados atributos. Em alguns casos, o
custo envolvido na extrao de valores muito precisos de um atributo pode ser alto.
Em outros casos, pode ser difcil decidir quais so os atributos mais relevantes que
caracterizam um elemento. Por essas razes, torna-se conveniente o uso de variveis
lingusticas e limitaes para descrever os valores de atributos, em vez de tentar
fornecer uma representao numrica exata para os dados com valores incertos dos
atributos. Isso pode ser feito por meio do uso da Teoria de Conjuntos Fuzzy (TCF)
para representar valores imprecisos. Conjuntos Fuzzyesto inerentemente inclinados a
lidar com o conhecimento e domnio lingustico produzindo solues mais
interpretveis. Essa teoria de conjuntosfuzzyfoi introduzida primeiramente por Zadeh
em meados da dcada de 60, e construa a partir dos conceitos j estabelecidos da
lgica clssica.
Na teoria clssica dos conjuntos, as relaes entre um elemento e um conjunto
so bem definidas: dado um conjunto A em um universo U, os elementos deste
universo pertencem ou no pertencem quele conjunto. Esta relao expressa por
uma funo caracterstica fA: se fA(x) = 1, x pertence a A; se fA(x) = 0, x no
pertence a A.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
40/100
30
Zadeh props uma generalizao: a funo caracterstica pode assumir um
nmero infinito de valores no intervalo de [0,1]. Sendo assim, um conjunto fuzzyA
em um universo U definido por uma funo de pertinncia A(x): U[0,1]. Um
determinado elemento do universo pode pertencer simultaneamente a um conjunto e
ao seu complementar, sendo representado pela funo de pertinncia (REZENDE,
2005).
Segundo KLIR & YUAN (1995), a teoria de conjuntos fuzzypode ser utilizada
em pelo menos dois nveis no problema de clusterizao: 1) no nvel de atributos,
para representar os elementos do conjunto como um vetor de graus de pertinncia,
sendo que cada um desses graus representa o grau de posse do atributo em questo,
por parte desses elementos; e 2) no nvel de classificao, para representar a
pertinncia desses elementos s classes, bem como para prover uma estimativa das
informaes incompletas em termos de valores de pertinncia. Em ambos os casos,
permitem-se diferentes graus de relacionamento entre elementos do conjunto, sendo
que um elemento pode pertencer a mais de uma classe. Com a utilizao da
abordagem fuzzy, o problema passa ento a ser caracterizado como um problema de
clusterizao fuzzy, cujo objetivo a obteno de uma partio fuzzyem um conjunto
de dados X. No agrupamento fuzzy, cada cluster um conjunto fuzzyde todos os
padres, como apresentado na Figura 8, que exemplifica agrupamentos nebulosos e
no nebulosos sendo os retngulos H1 e H2 agrupamentos crisp (hard) e as elipses F1
e F2 a sada do algoritmo nebuloso.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
41/100
31
Figura 8: Comparao entre agrupamentos clssicos (conjuntos H1 e H2) eagrupamentos fuzzy (conjuntos F1 e F2) (modificado de JAIN, MURTY, FLYNN,1999).
Existem muitos algoritmos de clusterizaodisponveis na literatura, sendo
que a sua escolha depende dos tipos de dados disponveis e da aplicao desejada
(GAN et al., 2007). Dois tipos so mais aceitos: algoritmos de mtodos hierrquicos e
de mtodos de partio. O primeiro organiza o conjunto de dados em uma forma
hierrquica de acordo com a proximidade entre os indivduos e os resultados so
visualizados na forma de um dendrograma. J os mtodos particionais associam um
conjunto de indivduos a k grupos sem criar uma estrutura hierrquica.
A maioria dos algoritmos de clusterizao de alguma forma dependente de
uma distncia a qual utilizada para definir que registros so similares e quais no.
Vrios mtodos tm sido desenvolvidos para obter tanto clusters baseados na teoria
clssica quanto fuzzya partir de um determinado conjunto de dados. Para o caso da
abordagemfuzzy, foco deste trabalho, na seo seguinte ser apresentado o algoritmo
de relevncia e aplicabilidade para este estudo, o algoritmo Fuzzy c-means.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
42/100
32
4.2.1) Mtodo de AgrupamentoFuzzy C-means(FCM)
Fuzzy C-means o algoritmo de clusterizao de mtodo de partio mais
popular, e derivado do algoritmo K-means. O mtodo de clusterizaoFCM feitosubstituindo a funo caracterstica por uma funo de pertinncia, que gera uma
transio suave, ou seja, permite que um dado pertena a dois ou mais agrupamentos
simultaneamente (EVSUKOFF et al., 2004; EVSUKOFF et al., 2006; OLIVEIRA &
PEDRYCZ, 2007). Pode ser descrito da seguinte maneira:
Supondo um conjunto de indivduos X={x1,...,xn}, x Rp
(espao p
dimensional), deseja-se organiz-los em clusters, C={C1,..., Cc}. O algoritmo FCM
objetiva fornecer uma partio fuzzy de um conjunto de indivduos em c clusters.
Sendo assim, ele define e minimiza uma funo objetivo (Jm), a qual mede a
adequao entre os indivduos e os clusters:
Onde, m>1 representa o fator de nebulosidade que existe entre uma categoria e outra.
O algoritmo possui V={v1,...,vc} como um conjunto de vetores que representa os
centros das categorias. Urepresenta a matriz de graus de incluso nebulosos, e ij o
grau de incluso do ponto j na categoria i. A matriz U deve seguir as seguintescondies: a soma dos valores de pertinncia de um registro a todas as classes igual
a 1, ou melhor, a soma de todas as colunas de uma linha da matriz U igual a 1; cada
registro deve pertencer a pelo menos um agrupamento e nenhum deles deve conter
todos registros, ou seja, a soma de todas as linhas da matriz Udeve ser maior que 0 e
menor que n.
O mtodo fuzzy c-means pode ser equacionado por meio de um algoritmoiterativo, baseado na minimizao de um ndice de desempenho, que indica a
8/12/2019 Marcia_Val_Springer_doutorado.pdf
43/100
33
adequabilidade da pseudopartio gerada. O desempenho do algoritmo influenciado
pela escolha do nmero de classes c, dos centros de cluster iniciais, da ordem na qual
os vetores so processados, da medida de distncia, do critrio de parada e pelas
propriedades geomtricas dos dados. Os conjuntos que apresentam clusters
compactos, bem separados e com formas hiperesfricas, so apropriados para este
mtodo, mas para encontrar agrupamentos adequados necessrio realizar extensivos
testes com vrios valores de c, distncias, critrios de parada, centros de cluster
iniciais e diferentes ordens de amostras.
Assim, o algoritmo assume como entrada os seguintes parmetros: o nmero
desejado de clustersc; uma medida de distncia m (1,), que define a distncia
permitida entre os pontos e os centros de cluster; e um nmero pequeno > 0,
utilizado como um critrio de parada, alm da instanciao inicial dos graus de
pertinncia dos objetos a cada uma das classes e dos centros de cluster dessas classes.
A seguir, sero descritos os passos do algoritmo.
Passo1: Considere t = 0 representando a iterao 0. Defina P(0) como uma
pseudopartio P = {A1,A2,,Ac}, atribuindo os graus de pertinncia dos elementos
s classes dessa pseudopartio, os quais podem ser informados ou calculados de
forma aleatria.
Passo2:No caso de t = 0, fornea osccentros de cluster1(t), c
(t)iniciais. Para t >
0, calcule osccentros de cluster1(t), c
(t)pela equao abaixo para P(t) e o valor de
m fornecido.
A varivel real m> 1 chamada de ndice defuzzificaoe usada para definir
a distncia permitida entre os pontos e o centro que est sendo calculado. Quanto
maior o valor de m, mais elementos do conjunto so considerados como pertencentes
8/12/2019 Marcia_Val_Springer_doutorado.pdf
44/100
34
a uma pseudopartio. Esse parmetro escolhido de acordo com o problema
considerado. No existe nenhuma base terica para uma escolha tima do valor de m.
O vetor i, calculado pela equao acima visto como o centro do cluster Ai a mdia
ponderada dos dados em Ai. O peso do dado X a m-sima potncia do seu grau depertinncia ao conjuntofuzzyAi.
Passo3:Atualize P(t)para P(t+1) usando o seguinte procedimento: para cada xkX e
para todo i {1,2,,c}, se ||xk- i(t)||2>0, calcule o grau de pertinncia do elemento
xk classe Ai, pela frmula abaixo, sendo que as classes Aipodem ser selecionadas
em uma ordem pr-definida ou aleatoriamente.
Assume- se que || || alguma norma indicada para o produto interno no espao R pe
||xk-i(t)||2representa a distncia entre xkei.
Por meio da frmula acima, a distncia de cada elemento xkao centro de cluster
ida pseudopartio atual Ai comparada distncia do mesmo elemento ao centro
de cluster jde todas as demais pseudoparties Aj, de modo a atribuir um grau de
pertinncia ao elemento xk no cluster Ai que seja proporcional ao seu grau de
pertinncia aos demais clusters Aj.
Quando ||xk- i(t)||2= 0 para algum i I {1,2,,c}, o que indica que xkcorresponde
ao centro de cluster i, defina Ai(t+1) (xk) como um nmero real no negativo que
satisfaz a equao abaixo e defina Ai(t+1)(xk)= 0 para i {1,2,,c} -I.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
45/100
35
Em casos como este, quando o elemento coincide com o centro de clusterde
uma classe Ai, o ideal seria que o algoritmo atribusse a tal elemento o grau de
pertinncia mximo (1) quela classe e o grau de pertinncia mnimo (0) s demais
classes. No entanto, o teste realizado pela frmula acima se torna necessrio, uma vez
que esse elemento pode ter sido associado a outras classes com um grau de
pertinncia maior que zero, se Aino for a primeira classe selecionada pelo algoritmo.
Nota- se, portanto, a influncia da ordem na qual as pseudoparties so escolhidas.
Passo 4:Como critrio de parada, compare P(t)e P(t+1). Se |P(t)-P(t+1)| , ento pare;
caso contrrio, faa t = t + 1 e retorne ao Passo 2.
Neste teste, |P(t)- P(t+1)| denota a distncia entre P(t+1)e P(t), dada pela frmula:
Essa frmula verifica se a mxima diferena entre o grau de pertinncia de
qualquer elemento xkem uma dada classe Aina iterao atual e na iterao anterior
menor que o erro definido e, sendo isso feito para todas as classes. Em caso positivo,
o algoritmo deve parar e retornar os graus de pertinncias atuais de todos os
elementos, em todas as classes, como resultado. Note que, quanto menor o valor de ,
maior o nmero de passos e, consequentemente, mais refinada a pseudopartio
final obtida.
Ao final da ltima iterao do algoritmo, a pseudopartio obtida deve ser
analisada segundo algum critrio que expresse a ideia geral de que as associaes so
fortes dentro do cluster e fracas entre clusters. Este critrio pode ser definido, por
exemplo, em termos de ndices de desempenho, tal como o ndice Jm(P), dado em
funo dos centros de clustere de m pela frmula a seguir.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
46/100
8/12/2019 Marcia_Val_Springer_doutorado.pdf
47/100
37
ainda pesquisas sendo desenvolvidas a esse respeito, como em KIM et al. (2004) e
WU & YANG (2005), com uma tentativa de encontrar um ndice que se encaixe a
qualquer estrutura de dados.
Um dos ndices mais recentes de validao, o PBM, foi proposto por trs
pesquisadores: Pakhira, Bandyopadhyay e Maulik. Este ndice o produto de trs
fatores, cuja maximizao garante uma partio formada por um nmero pequeno de
clusters e compactos separados (PAKHIRA et al., 2004). Esse ndice pode ser
definido por:
sendoc o nmero de agrupamentos e,
tal que,
e,
N o nmero total de pontos do conjunto, U(X) = [uki]cN uma matriz de
pertinncia para os dados e vi a matriz de centro do i -simo agrupamento. O
objetivo maximizar o ndice para obter o nmero de agrupamentos. Quanto maior o
ndice PBM, melhor ser a clusterizao fuzzy.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
48/100
8/12/2019 Marcia_Val_Springer_doutorado.pdf
49/100
39
ndices de validao como PBM, Calinski-Harabasz, Xie-Beni, de maneira
geral, tentam avaliar a capacidade intra-cluster e a separao inter-cluster (PAKHIRA
et al., 2004).
Note-se que o uso concomitante de um conjunto de ndices diferentes pode
representar um subsdio mais robusto na escolha do melhor nmero de grupos. Isto
porque resultados de ndices de origens diferentes e com interpretaes diversas que
apresentam recomendaes coincidentes reforam as convices para a escolha a ser
feita.
O ndice de validao PBM obteve bons resultados em vrios bancos de dados
quando comparado com outros ndices (PAKHIRA et al., 2004). Sendo assim, o
ndice PBM foi aplicado na realizao deste trabalho.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
50/100
40
Captulo 5.Materiais e Mtodos
A utilizao das tcnicas geoqumicas permite correlacionar os leos entre si e
com as rochas geradoras caracterizadas, correlaes essas que podem levar a
concluses a respeito dos tipos de petrleo presentes em uma provncia produtora, e
seus graus de evoluo trmica.
Para a realizao deste estudo foi selecionado um conjunto de amostras de leos
que foram caracterizadas por parmetros geoqumicos, envolvendo biomarcadores e
diamantides.
A preparao das amostras e os mtodos analticos empregados foram
realizadas do laboratrio LAGOA- Laboratrio de Geoqumica Orgnica Molecular eAmbiental do Instituto de Qumica da UFRJ.
5.1) Procedimentos Analticos
As anlises geoqumicas realizadas nas amostras de leo, descritas a seguir,
foram: separao em fraes por cromatografia lquida; cromatografia gasosa do leo
total (whole oil) e cromatografia gasosa acoplada a espectrometria de massas dafrao dos hidrocarbonetos saturados. O procedimento analtico realizado no
laboratrio est representado na figura9.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
51/100
41
()
/
(2)
/
(1)
Figura 9: Esquema ilustrativo da sequncia de anlises para as amostras de leosselecionados.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
52/100
42
5.1.1) Tcnicas analticas utilizadas
As amostras de leos foram analisadas utilizando-se cromatografia lquida,
cromatografia gasosa (CG) e cromatografia gasosa acoplada espectrometria de
massas (CG-EM).
- Cromatografia lquida
A cromatografia lquida utilizada para separar os leos em fraes:
hidrocarbonetos saturados, hidrocarbonetos aromticos e compostos polares
(denominados NSO), a partir da propriedade da polaridade especfica que cada
composto possui.
Aproximadamente, 100 mg de leo bruto foi pesado e dissolvido em 5,0 mL de
hexano, e acrescentou-se 0,5 mL da mistura de padres preparada previamente (n-
dodecano-d26, n-hexadecano-d34 (Chiron S.A., Noruega), e n-tetracosano-d50
(Cambridge Isotopes Laboratories, USA)). A soluo foi adicionada no topo da
coluna cromatogrfica contendo 2,5 mg de slica gel ativada, e foi eluda com hexano.
Sendo assim, as fraes de hidrocarbonetos saturados (1 frao), hidrocarbonetos
aromticos (2 frao) e compostos NSO (3 frao) foram separadas (GRICE et al.
2000; AZEVEDO et al., 2008; SPRINGER et al., 2010).
A frao de hidrocarbonetos saturados (1 frao) foi eluda com 5,0 mL de n-
hexano e recolhida em frascos de 2,0 mL, totalizando um volume final de
aproximadamente 1,5 mL e logo em seguida analisada por cromatografia gasosa
acoplada espectrometria de massas para a deteco dos diamantides.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
53/100
43
Posteriormente, o volume final foi reduzido a aproximadamente 800 L, para anlise
dos biomarcadores.
A frao de hidrocarbonetos aromticos (2 frao) foi eluda com 10,0 mL de n-
hexano/diclorometano (8:2), enquanto a frao dos compostos polares (3 frao) foi
eluda com 10,0 mL de diclorometano/metanol (9:1).
- Cromatografia gasosa
A Cromatografia Gasosa (CG) uma tcnica de separao e anlise de misturas
de substncias volatilizveis. A cromatografia em fase gasosa permite uma separao
mais refinada dos compostos orgnicos presentes em leos ou extrato de rocha do que
a cromatografia lquida. Seus resultados so apresentados sob a forma de grfico
(cromatograma) onde observada a distribuio dos compostos orgnicos presentes.
A anlise de leo total (Whole oil) foi realizada em um cromatgrafo gasoso
Agilent Technologies modelo HP5890 srie II, coluna capilar DB-5 de 30 metros de
comprimento, 0,25 mm de dimetro interno e 0,25 m de espessura de fase
estacionria. As condies cromatogrficas utilizadas para as anlises foram:
temperatura de 40C (isoterma de 1 minuto) a 310C (isoterma de 19 minutos), com
taxa de aquecimento de 6C min-1. A temperatura do injetor foi de 290C e do detector
foi de 320C.
- Cromatografia Gasosa acoplada Espectrometria de Massas (CG-EM)
A cromatografia gasosa no revela a informao estrutural sobre os compostos
em anlise, por isso importante o acoplamento de um cromatgrafo a gs com um
detector mais especfico, como por exemplo, o detector seletivo de massas. Este
acoplamento leva obteno do espectro de massas de cada analito que eludo da
cromatografia (CG). A interpretao do espectro de massas (EM) permite a
identificao dos componentes de interesse.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
54/100
44
As fraes dos hidrocarbonetos saturados separadas por cromatografia em
coluna de slica foram analisadas por cromatografia gasosa de alta resoluo acoplada
a espectrometria de massas (CG/EM). Estas foram realizadas em um instrumento
Agilent Technologies 6890N acoplado a um detector seletivo de massas Agilent
Technologies 5973 utilizando uma coluna capilar de slica fundida recoberta com DB-
5 (J&W; 30 m X 0,25 mm d.i.; df = 0,25 m).
As amostras foram analisadas por CG-EM atravs do modo de monitoramento
seletivo de ons (MSI). Para a caracterizao dos biomarcadores foram selecionados
os seguintes ons: m/z 217 para os -esteranos, m/z 218 para os -esteranos e m/z
191 para terpanos, m/z177, 259 e 231, e m/z 66 para os padres internos (n-alcanos
perdeuterados: n-dodecano-d26, n-hexadecano-d34 e n-tetracosano-d50). As
condies cromatogrficas utilizadas para as anlises foram: temperatura 70C a
170C com taxa de aquecimento 20C min-1, de 170C a 310C com aquecimento de
2C min-1e isoterma de 310C durante 10 minutos. Foi realizada injeo automtica
de 1,0 L da amostra, com impacto de eltrons a 70 eV, utilizando hlio como gs de
carreador, a uma presso constante de 10 psi.
No caso dos diamantides foram selecionados os seguintes ons: m/z 135, 136,
149, 163, 177 (adamantanos); m/z 187, 188, 201, 215 (diamantanos) e m/z 66 para os
padres internos (n-alcanos perdeuterados: n-dodecano-d26, nhexadecano-d34 e n-
tetracosano-d50). As condies cromatogrficas utilizadas para as anlises foram:
temperatura 40C a 180 C com taxa de aquecimento 3 C min-1, de 180 C a 310C
com aquecimento de 6C min-1e isoterma de 310C durante 10 minutos. Foi realizada
injeo automtica de 1,0 L da amostra, com impacto de eltrons a 70 eV, utilizando
hlio como gs de carreador, a uma presso constante de 10 psi.
5.2) Avaliao estatstica dos dados
Hoje em dia, existem diversas ferramentas encontradas no mercado que seriam
passveis de serem utilizadas na execuo deste estudo. Dentre elas destacam-se: o
Statistica, MatLab, Clementine, Intelligent Miner e Weka. Porm, para a
realizao deste trabalho optou-se pela utilizao do MatLab verso 6.5, de fcilinterface com o usurio e com mdulos de visualizao j contemplados no pacote.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
55/100
45
O MatLab um "software" interativo de alta performance voltado para o
clculo numrico, que integra anlise numrica, clculo com matrizes, processamento
de sinais e construo de grficos em ambiente fcil de usar onde problemas e
solues so expressos somente como eles so escritos matematicamente, ao contrrio
da programao tradicional (SANTOS, 2009).
A modelagem pode ser dividida em quatro blocos principais, conforme
apresentado na Figura 10.
Figura 10: Esquema de viso geral do processo para anlise de grupos.
A Seleo e Tratamento de Dados o processo responsvel pelo pr-
processamento dos dados. O processo de anlise de agrupamento de dados inicia-se
com a seleo e preparao do conjunto de dados a ser utilizado na fase de
agrupamento. Estas duas etapas envolvem a seleo de um conjunto de dados
representativo da base de dados e a realizao de processos de tratamento de dados, a
fim de garantir a qualidade dos dados que sero utilizados nas etapas seguintes do
processo.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
56/100
8/12/2019 Marcia_Val_Springer_doutorado.pdf
57/100
47
Captulo 6.
Base de Dados - Descrio
A caracterizao dos sistemas petrolferos, atravs de parmetros de geoqumica
orgnica, fundamental para o desenvolvimento de modelos preditivos para a
explorao de petrleo. A maturao trmica e a caracterizao do ambiente
deposicional das rochas geradoras constituem os principais parmetros controladores
de gerao de hidrocarbonetos nas rochas sedimentares, e muitos autores tmmostrado que as evidncias geoqumicas e as distribuies dos biomarcadores e
diamantides podem fornecer critrios para distinguir rochas geradoras depositadas
em diferentes ambientes, como j discutido no captulo 3.
Como j citado anteriormente, a base de dadoscontem registros de parmetros
de maturao trmica e ambiente deposicional de 69 amostras, envolvendo razes de
biomarcadores e diamantides, que foram selecionadas a partir de trabalhos j
desenvolvidos anteriormente. Essas amostras de leos so provenientes de bacias
sedimentares brasileiras e da bacia sedimentar Llanos Orientales, sendo no total 7
bacias diferentes, como apresentado na Tabela 2. A seguir, ser apresentado um
resumo destes estudos, mostrando a caracterizao geoqumica quanto aos parmetros
de maturao e origem.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
58/100
8/12/2019 Marcia_Val_Springer_doutorado.pdf
59/100
49
Portanto, a integrao das anlises de diamantides e biomarcadores foi decisiva para
a caracterizao dos leos. Os diamantides permitiram a obteno de resultados mais
consistentes. As anlises destes compostos sugerem que os leos das bacias
envolvidas apresentam diferentes estgios de maturao: foram encontradas amostras
com alto grau de evoluo trmica e amostras pouco evoludas termicamente.
A origem dos leos foi diagnosticada como sendo marinha, mas diferentes graus
de influncia de matria orgnica depositada em ambiente continental (ou lacustre).
No estudo desenvolvido por SPRINGER (2007), cujo objetivo foi a
caracterizao geoqumica de leos provenientes da bacia sedimentar colombiana,
Llanos Orientales, as amostras de leo analisadas apresentaram, tambm, diferentes
estgios de maturao. O estudo realizado demonstrou que os leos estudados foram
classificados como biodegradados de baixa maturidade a alta maturidade e, tambm,
como craqueados. Essa caracterizao tambm s foi possvel de ser determinada
pela integrao de parmetros de biomarcadores e diamantides, segundo Dahl et al.
(1999).
Na caracterizao do ambiente deposicional, baseados em parmetros de
biomarcadores, o estudo demonstrou que algumas amostras possuem caractersticas
de matria orgnica marinha, outras de matria orgnica terrestre e, a grande maioria
se comporta como mistura.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
60/100
50
Captulo 7.Resultados e Discusso
Este captulo apresenta primeiramente a interpretao dos resultados atravs dos
mtodos tradicionais, ou seja, correlaes entre os parmetros envolvidos, tanto
para a caracterizao da maturao quanto para a caracterizao da origem. Em
seguida, apresenta os resultados da execuo do algoritmo Fuzzy c-means.
7.1) Parmetros de Maturao
7.1.1) Interpretao dos resultados pela caracterizao deBiomarcadores e Diamantides
Para a caracterizao geoqumica dos leos em estudo, alguns parmetros de
biomarcadores e diamantides propostos na literatura como indicadores do nvel de
evoluo trmica (SEIFERT & MOLDOWAN, 1991; WAPLES & MACHIHARA,
1991; CHEN et al., 1996; WASEDA & NISHITA, 1998; DAHL et al., 1999; PETERS
et al., 2005) foram calculados e avaliados, como mostra a Tabela 3.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
61/100
51
Tabela 3: Valores dos parmetros de biomarcadores dependentes de maturao trmica paraas amostras de leo estudadas. As amostras de BA a BG pertencem s bacias brasileiras, e as
BH, bacia colombiana.
AMOSTRAS IMD IMA
3-+4-Metildiamantanos
(ppm)Estigmastano
(ppm)Esteranos
/(+)(C29)Esteranos
S/(S+R) C29BA1 0,58 0,67 90,89 9,25 0,61 0,55BA2 0,68 0,69 137,17 21,32 0,61 0,63BA3 0,57 0,68 91,77 106,02 0,52 0,56BA4 0,58 0,68 130,39 50,65 0,51 0,54BA5 0,55 0,69 111,08 8,33 0,41 0,5
BA6 0,53 0,76 29,77 3,78 0,49 0,58BB1 0,39 0,63 0,37 34,19 0,34 0,49BB2 0,33 0,57 1,84 83,13 0,43 0,5BB3 0,40 0,64 2,41 73,63 0,31 0,41BC1 0,46 0,61 45,35 342,66 0,53 0,57BC2 0,44 0,68 44,34 721,40 0,35 0,54BC3 0,47 0,68 21,04 28,64 0,24 0,41BC4 0,44 0,69 22,87 235,57 0,55 0,69BC5 0,38 0,60 16,67 766,88 0,3 0,48
BC6 0,44 0,68 25,83 688,90 0,23 0,49BC7 0,42 0,61 20,03 41,25 0,48 0,51BC8 0,41 0,65 5,54 29,80 0,6 0,58BC9 0,40 0,68 7,48 30,82 0,6 0,54
BC10 0,39 0,64 4,38 24,64 0,39 0,59BC11 0,30 0,62 86,56 20,09 0,5 0,58BC12 0,31 0,62 30,08 44,66 0,32 0,48BC13 0,38 0,68 9,21 19,69 0,6 0,7BC14 0,38 0,62 8,16 294,14 0,43 0,43
BC15 0,27 0,69 45,85 6,16 0,4 0,38BC16 0,44 0,74 4,00 8,69 0,35 0,52BC17 0,34 0,62 83,52 25,99 0,45 0,24BC18 0,44 0,69 4,62 7,61 0,39 0,42BC19 0,42 0,57 26,82 76,34 0,4 0,52BC20 0,41 0,64 5,14 11,28 0,42 0,53BC21 0,43 0,72 32,33 13,46 0,52 0,52BC22 0,45 0,71 30,00 23,74 0,34 0,52BC23 0,45 0,73 150,16 0,50 0,33 0,54
BC24 0,44 0,70 19,03 148,70 0,41 0,52BC25 0,44 0,72 19,96 112,44 0,37 0,4
8/12/2019 Marcia_Val_Springer_doutorado.pdf
62/100
8/12/2019 Marcia_Val_Springer_doutorado.pdf
63/100
53
Para a caracterizao geoqumica das amostras de leos em estudo, podemos
destacar duas razes de biomarcadores que envolvem a isomerizao de esteranos,
muito utilizadas na avaliao da maturao de leos: a razo dos C29 20S/
(20S+20R) e a razo dos C29/ (+) (FARRIMOND et al., 1998).
A razo 20S/ (20S + 20R) esterano C29 usada para medir a evoluo trmica
da rocha geradora ao longo da zona imatura e parte da zona principal de gerao do
leo, chamada janela de gerao do leo (PETERS & MOLDOWAN, 1993).
Apenas a configurao R no C-20 est presente nos precursores esteroidais oriundos
de organismos vivos. Esta configurao convertida ao longo do processo de
maturao para uma mistura de esteranos de configuraes R e S e atinge seus valores
de equilbrio antes ou durante o incio da janela de gerao do leo. Esses valores
variam de zero at aproximadamente 0,5, sendo que os valores 0,52 e 0,55 se
encontram na faixa de equilbrio (SEIFERT & MOLDOWAN, 1986; PETERS et al.,
2005).
A razo / ( + )-esterano C29 uma razo de isomerizao importante
nos estudos de maturao. Seus valores de equilbrio atingem a janela de gerao do
leo, variando de zero a aproximadamente 0,7, sendo que os valores 0,67 e 0,71 se
encontram na fase de equilbrio. A configurao dos esteranos a produzida
biologicamente. Com o avano do processo da diagnese, esta forma
progressivamente, converte-se em uma mistura de epmeros e . Esta
transformao ainda no bem conhecida, acredita-se que dois tomos de hidrognio
prximos mudam simultaneamente da posio alfa () para a posio beta (). J que
existem os diastereoismeros 20S e 20R para cada forma, e respectivamente,
existiro quatro espcies distintas em cada uma das famlias (C27, C28e C29esteranos).
A isomerizao no C-14 e C-17 nos C29 esteranos regulares 20S e 20R gera um
aumento na razo / (+), que com o progressivo aumento da maturao, varia
de valores prximos a zero at valores prximos a 0,7 (PETERS et al., 2005).
8/12/2019 Marcia_Val_Springer_doutorado.pdf
64/100
8/12/2019 Marcia_Val_Springer_doutorado.pdf
65/100
55
A fim de auxiliar no estudo do grau de evoluo trmica dos leos selecionados,
utilizaram-se os diamantides atravs dos ndices propostos por Chen et al., (1996),
detalhados no captulo 3: MAI = 1-MA/(1-MA + 2-MA) e MDI = 4-MD/(1-MD + 3-
MD + 4-MD). A Figura 12 apresenta o grfico que correlaciona esses ndices.
Na avaliao das amostras sob a influncia dos parmetros de CHEN et al.
(1996) foi observado que as amostras de leo estudadas esto distribudas em regies
de altos valores dos ndices IMD e IMA. Os leos da bacia BA e alguns leos das
bacias BC, BF e BG se destacam (crculo azul) apresentando os maiores valores para
ambos os ndices, indicando um elevado grau de evoluo trmica. Por outro lado,
alguns leos da bacia BC e uma amostra da bacia BB (destacado no crculo vermelho)
apresentam os menores valores de MAI e MDI, sendo considerado os leos menos
evoludo termicamente em relao aos demais.
Figura 12: Grfico entre os ndices de metiladamantanos (MDI) e metildiamantanos (MAI)para as amostras de leo selecionadas.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
66/100
56
Outras correlaes realizadas foram entre o MDI e as razes de biomarcadores
/ (+) e 20S/ (20S + 20R) esterano C29, Figuras 13A e 13B,
respectivamente. A partir destes grficos, podemos observar que o parmetro origem
pode ser um grande controlador sob alguns fatores maturao: no existe umatendncia linear para todo o grupo, e sim um visvel agrupamento por bacia. Na figura
13B, observa-se uma clara separao entre as amostras da bacia BH (bacia
colombiana) e as demais amostras, provenientes de bacias sedimentares brasileiras.
No grfico da figura 13A, observou-se uma disperso linear para as amostras das
bacias brasileiras, destacando as amostras da bacia BA como as mais evoludas
termicamente.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
67/100
57
Figura 13: Grficos de : (A) correlao entre MDI e a razo / (+); (B) correlaoentre MDI e a razo 20S/ (20S + 20R) esterano C29.
Aumento damaturao
A
B
8/12/2019 Marcia_Val_Springer_doutorado.pdf
68/100
58
Outra correlao muito estudada para analisar a evoluo trmica dos leos foi
proposta por DAHL et al. (1999). A resistncia estabilidade trmica dos
diamantides leva a um consequente aumento da sua concentrao durante a evoluotrmica do leo, enquanto a concentrao dos biomarcadores, que so menos
resistentes a essas condies, diminui. Com o aumento do estresse trmico os
biomarcadores so degradados, este fato pode ser observado pela diminuio da
concentrao do estigmastano (5,14,17(H)-24-etil-colestano 20 R). Por outro lado,
ocorre um enriquecimento da concentrao de diamantides, neste caso foi usado o
somatrio do 3-metildiamantano e 4-metildiamantano.
O resultado do grfico entre as concentraes de 3-+4-metildiamantanos e
Estigmastano est representado nas Figuras 14A e 14B. Para as amostras em estudo,
possvel observar que as amostras da bacia BC tm caractersticas tanto imaturas
(amostras destacadas pelo crculo vermelho) quanto maturas e altamente maturas. As
amostras da bacia BB so maturas, mas ainda no se encontram na fase de
craqueamento. A maioria das amostras das bacias BA e BH so altamente maturas,
sendo que algumas j se encontram na fase de craqueamento, assim como uma
amostra da bacia BG. Algumas amostras das bacias BA e BH apresentam altas
concentraes de estigmastano e diamantides, que segundo DAHL e colaboradores
(1999), pode ser considerado mistura de leos em diferentes pulsos de migrao com
nveis diferenciados de maturao.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
69/100
59
Figura 14: Grfico de correlao entre 3-+4- metildiamantano versusEstigmastano, propostopor DAHL et al. (1999).
Mistura
B
A
maturao
craqueamento
8/12/2019 Marcia_Val_Springer_doutorado.pdf
70/100
60
7.1.2) Anlise de agrupamento FCM Fuzzy c-means
A anlise de agrupamento foi realizada utilizando os parmetros e valores
mostrados na Tabela 2. Pela anlise de cluster as amostras foram diferenciadas em
cinco grupos de diferentes graus de maturao. Os resultados so discutidos a seguir.
Antes de realizar o processo de clusterizao foi efetuado o pr-tratamento dos
dados, analisando a presena de valores ausentes e correlaes entre as variveis,
seguindo o procedimento de Data Mining.
Com a finalidade de determinar o melhor nmero possvel de agrupamentos foi
utilizado o ndice de validao PBM, detalhado no captulo 4 (PAKHIRA et al.,
2004).. Analisando a Tabela 4, que apresenta diferentes valores de m para cada
agrupamento, o ndice de validao indica cinco grupos.
Tabela 4: Determinao do nmero de grupos.
Grupos m=1,2 m=1,4 m=1,6 m=1,8 m=2,0
2 0,125 0,081 0,044 0,026 0,011
3 0,185 0,124 0,073 0,050 0,033
4 0,360 0,158 0,081 0,047 0,033
5 1,207 0,417 0,166 0,053 0,028
6 1,116 0,145 0,085 0,050 0,023
8/12/2019 Marcia_Val_Springer_doutorado.pdf
71/100
8/12/2019 Marcia_Val_Springer_doutorado.pdf
72/100
62
Figura 16: Grfico de distribuio dos grupos em porcentagem para os parmetros dematurao selecionados.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
73/100
63
Figura 17: Grfico de funo de pertinncia para os parmetros de maturao, usando FCM,com ndice de fuzzificaom=1,2 e, componentes principais CP1 e CP2.
Como j discutido no captulo de fundamentao terica (captulo 4), e
observando a tabela 4, com o aumento do valor do parmetro de fuzzificao (m)o
valor do ndice diminui, pois mais imprecisas so as parties geradas. Nas Figuras
18A e 18B observa-se a disposio das funes de pertinncia para diferentes valoresde m, m=1,2 e m=1,8, respectivamente.
8/12/2019 Marcia_Val_Springer_doutorado.pdf
74/100
64
Figura 18: Grficos de funes de pertinncia para os parmetros de maturao, usando FCM:(A) m =1,2; (B) m = 1,8.
A interpretao de cada cluster pode ser realizada pelos centros de suas
respectivas coordenadas. Observando a Tabela 5, podem-se fazer algumasconsideraes relatadas a seguir.
A
B
8/12/2019 Marcia_Val_Springer_doutorado.pdf
75/100
65
Tabela 5: Valores dos Parmetros de Maturao nos Centros de Grupos.
Parmetros Grupo 1 Grupo 2 Grupo 3 Grupo 4 Grupo 5
MAI 1,68 1,67 1,69 1,67 1,73
MDI 1,44 1,50 1,50 1,44 1,45
3+4 metildiamantanos 84,64 98,80 119,58 111,37 138,93Estigmastano 108,96 105,10 99,00 129,02 78,06
/(+)(C29) 1,52 1,58 1,61 1,66 1,50
S/(S+R) C29 1,51 1,48 1,50 1,56 1,53
Os parmetros 3-+4- metildiamantanos e Estigmastano so os que possuem
maior ponderao em cada grupo, ou seja, so mais significativos. No grupo 1, acontribuio de Estigmastano supera a contribuio de metildiamantanos, o que pode
sugerir um grupo de amostras de leo pouco maturo, evento que tambm ocorre no
grupo 2. Porm, este apresenta uma maior contribuio dos metildiamantanos em
relao aquele. Sendo assim, o grupo 2 pode ser considerado mais evoludo
termicamente que o grupo 1.
J nos grupos 3 e 5 a contribuio dos metildiamantanos maior que a dobiomarcador estigmastano: o grupo 5 apresenta o menor valor de estigmastano e o
maior valor de metildiamantano em relao aos demais grupos, mostrando ser assim o
mais evoludo termicamente; o grupo 3 possui menor valor de metildiamantano e
maior valor de estigmastano que o grupo 5, mostrando ser menos maturo que este,
mas com maior maturidade que os grupos 1 e 2.
Analisando os resultados para o grupo 4, observam-se valores elevados de
biomarcadores e valores elevados de diamantides. Consequentemente, suspeita-se de
mistura de leos em diferentes pulsos de migrao com nveis diferenciados de
maturao (DAHL et al., 1999).
Conforme os resultados discutidos anteriormente, os parmetros 3-+4-
metildiamantanos e Estigmastano apresentam uma contribuio muito superior aos
demais parmetros. Sendo assim, considerados parmetros decisivos para o
agrupamento das amostras do estudo. Estes resultados, vo de encontro com os
8/12/2019 Marcia_Val_Springer_doutorado.pdf