111
UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIA GUILHERME NAVARRO NILO GIUSTI SEQUENCIAMENTO DE ALTO DESEMPENHO PARA QUANTIFICAÇÃO DA DOENÇA RESIDUAL MÍNIMA EM LEUCEMIA LINFÓIDE AGUDA CAMPINAS (2019)

UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

UNIVERSIDADE ESTADUAL DE CAMPINAS

INSTITUTO DE BIOLOGIA

GUILHERME NAVARRO NILO GIUSTI

SEQUENCIAMENTO DE ALTO DESEMPENHO PARA

QUANTIFICAÇÃO DA DOENÇA RESIDUAL MÍNIMA EM

LEUCEMIA LINFÓIDE AGUDA

CAMPINAS

(2019)

Page 2: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

GUILHERME NAVARRO NILO GIUSTI

SEQUENCIAMENTO DE ALTO DESEMPENHO PARA QUANTIFICAÇÃO DA

DOENÇA RESIDUAL MÍNIMA EM LEUCEMIA LINFÓIDE AGUDA

Orientador: José Andrés Yunes

CAMPINAS

(2019)

Dissertação apresentada ao Instituto de Biologia da Universidade Estadual de Campinas como parte dos requisitos exigidos para a obtenção do título de Mestre em Genética e Biologia Molecular, na Área de Genética Animal e Evolução

ESTE TRABALHO CORRESPONDE À VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO ALUNO GUILHERME NAVARRO NILO GIUSTI E ORIENTADA PELO PROF. DR. JOSÉ ANRÉS YUNES

Page 3: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO
Page 4: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

Campinas, 22 de Fevereiro de 2019

COMISSÃO EXAMINADORA

Prof. Dr. José Andrés Yunes

Prof. Dr. Márcio José da Silva

Dra. Juliana Godoy Assumpção

Os membros da Comissão Examinadora acima assinaram a Ata de Defesa, que se

encontra no processo de vida acadêmica do aluno.

Page 5: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

AGRADECIMENTOS

Em primeiro lugar, agradeço à minha mãe, Viviane, por sempre ter me apoiado

e dado condições de me dedicar às minhas curiosidades e aos estudos. A estrutura e

carinho que você me proveu ao longo de toda a minha vida foram e sempre serão

essenciais a essa jornada. Você é o meu maior exemplo.

À minha namorada, Caroline, por todo amor e compreensão, mesmo nos

momentos mais turbulentos. Sem o seu apoio, esse momento teria sido infinitamente

mais complicado. Que nós possamos enfrentar muitos outros desafios lado a lado e

que eu consiga te retornar pelo menos metade do suporte que você me proveu.

A toda a minha família, que sempre estive presente quando a minha maior

necessidade era Raiz e Casa. Agradeço especialmente aos meus avós, Filadelfo e

Dalva, por terem originado essa família maravilhosa e servirem como grande fonte de

inspiração. Se eu escolhi trabalhar com pesquisa em saúde, a razão foi você, vô. Outro

agradecimento especial aos meus primos, por terem sido por uma vida toda os irmãos

que nunca tive.

Agradeço também ao meu pai, Carlos. Apesar da distância, você nunca me

faltou com amor e participação na formação do meu caráter, sendo sempre um grande

exemplo positivo a ser seguido.

Agradeço também ao meu orientador, Prof. Dr. Andrés, por acreditar em meu

potencial em desenvolver um trabalho de importância tão significativa. Aos seus

conselhos, prontidão em sempre auxiliar no desenvolvimento do projeto e apoio. Que

nossos próximos trabalhos em conjunto possam ser tão bem-sucedidos quanto essa

jornada.

A todos os amigos do Centro de Pesquisa Boldrini, seja pelos conselhos

técnicos e acadêmicos, seja pela amizade constante que faz toda diferença em criar

um ambiente prazeroso de trabalho. Em especial, agradeço à Dra. Patrícia por toda a

paciência em me auxiliar e ensinar ao longo de todo o desenvolvimento desse projeto,

além de todos os conselhos, conversas e amizade. Agradeço também especialmente

Page 6: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

aos bagaceiros Zeni, Diego, Leo e Victor. A amizade de vocês não tem preço e se

estende para muito além dos laboratórios dessa vida acadêmica.

Agradeço a todos outros amigos verdadeiros que fizeram e fazem parte da

minha vida, ao longo de toda a minha nômade jornada por esse mundo. Dizem que

os amigos são a família que a gente escolhe, e nesse caso isso não poderia ser mais

verdadeiro. Vocês são incríveis.

Um agradecimento mais que especial a todas às crianças que cederam o

material biológico que possibilitou o desenvolvimento desse trabalho. Desse modo, a

luta de vocês é convertida em esperança e também em apoio para que cada vez

menos crianças tenham que lutar.

Agradeço às instituições que propiciaram o suporte financeiro para o

desenvolvimento desse projeto. Ao Conselho Nacional de Desenvolvimento Científico

e Tecnológico (CNPq) pelo apoio durante o primeiro ano do mestrado. Ao Programa

Nacional de Apoio à Atenção Oncológica (PRONON, SIPAR 25000.057709/2015-01),

Instituto Ronald McDonald e Fundação Bradesco por outras verbas que permitiram a

realização desse estudo.

Por fim, agradeço à Fundação de Amparo à Pesquisa do Estado de São Paulo

(FAPESP) pelo financiamento do projeto (processo n° 2017/03942-8) por meio do

convênio com a Coordenação de Aperfeiçoamento de Pessoal de Nível Superior

(CAPES)

Page 7: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

RESUMO

Sequenciamento de alto desempenho para quantificação da Doença Residual

Mínima em Leucemia Linfóide Aguda

A leucemia linfoide aguda (LLA) é o câncer mais comum na criança. Os atuais

protocolos de tratamento da LLA pediátrica alcançam índices de sobrevida livre de

doença que se aproximam de 90%. Parte desse sucesso se deve à alocação dos

pacientes em diferentes grupos de risco, segundo fatores prognósticos obtidos ao

longo do tratamento. A resposta inicial ao tratamento, avaliada pela quantificação das

células leucêmicas residuais do paciente, ou doença residual mínima (DRM), é um

dos mais importantes fatores para a identificação desses grupos de risco. O protocolo

do Grupo Brasileiro de Tratamento da Leucemia Infantil (GBTLI LLA-2009), usa a

DRM dos dias 15 e 35 do tratamento, avaliada por citometria de fluxo e por PCR

quantitativo (qPCR) respectivamente, para alocação dos pacientes nos grupos para

diferentes esquemas de tratamento quimioterápico. A avaliação da DRM por

citometria de fluxo (DRM-CF) e qPCR (qPCR DRM) é cara, exige muita experiência e

demanda análise imediata (citometria) ou demorada das amostras (qPCR),

dificultando seu uso em abrangência nacional. O número de crianças que têm se

beneficiado do exame de DRM é de apenas 100 por ano (3,2%). Nesse projeto

padronizou-se o uso do sequenciamento de última geração (NGS) para a

quantificação da DRM em crianças com LLA-B derivada, método que apresenta

vantagens em termos de rapidez, custos e escalabilidade. Uma vez padronizado, o

método de análise de DRM por sequenciamento (NGS DRM) foi validado em amostras

de LLA-B derivada pediátrica retrospectivamente analisadas no Centro Infantil

Boldrini. Resultados NGS DRM foram comparados a resultados de qPCR DRM para

as mesmas amostras, obtendo uma taxa de satisfatoriedade de 88,5% e um

coeficiente de correlação de Pearson de 0,86. Como próximos passos, esperamos

continuar o aperfeiçoamento do método, elevando a sua sensibilidade e acurácia,

adicionando outros marcadores associados à LLA-B derivada pediátrica ao protocolo

e adaptando-o para outras variedades de leucemias.

Page 8: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

ABSTRACT

Acute Lymphoblastic Leukemia Minimal Residual Disease quantification by high

throughput sequencing

Acute Lymphoblastic Leukemia (ALL) is the most common cancer in children. The

current childhood ALL treatment protocols achieve disease-free survival rates close to

90%. Part of this success is due to the allocation of patients in different risk groups,

according to prognostic factors assessed during the treatment. Initial treatment

response, assessed by the quantification of the patient’s residual leukemic cells, or

Minimal Residual Disease (MRD), is one of the most important factors to identify these

risk groups. The protocol of the Brazilian Group for the treatment of ALL (GBTLI LLA-

2009) uses MRD at days 15 and 35, evaluated by flow cytometry and qPCR

respectively, to allocate the patients into groups for different chemotherapy treatment

schemes. Flow cytometry and qPCR MRD assessment are expensive, require a lot of

experience from the analyst and demand immediate analysis (cytometry) or a multistep

25 days-long analysis (qPCR). These factors hamper these methods’ broad utilization

in Brazil. The number of children in the country who are able to take advantage of the

MRD exam is 100 a year (3,2% of total pediatric ALL cases in our country). In this

Project, we standardized MRD assessment in childhood ALL by Next Generation

Sequencing of IgH rearrangements. This assay is both cheaper and faster than the

conventional ones and has high scalability potential. Once standardized, this method

was validated using pediatric pre-B ALL samples previously analyzed at Centro Infantil

Boldrini. The NGS MRD results were compared to the qPCR MRD ones, achieving a

result satisfaction rate of 88,5% and a Pearson correlation coefficient of 0,86. The next

steps are to keep polishing the method, by increasing its sensitivity and accuracy,

adding additional established pediatric pre-B ALL markers to the protocol and adapting

the method for other types of leukemia.

Page 9: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

SUMÁRIO

I. INTRODUÇÃO 11

1. Leucemia Linfoide Aguda 11

2. Rearranjo V(D)J 12

3. Doença Residual Mínima 15

4. Detecção da DRM 16

5. DRM por Next Generation Sequencing (NGS) 19

5.1. Obtenção da Frequência do Clonotipo Leucêmico em DNA Linfocítico Total 19

5.2. Normalização da Frequência do Clonotipo Leucêmico em DRM 24

5.3. Vantagens da NGS DRM 27

II. OBJETIVOS 29

III. MÉTODOS 30

1. Clonagem das Sequências Spike-In Control 32

2. Preparo do Pool de Spike-In Control 34

3. Seleção das Amostras para Determinação de NGS DRM 35

4. Isolamento das células mononucleadas 36

5. Quantificação da DRM por NGS 37

IV. FORMA DE ANÁLISE DOS RESULTADOS 40

V. RESULTADOS 42

1. Padronização da Amplicon PCR 42

1.1. Teste de Enzimas: Phusion vs Tth 42

1.2. Touchdown PCR 44

1.3. Redução da Concentração de Primers 46

1.4. Teste da Enzima GoTaq G2 Hot Start DNA Polymerase 48

2. Número de Ciclos de PCR 50

3. Teste de Concentração de PhiX 53

Page 10: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

4. Spike-in Control 55

4.1. Teste do uso de Spike-In Controls para Determinar NGS DRM 55

4.2. Teste do uso de Spike-In Controls linearizados para Determinar NGS DRM 58

4.3. Teste de Amplificação Diferencial de Moléculas Spike-In Control 61

5. Validação do Método de NGS DRM 64

5.1. Desenho Experimental 64

5.2. Análise da Qualidade dos Dados do Sequenciamento 65

5.3. Comparação do Número de Clonotipos Leucêmicos Identificados por NGS DRM e qPCR DRM 66

5.4. Comparação entre qPCR DRM e NGS DRM 66

5.5. Determinação de Subamplificação de Sequências Spike-In Control 71

5.6. Comparação entre qPCR DRM e NGS DRM Excluindo o Terceiro Subset 73

5.7. Comparação entre qPCR DRM e Frequência dos Clonotipos Leucêmicos 75

6. Comparação de Custo entre qPCR DRM e NGS DRM 78

VI. DISCUSSÃO 79

VII. REFERÊNCIAS BIBLIOGRÁFICAS 88

VIII. ANEXOS 92

Anexo 1 - Tabela 1S 92

Anexo 2 - Termo de Consentimento GBTLI LLA-2009, Baixo Risco 95

Anexo 3 - Termo de Consentimento GBTLI LLA-2009, Alto Risco 99

Anexo 4 - Termo de Consentimento URB/Boldrini 103

Anexo 5 - Parecer Consubstanciado CEP 105

Anexo 6 - Declaração de Direitos Autorais 111

Page 11: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

11

I. INTRODUÇÃO

1. Leucemia Linfoide Aguda

A Leucemia Linfoide Aguda, comumente denominada LLA, é uma neoplasia

maligna cujo principal atributo é a proliferação monoclonal de células precursoras de

linfócitos cancerosas na medula óssea e no sangue periférico, ocorrendo com maior

frequência em linfócitos B (Woo et al., 2014). Essa enfermidade é altamente

prevalente em crianças, sendo responsável por cerca de 25% dos casos de câncer

nesse grupo etário (Howlader et al., 2013). Em função dos diversos esforços da

comunidade científica internacional, a taxa de sobrevida livre dessa doença em

pacientes pediátricos atualmente vem se aproximado de 90% (Pui et al., 2009;

Kansagra et al., 2018; Kato e Manabe, 2018). Apesar desse sólido avanço, outros

dados explicitam o longo caminho ainda a ser percorrido no combate à LLA infantil.

Como exemplo, crianças que apresentam recaídas após remissão clínica, têm entre

20 e 35% de probabilidade de cura (Nguyen et al., 2008; Reismüller et al., 2009).

Ao longo do ano de 2018, segundo o Instituto Nacional de Câncer, estimou-se

a ocorrência de 420.000 novos casos de neoplasias no Brasil, dos quais 12.500

correspondem a casos infantis e em adolescentes de até 19 anos (INCA, 2017).

Desses, 3125 devem ter correspondido à Leucemia Linfoide Aguda, segundo a

conjectura percentual dessa doença.

Page 12: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

12

2. Rearranjo V(D)J

Os linfócitos das linhagens B e T, como células efetoras do sistema imune

adaptativo, devem ser capazes de reconhecer de maneira altamente específica uma

vasta gama de antígenos. O elevadíssimo grau de polimorfismos existente nas

imunoglobulinas (Ig) e receptores de células T (TCR), responsáveis pela identificação

de antígenos, deriva de um mecanismo de rearranjo somático nos loci gênicos

responsáveis pela expressão dessas moléculas. Esse processo recombina os éxons

denominados Variável (V), Diversidade (D) e Junção (J) desses genes de maneira

diferente em cada célula, além de adicionar e remover aleatoriamente alguns

nucleotídeos nas regiões de intersecção desses éxons (Figura 1). Particularmente

para o gene da cadeia pesada de imunoglobulina (IgH), relevante para esse projeto,

existem 7 famílias de éxons V (denominados VH), 7 famílias de éxons D (denominados

DH) e 6 famílias de éxons J (denominados JH). Apesar de toda a sua variabilidade,

esses segmentos possuem algumas regiões razoavelmente conservadas para cada

família de éxons, denominadas frameworks (Abbas et al., 2017)

Page 13: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

13

Desse modo, o processo de recombinação V(D)J permite que cada linfócito

gerado possua uma molécula de reconhecimento distinta e virtualmente única

(Tonegawa S, 1983). Esse processo de rearranjo singular e em certo grau aleatório

do DNA de cada precursor de linfócito resulta, portanto, em uma população de células

B e T contendo um vasto repertório de reconhecimento de antígenos. Cada variante

de sequência gerada por um rearranjo V(D)J presente em uma população de linfócitos

é denominada um clonotipo.

Nos casos de LLA-T e LLA-B derivada, no entanto, um precursor de linfócito

(denominado linfoblasto) neoplásico passa a se reproduzir de maneira descontrolada.

Figura 1. Diagrama esquemático do rearranjo V(D)J de genes Ig e TCR. (A) esquema do gene TCRB, mostrando sequência de eventos do rearranjo V(D)J até expressão do receptor TCR. (B) A sequência do rearranjo V(D)J para cada novo linfócito gerado é virtualmente única.

Page 14: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

14

Essa proliferação excessiva leva a população linfocítica a ser tomada por clones

desse linfoblasto canceroso, que possuem todos um mesmo clonotipo V(D)J (Levy et

al., 1977).

Page 15: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

15

3. Doença Residual Mínima

Uma das principais ferramentas para acompanhar a resposta ao tratamento na

LLA é a avaliação da Doença Residual Mínima, ou seja, a apreciação quantitativa de

células malignas presentes na medula óssea ou no sangue periférico não detectáveis

através de análises morfológicas (Stock e Estrov, 2000). Valores de DRM são

expressos em frequência de um linfoblasto leucêmico pela quantidade de células

mononucleadas total da amostra (Cavé et al., 1998). A avaliação desse dado em

diferentes time points ao longo do tratamento possibilita uma análise altamente

sensível da redução ou do aumento da quantidade de linfócitos neoplásicos no

paciente, funcionando assim como o mais poderoso fator prognóstico individual para

seu risco de recaída. Essa informação acerca da dinâmica da população de células

cancerosas permite classificar os pacientes em diferentes grupos de risco e,

consequentemente, modular o seu tratamento, reduzindo seus efeitos colaterais e

elevando as suas taxas de sobrevida (Wasserman et al., 1992; Brisco et al., 1994;

Gajjar et al., 1995; van Dongen et al., 1998; Ryan et al., 2009; Conter, 2010).

Alguns parâmetros fundamentais para a análise da DRM são a sensibilidade

do ensaio utilizado, que deve ser capaz de detectar no mínimo um linfócito maligno

em 10.000 células saudáveis (10-4); o time point no qual o exame é realizado; e a

associação do valor percentual de células leucêmicas residuais à situação clínica do

paciente, existindo um consenso de que níveis acima de 10-3 estão associados a

maiores chances de recaída. Ainda, o valor prognóstico da DRM depende da

padronização e verificação desses parâmetros em função do protocolo de tratamento

utilizado (Jacquy et al., 1997; Cavé et al., 1998; Ryan et al., 2009; Conter, 2010).

Page 16: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

16

4. Detecção da DRM

Antes do desenvolvimento de métodos mais sensíveis, estudos das taxas de

doença residual de pacientes com LLA eram realizados através da contagem de

linfoblastos em esfregaços de medula óssea analisados em microscópios. No entanto,

essa análise morfológica apresenta uma sensibilidade máxima de apenas 5 células

leucêmicas em 100 células normais (5 x 10-2). A partir do início da década de 1990,

essa dinâmica populacional das células leucêmicas, já denominada doença residual

mínima, passou a ser investigada por PCR convencional seguida de quantificação por

Southern Blot (Yamada et al., 1990; Cavé et al., 1998; Biondi et al., 2000).

O surgimento de técnicas modernas de biologia molecular contribuiu para o

aperfeiçoamento dos métodos de análise da DRM, sendo mais utilizados atualmente

a Citometria de Fluxo (CF), baseada no imunofenótipo distintivo das células de LLA,

e o PCR quantitativo em tempo real (qPCR) dos rearranjos de genes Ig e TCR (van

Dongen et al., 2016). Os ensaios de qPCR fazem uso do rearranjo V(D)J sofrido por

esses genes no início da diferenciação linfóide, que gera sequências diferentes e

únicas para cada um dos linfócitos gerados (Figura 2) (Verhagen et al., 2000). Já os

exames baseados na CF detectam essas células através de painéis de marcadores

de superfície presentes em populações celulares leucêmicas (Coustan-Smith et al.,

1998). A natureza majoritariamente monoclonal da LLA resulta do fato das células

malignas terem origem em apenas um linfoblasto neoplásico e, portanto, possuírem

moléculas de superfície ou genes Ig/TCR idênticos entre si, mas diferentes do restante

da população linfocítica, permitindo a sua identificação pelos experimentos

previamente citados. (Verhagen et al., 2000).

Page 17: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

17

Enquanto esses dois procedimentos para detecção da DRM têm sido

largamente utilizados com relativo sucesso, ambos apresentam limitações-chave. Em

relação à citometria de fluxo, por exemplo, existe dificuldade na obtenção de níveis de

sensibilidade estáveis, uma vez que os linfoblastos malignos podem ser confundidos

pelo método com células normais em regeneração. Mesmo quando uma sensibilidade

estável é atingida, níveis melhores que 10-4 não costumam ser alcançados, mesmo

quando utilizando técnicas de citometria com 6 a 8 cores. Por fim, a interpretação dos

dados gerados é bastante dependente do nível de treinamento e experiência do

operador, adicionando um viés subjetivo ao resultado final (van Dongen et al., 2016).

A PCR quantitativa em tempo real, por outro lado, consegue atingir níveis de

sensibilidade mais satisfatórios, chegando à ordem de 10-5 (Ryan et al., 2009). O nível

de sensibilidade varia em função da frequência com a qual o rearranjo utilizado como

marcador ocorre em casos de LLA e em linfócitos saudáveis; da sua estabilidade, que

é determinada pela sua tendência a sofrer rearranjos secundários (quanto maior essa

frequência, menor a estabilidade); e das características de sua “cicatriz” V(D)J, como

o número e tipo de nucleotídeos N inseridos entre as regiões recombinadas. Para os

casos de Leucemia Linfoide Aguda B-derivada, o protocolo internacional europeu

AIEOP-BFM ALL 2000 considera IgH como o biomarcador mais promissor (van

Dongen et al., 2003).

No entanto, o uso da qPCR para a determinação de DRM em casos desse

câncer também enfrenta desvantagens e limitações. O principal desses empecilhos é

a natureza laboriosa, demorada e cara do método, o que dificulta a universalização

Figura 2. Princípio da análise de DRM por qPCR. A análise da DRM por qPCR tira proveito do fato da inserção de nucleotídeos N/P no processo de recombinação V(D)J ser aleatória e, por isso, com virtualmente única em cada linfócito formado. O primer paciente-específico (em vermelho) é desenhado de forma a anelar sobre a região dos nucleotídeos N/P. A qPCR é feito com primer paciente-específico forward em combinação com primer reverso consenso e sonda TaqMan que se anelam no segmento J.

Page 18: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

18

do seu uso. Muito desse consumo de tempo e recursos está ligado à necessidade da

confecção e teste de primers específicos e individuais para o clonotipo leucêmico de

cada paciente (van Dongen et al., 2016). Em adição, na maior parte dos casos existe

a necessidade da utilização de pelo menos dois marcadores moleculares na análise

da DRM, com o intuito de evitar a obtenção de resultados falso-negativos como

consequência de oligoclonalidade gerada por evoluções subclonais (Beishuizen et al.,

1994). Cada marcador acompanhado por qPCR exige a confecção de um primer

paciente-específico próprio para a sua sequência V(D)J.

Em função dessa conjuntura de altos custos e elevado grau de expertise

necessário, a análise de casos pediátricos de LLA por DRM no Brasil ocorre de forma

rotineira apenas no Centro Infantil Boldrini e no GRAAC (Unifesp). Desse modo,

atualmente apenas cerca de 100 crianças por ano (3,2% do total de casos no país) se

beneficiam da apreciação desse importante fator prognóstico em seus tratamentos.

Page 19: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

19

5. DRM por Next Generation Sequencing (NGS)

Esse conjunto de limitações das técnicas atuais, portanto, expõe a necessidade

do desenvolvimento de um método para análise de DRM mais sensível, específico,

automatizável e, principalmente, mais barato. Nesse contexto, o sequenciamento de

nova geração, também denominado Next Generation Sequencing (NGS), surge como

um proeminente candidato (Wu et al., 2012; Nunes et al., 2017). Nesse projeto,

buscou-se a padronização da utilização do sequenciador Illumina MiSeq para realizar

análises de DRM em casos de LLA-B derivada, utilizando como gene alvo o rearranjo

V(D)J em IgH.

Esse trabalho fez parte do projeto PRONON denominado “Sequenciamento de

alto desempenho para quantificação da Doença Residual Mínima em Leucemia

Linfoide Aguda”, de número 25000.057709/2015-01 no SIPAR, cujo Termo de

Concessão encontra-se publicado no Diário Oficial da União de 10 de dezembro de

2015.

5.1. Obtenção da Frequência do Clonotipo Leucêmico em DNA Linfocítico Total

A análise da DRM por NGS é feita com uso de amostras pareadas coletadas

no ato do diagnóstico da LLA (amostra diagnóstico) e no 35º dia da terapia de indução

(amostra seguimento). Essas amostras são coletadas da medula óssea dos pacientes,

tendo as suas células mononucleadas isoladas e seu DNA genômico extraído. As

amostras diagnóstico (denominadas D0) possuem altos índices de linfoblastos

leucêmicos, permitindo a identificação das sequências de nucleotídeos referentes a

esses clonotipos para o paciente testado. As amostras seguimento (denominadas

D35) são utilizadas para o cálculo em si da NGS DRM do paciente nesse time point.

Amostras D35 e D0 são sequenciadas em corridas separadas, para evitar

contaminação cruzada entre esses grupos.

A obtenção de NGS DRM também se fundamenta na amplificação da “cicatriz”

V(D)J do gene IgH, assim como na qPCR DRM. No entanto, o preparo das amostras

Page 20: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

20

para sequenciamento se baseia em uma multiplex nested PCR, ao invés de uma PCR

singleplex. Nesse sistema, a primeira etapa de PCR faz uso de um conjunto de primers

consenso capazes de se anelar a uma vasta gama de rearranjos de IgH, realizando a

amplificação da sequência V(D)J em si. Já a segunda etapa adiciona os adaptadores

para o sequenciamento aos amplicons gerados na primeira PCR (Faham et al., 2012).

Esse processo encontra-se ilustrado na Figura 3.

Na primeira, denominada Amplicon PCR, utiliza-se 50 ng de gDNA para a

análise de amostras D0, quantidade suficiente para a identificação dos seus clonotipos

leucêmicos. Já para analisar amostras D35, são utilizadas 600 ng de gDNA. Desse

modo, levando em conta que uma célula diploide humana contém cerca de 6 pg de

DNA, a análise da DRM utiliza o material genético de cerca de 100.000 células

mononucleadas por amostra. A sensibilidade máxima teórica da técnica de NGS DRM

é, portanto, de uma célula leucêmica em 100.000 células mononucleadas (10-5).

O multiplex de primers utilizado nessa etapa é o FR2 Biomed2, que consiste

em um conjunto de forward primers que têm como alvo o segundo framework de

diferentes segmentos VH em par a um reverse primer consenso para anelamento em

JH (van Dongen et al., 2003). Cada oligonucleotídeo forward desse conjunto utilizado

Figura 3. Esquema do Nested Multiplex PCR de rearranjos IgH. Primeira etapa de PCR utiliza um conjunto de primers em multiplex para segmentos V(D)J. A segunda PCR adiciona os adaptadores para o sequenciamento do amplicon.

Page 21: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

21

é específico para uma família de segmento VH, totalizando assim 7 primers. O reverse

primer consenso é capaz de reconhecer todas as famílias JH. Todos esses alvos

desses oligonucleotídeos se encontram no gene IgH. Foram adicionadas a esses

primers caudas 5’ não-complementares a rearranjos V(D)J, que funcionam como alvo

para o anelamento dos primers da segunda etapa de PCR.

Na segunda etapa, denominada Index PCR, os primers utilizados provém do

kit Nextera XT, fornecidos pela Illumina. Esse par de oligonucleotídeos consiste nos

adaptadores necessários à etapa posterior de sequenciamento no MiSeq,

denominados P5 e P7, além de conter duas sequências indexadoras de 8

nucleotídeos (um em cada primer do par). Esses index possibilitam gerar uma

combinação de sequências identificadoras de amostras única para cada paciente

analisado. Desse modo, é possível realizar a análise de amostras de diversos

pacientes em apenas uma corrida do sequenciado.

Reações de PCR multiplex, como a etapa de Amplicon PCR, podem apresentar

um viés de amplificação diferencial, amplificando certas sequências de DNA com

eficiência maior do que outras. Esse efeito pode ser gerado pela maior facilidade de

amplificação de fragmentos de DNA menores ou por diferentes porcentagens de GC

dos amplicons (Elnifro et al., 2000). O número de ciclos das duas reações de PCR

realizadas é um fator importante no controle desse viés de amplificação diferencial,

uma vez que menores números de ciclos na primeira etapa, na qual a reação multiplex

é de fato realizada, privilegiariam a restrição desse viés (D’Amore et al., 2016). Assim

sendo, o número de ciclos da primeira PCR foi um parâmetro testado, buscando

minimizar o seu viés de amplificação sem comprometer a sensibilidade e linearidade

do teste.

Após a realização das duas etapas de PCR, o material genético obtido

(denominado biblioteca) é purificado utilizando beads magnéticas, capazes de separar

fragmentos de DNA com base em seu tamanho. A plataforma MiSeq tem maior

facilidade em sequenciar amplicons quanto menores os seus tamanhos.

Considerando que primer-dimers possuem adaptadores para sequenciamento e são

menores que os amplicons alvo do método de NGS DRM, sua remoção é imperativa.

As bibliotecas preparadas são então quantificadas, diluídas para a

concentração de sequenciamento e, em casos em que amostras de mais de um

paciente forem ser analisadas em um mesmo sequenciamento, multiplexadas. Os

Page 22: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

22

sistemas de sequenciamento Illumina possuem dificuldade em sequenciar bibliotecas

de baixa diversidade, como é o caso do um sequenciamento contendo apenas

amplicons do gene IgH (Mitra et al., 2015). Desse modo, é realizada a adição de

genomas PhiX (Illumina) à biblioteca, o que eleva a sua diversidade de amplicons,

permitindo um sequenciamento mais robusto. Buscando reduzir a concentração PhiX

adicionada e assim diminuir o volume de dados desperdiçado no sequenciamento, foi

testado o uso concomitante de quatro variedades do primer reverso JH (utilizado na

primeira etapa do nested PCR), com cada uma delas contendo entre 0 a 3

nucleotídeos N entre a sequência JH e a cauda 5’ não-complementar. Desse modo,

uma vez que o sequenciamento tem início a partir dessa extremidade do amplicon, o

uso dessas 4 variedades de primers reverso permite elevar a diversidade de

nucleotídeos sequenciados a cada ciclo do processo de sequencing by synthesis.

Após a adição de PhiX, as bibliotecas passam então por duas etapas de

desnaturação: química (NaOH) e por calor. Esse processo objetiva converter suas

moléculas de DNA em fita simples, permitindo que elas se hibridizem à flow cell,

plataforma onde o sequenciamento em si é realizado.

Nessa plataforma, os amplicons de IgH são distribuídos de maneira randômica

em sua superfície sólida, onde também são adicionados primers, DNA polimerase e

nucleotídeos marcados com fluorescência, contidos no kit de sequenciamento provido

pela Illumina. Cada amplicon é hibridizado à flow cell pela sua extremidade VH

(adaptador P7) e forma então um cluster de moléculas idênticas entre si através de

uma amplificação denominada bridge PCR. O sequenciamento de cada cluster se

inicia pela extremidade JH do amplicon (adaptador P5) e se dá por um método de

terminação cíclica reversível de quatro cores, denominado sequencing by synthesis.

Nesse sistema, cada ciclo de sequenciamento determina a identidade de um

nucleotídeo para cada cluster (Figura 4). Para NGS DRM, utilizam-se 150 ciclos de

sequenciamento. Resumidamente, o sequenciamento é realizado em três etapas (1)

utilização do primer para sequenciamento a partir de JH, obtendo a sequência JH-

N(D)N-VH (2) lavagem da fita formada e adição do primer para sequenciamento de

um dos indexadores de 8 nucleotídeos e (3) lavagem da fita formada e adição do

primer para sequenciamento do outro indexador de 8 nucleotídeos.

Page 23: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

23

Em seguida, o software Real Time Analyzer do MiSeq demultiplexa dados de

diferentes amostras com base em sua combinação de indexes e monta, através do

cálculo da intensidade de fluorescência e posicionamento dos clusters, as sequências

para os amplicons sequenciados, denominadas reads. Uma vez que o

sequenciamento para NGS DRM dura 150 ciclos, os reads gerados têm até 150 bases

de comprimento. Pelo menos 10.000 reads são gerados por amostra D0 e 500.000

reads por amostra D35. Assim, a profundidade mínima de cobertura para amostras

D0 é de 1 vez e para amostras D35 é de 5 vezes

Cada read corresponde à sequência de um cluster, que por sua vez

corresponde a um amplicon hibridizado à flow cell. (Metzker, 2010; Liu et al., 2012).

Figura 4. Esquema do processo de Next Generation Sequencing na plataforma Illumina MiSeq. (A) Amplicons ligados à flow cell são amplificados por bridge PCR. Sequencias de adaptador P7 representada em azul e P5 em roxo. (B) Clusters gerados pela bridge PCR são sequenciados pelo processo de sequencing by synthesis. Durante cada ciclo de sequenciamento, um nucleotídeo marcado com fluorescência é incorporado ao amplicon, emitindo um sinal de fluorescência correspondente à base utilizada. Um bloqueador 5’ removível (representado em cinza), impede a incorporação de outros nucleotídeos no mesmo ciclo de sequenciamento. Fonte: Westbury, 2018.

Page 24: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

24

Esses reads, por tanto, representam a heterogeneidade da população celular

analisada. Desse modo, é possível identificar a sequência de nucleotídeos associada

a um clonotipo leucêmico na amostra D0 de um paciente e, através dessa sequência,

observar a abundância desse mesmo clonotipo em sua amostra D35. Essa análise

permite, portanto, determinar a frequência do clonotipo leucêmico em relação ao DNA

linfocítico total presente inicialmente na amostra D35 analisada (daqui para frente

referida como frequência do clonotipo leucêmico), como demonstrado por Kotrova et

al. (2015).

5.2. Normalização da Frequência do Clonotipo Leucêmico em DRM

Os primers consenso usados para o sequenciamento de nova geração são

específicos para rearranjos V(D)J de IgH e, portanto, retornam apenas reads

correspondentes a linfoblastos e linfócitos, sejam eles neoplásicos ou saudáveis. No

entanto, a composição linfocitária da medula óssea é de apenas 18,3%, com o

restante da população celular sendo composta por 4,7% monócitos, 69,4%

granulócitos e 6,5% leucócitos imaturos (Brooimans, 2009). Desse modo, o uso

desses primers não traz como resultado a porcentagem de células cancerosas em

relação a todas as células mononucleadas da medula (linfócitos e monócitos), mas

apenas em relação à população total linfocítica. Assim sendo, este projeto propôs

testar a massa de gDNA utilizada no preparo da biblioteca para sequenciamento como

ponto de referência para o número total de células mononucleadas presentes na

amostra analisada.

Com o intuito de normalizar o número de reads associados a um clonotipo

leucêmico, experimentou-se o uso de um controle externo (spike-in control). Esse

normalizador consiste em 21 fragmentos de DNA correspondentes a rearranjos V(D)J

de IgH com sequência conhecida, clonados em plasmídeos. Os controles spike-in são

adicionados em quantidades fixas e diferentes entre si à amostra D35 antes da nested

PCR. Desse modo, eles passam pelas mesmas condições de amplificação e

sequenciamento que o restante do gDNA da amostra na qual se encontram presentes.

Assim sendo, a associação do seu número de cópias inicialmente utilizado ao seu

número de reads gerado, permite a determinação do número de cópias inicial da

Page 25: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

25

molécula de gDNA associada ao clonotipo leucêmico. Esse parâmetro, em conjunto

ao número total de células mononucleadas, obtido conforme descrito no parágrafo

anterior, permite a determinação da DRM da amostra D35 a partir da frequência do

seu clonotipo leucêmico (Figura 5). Esse princípio já foi demonstrado por outros

estudos, como por Faham et al. (2012), Gawad et al. (2012) e Ladetto et al. (2014)

utilizando o método comercial fechado LymphoSIGHT (Sequenta).

Page 26: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

26

Figura 5. Esquema do método de determinação da DRM utilizando o Spike-in Control. O gDNA das células da medula a ser analisado é extraído e quantificado (Ntot). São adicionados, em quantidades determinadas e diferentes entre si, 21 fragmentos de IgH clonados em plasmídeos (spike-in control), denominadas Nr (no exemplo representados apenas três fragmentos). As bibliotecas são preparadas através de dois processos de PCR, sendo então enviadas para sequenciamento. Três tipos de reads são gerados: células saudáveis com rearranjo V(D)J, linfoblastos leucêmicos (Sl) e controle spike-in (Sr). Esses parâmetros são utilizados para determinar o fator Spike-in e a DRM, como exemplificado com os valores hipotéticos acima.

Page 27: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

27

5.3. Vantagens da NGS DRM

A análise de DRM utilizando essa tecnologia de sequenciamento possui o

potencial de superar limitações das técnicas atualmente utilizadas. Esse sistema

evade, por exemplo, a necessidade do uso de primers paciente-específicos, uma vez

que o clonotipo leucêmico poderá ser identificado em meio aos demais reads

sequenciados através da sua sequência de nucleotídeos, determinada a partir da

amostra D0. A identificação dessa sequência nessa amostra diagnóstico é simples,

uma vez que ela se encontra tomada por linfoblastos leucêmicos. Desse modo, o

clonotipo associado a essas células leucêmicas encontra-se extremamente super-

representado nos reads gerados a partir do seu sequenciamento. Esse fator torna a

técnica de NGS DRM mais rápida e menos trabalhosa quando comparada a qPCR

DRM, como apresentado na Tabela 1.

Em relação aos seus custos, a adição de tags indexadores aos primers

utilizados torna possível realizar o exame para diversos pacientes (até 20) em uma

única corrida, reduzindo assim o preço por paciente do método. Em adição, o NGS

possibilita acompanhar sem esforços adicionais a população de subclones leucêmicos

gerados por rearranjos secundários, evitando assim resultados falso-negativos

decorrentes de possível proliferação desses subclones (Gawad et al., 2012). Por fim,

após a sua padronização, o estudo da DRM através desse método pode ser adaptado

para ser utilizado em casos de LLA-T (como por exemplo através do sequenciamento

de rearranjos do TCRB e TCRG), além de em outras variantes de leucemia para as

quais a DRM também possa ser relevante, como em alguns casos de leucemia

mieloide aguda (Rubnitz et al., 2010).

Page 28: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

28

Tabela 1. Comparação entre análise de DRM por qPCR e NGS no MiSeq. Para o

período de tempo descrito, é possível analisar dois pacientes por qPCR e vinte

pacientes por NGS.

Atividade qPCR DRM NGS DRM

Dia Funcionário Dia Funcionário

Separação de células MNC da amostra D0

1 A 1 A

Extração e quantificação de DNA do D0

1 B 1 B

Extração de DNA de controles (para curvas de diluição)

2

PCR rearranjos V(D)J de Ig 3 B

Homo/heteroduplex e reamplificação

3 e 4

Sequenciar rearranjos V(D)J clonais

5 a 12 C

Analisar sequências e desenhar primers paciente-específicos

13 e 14 C

Síntese de primers (serviço de terceiros)

15 a 19 -

Teste de sensibilidade dos primers

20 e 21 C, D

Separação de MNC da amostra D35

22 A, D 2 A

Extração e quantificação de DNA do D35

22 2 B

qPCR (controle e Ig) da amostra D35

23 D

PCR rearranjos VDJ de Ig de D0 e D35

3 e 4 B, C

Quantificação do DNA dos produtos de PCR (amplicon)

5 B, C

Combinar amplicon e carregar no reagent cartridge juntamente com a flow cell e rodar sequenciamento

5 B, C

Análise dos resultados 23 6 C

TOTAL 23 dias 4 6 dias 3

Page 29: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

29

II. OBJETIVOS

Padronizar e validar método de análise de Doença Residual Mínima em Leucemia

Linfoide Aguda B-derivada pediátrica por sequenciamento massivo de rearranjos de

IgH.

Objetivos Específicos

1. Realizar testes de sensibilidade e linearidade de quantificação de rearranjos IgH

por sequenciamento de última geração.

a. Desenhar e testar primers com adaptadores Illumina, próprios para o PCR e

sequenciamento dos rearranjos IgH.

b. Testar e padronizar a DNA polimerase utilizada no preparo das bibliotecas

para sequenciamento.

c. Testar influência da variação do número de ciclos de PCR no preparo de

bibliotecas para sequenciamento.

d. Testar os efeitos da redução da concentração de genomas PhiX adicionados

às bibliotecas.

e. Testar vantagens da normalização do número de reads de clonotipos

leucêmicos através da quantificação da massa de gDNA utilizado no preparo

da biblioteca em conjunto a controles externos (spike-in control).

2. Fazer análise de DRM por sequenciamento NGS em 50 casos retrospectivos de

LLA-B derivada já analisada por qPCR.

3. Comparar resultados de DRM por NGS e qPCR.

4. Comparar custos da quantificação de DRM por NGS e qPCR.

Page 30: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

30

III. MÉTODOS

Essa seção descreve o método final de NGS DRM, utilizado em sua validação,

bem como as amostras utilizadas nesta etapa. Detalhes específicos dos experimentos

anteriores para a padronização desse método estão discriminados em detalhe em

suas seções de resultados. Um resumo esquemático do método descrito a seguir

encontra-se na Figura 6.

Page 31: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

31

Figura 6. Resumo esquemático do método final para determinação de NGS DRM.

Page 32: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

32

1. Clonagem das Sequências Spike-In Control

As sequências de rearranjos V(D)J IgH clonadas para ser utilizadas como

spike-in control, suas respectivas famílias VH e nomenclaturas estão descritas na

Tabela 1S, presente nos anexos.

Vinte e uma amostras de gDNA contendo rearranjos IgH foram selecionadas

para uso como spike-in control. Elas foram quantificadas utilizando o ensaio HS

dsDNA do fluorímetro Qubit (Life Technologies). Suas sequências V(D)J foram

amplificadas para a clonagem conforme o protocolo descrito na Tabela 2. Os produtos

de PCR foram clonados conforme o protocolo para sticky end amplicons do sistema

pJET1.2/blunt Cloning Vector (ThermoFisher Scientific). Uma linhagem de E. coli DH5-

Alfa competente foi utilizada para a clonagem.

Tabela 2. Protocolo de preparo e condições de PCR para amplificação de sequências

V(D)J para clonagem.

A extração e purificação dos plasmídeos foi realizada segundo o protocolo do

kit NucleoSpin Plasmid (No Lid) (MN). A confirmação da clonagem foi realizada por

digestão (Tabela 3) e PCR (Tabela 4).

Page 33: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

33

Tabela 3. Protocolo de preparo e condições de digestão para confirmação de

clonagem.

Tabela 4. Protocolo de preparo e condições de PCR para confirmação da clonagem.

Page 34: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

34

2. Preparo do Pool de Spike-In Control

Os plasmídeos utilizados como spike-in control foram linearizados conforme a

Tabela 5. Os plasmídeos linearizados foram quantificados utilizando o ensaio HS

dsDNA do fluorímetro Qubit (Life Technologies). Um pool contendo todas as 21

sequências spike-in control foi preparado. A nomenclatura dos spike-in control, suas

famílias VH e seus números de cópias por microlitro de pool estão ilustrados na Figura

7.

Tabela 5. Protocolo de preparo e condições de linearização dos plasmídeos spike-in

control.

Figura 7. Composição do pool de spike-in control. Nomenclatura, em negrito, família VH e número de cópias por microlitro de cada sequência spike-in control no pool.

Page 35: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

35

3. Seleção das Amostras para Determinação de NGS DRM

Este estudo inclui amostras de medula óssea de 45 pacientes com Leucemia

Linfoide Aguda B-derivada, analisadas no Centro Infantil Boldrini, Campinas. Para

realizar a análise de NGS DRM de cada paciente, utilizou-se amostras pareadas D0

e D35, totalizando então 90 amostras utilizadas. Amostras seguimento colhidas entre

os dias 36 a 56 foram utilizadas substituindo a amostra D35 quando necessário,

devido a recoletas na ocasião original da determinação da DRM do paciente por

qPCR. Quarenta e um pacientes e seus responsáveis atestaram participação

voluntária no protocolo GBTLI LLA-2009, que inclui estudo da DRM, através de um

Termo de Consentimento Livre e Esclarecido (em anexo). Os 4 pacientes restantes e

seus responsáveis atestaram participação voluntária no protocolo AIEOP-2009, que

inclui um Termo de Consentimento Livre e Esclarecido acerca do armazenamento do

material biológico colhido e o seu eventual uso em projetos de pesquisa (em anexo).

O projeto foi aprovado pelo CEP Boldrini com o número CAAE 57280616.4.0000.5376

(em anexo).

As amostras de pacientes diagnosticados com LLA B-derivada foram

escolhidas de forma consecutiva a partir de um dos primeiros pacientes que a ter sua

DRM analisada por qPCR pelo Laboratório de Biologia Molecular do Centro Infantil

Boldrini (paciente com número de laboratório 1665). Foram excluídos dessa seleção

pacientes (1) que foram diagnosticados com outra neoplasia que não a LLA B-

derivada (2) que não tiveram uma DRM de amostra D35 (ou recoleta dessa) analisada

originalmente por qPCR de um clonotipo IgH; (3) cuja amostra D35 não possuísse

DNA em quantidade suficiente para a realização do método de NGS DRM (600 ng)

(4) cuja amostra D0 não possuísse DNA em quantidade suficiente para a realização

do método de NGS DRM (50 ng).

Page 36: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

36

4. Isolamento das células mononucleadas

As amostras provenientes da medula óssea dos pacientes, que foram colhidas

em EDTA, são diluídas em solução salina, na proporção de 1:1, e em seguida

centrifugadas em um gradiente de Ficoll Hypaque Plus (GE Healthcare). As células

mononucleares obtidas através desse processo foram então aliquotadas em solução

de isotiocianato de guanidina 4M e tiveram o seu DNA extraído, seguindo o protocolo

do illustra blood genomicPrep Mini Spin Kit (GE Healthcare), para a utilização no

estudo de qPCR DRM. Esse mesmo DNA foi utilizado para a análise de NGS DRM.

Page 37: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

37

5. Quantificação da DRM por NGS

As 90 amostras pareadas foram preparadas e sequenciadas em sets de até 20

amostras, sempre separando D0 e D35. As amostras foram quantificadas utilizando o

ensaio HS dsDNA no fluorímetro Qubit (Life Technologies). Vinte amostras

selecionadas foram amplificadas para sequenciamento conforme a Tabela 6. Para a

Amplicon PCR, 50 ng de gDNA foram utilizados como template em amostras D0,

enquanto 600 ng de gDNA foram utilizados para amostras D35. O pool de moléculas

spike-in control é adicionado apenas no preparo de amostras D35. Os

oligonucleotídeos utilizados nessa primeira etapa de PCR estão descritos na Tabela

7.

Tabela 6. Protocolo de preparo de bibliotecas e condições das duas etapas de PCR

para o método de DRM NGS.

Page 38: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

38

Tabela 7. Oligonucleotídeos Biomed2 FR2 acrescidos de caudas 5’ não

complementares, utilizados no preparo das bibliotecas para NGS DRM. Caudas 5’

não-complementares destacadas em verde e em vermelho. Nucleotídeos N inseridos

para elevação artificial da diversidade de amplicons sequenciados destacados em

azul.

VH-FR2

Primer Sequência 5’→ 3’

VH1-FR2 GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGCTGGGTGCGACAGGCCCCTGGACAA

VH2-FR2 GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGTGGATCCGTCAGCCCCCAGGGAAGG

VH3-FR2 GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGGGTCCGCCAGGCTCCAGGGAA

VH4-FR2 GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGTGGATCCGCCAGCCCCCAGGGAAGG

VH5-FR2 GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGGGGTGCGCCAGATGCCCGGGAAAGG

VH6-FR2 GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGTGGATCAGGCAGTCCCCATCGAGAG

VH7-FR2 GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAGTTGGGTGCGACAGGCCCCTGGACAA

JH

Primer Sequência 5’→ 3’

JH-cons R 0N TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGCTTACCTGAGGAGACGGTGACC

JH-cons R 1N TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGNCTTACCTGAGGAGACGGTGACC

JH-cons R 2N TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGNNCTTACCTGAGGAGACGGTGACC

JH-cons R 3N TCGTCGGCAGCGTCAGATGTGTATAAGAGACAGNNNCTTACCTGAGGAGACGGTGACC

As bibliotecas foram purificadas com Agencourt Ampure XP Beads (Beckman

Coulter) conforme a seção PCR Clean-Up 2 do protocolo 16S metagenomic library

preparation (Illumina), utilizando uma proporção de volume beads magnéticas para

volume de biblioteca de 0,7. As bibliotecas foram eluídas em 25 µL de Tris 10 mM pH

8.5.

O aferimento do tamanho dos amplicons alvo em pares de base foi realizado

por eletroforese em gel de agarose 2%. As bibliotecas foram quantificadas utilizando

o ensaio HS dsDNA no fluorímetro Qubit (Life Technologies). A concentração molar

das bibliotecas, em nM, foi determinada através da seguinte fórmula:

concentração em nM = 1000000 x (concentração em ng/µL)

(660 g/mol x tamanho da biblioteca)

Page 39: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

39

As bibliotecas foram diluídas a 4 nM em HT1 Hybridization Buffer (Illumina) e

multiplexadas. Em seguida, 5 µL desse pool de bibliotecas é adicionado a 5 µL de 0.2

N NaOH por 5 minutos para desnaturação. O pool desnaturado foi diluído a 8 pM em

HT1. Adicionou-se 60 µL de PhiX control v3 (Illumina) 8 pM desnaturado a 540 µL do

pool desnaturado de bibliotecas. O pool resultante foi aquecido em banho seco a 96

°C por 2 minutos e em seguida resfriado em gelo por 5 minutos. Os 600 µL desse pool

foram adicionados ao Reagent Cartridge (Illumina) para sequenciamento. O

sequenciamento de amostras D0 foi realizado utilizando o MiSeq Reagent Nano Kit

v2 (300-cycles). Amostras D35 foram sequenciadas utilizando o MiSeq Reagente Kit

v3 (150-cycles). Ambos tipos de amostras foram sequenciados por 150 ciclos single-

read.

Page 40: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

40

IV. FORMA DE ANÁLISE DOS RESULTADOS

Os reads gerados pelo software Real Time Analyzer, do sequenciador MiSeq,

são armazenados em arquivos fastq. Um arquivo desse tipo é gerado para cada

amostra sequenciada. Esses reads possuem cerca de 150 pares de base, gerados

por 150 ciclos de sequenciamento single-read (apenas uma das extremidades da

biblioteca é sequenciada). Essa modalidade de sequenciamento foi utilizada tanto em

função do seu menor custo e tempo de execução, como por ter sido capaz de gerar

reads de alta qualidade com comprimento suficiente para identificar a cicatriz V(D)J

da grande maioria dos clonotipos analisados. A análise da qualidade dos dados

gerados foi realizada nos softwares FastQC e MultiQC.

A análise da frequência dos clonotipos presentes em cada amostra foi feita

utilizando a web application do software Vidjil (http://www.vidjil.org). Esse software foi

escolhido por ter sido capaz de identificar e classificar corretamente a maior parte dos

clonotipos leucêmicos IgH analisados, além de ser o único desse tipo a fornecer uma

versão com interface gráfica (GUI), reduzindo o grau de conhecimento e familiaridade

com linhas de comando necessário para um analista clínico determinar a NGS DRM.

Essa plataforma permite agrupar reads de clonotipos V(D)J IgH baseado na

semelhança das suas sequências, determinando suas frequências frente ao restante

da população de clonotipos (Duez et al., 2016). A partir dessa comparação, é possível

observar quais rearranjos IgH correspondem a linfoblastos B malignos, bem como a

suas presenças percentuais na composição da amostra. Em concordância com outros

trabalhos desenvolvidos na área, foi estipulado que um clonotipo IgH presente em

pelo menos 5% da amostra D0 corresponde a um rearranjo leucêmico (Faham et al.,

2012; Gawad et al., 2012; Ladetto et al., 2014; Pulsipher et al., 2015). Clonotipos com

alto grau de semelhança a uma sequência leucêmica foram agrupados a essa

(somando os números de reads) se as três condições a seguir fossem verdadeiras

concomitantemente: (a) esse clonotipo estava entre os 100 mais frequentes de sua

amostra (b) a diferença para o clonotipo leucêmico foi de até três nucleotídeos nos

segmentos VH, DH ou JH (c) a diferença para o clonotipo leucêmico foi de no máximo

um nucleotídeo na região de inserções aleatórias N. Através da identificação das

Page 41: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

41

sequências leucêmicas a partir da amostra D0, é possível analisar também a

frequência desses clonotipos neoplásicos na amostra D35 do mesmo paciente.

O número de reads gerado por cada molécula spike-in control sequenciada foi

identificado através da sequência V(D)J conhecida associada àquela molécula. Os

dados desses controles foram então utilizados para normalizar os reads de clonotipos

leucêmicos em valores de NGS DRM, conforme previamente ilustrado na Figura 5.

Enfim, os resultados finais obtidos puderam ser comparados aos estudos

retrospectivos por qPCR da mesma amostra.

A análise estatística dos resultados finais de validação do método de NGS DRM

foi realizada utilizando um nível de significância correspondente a p < 0.05. A

comparação entre os dados de qPCR DRM e NGS DRM foi realizada de forma

pareada pelo coeficiente de correlação de Pearson no programa Google Sheets.

Page 42: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

42

V. RESULTADOS

1. Padronização da Amplicon PCR

O processo de padronização do preparo e condições de reação de Amplicon

PCR, que resultou no método anteriormente ilustrado na Tabela 6, encontra-se

descrito a seguir. Uma vez que apenas a Amplicon PCR foi realizada nessa etapa de

padronização, utilizou-se de 25 a 35 ciclos de reação, possibilitando a avaliação de

seus resultados por eletroforese em gel 2%.

1.1. Teste de Enzimas: Phusion vs Tth

As enzimas Phusion High-Fidelity DNA Polymerase (New England Biolabs) e

Tth DNA Polymerase (Sigma Aldrich) foram testadas e comparadas. Como template,

utilizou-se três pontos de uma curva-padrão de gDNA de LLA-B derivada em gDNA

de PBMC saudável (Peripheral Blood Mononucleated Cells), nas proporções 5 x 10-5,

5 x 10-4 e 10-3. Também foi utilizada uma amostra de PBMC pura e uma amostra D0

da mesma leucemia usada para preparar a diluição seriada. Foram utilizados 50 ng

de gDNA para cada amostra amplificada. O resultado obtido por eletroforese em gel

de agarose 2% está representado na Figura 8.

Page 43: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

43

Foram observadas bandas com tamanhos correspondentes aos amplicons de

rearranjos V(D)J de IgH utilizando as duas enzimas testadas. No entanto, ambas as

condições também apresentaram alto índice de formação de primer-dimer e baixa

uniformidade entre as bandas observadas.

Figura 8. Comparação das enzimas Phusion High Fidelity DNA Polymerase e Tth DNA Polymerase. Bandas esperadas de rearranjos V(D)J de IgH destacadas em vermelho (cerca de 300 pares de base). Controle negativo representado por NC. Bandas de cerca de 120 pares de base correspondem a primer-dimer. Bandas de cerca de 60 pares de bases correspondem a resto de primer. Ladder 1 Kb plus (ThermoFisher Scientific).

Page 44: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

44

1.2. Touchdown PCR

Buscando elevar a especificidade da reação para reduzir a formação de primer-

dimer previamente observada, testou-se a elevação da temperatura de anelamento

utilizada em 2 °C, juntamente ao uso de uma touchdown PCR durante os 5 primeiros

ciclos da reação. Como template, utilizou-se três pontos de uma curva-padrão de

gDNA de LLA-B derivada em gDNA de PBMC saudável, nas proporções 5 x 10-5, 5 x

10-4 e 10-3. Também foi utilizada uma amostra de PBMC pura e uma amostra D0 da

mesma leucemia usada para preparar a diluição seriada. Foram utilizados 600 ng de

gDNA para cada amostra amplificada, excetuando D0, para qual utilizou-se 50 ng de

gDNA. O resultado obtido por eletroforese em gel de agarose 2% está representado

na Figura 9.

Page 45: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

45

Apenas o uso de touchdown PCR foi pouco efetivo na redução da formação de

primer-dimers. A PCR utilizando a enzima Phusion High-Fidelity DNA Polymerase

continuou por apresentar baixa uniformidade entre as bandas observadas. A PCR

utilizando a enzima Tth DNA Polymerase apresentou a formação de amplicons não

identificados de cerca de 150 pares de base.

Figura 9. Efeito do uso de Touchdown PCR na comparação entre as enzimas Phusion High Fidelity DNA Polymerase e Tth DNA Polymerase. Bandas esperadas de rearranjos V(D)J de IgH destacadas em vermelho (cerca de 300 pares de base). Controle negativo representado por NC. Bandas de cerca de 120 pares de base correspondem a primer-dimer. Bandas de cerca de 60 pares de bases correspondem a resto de primer. Ladder 1 Kb plus (ThermoFisher Scientific).

Page 46: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

46

1.3. Redução da Concentração de Primers

A concentração do pool de oligonucleotídeos no volume final da PCR foi

reduzida de 200 nM para 100 nM para tentar, em conjunto a touchdown PCR

previamente descrita, reduzir a formação de primer-dimer. Como template, utilizou-se

três pontos de uma curva-padrão de gDNA de LLA-B derivada em gDNA de PBMC

saudável, nas proporções 5 x 10-5, 5 x 10-4 e 10-3. Também foi utilizada uma amostra

de PBMC pura e uma amostra D0 da mesma leucemia usada para preparar a diluição

seriada. Foram utilizados 600 ng de gDNA para cada amostra amplificada, excetuando

D0, para qual utilizou-se 50 ng de gDNA. O resultado obtido por eletroforese em gel

de agarose 2% está representado na Figura 10.

Page 47: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

47

A redução da concentração de primers na Amplicon PCR com Phusion High-

Fidelity DNA Polymerase diminuiu fortemente a formação de primer-dimer. Observou-

se também a formação de amplicons não identificados com cerca de 550 pares de

base. Esse DNA, no entanto, não compromete a determinação da NGS DRM, uma

vez que o seu tamanho é consideravelmente maior que o do amplicon alvo da técnica.

Desse modo, as sequências de rearranjos V(D)J IgH se ligam a flow cell em taxas

muito maiores que esse amplicon maior. O mesmo efeito positivo não foi observado

Figura 10. Efeito da redução da concentração de primers na comparação entre as enzimas Phusion High Fidelity DNA Polymerase e Tth DNA Polymerase. Bandas esperadas de rearranjos V(D)J de IgH destacadas em vermelho (cerca de 300 pares de base). Controle negativo representado por NC. Bandas de cerca de 120 pares de base correspondem a primer-dimer. Bandas de cerca de 60 pares de bases correspondem a resto de primer. Ladder 1 Kb plus (ThermoFisher Scientific).

Page 48: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

48

na Amplicon PCR com Tth DNA Polymerase, na qual a formação de primer-dimer

ainda foi bastante pronunciada.

1.4. Teste da Enzima GoTaq G2 Hot Start DNA Polymerase

Considerando a natureza do método de NGS DRM, de possível integração à

rotina clínica de centros de diagnóstico de biologia molecular, buscamos substituir a

enzima Phusion High-Fidelity DNA Polymerase pela GoTaq G2 Hot Start DNA

Polymerase (Promega), uma alternativa cerca de cinco vezes mais barata e com maior

disponibilidade a pronta entrega. A Amplicon PCR com essa enzima foi testada

mantendo os parâmetros anteriormente determinados (redução de concentração de

primers e uso de touchdown PCR).

Como template, utilizou-se um ponto de uma curva-padrão de gDNA de LLA-B

derivada em gDNA de PBMC saudável, na proporção 10-2. Foram utilizados 600 ng

de gDNA. O resultado obtido por eletroforese em gel de agarose 2% está representado

na Figura 11.

Page 49: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

49

O amplicon de rearranjo V(D)J de IgH foi observado através de uma banda

nítida correspondente a cerca de 300 pares de base, enquanto a taxa de formação de

primer-dimer foi baixa, representada através de uma banda quase inexistente

correspondente a cerca de 120 pares de base. Por fim, a banda não identificada de

cerca de 550 pares de base continua presente, mas em níveis menores que os

observados utilizando as enzimas Phusion High-Fidelity DNA Polymerase e Tth DNA

Polymerase. Desse modo, padronizou-se o preparo de bibliotecas para DRM NGS

com a enzima GoTaq G2 Hot Start DNA Polymerase.

Figura 11. Teste da Amplicon PCR utilizando a enzima GoTaq G2 Hot Start DNA Polymerase. Banda esperada de rearranjos V(D)J de IgH destacada em vermelho (cerca de 300 pares de base). Controle negativo representado por NC. Ladder 1 Kb plus (ThermoFisher Scientific).

Page 50: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

50

2. Número de Ciclos de PCR

Esse ensaio foi realizado utilizando a enzima Phusion High-Fidelity DNA

Polymerase, uma vez que ela ainda não havia sido substituída pela GoTaq G2 Hot

Start DNA Polymerase.

Os valores 17, 20, 23 e 25 foram testados como o número de ciclos a ser

utilizado na primeira PCR do preparo das bibliotecas para sequenciamento, com o

intuito de reduzir um possível viés de amplificação ocasionado pela reação multiplex.

A segunda PCR foi realizada de modo a completar 40 ciclos totais para as duas

reações. O ensaio utilizou como template, para cada condição testada, dois pontos de

uma curva-padrão de gDNA de LLA-B derivada em gDNA de PBMC saudável nas

proporções 10-4, 10-3, além de uma amostra D0 da mesma leucemia usada para

preparar a diluição seriada. Foram utilizados 600 ng de gDNA para cada amostra

amplificada, excetuando D0, para qual se utilizou 50 ng de gDNA. A qualidade dos

dados gerados pelo sequenciamento foi analisada utilizando os softwares FastQC e

MultiQC (Figura 12) enquanto a análise dos dados em si utilizou o software Vidjil

(Figura 13).

P

hre

d S

co

re

Position (bp)

Figura 12. Controle de qualidade no software MultiQC do sequenciamento do ensaio para análise do número de ciclos de PCR. Cada linha representa o Phred score médio por base dos reads de uma das amostras sequenciadas. Scores acima de 30 (Q30), representados na porção verde do gráfico, são considerados como apresentando boa qualidade.

Page 51: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

51

As porcentagens equivalentes à frequência do clonotipo leucêmico de cada

amostra sequenciada estão representadas nas Tabela 8 abaixo.

Tabela 8. Resumo da frequência do clonotipo leucêmico por amostra. A amostra D0

amplificada na primeira PCR por 17 ciclos apresentou problemas no seu preparo de

biblioteca, impedindo o prosseguimento da sua análise.

Número de Ciclos / Curva-Padrão

10-4 10-3 D0

17 0.036% 0.176% -

20 0.078% 0.230% 86.20%

23 0.012% 0.265% 83.13%

25 0.024% 0.217% 74.63%

Através da análise dos dados gerados, determinou-se 25 ciclos de reação na

primeira etapa do preparo das bibliotecas para sequenciamento como o valor ideal,

uma vez que a diferença esperada de dez vezes da frequência do clonotipo leucêmico

entre os pontos 10-4 e 10-3 da diluição foi observada apenas nas amostras preparadas

dessa maneira. No mais, através da análise do controle de qualidade dos dados

gerados, é possível observar que amostras preparadas com números maiores de

ciclos de PCR tendem a apresentar maiores Phred scores. Os valores abaixo de Q30

Figura 13. Análise do sequenciamento no software Vidjil para análise do número de ciclos de PCR. Cada linha no gráfico representa a frequência de um clonotipo V(D)J ao longo das amostras da curva-padrão. O clonotipo correspondente à célula leucêmica está representado em vermelho. A análise exemplificada acima correspondente às amostras preparadas com 25 ciclos de PCR, com um gráfico similar havendo sido gerado para cada condição testada (17, 20 e 23 ciclos).

Page 52: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

52

observados para algumas amostras estiveram majoritariamente associados às

amostras preparadas utilizando 17 ciclos de PCR na primeira etapa e às amostras D0,

possivelmente pelo uso de menores quantidades de DNA em relação à curva-padrão.

Page 53: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

53

3. Teste de Concentração de PhiX

Esse ensaio foi realizado utilizando a enzima Phusion High-Fidelity DNA

Polymerase, uma vez que ela ainda não havia sido substituída pela GoTaq G2 Hot

Start DNA Polymerase.

A concentração mínima de PhiX usualmente recomendada pela Illumina para

NGS de amplicons é de 20% da quantidade total de moléculas no pool da biblioteca

sequenciada. Isso corresponde a 20% de seu volume quando o pool de PhiX utilizado

tem a mesma concentração molar do pool de bibliotecas em questão. No entanto, em

função da elevação artificial da diversidade de amplicons causada pelos nucleotídeos

N adicionados às variantes do primer Biomed2 JH consenso utilizadas na Amplicon

PCR, a concentração mínima de PhiX acionada ao pool de bibliotecas pode ser

reduzida.

Foram testadas então diferentes concentrações de PhiX para o

sequenciamento de bibliotecas para NGS DRM. Para isso, utilizou-se como template

um ponto de uma curva-padrão de gDNA de LLA-B derivada em gDNA de PBMC

saudável, na proporção 10-3. Essa amostra foi sequenciada 3 vezes, em corridas de

sequenciamento distinta. Foram utilizados 600 ng de gDNA da amostra no preparo de

sua biblioteca. A cada corrida realizada, diferentes volumes de PhiX 8pM foram

adicionados ao pool de bibliotecas 8pM para sequenciamento. Os valores testados

foram: 10% do volume do pool de bibliotecas (60 µL de PhiX e 540 µL de pool), 7,5%

(45 µL de PhiX e 555 µL de pool) e 5% (30 µL de PhiX e 570 µL de pool).

As amostras contendo 10% e 7,5% de PhiX não apresentaram problemas em

suas corridas, com altas taxas de clusters aprovados pelo filtro de qualidade do

aparelho (%PF) e boas médias de nucleotídeos sequenciados que atingiram níveis de

qualidade Q30 (Avg %Q30). Já a amostra contendo 5% de PhiX teve a sua corrida

interrompida em função da baixa qualidade de clusters observada (Figura 14). A

frequência do clonotipo leucêmico observada para ambas as amostras de fato

sequenciadas foi bastante semelhante, sendo de 0,803% para a amostra contendo

10% de PhiX e de 0,809% para 7,5% de PhiX. Ambas as condições, portanto,

mostraram-se apropriadas para o método de DRM NGS. No entanto, padronizou-se

10% de PhiX como o volume padrão adicionado ao pool de bibliotecas, mantendo-se

Page 54: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

54

esse fator mais distante do seu threshold de falha, reduzindo a chance de ocorrerem

erros no sequenciamento ligados a baixa diversidade de amplicons.

Figura 14. Resumo dos parâmetros de qualidade para corridas com diferentes

concentrações de PhiX. Taxa de clusters aprovados pelo filtro de qualidade do MiSeq representada por %PF. Média de nucleotídeos sequenciados que atingiram níveis de qualidade Q30 representada por Avg %Q30.

Page 55: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

55

4. Spike-in Control

Os ensaios para testar o uso de moléculas spike-in control utilizaram apenas 9

das 21 sequências de rearranjo V(D)J de IgH clonadas descritas na Tabela 1S. As

sequências spike-in control utilizadas, o seu número de cópias adicionado às

amostras sequenciadas, bem como suas famílias VH, estão representadas na Figura

15.

4.1. Teste do uso de Spike-In Controls para Determinar NGS DRM

O ensaio foi realizado utilizando três pontos de uma curva-padrão de gDNA de

LLA-B derivada em gDNA de PBMC saudável, nas proporções 5 x 10-5, 5 x 10-4 e 5 x

10-3. O rearranjo V(D)J de IgH da LLA-B derivada utilizada possuía seu segmento VH

pertencente à família 6. Foram utilizados 600 ng de gDNA para cada amostra

amplificada. A qualidade dos dados gerados pelo sequenciamento foi analisada

utilizando os softwares FastQC e MultiQC (Figura 16) enquanto a análise dos dados

em si utilizou o software Vidjil (Figura 17).

Figura 15. Número de cópias de cada spike-in control adicionado às amostras para determinação de NGS DRM. Nome, família VH e número de cópias de cada spike-in control utilizado. O rearranjos V(D)J de IgH dos controles apresentavam segmentos VH das famílias 1 (vermelho), 2 (azul) ou 3 (verde). Escala considerando 100 (100%) como 200.000 genomas (100.000 células), ou 600 ng de DNA.

Page 56: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

56

P

hre

d S

co

re

Position (bp)

Figura 16 Controle de qualidade no software MultiQC do sequenciamento do ensaio para análise do spike-in control. Cada linha representa o Phred score médio por par de base dos reads de uma das amostras sequenciadas. Scores acima de Q30 (porção verde do gráfico) são considerados como apresentando boa qualidade.

Figura 17. Análise do sequenciamento no software Vidjil para determinação de NGS DRM. Cada linha no gráfico representa a frequência de um clonotipo V(D)J ao longo das amostras da curva-padrão. O clonotipo correspondente à célula leucêmica está representado em vermelho. Os clonotipos provenientes de um spike-in control contendo um rearranjo VH1 estão representados em azul, contendo VH2 em rosa e contendo VH3 em verde. As porcentagens representadas na legenda correspondem ao ponto 5 x 10-3 da curva-padrão sequenciada.

Page 57: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

57

Tanto o clonotipo correspondente ao linfoblasto leucêmico, quanto os

clonotipos correspondentes a sete dos nove spike-in control adicionados, foram

identificados utilizando a web application do software Vidjil. No entanto, dois clonotipos

de spike-in control (2047 e 2227, das famílias VH2 e VH3 respectivamente) não foram

observados nessa versão do software. No entanto, através da execução desse

programa em sua versão CLI, foi possível identificar esses dois clonotipos restantes

através da modificação dos parâmetros de número máximo de clones computados

contendo uma sequência consenso (de 100 para 1000) e de número máximo de

clones a serem analisados com uma designação V(D)J completa (de 100 para 1000).

O comando utilizado para a execução do algoritmo encontra-se a seguir:

<path_to_vidjil> -c clones -g <path_to_germline> -2 -3 -y 1000 -z 1000 -l

<file_containing_the_sequences_of_interest> -F <fastq_file>

Os valores de NGS DRM para as três amostras sequenciadas foram

determinados através do uso das nove sequências de spike-in control, conforme o

método explanado previamente na Figura 5. Para análises de regressão linear,

valores de DRM são convertidos para uma escala logarítmica em base 10, em função

da vasta gama de valores que os números absolutos de DRM abrangem. Um resumo

desses valores de NGS DRM obtidos estão representados na Figura 18.

Page 58: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

58

Através da análise dos dados de NGS DRM obtidos, é possível observar que

todos os valores corrigidos através do uso do spike-in control se encontram bastante

elevados, apresentando erros de fold change mais de uma ordem de grandeza acima

do esperado. Esse resultado evidencia uma possível subamplificação dos spike-in

control em relação ao restante do DNA presente na biblioteca para sequenciamento.

4.2. Teste do uso de Spike-In Controls linearizados para Determinar NGS DRM

Partindo da subamplificação observada das moléculas spike-in control durante

o preparo das bibliotecas para sequenciamento, hipotetizou-se que a estrutura

supercoiled dos plasmídeos no qual esses controles se encontram poderia estar

prejudicando a ocorrência da PCR em condições ótimas nessas moléculas. Assim

sendo, realizou-se um experimento comparando a NGS DRM de amostras contendo

supercoiled spike-in controls a amostras contendo spike-in controls linearizados.

Figura 18. Comparação da NGS DRM determinada através do uso de diferentes conjuntos de spike-in control. Representação dos valores de -log10 de NGS DRM para as três amostras sequenciadas (5 x 10-5, 5 x 10-4 e 5 x 10-3) calculados através do uso do spike-in control utilizados (azul). Os valores esperados de DRM para as amostras estão representados em vermelho. Valores de DRM em unidade arbitrária.

Page 59: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

59

O ensaio foi realizado utilizando, para ambas as condições testadas, três

pontos de uma curva-padrão de gDNA de LLA-B derivada em gDNA de PBMC

saudável, nas proporções 5 x 10-5, 5 x 10-4 e 5 x 10-3. O rearranjo V(D)J da LLA-B

derivada utilizada possuía seu segmento VH pertencente a família 6. Foram utilizados

600 ng de gDNA para cada amostra amplificada. A qualidade dos dados gerados pelo

sequenciamento foi analisada utilizando os softwares FastQC e MultiQC (Figura 19)

enquanto a análise dos dados em si utilizou o software Vidjil (Figura 20).

P

hre

d S

co

re

Position (bp)

Figura 19. Controle de qualidade no software MultiQC do sequenciamento do ensaio para comparação do supercoiled spike-in control ao spike-in control linear. Cada linha representa o Phred score médio por par de base dos reads de uma das amostras sequenciadas. Scores acima de Q30 (porção verde do gráfico) são considerados como apresentando uma boa qualidade.

Page 60: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

60

A NGS DRM para todas as seis amostras sequenciadas foi determinada,

novamente utilizando o método descrito anteriormente. Desse modo, comparou-se os

valores de NGS DRM obtidos através da normalização por spike-in controls

linearizados ou por supercoiled spike-in controls aos valores de DRM esperados para

essas amostras (Figura 21).

Figura 20. Análise do sequenciamento no software Vidjil para comparação de valores de NGS DRM determinados por supercoiled spike-in control ou por spike-in control linear. Cada linha no gráfico representa a frequência de um clonotipo V(D)J ao longo das amostras da curva-padrão. O clonotipo correspondente à célula leucêmica está representado em vermelho. Os clonotipos provenientes de um spike-in control contendo um rearranjo VH1 estão representados em azul, contendo VH2 em rosa e contendo VH3 em verde. O gráfico apresentado corresponde às amostras contendo o spike-in control linearizado, com um gráfico semelhante havendo sido gerado para as amostras contendo o controle supercoiled. As porcentagens representadas na legenda correspondem ao ponto 5 x 10-3 da curva-padrão contendo spike-in controls linearizados.

Page 61: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

61

Através dessa análise, é possível observar que a linearização dos plasmídeos

contendo os spike-in control evitou a sua subamplificação, permitindo a determinação

de valores de NGS DRM muito mais próximos ao esperado, quando comparado aos

plasmídeos não-linearizados. Desse modo, padronizou-se o uso de moléculas spike-

in controls linearizadas no método de NGS DRM. Todos os experimentos descritos a

partir desse teste foram realizados com plasmídeos spike-in control linearizados.

4.3. Teste de Amplificação Diferencial de Moléculas Spike-In Control

Rearranjos V(D)J de IgH com famílias VH distintas são amplificadas por

diferentes forward primers na etapa de Amplicon PCR do método de NGS DRM.

Desse modo, foi testado se a determinação da NGS DRM é afetada ao se utilizar

nesse cálculo todos os spike-in controls adicionados à amostra (General NGS MRD),

ou apenas as moléculas com famílias VH1 (VH1 NGS MRD), VH2 (VH2 NGS MRD)

Figura 21. Comparação da NGS DRM determinada através do uso de spike-in control linearizado ou supercoiled. Representação dos valores de -log10 NGS DRM para as amostras sequenciadas, que receberam supercoiled spike-in control (em azul) ou spike-in control linearizado (em verde). A DRM esperada para as amostras está representada em vermelho. Valores de DRM em unidade arbitrária.

Page 62: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

62

ou VH3 (VH3 NGS MRD) (Figura 22). Essa análise foi realizada a partir dos dados

obtidos para as amostras contendo controles linearizados do experimento descrito na

seção anterior.

Observou-se que valores de NGS DRM normalizados a partir de sequências

contendo segmentos VH3 tendem a serem mais altos do que os normalizados

utilizando sequências de família VH1 ou VH2. Isso indica um possível efeito de

amplificação diferencial entre os controles contendo segmentos VH de diferentes

famílias. Esse efeito pode se estender às sequências de rearranjo V(D)J da amostra

na qual se determina a NGS DRM. Desse modo, notou-se a necessidade de um

estudo mais profundo sobre melhor forma de utilização dos spike-in controls para a

normalização dos reads obtidos durante o sequenciamento em dados de NGS DRM.

Portanto, para a etapa de validação do método de NGS DRM, comparamos os valores

Figura 22. Comparação da NGS DRM determinada através do uso de diferentes conjuntos de spike-in control linearizado. Representação dos valores de -log10 NGS DRM das amostras sequenciadas, calculados através do uso de todos os spike-in control utilizados (General NGS MRD, em marrom), ou utilizando apenas os controles contendo sequências com família VH1 (VH1 NGS MRD, em azul), VH2 (VH2 NGS MRD, em rosa) ou VH3 (VH3 NGS MRD, em verde). A DRM esperada para as amostras está representada em vermelho. Valores de DRM em unidade arbitrária.

Page 63: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

63

de NGS DRM obtidos ao normalizar os reads dos clonotipos leucêmicos das amostras

por todos os spike-in controls nela adicionados ou apenas pelos spike-in controls com

segmento VH de mesma família que a de cada clonotipo leucêmico de cada amostra.

Page 64: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

64

5. Validação do Método de NGS DRM

5.1. Desenho Experimental

A metodologia completa para essa etapa de validação está descrita nas seções

anteriores “Métodos” e “Forma de Análise dos Resultados”.

A etapa de validação do método de NGS DRM utilizou todas as 21 moléculas

de spike-in control clonadas, na forma do pool descrito na Figura 6. O número de

cópias de cada molécula controle adicionada às amostras foi alterado em relação à

seção anterior. Essa alteração visa permitir a adição de mais tipos de spike-in control

a cada amostra, sem elevar a quantidade total de moléculas controle utilizadas. O

número de moléculas de cada spike-in control adicionado às amostras, bem como os

seus nomes e famílias, estão representados na Figura 23.

Foram sequenciadas 90 amostras pareadas D0 e D35 de 45 pacientes com

Leucemia Linfoide Aguda B-derivada. No total, 58 clonotipos IgH leucêmicos haviam

sido analisados por qPCR para essas amostras, uma vez que alguns pacientes podem

apresentar mais de um marcador IgH associado a linfoblastos leucêmicos. Três

desses clonotipos IgH leucêmicos analisados por qPCR não foram identificados pelo

método de NGS DRM, sendo excluídos das análises. Desse modo, 55 clonotipos

leucêmicos foram analisados por NGS DRM.

Figura 23. Número de cópias de cada spike-in control adicionado às amostras para sequenciamento. Nomenclatura, família e número de cópias de cada spike-in control utilizado. Escala considerando 100 (100%) como 200.000 genomas (100.000 células), ou 600 ng de DNA.

Page 65: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

65

Dois valores de NGS DRM foram estimados para cada um dos 55 clonotipos

analisados: um normalizando as frequências dos clonotipos leucêmicos através do

uso de todas as 21 sequências spike-in control e um utilizando apenas as três

sequências spike-in control específicas à família VH de cada clonotipo leucêmico.

Esses valores foram denominados, respectivamente, NGS DRM Geral e NGS DRM

Família. Desse modo, totalizou-se 110 valores de NGS DRM calculados, consistindo

em 55 NGS DRM Geral e 55 NGS DRM Família. Esses resultados foram então

comparados à qPCR DRM e entre si.

5.2. Análise da Qualidade dos Dados do Sequenciamento

A qualidade dos dados gerados pelo sequenciamento foi analisada utilizando

os softwares FastQC e MultiQC (Figura 24) enquanto a análise dos dados em si

utilizou o software Vidjil.

Figura 24. Controle de qualidade no software MultiQC do sequenciamento do ensaio de validação do método de DRM por NGS. Cada linha representa o Phred score médio por par de base dos reads de uma das amostras sequenciadas. Scores acima de Q30 (porção verde do gráfico) são considerados como apresentando boa qualidade.

Page 66: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

66

5.3. Comparação do Número de Clonotipos Leucêmicos Identificados por NGS DRM

e qPCR DRM

Como anteriormente mencionado, 58 clonotipos leucêmicos haviam sido

analisados por qPCR DRM para os 45 pacientes selecionados para essa validação de

método. Pacientes que possuíam 2 sequências de rearranjo V(D)J de IgH exploradas

por esse método requereram a síntese de 2 primers paciente-específicos. Desses 58

clonotipos, a NGS DRM foi capaz de identificar e acompanhar 55.

Já a NGS DRM foi capaz de identificar 87 clonotipos leucêmicos para esses 45

pacientes, sem requerer nenhum esforço adicional para acompanhá-los.

5.4. Comparação entre qPCR DRM e NGS DRM

Inicialmente, foram definidos quais critérios seriam utilizados para avaliar o

resultado de NGS DRM em comparação ao qPCR DRM, não de um ponto de vista

matemático, mas considerando a sua relevância clínica. Consideraram-se

satisfatórios resultados de NGS DRM com fold change menor que 5 em relação a

qPCR DRM. Uma vez que o ponto de corte para o ajuste de terapia no GBTLI LLA

2009 é de 1 x 10-3, resultados de NGS DRM com diferença absoluta igual ou menor a

1 x 10-4 em relação à qPCR DRM também foram considerados satisfatórios,

independentemente do valor do fold change. O resumo dos valores de NGS DRM

obtidos, bem como o resultado dessa categorização encontram-se na Tabela 9.

Page 67: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

67

Tabela 9. Resumo dos valores de qPCR DRM, NGS DRM Geral e NGS DRM Família

para os 55 clonotipos leucêmicos analisados. Valores de NGS DRM em verde indicam

resultados considerados satisfatórios pelo critério adotado (Diferença Absoluta ≤ 1 x

10-4 ou Fold Change ≤ 5). Valores em vermelho indicam resultados considerados

insatisfatórios por esse mesmo critério (Diferença Absoluta > 1 x 10-4 e Fold Change

> 5). As demarcações entre as linhas agrupam amostras D35 sequenciadas em uma

mesma Flow Cell.

Page 68: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

68

Page 69: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

69

Tendo como base essa análise, a determinação das NGS DRM Geral para

cada clonotipo leucêmico observado resultou em 51 dos 55 (92,7%) resultados para

esses marcadores serem considerados satisfatórios. Já a determinação das NGS

DRM Família de cada clonotipo leucêmico resultou em 50 de 55 (90,9%) valores

satisfatórios.

O índice de correlação entre as de qPCR DRM e NGS DRM foi determinado

através do coeficiente de Pearson. Clonotipos leucêmicos que possuem alguma das

suas DRM (esperada, geral ou família) com valor 0 e cujos demais valores de DRM

também são 0 ou são menores que 1 x 10-4 foram excluídos dessa análise, uma vez

que se tratam de grandezas muitos pequenas e próximas que, no entanto, introduzem

erros à avaliação, uma vez que valores decimais pequenos se tornam mais distantes

de 0 quando convertidos a escala logarítmica. A representação visual da correlação

obtida através de regressão linear entre os valores de qPCR DRM e NGS DRM e,

bem como o seu coeficiente de correlação de Pearson, estão representados na Figura

25.

Um clonotipo leucêmico incluído na análise da NGS DRM Geral não pode ser

incluída na análise de NGS DRM Família, uma vez que a sua DRM calculada por esse

método teve um valor menor que 0. Valores negativos não podem ser convertidos a

uma escala log10, além de não possuírem significado biológico.

Page 70: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

70

Figura 25. Regressão linear e coeficiente de correlação de Pearson entre qPCR DRM e NGS DRM Geral e entre qPCR DRM e NGS DRM Família. Regressão linear e coeficiente de correlação de Pearson (R) determinado através da conversão dos valores de DRM para uma escala -log10. Valores de DRM representados em unidade arbitrária. Valores de R acima de 0,7 indicam correlação forte entre ambas as variáveis (qPCR DRM e NGS DRM). Ambas correlações são estatisticamente significativas tendo p < 0.05.

Page 71: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

71

5.5. Determinação de Subamplificação de Sequências Spike-In Control

As 50 amostras D35 analisadas por NGS descritas nessa dissertação podem

ser divididas em três subsets em relação ao preparo de suas bibliotecas, uma vez que

o seu sequenciamento se deu em três levas, conforme previamente evidenciado na

Tabela 9. Com base nessa divisão, é possível observar que o índice de valores de

NGS DRM determinados insatisfatórios encontra-se mais elevado no terceiro subset

de sequenciamento em relação aos dois primeiros, tanto levando-se em consideração

a NGS DRM Geral (14,3% contra 4,5% e 5,2%) e a NGS DRM Família (14,3% contra

4,5% e 10,5%). É também possível observar que esse terceiro subset apresenta uma

média de fold change entre a NGS DRM e qPCR DRM bastante elevada em relação

aos outros dois subsets, conforme ilustrado na Figura 26.

Uma possível explicação para esse fenômeno consiste em uma produção de

reads associados a spike-in controls menor que a esperada no sequenciamento. Para

avaliar essa hipótese, calculou-se, para cada amostra, a razão do total de reads

analisado pelo total de reads correspondente a moléculas spike-in control,

Figura 26. Comparação da fold change média entre subsets de amostras. Subsets definidos como amostras cujas bibliotecas foram preparadas juntas e sequenciadas em uma mesma flow cell. Barras azuis representam médias de fold changes correspondentes a NGS DRM Geral. Barras vermelhas representam médias de fold changes correspondentes a NGS DRM Família. Fold change representada em unidade arbitrária.

Page 72: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

72

denominado coeficiente de amplificação spike-in. Desse modo, maiores valores desse

coeficiente para uma amostra indicam uma menor frequência relativa de reads

associados a sequências spike-in control. Assim sendo, a média e a mediana do

coeficiente de amplificação spike-in para o terceiro subset e para as demais amostras

foi determinado, como ilustrado na Figura 27.

Observou-se diferença entre o coeficiente de amplificação spike-in médio do

terceiro subset em relação às demais amostras. O mesmo efeito foi verificado para a

mediana desse coeficiente. Essa diferença confirma a menor frequência relativa de

reads relacionados a moléculas spike-in control nesse subset. Hipotetiza-se que esse

processo possa decorrer tanto de uma subamplificação das sequências spike-in

control adicionadas às amostras D35, em função de algum grau de degradação do

pool dessas moléculas, como também de erros na adição desse pool a essas

amostras.

No entanto, é importante notar, independente da fonte de erro, que o

coeficiente de amplificação spike-in permite identificar casos de NGS DRM com taxas

de reads de spike-in controls alteradas. Desse modo, através de futuras comparações

entre NGS DRM e qPCR DRM, será possível confirmar se corridas de

Figura 27. Comparação entre a média e mediana dos coeficientes de amplificação spike-in do terceiro subset e as demais amostras sequenciadas. Coeficiente de amplificação spike-in médio representado em azul. Mediana do coeficiente de amplificação spike-in representada em vermelho. Coeficiente de amplificação spike-in representado em unidade arbitrária.

Page 73: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

73

sequenciamento com essas taxas alteradas estão de fato associadas a maiores níveis

de erro de fold change em relação às DRM esperadas. Caso essa correlação se

confirme, esse coeficiente de amplificação spike-in pode ser estabelecido como um

identificador de corridas de sequenciamento com possíveis erros em relação ao total

de amplicons spike-in control sequenciados.

5.6. Comparação entre qPCR DRM e NGS DRM Excluindo o Terceiro Subset

Em função do erro identificado no sequenciamento do terceiro subset de

amostras sequenciadas em uma mesma flow cell, análises e comparações realizadas

anteriormente entre os valores de qPCR DRM e NGS DRM das amostras

sequenciadas para validação do método foram realizadas novamente, à exclusão

desse terceiro subset.

Nesse contexto, 39 dos 41 (95,1%) valores de NGS DRM Geral determinados

para os clonotipos leucêmicos analisados foram considerados satisfatórios pelo

critério previamente determinado. Já para os valores de NGS DRM Família para esses

mesmos clonotipos, a taxa de amostras satisfatórias correspondeu a 38 de 41

(92,7%). O cálculo do coeficiente de correlação de Pearson para esse conjunto de

resultados de NGS DRM Geral e NGS DRM Família seguiu os mesmos critérios de

exclusão de clonotipos e conversão logarítmica utilizados anteriormente. A correlação

por regressão linear bem como o coeficiente de correlação de Pearson entre os

valores de qPCR DRM e NGS DRM estão representados na Figura 28.

Page 74: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

74

Figura 28. Regressão linear e coeficiente de correlação de Pearson entre qPCR DRM e NGS DRM Geral e entre qPCR DRM e NGS DRM Família, à exclusão do terceiro subset de amostras sequenciadas em uma mesma Flow Cell. Regressão linear e coeficiente de correlação de Pearson (R) determinado através da conversão dos valores de DRM para uma escala -log10. Valores de DRM representados em unidade arbitrária. Valores de R acima de 0,7 indicam correlação forte entre ambas as variáveis (qPCR DRM e NGS DRM). Ambas correlações são estatisticamente significativas tendo p < 0.05.

Page 75: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

75

5.7. Comparação entre qPCR DRM e Frequência dos Clonotipos Leucêmicos

Para efeito de comparação à NGS DRM, foi determinada a correlação entre a

frequência dos clonotipos leucêmicos e os resultados esperados de qPCR DRM. A

frequência de um clonotipo leucêmico pode ser determinada através da fórmula a

seguir:

frequência = reads clonotipo leucêmico/(total de reads - reads spike-in)

Uma vez que a frequência de um clonotipo leucêmico não consiste em uma

DRM, não é possível avaliar a relevância clínica desses resultados em relação a qPCR

DRM. Desse modo, apenas o grau de correlação entre essas variáveis foi

determinado, através do coeficiente de correlação de Pearson. Fez-se o uso do

mesmo critério de exclusão de clonotipos previamente utilizado na determinação do

índice de correlação entre NGS DRM e qPCR DRM. A análise foi realizada tanto

considerando o conjunto total de clonotipos não excluídos por esse critério, bem como

realizando também a exclusão dos clonotipos referentes ao terceiro subset de

amostras sequenciadas (Figura 29).

Page 76: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

76

Figura 29. Regressão linear e coeficiente de correlação de Pearson entre qPCR DRM e frequência dos clonotipos leucêmicos. Análise realizada considerando (acima) e excluindo (abaixo) o terceiro subset de amostras. Regressão linear e coeficiente de correlação de Pearson (R) determinado através da conversão dos valores de DRM para uma escala -log10. Valores de DRM e Frequência de Clonotipo representados em unidade arbitrária. Valores de R acima de 0,7 indicam correlação forte entre ambas as variáveis (qPCR DRM e NGS DRM). Ambas correlações são estatisticamente significativas tendo p < 0.05.

Page 77: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

77

Foi possível observar um grau de correlação entre a frequência dos clonotipos

leucêmicos e as suas qPCR DRM. No entanto, esse grau de correlação foi inferior aos

índices obtidos através da normalização das frequências pelo sistema de spike-in

control. Além do mais, a não correção da frequência dos clonotipos leucêmicos em

valores de DRM resultou em fold changes entre uma e duas ordens de grandeza

maiores que a qPCR DRM. Esse fator dificulta a correlação dessas frequências a

prognósticos clínicos dentro dos parâmetros já estabelecidos e padronizados para

DRM.

Page 78: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

78

6. Comparação de Custo entre qPCR DRM e NGS DRM

Os custos dos métodos para a quantificação de DRM por qPCR e NGS foram

comparados (Tabela 10). Nessa análise, determinou-se o custo por paciente da

determinação da DRM por análise de marcadores IgH. Para a determinação de DRM

por qPCR, é aconselhável o acompanhamento de pelo menos menos dois marcadores

moleculares por paciente. Desse modo, considerou-se o custo do acompanhamento

de dois marcadores IgH por paciente. Já para a quantificação de DRM por NGS, levou-

se em consideração o custo por paciente da corrida de duas flow cells (uma para a

análise de amostras D0 e uma para D35) contendo amostras de 20 pacientes cada.

Os preços dos reagentes consumíveis utilizados nessa análise financeira foram

embasados em cotações obtidas durante o ano de 2018. Os valores de mão de obra

considerados foram baseados no valor de uma bolsa de Treinamento Técnico V a

partir de setembro de 2018 (R$ 7372,40).

Através dessa análise financeira, constatou-se um custo de R$ 1162,18 por

paciente para a quantificação de DRM através no método de qPCR DRM e de R$

520,32 através da NGS DRM.

Tabela 10. Comparação dos custos da quantificação de DRM por paciente através

dos métodos de qPCR DRM e NGS DRM. Valores monetários expressos em Reais.

Page 79: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

79

VI. DISCUSSÃO

A LLA é o câncer mais prevalente em crianças, correspondendo a cerca de

25% das neoplasias malignas nessa faixa etária. Apesar dos altos índices de

sobrevida livre atingidos pelos protocolos de tratamento atuais (cerca de 90%), ainda

existe muito espaço para melhorias, uma vez que apenas entre 20% a 35% das

crianças que apresentam relapso após remissão clínica sobrevivem, por exemplo.

Nesse contexto, a determinação da DRM desses pacientes em diferentes time

points ao longo do seu tratamento se caracteriza como um dos mais importantes

fatores prognósticos para essa doença. Essa avaliação permite estratificar essas

crianças em diferentes grupos de risco, ajustando seus protocolos de tratamento de

modo a elevar suas taxas de sobrevida e reduzir efeitos colaterais relacionados aos

fármacos utilizados no combate a LLA. Como exemplo, valores de DRM maiores que

10-3 são geralmente associados à maiores taxas de recaídas.

Atualmente, o protocolo do Grupo Brasileiro de Tratamento da Leucemia Infantil

(GBTLE LLA-2009), avalia a DRM no 15° dia após o início da terapia de indução por

citometria de fluxo e no 35° dia por qPCR. Enquanto essas técnicas, em particular a

qPCR, são ainda consideradas gold standards para esse exame, elas apresentam

limitações-chave que devem ser consideradas na avaliação do panorama da DRM

para o futuro. A citometria de fluxo requer análise imediata da amostra, exige alto

grau de experiência do analista e tem dificuldade em atingir níveis de sensibilidade

maiores que 10-4. Já a qPCR demanda a confecção de primers paciente-específicos

para cada marcador analisado para um paciente. Essa necessidade torna a detecção

de DRM por qPCR cara e demorada. Devido a essa conjuntura, apenas cerca de 3,2%

das crianças diagnosticadas com LLA no Brasil tem acesso ao exame de DRM.

Esse contexto demonstra a necessidade do desenvolvimento de novas

técnicas para acompanhar a DRM nesses pacientes. O sequenciamento de nova

geração tem sido sugerido como um possível candidato para substituir as técnicas

atualmente em uso, prometendo uma análise mais rápida, de menor custo e com a

possibilidade de acompanhar diversos clonotipos leucêmicos presentes em uma

mesma amostra sem requerer nenhum esforço adicional. A título de comparação, a

determinação da DRM de um paciente por qPCR leva cerca de 23 dias, enquanto

Page 80: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

80

essa mesma determinação por NGS pode ser realizada em cerca de 6 dias. Nesse

projeto, buscamos padronizar e validar um método para a determinação de NGS DRM

em pacientes pediátricos com LLA-B derivada, a variedade mais comum de LLA na

criança. A plataforma de sequenciamento utilizada foi o Illumina MiSeq.

Sequências de rearranjo V(D)J no gene IgH são consideradas os melhores

marcadores moleculares para esse tipo de LLA, devido ao seu alto grau de

polimorfismo e estabilidade nos linfoblastos leucêmicos. Assim como esse marcador

é utilizado para a identificação e quantificação de linfoblastos leucêmicos na medula

óssea pela qPCR DRM, nós exploramos o uso do seu sequenciamento para a

determinação da NGS DRM. A conversão dos reads gerados pelo sequenciamento

em valores de DRM exige a normalização da frequência do clonotipo leucêmico por

spike-in controls e a determinação do número de células mononucleadas totais

referentes à amostra sequenciada. Princípios semelhantes foram explorados por

Faham et al. (2012) e Ladetto et al. (2014), através do método comercial fechado

LymphoSIGHT (Sequenta).

O preparo das bibliotecas para determinação de NGS DRM envolve duas

etapas de amplificação da região de rearranjo V(D)J do gene IgH. A primeira etapa,

denominada Amplicon PCR, é particularmente complexa, por se tratar de uma reação

em multiplex. Desse modo, buscamos padronizar essa reação de modo a obter

bandas bem definidas para o amplicon alvo, de cerca de 300 pares de base, e

minimizar a formação de primer-dimer. Para isso, nós ajustamos a concentração de

primer utilizada no preparo da reação e a temperatura de anelamento dos primeiros

ciclos da PCR, através de uma touchdown PCR. Além disso, três enzimas (Tth DNA

Polymerase, Phusion High-Fidelity DNA Polymerase e GoTaq G2 Hot Start DNA

Polymerase) foram testadas para o protocolo estabelecido para a Amplicon PCR. As

enzimas Phusion e GoTaq apresentaram bons resultados, com baixos índices de

formação de primer-dimer observados. Dentre elas, enzima GoTaq G2 Hot Start DNA

Polymerase foi definida como a padrão para o método de NGS DRM, em função do

seu menor custo e maior facilidade de acesso a pronta entrega, fatores relevantes no

contexto de uma técnica que se pretende utilizar para realizar diagnósticos clínicos.

Vieses de amplificação diferencial entre os amplicons gerados podem ocorrer

em reações de PCR multiplex, como a Amplicon PCR. Desse modo, número mínimo

de ciclos de amplificação realizados nessa etapa do preparo das bibliotecas foi

Page 81: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

81

testado, uma vez que a redução desse valor privilegia a restrição desses vieses. Os

valores testados para esse parâmetro foram 17, 20, 23 e 25 ciclos de amplificação.

Nós determinamos 25 como o número de ciclos a ser utilizado na Amplicon PCR no

preparo das bibliotecas para NGS DRM, uma vez que esse valor foi o único a não

ocasionar em uma redução da linearidade da técnica, quando testada nos pontos 10-

3 e 10-4 de uma curva padrão de DNA leucêmico em DNA de PBMCs. Além do mais,

valores menores de ciclos de amplificação estiveram associados a queda na

qualidade dos reads gerados pelo sequenciamento de suas bibliotecas.

A plataforma de sequenciamento Illumina MiSeq apresenta dificuldade em

sequenciar bibliotecas com baixos níveis de diversidade, como no caso do

sequenciamento de bibliotecas de um amplicon. Nesses casos, a Illumina recomenda

a adição de pelo menos 20% de genomas PhiX às bibliotecas para elevar

artificialmente a sua diversidade. Outra estratégia para realizar essa elevação de

diversidade consiste no uso de diferentes variedades do reverse primer na etapa de

Amplicon PCR, com a adição de entre 0 a 3 nucleotídeos N na região onde o início do

sequenciamento em si ocorre. Desse modo, amplicons gerados por diferentes primers

não estarão em fase durante os ciclos de sequenciamento.

Utilizando essa estratégia, nós buscamos reduzir a quantidade de genomas

PhiX adicionada às bibliotecas, uma vez que esses controles ocupam espaço na flow

cell, diminuindo o número de dados relacionados à amostra gerado por

sequenciamento. Nós testamos o sequenciamento de uma mesma amostra utilizando

10%, 7,5% ou 5% de PhiX na concentração final da sua biblioteca. Enquanto o

sequenciamento ocorreu sem maiores problemas para as bibliotecas com 10% e 7,5%

de PhiX, a corrida da biblioteca com 5% desse controle falhou pela baixa qualidade

dos clusters gerados. Para as bibliotecas com 10% e 7,5% de PhiX, os níveis de

clusters aprovados pelo filtro de qualidade do sequenciador (89,88% contra 89,52%),

de nucleotídeos sequenciados que atingiram níveis de qualidade Q30 (90,22% contra

90,22%) e a frequência do clonotipo leucêmico (0,803% contra 0,809%) foram

bastante semelhantes. No entanto, nós decidimos padronizar a adição de PhiX a

biblioteca em 10% de sua concentração, mantendo o método mais distante do

threshold de falha desse parâmetro, uma vez que a ocorrência desse tipo de falha

ocasiona a perda total da corrida do sequenciamento.

Page 82: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

82

O uso dos spike-in controls para determinar a NGS DRM ao longo de uma curva

padrão de DNA leucêmico em DNA de PBMCs resultou, inicialmente, em valores de

NGS DRM cerca de uma ordem de grandeza acima dos esperados. A estrutura

supercoiled de plasmídeos pode levar a uma redução da sua eficiência de

amplificação (Chen et al., 2007), o que explicaria a obtenção de valores de NGS DRM

mais elevados que o esperado. Em concordância a essa hipótese, a linearização das

moléculas de spike-in control permitiu a redução das NGS DRM observadas,

trazendo-as para níveis bastante similares aos esperados.

Clonotipos com segmentos VH pertencentes a diferentes famílias são

amplificados por diferentes primers durante a etapa de Amplicon PCR. Desse modo,

uma diferença de eficiência desses oligonucleotídeos pode levar a uma amplificação

diferencial desses clonotipos. Assim sendo, a utilização de apenas controles spike-in

contendo segmentos VH da mesma família do clonotipo leucêmico analisado no

cálculo de sua NGS DRM pode ser necessária, dependendo dos níveis dessa

amplificação diferencial.

Nós realizamos um experimento que comparou, para uma curva-padrão de

DNA leucêmico em DNA de PBMCs, os níveis de NGS DRM determinados utilizando

apenas controles spike-in de uma mesma família VH. Os valores de NGS DRM foram

normalizados por controles de família VH1, VH2 ou VH3. Através desse ensaio,

observamos diferenças principalmente nos valores de NGS DRM determinados a

partir de moléculas spike-in com rearranjos VH3, quando comparados aos valores

determinado através de controles VH1 e VH2. Esse resultado demonstrou que o uso

de apenas spike-in controls com segmento VH da mesma família que a do clonotipo

leucêmico analisado pode ser necessária. Esse princípio foi levado em consideração

em todas as etapas de análise da validação do método de NGS DRM, com valores de

NGS DRM Geral e NGS DRM Família sendo determinados para todos os clonotipos

analisados e a eficiência de ambas as abordagens sendo comparadas.

A validação do método de NGS DRM se deu através da análise de amostras

de 45 pacientes pediátricos diagnosticados com LLA-B derivada. Dos 58 clonotipos

leucêmicos analisados nessas amostras por qPCR DRM, 55 foram identificados

também pela NGS DRM, sendo então utilizados para a comparação dos dois métodos.

A NGS DRM, no entanto, foi capaz de identificar 32 clonotipos leucêmicos além dos

55 já mencionados, totalizando 87 clonotipos leucêmicos identificados para as 45

Page 83: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

83

amostras analisadas. A análise de mais de um marcador IgH por qPCR para um

paciente requer a síntese de mais de um primer paciente-específico, tantos quanto

forem os marcadores utilizados. Em contraste, a NGS DRM é capaz de identificar e

acompanhar diversos clonotipos leucêmicos por paciente sem a necessidade de

esforços adicionais.

A comparação entre os resultados de NGS DRM e qPCR DRM foi realizada

não só através de correlações matemáticas (coeficiente de correlação de Pearson),

mas também a partir da sua relevância clínica. Para essa segunda análise, valores de

NGS DRM com diferença absoluta menores que 1 x 10-4 em relação a qPCR DRM ou

fold changes menores que 5 foram considerados satisfatórios. Desse modo, a

frequência de amostras com DRM satisfatórias foi de 92,7% quando levando em

consideração a NGS DRM Geral e de 90,9% quando utilizando a NGS DRM Família.

No entanto, uma presença aquém da esperada de reads relacionados a

sequências de spike-in controls foi observada para o último subset de pacientes

sequenciados em uma mesma corrida (as amostras D35 para essa etapa de validação

final foram sequenciadas em três corridas do sequenciador MiSeq). Essa sub-

representação de reads de spike-in control levou a valores de NGS DRM com erros

de fold change mais elevados para esse terceiro subset de amostras (média de 6,04

vezes) em relação ao primeiro (média de 1,8 vez) e ao segundo (média de 2,00 vezes).

Assim sendo, nós repetimos as análises dos índices de NGS DRM

considerados satisfatórios em relação a qPCR quando comparados de um ponto de

vista clínico, dessa vez excluindo o terceiro subset de amostras previamente

mencionado. Nesse contexto, a frequência de amostras com DRM satisfatórias foi de

95,1% quando levando em consideração a NGS DRM Geral e de 92,7% quando

utilizando a NGS DRM Família.

A correlação matemática entre os valores de NGS DRM observados e os

valores de qPCR esperados foi realizada convertendo esses valores para uma escala

log10 e determinando o seu coeficiente de correlação de Pearson. Em função da

conversão de escala, clonotipos leucêmicos que tiveram uma de suas DRM (seja ela

a DRM esperada, geral ou família) com valor 0 foram excluídos da análise, contanto

que nenhum dos seus outros valores de DRM fosse superior a 1 x 10-4. Essa exclusão

se deu em função da correlação entre um valor muito pequeno e 0, quando realizada

Page 84: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

84

em escala logarítmica na base 10, introduzir altos níveis de erro na análise, uma vez

que a conversão de valores decimais a essa escala os afasta cada vez mais de 0

quanto menor for esse valor.

Os valores de NGS DRM dos clonotipos analisados apresentaram forte

correlação aos valores de qPCR DRM esperados, com um coeficiente de Pearson de

0,88 para as NGS DRM Geral e de 0,91 para as NGS DRM Família. Essa análise

também foi realizada novamente à exclusão dos clonotipos do terceiro subset de

amostras sequenciadas, atingindo um coeficiente de correlação de Pearson de 0,88

para a NGS DRM geral e de 0,92 para a NGS DRM Família.

A frequência desses clonotipos leucêmicos, sem normalização a valores de

DRM, também foi comparada e correlacionada aos valores esperados de qPCR.

Observamos um coeficiente de correlação de Pearson de 0,78 para essas variáveis

incluindo o terceiro subset de amostras e de 0.81 quando excluindo esse subset da

análise. Esse grau de correlação, portanto, mostrou-se inferior aos obtidos utilizando

o sistema de spike-in control para a normalização do número de reads de um clonotipo

leucêmico em DRM. No mais, a relevância clínica das frequências de clonotipos

leucêmicos não pode ser facilmente estabelecida pelos parâmetros padronizados para

DRM, uma vez que os seus valores são, no geral, entre uma a duas ordens de

grandeza maiores que suas contrapartes em DRM.

Através dessas análises, concluímos que o método de NGS DRM é capaz de

gerar resultados satisfatórios quando comparados a qPCR DRM, seja de um ponto de

vista de relevância clínica dos resultados quanto em relação à correlação matemática

entre esses valores. Adicionalmente, os níveis de correlação entre essas variáveis

atingidos pelo nosso método são comparáveis aos obtidos em estudos baseados no

sistema comercial fechado LymphoSIGHT, como por Faham et al. (2012) e Ladetto et

al. (2014). Além disso, a sua taxa de correlação foi superior quando comparada a

sistemas que não utilizam controles para normalizar a frequência do clonotipo

leucêmico a um valor de DRM, como nesse próprio projeto e em um estudo por

Kotrova et al. (2015). Desse modo, consideramos que o principal objetivo do projeto

foi atingido.

Não foi possível, no entanto, determinar se um dos métodos de normalização

dos reads de um clonotipo leucêmico em DRM é significativamente superior. Por um

Page 85: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

85

lado, os valores de NGS DRM calculados utilizando apenas spike-in controls com a

mesma família VH do clonotipo leucêmico analisado apresentaram coeficientes de

correlação de Pearson levemente superiores. No entanto, o número de reads de

apenas três spike-in controls é levado em consideração nessa análise, uma vez que

cada família VH possui apenas 3 representantes nas 21 sequências controle. Desse

modo, o cálculo da NGS DRM a partir desse conjunto se torna altamente sensível a

comportamentos erráticos acentuados dos reads dessas sequências. Em casos raros,

por exemplo, é possível que o fator spike-in para um clonotipo leucêmico seja

negativo, resultando em uma NGS DRM menor que 0, que não possui nenhum sentido

biológico.

Já os valores de NGS DRM calculados a partir do uso de todas as 21

sequências spike-in utilizadas são bem menos sensíveis a problemas na amplificação

de uma ou duas moléculas de controle, uma vez que o maior número de sequências

utilizadas nesse cálculo o torna mais robusto a resistir a influência de outliers. Assim

sendo, a análise de um maior volume de dados de NGS DRM é necessária para

compreender melhor as limitações de cada abordagem de determinação de DRM.

Apenas assim poderemos determinar com confiança se há de fato uma opção superior

entre a NGS DRM Geral e a NGS DRM Família.

As taxas anormais de fold change entre NGS DRM e qPCR DRM observadas

para o terceiro subset de amostras sequenciadas estiveram majoritariamente

relacionadas a uma sub-representação de reads relacionados aos spike-in controls

nessas bibliotecas, como anteriormente mencionado. Nós hipotetizamos que esse

erro possa estar vinculado a uma subamplificação das sequências spike-in control

adicionadas às bibliotecas. Essa subamplificação poderia ter sido ocasionada, por

exemplo, por um maior grau de degradação do pool de spike-in controls em

decorrência do maior tempo desde o seu preparo, uma vez que esse foi o último grupo

de amostras a ser sequenciado. Outra hipótese que pode explicar esse erro é uma

simples falha operacional na adição do pool de spike-in controls a essas bibliotecas.

Considerando a utilização do método de NGS DRM em situações de

diagnósticos clínicos reais, não haverá resultados de qPCR para servir de parâmetro

na identificação desses erros. Pacientes com níveis de DRM reais baixos poderiam

então vir a ser enquadrados como apresentando taxas de DRM mais elevadas, com

a possibilidade até do seu caso ser classificado erroneamente como de alto risco,

Page 86: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

86

gerando então um falso-positivo. Desse modo, é importante que existam ferramentas

que permitam a identificação de corridas de sequenciamento que apresentam esse

tipo de de erro, independentemente de sua origem. Nesse contexto, nós observamos

que a média ou a mediana dos coeficientes de amplificação spike-in (definido para

uma amostra como a razão entre o seu total de reads contendo rearranjos V(D)J e o

seu total de reads relacionados a sequências spike-in control) das amostras de um

sequenciamento pode ser uma dessas ferramentas. Para o nosso caso em particular,

a média e mediana desses coeficientes de amplificação spike-in foi de 7,12 e 5,24

respectivamente para o terceiro subset de amostras e de 4,92 e 3,20 para as demais

amostras. A consolidação definitiva desses coeficientes de amplificação spike-in como

um parâmetro para avaliar a sub-representação de reads de controles em corridas de

sequenciamento, no entanto, ainda depende da sua padronização e de estudos em

um maior número de casos.

Apesar do método para a quantificação de DRM por NGS proposto neste

projeto ter sido padronizado e validado com sucesso, atingindo resultados satisfatórios

tanto de um ponto de vista de sua relevância clínica quanto de um ponto de vista

matemático, ainda há muita margem para aperfeiçoamentos e desenvolvimentos

futuros.

O conjunto de sequências V(D)J spike-in control utilizado para normalizar o

número de reads de clonotipos leucêmicos em valores de DRM ainda pode, por

exemplo, ser otimizado. Nesse estudo, utilizamos 21 sequências de rearranjos IgH

para realizar essa normalização, buscando representar uniformemente as 7 famílias

de segmentos VH possíveis para esses rearranjos. É razoável, no entanto, que seja

possível quantificar a NGS DRM com níveis de sensibilidade e linearidade

semelhantes ou até mesmo superiores aos aqui obtidos partindo de um conjunto

menor de controles. Já no caso de acabarmos optando pela utilização da NGS DRM

família-específica, pode ser que a adição de mais controles externos de cada família

VH ao ensaio seja necessária, para reduzir o quanto o valor final de NGS DRM

estimado é afetado por problemas na amplificação de algum desses spike-in controls.

Desse modo, o número ótimo de sequências spike-in controls que deve utilizado na

NGS DRM só poderá ser determinado através de uma exploração mais a fundo dos

dados já gerados nesse projeto e dos que ainda virão a ser gerados por esse método.

Page 87: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

87

Enquanto rearranjos completos do gene IgH se configuram como o melhor

marcador para avaliar DRM em LLA-B derivada, eles nem sempre estão presentes ou

permitem alcançar sensibilidades satisfatórias em todos os casos dessa variedade de

LLA. Desse modo, outros marcadores, como rearranjos incompletos IgH, rearranjos

IgK, TCRD e TRCG, podem ser utilizados para essa avaliação em certos casos de

LLA-B derivada. Em adição, os genes TCRD, TRCB, IgH incompleto e TCRG são,

nessa ordem, os melhores marcadores contendo rearranjos V(D)J para acompanhar

DRM em casos de LLA-T (Flohr et al., 2008). Todos esses marcadores mencionados

para LLA-B e LLA-T possuem rearranjos V(D)J e, portanto, podem ser utilizados para

determinar NGS DRM através da adaptação dos primers utilizados na Amplicon PCR

e dos controles externos utilizados. Desse modo, o método de NGS DRM pode ser

facilmente adaptado não só para um maior número de casos de LLA-B derivada, mas

também para pacientes diagnosticados com LLA-T.

A NGS DRM também pode ser adaptada para uso na Leucemia Mieloide Aguda

(LMA). Os genes IgH, IgK e TCRD encontram-se rearranjados em cerca de 10,4%,

3,2% e 9,3% dos casos de LMA respectivamente, segundo Boeckx et al. (2002). No

entanto, a NGS DRM não precisa se restringir ao uso de genes com rearranjos V(D)J,

podendo utilizar também mutações associadas a células de LMA para identificá-las e

acompanhar sua dinâmica populacional ao longo do tratamento da doença.

Aproximadamente 58% dos casos de LMA apresentam mutações em pelo menos um

dos seguintes genes, que poderão ser explorados então para a determinação da NGS

DRM: NRAS, KRAS, PTPN11, FLT3, KIT, RUNX1, CEBPA, ETV6, NPM1, TP53,

CDKN2A/B, GATA1 e MLL (Radtke et al., 2009).

Concluindo, esperamos que os resultados obtidos nesse projeto não só reflitam

em benefícios a curto prazo para as crianças brasileiras sofrendo de LLA-B derivada,

mas que os seus frutos futuramente se estendam para também para pacientes

acometidos por outras variedades de leucemia.

Page 88: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

88

VII. REFERÊNCIAS BIBLIOGRÁFICAS

ABBAS, A. K.; LICHTMAN, A. H.; PILLAI, S. Lymphocyte Development and Antigen Receptor Gene Rearrangement. In ___. Cellular and Molecular Immunology. 9 ed. Philadelphia: Elsevier, 2017, cap. 8.

BEILLARD, E.; PALLISGAARD, N.; VAN DER VELDEN, V. H.; BI, W.; DEE, R.; VAN DER SCHOOT, E.; DELABESSE, E.; MACINTYRE, E.; GOTTARDI, E.; SAGLIO, G.; WATZINGER, F.; LION, T.; VAN DONGEN, J. J.; HOKLAND, P.; GABERT, J. Evaluation of candidate control genes for diagnosis and residual disease detection in leukemic patients using “real-time” quantitative reverse-transcriptase polymerase chain reaction (RQ-PCR) – a Europe against cancer program. Leukemia, v. 17, n. 12, p. 2474-2486, 2003.

BEISHUIZEN, A.; VERHOEVEN, M. A.; VAN WERING, E. R.; HÄHLEN, K.; HOOIJKAAS, H.; VAN DONGEN, J. J. M. Analysis of Ig and T-cell receptor genes in 40 childhood acute lymphoblastic leukemias at diagnosis and subsequent relapse: implications for the detection of minimal residual disease by polymerase chain reaction analysis. Blood, v. 83, n. 8, p. 2238-2247, 1994.

BIONDI, A.; VALSECCHI, M. G.; SERIU, T.; D’ANIELLO, E.; WILLEMSE, M. J.; FASCHING, K.; PANNUZIO, A.; GADNER, H.; SCHRAPPE, M.; KAMPS, W. A.; BARTRAM, C. R.; VAN DONGEN, J. J. M.; PANZER-GRÜMAYER, E. R. Molecular detection of minimal residual disease is a strong predictive factor of relapse in childhood B-lineage acute lymphoblastic leukemia with medium risk features. A case control study of the International BFM study group. Leukemia, v. 14, n. 11, p. 1939-1943, 2000.

BOECKX, N.; WILLEMSE, M. J.; SZCZEPANSKI, T.; VAN DER VELDEN, V. H.; LANGERAK, A. W.; VANDEKERCKHOVE, P.; VAN DONGEN, J. J. M. Fusion gene transcripts and Ig/TCR gene rearrangements are complementary but infrequent targets for PCR-based detection of minimal residual disease in acute myeloid leukemia. Leukemia, v. 16, n. 3, p. 368-375, 2002.

BRISCO, M. J.; CONDON, J.; HUGHES, E.; NEOH, S. H.; SYKES, P. J.; SESHADRI, R.; TOOGOOD, I.; WATERS, K.; TAURO, G.; EKERT, H. Outcome prediction in childhood acute lymphoblastic leukaemia by molecular quantification of residual disease at the end of induction. Lancet, v. 343, n. 8891, p. 196-100, 1994.

BROOIMANS, R. A.; KRAAN, J.; VAN PUTTEN, W.; CORNELISSEN, J. J.; LÖWEMBERG, B.; GRATAMA, J. W. Flow cytometric differential of leukocyte populations in normal bone marrow: Influence of peripheral blood contamination. Cytometry B Clin Cytom, v. 76, n. 1, p. 18-26, 2009.

CAVÉ, H.; BOSH, J. W.; SUCIU, S.; GUIDAL, C.; WATERKEYN, C.; OTTEN, J.; BAKKUS, M.; THIELEMANS, K.; GRANDCHAMP, B.; VILMER, E.; NELKEN, B.; FOURNIER, M.; BOUTARD, P.; LEBRUN, E.; MÉCHINAUD, F.; GARANAD, R.; ROBERT, A.; DASTUGUE, N.; PLOUVIER, E.; RACADOT, E.; FERSTER, A.; GYSELINCK, J.; FENNETEAU, O.; DUVAL, M.; SOLBU, G.; MANEL, A. Clinical significance of minimal residual disease in childhood acute lymphoblastic leukemia. European Organization for Research and treatment of Cancer-Childhood Leukemia Cooperative Group. N Engl J Med, v. 339, p. 591-598, 1998.

CHEN, J.; KADLUBAR, F. F.; CHEN, J. Z. DNA supercoiling suppresses real-time PCR: a new approach to the quantification of mitochondrial DNA damage and repair. Nucleic Acids Res, v. 35, n. 4, p. 1377-1388, 2007.

CONTER, V.; BARTRAM, C. R.; VALSECCHI, M. G.; SCHRAUDER, A.; PANZER-GRÜMAYER, R.; MÖRICKE, A.; ARICÒ, M.; ZIMMERMANN, M.; MANN, G.; DE ROSSI, G.; STANULLA, M.; LOCATELLI, F.; BASSO, G.; NIGGLI, F.; BARISONE, E.; HENZE, G.; LUDWIG, W.; HAAS, O. A.; CAZZANIGA, G.; KOEHLER, R .; SILVESTRI, D.; BRADTKE, J.; PARASOLE, R.; BEIER, R.; VAN DONGEN, J. J. M.; BIONDI, A.; SCHRAPPE, M. Molecular response to treatment redefines all prognostic factors in children and adolescents with B-cell precursor acute lymphoblastic leukemia: results in 3184 patients of the AIEOP-BFM ALL 2000 study. Blood, v. 115, p. 3206-3214, 2010.

COUSTAN-SMITH, E.; BEHM, F. G.; SANCHEZ, J.; BOYETT, J. M.; HANCOCK, M. L.; RAIMONDI S. C.; RUBNITZ, J. E.; RIVERA, G. K.; SANDLUND, J. T.; PUI, C. H.; CAMPANA, D. Immunological detection of minimal residual disease in children with acute lymphoblastic leukaemia. Lancet, v. 351, n. 9102, p. 550-554, 1998.

Page 89: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

89

D’AMORE, R.; IJAZ, U. Z.; SCHIRMER, M.; KENNY, J. G.; GREGORY, R.; DARBY, A. C.; SHAKYA, M.; PODAR, M.; QUINCE, C.; HALL, N. A comprehensive benchmarking study of protocols and sequencing platforms for 16s rRNA community profiling. BMC Genomics, v. 17, n. 55, 2016.

DUEZ, M.; GIRAUD, M.; HERBERT, R.; ROCHER, T.; SALSON, M.; THORNIER, F. Vidjil: A web platform for analysis of high-throughput repertoire sequencing. PLOS ONE, v. 11, n. 11, e0166126, 2016.

ELNIFRO, E. M.; ASHSHI, A. M.; COOPER, R. J.; KLAPPER, P. E. Multiplex PCR: optimization and application in diagnostic virology. Clin Microbiol Rev, v. 13, n. 4, p. 559-570, 2000.

FAHAM, M.; ZHENG, J.; MOORHEAD, M.; CARLTON, V. E. H.; STOW, P.; COUSTAN-SMITH, E.; PUI, C.; CAMPANA, D. Deep-sequencing approach for minimal residual disease detection in acute lymphoblastic leukemia. Blood, v. 120, n. 26, p. 5173-5180, 2012.

FLOHR, T.; SCHRAUDER, A.; CAZZANIGA, G.; PANZER-GRÜMAYER, R.; VAN DER VELDEN, V.; FISCHER, S.; STANULLA, M.; BASSO, G.; NIGGLI, F. K.; SCHÄFER, B. W.; SUTTON, R.; KOEHLER, R.; ZIMMERMANN, M.; VALSECCHI, M. G.; GADNER, H.; MASERA, G.; SCHRAPPE, M.; VAN DONGEN, J. J. M.; BIONDI, A.; BARTRAM, C. R. Minimal residual disease-directed risk stratification using real-time quantitative PCR analysis of immunoglobulin and T-cell receptor gene rearrangements in the international multicenter trial AIEOP-BFM ALL 2000 for childhood acute lymphoblastic leukemia. Leukemia, v. 22, p. 771-782, 2008.

GAJJAR, A.; RIBEIRO, R.; HANCOCK, M. L.; RIVERA, G. K.; MAHMOUD, H.; SANDLUND, J. T.; CRIT, W. M.; PUI, C. H. Persistence of circulating blasts after 1 week of multiagent chemotherapy confers a poor prognosis in childhood acute lymphoblastic leukemia. Blood, v. 86, n. 4, p. 1292-1295, 1995.

GAWAD, C.; PEPIN, F.; CARLTON, V.; KLINGER, M.; LOGAN, A. C.; MIKLOS, D. B.; FAHAM, M.; DAHL, G.; LACAYO, N. Massive evolution of the immunoglobulin heavy chain locus in children with B precursor acute lymphoblastic leukemia. Blood, v. 120, n. 22, p. 4407-4417, 2012.

HOWLADER, N.; NOONE, A. M.; KRAPCHO, M.; GARSHELL, J.; NEYMAN, N.; ALTEKRUSE, S. F.; KOSARY, C. L.; YU, M.; RUHL, J.; TATALOVICH, Z.; CHO, H.; MARIOTTO, A.; LEWIS, D. R.; CHEN, H. S.; FEUER, E. J.; CRONIN, K. A. SEER Cancer Statistics Review, 1975-2010, National Cancer Institute. Disponível em: https://seer.cancer.gov/archive/csr/1975_2010/. Acessado em 28/01/2019.

INSTITUTO NACIONAL DE CÂNCER JOSÉ ALENCAR GOMES DA SILVA (INCA). Estimativa 2018. Incidência de Câncer no Brasil. Rio de Janeiro: Coordenação de Ensino, 2017.

JACQUY, C.; DELEPAUT, B.; VAN DAELE, S.; VAERMAN, J. L.; ZENEBERGH, A.; BRICHARD, B.; VERMYLEN, C.; CORNU, G.; MARTIAT, P. A prospective study of minimal residual disease in childhood B lineage acute lymphoblastic leukaemia: MRD level at the end of induction is a strong predictive factor of relapse. British Journal Haematology, v. 98, p.140-146, 1997.

KANSAGRA, A.; DAHIYA, S.; LITZOW, M. Continuing challenges and current issues in acute lymphoblastic leukemia. Leukemia and Lymphoma, v. 59, n. 3, p. 526-541, 2018.

KATO, M.; MANABE, A. Treatment and biology of pediatric acute lymphoblastic leukemia. Pediatr Int, v. 60, n. 1, p. 4-12, 2018.

KOTROVA, M.; MUZIKOVA, K.; MEJSTRIKOVA, E.; NOVAKOVA, M.; BAKARDJIEVA-MIHAYLOVA, V.; FISER, K; STUCHLY, J.; GIRAUD, M.; SALSON, M.; POTT, C.; BRÜGGERMANN, M.; FÜLLGRABE, M.; STARY, J.; TRKA, J.; FRONKOVA, E. The predictive strength of next-generation sequencing MRD detection for relapse compared with current methods in childhoold ALL. Blood, v. 126, p. 1045-1047, 2015.

LADETTO, M.; BRÜGGERMANN, M.; MONITILLO, L.; FERRERO, S.; PEPIN, F.; DRANDI, D.; BARBERO, D.; PALUMBO, A.; PASSERA, R.; BOCCADORO, M.; RITGEN, M.; GÖKBUGET, N.; ZHENG, J.; CARLTON, V.; TRAUTMANN, H.; FAHAM, M.; POTT, C. Next-generation sequencing and real-time quantitative PCR for minimal residual disease detection in B-cell disorders. Leukemia, v. 28,

p. 1299-1307, 2014.

LEVY, R.; WARNKE, R.; DORFMAN, R. F.; HAIMOVICH, J. The monoclonality of human B-cell lymphomas. J Exp Med, v. 145, n. 4, p. 1014-1028, 1977.

Page 90: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

90

LIU, L.; LI, Y.; LI, S.; HU, N.; HE, Y.; PONG, R.; LIN, D.; LU, L.; LAW, M. Comparison of next-generation sequencing systems. Journal of Biomedicine and Biotechnology, v. 2012, 2012. Disponível em: http://dx.doi.org/10.1155/2012/251364. Acessado em: 01 de fev. 2012. LOCATELLI, F.; SCHRAPPE, M.; BERNARDO, M. E.; RUTELLA, S. How I treat relapsed childhood acute lymphoblastic leukemia. Blood, v. 120, n. 14, p. 2807-2816, 2012.

METZKER, M. L. Sequencing Technologies - the next generation. Nat Rev Genet, v. 11, n.1, p. 31-46, 2010.

MITRA, A.; SKRZYPCZAK, M.; GINALSKI, K.; ROWICKA, M. Strategies for Achieving High Sequencing Accuracy for Low Diversity Samples and Avoiding Sample Bleeding Using Illumina Platform. PLoS One, v. 10, n. 4, 2015. Disponível em: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4393298/. Acessado em 28/01/2019.

NGUYEN, K.; DEVIDAS, M.; CHENG, S.; LA, M.; RAETZ, E. A.; CARROLL, W. L.; WINICK, N. J.; HUNGER, S. P.; GAYNON, P. S.; LOH, M. L. Factors Influencing Survival After Relapse From Acute Lymphoblastic Leukemia: A Children’s Oncology Group Study. Leukemia, v. 22, n. 12, p. 2142-2150, 2008.

NUNES, V.; CAZZANIGA, G.; BIONDI, A. An update on PCR use for minimal residual disease monitoring in acute lymphoblastic leukemia. Expert Rev Mol Diagn, v. 17, n. 11, p. 953-963, 2017.

PUI, C. H.; CAMPANA, D.; PEI, D.; BOWMAN, P.; SANDLUND, J. T.; KASTE, S. C.; RIBEIRO, R. C.; RUBNITZ, J. E.; RAIMONDI, S. C.; ONCIU, M.; COUSTAN-SMITH, E.; KUN, L. E.. Treating Childhood Acute Lymphoblastic Leukemia without Cranial Irradiation. N Engl J Med, v. 360, p. 2730-2741, 2009.

PULSIPHER, M. A.; CARLSON, C.; LANGHOLZ, B.; WALL, D. A.; SCHULTZ, K. R.; BUNIN, N.; KIRSCH, I.; GASTIER-FOSTER, J. M.; BOROWITZ, M.; DESMARAIS, C.; WILLIAMSON, D.; KALOS, M.; GRUPP, S. A. IgH-V(D)J NGS-MRD measurement pre- and early post-allotransplant defines very low- and very high-risk ALL patients. Blood, v. 125, n. 22, p. 3501-3508, 2015.

RADTKE, I.; MULLIGHAN, C. G.; ISHII, M.; SU, X.; CHENG, J.; MA, J.; GANTI, R.; CAI, Z.; GOORHA, S.; POUNDS, S. B.; CAO, X.; OBERT, C.; ARMSTRONG, J.; ZHANG, J.; SONG, G.; RIBEIRO, R. C.; RUBNITZ, J. E.; RAIMONDI, S. C.; SHURTLEFF, S. A.; DOWNING, J. R. Genomic analysis reveals few genetic alterations in pediatric acute myeloid leukemia. Pnas, v. 106, n. 31, p. 12944-12949, 2009.

REISMÜLLER, B.; ATTARBASCHI, A.; PETERS, C.; DWORZAK, M. N.; PÖTSCHGER, U.; URBAN, C.; FINK, F.; MEISTER, B.; SCHMITT, K.; DIECKMANN, K.; HENZE, G.; HAAS, O. A.; GADNER, H.; MANN, G. Long-term outcome of initially homogeneously treated and relapsed childhood acute lymphoblastic leukaemia in Austria - A population-based report of the Austrian Berlin-Frankfurt-Münster (BFM) Study Group. Br J Haematol., v. 144, n. 4, p. 559-570, 2009.

RUBNITZ, J. E.; INABA, H.; DAHL, G.; RIBEIRO, R. C.; BOWMAN, W. P.; TAUB, J.; POUNDS, S.; RAZZOUK, B. I.; LACAYO. N. J.; CAO. X.; MESHINCHI, S.; DEGAR, B.; AIREWELW, G.; RAIMONDI, S. C.; ONCIU, M.; COUSTAN-SMITH, E.; DOWNING, J. R.; LEUNG, W.; PUI C. H; CAMPANA D. Minimal residual disease-directed therapy for childhood acute myeloid leukaemia: results of the AML02 multicentre trial. Lancet Oncol, v. 11, n. 6, p. 543-552, 2010.

RYAN J.; QUINN, F.; MEUNIER, A.; BOUBLIKOVA, L.; CRAMPE, M.; TEWARI, P.; O’MARCAIGH, A.; STALLINGS, R.; NEAT, M.; O’MEARA, A.; BREATNACH, F.; MCCANN, S.; BROWNE, P.; SMITH, O.; LAWLER, M. Minimal residual disease detection in childhood acute lymphoblastic leukemia patients at multiple time-points reveals high levels of concordance between molecular and immunophenotypic approaches. British Journal of Haematology, v. 144, n. 1, p. 107-115, 2009.

STOCK, W.; ESTROV, Z. Studies of minimal residual disease in acute lymphocytic leukemia. Hematol Oncol Clin North Am, v. 14, n. 6, p. 1289-1305, 2000.

TONEGAWA, S. Somatic generation of antibody diversity. Nature, v. 302, p. 575-581, 1983.

VAN DONGEN, J. J. M.; SERIU, T.; PANZER-GRÜMAYER, E. R.; BIONDI, A.; PONGERS-WILLEMSE, M. J.; CORRAL, L.; STOLZ, F.; SCHRAPPE, M.; MASERA, G.; KAMPS, W. A.; GADNER, H.; VAN WERING, E. .R; LUDWIG, W. D.; BASSO, G.; DE BRUIJN, M. A.; CAZZANIGA, G.; HETTINGER, K.; VAN DER DOES-VAN DEN BERG, A.; HOP, W. C.; RIEHM, H.; BARTRAM, C. R. Prognostic value of minimal residual disease in acute lymphoblastic leukaemia in childhood. Lancet, v. 352, n. 9142, p. 1731-1738, 1998.

Page 91: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

91

VAN DONGEN, J. J. M.; LANGERAK, A. W.; BRÜGGEMANN, M.; EVANS, P. A.; HUMMEL, M.; LAVANDER, F. L.; DELABESSE, E.; DAVI, F.; SCHUURING, E.; GARCÍA-SANZ, R.; VAN KRIEKEN, J. H.; DROESE, J.; GONZÁLEZ, D.; BASTARD, C.; WHITE, H. E.; SPAARGAREN, M.; GONZÁLEZ, M.; PARREIRA, A.; SMITH, J. L.; MORGAN, G. J.; KNEBA, M.; MACINTYRE, E. A. Design and standardization of PCR primers and protocols for detection of clonal immunoglobulin and T-cell receptor gene recombinations in suspect lymphoproliferations: report of the BIOMED-2 Concerted Action BMH4-CT98-3936. Leukemia, v. 17, n. 12, p. 2257-2317, 2003.

VAN DONGEN, J. J. M.; VAN DER VELDEN V. H. J.; BRÜGGEMANN, M.; ORFAO, A. Minimal residual disease diagnostics in acute lymphoblastic leukemia: need for sensitive, fast and standardized technologies. Blood, v. 125, n. 26, p. 3996-4009, 2016.

VERHAGEN, O. J.; WILLEMSE, M. J.; BREUNIS, W. B.; WIJKHUJIS, A. J.; JACOBS, D. C.; JOOSTEN, S. A.; VAN WERING, E. R.; VAN DONGEN, J. J. M.; VAN DER SCHOOT, C. E. Application of germline IGH probes in real-time quantitative PCR for the detection of minimal residual disease in acute lymphoblastic leukemia. Leukemia, v. 14, n. 8, p. 1426-1435, 2000.

WASSERMAN, R.; GALILI, N.; ITO, Y.; SILBER, J. H.; REICHARD, B. A.; SHANE, S.; WOMER, R. B.; LANGE, B.; ROVERA, G. Residual disease at the end of induction therapy in childhood B-lineage acute lymphoblastic leukemia. J Clin Oncol, v. 10, n. 12, p. 1879-1888, 1992.

WESTBURY, M. V. Unraveling evolution through Next Generation Sequencing. Tese - Universität Potsdam, 2018.

WOO, J.S.; ALBERTI, M.O; TIRADO, A. C. Childhood B-acute lymphoblastic leukemia: a genetic update. Experimental Hematology & Oncology, v. 3, p. 16, 2014.

WU, D.; SHERWOOD, A.; FROMM, J. R.; WINTER, S. S.; DUNSMORE, K. P.; LOH, M. L.; GREISMAN, H. A.; SABATH, D. E.; WOOD, B. L.; ROBINS, H. High-Throughput Sequencing Detects Minimal Residual Disease in Acute T Lymphoblastic Leukemia. Sci Transl Med, v. 4, n. 134, p. 63-70, 2017.

YAMADA, M.; WASSERMAN, R.; LANGE, B.; REICHARD, B. A.; WOMER, R. B.; ROVERA,G. Minimal residual disease in childhood B-lineage lymphoblastic leukemia. Persistence of leukemic cells during the first 18 months of treatment. N Engl J Med, v. 323, n. 7, p. 448-455, 1990.

Page 92: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

92

VIII. ANEXOS

Anexo 1 - Tabela 1S

Tabela 1S. Nomenclatura, família VH e sequência dos rearranjos V(D)J de IgH

utilizados como spike-in control. Sequências do plasmídeo pJET1.2 representadas

em vermelho. Regiões de anelamento dos primers Biomed2 destacadas em rosa.

Porção final do segmento VH destacada em amarelo. Segmento DH destacado em

verde. Porção inicial do segmento JH representada em azul. Inserções N

representadas por nucleotídeos sublinhados. Nucleotídeos em negrito correspondem

a porção da sequência utilizada para identificar o clonotipo no software Vidjil.

Nomenclatura Família VH Sequência 5’→ 3’

2234 VH1

TTTAGCAAGATCTGGGTGCGACAGGCCCCTGGACAAAGGSSTTKGAGTGGWGGGTGGATCAACGCTGGCAATGGTAACACAAAATATTCACAGAAGTTCCAGGGCAGAGTCACCATTACCAGGGACACATCCGCGAGCACAGCCTACATGGAGCTGAGCAGCCTGAGATCTGAAGACACGGCTGTGTATTACTGTGCGAGAGATCGGGGGGGAGGGTTCGGGGAGTTTTCCCCCGCCCATTGACTACTGGGGCCAGGGAACCCTGGTCACCGTCTCCTCAGGTAAGATCTTTCTAG

2224 VH1

TTTAGCAAGATCTGGGTGCGACAGGCCCCTGGACAAGGGTTTGAATGGATGGTAGGGAGCTACTCTGGCAATGGTAACACAGGCTATGCACAGAAGTTTCAGGGCAGAGTCACCATGACCAGGGACACGTCCACGAGCACAGCCTACATGGAGCTGAGCAGTCAGAGATCTGAGGACATAGATGTGTACTACTGTGCGAGACATTCTTTTGACTACTGGGGCCAGGGAACCCTGGTCACCGTCTCCTCAGGTAAGATCTTTCTAG

2233 VH1

TTTAGCAAGATCTGGGTGCGCCAGGCCCCCGGACAAAGGSTTGCRGKGGSTGGGTGGGATCAACGCTGGCAATGGTAACACAAAATATTCACAGAAGTTCYAGGGCAGAGTCACCATTACCAGGGACACATCCGCGAGCACAGCCTACATGGAGCTGAGCAGCCTGAGATCTGAAGACACGGCTGTGTATTTTGAAGGATGGTAGCTGCTAACGGTATGGACGTCTGGGGCCAAGGGACCACGGTCACCGTCTCCTCAGGTAAGATCTTTCTAG

2168 VH2

TTTAGCAAGATTGGATCCGTCAGCCCCCAGGGAAGGCCCTGGAGKGGCTTGACTCATTGATTGGGATGATGATAAATACTACAGCACATCTCTGAAGACCAGGCTCACCATCTCCAAGGACACCTCCAAAAACCAGGTGGTCCTTACAATGACCAACATGGACCCTGTGGACACAGCCACGTATTACTGCCCCTTGGCCTCCTCAATTACGATATTTTGACTGGTTATCCTACTGGGGCCAGGGAACCCTGGTCACCGTCTCCTCAGGTAAGATCTTTCTAG

2065 VH2

TTTAGCAAGATTGGATCCGTCAGCCCCCAGGGAAGGCCCTGGAGTGSCTTGCACACATTTTTTCGAATGACGAAAAATCCTACAGCACATCTCTGAAGAGCAGGCTCACCATCTCCAAGGACACCTCCAAAAGCCAGGTGGTCCTTACCATGACCAACATGGACCCTGTGGACACAGCCACATATTACTGTGCACGGAAGGGACCTTTACGATTTTTGGAGTGGTTATTAGGCCCTCTTACTACGGTATGGACGTCTGGGGCCAAGGGACCACGGTCACCGTCTCCTCAGGTAAGATCTTTCTAG

2047 VH2

TTTAGCAAGATTGGATCCGTCAGCCCCCAGGGAAGGCCCTGGAGTGGCTTGCACACATTTTTTCGAAKGASGAWWAATCCTACAGCACATCTCTGAAGAGCAGGCTCACCATCTCCAAGGACACCTCCAAAAGCCAGGTGGTCCTTACCATGACCAACATGGACCCTGTGGACACAGCCACATATTACTGTGCACGGATAAAGGGGATTTAGAGGGCGGGGGGCCCCCAATAAACTTATTGTAGTAGTACCAGCTGCTACCCCAACCCAGACCCCGTCTTTTCCTGGTCCGTTCGTATTCTACTACTACTACTACATGGACGTCTGGGGCAAAGGGACCACGGTCACCGTCTCCTCAGGTAAGATCTTTCTAG

2231 VH3 TTTAGCAAGATGGTCCGCCAGGCTCCAGGGAAGGGGCTGGAGTGGGTTGG

Page 93: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

93

CCGTACTAGAAACAAAGCTAACAGTTACACCACAGAATACGCCGCGTCTGTG

AAAGGCAGATTCACCATCTCAAGAGATGATTCAAAGAACTCACTGTATCTGC

AAATGAACAGCCTGAAAACCGAGGACACGGCCGTGTATTACTGTGCTAGAG

GTGAGATCGGGGTATTATGATTACGTTTTGGGGAGCGTTAGCCCCATCTAC

GTACTACTACTACTACGGTATGGACGTCTGGGGGCAAGGGACCACGGTCAC

CGTCTCCTCAGGTAAGATCTTTCTAG

2227 VH3

TTTAGCAAGATGGTCCGCCAGGCTCCAGGGAAGGGGSTGGGAGTGGGTTTCATACATTAGTAGTAGTAGTAGTACCATATACTACGCAGACTCTGTGAAGGGCCGATTCACCATCTCCAGAGACAACGCCAAGAACTCACTGTATCTGCAAATGAACAGCCTGAGAGCCGAGGACACGGCTGTGTATTACTGTGCGAGACCTAATAGCAGCTCGCTCACAGATTACTACTACTACTACTACATGGACGTCTGGGGCAAAGGGACCACGGTCACCGTCTCCTCAGGTAAGATCTTTCTAG

2170 VH3

TTTAGCAAGATGGTCCGCCAGGCTCCAGGGAAGGGGCTGGAGTGGGTCTC

AGTTATTTATAGCGGTGGTAGCASATACTACGCAGACTCCGTGAAGGGCCG

ATTCACCATCTCCAGAGACAATTCCAAGAACACGCTGTATCTTCAAATGAAC

AGCCTGAGAGCCGAGGACACGGCCGTGTATTACTGTCCTCCCGAACGAAC

CCCTCCGAACCCCCTATAGCAGCTCGGAGTATGGGTGTCAAACTACTACG

GTATGGACGTCYGGGRCCAAMRGGCCAACGGTCACCGTCTCCTCAGGTAA

GATCTTTCTAG

1809 VH4

TTTAGCAAGATTGGATCCGCCAGCCCCCARGGRAARGGGCATKGGGAGTG

GATTGGGTATATCTATTACAGTGGGAGCACCAACTACAACCCCTCCCTCAAG

AGTCGAGTCACCATATCAGTAGACACGTCCAAGAACCAGTTCTCCCTRAAGC

TGAGCTCTGTGACCGCCGCAGACACGGCMGTGTATTACTGTGCGAGGGGA

TTTTGACTGGTTATTGAAGGGACTACTGGGGCCAGGGAACCCTGGTCACCG

TCTCCTCAGGTAAGATCTTTCTAG

1974 VH4

TTTAGCAAGATTGGATCCGTCAGCCCCCAGGGAAGGGACTGGAGTGGATTG

GGTATATCTATTACAGTGGGAGCACCAACTACAACCCCTCCCTCAAGAGTCG

AGTCACCATATCAGTAGACACGTCCAAGAACCAGTTCTCCCTGAAGCTGAGC

TCTGTGACCGCTGCGGACACGGCCGTGTATTACTGTGCGAGAAGGGGTAT

AGCAGCAGCTGGTGCCTACTTTGACTACTGGGGCCAGGGAACCCTGGTCA

CCGTCTCCTCAGGTAAGATCTTTCTAG

2353 VH4

TTTAGCAAGATGGATCCGTCAGCCCCCAGGGAAGGGCCTGGAGTGGATTG

GGTACATCTATTACAGTGGGAGCACCTACTMCAACCCGTCCCTCAAGAGTC

GAGTTACCATATCAGTAGACACGTCTAAGAACCAGTTCTCCCTGAAGCTGAG

CTCTGWACWSCGMGGAACGGCCGTGTATTACTGTGCGAGaGcGGGGATGG

TCAGTGGGCAGTGGCTGGTAGGGACTGGGGCCAGGGAACCCTGGTCACCG

TCTCCTCAGGTAAGATCTTTCTAG

1989 VH5

TTTAGCAAGATGGGTGCGCCAGATGCCCGGGAAAGGCCTGGAGTGGATGGGGAGGATTGATCCTAGTGACTCTTATACCAACTACAGCCCGTCCTTCCAAGGCCACGTCACCATCTCAGCTGACAAGTCCATCAGCACTGCCTACCTGCAGTGGAGCMRSCTGAAGGCCTCGGACACCGCCATGTATTACTGTGCGACCCTCCGCCACCCTGAGAGCCCACCTGGGGGAGGTTTGAACTACTGGGGCCAGGGAACCCTGGTCACCGTCTCCTCAGGTAAGATCTTTCTAG

2023 VH5

TTTAGCAAGATGGGTGCGCCAGATGCCCGGGAAAGGCCTGGAGTGGATGGGGATCATCTATCCTGGTGACTCTGATACCAGATACAGCCCGTCCTTCCAAGGCCAGGTCACCATCTCAGCCGACAAGTCCATCAGCACCGCCTACCTGCAGTGGASMRSCTGAAGGCCTCGGACACCGCCATGCCAAAACGGGGATAGCTACTGGTACTTCGATCTCTGGGGCCGTGSCMCCTGGTCACCGTCTCCTCAGGTAAGATCTTTCTAG

2387 VHR

TTTAGCAAGATGGGTGCGCCAGATGCCCGGGAAAGGCCTGGAGTGGATGGGGATCATCTATCCTGGTGACTCTGATACCAGATACAGCCCGTCCTTCCAAGGCCAGGTCACCATCTCAGCCGACAAGTCCATCAGCACCGCCTACCTGCAGTGGAGCMRSCTGAAGGCCTCGGACACCGCCATGTATTACTGTGCGAGACGGGGCCCGTACCGCTATGGTATTACTACTACTACTACGGTATGGACGTCTGGGGCCAAGGGACCACGGTCACCGTCTCCTCAGGTAAGATCTTTCTAG

1691 VH6

TTTAGCAAGATTGGATCAGGCAGTCCCCATCGAGAGGCGCTTGAGTGGCTGGGAAGGMATACTACAGGTCCRAGTKRWATAATGATTATGCAGTATCTGTGAAAAGTCGAATAACCATCAACCCAGACACATCCAAGAACCAGTTCTCCCTGCAGCTGAACTCTGTGACTCCCGAGGACACGGCTGTGTATTACTGTGCAAGAGGTCTGGAACATTATTACTACTACTACTACGGTATGGACGTCTGGGGCCAAGGGACCACGGTCACCGTCTCCTCAGGTAAGATCTTTCTAG

1743 VH6

TTTAGCAAGATTGGATCAGGCAGTCCCCATCGAGAGGCCTTGAGTGGCTGGGAAGGACATACTACAGGTCCAAGTGGTATAATGATTATGCAGTATCTGTGAAAAGTCGAATAACCATCAACCCAGACACATCCAAGAACCAGTTCTCCCTGCAG

Page 94: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

94

CTGAACTCTGTGACTCCCGAGGACACGGCTGTGTATGGGTAGGTATAGCAGCAGGTCCGCGCGTCTTGGACTTGACTACTGGGGCCAGGGAACCCTGGTCACCGTCTCCTCAGGTAAGATCTTTCTAG

1816 VH6

TTTAGCAAGATTGGATCAGGCAGTCCCCATCGAGAGGCCTTGAGTGGCTGGGAAGGACATACTACAGGTCCAAGTGGTATAATGATTATGCAGTATCTGTGAAAAGTCGAATAACCATCAACCCAGACACATCCAAGAACCAGTTCTCCCTGCAGCTGAACTCTGTGACTCCCGAGGACACGGCTGTGTATTACTGTGCAAGTCCCAGGCCCCAACGTATTACGATTTTTGGAGTGGCCCCCAAGAGCGTTCGACCCCTGGGGCCAGGGAACCCTGGTCACCGTCTCCTCAGGTAAGATCTTTCTAG

1620 VH7

TTTAGCAAGATTTGGGTGCGACAGGCCCCTGGACAAGGGCTTGAGTGGATGGGATGGATCAACACCAACACTGGGAACCCAACGTATGCCCAGGSCTTCACAGGACGGTTTGTCTTCTCCTTGGACACCTCTGTCAGCACGGCATATCTGCAGATCTGCAGCCTAAAGGCKGAGGACACTGCCGTGTATTACTGTGAAAAGATCCTTAAAGAGTAGAGCGGCATTACTATGGTTCGGGGAGTTGACTACTGGGGCCAGGGAACCCTGGTCACCGTCTCCTCAGGTAAGATCTTTCTAG

2104 VH7

TTTAGCAAGATTTGGGTGCGACAGGCCCTGGACAAGGGCTTGAGTGGATGGGATGGATCAACACCAACACTGGGACCAACGTATGCCAGGGCTCACAGGACGGTTTGTCTCTCCTTGGACACCTCTGTCAGCACGGCATATCTGCAGATCMRSARGCTAAAGGCTGRGRCAMTGCCGTGTATTACTGTGCGAGMGCCCTCCCCTCGAGGGGTCTTTTTTGTGCTTTTGATATCTGGGGCCAAGGGACAATGGTCACCGTCTCCTCAGGTAAGATCTTTCTAG

2130 VH7

TTTAGCAAGATTKGGGTGCGACAGGCCCCTGGACAAGGGCTTGAGTGGATGGGATGGATCAACMCCAACACTGGGAACCCAMCGTATSCCCAGGSCTTCACAGGACGGTTTGTCTTCTCCTTGGACACCTCTGTCAGCACGGCATATCTGCAGATCAGMACCTAAAGGCTGAGGAATGCCGTGTATTACTGTGCGAGAGAGGGCGGTGGTCCCCCCTGGCGGGCGTCCATTGACTACTGGGGCCAGGGAACCCTGGTCACCGTCTCCTCAGGTAAGATCTTTCTAG

Page 95: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

95

Anexo 2 - Termo de Consentimento GBTLI LLA-2009, Baixo Risco

VI.1. Termo de Consentimento Para Participação no Estudo GBTLI LLA-2009 de tratamento da Leucemia

Linfóide Aguda B-derivada Baixo Risco de Recaída

Seu(sua) filho(a) tem um câncer no sangue chamado leucemia linfóide aguda. Os linfoblastos são as

células brancas muito jovens, que se proliferam pelo câncer. Pelo fato destas células em seu(sua) filho(a)

apresentarem no exame de imunofenotipagem a B-derivação, a leucemia será assim denominada. Pelo fato da

contagem dos glóbulos brancos do seu(sua) filho(a) estar abaixo de 50000/mm3 quando foi descoberta a leucemia,

ou pelo fato da sua criança ter idade entre 1 a 9 anos ou pelo fato de não apresentar achados citogenéticos de mau

prognóstico (cromossomo filadélfia positivo, rearranjo do gene MLL ou hipodiploidia), a leucemia dele é chamada

de “Baixo Risco de Recaída”. Para continuar neste grupo, os doentes necessitam apresentar boa resposta à terapia

inicial, apresentando menos de 1000 blastos/mm3 no exame de sangue do dia 8 e medula óssea classificada como

em remissão (menos de 5% de blastos) e com Doença Residual Mínima negativa no dia 15 do tratamento e

adicionalmente, deverão obrigatoriamente entrar em remissão no 35º dia do tratamento, apresentando a remissão

medular e a pesquisa da Doença Residual negativa. Incluiremos também neste grupo, os doentes de baixo risco,

mas com resposta parcial ao tratamento inicial, que mostram menos de 25% de blastos leucêmicos na medula

óssea ou Doença Residual Mínima positiva (igual ou acima de 0,01% e inferior a 10%) no dia 15. Estes pacientes

serão classificados como de Baixo Risco Intermediário (Subgrupo BRI) à terapia. Aqueles que apresentarem

mais de 1000 blastos/mm3 no sangue periférico do dia 8 e/ou mais que 25% de blastos leucêmicos na medula

óssea ou Doença Residual Mínima positiva no dia 15 da terapia, serão transferidos para o Grupo de Alto Risco –

Respondedor Lento (RL), assim como, aqueles que não alcançarem a remissão no dia 35, com positividade de

Doença Residual Mínima (igual ou acima de 10-3)

Os pacientes com excelente e resposta no D8 (inferior a 1000 blastos/mm³ no sangue periférico) e

medula óssea com menos de 5% de blastos e com Doença Residual Mínima negativa (inferior a 0,01%) no D15 e,

adicionalmente, medula óssea com menos de 5% de blastos com Doença Residual Mínima negativa (inferior a 10-

3) no D35 serão alocados como Baixo Risco Verdadeiro (Subgrupo BRV), com o objetivo da redução da dose

de Daunoblastina, de Ciclofosfamida, em virtude dos efeitos secundários destas drogas.

Estamos nos dirigindo a você(s) para solicitar autorização de que seu (sua) filho (a) participe de um

estudo de pesquisa para o tratamento de leucemia linfóide aguda de baixo risco de recaída. Este estudo foi

delineado pelo Grupo Brasileiro de Tratamento da Leucemia da Infância (GBTLI) vinculado à Sociedade

Brasileira de Oncologia Pediátrica. Neste estudo cooperativo participam vários hospitais no Brasil que cuidam de

crianças com câncer. Há mais de 20 anos, esta tem sido uma prática médica em Centros especializados para tratar

crianças com leucemia, com protocolos terapêuticos de abrangência nacional, como este estudo, objetivando

introduzir os recentes avanços diagnósticos e terapêuticos alcançados internacionalmente. O planejamento básico

do tratamento da leucemia linfóide aguda de baixo risco de recaída, está alicerçado nos bons resultados do estudo

anterior (GBTLI LLA-99) onde a sobrevida livre de recidiva em 7 anos é da ordem de 76,3% para os doentes de

melhor prognóstico que são classificados no grupo de baixo risco de recaída. Resultados semelhantes são relatados

na literatura internacional.

São três as finalidades terapêuticas do estudo atual para a leucemia linfóide aguda B-derivada de Baixo Risco:

1) Identificar precocemente as crianças que apresentam boa resposta à terapia inicial das duas

primeiras semanas, pacientes do Subgrupo BRV, com objetivo de reduzir a dose do

antracíclico (Daunoblastina) e retirada de Ciclofosfamida, em virtude dos efeitos secundários.

2) Identificar precocemente aquelas crianças que não respondem satisfatoriamente na 1ª ou na 2ª

semana de tratamento, transferindo-as para o Grupo de Alto Risco.

3) Tentar diminuir as recidivas, fazendo um esquema da quimioterapia da manutenção, com

doses mais elevadas do Metotrexate, empregado de maneira intermitente com a

Mercaptopurina. Mediante alocação casual, para efeitos de comparação, teremos outro grupo

tratado de maneira já utilizada no estudo anterior GBTLI LLA-99, onde o methotrexate e a

mercaptopurina são administrados de maneira intermitente, mas com dose fixa do

Methotrexate.

A única maneira de descobrir se um tratamento é melhor do que outro, é compará-los diretamente,

dando para uns doentes um esquema (GRUPO 1) e, para outros o esquema de estudo (GRUPO 2). Como não

sabemos qual dos dois esquemas é o melhor, a alocação será casual, realizada centralmente por meio eletrônico,

nos dois grupos de estudo, garantindo-se que cada grupo seja muito semelhante ao outro.

Page 96: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

96

Se você(s) concordar(em) que seu(sua) filho(a) participe do estudo, ele(a) fará uma fase inicial da

Prefase, seguida da Indução (4 semanas), fase de Consolidação (4 semanas), fase de Intensificação (8 semanas),

fase de Consolidação Tardia (8 semanas) e a fase final da Manutenção (1 ano e meio). Antes do início da fase de

Manutenção haverá a alocação casual para o GRUPO 1 (terapia com dose fixa do MTX/6-MP administrados em

regime intermitente a cada 3 semanas) ou para o GRUPO 2 (terapia do estudo com doses escalonadas do

Methotrexate a cada 3 semanas acrescido do 6MP). A alocação será feita eletronicamente pela Central de

Processamentos de Dados do GBTLI.

Após 7 dias da Prefase e após uma semana da terapia da Indução, se seu(sua) filho(a) tiver no

resultado do exame de sangue periférico igual ou acima de 1000 /mm3 blastos no dia 8 ou a medula óssea com

mais de 25% de blastos no Dia 15 e Doença Residual Mínima (DRM) positiva, ele(ela) não continuará no plano

terapêutico proposto, sendo transferido(a) para o Grupo de Alto Risco de recidiva. Isso significa que ele(ela)

receberá um regime terapêutico mais intensivo. O(a) médico(a) da sua criança lhe(s) explicará o novo tratamento.

Por outro lado, se seu(sua) filho(a) apresentar excelente resposta nas três primeiras avaliaçõe do dia 8, no dia 15 e

dia 35, serão classicados como de

Baixo Risco Verdadeiro (Subgrupo BRV) sendo preconizada redução do esquema de quimioterapia.

Se alterações cromossômicas das células leucêmicas da sua criança identificadas ao diagnóstico

forem consideradas desfavoráveis, ou se a medula óssea obtida no dia 35 da indução mostrar mais de 5% de blastos

leucêmicos ou Doença Residual Mínima positiva, ele(ela) receberá também, uma quimioterapia mais agressiva e,

será considerada a possibilidade da realização do transplante de medula óssea. É esperado que cerca de 10% dos

pacientes com LLA inicialmente classificados como de baixo risco, necessitarão de um tratamento mais intensivo

(Grupo de Alto Risco).

Riscos e desconfortos

É importante que você(s) entenda(m) os riscos, possíveis problemas, e desconfortos que fazem parte

deste plano terapêutico. Além de destruir as células malignas, a quimioterapia pode danificar os tecidos normais e

causar efeitos colaterais. Entretanto, há muitos anos estas drogas têm sido usadas em crianças. Cuidadosamente

ajustando as quantidades e o tempo de uso das medicações, podem-se evitar problemas sérios. A maioria destes

efeitos colaterais, se ocorrerem, cessam quando a medicação é suspensa ou, se menor quantidade for administrada

na próxima vez. Ocasionalmente, um efeito colateral pode continuar, podendo causar complicações mais sérias. É

por isso que exames que avaliam a função renal e hepática, assim como hemogramas, são freqüentemente feitos.

Quanto aos possíveis efeitos colaterais de cada medicação, o(a) médico(a) do seu(sua) filho(a) lhe(s) informará a

cada etapa do tratamento.

Estudos Investigacionais

Outra finalidade deste estudo é quantificar pequenos números de células leucêmicas que possam ter

ficado na medula óssea do seu(sua) filho(a) durante o tratamento. Chamamos isto de Doença Residual Mínima.

Realizaremos este exame através de 3 técnicas (citometria de fluxo, Polimerização em cadeia em tempo real e com

técnica simplificada). O objetivo é avaliar a sensibilidade e exatidão de cada técnica. As amostras colhidas de

aspirados da medula óssea serão enviadas aos Laboratórios de Referência, para estes estudos especializados. Estes

exames serão realizados sem custos financeiros a você(s).

Benefícios

Não há nenhum benefício direto para a sua criança participar do estudo. A chance de cura para

crianças tratadas com quaisquer desses regimes é esperada de ser no mínimo de 75%. O regime experimental

(GRUPO 2) poderá ou não melhorar a chance de cura.

Tratamentos Alternativos

Caso você(s) decida(m) não autorizar a participação da sua criança neste estudo, a terapia padrão

será oferecida de acordo com o protocolo anterior GBTLI LLA-99, com o uso intermitente do par

Mercaptopurina/Methotrexate, com dose fixa do Methotrexate. Caso desejem retirar seu consentimento, em

qualquer fase da pesquisa, esta poderá ser feita sem penalização alguma e sem prejuízo algum no cuidado do

seu(sua) filho(a).

Confidencialidade

A identidade da sua criança não será revelada em publicações. Os registros do prontuário também

são confidenciais e, sob a responsabilidade do Hospital.

Page 97: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

97

A Central de Processamento de Dados do GBTLI tem o direito de consulta/revisão de todos os dados

do prontuário, em qualquer necessidade.

Participação Voluntária

A participação da sua criança neste estudo é voluntária. A recusa na participação não leva a

nenhum prejuízo para sua criança, assim como, não comprometerá o cuidado médico com a mesma.

Aproximadamente 800 crianças serão tratadas neste estudo.

Esclarecimento de dúvidas

A qualquer momento, em caso de dúvidas, solicite(m) ao médico(a) do seu(sua) filho(a) os

esclarecimentos necessários. Você(s) poderá(ão) também contatar o(s) Coordenador(es) do Estudo.

Nome: Dra. Maria Lúcia Martino Lee

RG:26864157-2 / CPF: 355809090-04

Endereço: Rua Botucatu, 743 – Vl. Clementino

CEP: 04023-062 / São Paulo – SP

Telefone(s): (11) 5080 8475

Fax: (11) 5080 8480

e-mail: [email protected] / [email protected]

Nome: Dra. Silvia Regina Brandalise

RG: 2.837.167 / CPF: 052306328-87

Endereço: Rua Dr. Gabriel Porto, 1270 - Barão Geraldo

CEP: 13083-210 / Campinas - SP

Telefone(s): (19) 3787 5016

Fax: (19) 3289 3571

e-mail: [email protected]

Autorização

Eu li este documento a respeito do estudo GBTLI LLA-2009 ou ele foi lido para mim. Eu fui

informado sobre os riscos e benefícios. Decidi que meu (minha) filho (a) participe desta pesquisa. Eu sei, também,

que tenho a liberdade de recusar o tratamento proposto e, assim mesmo, minha criança continuará a receber o

tratamento médico usual. Eu receberei uma cópia deste consentimento.

Eu dei permissão para minha criança _________________________________________

________________________________________________fazer o protocolo de tratamento GBTLI LLA-2009

para

Baixo Risco em _______/________/__________

______/_____/_____

Assin. Pai paciente Data

Page 98: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

98

______/_____/_____

Assin. Mãe paciente Data

______/_____/_____

Testemunha Data

Eu expliquei aos familiares/criança este estudo e, considero que eles tiveram suficiente informação

com respeito aos riscos e benefícios, fazendo uma decisão embasada. Eu informarei aos mesmos, no momento

oportuno, quaisquer modificações no procedimento.

______/_____/_____

Assin. Médico Data

Page 99: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

99

Anexo 3 - Termo de Consentimento GBTLI LLA-2009, Alto Risco

VI.2. Termo de Consentimento Para Participação no Estudo GBTLI LLA-2009 de tratamento de leucemia

linfóide aguda B-derivada de Alto Risco de Recaída

Seu(sua) filho(a) tem um câncer do sangue chamado leucemia linfóide aguda. Os linfoblastos são

as células brancas muito jovens, que se proliferam pelo câncer. Pelo fato dessas células em seu(sua) filho(a)

apresentarem no exame de imunofenotipagem a B-derivação a leucemia será assim denominada. Pelo fato da

contagem dos glóbulos brancos do seu(sua) filho(a) estar muito alta acima de 50000/mm3 quando foi descoberta a

leucemia, ou pelo fato da sua criança ter idade de risco (maior de 9 anos) ou pelo fato de apresentar achados

citogenéticos de mau prognóstico (cromossomo filadélfia positivo ou rearranjo do gene MLL ou hipodiploidia), a

leucemia dela é chamada de “Alto Risco de Recaída”. Incluiremos neste grupo também, os doentes de Baixo Risco,

mas maus respondedores ao tratamento inicial, que mostrem igual ou acima de 1000 blastos/mm3 no exame de

sangue do dia 8 e/ou medula óssea com mais de 25% de blastos no dia 15 e/ou com Doença Residual Mínima igual

ou acima de 10% no dia 15. Adicionalmente, serão incluídos neste grupo aqueles pacientes que não alcançarem a

remissão medular no 35º dia do tratamento e com a Doença Residual positiva (igual ou acima de 10-3).

Estamos nos dirigindo a você(s) para solicitar autorização de que seu(sua) filho(a) participe de um

estudo de pesquisa para o tratamento de leucemia linfóide aguda de Alto Risco. Este estudo foi delineado pelo

Grupo Brasileiro de Tratamento da Leucemia da Infância (GBTLI) vinculado à Sociedade Brasileira de Oncologia

Pediátrica. Neste estudo cooperativo participam vários hospitais no Brasil que cuidam de crianças com câncer. Há

mais 20 anos, esta tem sido uma prática médica em Centros especializados para tratar crianças com leucemia, com

protocolos terapêuticos de abrangência nacional, com este estudo, objetivando introduzir os recentes avanços

diagnósticos e terapêuticos alcançados internacionalmente. Os modernos protocolos de tratamento para as

leucemias de alto risco, proporcionam taxas de sobrevida livre de doença em 5 anos, da ordem de 50-60%. Os

resultados nacionais do estudo GBTLI LLA-99 mostram taxas de sobrevida em 7 anos de 59,8%. O problema

nestas crianças de alto risco de recidiva é que em cerca de 80% delas, todos os sinais da leucemia desaparecem

por certo período de tempo, entretanto, as células leucêmicas podem voltar e a maioria destes doentes recidivados

são refratários a outros tratamentos mais intensivos.

O estudo atual GBTLI LLA-2009 procura melhorar os índices de cura, intensificando precocemente

a terapia com a introdução da Ciclofosfamida e duas doses de Daunoblastina, já na 3ª semana do tratamento (fase

da indução). Desejamos saber se a introdução da Ciclofosfamida proporcionará maior taxa de remissão da doença

no dia 35 da terapia, quando comparamos com o tratamento previamente utilizado no protocolo GBTLI LLA-99.

São quatro as finalidades terapêuticas do estudo atual para a Leucemia Linfóide Aguda de alto risco:

1) Identificar precocemente aquelas crianças que apesar de classificadas inicialmente no grupo

de Alto Risco, apresentam boa resposta à terapia inicial (menos de 1000 blastos/mm3 no exame

de sangue no dia 8 e medula óssea com menos de 25% de blastos e Doença Residual Mínima

inferior a 10% no dia 15 e, adicionalmente, que alcancem a remissão medular no dia 35 da

terapia com Doença Residual negativa (inferior a 10-3), com o objetivo de redução da dose de

Daunoblastina, da Ciclofosfamida e do Methotrexate, em virtude dos efeitos secundários

destas drogas.

2) Tentar diminuir as taxas de recidiva naqueles doentes já classificados de alto risco ao

diagnóstico

(igual ou acima de 50000 glóbulos brancos/mm3 de início ou idade acima de 9 anos ou

acometimento leucêmico em Sistema Nervoso Central) ou aqueles maus respondedores à

terapia inicial da indução (igual ou acima de 1000 blastos/mm3 no dia 8 e/ou medula óssea

com menos de 25% de blastos no dia 15 e/ou DRM inferior a 10% no dia 15), acrescentando-

se duas doses da Ciclofosfamida na 3ª semana da indução e duas doses adicionais de

Daunoblastina.

3) Tentar diminuir as recidivas, fazendo um esquema da quimioterapia da manutenção, com

doses mais elevadas do Metotrexato, empregado de maneira intermitente com a

Mercaptopurina. Mediante alocação casual, para efeitos de comparação, teremos outro grupo

tratado de maneira já utilizada no estudo anterior LLA-99, onde o Methotrexate e a

Mercaptopurina são administrados de maneira intermitente, mas com dose fixa do

Methotrexate.

Page 100: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

100

4) Em virtude da maior taxa de recidiva em Sistema Nervoso Central no estudo GBTLI LLA-

99, reintroduzir a radioterapia profilática para aqueles pacientes que apresentarem mais de

100000 leucócitos/mm3 ao diagnóstico e/ou que forem respondedores lentos à terapia inicial

(2 primeiras semanas). Estes doentes de alto risco têm maior chance de recidivas leucêmicas

em Sistema Nervoso Central, fato que reduz as chances de cura.

A única maneira de descobrir se um esquema de tratamento é melhor do que o outro, é compará-los

diretamente, dando para uns doentes um esquema (GRUPO 1) e, para outros o esquema do estudo (GRUPO 2).

Como não sabemos qual dos dois esquemas é o melhor, a alocação será realizada centralmente por meio eletrônico,

nos dois grupos de estudo, garantindo-se que cada grupo seja muito semelhante ao outro.

Se você(s) concordar(em) que seu(sua) filho(a) participe do estudo, ele(a) fará uma fase inicial

Prefase, seguida da Indução (4 semanas), uma fase de Consolidação de 8 semanas (Grupo dos Respondedores

Rápidos) ou com 3 blocos intensivos de quimioterapia para os pacientes Respondedores Lentos (Subgrupo RL)

à terapia inicial. Prossegue-se com uma fase de Intensificação (8 semanas), uma Interfase (8 semanas), uma fase

de Consolidação Tardia (8 semanas) e a terapia de Manutenção (1 ano e meio). Antes do início da fase de

Manutenção, haverá a alocação casual para o GRUPO1 (terapia com dose fixa do Methotrexate/Mercaptopurina

administrados em regime intermitente a cada 3 semanas) ou para o GRUPO 2 (terapia do estudo, com doses

escalonadas do Methotrexate a cada 3 semanas acrescidas da Mercaptopurina). A alocação será feita

eletronicamente pela Central de Processamento de Dados.

No caso do(a) seu(sua) filho(a) ser inicialmente classificado de baixo risco mas, posteriormente foi

classificado como mau respondedor ao tratamento da indução (Dia 8 ou Dia 15), ele(a) também será alocado(a)

casualmente, para o GRUPO 1 ou GRUPO 2. Se, eventualmente, sua criança apresentar alterações cromossômicas

consideradas desfavoráveis nas células leucêmicas iniciais e, adicionalmente for Respondedor Lento (Subgrupo

RL) nos dias 8 e/ou 15 e/ou 35 da indução, o transplante de medula óssea será cogitado como alternativa

terapêutica.

Com relação à realização da radioterapia craniana, como tratamento dirigido ao Sistema Nervoso

Central, ela será preconizada para os pacientes com mais de 100000 glóbulos brancos /mm3 ao diagnóstico e maus

respondedores à terapia. Estes, felizmente, correspondem à minoria dos pacientes. A comparação das taxas de

recidiva em Sistema Nervoso Central será feita com controles históricos do grupo de alto risco do protocolo

GBTLI- LLA-93, onde foi realizada a irradiação craniana para todos os pacientes de alto risco, além da comparação

com o estudo GBTLI LLA-99 para o Grupo de Alto Risco onde não se recomendou esta modalidade de terapia,

em virtude de publicações de alguns estudos internacionais.

Riscos e desconfortos

A introdução de mais um medicamento, a Ciclofosfamida no esquema da indução pode aumentar as

toxicidades já observadas nesta fase. As principais complicações vinculadas a Ciclofosfamida são as renais,

gastrointestinais (mucosites severas, enterites), hepáticas (icterícia) e fertilidade.

É importante que você(s) entenda(m) os riscos, possíveis problemas, e desconfortos que fazem parte

deste plano terapêutico. Além de destruir as células malignas, a quimioterapia pode danificar os tecidos normais e

causar efeitos colaterais. Entretanto, estas drogas têm sido usadas em crianças, há muitos anos. Cuidadosamente

ajustando as quantidades e o tempo de uso das medicações, podem-se evitar problemas sérios. A maioria destes

efeitos colaterais, se ocorrerem, cessa quando a medicação é suspensa ou, se menor quantidade for administrada

na próxima vez. Ocasionalmente, um efeito colateral pode continuar podendo causar complicações mais sérias. É

por isso que exames que avaliam a função renal e hepática, assim como hemogramas, são freqüentemente feitos.

Quanto aos possíveis efeitos colaterais de cada medicação, o(a) médico(a) do seu(sua) filho(a) lhe(s) informará a

cada etapa do tratamento.

Estudos Investigacionais

Outra finalidade deste estudo é quantificar pequenos números de células leucêmicas que possam ter

ficado na medula óssea do seu(sua) filho(a) durante o tratamento. Chamamos isto de Doença Residual Mínima.

Realizaremos este exame através de 3 técnicas (Citometria de fluxo, Polimerização em cadeia em tempo real com

técnica simplificada). O objetivo é avaliar a sensibilidade e a exatidão de cada técnica. As amostras colhidas de

aspirados da Medula Óssea serão enviadas aos Laboratórios de Referência, para estes estudos especializados. Estes

exames serão realizados sem custo financeiro a você(s).

Benefícios

Não há nenhum benefício direto para a sua criança participar do estudo. A chance de cura para

crianças tratadas com quaisquer desses regimes é esperada de ser no mínimo de 50%. O regime experimental

(GRUPO 2) poderá ou não melhorar a chance de cura.

Page 101: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

101

Tratamentos Alternativos

Caso você(s) decida(m) não autorizar a participação da sua criança neste estudo, a terapia padrão

será oferecida de acordo com o protocolo anterior GBTLI LLA-99, com o uso intermitente do par

Mercaptopurina/Methotrexate com dose fixa do Methotrexate. Caso desejem retirar seu consentimento, em

qualquer fase da pesquisa, está poderá ser feita sem penalização alguma e sem prejuízo no cuidado do seu(sua)

filho(a).

Confidencialidade

A identidade da sua criança não será revelada em publicações. Os registros do prontuário também

são confidenciais e, sob a responsabilidade do Hospital.

A Central de Processamento de Dados do GBTLI tem o direito de consulta/revisão de todos os dados

do prontuário, em qualquer necessidade.

Participação Voluntária

A participação da sua criança neste estudo é voluntária. A recusa na participação não leva a nenhum

prejuízo para sua criança, assim como, não comprometerá o cuidado médico com a mesma. Aproximadamente

880 crianças serão tratadas neste estudo.

Esclarecimento de dúvidas

A qualquer momento, em caso de dúvidas, solicite (m) ao médico (a) do seu (sua) filho (a) os

esclarecimentos necessários. Você poderá também contactar o(s) Coordenador (es) do Estudo.

Nome: Dra. Vitória Régia Pereira Pinheiro

RG: 1077971 / CPF: 175171335-00

Rua Dr. Gabriel Porto, 1270.

CEP: 13083-210 - Barão Geraldo

Campinas - SP

Telefone (s): (19) 3787 5016

Fax: (19) 3289 3571

e-mail: [email protected]

Autorização

Eu li este documento a respeito do estudo GBTLI LLA-2009 para Alto Risco de Recidiva ou ele foi

lido para mim. Eu fui informado sobre os riscos e benefícios. Decidi que meu (minha) filho (a) participe desta

pesquisa. Eu sei, também, que tenho a liberdade de recusar o tratamento proposto e, assim mesmo, minha criança

continuará a receber o tratamento médico usual. Eu receberei uma cópia deste consentimento.

Eu dei permissão para minha criança

_______________________________________________________

________________________________________________fazer o protocolo de tratamento GBTLI LLA-2009

para Alto

Risco em _______/________/__________

______/_____/_____

Assin. Pai paciente Data

______/_____/_____

Assin. Mãe paciente Data

______/_____/_____

Testemunha Data

Nome: Dra. Silvia Regina Brandalise RG: 2.837.167 / CPF: 052306328-87 Endereço: Rua Dr. Gabriel Porto, 1270. CEP: 13083-210 - Barão Geraldo Campinas - SP Telefone (s): (19) 3787 5016 Fax: (19) 3289 3571 e-mail: [email protected]

Page 102: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

102

Eu expliquei aos familiares/criança este estudo e, considero que eles tiveram suficiente informação

com respeito aos riscos e benefícios, fazendo uma decisão embasada. Eu informarei aos mesmos, no momento

oportuno, quaisquer modificações no procedimento.

______/_____/_____

Assin. Médico Data

Page 103: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

103

Anexo 4 - Termo de Consentimento URB/Boldrini

Page 104: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

104

Page 105: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

105

Anexo 5 - Parecer Consubstanciado CEP

CENTRO INFANTIL DE INVESTIGAÇÕES HEMATOLÓGICAS DR.

PARECER CONSUBSTANCIADO DO CEP

DADOS DO PROJETO DE PESQUISA

Título da Pesquisa:

Seqüenciamento de alto desempenho para quantificação da Doença Residual Mínima em Leucemia Linfóide

Aguda Pesquisador:

Jose Andres Yunes Área Temática:

Genética Humana:

(Trata-se de pesquisa envolvendo Genética Humana que não necessita de análise ética por parte da CONEP;);

Versão:

1 CAAE:

57280616.4.0000.5376 Instituição Proponente:

Centro Infantil de Investigações Hematológicas Dr.Domingos A Boldrini Patrocinador Principal: Ministério

da Saúde DADOS DO PARECER

Número do Parecer: 1.622.112

Apresentação do Projeto: O projeto de pesquisa se dispõe a estabelecer um novo método de detecção de

Doença Residual Mínima, isto é, detectar por meio de técnicas de Biologia Molecular, pequenas quantidades de

células malignas residuais que podem ser detectadas no organismo do paciente em tratamento quimioterápico. A

detecção da DRM é extremamente importante, pois permite saber como é que o paciente está respondendo ao

tratamento, podendo desta maneira determinar uma outra abordagem terapêutica, passando assim a ter melhores

chances de sucesso no tratamento. Por outro lado, os pacientes que apresentam excelente resposta terapêutica nas

primeiras semanas da terapia, podem passam a receber uma quimioterapia menos intensiva, sem comprometer os

índices de cura e com diminuição dos efeitos colaterais da quimioterapia. O exame padrão de análise da DRM,

implantado desde 2010 pelo Centro Boldrini, demanda muita experiência técnica em biologia molecular, é

demorado e oneroso, razões que tem dificultado sua implantação em outras instituições ou centralização em

abrangência nacional. Apenas 2% (aproximadamente 60) das crianças diagnosticadas anualmente com leucemia

linfóide aguda no Brasil recebem tratamento ajustado pela DRM. Este projeto PRONON pretende padronizar um

método novo de detecção da Endereço: Bairro: CEP:

13.083-210

Telefone:

(19)3787-5001 E-mail: [email protected]

Rua Dr. Gabriel Porto, 1270 Cidade Universitária Barão Geraldo UF: SP Município: CAMPINAS

Fax: (19)3289-3571 Página 01 de 03

CENTRO INFANTIL DE INVESTIGAÇÕES HEMATOLÓGICAS DR. Continuação do Parecer: 1.622.112

DRM, baseado nos últimos equipamentos e técnicas da genômica, o assim chamado sequenciamento de DNA de

última geração” ou “Next Generation Sequencing (NGS)”. Este novo método de análise da DRM tem vantagens

em termos de sensibilidade, custo, escalabilidade e possibilidade de automação. A expectativa é implementar um

método que permita oferecer este valioso exame laboratorial a todas as crianças brasileiras acometidas pela

leucemia.

Objetivo da Pesquisa: Padronizar a análise da Doença Residual Mínima por sequenciamento massivo,

comparando os resultados obtidos pelo método de PCR quantitativo, visando aumento de sensibilidade de

detecção e diminuição de custo deste exame.

Avaliação dos Riscos e Benefícios: Não há risco para os pacientes, uma vez que o material que será utilizado na

pesquisa será colido para os exames de rotina. Os benefícios possíveis são: diminuir o custo e o tempo de

resposta do exame (6 dias versus 23 dias para DRM por RQ-PCR).A expectativa é de que a quantificação da

DRM por NGS permitirá oferecer o exame para todas as crianças com LLA do Brasil.

Comentários e Considerações sobre a Pesquisa: O projeto se propõe a estabelecer uma metodologia inovadora

Page 106: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

106

que poderá ser de altíssima importância para o país, uma vez que poderá atender todos os pacientes pediátricos

com LLA, o que hoje não é possível.

Considerações sobre os Termos de apresentação obrigatória: O projeto apresenta o TCLE referente a outro

projeto de pesquisa que fará a coleta das amostras que serão utilizada também neste projeto e pede dispensa de

apresentar TCLE.

Conclusões ou Pendências e Lista de Inadequações: Acredito que seja cabível a dispensa do TCLE para este

projeto específico.

Considerações Finais a critério do CEP: Projeto Aprovado, apresentar relatório parcial em 6 meses.

Este parecer foi elaborado baseado nos documentos abaixo relacionados:

Tipo Documento Arquivo Postagem Autor Situação Informações Básicas do Projeto

PB_INFORMAÇÕES_BÁSICAS_DO_P ROJETO_226681.pdf

20/06/2016 16:15:21

Aceito Endereço:

Rua Dr. Gabriel Porto, 1270 Cidade Universitária Bairro: Barão Geraldo

CEP:

13.083-210 UF: SP Município: CAMPINAS Telefone:

(19)3787-5001 Fax: (19)3289-3571

E-mail: [email protected] Página 02 de 03

CENTRO INFANTIL DE INVESTIGAÇÕES HEMATOLÓGICAS DR. Continuação do Parecer: 1.622.112

Folha de Rosto folha_de_Rosto_DRMseq_assinado.pdf 20/06/2016

16:12:35

CAMPINAS, 05 de Julho de 2016

Assinado por: Maristela Amaral Palazzi (Coordenador)

Jose Andres Yunes Aceito

Outros Parecer_2_Fapesp_proj_DRM_por_NG

S.pdf

20/06/2016 11:35:21

Jose Andres Yunes Aceito

Outros Parecer_1_Fapesp_proj_DRM_por_NG

S.pdf

20/06/2016 11:34:57

Jose Andres Yunes Aceito

Declaração do Patrocinador

Termo_Acordo_MinisterioSaude_e_Bold rini_proj_PRONON_DRM_NGSseq.pdf

20/06/2016 11:29:39

Jose Andres Yunes Aceito

Declaração do Patrocinador

Aprova_Readequacao_MinisterioSaude _proj_PRONON_DRM_NGSseq.pdf

20/06/2016 11:28:58

Jose Andres Yunes Aceito

TCLE / Termos de Assentimento / Justificativa de Ausência

TCLEs_protocolo_de_tratamento_da_LL A_GBTLI2009.pdf

20/06/2016 11:28:01

Jose Andres Yunes Aceito

Brochura Pesquisa Proj_PRONON_DRMseq_260814_resu

mo_e_sinopse.docx

20/06/2016 11:26:58

Jose Andres Yunes Aceito

Projeto Detalhado / Brochura Investigador

Proj_PRONON_DRMseq_140415_com_ indice_FINAL_p_PlataformaBrasil.docx

20/06/2016 11:26:07

Page 107: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

107

Jose Andres Yunes Aceito

Situação do Parecer: Aprovado

Necessita Apreciação da CONEP: Não Endereço:

Rua Dr. Gabriel Porto, 1270 Cidade Universitária Bairro: Barão Geraldo

CEP:

13.083-210 UF: SP Município: CAMPINAS Telefone:

(19)3787-5001 Fax: (19)3289-3571

E-mail: [email protected] Página 03 de 03

Page 108: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

108

Page 109: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

109

Page 110: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

110

Page 111: UNIVERSIDADE ESTADUAL DE CAMPINAS INSTITUTO DE BIOLOGIArepositorio.unicamp.br/bitstream/REPOSIP/335127/1/Giusti... · 2019-10-01 · VERSÃO FINAL DA DISSERTAÇÃO DEFENDIDA PELO

111

Anexo 6 - Declaração de Direitos Autorais