40
Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna Struck Rossen, Rebecca Bolt Ettlinger og Mikkel Schou Nielsen 6. juni 2007 1

Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

  • Upload
    lydiep

  • View
    218

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

Numerisk Analyse af QT-dynamik i Patienter med Blodprop iHjertet

Ninna Struck Rossen, Rebecca Bolt Ettlinger og Mikkel Schou Nielsen

6. juni 2007

1

Page 2: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

Indhold

1 English Summary 4

2 Problemformulering 4

3 Hjertet 5

3.1 Elektrokardiogram . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

4 Datamateriale 6

4.1 Datasættets udseende og form . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

4.2 Tidligere opnåede resultater . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

5 Tidsserieanalyse 9

5.1 Moving Average model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

5.2 Modeller . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

5.2.1 Levende og døde . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

6 Principal Component Analysis 14

6.1 Mønstre i koefficienterne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

6.2 Teori for PCA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

6.3 Resultater fra PCA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

6.4 Summary . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

7 Cox-analyse og ROC-kurver 21

7.1 Overlevelsesanalyse og Cox-modellen . . . . . . . . . . . . . . . . . . . . . . . . 21

7.2 Check af forudsætninger for Cox . . . . . . . . . . . . . . . . . . . . . . . . . . 23

7.3 Anvendelse af Cox på data med kontinuerte baggrundsvariable - hvordan manfinder de parametre, som kan forudsige død . . . . . . . . . . . . . . . . . . . . 23

7.4 ROC-kurver . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

7.5 Univariat Analyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

7.6 Multivariat Analyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

8 Resultaterne for Cox analysen for Koefficient modellerne 26

9 Resultater for Cox Analyse - Principalkomponenter 29

10 Forbedringer af modellen 34

10.1 Opdeling for dag og nat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

2

Page 3: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

11 Begrænsninger/Fremtidige perspektiver 37

12 perspektivering 37

13 Konklusion 38

3

Page 4: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

1 English Summary

This bachelor’s project centers on data about the heartbeat of patients with acute myocardicinfarction. In a previous study, this data has been used to find parameters that predict in-creased risk of dying in the following years in certain patients. The aim of our project is tofind additional parameters that may improve this prediction and shed light on the temporaldynamics of the heartbeat.

We attempt this by looking at the response of the QT-interval (i.e. the heart’s contractiontime) to change in the length of the heartbeat and propose a moving average model thatdetermines the contraction time of the heart from the length of previous heartbeats. As it isnot known how many beats should be included in the model, eight models ranging from fiveto 200 beats, are construction

From the moving average models a number of coefficients are found whose ability to separatehigh-risk patients from low-risk patients is evaluated using Cox Analysis and ROC-curves. Thecoefficients are also used in Principal Component Analysis to construct a set of uncorrelatedparameters that concentrate information on how the patients’ coefficients differ. The predictivevalue of these paramaters is evaluated in the same manner as the coefficients. For the numericalwork, the programmes SAS and R are used.

It is found that both moving average coefficients and principal components may be used toimprove mortality prediction. Certain models with particular strength are idenfied. However,for both types of parameters the physiological background for the improved prediction is hardto explain. The principal components may be more reasonable to use because they incorporategeneral trends in the heartbeat length rather than using a coefficient for a single beat to predictmortality.

The predictive value may be slightly improved by using data for the daytime rather than for24 hours. However, this option needs further exploration. An Autoregressive Moving Averagemodel also tested does not improve prediction.

2 Problemformulering

Projektet tager udgangspunkt i unikke data om hjerterytmen hos patienter, som har haftblodprop i hjertet. Datasættet er tidligere brugt til at undersøge, om bestemte parametre kanbruges til at forusige, om patienterne har forhøjet risiko for at dø kort efter blodproppen.

Målet med vores projekt er at undersøge den tidslige dimension af hjerterytmen og teste nyeparametre relateret til en tidslig model. Håbet er, at disse parametre kan forbedre eksisterendemodeller til at forudsige risiko for død.

De tidslige parametre findes udfra en model af hjerterytmen, som sammenkæder hjertets sam-mentrækningstid (QT-intervallet) med længden af de foregående hjerteslag. For at opstille ogteste parametrene, findes en række koefficienter udfra en Moving Average model, der bestem-mer sammentrækningstiden direkte ud fra de enkelte forudgående hjerteslag. Herefter findesparametre, som vægter koefficienterne alt efter hvor gode de er til at adskille patienterne vedhjælp af Principal Component Analysis, idet det forventes, at der hvor patienterne adskillersig mest, kan forskellen på de, der overlever, og de, der dør, måske også ligge.

4

Page 5: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

Både de nye parametre, kaldet principalkomponenter, og de oprindelige koefficienter under-søges for, om de kan bruges til at skille patienter, som døde kort efter forsøget, fra de, somoverlevede. Undersøgelsen af parametrene foretages med en Cox-analyse. En evaluering af demodeller, som fremkommer af Cox-analysen, foretages vha ROC-kurver, der viser, hvor goden given model er til at sortere døde fra overlevende. De fundne modeller sammenlignes meden, som allerede er kendt.

For at få bedre indblik i dynamikken i Cox-analysen, undersøges en enkelt af modellerneogså ved hjælp af Cluster Analyse, som er et redskab, der også kan bruges til at grupperedata (UDELADES?). Herudover undersøges en række forbedringer/viderebygninger af denoprindelige model, og nogle af usikkerhederne i modellen evalueres.

Til de numeriske beregninger benyttes SAS og R. De rutiner, som er benyttet, vedlægges påCD-ROM.

3 Hjertet

Hjertets rolle i kroppen er at sikre, at blod pumpes rundt i blodårerne, hvorved kroppens cellerkan tilføres næringsstoffer og skille sig af med affaldsstoffer.Hjertet fungerer som en mekanisk pumpe, der skiftevis passivt fyldes med blod og derefterpumper det ud i blodårerne. Pumpningen sker ved, at de hjertemuskelceller, som hjertet eropbygget af trækker sig sammen. Det tidsrum, hvor hjertet fyldes med blod, kaldes diastolenog den del, hvor hjertet aktivt pumper blod ud, kaldes systolen.

Hjertets mekaniske pumpefunktion kræver en stor koordinering af alle hjertemuskelcellernesarbejde, således at hjertet trækker sig sammen på én gang. Denne koordinering sker igennemelektriske signaler, som fordeler sig fra celle til celle.Signalerne opstår som følge af en udveksling af K+ og Na+ ioner over cellemembranen i hjerte-muskelcellerne, som kaldes et aktionspotentiale. Cellerne opretholder en høj koncentration afK+ ioner og en lav koncentration af Na+ ioner i intercellulærvæsken, dvs inde i cellen. Dettebevirker, at væsken inde i cellen bliver negativt ladet i forhold til væsken uden for, og derskabes et negativt hvilepotentiale over cellemembranen.Ved åbning af ionkanaler i cellemembranen, der tillader Na+ ioner at flyde igennem, kan po-tentialet hurtigt stige fra en negativ værdi til en positiv. Efterfølgende åbning af andre kanalergør, at K+ ioner flyder ud af cellen og potentialet falder. Denne udveksling kaldes et aktionspo-tentiale, og i muskelceller giver det signal til at en muskelkontraktion finder sted.I almindelige muskelceller igangsættes aktionspotentialerne oftest af signaler fra nervecellerne,men i hjertemuskelceller er det anderledes. Her starter aktionspotentialet af sig selv med fastetidsintervaller, således at kontraktionerne kan foregå regelmæssigt. I et rask hjerte er der dogen bestemt samling af celler, kaldet sinusknuden, der sætter farten og virker som en pacemaker,idet deres sammentrækninger sker lidt hurtigere end de andre celler. Sinusknudens aktionspo-tentialer fordeler sig til de andre dele af hjertet, og sammentrækningen sker som følge af dettesamtidigt.Beskrivelsen af hjertet i det foregående er ganske overfladisk. Ønskes en mere udførlig gen-nemgang se f.eks. [6].

5

Page 6: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

3.1 Elektrokardiogram

Det, at stort set alle hjertemuskelcellerne udløser aktionspotentiale og kontraherer på sammetid, skaber et varierende elektrisk felt, som kan måles makroskopisk på overfladen af huden. Forat få et så nøjagtigt billede af de elektriske ændringer som muligt, bruger man flere forskelligeelektroder til at måle, således at man kan måle flere komposanter af feltet. Den registreredekurve over spændingsvariationerne benævnes elektrokardiogram (EKG).I Figur ?? er vist et normalt EKG. De forskellige takker i EKG’et benævnes fra P til T, ogrepræsenterer forskellige faser i hjertets kontraktion. Den mest markante tak kaldes R-takken,og intervallet mellem to R-takker angiver hjerteslagets længde.Som nævnt i det foregående afsnit består hjerteslaget af to faser, diastolen og systolen. Dettidsrum hvor hjertet aktivt pumper kan genfindes på EKG’et som intervallet mellem Q- ogT-takken. Ved at have bestemt hjerteslagets længde og længden af systolen, kan man dermedfinde diastolen, og længden af de to faser af hjerteslaget er dermed bestemt.Det bør dog bemærkes, at målinger af EKG kan variere meget fra person til person, og detsåledes ikke altid er muligt at bestemme alle takkerne præcist.

4 Datamateriale

Datamaterialet anvendt i denne rapport stammer fra et forsøg kaldet BEAT LES. Tidligereresultater fra dette datamateriale er publiceret i [2], hvor også informationerne i dette afsniter hentet.Forsøget bestod i at tage EKG-målinger af patienter, der havde fået konstateret en blodpropi hjertet og tilhørende hjerteinfarkt1 og efterfølgende blevet behandlet for denne.Dette blev foretaget i sammenhæng med afprøvning af et nyt lægemiddel. Målingerne i BEATLES blev dog foretaget på screeeningspopulationen for lægemiddelforsøget og før en egentligordinering af lægemidlet. Kun få af de deltagende i BEAT LES indgik senere i afprøvningen aflægemidlet[2]. Det viste sig at det nye lægemiddel ikke forbedrede det lægemiddel der normaltbruges[3]. Dvs. at de patienter der modtog det nye lægemiddel ikke havde nogen ændring idødeligheden i forhold til dem der fik den normale medicin. Det betyder at patientpopula-tionen i datasættet effektivt har fået den samme behandling. Hvis det testede lægemiddelhavde haft en bedre eller dårligere effekt end det der normalt bruges, ville det kunne give ensystematisk fejl på dødeligheden af patienterne.

Målingerne er foretaget ved optagelse af EKG i 24 timer 1 til 3 dage efter operation forhjerteinfarkt. EKG’et blev optaget ved en metode kaldet Holter måling der har en samplingrate på 256 Hz, dvs at der tages en måling hvert 4 ms. I forsøget anvendes ikke det fuldeEKG, men der aflæses ved brug af et computerprogram (Stratascan Holter analysis system),to variable. Der måles hhv længden af QT-intervallet (QT) for hjerteslaget og længden afRR-intervallet (RR) for det foregående hjerteslag. Der blev målt EKG for hver patient over24 timer, de svarede til ca. 100.000 sammenhørende datapunkter (QT,RR) for hver patient.Hvert af disse datasæt har derefter fået fjernet en del uregelmæssigheder, såsom artifakter og

1Et hjerteinfarkt er dødt vævs i hjertet, der er resultatet af en blodprop i hjertet, som stoppede blodtilførslentil netop dette område af hjertet, således at vævet ikke fik ilt, og døde som følge deraf.

6

Page 7: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

ekstrasystoler2, manuelt.

Der blev foretaget målinger på 481 patienter, men af disse blev sorteret 170 patienter sorteretfra. Årsagerne til dette var bl.a. en for hyppig fjernelses af dele af EKG’et, mangelfulde Ttakker gennem hele målingen, for voldsomme spring i QT eller RR3, tilbagetrækning af sam-tykke om at være med i forsøget og andre tekniske problemer, der umuliggjorde en bestemmelseaf QT og RR udfra patientens EKG.

Tilbage i datasættet indgår der 311 patienter med ca 100.000 sammenhørende datapunk-ter pr patient for RR og QT. Disse er efterfølgende blevet fulgt i en 3 årig periode, hvorunderevt dødsfald og dødstidspunkt er noteret. I alt døde 70 ud af de 311 patienter i perioden.Hvis kontakten blev mistet til en patient er tidspunktet for dette ligeledes noteret. For allepatienter haves altså det antal dage, det vides, at de var i live i perioden hvor undersøgelsenfandt sted.Datasættet er meget stort i forhold til medicinske studier normalt[3], og antallet af døde pa-tienter er stort i forhold til andre studier[2]. Derfor er dette datasæt et godt udgangspunkttil et studie der forsøger at kortlægge nogle generelle risikofaktorer i patientens EKG der kanforudsige risiko for død.

4.1 Datasættets udseende og form

For at få et indtryk af, hvilken information datasættet indeholder, og hvilke begrænsningerdatasættet giver os, foretages en række indledende undersøgelser.En af de mest simple måder, at visualisere datasættet er ved et direkte plot af sammenhørendeRR og QT værdier, der fås for hvert hjerteslag. Der ses to eksempler på dette på figur 1. Sam-menlignes de to plots, ses det, at fordelingen af værdierne kan variere ganske betydeligt mellemde to patienterne. Værdierne på det venstre danner således en form for kompakt sky, mens dethøjre har værdier liggende flere forskellige steder. Sandsynligvis er en del af de datapunkterpå det højre plot, der afviger artefakter[3], men punkterne indgår i vores datasæt og er i givetfald en fejlkilde.

Af figuren ses herudover, at værdierne ligger i faste intervaller, hvilket ses mest tydeligt af detvenstre plot. Årsagen til dette skal findes i samplingraten på 256 Hz, der som nævnt giver enpræcision på ±2 ms. Metoden, der måles på, gør, at værdierne i datasættet antager diskreteværdier, hvilket kan give begrænsninger i databehandlingen.Da området for værdier af QT og RR i datasættet hhv er i størrelsesordenen 200 - 600 ms og400 - 1200 ms, giver målepræcisionen altså en usikkerhed i størrelsesordenen 0,5% for QT- og0,25% for RR-værdierne.

2En ekstrasystole er et hjerteslag, der dannes pga et aktionspotentiale, der følger ekstremt kort efter etandet. Ekstrasystolen medfører, at der går længere tid til det næste aktionspotentiale, og hjertet har dermed“sprunget et slag over“, hvilket føles, som om hjertet hopper i brystet.[6]

3Voldsomme spring i QT eller RR defineres som en afvigelse på mere en 20% fra det lokale gennemsnit afde to foregående og to efterfølgende hjerteslag.[2]

7

Page 8: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

Figur 1: Plot af sammenhørende værdier for QT og RR for to udvalgte patient. Den begrænsede opløsningses tydeligt af de faste spring i værdierne på begge akser.

4.2 Tidligere opnåede resultater

Som nævnt har der været foretaget databehandling på datasættet tidligere[2]. Udvalgte parame-tre er blevet undersøgt for prognostisk betydning4. Herunder er det blevet påvist, at hæld-ningskoefficienten for en simpel lineær regression af de sammenhørende værdier af QT og RRer predictor for død5, og altså indeholder prognostisk information[2]. En stor hældningskoef-ficient indikerer større risiko for død, og kan fysiologisk fortolkes som, at systolen fylder enforholdsvis stor del af hjerteslaget, således at der ikke er tid til, at hjertet kan fyldes fuld-stændigt med blod under den passive fyldning i diastolen. På Figur 2 ses et eksempel på enlav- og højrisiko patient bestemt ud fra hældningskoefficienten.

Der er foruden en simpel lineær regression også lavet andre ikke-lineære fit til datasættet, ogder er fundet en vis non-linearitet i datasættet[2]. Denne er dog så lille, at en lineær model erklart at foretrække.

Den hidtil bedste predictor for død fundet på baggrund af datasættet, er imidlertid en heltanden parameter. Den fundne predictor, kaldet QT/RR variability ratio (VR), er givet ved:

VR =σQT

σRR=

√∑(QT−QT)2√∑(RR− RR)2

Denne størrelse sammenkæder en kendt prognostisk størrelse, variationen af RR[], med en nystørrelse, variationen af QT. En relativ lille variation i RR, målt i standardafvigelsen, betyderen forhøjet risiko for død[2]. Tilsvarende er variationen i QT også lille for patienter med størrerisiko for død. Disse variationer udligner ikke hinanden i VR størrelsen, for selvom både RR

4Ved prognostisk betydning menes, at noget kan bruges til at forudsige, hvordan det vil gå en person.Altså bestemme risiko for, at en hændelse vil forekomme. I vores tilfælde er det død pga hjertefejl, der ønskesforudset.

5Ved predictor forstås, at parameteren på en statistisk signifikant måde kan forudsige død, hvilket kan testesved forskellige metoder indenfor overlevelsesanalyse. Se afsnit 7.1 om Cox Analysen.

8

Page 9: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

Figur 2: Plot af en lav- og højrisiko patient baseret på hældningen af regressionslinje.

RR snit [ms] QT snit [ms] VR snit Hældning Offset [ms]Alle 850 ±150 380 ±40 0.21 ±0.09 0.15 ±0.06 260 ±50

Levende 860 ±140 380 ±40 0.19 ±0.06 0.14 ±0.05 270 ±50Døde 780 ±160 380 ±50 0.27 ±0.13 0.19 ±0.08 240 ±60

Tabel 1: Gennemsnit af middel QT, middel RR og VR med angivet standard spredning foralle patienter samt levende og døde.

og QT variationen er lille i højrisiko patienter, så er variationen i RR væsentlig mindre endden i QT, hvilket giver anledning til en samlet forøgelse af VR. En forøgelse i VR giver enstørre risiko for død [2]. Dette er den hidtid bedste predictor for død fundet ud fra datasættetog vi vil derfor teste mulige forbedringer op imod denne variabel.

I tabellen ses gennemsnitsværdier for forskellige parametre, herunder VR og hældning afden lineære regressionslinje, for hhv alle patienter og levende og døde. RR snit og QT snit erfundet som gennemsnittet af middel RR og QT for hver patient. De viste usikkerheder er spred-ningen mellem patienterne beregnet som standardafvigelsen. Selvom gennemsnitsværdiernenaturligvis er en meget simpel måde at sammenligne på, så genfinder man her en højere VRog hældning blandt de døde patienter.

5 Tidsserieanalyse

I det forrige afsnit viste at der var en hvis, men ikke udpræget, linearitet mellem QT og RRhørende til samme hjerteslag, se Figur 2. De mange datapunkter, der adskiller sig fra denrette linje, tyder på at en så simpel model ikke er den bedste til at forklare sammenhængen

9

Page 10: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

mellem QT og RR. Som nævnt tidligere er svaret ikke en nonlineær model. En mulighed kunnederimod være at se på den tidslige afhængighed mellem QT og RR.

Da RR og QT er tidslig diskrete størrelser, er en god model til at beskrive sammenhængen enMoving Average model

5.1 Moving Average model

En Moving Average (MA) model er betegnelsen for en model, hvor man beskriver en parametertil tiden m som en lineær funktion af en afhængig variabel til de foregående tidspunkter m− i.I vores tilfælde antages det, at QT kan opskrives som en funktion af de foregående RR6:

QTm = cc +N−1∑i=0

ci · RRm−i

Her er offset, cc, og koefficienterne, ci, konstanter og N det antal slag, man medtager bagud itiden. Altså antages det, at QT kan opskrives som en lineær funktion af de N foregående RR.Der nummeres fra 0, idet det RR, der i datasættet er til tid m er det foregående i forhold tilQT. For N = 1 fås en almindelig lineær regression for QT og RR, som vist i Figur 2. I allemodeller er cc et offset for QT, og ci virker som en lineær vægtning af RR. Altså kan man udfra værdierne af de forskellige ci se, hvor stor betydning de foregående hjerteslag længde harpå QT, og muligvis tolke på hvilke fysiologiske mekanismer, der kan ligge bagved.

5.2 Modeller

Vi har udarbejdet en række forskellige MA-modeller til at undersøge datamaterialet. Måletmed modellerne er at få en bedre fysiologisk forståelse af, hvordan QT varierer, og en bedreprognostisk forståelse, som kan bruges til at adskille høj- og lavrisiko patienter.Det er dog a priori usikkert, hvor mange led der er interessante og nødvendige at medtage.Derfor er der lavet modeller hvor man går hhv. 5, 10, 21, 35, 50, 100, 150 og 200 hjerteslagtilbage i tiden og derfor fås tilsvarende mange koefficienter. Modellerne benævnes herefter somMA 5, MA 10 osv). En spændvidde i modellerne fra de 5 til 200 foregående hjerteslag givermulighed for at se, om det er den korte eller lange feedback/regulerings processer, der harstørst betydning7.Modellerne laves for hver patient, hvorved der for hver model fås 311 sæt af forskellige koeffi-cienter - et for hver patient, der efterfølgende kan laves analyse over.Fordi modellerne er afhængig af de foregående RR-intervaller, vil en MA-model med n koeffi-cienter ikke være præcis for de første n hjerteslag i hvert datasæt. Da antallet af datapunkterfor hver patient er i størrelsesordenen 100.000, vil dette dog ikke være et problem for modellerop til 200 koefficienter. Afvigelserne i de fundne koefficienter pga dette vil være af ubetydeligstørrelse.

Plot af gennemsnittet af koefficienterne for alle patienter fra de forskellige modeller er vist på6RR intervallerne er nemmere at måle præcist end QT-intervallerme, vil vil i afsnitte om "Forbedringer af

Modellen"se nærmere på en anden tidslig lineær model kaldet ARMA modellen.7200 slag svarer til ca 3 min, hvilket omtrent er det tidsrum, hjertet er om at adaptere efter en stimulering[3]

10

Page 11: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

Figur 3: Plot af gennemsnit af koefficienterne for alle patienter for forskellige MA modeller. Den store viserhele forløbet. Den lille et udsnit for de første 20 ci

Figur 3. Her ses det, at modellerne har en meget ens tidslige. Den første konstant, c0, har denstørste gennemsnitlige værdi for alle modeller. De næste 5 konstanter har også relativt højeværdier, hvilket kan ses af den lille figur, men herefter er der for modeller med mere end 10koefficienter et midterstykke med meget lave værdier, indtil der til sidst er en stigning op tilde 5 sidste konstanter i hver model.

Af Figur ?? kan man se en dynamik i starten af datasættet. Den første konstant har somnævnt den største værdi. Herefter sker et fald til den anden konstant, c1, en stigning til dentredje, og et fald i værdi indtil den sjette kontant, c5.

Denne hale som dannes af de sidste 5 konstanter er noget, der springer i øjnene. Hvorimodde andre koefficienter bevarer dynamikken mellem modellerne og næsten har ens værdi, såskubbes halen, så den bliver ved med at være i slutningen. Derudover ses et tydeligt fald istørrelsen af halen, når der laves en model med flere koefficienter, hvilket kan ses af tabellen,hvor andelen, som den sidste koefficient udgør af den samlede sum, er vist. Andelen kan sesat følge en aftagende potensfunktion på formen a · xn + b. Se evt appendix ??

Hvad halen repræsenterer kan ikke siges præcist. En mulig fortolkning er, at halen fremkommersom følge af den algoritme, der benyttes til at beregne modellen. Algoritmen har noget infor-mation eller muligvis støj, som den ikke kan placere andet steds end på de sidste koefficienter,da disse naturligt variere mest i forhold til QT. Når der laves en model med flere koefficienter,kan algoritmen fordele mere af informationen eller støjen ud på de ekstra koefficienter - ogdermed bliver halen mindre.

11

Page 12: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

En anden fortolkning er, at halen repræsenterer den information, der ligger i de sene hjertes-lag, altså de hjerteslag der ligger længere tilbage end det antal koefficienter, der er medtageti modellen. Her bliver halen mindre, fordi informationen kan placeres det rette sted, når derer flere koefficienter med.

Udover at halen skubbes længere og længere tilbage, så er dynamikken i modellerne ens.Den eneste forskel er, at værdierne for hver koefficient blot er en smule mindre, jo flere koeffi-cienter der er medtaget i modellen.Selvom der således kan se en klar dynamik for gennemsnittet, så kan man ikke umiddelbart

Figur 4: Plot af gennemsnit og spredning for alle patienter for MA50.

lave en fysiologisk fortolkning af dette, der der er en ganske stor spredning for koefficienternefor de enkelte patienter. Dette ses af Figur 4, hvor gennemsnittet af MA50 modellen er vistmed en spredning, der er beregnet som standardafvigelsen.Det fremgår, at der er en stor spredning for alle koefficienter, men at variationen er langt denstørste for de første og sidste koefficienter. Der er altså ganske stor forskel på, hvordan hjertetstidslige dynamik opfører sig fra patient til patient - se grafer i bilag?.

For at få et indtryk af, hvor godt modellerne stemmer overens med det oprindelige datasætplottes det oprindelige QT og det QT som forudsiges af MA 5 og MA 200 for en udvalgt patientpå Figur 5. På det venstre ses, at MA-modellerne gengiver den lange dynamik i datasættet.Den hurtige dynamik fra slag til slag er derimod ikke indfanget. Dette er ikke overraskende,idet en MA-model netop finder et vægtet gennemsnit over et tidsinterval. Derved tilpassesmodellen automatisk de længere trends i datasættet. Det er derfor heller ikke overraskende,at modellen med 200 koefficienter ser ud til at variere mindre end den med 5.Når modellen med 200 koefficienter overhovedet kan ændre sig mellem enkelte hjerteslag,skyldes det som bemærket ovenfor, at det er de første koefficienter, der har de største værdier.

12

Page 13: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

Figur 5: Oprindelig data for QT og to modeller, MA5 og MA200, plottet som funktion af tid angivet ihjerteslagsnummer. Til venstre ses, at modellerne fanger den lange dynamik, men ikke den hurtige, samt atMA200 til tider passer bedre end MA5. Til højre ses, at hverken MA5 eller MA200 stemmer godt overens meddata i midten

Derfor vil modellen stadig være følsom over for ændringer, men ændringerne dæmpes ved, atder medtages bidrag fra hjerteslag længere tilbage.

Det højre plot på Figur 5 viser, at modellerne ikke altid stemmer godt overens med de o-prindelige data. Plottet viser en situation, hvor der til syneladende sker en pludselig ændring afQT-intervallerne, som ingen af de to modeller beskriver godt. Sådanne ændringer kan tænkesat være pludselige forstyrrelser, som giver hjertet et stimuli udefra, men kan også skyldesforstyrrelser i målingen, altså artefakter.

5.2.1 Levende og døde

De forskellige modeller viser en klar adskillelse i gennemsnittet af koefficienternes værdier forlevende og døde. På Figur 6 ses dette for MA50 modellen. Det ses, at gennemsnittet for dedøde patienter er højere end for de levende for alle 50 koefficienter. Dette stemmer godt overensmed de tidligere resultater, hvor en højrisiko patient havde en større hældningskoeffficient enden lavrisiko, men det burde ikke nødvendigvis være sådan for alle 50 koefficienter.Derudover ses også, at dynamikken for gennemsnittet for levende og døde er den samme somfor alle patienter. Altså er der ikke en klar adskillelse i dynamik mellem levende og døde. Sommed alle patienterne er der også for de levende og døde stor spredning imellem patienterne,hvilket ses af Figur 7. Således forekommer der levende patienter, der har højere værdier forkoefficienterne end gennemsnittet af de døde, men gennemsnitsværdierne viser alligevel en klartendens.Betragtes variationen for de enkelte koefficienter på Figur 7, ses det, at spredningen igen er

størst for de første og sidste koefficienter. Generelt er variationen i koefficienterne for de dødemarkant større end for de levende. Således dækker usikkerhedsbjælken for de døde totalt den

13

Page 14: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

Figur 6: Til venstre vises gennemsnit af VR for levende og døde med angivet spredning, og til højre gennem-snittet af koefficienter af levende og døde for MA50.

for de levende for de fleste konstanter.Hvis man ser på forskellen i koefficienterne, er det måske værd at bemærke, at det ikke er påde to første koefficienter, at der findes den største forskel i gennemsnitsværdi. Faktisk er denanden koefficient næsten ens for levende og døde i både gennemsnit og spredning.

6 Principal Component Analysis

6.1 Mønstre i koefficienterne

Fra Moving Average modellen får man en lang række koefficienter (ci’er) for hver patient.Vores mål er at undersøge, om disse ci’er kan bruges til at adskille grupper af patienter, f.eks.de der overlever, og de der ikke gør. Det er dog svært at skille patienterne i grupper, hvis manskal kigge på samtlige ci’er i en model med f.eks. 50 eller 100 for hver patient. Samtidig erkoefficienterne sandsynligvis korrelerede, idet de alle er bestemt af hjertedynamikken. Ved atbenytte Principal Component Analysis (PCA), også ofte kaldet Singular Value Decomposition,kan man skabe en række uafhængige parametre, der grupperer koefficienterne efter hvor megetvariation, de bestemmer i patient-datasættet. Disse parametre vil opkoncentrere informationenom hvordan patienterne er forskellige, og vil samtidig kunne sige mere om hjertedynamikkenend de enkelte ci.

Teorien bag PCA forklares i næste afsnit. Derefter beskrives resultaterne af PCA på voresdata og diskuteres.

14

Page 15: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

Figur 7: Her vises gennemsnittet af koefficienter af levende og døde for MA50 med angivet spredning. Tilvenstre interceptet og til højre ci

6.2 Teori for PCA

Vi vil her følge en relativt intuitiv forklaring af PCA fundet i Muller et al. []. Den tagerudgangspunkt i et billede af datasættet som en sky i et vektorrum og principalkomponenternesom de vektorretninger, hvor skyen er bredest.

I vores tilfælde har rummet en dimension for hver koefficient, og hver patient har et punkt irummet med koordinater givet af hans eller hendes koefficienter. På figur 8 vises et udsnit afvektorrummet for vores data udspændt af koefficient c0, c1 og c2 for MA-50 modellen.

Det ses på figuren, at datapunkterne ikke ligger i en perfekt kugle-fordeling - skyen er lidtfladtrykt. Patienternes datapunkter er altså mere adskilt i nogle retninger end i andre. Påfiguren er vektorer indtegnet i de retninger (vinkelret på hinanden), hvor der er mest variationi data-skyen.

Formålet med PCA er netop at finde de retninger, hvor der er mest variation. Heraf navnet,Principal Component Analysis - den finder de vigtigste komponenter i datasættet. Det gøresved at opstille datasættet som en matrix, der er opbygget af vektorer for hvert datapunkt.

I vores tilfælde ser matricen således ud:

15

Page 16: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

Figur 8: Datapunkter i rummet udspændt af c0, c1 og c2 for MA-50 modellen. Retninger med maksimalvariation er indtegnet med vektorer, som står vinkelret på hinanden.

X =

c0−c1−c2−c3−

...

patienter

p1 p2 p3 . . .x11 x12 x13 . . .x21 x22 x23 . . .x31 x32 x33 . . .x41 x42 x43 . . ....

......

. . .

(1)

BRUG MIKKELS RETTELSER Dette er en m x n matrix hvori hver kolonnevektor, xj, in-deholder koefficienterne for patient j minus gennemsnittet af koefficienten for alle patienterne.Antallet af koefficienter er m (varierer fra model fra model), og antallet af patienter er n (=311patienter). Gennemsnittet trækkes fra for at centrere data-skyen omkring origo.

Principalkomponenterne kan nu findes ved hjælp af kovariansmatricen, C. Egenvektorernefor kovariansmatricen bestemmer nemlig netop de retninger i dataskyen, hvor der er mestvariation, og variationen for hver egenvektor er proportional med den tilsvarende egenvektor.Udledningen af dette resultat er vist i ??.

C er proportional med produktet af X og XT og kan skrives som:

16

Page 17: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

C =1n

X ·XT =1n

x11 x12 x13 . . .x21 x22 x23 . . ....

......

. . .

x11 x21 . . .x12 x22 . . .x13 x23 . . ....

.... . .

=1n

xT

1 · xT1 xT

1 · xT2 . . .

xT2 · xT

1 xT2 · xT

2 . . .xT

3 · xT1 xT

3 · xT2 . . .

......

. . .

Bemærk, at C er en symmetrisk m x m matrix. Element i, j svarer til kovariansen af ci medcj . Netop fordi C er symmetrisk og reel, kan den omskrives som []:

C = UcΛcUTc

hvor Uc er en m × m orthonormal matrix og Λc er en diagonalmatrix med diagonalværdierλj . Kolonnerne i Uc er egenvektorer for C og λi’erne er de tilsvarende egenværdier. Dermedsvarer principalkomponenterne til kolonnerne i Uc.

Den egenvektor, som har størst tilhørende egenværdi, er defineret som principal-komponent 1,den, der har næststørst egenværdi, er principalkomponent 2, osv.

Herefter kan projektionen af hver enkelt patients koefficienter på en given principalkomponentudregnes. Dette er patienternes ’score’ på principalkomponenten, hefter kaldet PCSi, hvor i erprincipalkomponentens nummer. Scoren benyttes til at bestemme den enkelte patients risikoi overlevelsesanalysen senere hen.

Hvis 1. principalkomponent kaldes u1, 2. principalkomponent kaldes u2, osv, kan scoren forpatient j for den i’te komponent, benævnt PCSi, j udregnes som:

PCSi, j = ui · xj =(

u1,j u2,j u3,j . . .)

x1,i

x2,i

x3,i...

En egentlig visualisering af principalkomponenterne ligger ikke lige for, da det rum de ligger ihar lige så mange dimensioner som MA-modellerne har koefficienter, men man kan dog give enret forståelig illustration ved at plotte egenvektorernes vægtning af de individuelle koefficienter.Da vil den tidslige dimension af principalkomponenten fremstå, idet hver koefficient netop eren vægtning af et hjerteslag i tidsrækken. Dette ses i næste afsnit for de principalkomponenter,som blev fundet for vores data.

6.3 Resultater fra PCA

For hver MA model opstilles en matrix med data som beskrevet i ligning ??, og modellensprincipalkomponenter udregnes.Principalkomponenternes styrke ligger i at kunne bestemme de retninger, hvor der er størst

17

Page 18: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

variation i datasættet. Det ses af tabellen nedenfor, der angiver mængden af variation i deførste syv principalkomponenter fra hver af modellerne (MA 5 modellen har naturligvis kun 5komponenter), at langt størstedelen af variationen således kan beskrives med ganske få kompo-nenter. I modellerne bliver mindst 80% beskrevet ud fra de første 7 principalkomponenter. Detvil sige, at det N -dimensionale vektorrum, som stammer fra de N koefficienter i modellen, kanreduceres til et 7 dimensionalt vektorrum med næsten lige så meget information om hvordandatapunkterne varierer.Mængden af variation i en principalkomponent svarer til den andel, som komponentens egen-værdi udgør af summen af egenværdierne (Andel variation = λiP

j=1nλi).

MA5 MA10 MA20 MA35 MA50 MA100 MA150 MA200PC1 0,465 0,431 0,471 0,500 0,529 0,524 0,509 0,489PC2 0,282 0,195 0,146 0,136 0,138 0,141 0,138 0,133PC3 0,117 0,130 0,129 0,118 0,097 0,087 0,084 0,081PC4 0,088 0,085 0,063 0,058 0,054 0,050 0,049 0,047PC5 0,048 0,056 0,056 0,046 0,041 0,034 0,030 0,028PC6 0,036 0,038 0,036 0,029 0,018 0,016 0,015PC7 0,031 0,024 0,020 0,018 0,015 0,013 0,013Sum 1,000 0,965 0,927 0,914 0,906 0,870 0,838 0,806

Her, og i hele resten af rapporten, bliver 1. principalkomponent benævnt PC1, 2. komponentPC2, osv. Det ses, at mængden af variation i komponenterne aftager meget hurtigt. PC1 udgøromkring 50%, mens PC7 kun udgør omkring 2% af den samlede variation i datasættet.

PC1 peger i den retning, hvor der er mest variation. I Figur 9 ses et plot af PC1’s vægt-ning af de koefficienter, der indgår i MA 10, MA 20, MA 35 og MA 50. Det ses, at vægtningener næsten ens for samtlige modeller - et plot, som medtager MA 100, MA 150 og MA 200viser samme mønster. Dette skyldes, som nævnt i afsnit ??, at dynamikken og variationeni koefficienterne er næsten ens på tværs af modellerne. Ens variation giver i store træk ensprincipalkomponent, og man genfinder mange af de samme former på de første PCi’er på tværsaf alle modeller

Principal komponenterne fra forskellige modeller er selvølfelig ikke direkte sammenlignelige,fordi de er udspænd i forskelligt dimensionale rum. Hver principal komponent angiver enretning i det N dimensionale rum den udspændes af. Når principal komponenter i forskelligemodeller (N = {21, 35, 59}) ligner hinanden, er det fordi, at disse principalkomponenter liggernæsten ens, når de projiceres ned i et fælles underrum. I tilfældet med PC6 i Figur 10 vil detteunderrum udspændes af c0− c4, idet det er ved disse koefficienter, at deres vægtning stemmeroverens.

For modeller med næsten samme antal ci (f.eks. MA 35 og MA 50; MA 150 og MA 200), erdet muligt at finde ens komponenter op til 8.-10. principalkomponent, se Figur 10

Når egenværdien for principalkomponenten bliver mindre, begynder lighederne på tværs afmodellerne at blive mindre. Det betyder at samme dynamik findes sjældnere i to principalkom-ponenter fra to forskellige modeller. Det betyder at de ikke længere ligger tæt på hinanden,når de projiceres ned på det fælles underrum. Dette skyldes, at en retning i rummet, sombeskriver en lille andel variation, er mere følsom over for forskellene mellem modellerne. Afsamme årsag ville de sene PCi’er, med meget lille egenværdi, formentlig få et andet udseende,

18

Page 19: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

Figur 9: PC1 og PC34: vægtning er plottet mod koefficient-nummer. Til venstre ses, at formen for PC1 erens for alle fire viste modeller. Til højre ses, at PC34 for MA35 har de største vægtninger for de miderste ci.

hvis man gentog forsøget en anden dag eller på en anden gruppe patienter, da de ville blivepåvirket af selv de mindste ændringer. Af disse nævnte grunde, vil det formentlig være sværtat genfinde én af de sene komponenter, hvis man foretog et nyt forsøg, hvorimod de tidligekomponenter har en langt større sandsynlighed for at kunne genfindes. Derfor har vi meretiltro til at de tidlige komponenter beskriver en reel dynamik og reel variation i datasættet.

Udfra en hypotese om at de retninger der udviser variation - altså PCi’erne - eventuelt kanbeskrive nogen bagved liggende dynamikker, for hvordan hjertet reguleres, vil man helst kunbetragte de PCi’er, der har størst egenværdi - mest variation. Idet de har findes at være mererobuste modellerne imellem, det vil sige at det samme mønster genfindes for fælles under-rum. Derfor vil de principal komponenter der har størst egenværdi med større sandsynlighedkunne genfindes i andre datasæt. Man kan kun have håb om at have fundet nogle generellebagvedliggende dynamikker, der har indeflydelse på om patienter dør eller overlever, hvis mankan regne med at nogenlunde samme de principal komponenter er at finde i nye datasæt, hvisman skal tro på at principal komponenterne udtrykker disse dynamikker.

Det er dog ikke nødvendigvis de principalkomponenter, der beskriver mest variation i datasæt-tet, som også har den største prognognostiske information, hvilket vil blive omtalt i afsnit 9.Af Figur 9 ses, at PC1 lægger meget vægt på de første koefficienter og langt mindre på resten- den ligger faktisk stort set kun i det rum, som er udspændt af c0-c6. Dette er ikke overrask-ende, da det netop er disse koefficienter, der har den største spredning patienterne imellem,hvilket kan ses på Figur 4 i afsnit ??.De følgende principalkomponenter beskriver en faldende mængde variation, og dermed vil degradvist begynde at vægte de ci’er, der udviser mindre spredning, højere. Det ses i Figur 10,at PC6 lægger mere vægt på de midterste og sidste ci’er i forhold til PC1, samtidig med atden dog også lægger vægt på de første.

19

Page 20: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

Figur 10: PC6: vægtning plottet mod koefficient-nummer. Bemærk den relativt store vægtning af de sidsteci’er.

I MA 35 og MA 50 er det eksempelvis blevet observeret at 1. og 2. principalkomponent læggervægt på de første ci’er, 3. til 10. komponent lægger vægt på både de første og sidste ci,og gradvist lægger komponenterne mere og mere vægt på de midterste ci. De følger såledesmængden af variation i ci’erne, se Figur 4 i afsnit ??, som det forventedes. Af Figur ?? ses, atPC34 for MA 35 modellen netop lægger meget vægt på de midterste ci’er, som der er megetmindre spredning på.Umiddelbart kan principalkomponenterne ikke fortolkes fysiologisk, men en analyse, der viserhvilke komponenter, der kan bruges til at forudsige død, kan vise noget om hvilken form forvariation i ci’erne er prognostisk vigtig. Dette har en direkte fortolkning i hvordan tidligerehjerteslag påvirker de senere.

6.4 Summary

I afsnit ?? blev der opstillet en moving averae model, med det formål at undersøge om dereventuel var en tidslig afhængighed mellem QT værdierne og RR fra de foregående hjerteslag,og om hvad der kunne ses af en sådan eventuel afhængighed. Vi fandt at QT’erne i høj gradafhang af de tidligere RR- værdier, idet vi fik nogle koefficienter, ci’er, der var forskellige fra0, og som derudover viste den samme form for vægtning af de 5 RR der kom lige inden QT’etfor samtlige modeller. Det betyder at den fundne QT afhængighed af de forrige 5 RR, ser udtil at være robust ligegyldig hvor mange hjerteslag moving average modellen medtager. Dehjerteslag der ligger længere tilbage en de første 5 har langt mindre indflydelse på QT, idetci>5’erne er meget tæt på 0. For alle moving average modeller er der dog blevet registreret en"hale-indflydelse - at for en model der går N hjerteslag tilbage i tiden, vil cN−5, næsten ingenindflydelse have hvorefter cN−4, cN−3, cN−2 og cN−1 (det aller sidste slag) vil have mere ogmere indflydelse på QT.

Hvis de døde og de overlevende patienters middelværdi for de forskellige koefficienter betragtes,

20

Page 21: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

se Figur ??, kunne det ses at de døde patienters gennemsnitlige koefficienter lå langt højereend de levendes. De dødes QT er således langt mere afhængige af RR ra de tidligere hjerteslagend de levendes. Det kan dog ikke ses om der er nogen statistisk signifikant forskel på de to,og et plot af spredningen for værdien af koefficienterne, se Figur ?? i de to grupper, gør énskeptisk.

Den store spredning i koefficienternes værdier, der gør os skeptiske over om koefficienternealene kan adskille døde fra levende på et statistisk signifikant niveau, giver anledning til enanden form for udtrykkelse af data for patienterne. Det lavedes Principal Komponent Analysepå koefficienterne, og de retninger, i punktskyen af datapunkter for patienterne, hvor der ermest variation defineres. På den måde opkoncentreres informationen om hvordan patienterneadskiller sig fra hinanden effektivt. Principalkomponenterne er en vægtning af alle koefficien-terne i moving averagemodellen og giver beskriver derfor en tidslig dynamik i de foregående RRintervaller. De første mange principalkomponenterne i de forskellige modeller udviser mangeaf de samme mønstre, så PCA er altså relativ robust overfor udvidelse af moving average mod-ellen. Det bekræfter at de principal komponenter der angiver retninger med mest variation,kan have fat i nogen generelle træk ved afhængigheden mellem QT og de tidligere RR, ligegyldig hvor langt man går tilbage i tiden. Altså kan man sige at disse principalkomponenterudtrykker nogen dynamikker der er robust fra model til model.

At de ellers så forskellige modeller er enig om nogen generelle retninger i underrummet under-støtter vores idé om, at betragte principal komponenterne i stedet for de enkelte koefficienter.Vi har dermed fået afdækket nogle tidslige tendenser8, der ville kunne danne grundlag fornogle dybdegående fysiologiske undersøgelser.

I det følgende vil det blive undersøgt om koefficienterne eller principalkomponent scoren forde forskellige patienter kan opdele hvilke patienter der døde og hvilke der overlevede. Vedoverlevelses analyse kan man statistisk eftervise om hvorvidt en inddragelse af patientenskoefficienter eller principalkomponent score kan forbedre den tidligere model, der kun indeholdtVR.

7 Cox-analyse og ROC-kurver

Efter at have fundet koefficienter og principalkomponenter for MA-modellerne, ønsker vi atidentificerer de variable, der bedst indikerer, hvilke patienter der er i risiko for at dø. Dette kangøres ud fra en Cox analyse, der er en form for overlevelsesanalyse. Teorien for Cox analysener beskrevet i det følgende afsnit, hvorefter resultaterne for vores data gennemgås.

7.1 Overlevelsesanalyse og Cox-modellen

Overlevelsesanalyse tager udgangspunkt i, at alle mennesker har et grundlæggende livsfor-løb, der ville være ens hvis vi alle levede ens - en slags basis-levetid. Analysen handler om,at identificere de variable, der gør at nogen mennesker lever længere eller kortere end dennebasis-levetid. Hvis der haves et antal variable, kan overlevelsesanalyse altså fortælle, om de

8Vi benytter ordet tidslige tendenser fordi Principal Komponenterne netop er en vægtning af ci’erne. Daci’erne i forvejen er en vægtning af de tidligere RR-intervaller, kan vi med rette se Principal Komponenternesom en klargøreing af en bestemt tidslig dynamik.

21

Page 22: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

har en signifikant indvirkning på basislevetiden.

I Cox analyse gøres dette ved at opstiller en dødsintensitet, der er individuel for hver patient.En dødsintensitet λi(t) angiver sandsynligheden for, at et individ, i, dør indenfor et lille tidsin-terval givet at det var i live i begyndelsen af intervallet. Det er altså en betinget sandsynlighedgivet som[1]:

λi(t) =fi(t)Si(t)

Her angiver Si(t) sandsynligheden for, at individet er i live til tiden t, mens fi(t) angiversandsynligheden for, at individet dør indenfor tidsintevallet ]t, t + ∆t]. Disse to størrelser erforbundet med følgende generelle sammenhæng[1]:

f(t) = − d

dtS(t)

Derfor vil en levetid give direkte anledning til en dødsintensitet, idet

λi(t) =fi(t)Si(t)

=− d

dtSi(t)Si(t)

= − d

dtlnSi(t)

Således vil en basis-levetid S0(t) medføre en basis-dødsintensitet λ0(t). Denne basis-dødsintensiteter overalt positivt og generelt stigende, da et individs sandsynlighed for at dø må blive større,jo længere han/hun har været i live.

Cox analyse er et eksempel på en Proportional Hazards overlevelsesanalyse, som antager, atde individuelle dødsintensiteter er proportionale med basis-dødsintensititen. Altså at λi(t) =λ0(t) ·ki, hvor ki er en specifik proportionalitetsfaktor for hvert individ. For at kunne anvendeCox analyse, skal alle de individuelle dødsintentiteter altså være proportionale.

I Cox analyse udtrykkes proportionalitetsfaktoren således, at den individuelle dødsintensitetkan skrives[1]:

λi(t) = λ0(t)ePN

j=1(βj ·baggrundsvariabel j for patient i)

Der er altså en ekspontiel afhængighed af en række “baggrundsvariable“, som være hvad somhelst, der kan have inflydelse på patientens risiko for at dø; alder, mængden af medicin, patien-ten modtager, BodyMassIndex, osv. βj er en regressionsparameter, der vægter baggrundsvari-ablens indflydelse på dødsintensiteten.Idet det ville være utænkeligt at λ(t) var negativ, er ki en positiv konstant. Derfor er detsmart at skalere basis-dødsintensiteten med en eksponentialfunktion, da denne aldrig blivernegativ.

Hver patient har altså en specifik propertionalitets faktor ki. Målet med Cox analysen er atundersøge om disse ki’er udviser nogen form for regelmæssig afhængighed af baggrundsvari-ablerne. Altså om en ændring i en baggrundsvariabel fører til en ændring i ki. Et godt eksempeler, at ki stiger jo ældre patienten er, så der er større sandsynlighed for at dø, når man er ældre.

Hvis ki < 1 er der tale om en patient, der har en mindre dødsintensitet end basis dødsin-tensiteten og derfor står bedre stillet. Hvis ki > 1 er der tale om en patient, der er værrestillet.

22

Page 23: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

7.2 Check af forudsætninger for Cox

Antagelse, om proportionale dødsintensiteter ser ud til at være opfyldt for de baggrundsvari-able, vi tester - dette er checket med en rutine i SAS. Antagelsen checkes grafisk ved at opstilleet estimat for den kumulerede dødsintensitet for fem undergrupper af patienterne, hvorefterser efter, om estimaterne er parallelle.

Herudover skal to antagelser være opfyldt for benyttelse af maksimum likelihood metoden - atpatienternes livsforløb er uafhængige af hinanden, samt at der ikke sker noget mellem forsøgetsstart og slut, som har indfyldelse på patientens risiko for at dø. Den sidste antagelse er opfyldt,idet vi udelukkende baserer vores prognoser på det 24 timers Holter EKG, som blev optagetlige efter patienten blev opereret. Den første antagelse må man blot gå ud fra er opfyldt.

7.3 Anvendelse af Cox på data med kontinuerte baggrundsvariable - hvor-dan man finder de parametre, som kan forudsige død

De variable som vi vil undersøge med Cox analyse, eksempelvis VR og ci, varierer kontinuert,og derfor vil vi her betragte Cox analyse for kontinuerte baggrundsvariable. For andre typerbaggrundsvariable se [1].

For en model med én baggrundsvariabel, kan den i’te patients dødsintentisitet opskrives som:

λi(t) = λ0(t) · eβV R·(V Ri−V R0)

Her er VR valgt som eksempel og V Ri er den i’te patients VR-værdi, mens V R0 er en passendevalgt reference for VR-værdien. Denne angiver baggrundsværdien for variablen, som alle pa-tienters VR testes op imod, og kan f.eks. være gennemsnittet for alle patienter eller gennem-snittet for raske personer.

For at sammenligne patienternes dødsintensiteter og identificere dem med størst risiko for atdø, skal man kende parameteren βV R. Et estimat for denne, βV R, kan findes ud fra MaksimumLikelihood metoden. Denne metode går ud på at opskrive en sandsynligheds- eller likelihood-funktion for modellen og maksimere denne for en valgt variabel.Den funktion, som maksimeres i Cox-analysen, kaldes Cox’s likelihoodfunktion. I tilfældet medén kontinuert baggrundsvariabel vil den være:

LC(βV R) =eβV R·(V Ri−V R0)∑

j∈R(ti)eβV R·(V Rj−V R0)

Se ?? for udledning. Her angiver R(ti) risikomængden, dvs. mængden af patienter, der videsat overleve intervallet [0, ti[. Der summes således kun over de patienter, der er i live til tidenti og er i risiko for at dø fremover. Ved at maksimerer ln(LC) mht. βV R fås ligningen:

d∑i=1

(V Ri − V R0) =d∑

i=1

∑j∈R(ti)

(V Rj − V R0)eβV R(V Rj−V R0)∑j∈R(ti)

eβV R(V Rj−V R0)

23

Page 24: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

På venstresiden summeres der over, hvorledes alle de dødes VR-værdi afviger fra V R0. Påhøjresiden summeres der i tælleren over led af typen (V Ri − V R0)eβ(V Ri−V R0). Dermed fra-sorteres alle patienter, der har VR-værdi lig V R0, dvs de patienter, der har den grundlæggendedødsintensitet. Det bliver derfor muligt at fokusere bestemmelsen af βV R udfra de patienter,der afviger fra basis-dødsintensiteten. Maximum likelihood estimatoren βV R findes ud fradenne ligning. Den fundne βV R testes for nulhypotesen for at afgøre, om VR har betydningfor patienternes risiko. Nulhypotesen siger, at der ingen forskel er på dødsintensiteterne mellempatienterne pga forskel i VR. Hvis denne hypotese forkastes, betyder det, at dødsintensiteternevirkelig ændrer sig pga VR. βV R kan nu benyttes til at evaluere den enkelte patients risiko forat dø udfra hans eller hendes dødsintensitet, λi(t) og vurdere om VR har indflydelse.Hvis βV R · (V Ri − V R0) < 0 for den enkelte patient bliver dødsintensiteten formindsket, oghan/hun har derfor mindre risiko for at dø end patienter med VR = V R0. Tilsvarende harpatienter med β(V Ri − V R0) > 0 større risiko for at dø end patienter med VR = V R0.Med flere variable er summen af variable minus baggrundsværdi ganget med deres β, der afgør,om der er større eller mindre risiko. Denne sum i eksponenten kaldes det Prognostiske Index,I, og kan således bruges til at afgøre, om en patient har en høj eller en lav risiko for at dø.

7.4 ROC-kurver

For at sammenligne hvor gode forskellige modeller er til at adskille patienterne i høj- oglavrisikogrupper benyttes en ROC-kurve9. En ROC-kurve sammenligner hvor mange patienteren given model korrekt klassificerer som overlevende eller døde. Til dette formål defineres tonye størrelser:

Sensitivity =Antal rigtigt klassificerede levende

Totale antal patienter der overlevede

Specificity =Antal rigtigt klassificerede dødeTotale antal patienter der døde

Sensitiviteten angiver altså den procentdel af de overlevende, der katagoriseres rigtigt somlavrisikopatienter. Tilsvarende angiver specificiteten den procentdel af de døde, der katagoris-eres rigtigt som højrisikopatienter.

Opdelingen i høj- og lavrisiko patienter, som bestemmer sensitivitet og specificitet, sker vedat bestemme et cut-off, dvs en grænseværdi, for det prognostiske index, I. Højrisiko patien-terne defineres for dette cut-off som dem, der har et I, der er større end cut-offet, og lavrisikopatienterne som dem med et I, der er mindre.

Denne opdeling giver mening, idet jo større det prognostiske indeks er, jo større er risikoenfor død, som nævnt i afsnit 7.3. Således vil gruppen af patienter med et I større end cut-offethave en større risiko for død end dem med et I, der er mindre.Det er dog yderst sjældent, at de døde patienters prognostiske index er grupperet seperatfra de overlevendes. De er snarere fordelt med megen overlap, som vist i Figur 7.4, der viseren fordeling af I for modellen kun indeholdende VR. Derfor findes der oftest ikke et perfekt

9ROC står for "Receiver Operating Characteristic"

24

Page 25: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

cut-off.

Figur 11: De to histogrammer viser en opdeling af overlevende og døde efter det prognostiskeindeks, I, for en overlevelsesmodel med kun VR.

Dette understreges af de tre forskellige cut-offs som vises på histogrammerne. Det første cut-offangiver den værdi, der korrekt identificerer 100% af de patienter, der rent faktisk døde, somværende højrisiko patienter. Her fås altså en specificitet på 1. Det ses dog, at sensitivitetenkommer til at lide under det, idet kun ganske få procent af de overlevende patienter identifi-ceres som lavrisiko patienter.Det sidste cut-off er der, hvor alle de overlevende patienter korrekt klassificeres som værendei lavrisikogruppen - altså en sensitivitet på 1. Dette sker på bekostning af specificiteten, derer nedsat betragteligt.Det miderste cut-off er en mellemvej mellem de to ekstremer og giver et mere brugbart cut-off.Her fås både en relativ høj specificitet og sensitivitet.

Da der som nævnt ikke findes ét perfekt cut-off, må der i hvert tilfælde vurderes, om derønskes en høj specificitet eller sensitivitet på bekostning af den anden. For at gøre dette let-tere at overskue kan man visualisere det på en ROC-kurve, hvor der plottes sammenhørendeværdier af sensitiviteten som funktion af 1−specificiteten for en række cut-offs. Se figur ??.1−specificiteten angiver andelen af de døde, der klassificeres forkert. Dette giver for alle mod-eller en monoton voksende kurve, der starter i (1−specificitet, sensitivitet) = (0, 0) og enderi (1, 1).Et plot for en perfekt model ville give et enkelt punkt i (0, 1), svarende til et cut-off medspecificitet og sensitivitet= 1. En kurve kan her indtegnes som en lodret linje fra (0, 0) og envandret fra (1, 1) som skærer i (0, 1)Hvis modellen allokerede patienterne tilfældigt ville det prognostiske indeks for de døde og deoverlevende have en ens fordeling, og alle punkter ville ligge på diagonalen fra (0, 0) til (1, 1),idet sensitiviteten og 1−specificiteten ville være ens for alle cut-off.Hvis ROC-kurven for en model ligger over diagonalen, vil modellen altså have en predictiv

25

Page 26: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

styrke, og to modeller kan nu sammenlignes ved hjælp af deres ROC-kurver. Jo højere enmodel ligger over de andre, jo bedre er den til at kategoriserer patienterne.

7.5 Univariat Analyse

For vores data udførtes først en univariat og derefter en mulitivariat Cox-analyse. Den univari-ate Cox analyse belyser hvilke baggrundsvariable, der enkeltvis kan registrere en forskel i dedøde og de overlevende. Baggrundsvariablene testes mod nulhypotesen med en teststørrelse10,som for den univariate analyse følger en χ2 fordeling med 1 frihedsgrad. Derfor vil de bag-grundsvariable, der får en teststørrelse højere en 3.8456 forkaste hypotesen, idet χ2 = 3.8456er 5% grænsen i denne fordeling. Dette betyder at variablen er statistisk signifikant og kanbruges til at adskille døde fra overlevende i datasættet.

Den univariate undersøgelse bruges til at identificere de variable, som medtages i den multi-variate analyse (som altså indeholder flere baggrundsvariable), da man af beregningsmæssigeårsager ikke altid kan medtage samtlige variable. Hvis en variabel ikke er statistisk signifikanti den univariate analyse, vil vi derfor ikke bruge den i den multivariate analyse.

Alle ci og PCSi samt cc for alle MA modeller analyseres for univariat signifikans.

7.6 Multivariat Analyse

Der findes to procedurer, der normalt benyttes til at finde de baggrundsvariable, som erstatistisk signifikant i den multivariate analyse. De kaldes Forward Selection og BackwardElimination.[1]I begge procedurer gives som input alle de baggrundsvariable, der ønskes undersøgt. I vorestilfælde er det som nævnt de univariat signifikante cc, ci og PCSi for hver MA model samtVR, der bruges som reference. Begge procedurer går iterativt frem, men hvor Forward i hvertskridt vælger den mest signifikante variabel ud, så vælger Backward den mindst signifikantefra de samlede variable fra. Begge procedurer stopper, når der ikke længere er variable, derkan vælges ud eller vælges fra. Se evt [1]Der er fordele og ulemper ved begge metoder. Dog er procedurerne ofte enige om hele eller deleaf modellen - disse dele er sandsynligvis de vigtigste. Hvis de kommer frem til to forskelligemodeller, kan χ2 testet give et fingerpeg om hvilken model der er bedst, men det bør eftervisesved at studere de to modellers ROC-kurver.

8 Resultaterne for Cox analysen for Koefficient modellerne

Vi har set hvordan en Cox analyse kan laves for en enkelt baggrundsvariabel VR for allepatienterne, og vi ved fra tidligere resultater (4.2) at dette er en god parameter til at deskrim-

10se Appendix ??

26

Page 27: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

inerer mellem høj- og lavrisiko patienterne. Derfor inkluderer vi denne baggrundsvariabel i deefterfølgende Cox Analyser.

I dette afsnit betragtes en Cox model med VR og koefficienterne c0, . . . , cN−1 for alle mod-ellerne. Først udføres en univariat analyse for at kunne begrænse antallet af baggrundsvariableder skal betragtes i de multivariate analyser. Stort set alle ci er univariat signifikante, dvs.hver ci kan alene afvise nulhypotesen. Det skal dog specielt bemærkes, at hverken c0 eller c1

er univariat signifikante for nogen af de MA modeller vi betragtede. VR havde en χ2-værdi på81.14 og cc’erne for de forskellige modeller havde χ2-værdier på ca. 27-30. Disse teststørrelserskal holdes op mod en χ2-fordeling med 1 frihedsgrad, så de forkaster alle nulhypotesen medpiber og trommer. Dvs. at de hver især kan bruges til at adskille de døde fra de levende,så begge disse variable er selvfølgelige med i de multivariate procedurer. I Bilag ? er alle deunivariate resultater vedlagt.

Det, at stort set alle ci er univariat signifikante, stemmer overens med Figur ??, hvor det netopses at samtlige ci i snit er højere for de døde end for de overlevende. For de fleste koefficienterer forskellen i de døde og overlevendes gennemsnitlige værdi altså så stor at de kan adskille deto grupper på et statistisk signifikant niveau.

Det er bekymrende at så mange variable inkluderes i multivariatanalysen, da det kan giveanledning til ustabile modeller11. Et eksempel er diskuteret i Appendix ?. Der er simpelthenfor mange variable (VR, cc og op mod 60 ci) der fittes til for få datapunkter (kun 311 patienter),til at de iterative procedurer for forward selection og backward elimination kan give stabileresultater. Kriteriet om at alle variable inkluderet i den multivariate analyse skal være univariatsignifikante benyttes dog stadig.

Ved brug af de to multivariate procedurer, Forward Selection og Backward Elimination, kander nu fremstilles nogle endelige modeller. Cox analysen for ci’erne gav hyppigst to forskelligeendelige modeller, alt efter hvilken procedurer der blev benyttet. Kun MA 5, MA 10 og MA200 gav den samme endelige model. Ovenikøbet var disse modeller ikke ret stabile og der varmange vekselvirkninger mellem variablene. Vekselvirkningerne gør ikke modellen forkert, mendet gør det sværere at fortolke den underliggende dynamik.

Her den endelige model for MA 50 (forward og backward) angivet:MA 50 Forward Selection

Variable Parameter Standard p-værdiEstimat Afvigelse for

β SE(β) Teststr.VR 7.26 1.82 <0.0001c2 18.37 6.81 0.0070c9 71.53 33.22 0.0313c31 -169.39 64.22 0.0084c36 140.22 58.44 0.0164c46 111.87 33.19 0.0007c49 -57.19 14.66 <0.0001

MA 50 Backward EliminationVariable Parameter Standard p-værdi

Estimat Afvigelse forβ SE(β) Teststr.

VR 7.22629 1.71 <0.0001c2 16.21 6.55 0.0134

c31 -158.56 63.58 0.0126c36 136.28 57.83 0.0184c46 127.46 33.13 0.0001c49 -52.88 14.16 0.0002

11En model der ikke er konsistent med sig selv når samme multivariate procedurer anvendes på den to gangebetragtes som ustabil. Hvis der f.eks. foretages backward elimination og man finder en endelig model medbestemte variable, vil man forvente at en ny backround elimination med variablene fra den endelige model ogen variabel, der tidligere blev elimineret, vil give den samme endelige model.

27

Page 28: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

p-værdien fås ved at sammenligne Wald teststørrelsen, β

SE(β), der holdes op mod en χ2-

fordeling med 1 frihedsgrader [7]. For de fulde resultater med teststørrelser for denne og deandre modeller henvises til Bilag ?.

Resultaterne for de to procedurer stemmer ikke helt overens, og giver anledning til to forskelligeendelige modeller, der har to forskellige prognostiske index givet ved:

Ii,forward(t) = 7.26VRi + 18.37c2 + 71.53c9 − 169.39c31 + 140.22c36 + 111.87c46 − 57.19c49

Ii,backward(t) = 7.23VRi + 16.21c2 − 158.56c31 + 136.28c36 + 127.46c46 − 52.88c49

Jo større det prognostisk index er for hver patient, jo større er dødsintensiteten.

Det ses, at den endelige model for MA 50 udfra VR og ci’erne er en forbedring af den model,der kun indeholder VR, ved at plotte begge modellers ROC-kurver. Dette ses på Figur 12.Dette er sandt for stort set alle de endelige MA modeller dannet udfra VR og ci’erne, hvilket

Figur 12:

kan ses i Bilag ?. Derfor må det kunne siges, at der ligger noget information i QTs tidsligeafhængighed af RR, der kan øge prediktionsevnen i den endelig model.

Dog skal det bemærkes at der ikke tages højde for dynamikken i disse endelige modeller. Detteses, når man kigger nærmere på ci’erne i de endelige modeller. For alle MA modellerne har viderfor angivet dem i følgende tabel.MA MA MA MA MA MA MA MA MA MA MA MA MA5 10 21 f 21 b 35 f 35 b 50 f 50 b 100 f 100 b 150 f 150 b 200

VR VR VR VR VR VR VR VR VR c2 VR VR VRc3 c6 c13 c13 c2 c2 c2 c2 c14 c14 c46 c46 c135

c16 c16 c30 c30 c31 c31 c46 c46 c2 c195

c3 c2 c14 c9 c36 c36 c96 c96 c31

c9 c29 c13 c46 c46 c2 c65

c17 c20 c49 c49 c31 c75

c9 c65 c121

c73 c146

c75

c95

Et generelt mønster falder ikke umiddelbart i øjnene, men bemærk de koefficienter, der erangivet med fed skrift. Disse udgør enten den 4. eller 5. sidste ci i modellen. Disse to er for-bundet med en tidslig dynamik: Den 5. sidste er for alle modeller ’dykket’ inden halen (seafsnit.. figur..), og den 4. sidste er den første ci i halen. I alle modeller, der kan siges at haveen hale (dvs. MA 10 til MA 200) er enten den 4. sidste, den 5. sidste eller begge med i denendelige model - i hvert fald for én af procedurerne. Af figur ?? ses det, at der netop på dissekoefficienter er en markant stor forskel mellem de døde og overlevendes gennemsnit. Samletkan de to koefficienter altså vise noget om forskellen i dynamik mellem døde og overlevende.

At generelt blot én af de to er med i modellen, kan skyldes, at der en vis Pearsson korrelationmellem dem. Denne korrelation gør at de deler noget af den information, der kan bruges

28

Page 29: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

til at adskille de overlevende fra de døde. Fordi Cox-analysen søger at minimere antallet afbaggrundsvariable vil den altså som oftest kun inkluderer én af koefficienterne i den endeligemodel.

Vi ser altså sporet af et generelt mønster i de koefficienter, der kommer med i de endeligemodeller, men pga. korrelationer mellem koefficienterne ser vi kun en flig af den dynamik, derkunne ligge til grund for dette mønster, hvis en sådan dynamik eksisterer.

For at kunne undersøge eventuelle dynamikker benytter vi derfor også patienternes scores påprincipalkomponenterne (PCSi) i Cox analysen. Hver Principal Komponent er en vægtningaf samtlige koefficienter, og håbet er at de hver især vil kunne opfange en unik dynamik.PCSi’erne er per konstruktion ukorrelerede og derved undgås at nogle PCSi, der kan adskilledøde fra overlevende, udelades af Cox analysen, fordi en anden principal komponent indeholdernoget af den samme information.

9 Resultater for Cox Analyse - Principalkomponenter

Lige som i tilfældet med ci’erne, bliver Cox Analysen indledt med en univariat analyse af VR,cc og PCSi’erne. VR er som før

statistisk signifikant for alle MA modellerne - selvfølgelig med samme χ2-værdi, da det ersamme test. De principal komponenter, der blev testet univariat signifikant for en række afmodellerne, er angivet her. Resten ses i bilag.

MA10 MA20 MA35 MA50 MA100Variabel χ2 Variabel χ2 Variabel χ2 Variabel χ2 Variabel χ2

VR 81.14 VR 81.14 VR 81.14 VR 81.14PCS4 30.40 PCS4 52.29 PCS6 31.95 PCS6 47.30 PCS8 38.30

cc 29.63 cc 29.80 PCS5 30.60 cc 27.70 cc 27.69PCS34 29.29 PCS24 22.02 cc 29.41 PCS5 12.94 PCS5 26.60PCS2 PCS5 18.74 PCS2 14.29 PCS3 12.04 PCS124 12.03

PCS17 6.33 PCS3 9.18 PCS2 8.57 PCS3 7.52PCS3 6.28 PCS4 7.16 PCS4 7.42 PCS2 5.70

PCS6 5.09 PCS34 4.59 PCS7 5.32PCS21 3.89

Det, der især bør bemærkes er, at for ingen af disse modeller er PCS1 univariat signifikant.Dette stemmer overens med at c0 og c1 heller ikke er statistisk signifikante univariat, da viså i figur ?? at PC1 afhænger stærkt af c0 og c1. Selvom PC1 ellers er den "retning af data-skyen"hvor patienterne varierer mest, kan man altså ikke ud fra patienternes score på denafgøre om de er i høj- eller lavrisiko gruppen.

Bemærk at det ikke nødvendigvis er de PCi, der beskriver mest variation i datasættet, somhar den største prognognostiske information. Det er f.eks muligt, at overlevende og dødesdatapunkter ligger i to klart adskilte grupper i vektorrummet, men at de er ens fordelt i ret-ningerne med mest variation, mens adskillelsen sker i den retning med mindst variation.

29

Page 30: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

Efter de univariate analyser foretages de multivariate. Idet der var færre univariat signifikanteparametre bliver de endelige modeller mere stabile med PCSi’erne end med ci’erne.

For MA 50 fik vi følgende endelige model:

MA 50 Forward Selection og Backward EliminationVariable Friheds- Parameter Standard Teststr. p-værdi for

grader Estimat, β Afvigelse, SE(β) χ2 Teststr.VR 1 6.25160 1.14914 29.5964 <0.0001PCS2 1 15.04083 6.23215 5.8246 0.0158PCS6 1 76.09803 14.67543 26.8884 <0.0001

Denne model har en χ2-værdi på 130.5568 og giver følgende prognostiske index for patienti:

I = 6.25160 ·VRi + 15.04083 · PCS2,i + 76.09803 · PCS6,i

Tilsvarende resultater er at finde for de andre modeller i Bilag ?. For overskuelighedens skyldvil vi i følgende tabel bare angive de parametre, der indgik i de endelige modeller, for at un-dersøge nogle generelle mønstre i PCi’erne.

MA 5 MA 10 MA 21 MA 35 MA 50 MA 100 f MA 100 b MA 150 f MA 150 b Ma 200VR VR VR VR VR VR PCS3 VR PCS2 VR

PCS4 PCS3 PCS3 PCS2 PCS2 PCS2 PCS2 PCS9 PCS9 PCS70

PCS4 PCS4 PCS5 PCS6 PCS7 PCS7 PCS13 PCS134 PCS104

PCS5 PCS6 PCS8 PCS8 PCS174 PCS174 PCS136

PCS6 PCS34 PCS12 PCS12 PCS70 PCS70 PCS138

PCS17 PCS52 PCS52 PCS125 PCS125

PCS58 PCS5 PCS3

PCS21 PCS5

PCS98 PCS97

Ligesom i de endelige modeller for ci’erne ryger cc ud i den multivariate analyse fordi den erhøjt korreleret med de andre parametre.

Principal komponenterne fra forskellige modeller er ikke direkte sammenlignelige fordi de erudspændt i forskelligt dimensionale rum.

Vi leder derfor eventuelle generelle mønstre ved at plotte de forskellige PCi fra de forskelligeMA modeller i samme plot.

Det viser sig, at PC3 i MA 10 og 21 er af samme form som PC2 i MA 35, 50 og 100 - se figur13. Denne komponent går altså igen fra model til model. Tilsvarende går PCS6 igen i MA 21,35 og 50 - disse tre PCSi er også af samme form; se figur 10

Ud over dette ser vi også, at de to multivariate procedurer hyppigere kommer frem til sammeendelige model i MA modellerne med PCSi’er end med ci’er. Samtidig er det ved PCA ogsålykkedes at skære lidt ned på antallet af variable og der er færre vekselvirkninger mellemvariablene i de endelige modeller. Få variable letter beregningerne og gør at der er færredynamikker og vekselvirkninger, at forsøge at fortolke i den endelige model. Få vekselvirkninger

30

Page 31: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

Figur 13: De to 3. Principalkomponenter fra Ma 10 og MA 21, plottet sammen med de to 2.Principal Komponenter fra MA 35 og Ma 50.

letter i sig selv også fortolkningen. Disse tre kriterier, dvs at forward og backward giver sammemodel, at der er så få variable så muligt, og at der er begrænsede vekselvirkninger mellemvariablene, er således vigtige for at bedømme hvor gode vores modeller er.

Hovedkriteriet er dog at modellen giver forbedret forudsigelse af død, dvs en bedre sensitivitetfor en given specificitet på en ROC-kurve. Dette er undersøgt, og det viser sig at alle pånær én model med PCSi’er konsekvent er bedre end den model, som blot indeholder VR. Vikan derfor konkludere at der er kommet ny information ind i overlevelsesmodellerne ved atinkludere QTs tidslige afhængighed af RR, samt at modellerne generelt bliver bedre ved brugaf PCSi’er end med ci’er.

Den eneste model der på et enkelt område er dårligere end VR-modellen er MA 5, hvilketkan tyde på at det måske er en dynamik længere tilbage end denne models fem slag, der harbetydning for at adskille patientgrupperne.

På figur 14 ses ROC-kurven for MA 50 modellen. ROC-kurver for de andre modeller er vist ibilag. MA 50 modellen er udvalgt fordi den opfylder kriterierne for at udvælge en god modelbedst: den viser en markant forbedring i forhold til VR-modellen, den er stabil, den har blottre variable, og de variable, der indgår, vekselvirker ikke. Bemærk, at de variable som indgårer netop de, der går igen fra model til model: VR, PCS6 og PCS2.

To andre modeller havde lige så flotte ROC-kurver som MA 50. Disse var MA 21 og MA 150både backward og forward. Ingen af disse tre modeller er bedre end de andre på alle intervalleri grafen. Dog er der ulemper ved MA 21 og 150 modellerne:

For MA 150 er multivariat procedurerne er ikke enige om den endelige model. Derudoverses det, at VR ikke indgår i den endelige model for MA 150 ved backward elimination -faktisk udtages den allerede ved første trin. Dette skyldes, at alle principal komponenterne erukorrelerede, men at de alle er en smule korrelerede med VR. Når backwards eliminationen

31

Page 32: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

ROC−kurve for bedste model udfra principal komponent scorerne

1−Specificiteten

Sen

sitiv

itete

n

Modeller:

tilfældigkun med VR

MA 50 med principal komponent scorerneoptimal

Figur 14: Her ses ROC-kurven for MA 50 modellen med principalkomponenter sammenlignetmed modellen som blot indeholder VR. På figuren vises også kurven for tilfældig inddeling afhøj- og lavrisikogrupper (diagonalen) og den optimale kurve, som danner en ret vinkel.

kun kan tage én variabel ud ad gangen, bliver det i dette tilfælde VR, fordi al den informationden indeholder også til dels findes hos de medtagne principal komponenter. Når VR ikke ermed i den endelige model, ses det, at der skal langt flere principal komponenter til at give densamme information i forhold til forward modellen, hvor VR er med. ROC-kurven for de to ernæsten ens. Det samme er iøvrigt tilfældet for MA 100 modellerne.

Selv for forward-modellen i MA 150 er der relativt mange variable i modellen (6 stk) og mange

32

Page 33: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

Figur 15: Her plottes patient-datapunkterne i det plan som VR og PCS6 udspænder

af disse er PCi’er med foruroligende lille egenværdi, jvf diskussionen i afsnit 6.3. Det sammegælder MA 21 modellen, som ligeledes har seks variable og inkluderer PC17. Derudover er deri MA 21 mange vekselvirkninger imellem variablene.

Alt i alt virker MA 50-modellen som den bedste. Vi ser derfor nærmere på denne model.

Det bemærkes dog først, at MA 35 og MA 200 også gode i området, hvor man ville prioritereren høj specificitet (se figur i bilag). Dette er tilfældet hvis man vil sikre sig mange korrektklassificeret højrisikopatienter, feks hvis man ordinerer dyr eller farlig medicin og gerne vilvære helt sikker på at patienten er i overhængende fare for at dø. Til videre analyser er detderfor vigtigt at gøre sig nogen overvejelser om hvilken model man vil fortsætte med, nårberegninger, der er involveret, er så omfattende.

I Figur 15 ses, hvordan værdierne for PCS6,i- og VRi fordeler sig for de patienter der døde ogde der overlevede.

Dette plot tydeliggør, at der er ekstra information at hente i PCi’erne. Det ses at de døde haren forholdsvis højere VR end de levende, som vist i afsnit 4.2. PCS6 nuancerer adskillelsen.Det ses, at hvis man betragter de patienter, der har lav VR og negativ PCS6, overlever de stortset alle sammen. Tilsvarende dør næsten alle de, der har høj VR og positiv PCS6. Dette givermindre fejlkatagorisering end hvis man kun betragter VR. Man kan argumentere på sammemåde for PCS2, men det er knap så udpræget. Det er altså vist at netop den kombination afci som ligger i disse PCi har ekstra prognostisk information.

Det prognostiske index angiver en linje, eller flade12; der alt efter hvilket cut-off man vælgerrykkes det til den ene eller den anden side. Denne flade adskiller patienterne, så de, der liggerpå den ene side, er lavrisiko patienter og dem på den anden er højrisikopatienten.

12hvis der er mere end 2 baggrundsvariable og der dermed udspændes et rum større end 2-D af hver patientsinformation

33

Page 34: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

Hvis man forestiller sig at patienternes information lå i et 3-dimensionelt rum, som de gøri tilfældet med MA 50, ville man intuitivt kunne forstille sig, at de døde måske snarere varoutliers i forhold til en normal VR-, PCS2- og PCS6-værdi. For at identificere hvor disse outlierskunne ligge og dermed hvilke dele af det 3-dimensionele rum der var højrisiko, kunne manbenytte en cluster analyse, der er et redskab som bruges til at gruppere data i et vektorrumefter deres indbyrdes afstand.

10 Forbedringer af modellen

De foregående afsnit har vist, at MA modeller og PCA foretaget på modellerne indeholderekstra prognostisk information ud over VR. MA modellen var et forsøg på at forbedre densimple lineære regression som nævnt i 4.2, men der er dog mange muligheder for at forsøge atforbedre modellen yderligere.

10.1 Opdeling for dag og nat

En anden mulig forbedring af modellen er at opdele datasættet i mindre områder ud fra etfysiologisk argument. Da målingerne er taget over 24 timer, inderholder datasættene for hverpatient både QT og RR for vågen tilstand og for sovende tilstand. Det må forventes, at h-jerterytmerne er forskellige for vågen og sovende tilstand, og at der derfor også er forskel idynamikken. Derfor er der muligvis også forskel i den prognostiske information mellem de to.Der tages igen udgangspunkt i MA50 modellen, men denne gang opdeles datasættet i to tid-slige områder. Et fra kl 05-21, som repræsenterer den vågne tilstand i dagstimerne, og et frakl 21-05, der repræsenterer den sovende om natten. Herefter foretages en MA50 model ogefterfølgende PCA på de to forskellige tidsrum. Der er ingen garanti for, at patienterne rentfaktisk har været hhv vågen og sovende i de to tidsrum, men det må antages, at størstedelenhar.Der er fysiologiske argumenter både for og imod, at denne opdeling vil kunne give en større

Figur 16: Her ses et koefficienter for nat, dag og 24 timer for hhv en udvalgt patient og som gennemsnit foralle patienter

prognostisk information. I vågen tilstand er der en større belastning af hjertet, og muligvis vil

34

Page 35: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

det gøre, at et mere udsat hjerte vil vise tegn på ikke at kunne klare belastningen lige så godtsom hos en rask person.På den anden side kan belastningen og de oplevelser patienterne har i løbet af dagen være såforskellige, at de muligvis ikke kan sammenlignes, og dermed give mindre prognostisk infor-mation. I sovende tilstand ville patienternes forløb og oplevelser være sammenlignelige, hvilketmuligvis vil være bedre til at adskille høj- og lavrisiko patienter.

Af figur 16 ses koefficienterne for dag og nat opdelingen samt for hele døgnet for hhv enudvalgt patient og for gennemsnittet af alle patienter med spredning. Det ses, at der er enforskel på dynamikken mellem de forskellige opdelinger for den udvalgte patient, men der serikke ud til at være nogen speciel forskel for gennemsnittet.Principalkomponenterne for dag, nat og hele døgnet blev sammenlignet. Der er en god ov-erenstemmelse mellem de forskellige opdelinger til og med den 5. principalkomponent. Bådedynamik og værdier er meget ens. Nat-komponenten afviger dog tydeligt mere end dag-komponenten fra hele døgnet for de fleste principalkomponenter. På figur 17 er 3. komponentvist, og der ses en klar forskel i værdier men dog ikke i dynamik. Dette skyldes nok, at nat-komponenten er baseret på blot 8 timers data, mens dag-komponenten er baseret på 16 timerud af de 24. Den mindre mængde data gør, at der kan ske en større ændring.

Der blev foretaget Cox analyser på de opnåede principalkomponenter samt VR udregnet

Figur 17: Her ses den 3. principalkomponent for dag, nat og hele døgnet

for dag og nat. De univariat signifikante variable indgik i forward og backward procedurer, ogudfra dette blev fundet to endelige modeller for dagen og natten.Dagen:

λ(t) = λ0(t) · e6.1·qtrr_vari+0.25·Prin2+0.61·Prin6+(−0.28)·Prin34+0.32·Prin35

Natten:

λ(t) = λ0(t) · e4.7·qtrr_vari+0.30·Prin7+0.40·Prin8+0.28·Prin25+0.26·Prin28

35

Page 36: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

0.0 0.2 0.4 0.6 0.8 1.0

0.0

0.2

0.4

0.6

0.8

1.0

ROC−kurve for bedste model udfra måletidspunkt

1−Specificiteten

Sen

sitiv

itete

n

Modeller:

tilfældigkun med VR

MA 50 med PCS over hele døgnetBackward MA 50 med PCS'er over dagen

optimal

Figur 18: Roc kurver for dag og nat sammenholdt med MA50 for hele døgnet

Disse to gav andledning til ROC kurver, som kan ses på figur 18. Det ses, at de ligger tæt påMA50 modellen med data fra hele døgnet.ROC-kurven for forward selection proceduren for dagen ligger næsten helt op ad ROC-kurvenfor hele døgnet. Den er en anelse dårligere på midten, men bliver så tlsvarende en anelse bedreved høj sensitivitet. For natten ligger ROC-kureven markant under den for hele døgnet især påmidten, men en lille smule højere ude i enderne. Den bedste model er klart den for backwardsproceduren for hele dagen. Den ligger over den for hele døgnet overalt, særligt har den utrolighøj specificitet og sensitivitet samtidigt.Vi må sige at være en smule skeptiske overfor dags modellen, idet forward og backward pro-cedurerne ikke giver samme endelige model for den. Det overraskende er, at backwarden, derviser sig at være markant bedre, slet ikke inkludere VR. Faktisk eliminierer proceduren densom den første.

Opdelingen om dagen indeholder en noget større prognostiske information end for hele døgnet.Dette kan muligvis skyldes det tidligere nævnte, at den noget større belastning om dagen ihøjere grad afslører hvilke patienter der har mere udsatte hjerter en andre. Denne belast-ningsfaktor mangler om natten, og derfor kan man ikke så godt definerer høj- og lavrisikopatienterne. Et svagere hjerte vil stadig kunne klare en nats søvn næsten lige så godt som et

36

Page 37: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

rask, og derfor ikke udvise nogen forskel.

11 Begrænsninger/Fremtidige perspektiver

Mulige problemer med MA-algoritme Mistro overfor haler - er de blot tilfældige, udtrykfor støj? Dette ville ændre vores konklusion drastisk Check med Randomiseret datasæt -kommer der stadig haler??

Antagelse om ens behandling -Kommentar på antagelser i Cox-afsnit? sættes de i bilag?

I Cox-analysen antages det at der ikke sker noget mellem forsøgets start og slut, der ændrer påpatienternes risiko for at dø. Det antages derfor også at behandling givet efter blodproppen,f.eks bypass-operation eller medicinering bliver tilfældigt fordelt blandt patienterne. Den in-formation, der vurderes i vores undersøgelse er ikke en del af grundlaget for hvilken behandlingder foretages, og derfor antages de to ting at være uafhængige. Det er dog muligt, at denneantagelse ikke er opfyldt. Derfor bør korrelationen mellem de parametre, vi har undersøgt, ogandre risikoparametre, f.eks. alder, undersøges.

Prospektiv undersøgelse og krydsvalidering For at følge op på vores undersøgelse, børman lave en helt ny undersøgelse. Dette skal prospektiv undersøgelse, som følger patienterneefter forsøget for at sammenholde information om risikoparametrene med om patienterne harandre karakteristika der gør de bliver særbehandlet.

Her er det nødvendigt med et endnu større patient-materiale, så man kan foretage krydsvalid-ering af undersøgelsen. Dette blev ikke gjort på vores datasæt fordi det var for lille, men ernødvendigt for at undersøge hvor stor betydning forskelle mellem patienterne har på f.eks.formen af de principalkomponenterne der indgår i de endelige risiko-modeller.

Under datamaterialet: Artefakter i EKG kan feks opstå ved anden muskelaktivitet, e.g tand-børstning.

12 perspektivering

Kan man på nogen måde se hvor stor hver enkelts hjerte infakt er og hvor i hjertet det sidder?F.eks. ved noget blodgennemstrømningsanalyse/ultralydsskanning - se hvor hjertet måske ikketrækker sig sammen. Ville dette ikke også være interessant at sammenligne og ikke kun deforskellige patienters EKG’er.

Man vil kunne bruge sådanne undersøgelser til et predikterer hvilke patienter der er i stor risikofor at dø indenfor de næste tre år. En handlingsplan for at forbedre disse patienters chancefor at overleve ville være at indoperer en pacemaker i hjertet på disse patienter. Pacemakerser dyre og sygehus/sygesectorens resourcer sætter en naturlig begrænsning på hvor mangeman kan give sådan en pacemaker. Derfor vil man vær sikker på at det er de mest udsatte(dem der nok alligevel ville dø) der fik indopereret sådan en pacemaker - og man ville derforbruge et cutoff mellem høj- og lavrisiko patienter der havde en høj specifitet. Cut-offet vælgessimpelt nok ud fra hvor mange man har råd til at give en pacemaker. Hvis man senere hen fårmulighed for at indoperer pacemakere på flere patienter, så kan cut-offet nedjusteres såledesat man får en lavere specificitet, og en højere sensitivitet? checkes om det er rigtigt. Vi burdederfor tage alle modellernes ROC-kurver op til revurdering med dette som udgangs punkt og

37

Page 38: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

måske vælge den model der er bedst i dette område af ROCkurven. Det er ikke nødvendigvisMA 50 modellen der er mest optimal i dette område. Hvis vi betragter en ROC-kurve medalle hidtige modeller ses det at være ? ,?,? og ? der er de bedste modeller i dette område.Hvis vi derefter fokuserer på disse vil den endelige model være den der har den bedste overallperformance, så den netop også ville kunne bruges hvis flere pacemaker indoperationer blevmuligt. (Spørg Jørgen om hvor mange der er råd til for tiden, og hvilket cut-off det ville svarertil).

ROCKURVER MED ALLE OG EN MED FOKUS

ROC-kurver giver kun menning at bruge i tilfælde hvor man har et binært klassificeringssystem, dvs. at det man tester for kun kan falde indenfor to grupper som f.eks. døde ellerlevende.

Man ønsker selvfølgelig altid en model der ligger tæt på 100% i begge dele. Men sådan erdet desværre aldrig. Der foretages tit "trade-offs"ved hvilket cut-off man vælger for at kunnedefinere høj- og lavrisikogrupperne. Hvis man ordinerer dyr eller farlig medicin vil man f.eks.gerne være helt sikre på at patienten er i overhængende fare for at dø. Derfor vil man vælgeet cut-off der definerer grupperne med stor/høj specificitet. Alternativt kunne man vælge etcut-off med høj sensitivitet hvis omkostningerne er relativt lave og medicin ikke har grelebivirkninger, for på den måde at komme flest mulige patienter til gavn.

Hvilke andre modeller vil man kunne undersøge? Hvis der var mere tid ville det være en godidé at checke alle de lag kombinationer mellem QT- og RR-intervallerne i ARMA modellerfor at sikre sig at der ikke var nogen, f.eks. med 20 RR lags der forbedrede MA 50 modellen.Fremgangsmåden ved at arbejde videre med at udvælge én model sikrer ikke at den modelvi når frem til er den mest optimale. Alle kombinationer skal checkes for at sikrer det, menberegningstiden er så omfattende at en sådan undersøgelse ikke var mulig i dette projekt.Vi valgte i stedet at tage det i trin, og konsekvent gå videre med den model der gav debedste resultater. Først at sammenligne forskellige Moving Average modeller (her blev 50lags modellen valgt ud), dernæst udvide den model til forskellige Auto Regressive MovingAverage modeller (dette forbedrede ikke MA 50 modellen), for til sidst at kigge nærmere påtidsinddelingen for at se hvornår der var mest prognostisk styrke; når patienten havde væretvågen, eller når patienten har sovet. Ikke llineære sammenhænge. Tidslige perspektiver skalman nok holde fast i eftersom at denne analyse visser hvor meget information der ligger i detidligere hjerteslag.

13 Konklusion

Dette projekt har undersøgt den tidslige sammenhæng mellem hjertets sammentrækningstidog hjerteslagets længde. Fra den model, som blev opstillet, har vi forsøgt at finde parametre,som kan indikere forhøjet risiko for at dø efter en akut blodprop i hjertet. Vi har fundet enoverlevelsesmodel, som forbedrer tidligere resultater.

Den parameter, vi sammenligner med, er VR, et mål fundet ud fra tidligere undersøgelser pådet datasæt, vi benytter. Vores endelige overlevelsesmodel inkluderer udover VR to parametre,som stammer fra vores analyse af den tidslige dynamik.

For at komme frem til denne model, opstiller vi først en lineær regressionsmodel, som forudsigerQT (sammentrækningstiden) ud fra hjerteslagets længde. Modellen, som er en Moving Average

38

Page 39: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

model, forudsiger den overordnede variation i QT ret godt. Syv modeller er opstillet sommedtager fra 5 til 200 slag tilbage i tiden.

De koefficienter (ci), vi fandt for modellerne, viser en meget karakteristisk form. Gennemsnit-tene for de første fem har næsten ens dynamik fra model til model, hvilket bekræfter, at derer en bestemt tidslig dynamik i data. Det viser sig samtidig, at de, der dør, i gennemsnit harhøjere værdi for næsten alle ci end de, der overlever. Herved ses, at den tidslige dynamik erforskellig for overlevende og for døde.

Målet for resten af projektet er at finde ud af mere om hvor denne forskellighed ligger:

ci’erne bliver vha Cox-analyse brugt til at opstille overlevelsesmodeller. Disse viser sig at værebedre end den, som blot medtager VR. De endelige modeller er dog ustabile og den tidsligedynamik kommer ikke frem på grund af korrelation mellem ci’erne.

Principalkomponentanalyse bliver anvendt til at finde de kombinationer af ci, hvor patien-terne varierer mest. Disse komponenter er ukorrelerede og hver afspejler en uafhængig tidsligdynamik i datasættet. Igen ser vi samme form fra model til model.

Ligesom ci’erne bliver principalkomponenterne vha Cox-analyse brugt til at opstille over-levelsesmodeller. Disse er forbedrede både i forhold til den, som blot medtager VR, og de sommedtager ci’er. To bestemte komponenter går igen i flere modeller, og den, model som bliverudvalgt som bedst, indeholder netop disse to komponenter.

Ud fra de ny variable i denne endelige model kan man grafisk se forbedringen i adskillelsenaf døde og overlevende patienter. Forbedringen er markant i forhold til den model, som kunindeholder VR. Der er altså ny information til stede. Det synes således at være en god idé atkigge på den tidslige dynamik i hjerterytmen.

Sluttelig bemærkes det, at for vores datasæt kunne risiko-forudsigelsen yderligere forbedresved at benytte en model baseret udelukkende på målinger fra dagstimerne. Dette kan måskeskyldes, at forskellen mellem overlevende og døde især optræder når hjertet er under en visbelastning.

Litteratur

[1] Per Kragh Andersen og Michael Væth: Statistisk analyse af overlevelsesdata - ved lægev-idenskablige undersøgelser.FADL’s forlag pp 13-29, 61-104(1984)

[2] Berit T. Jensen, Steen Z. Abildstrom, Charlotte E. Larroude, Erik Agner, Christian Torp-Pedersen, Ole Nyvad, Michael Ottesen, Kristian Wachtell og Jørgen K. Kanters: QTdynamics in risk stratification after myocardial infarction.Heart Rhythm Vol 4, Nr 2 pp. 357-364 (2005)

[3] Jørgen KantersMundtlig korrenspondance

[4] Neil Muller, Lourenco Magaia and B .M. Herbst: Singular Value Decomposition, Eigen-faces, and 3D Reconstructions.SIAM Review Vol 14, Nr 3 pp. 518-545 (2004)

39

Page 40: Numerisk Analyse af QT-dynamik i Patienter med Blodprop i ...psi.nbi.dk/groups/psi/wiki/Numerisk Analyse af QT...Numerisk Analyse af QT-dynamik i Patienter med Blodprop i Hjertet Ninna

[5] Niels Vigand Pedersen: Lineær Algebra.Københavns Universitets Matematisk Afdeling pp. 123-128 (2000)

[6] Olav Sand, Øystein V. Sjaastad og Egil Haug: Fysiologi - En grundbog.Munksgaard Danmark pp 278-331 (2004)

[7] John R. Taylor: An Introduction to Error Analysis - The Study of Uncertainties in Phys-ical Measurements.University Science Books Third Edition (1997)

40