Download pdf - FACULTEIT GENEESKUNDE AMBTELIJKE REGISTRATIES VOOR … · Van harte wil ik mijn promotoren Prof.dr. M. van Sprundel en Prof. dr. G. Molenberghs bedanken. Zij hebben mij aangemoedigd

FACULTEIT GENEESKUNDE

AMBTELIJKE REGISTRATIES VOOR EEN EVALUATIEF

GEZONDHEIDSBELEID.

ASPECTEN VAN BELEIDSONDERBOUWING OP LANDELIJK,

INTERMEDIAIR EN LOKAAL NIVEAU

Proefschrift voorgelegd tot het behalen van de graad van doctor in de medische wetenschappen aan de Universiteit Antwerpen te verdedigen door

WILLEM AELVOET

Promotor: Prof.dr.Marc van Sprundel (Universiteit Antwerpen)

Co-promotor: Prof.dr.Geert Molenberghs (Universiteit Hasselt)

Antwerpen, 2008

2

Samenstelling van de PhD jury

Promotoren:

prof. dr. M. van Sprundel Universiteit Antwerpen

prof. dr. G. Molenberghs Universiteit Hasselt

Doctoraatscommissie:

prof. dr. L. Bossaert Voorzitter Universiteit Antwerpen

prof. dr. M. Elseviers Universiteit Antwerpen

prof. dr. H. Meulemans Universiteit Antwerpen

Externe leden:

prof. dr. G. De Backer Universiteit Gent

prof. dr. J. Kips Katholieke Universiteit Leuven

Ambtelijke registraties voor een evaluatief gezondheidsbeleid. Aspecten van

Beleidsonderbouwing op landelijk, intermediair en lokaal niveau

Willem Aelvoet

ISBN 978-90-5728-087-0 Vakgroep Epidemiologie en Sociale Geneeskunde Faculteit Geneeskunde Universiteit Antwerpen Universiteitsplein 1 B-2610 Antwerp Belgium E-mail [email protected]

3

INHOUDSOPGAVE

Samenstelling van de PhD jury ...............................................................................2 Inhoudsopgave ......................................................................................................3

Dankwoord.........................................................................................................................5

Lijst van afkortingen.........................................................................................................8

Glossarium .......................................................................................................................10

Inleiding: Een door evaluatie bijgestuurd gezondheidsbeleid.....................................12

DEEL I: KRITISCHE LITERATUURSTUDIE ..........................................................17

Hoofdstuk 1: Administratieve gegevensbanken: kwaliteit van de gegevens ..............19 1.1 Het beoordelen van de kwaliteit van gegevens..................................................21 1.2 Doodsoorzakenstatistiek. Kwaliteit en volledigheid van de gegevens. ................59 1.3 Besluit ..........................................................................................................71

Hoofdstuk 2: Gebruik van administratieve gegevensbanken in een perspectief van een kwaliteitsvol volksgezondheidsbeleid......................................................................73

2.1 Kwaliteit........................................................................................................76 2.2 Benadering gebaseerd op kwaliteitsindicatoren.................................................89 2.3 Benadering gebaseerd op incidenten. .............................................................115 2.4 Het ontsluiten van kwaliteitsindicatoren. .......................................................125 2.5 Besluit .........................................................................................................139

Hoofdstuk 3: Methodologische aspecten .....................................................................141 3.1 Audit: Statistische Methodologie...................................................................141 3.2 Statistische aandachtspunten bij het omgaan met en rapporteren van kwaliteitsgegevens: kleine aantallen, correlatie, case mix variatie en meervoudig gelijktijdig toetsen. ............................................................................................156 3.3 Methoden voor het beoordelen van kwaliteit/performance...............................160 3.4 Besluit .........................................................................................................173

DEEL II: CASUSSEN...................................................................................................175

Hoofdstuk 4: Kwaliteit van administratieve gegevens in België: overlijdensstatistieken en MKG...................................................................................177

4.1 Kwaliteit van codering en certificatie in Vlaanderen en België, 1980-1997.......177 4.2 Kwaliteit van de gegevens in een prospectief financieringssysteem..................197 4.3 Algemeen besluit..........................................................................................217

4

Hoofdstuk 5: Kwaliteit van zorgen ...................................................................219 5.1 Inleiding: Kwaliteit van zorgen, organisatorische cultuur en adequate gegevens.219 5.2 Kan het screenen voor interziekenhuis verschillen in keizersnedencijfer bij laagrisico verlossingen door middel van administratieve gegevens bijdragen tot kwaliteitsinitiatieven in de gezondheidszorg? ......................................................226 5.3 Interziekenhuis vergelijking van letaliteitcijfers na een opname voor acuut myocardinfarct. .................................................................................................268 5.4 Kwaliteit van zorgen: Algemeen Besluit ........................................................298

Hoofdstuk 6: Complementariteit van gegevensbanken. Gebruik van routinematig verzamelde gegevens om de reproductieve gezondheid te beoordelen in een gemeenschap gevestigd rond twee verbrandingsovens ..............................................301

6.1. Inleiding .....................................................................................................302 6.2 Methoden ....................................................................................................304 6.3 Resultaten....................................................................................................307 6.4 Bespreking...................................................................................................313 6.5 Besluit .........................................................................................................317

ALGEMEEN BESLUIT EN AANBEVELINGEN.....................................................319

SAMENVATTING........................................................................................................323

SUMMARY....................................................................................................................327

Literatuur.......................................................................................................................331

Curriculum vitae Willem H. G. Aelvoet ......................................................................397

Literatuurlijst Willem AELVOET ..............................................................................399

5

Dankwoord

Pas op het einde van je proefschrift realiseer je hoeveel mensen, elk op hun manier,

bijgedragen hebben tot het ontstaan en welslagen ervan. Dan pas ga je beseffen dat het

dankwoord niet alleen een academische geplogenheid is maar een te summiere weergave

van een groeiproces dat je nooit alleen zou voltooid hebben.

Van harte wil ik mijn promotoren Prof.dr. M. van Sprundel en Prof. dr. G. Molenberghs

bedanken. Zij hebben mij aangemoedigd om dit avontuur te beginnen, door te zetten in

ogenblikken van ontmoediging en te voltooien. Tijdens deze zesjarige tocht hebben ze mij

begeleid in mijn zoektocht naar oplossingen voor de problemen die zich stellen wanneer je

met administratieve gegevens werkt, en me geholpen wanneer ik in de knoei geraakte. Van

Prof. dr. van Sprundel leerde ik aandacht te schenken aan het detail en toch de grote lijn

niet uit het oog te verliezen. Hij uitte zijn bedenkingen en suggesties op een altijd

vriendelijke en rustgevende manier. Prof. dr. G. Molenberghs was de statistische behoeder

van dit proefschrift, een klankbord en hulp voor het proefschrift in zijn geheel. Met beide

promotoren heb ik aan een aantal projecten gewerkt onder meer de Neerland studie, de

codeerstudie, het keizersnedencijfer en het letaliteitcijfer na een opname voor een acuut

myocardinfarct. Maar bovenal waren beide promotoren altijd “bereikbaar”, waarvoor ik

hen zeer dankbaar ben.

Veel andere mensen hebben op een of ander ogenblik een rol gespeeld in mijn

ontwikkeling naar toegepast wetenschappelijk onderzoek. De professoren P. Mercenier en

H. Van Balen leerden mij wat volksgezondheid is. Professor Lagasse begeleidde mijn

eerste stappen in het schrijven van een wetenschappelijke tekst. De professoren H.

Callaert, N. Veraverbeke en P. Jansen, verwelkomden en gaven raad aan een overjaarse

ambtenaar met Grieks-Latijnse roots om niet helemaal verloren te lopen in de wereld van

de statistiek.

Professor A. Meheus en de vakgroep ESOC hebben mij over mijn laatste aarzeling

geholpen om eraan te beginnen. Aan allen mijn dank.

6

Zonder Frieda, Josie, Rita, Luc, Peter, Francis, Karel en Johan, mijn collega’s van de

Vlaamse Gemeenschap, zou het codeerverhaal nooit het licht gezien hebben. Ook Nathalie

T, Nathalie V, Francis L. en Francis W., Greet H., mijn collega’s van de FOD

Volksgezondheid, dank ik voor de steun, het geduld met een soms zenuwachtig celhoofd,

het nalezen en aanvullen van teksten en de samenwerking aan de eerste multidimensionele

feedback aan de ziekenhuizen. Mijn dank ook aan Dr. I. Mertens, mijn diensthoofd, die mij

inwijdde in de complexe wereld van de Minimale Klinische Gegevens.

Graag wil ik ook de mensen bedanken die met mij de Neerlandstudie tot een goed einde

brachten: Dhr J. Vanoverloop, Dr. G. Schoeters en de Professoren M. van Sprundel en G.

Molenberghs.

Voor de studie over het keizersnedencijfer kon ik rekenen op de hulp van mijn collega

Francis Windey (hij maakte onder meer de database aan, een hele opdracht) en van de

Professoren P. Van Reempts, H. Verstraelen, G.Molenberghs en J.M.Foidart; voor het

AMI-gerelateerde letaliteitcijfer op collega Nathalie Terryn (zij stelde de database samen,

deed de meeste analyses en realiseerde de oefening over de transfer van AMI patiënten) en

de input van de Professoren J.L.Van Overschelde, C.Vrints, G.De Backer en M.van

Sprundel. Voor de studie over miscoding dank ik mijn collega’s auditeurs en in het

bijzonder Myriam, mijn collega’s van de cel Studies en Dr C. Faes.

Verder een blijde gedachte aan de collega’s van de dienst Datamanagement. Zij waren

steeds bereid om te helpen en het ambtelijk leven te doen leven.

Ook dank aan mij hiërarchische oversten, die mij de gelegenheid gaven mij te verdiepen in

de noodzakelijke literatuur om de voormelde studies te onderbouwen.

Een warme gedachte aan mijn overleden ouders, die mij een warm nest bezorgden en de

mogelijkheid gaven om te studeren, aan mijn schoonvader, mijn schoonzoon, mijn

(schoon)zussen en (schoon)broers, (schoon)tantes en schoonoom.

7

Tenslotte ben ik aan Martine, Evelyne en Christian, Thomas en Kathy, en Stéphane veel

verschuldigd voor de warmte die ze me gaven tijdens het langdurige proces dat tot dit

proefschrift leidde en waarbij zij al te vaak verwaarloosd werden.

Martine gaf mij sterkte, ook wanneer zij meer nodig had dan de hulp die ik haar gaf. Ik

hoop het goed te kunnen maken.

8

Lijst van afkortingen ACOG American College of Obstetricians and Gynecologists AHRQ Agency for Healthcare Research and Quality AIM Acuity Index Method AMI Acuut MyocardInfarct AMI-LC Letaliteitcijfer tgv AMI APACHE Acute Physiology And Chronic Health Evaluation AP-DRG All Patients Diagnosis Related Groups APR-DRG All Patients Refined Diagnosis Related Groups AROC Area under the Receiver Operating Characteristic curve BI (OG;BG) Betrouwbaarheidsinterval (Ondergrens; Bovengrens) CABG Coronary Artery Bypass Graft CAD Coronary Artery Disease CEA Carotisendarterectomie CHD Coronary Heart Diseases (Coronaire hartaandoeningen) CHF Congestive Heart Failure COLD Chronic Obstructive Lung Disease CQI Continuous Quality Improvement CR Comparability ratio CSI Computerized Severity Index CVA CerebroVasculair Accident DRG Diagnosis Related Groups GEE Generalized Estimating Equations HCFA Health Care Financing Administration HMO Health Maintenance Organization ICC Intraclass Correlation Coefficient ICD-9(-CM) International Classification of Diseases, Ninth Revision, (Clinical

Modification) IHD Ischemic Heart Diseases (Ischemische hartziekten) IQI Inpatient Quality Indicators KS Keizersneden KSC Keizersnedencijfer LBTB Linker Bundel Tak Blok MAS Meconium Aspiratie Syndroom MKG Minimale Klinische Gegevens MMPS Medicare Mortality Predictor System MONICA Multinational Monitoring of Trends and Determinants in Cardiovascular

Disease NEC Not Elsewhere Classified NHQR National Healthcare Quality Report NICU Neonatal Intensif Care Unit NIS Nationaal Instituut voor de Statistiek NOS Not Otherwise Specified NPV Negative Predictive Value (negatieve voorspellende waarde) NSTEMI Niet- ST segment Elevatie MyocardInfarct OR (OG;BG) Odds Ratio (Ondergrens; Bovengrens)

9

PCI Percutaneous Coronary Intervention PMC Patient Management Categories PPCI Primary Percutaneous Coronary Intervention PPS Prospective Payment System, Prospectief financieringssysteem PPV Positive Predictive Value (positieve voorspellende waarde) PSI Patient Safety Indicators PTCA Percutaneous Transluminal Coronary Angioplasty (balloon) QI Quality Indicator (Kwaliteitsindicator) RDS Respiratory Distress Syndrome (Hyaliene membraanziekte) ROC Receiver Operating Characteristic curve ROM Risk of mortality RR Relatief Risico SOI Severity of illness SCD Sudden Cardiac Death SES Sociaal-economische Status SMR Standardised Mortality Ratio SPE Studiecentrum Perinatale Epidemiologie STEMI ST segment Elevatie MyocardInfarct TTN Tachypnee van de neonaat VBAC/VBS Vaginal Birth After Cesarean (Section)/Vaginale Bevalling na Sectio VRGT Vlaamse Vereniging voor Respiratoire Gezondheidszorg en

Tuberculosebestrijding ZH Ziekenhuis

10

Glossarium

TERM Definitie/Omschrijving

Administratieve gegevens

alle types en bronnen van gegevens bedoeld voor de administratie (van de gezondheidszorg)

Benchmark een benchmark is een methode om de prestatie van verschillende systemen, apparaten of organisaties met elkaar te kunnen vergelijken.

Capitation vast periodiek bedrag per patiënt

Case mix is een manier om het product of de output van een ziekenhuis te definiëren door klinisch homogene groepen van patiënten te identificeren, die een zelfde “pakket” behandelingen, testen en diensten gebruiken.1

Diagnosis Related Group (DRG)

Case mix maat die in het prospectieve financieringssysteem (PPS) van Medicare gebruikt wordt voor de omschrijving van ziekenhuisdiensten en gebaseerd is op de hoofddiagnose, nevendiagnoses, chirurgische ingrepen, leeftijd, geslacht en de aanwezigheid van complicaties.”2

Fee for service terugbetaling per prestatie

Health Maintenance Organization

voor een vast periodisch bedrag per patiënt worden gezondheidszorgen verstrekt aan de leden ongeacht de diensten die werkelijk verstrekt werden

Major Diagnostic Category (MDC)

Mutueel exclusieve categorieën van hoofddiagnoses, gegroepeerd per lichaamsstelsel, die de basis vromen voor de DRGs

Managed care Zorgmanagement

Doeltreffendheid Beantwoordt de vraag in welke mate een behandeling het beoogde resultaat bereikt. Men onderscheidt de "potentiële doeltreffendheid" ("efficacy") van een behandeling/programma van zijn "reële doeltreffendheid" ("effectiveness") op basis van het feit dat ze vastgesteld wordt in een experimentele gecontroleerde context (klinische studie), die in ideale omstandigheden uitgevoerd werd, en niet gemeten werd na een werkelijke toepassing van de behandeling/ programma op bevolkingsniveau.

Doelmatigheid "Rendement" van een collectief uitgeoefende medische activiteit; verband tussen de kosten (financiële, menselijke en materiële hulpbronnen) van die activiteit en de voordelen voor de betrokken bevolking (afname van de morbiditeit of sterfte, individueel lijden en ongelijkheid t.o.v. de ziekte)

11

Epidemiologie Geneeskundige discipline waar de factoren bestudeerd worden die een rol spelen bij het optreden van ziekten en de verschillende ziekteverschijnselen alsmede de frequentie ervan, de geografische en sociaal-economische spreiding en de evolutie

Letaliteit Verhouding dodelijke gevallen van een aandoening op het aantal gediagnosticeerde gevallen

Mortaliteit Aantal sterfgevallen ten gevolge van een bepaalde ziekte binnen de bevolking, in het algemeen gedurende een jaar,

Statistische significantie

Verschil vastgesteld tussen twee groepen patiënten of ingrepen enz., is statistisch relevant op niveau 5% (of 1%) als er minstens 5% (of 1%) kans is dat dit aan toeval te wijten is

Vertekening Term in de statistiek en de epidemiologie voor de verborgen oorzaak van een fout of een onduidelijke factor leidend tot een verkeerde logische conclusie, een onvrijwillige vooringenomenheid bij de waarnemer (“confounding”)

Inleiding

12

Inleiding: een door evaluatie bijgestuurd gezondheidsbeleid

Na een jarenlange activiteit als analist van de doodsoorzakenstatistieken en de Minimaal

Klinische Gegevens (MKG) leek het ogenblik gekomen om stimulerende concepten,

bevindingen en voorbeelden op het terrein en uit de literatuur, en ook de ervaring en

inzichten, die progressief gegroeid zijn, te bundelen. Vermits de gegevens uit deze

registraties noodzakelijk geacht worden voor de onderbouwing van de beleidsvoering3-7

en mijn beroepsactiviteit zich voornamelijk op dat terrein situeert, leek een onderzoek naar

het beleidsonderbouwend potentieel van administratieve gegevensbanken hiervoor de

geschikte vorm. De bruikbaarheid van administratieve gegevensbanken ten behoeve van

het beleid en niet het beleid zelf vormen bijgevolg het centrale onderwerp van dit

proefschrift. Naarmate het proefschrift vorderde werd het duidelijk dat het beleid in een

brede betekenis diende verstaan te worden en met name dat het zich op meerdere niveaus

situeert te weten het centrale, het intermediaire (zoals de “Begeleidingscommissie voor

ziekenhuisperformantie” en de “Colleges van geneesheren”) en het lokale (zoals

ziekenhuisdirecties).

Een gezondheidsbeleid kan op verschillende wijzen geconcipieerd worden. Als mogelijke

uitgangspunten kunnen bijvoorbeeld de optimalisering van het bestaande zorgensysteem8,

evidence-based medecine9;10 of kostenbeheersing11;12 geciteerd worden. Welk ook het

vertrekpunt is, steeds dienen er keuzes gemaakt en alternatieven afgewogen te worden.

Hiervoor zijn betrouwbare gegevens van fundamenteel belang.

Niet alleen dient men over gegevens te beschikken, zij moeten ook ingebed worden in een

toepassingskader. Evaluatie lijkt hiervoor aangewezen.6;13 Zij laat immers het voeren van

een coherent gezondheidsbeleid toe, dat op ieder ogenblik aangepast kan worden in functie

van de evoluerende gezondheidsproblemen en van de beschikbare middelen.

Een door evaluatie bijgestuurd gezondheidsbeleid is een cybernetisch concept.14 Het

wordt, in zijn meest elementaire vorm, schematisch weergegeven in figuur 1.

Prioritaire gezondheidsproblemen worden geïdentificeerd, grote streefdoelen gedefinieerd

en vertaald in concrete doelstellingen. Activiteiten worden gepland en de nodige middelen

voorzien. Resultaten worden vergeleken met de doelstellingen (doeltreffendheid) en met

de gebruikte middelen (doelmatigheid). Naast doeltreffendheid en doelmatigheid wordt

Inleiding

13

ook de impact nagegaan, die door Reinke gedefinieerd wordt als de ratio van de totale

uitkomsten over de output of het effect per eenheid van dienstverlening.6 De pertinentie

van de geplande activiteiten wordt beoordeeld ten opzichte van de concrete doelstellingen,

de concrete

Figuur 1: Schematische voorstelling van een door evaluatie bijgestuurd gezondheidsbeleid. 3 ⇓ 3 ⇓ 3 ⇓ ⇘ ⇓ 2 1

Prioritaire gezondheidsproblemen

Streefdoelen

Concrete doelstellingen

Activiteiten

Middelen

Resultaten

1) doeltreffendheid

2) doelmatigheid

3) relevantie, pertinentie, geëigendheid

doelstellingen ten opzichte van de grote streefdoelen, die op hun beurt getoetst worden aan

de prioritaire gezondheidsproblemen. Deze relevantietoetsing wordt van bij de eerste stap

in het planningsproces doorgevoerd en een positief toetsingsresultaat is telkens de

Inleiding

14

noodzakelijke voorwaarde voor het zetten van de volgende stap in dit proces. Zo zijn

bijvoorbeeld relevante streefdoelen de noodzakelijke voorwaarde om doelstellingen te

kunnen formuleren. Tenslotte wordt het billijkheidsbeginsel6;15;16 (“equity”) gehanteerd, dat

in iedere fase van het cybernetisch proces en bij elke afweging een belangrijke rol speelt.

De prioritaire gezondheidsproblemen vormen het vertrekpunt van deze evaluatiecyclus en

kunnen als volgt op bondige wijze omschreven worden. Gezondheidsproblemen worden

prioritair genoemd indien ze frequent en ernstig zijn, wanneer er een operationeel

uitvoerbare en aanvaardbare oplossing voor bestaat, als ze door het beleid en door de

bevolking als ernstig gepercipieerd worden en wanneer de evolutie ervan in stijgende lijn

gaat. De ernst wordt niet alleen uitgedrukt in termen van morbiditeit, tijdelijke of blijvende

beperkingen, en mortaliteit maar ook in economische en sociale kosten.14

De rol van ambtelijke registraties in de evaluatiecyclus bestaat voornamelijk in het

verstrekken van gegevens over de frequentie en ernst van prioritaire

gezondheidsproblemen benevens output en uitkomstgegevens voor de doelmatigheid- en

doeltreffendheidanalyses en voor de toetsing van het billijkheidsbeginsel6;7;17-20 Dit gebeurt

op een routinematige manier zodat ook de evolutie over de tijd kan gevolgd worden.

Het is duidelijk dat de doodsoorzakenstatistieken en MKG een noodzakelijke maar te

smalle basis vormen voor een onderbouwd gezondheidsbeleid. Dit heeft niet alleen nood

aan een breder spectrum van gezondheidsgegevens maar onder meer ook aan

sociaaldemografische en economische gegevens, aan gegevens over personeelsbezetting en

personeelsvooruitzichten, over de verwachtingen en het zich betrokken weten van de

gemeenschap, over sociale en beroepsorganisaties en over de politieke context.15

Kwaliteit van de gegevens was een eerste aandachtspunt. We meenden echter dat de

kwaliteitsbewaking van gegevens geen alleenstaande activiteit was maar diende gezien te

worden in een wisselwerking met hun gebruik. Rapporten in verband met uitwendige

oorzaken van morbiditeit en mortaliteit21, de invloed van sociale factoren op de

verblijfsduur22, de klinische indicatoren (zie hoofdstuk 5) en de invloed van de uitstoot van

verbrandingsovens op de reproductieve gezondheid van de buurtbewoners (zie hoofdstuk

6) hebben niet alleen lacunes van de MKG en doodsoorzakenstatistiek aangetoond maar

gaven tevens een aanzet tot hun verbetering. De aandacht ging hierbij zowel naar

Inleiding

15

verbetering van de gegevensverzameling en van de gegevensanalyse als naar de

gegevensdoorstroming en -uitwisseling tussen registraties.23;24 Het effectief gebruik van

administratieve gegevens voor evaluatieve of volksgezondheidskundige doeleinden laat

bijgevolg niet alleen een bijsturing toe van de te verstrekken promotionele, preventieve en

curatieve zorgen maar maakt tevens gegevensbeperkingen zichtbaar zodat ook de

gegevenskwaliteit gecorrigeerd kan worden.

Vervolgens laat deze verbetering op haar beurt een fijnere evaluatie van de kwaliteit van

zorgen op individueel en populatieniveau toe. Deze wisselwerking tussen het evaluatieve

gebruik van administratieve gegevens en bewaking van hun kwaliteit kan een opwaartse

spiraal van het gezondheidssysteem helpen schragen.

Waar gezondheidsgegevens in België wel voorhanden zijn, is hun toegankelijkheid vaak

een probleem. De probleemstelling in verband met de verbrandingsoven in Wilrijk, die

verder in dit werk aan bod komt, de zoektocht naar de nodige gegevens voor de berekening

van Disability Adjusted Life Years25 en het project Milieu en Gezondheid26zijn er

voorbeelden van.

Maar in afwachting dat alle nodige gegevens beschikbaar zijn en hun betrouwbaarheid

getoetst is, moet er beleid gevoerd worden.27 Het is dan zaak het beschikbare materiaal

voor het beleid te operationaliseren, er de volledigheid en accuratesse van aan te geven en

tevens de gegevensbanken maximaal inpasbaar te maken in een volwaardig

gezondheidsinformatiesysteem15;24;28.

Meer concreet trachten we een antwoord te geven op volgende onderzoeksvragen:

1) In welke mate zijn de registratiegegevens kwaliteitsvol?

2) Gegeven hun beperkingen, zijn deze gegevens bruikbaar voor de beleidsondersteuning?

3) Hoe kan deze bruikbaarheid verbeterd worden?

Dit proefschrift heeft de bedoeling een bijdrage te leveren bij het onderzoek naar een

wetenschappelijk verantwoord gebruik van administratieve gegevens. Daarnaast heeft het

ook de bedoeling aan de verantwoordelijken voor het gezondheidsbeleid en hun

medewerkers bruikbare informatie en voorbeelden te verschaffen over het omgaan met en

verbeteren van administratieve gegevens.

Inleiding

16

Vandaar ook de bewuste keuze het proefschrift in het Nederlands te schrijven.

Ons operationeel onderzoek situeert zich op lokaal, intermediair en centraal niveau en

dient geplaatst te worden in de cybernetische, evaluatieve benadering die we hierboven

geschetst hebben.

Het is duidelijk dat we in deze bundeling van elementen uit de literatuur en uit eigen

onderzoek slechts een zeer beperkt aantal elementen van de globale opzet hebben kunnen

ontwikkelen. We hopen verder op deze manier enkele aanzetten te geven voor verder te

ondernemen acties en voor verdere, meer diepgaande reflecties.

Het proefschrift werd dan als volgt opgebouwd. In een eerste deel, een literatuurstudie,

wordt onderzocht hoe de kwaliteit van de gegevens in administratieve gegevensbanken

onderzocht en verbeterd kan worden en in welke mate dit soort gegevens bruikbaar zijn

voor de beoordeling van ziekenhuiszorgen. Een hoofdstuk wordt gewijd aan

methodologische aspecten en voornamelijk het identificeren van “outlying” ziekenhuizen.

In het tweede deel worden de besproken concepten en methoden gebruikt om een inzicht

trachten te geven in de beperkingen en de mogelijkheden van twee Belgische

gegevensbanken op gebied van beleidsonderbouwing, en geeft aan dat het samenbrengen

van gegevens uit verschillende registraties soms noodzakelijk is voor het beantwoorden

van een beleidsvraag.

DEEL I: KRITISCHE LITERATUURSTUDIE

18

De uitgevoerde literatuurstudie werd niet systematisch van in het begin uitgevoerd, maar

was een stapsgewijze verkenning waarin de kwaliteit van de gegevens bestudeerd werd in

een operationele benadering vertrekkend van de diagnosestelling tot de opslag van de

gegevens.

De ruggengraat hiervoor werd geleverd door het boek “Problem Solving. A Statistician's

Guide. ” van C. Chatfield.23Andere boeken29-31, rapporten21;32-34, proefschriften35;36 en

gerichte opzoekingen via Pubmed onderbouwden het hoofdstuk over kwaliteit van de

gegevens. Er werd daarbij telkens aandacht geschonken aan voordelen en beperkingen van

administratieve gegevens, en aan alternatieve gegevensbronnen. Ook zochten we steeds

naar methoden voor de verbetering van gegevenskwaliteit.

Ook voor de kwaliteit van de zorgen was de gevolgde benadering operationeel.

Vertrekpunt hierbij was het project “Inpatient Quality Indicators”37 van de Agency for

Healthcare Research and Quality (AHRQ) in samenwerking met de Stanford University,

dat voorzien is van een omvangrijke literatuurlijst. Dit werd aangevuld met gerichte

opzoekingen in Pubmed voornamelijk over types en ontwikkeling van

kwaliteitsindicatoren, kwaliteit van zorgen, interziekenhuis vergelijkingen,

ziekenhuismortaliteit. Voor de besproken indicatoren werd de onderbouwing van de

indicator uit het Amerikaanse model aangevuld door verder te bouwen op de AHRQ

indicator en het actualiseren van de vermelde literatuur. Speciale aandacht werd telkens

besteed aan de beperkingen van de gegevens, het bestaan van en de toepassing van

richtlijnen en de vertaling van het Amerikaans model naar de Belgische situatie.

De literatuur in verband met interziekenhuisvergelijkingen en kwaliteitsindicatoren, en het

boek “Applied Logistic Regression” van Hosmer en Lemeshow38 hebben het

methodologisch hoofdstuk onderbouwd.

Wegens de niet onbeperkte toegang tot de literatuur van sommige

beleidsverantwoordelijken werd er naar getracht voor sommige methodologische en

conceptuele begrippen meerdere bronnen te vermelden die via Pubmed of Google vrij ter

beschikking worden gesteld.

19

Hoofdstuk 1: Administratieve gegevensbanken: kwaliteit van de gegevens

Een door evaluatie bijgestuurd gezondheidsbeleid rendeert optimaal in een systemische

benadering van de volksgezondheid, die steunt op de complementariteit van

gezondheidsbevordering, ziektepreventie en curatie, en die voor het aanpakken van

prioritaire gezondheidsproblemen, waar nodig, beroep doet op samenwerking buiten het

gezondheidssysteem.39 Zo zijn sterfte en invaliditeit ten gevolge van verkeersongevallen

een vanzelfsprekend voorbeeld van prioritaire gezondheidsproblemen, die een

intersectorale aanpak vereisen.

Beleid werd in het verleden echter vaak strikt sectoraal gevoerd. In de ziekenhuissector

bijvoorbeeld werden de toe te kennen toelagen voor ziekenhuisdiensten berekend in

functie van de bevolkingstoename, van verhoogd gebruik van diensten, van technologische

imperatieven en politieke druk.15 De evaluatie van de gezondheidszorg bestond

voornamelijk uit de kritische beoordeling van uitkomstgegevens van bepaalde

behandelingen en van de kwaliteit van zorgen in de instellingen, maar niet van de

gezondheid van bevolkingen.15 Dergelijke benadering gaat ervan uit dat de noden op

gebied van gezondheidszorgen op een gelijkmatige manier verdeeld zijn over de bevolking

en dat gezondheidszorg de kritische determinant van gezondheid is. Dat dit een onjuiste

veronderstelling is, blijkt uit de zwakke relatie, die er bestaat, tussen enerzijds de sterk

stijgende gezondheidsuitgaven, onder meer voor kankerbestrijding en voor kostelijke

hoogtechnologische onderzoeken en geneesmiddelen, en anderzijds de gezondheid van de

bevolking.15;40 Deze medisch-technische benadering gaat immers voorbij aan sociaal-

economische factoren en hun complexe relatie met dienstengebruik.41-54 Hoe beter we

echter de complexe determinanten van gezondheid begrijpen, hoe meer

aanknopingspunten we hebben om onze inspanningen te richten op de verbetering van de

gezondheid van de ganse bevolking of van specifieke doelgroepen.55

Om over te gaan van een klassieke, vraaggestuurde en ziekenhuisgecentreerde benadering,

naar een meer behoeftegestuurd en bevolkingsgericht gezondheidsbeleid is een degelijk

gezondheidsinformatiesysteem (Health Information System of HIS) nodig. In afwezigheid

ervan dient de aanwezige gezondheidsinformatie optimaal gebruikt te worden en kan een

Hoofdstuk 1: Administratieve gegevensbanken

20

HIS progressief opgebouwd worden uit de bestaande registraties en vervolledigd waar

nodig. Idealiter dient een HIS informatie te verschaffen over de gezondheid van de

bevolking, over de sociaal-economische risicofactoren, over het gebruik van

gezondheidsdiensten en uitgaven van de gezondheidszorg, en over de middelen die voor de

gezondheidszorg ter beschikking worden gesteld.10;15;24;28

Hierin krijgen secundaire gegevensbanken een belangrijke rol toebedeeld. Secundaire

gegevens zijn, niet door de onderzoekers zelf, maar door andere personen/instanties

verzamelde gegevens, waarvan de oorspronkelijke bedoeling niet het beschrijven van de

gezondheidsstatus van de betrokken persoon was maar die wel relevante

gezondheidsinformatie kan bevatten.56-59 Voorbeelden hiervan en tevens onderwerpen van

dit proefschrift zijn de ontslaggegevens van ziekenhuizen en overlijdenscertificaten.57 Zo is

naast facturatie het beschrijven van de ziekenhuisactiviteiten een vaak voorkomend

doeleinde van een ziekenhuisregistratie en zijn daarentegen kwaliteitsbewaking en

informatie rond morbiditeit, diagnosen en behandelingen vaak geen oorspronkelijke maar

wel afgeleide doeleinden van ziekenhuisregistratie.57;60-62Onze registratie van de Minimaal

Klinische Gegevens (MKG) bijvoorbeeld heeft zowel een financieel als een

kwaliteitsbevorderend doeleinde.3 Geboorte- en overlijdensberichten, waarvan de

oorspronkelijke bedoeling het melden van een geboorte of het bekomen van de toelating

tot begraving was, leveren daarenboven informatie die gebruikt wordt voor het monitoren

van de gezondheid.35;56;62-68

In het kader van dit proefschrift zullen we voor ziekenhuisontslaggegevens, geboorte- en

overlijdenscertificaten de vaak gebruikte term administratieve gegevens gebruiken.61;69 De

combinatie van deze administratieve gegevens met demografische en sociaal-economische

gegevens, en gegevens over milieuverontreiniging maakt het mogelijk sterfte- en

ziektecijfers te berekenen en rekening te houden met verstorende variabelen en

covariaten.15 Zo kunnen er rond de toegankelijkheid van diensten vragen gesteld worden,

kan er aan de hand van verschillen in behandelingspatronen over streken, waarvan de

bewoners nochtans een gelijkaardige gezondheidsstatus hebben, een antwoord gegeven

worden op vragen naar geëigende cijfers voor ingrepen, behandelingswijzen of

ziekenhuisopnamen.13;15;47;70-77Op basis van de Statistieken van de Burgerlijke Stand (1996)


21

konden we bijvoorbeeld vaststellen dat kinderen van Turkse moeders een groter risico op

kindersterfte vertoonden. 35

Deze transitie van louter administratieve gegevensbanken naar beleidsonderbouwende

gegevensbronnen is reeds begonnen. Ziekenhuisgegevens worden in toenemende mate

gebruikt voor het vervaardigen van rapporten over morbiditeit, mortaliteit en

activiteitencijfers.78 Ook moeten zij het mogelijk maken uitspraken te doen over de

kwaliteit en de uitkomsten van de verstrekte zorgen, en dienen het

financieringsmechanisme van het zorgensysteem, vaak in een optiek van kostenbeheersing,

te onderbouwen.15;79-83 Een laatste veld van toepassingen van administratieve

ziekenhuisgegevens betreft de evaluatiemogelijkheden, die ze bieden, voor andere sectoren

van de volksgezondheid zoals het functioneren van de eerste lijn en de impact van de

getroffen preventieve maatregelen.77;84-92

Maar zijn de administratieve gegevensbanken inderdaad bruikbaar voor deze doeleinden?

Aan de hand van literatuurgegevens trachten wij zowel de kwaliteit van administratieve

gegevens te omschrijven als hun bruikbaarheid in een perspectief van volksgezondheid aan

te tonen.

1.1 HET BEOORDELEN VAN DE KWALITEIT VAN GEGEVENS.

Er bestaat een groeiende consensus dat een gegevensbank, bestaande uit elektronische

patiënten dossiers, het ideale instrument is voor het verzamelen van kwaliteitsvolle

gegevens ten behoeve van een efficiënt zorgmanagement (“managed care”). De concrete

uitwerking van dit model echter, heeft te kampen met een aantal vooralsnog onvoldoend

opgeloste problemen onder meer in verband met privacy en beroepsgeheim; de beveiliging

van de gegevens; de noodzakelijkheid om een gestandaardiseerde inhoud te definiëren en

de kosten waarmee een dergelijk systeem gepaard gaat.82 In afwachting wordt er beroep

gedaan op administratieve gegevensbanken om kosten en performance te monitoren en de

zorgverleners terug te betalen. Waar zij in de eerste plaats bedoeld zijn voor de facturatie

van ziekenhuizen en hoewel zij ook nuttige patiëntengegevens registreren 26, worden in


22

deze benadering administratieve gegevensbanken gebruikt als proxy voor klinische

gegevensverzameling over kwaliteit en uitkomst van zorgen.82;93

De kwaliteit van de methoden die gebruikt worden voor het verzamelen van deze gegevens

en hun verdere verwerking wordt derhalve belangrijker.79 Voor de onderzoeker, die van

dergelijke gegevensbanken gebruik wil maken, bestaat de grootste uitdaging erin te

bepalen of die secundaire gegevensbronnen voldoende accurate en valide informatie

bevatten.94 Studies van de zeventiger jaren toonden immers aan dat gegevens zoals leeftijd,

geslacht, datum van opname en van ontslag zeer accuraat geregistreerd werden maar dat

het coderen van ingrepen en vooral van diagnosen minder betrouwbaar was. Ook in meer

recente studies blijven de auteurs zich verder vragen stellen omtrent de accuratesse van het

coderen van diagnosen 95 en over de validiteit van de diagnosen.96-99 Een andere reden van

bekommernis betreft de validiteit van de besluiten van studies in aanwezigheid van

verstorende variabelen. Zo stelt men zich de vraag of de vastgestelde verschillen tussen

artsen, ziekenhuizen en behandelingen reëel zijn of artefacten te wijten aan vertekening

door verschillen in case mix of risicofactoren, die niet meetbaar zijn via administratieve

gegevens.80;100-105

Hoewel er in de wetenschappelijke literatuur zeer groot belang gehecht wordt aan de

kwaliteit van de gegevens, bestaat er minder eenduidigheid over de inhoud van

verschillende aspecten van kwaliteit. Termen zoals accuratesse en precisie worden als

synoniemen gebruikt, validiteit wordt op verschillende manieren gedefinieerd en

betrouwbaarheid, herhaalbaarheid en reproduceerbaarheid worden vaak door elkaar

gebruikt.9 Ook de in deze context belangrijke term codering kan in de literatuur rond de

ziekenhuisfinanciering het ganse proces van de diagnosestelling, als de abstrahering en het

omzetten van de geabstraheerde medische termen in codevorm (codering stricto sensu)

omvatten.

Om zoveel mogelijk alle dubbelzinnigheid te vermijden aangaande termen en concepten

wordt in de voorliggende tekst de terminologie overgenomen van “A Dictionary of

Epidemiology”, een boek gesponsord door de International Epidemiological Association.9

Voor niet in het woordenboek voorkomende termen en begrippen, of bij gebruik van een


23

van het woordenboek afwijkende terminologie, wordt telkens de bron van de gebruikte

betekenis aangegeven.

Verder menen wij dat een korte omschrijving van enkele begrippen aangaande medische

gegevens op zijn plaats is. Ook hier heerst er soms onduidelijkheid wegens een niet

eenduidige terminologie. Een vaak gebruikte term, maar met een wisselende inhoud, is die

van het “medical record”. Soms gaat het hierbij over een elektronische gegevensopslag,

die door getraind personeel geabstraheerd werd uit het medisch dossier van een patiënt, de

“chart”, en dit gewoonlijk zonder input van de geneesheer.9 Elders wordt de term ook

gebruikt voor het medisch dossier in artsenkantoren of ziekenhuizen waarop zorgverleners

diagnoses, klinische details en het ziekteverloop noteren.61 Tenslotte wordt de term ook

gebruikt zonder te vermelden of het gaat over een elektronisch medisch dossier of niet60;63,

kent men er beide betekenissen aan toe 106;107 of wordt er ook gesproken over papieren

medical records.108 De physician billing databases, zijn een elektronische gegevensopslag

van facturatiegegevens meestal afgeleid van het operatieverslag. Naast de chart houden

artsen er soms nog een “daily log”, een persoonlijk dagboek, op na.109

Administratieve gegevens worden door Garnick et al61 gedefinieerd als “vorderingen

geregistreerd door private of publieke betalers, opgeslagen verslagen bewaard door

organisaties van zorgmanagement of rapporten van ziekenhuisopnamen aan

staatsagentschappen.” Dezelfde auteurs stellen dat het onderscheid tussen administratieve

en klinische gegevensbanken minder scherp wordt wegens twee ontwikkelingen. Enerzijds

maken technologische ontwikkelingen het mogelijk dat klinische resultaten gemakkelijk

kunnen geregistreerd worden en anderzijds worden in de publieke en privaatsector

gegevensbestanden met zowel administratieve als klinische gegevens ontwikkeld om

gemakkelijk de vragen van de overheid over het ziekenhuisgebeuren te kunnen

beantwoorden. Scerbo et al.2 definiëren administratieve gegevens als “alle gegevenstypes

en –bronnen, die bedoeld zijn voor de administratie van gezondheidsgegevens”.

In de volgende paragrafen zullen we trachten op basis van literatuurgegevens een

referentiekader voor het beoordelen van kwaliteit van administratieve en

mortaliteitsgegevens uit te werken en methoden van onderzoek en ervaringen op dit gebied

weer te geven.


24

1.1.1 Uitwerking van een referentiekader voor de beoordeling van administratieve gegevens.

Kwaliteit van gegevens is een relatief begrip, dat geoperationaliseerd kan worden door

middel van volgende vraag: “Laten deze gegevens toe een antwoord te geven op de

gestelde vragen?”.23 Het is duidelijk dat een vraag over de voornaamste

gezondheidsproblemen in een land niet dezelfde kwalitatieve eisen stelt aan een

gegevensbank als een vraag over de evolutie van die gezondheidsproblemen of over het

relatief belang van het subendocardiaal infarct in de groep van ischemische

hartaandoeningen. Het identificeren van de voornaamste gezondheidsproblemen vraagt

slechts een benaderende grootteorde, waar er voor het schetsen van een evolutie een meer

precieze omschrijving nodig is, zij het in tamelijk grove categorieën, en er voor het derde

type probleem een grote accuratesse van de gegevens vereist is. Verder is het zo dat aan

een gegevensbestand van een duizendtal records in de context van een gerandomiseerde

klinische studie hogere kwaliteitseisen gesteld worden dan aan een MKG-bestand van

meer dan een miljoen observaties. In het eerste geval is het immers vrijwel steeds

mogelijk tot het medisch dossier terug te gaan voor verificatie en eventuele verbetering,

waar dit in het tweede geval slechts in beperkte mate zo is.

De kwaliteit van de gegevens wordt beïnvloed door de manier waarop deze gegevens

verzameld worden: de weergave van het diagnose-behandelingsproces in het medisch

dossier, de extractie van de opgeslagen informatie en omzetting ervan in codevorm aan de

hand van de codeerregels van het gebruikte classificatiesysteem. We komen hier verder

uitvoerig op terug. Verder is het vanzelfsprekend dat de kwaliteit ook sterk beïnvloed

wordt door de context waarbinnen de registratie zich voordoet (kwaliteitsbewakend,

epidemiologisch of financieel), de manier waarop de gegevens verzameld worden en de

werklast, die de gegevensverzameling met zich meebrengt. Zo beschrijft Chatfield de

gegevensverzameling van de ambtelijke statistieken als volgt: “At the time of writing

there has been an explosion in the amount of data that hospital managers are trying to

collect in the UK so that nurses and doctors spend a high proportion of their time in

completing poorly designed forms rather than treating patients. Much of the information is


25

of dubious quality and some is never actually used. Insufficient attention has been given to

specifying objectives and to questionnaire design”.23

Wyatt omschrijft gegevenskwaliteit als volgt: “De mate waarin de items van de gegevens

accuraat zijn, volledig, relevant (beantwoorden de gegevens aan de doelen waarvoor ze

verzameld werden?), tijdig, voldoende gedetailleerd, op de juiste manier weergegeven

(bijvoorbeeld gecodeerd door middel van een klinisch codeersysteem), en met voldoende

contextuele informatie om het nemen van beslissingen toe te laten.” 110Het Federaal

Kenniscentrum voor de gezondheidszorg beoordeelde de kwaliteit van de Belgische

gegevensbanken in termen van toegankelijkheid en duidelijkheid (actuele informatie over

de gegevensbank in de vorm van metadata); relevantie en accuraatheid. Verdere

aandachtspunten waren de volledigheid; consistentie (relaties tussen de entiteiten van de

bank zijn constant zoniet verenigbaar); coherentie (de gegevens zijn gebaseerd op

gemeenschappelijke concepten, definities, classificaties); en, tijdigheid en punctualiteit

(naleven van de gemaakte afspraken i.v.m. oplevering van gegevens).32

Aan de hand van literatuurbevindingen zal derhalve getracht worden een evenwichtig

geheel van aandachtspunten en analysemethoden samen te stellen en tevens voldoende

vergelijkingsmateriaal te verzamelen om de kwaliteit van de gegevens van de in deze

studie gebruikte Belgische administratieve gegevensbanken en de resultaten van de erop

uitgevoerde analyses te toetsen.

1.1.1.1 Doeleinden van een registratie, verzamelwijze, diagnose, abstrahering en codering van de gegevens.

Om op een gefundeerde manier uitspraken te kunnen doen over de gegevenskwaliteit dient

men rekening te houden met de context waarbinnen en de doeleinden waarvoor ze

verzameld werden. Er bestaan verschillende methoden om gegevens te verzamelen:

steekproefsgewijs of exhaustief, via een questionnaire of via instructies (MKG of

bevolkingsstatistieken, in de Amerikaanse literatuur “vital statistics” genaamd). Het design

van de studie of van de bevraging is belangrijk in termen van interne en externe validiteit:

“Gaat het over een gerandomiseerd experiment of niet, of gaat het over een observationeel

onderzoek?” (cf. 1.1.8)


26

De manier van bevragen is belangrijk voor het bekomen van kwaliteitsvolle gegevens. Zo

zijn onder meer de formulering van de vragen en het type van vragen (open of gesloten)

belangrijk.62;111 Verder is de kwaliteit van de instructies voor het registreren van kapitaal

belang voor de analyse, die later uitgevoerd wordt: geen enkel veld van een gegevensbank

mag ingenomen worden door informatie, die op voorhand niet precies gedefinieerd werd.77

Het gebrek aan definities is een vaak opduikend probleem bij ziekenhuisregistraties, zeker

wanneer het gaat over essentiële begrippen zoals de (hoofd)diagnose.60 Toch is de

(hoofd)diagnose een essentieel en kritisch deel van het medisch dossier. Dit geldt zowel

voor het klinisch beleid (bvb. bij heropname, het uitwerken van richtlijnen), voor het

financieel beleid van het ziekenhuis en voor de volksgezondheid, meer bepaald voor het

evalueren van de zorgenbehoeften en van incidentie-evoluties in de bevolking.112-115

Na de diagnosestelling is het abstraheerproces van de administratieve gegevens uit het

patiëntendossier dikwijls een delicaat ogenblik bij de gegevensverzameling.116 Dit proces

wordt meestal uitgevoerd door gespecialiseerd personeel, dat echter zelf geen arts is, en

dit, wegens het vaak ontbreken van een abstraheervorm, meestal op een niet-

gestandaardiseerde manier. Overigens is het moeilijk om een abstraheervorm te ontwerpen

omdat patiëntendossiers complex zijn en op zeer individuele manier bijgehouden

worden.62

Verder is de kwaliteit van de gegevens functie van het gemak waarmee gegevens

geregistreerd kunnen worden en ook van het feit of de gegevens al dan niet uit

verschillende bronnen werden samengesmolten. In het laatste geval is het belangrijk na te

gaan of er bij de samensmelting inconsistenties werden vastgesteld en hoe ervoor

gecorrigeerd werd.23

Uiteindelijk dienen de medische gegevens voor hun verwerking in codevorm omgezet te

worden.114Dit is geen gemakkelijke taak en vereist een specifieke vorming, een

aanspreekpunt voor het beantwoorden van vragen i.v.m.codeerproblemen en een

regelmatige updating van de codeerinstructies.114;115


27

Daarnaast moeten regelmatige, grootschalige audits ervoor zorgen dat de codeerkwaliteit

bewaakt wordt.115We komen later in het vierde hoofdstuk, gewijd aan aan de

mortaliteitstatistieken (sectie 4.1) en de kwaliteit van de gegevens in een prospectief

financieringssysteem (sectie 4.2), meer in detail terug op de audit en de

codeerproblematiek.

1.1.1.2 Gegevensopslag (“Data Entry”).

“Since data entry precedes data utilization, the reliability of the information stored strongly

depends on the quality of data input. ”.116 Het is derhalve aangewezen om gebruik te

maken van technieken en routines, die erop gericht zijn het invoeren van foute gegevens of

het verloren gaan van gegevens te vermijden. Het lijkt bijvoorbeeld aanbeveling te

verdienen de invoer te herhalen van sleutelvariabelen, die de unieke omschrijving van een

record bepalen.116 Een interessanter alternatief is het automatiseren van de

gegevensopslag.116

De kwaliteit van de gegevens kan verbeterd worden door het gebruik maken van template

(automatisch overschrijven) en picture clausules (bvb. het omzetten van kleine letters in

hoofdletters) in formaatspecificaties, zodat bepaalde digits per definitie vastliggen (bvb M

voor een morfologiecode voor kankers) of dat bepaalde digits automatisch als hoofdletters

geregistreerd worden.116 Een verdere methode bestaat erin te controleren of het “domein”

van het “alfanumerisch” of “discreet” item gerespecteerd werd, of het “bereik” (de

“range”) van een continu item.77 De hoogste graad van gegevenszekerheid wordt bereikt

wanneer gegevens gegenereerd worden van reeds bestaande en gevalideerde gegevens

door een “procesroutine”: bijvoorbeeld het berekenen van een Body Mass Index op basis

van een gevalideerde lengte en gewicht.116

Een supplementaire manier om over kwalitatief goede gegevens te beschikken is de

optimalisatie van de gegevensopslag. Zij omvat onder meer: (1) een aangepast formaat

(indien mogelijk geen vrije tekst), (2) een onmiddellijk registreren op de formulieren, die

zullen dienen voor de gegevensinvoer om zoveel mogelijk transcriptiefouten van de

gegevens te verhinderen, (3) de scherm lay-out zoveel mogelijk laten gelijken op het


28

formulier, (4) het optisch inlezen, en (5) goede ergonomische voorwaarden.116 Met de

moderne technologie werden geautomatiseerde routines uitgewerkt die het mogelijk maken

een snelle en uitgebreide controle uit te voeren terzelfder tijd met de gegevensinvoer. Dit is

verkieselijk boven een controle in een latere fase van gegevensverwerking.116

1.1.1.3. Opsporen en omspringen met fouten en outliers.

“A result which looks interesting is probably wrong!”.23 Een outlier is een extreme

observatie, die niet consistent lijkt te zijn met andere gegevens: bijvoorbeeld iemand van

129 jaar of van 246 cm. Outliers kunnen bijvoorbeeld omschreven worden als de waarden

die buiten een gebied van waarden vallen, met als ondergrens: het eerste kwartiel –

(1.5*Interkwartiel bereik), en als bovengrens: het derde kwartiel + (1.5*Interkwartiel

bereik).117-119 Een outlier kan veroorzaakt zijn door een fout maar er bestaan ook echte

outliers. Deze komen voornamelijk voor wanneer een verdeling sterk asymmetrisch is en

de outlier uit de “lange” staart van de verdeling komt (bijvoorbeeld de verblijfsduur in

functie van een bepaalde Diagnosis Related Groups (DRG)).23

Er bestaan verschillende foutentypes: waarnemingsfout (bijvoorbeeld het slecht aflezen

van een instrument); tik- of schrijffout; transcriptiefout, een niet correcte kopij van een

observatie; inversiefout, wat bij codes belangrijk kan zijn bvb. 401 (hypertensie) versus

410 (AMI); herhaling van een observatie, die vaak gecombineerd is met de verwijdering

van een andere observatie; en tenslotte de falsificatie van een resultaat 23;60

Het insluipen van fouten kan ondanks maximale inspanningen niet vermeden worden.

Fouten dienen derhalve opgespoord te worden. Het lijkt aangewezen hiervoor optimaal

gebruik te maken van de gegevenseigenschappen om een aantal kwaliteitscontroles uit te

voeren, die gebaseerd zijn op het type (numeriek, alfabetisch of alfanumeriek) en de aard

(continu of discreet) van de meetbare gegevens. Een gegevenswoordenboek kan hierbij een

zeer nuttige rol spelen. Het gaat daarbij over een metagegevensbank waarin alle items

omschreven worden en hun eigenschappen bepaald.


29

Foute gegevens veroorzaken incoherenties en komen in conflict met een formele definitie,

of “fitten” niet met andere feiten: bvb. type van kanker is “onbekend” en het type van

differentiatie is “wel gedifferentieerd”.116 Dergelijke relationele controles zijn in geval van

nominale of ordinale variabelen meestal deterministisch: de relationele controle geeft aan

dat de geregistreerde waarde onverenigbaar is met de als “mogelijk” gedefinieerde

waarde(n). Zo kan een adenocanthoma alleen “welgedifferentieerd” zijn. In geval van

interval of ratio meetniveau of continue variabelen zal de controle meestal probabilistisch

zijn: bij een welgedifferentieerd adenocanthoma heeft de kortste kernas een lengte van 2

tot 12 μm. Een lengte korter dan 2 is onmogelijk (deterministisch) en een lengte van boven

de 12 is onwaarschijnlijk (probabilistisch).116

Voor de kwaliteitsbewaking van routinematig verzamelde gegevens wordt vaak beroep

gedaan op een probabilistische benadering door het opsporen en verbeteren van

“onwaarschijnlijke” waarden, de foutpositieven. De probabilistische benadering echter is

duidelijk gericht op de detectie van fout positieve gegevens. Nu dient de “verbetering” van

fout positieve gegevens afgewogen te worden tegen het bestaan van fout negatieve

gegevens.120 Het is dan belangrijk om te beoordelen of de voorgenomen verbetering ook

inderdaad een verbetering is.

Wij hebben dit probleem behandeld in een studie over de voorspellende waarde van het

geïnformatiseerde controleprogramma van de statistieken van de Burgerlijke Stand aan de

hand van gegevens van 1988 en dat als volgt gepubliceerd werd: “Aelvoet W, Humblet

PC, Lagasse R. Het in routine gebruikmaken van een geïnformatiseerd controleprogramma

als middel tot kwaliteitsbewaking van de statistieken van de burgerlijke stand in

Vlaanderen. Arch Public Health 1991;49:1-8. 120”

Nemen we als voorbeeld een record waarin bij een 20 jarige man een acuut myocard

infarct geregistreerd (AMI) werd. Op dergelijke leeftijd is een AMI een zeldzaamheid en

bestaat er het risico dat het over een fout positief geval gaat: er werd een code van AMI

geregistreerd voor een aandoening, die geen AMI was. Wat is dan de probabiliteit dat het

om een fout positief gegeven gaat?


30

Detectie en verbetering van foutpositieve waarden, de B van tabel 1 (vóór correctie), zijn

alleen nuttig indien de waarde A, beter de gezochte waarde A+C benadert dan de oude

waarde A+B, waarvan men vertrokken is.

Tabel 1: Vergelijking van de verdeling van een acuut myocardinfarct bij 20-jarige mannen zoals ze geregistreerd en gediagnosticeerd werd, vóór en na correctie. Theoretische benadering. Vóór “correctie” Na “correctie” Diagnose Diagnose

Aanwezig Afwezig Totaal Aanwezig Afwezig TotaalAanwezig A B A+B A - A

Ami in de Registratie Afwezig C D C+D C D* C+D* Totaal A+C B+D N A+C D* N

Indien de waarde van A+B = A+C is het duidelijk dat de nieuwe schatter A verder

verwijderd is van de gezochte waarde A+C, dan de oude schatter.

Een eventuele correctie is dus maar zinvol als A+B > A+C. Het nut van een eventuele

correctie houdt dan onmiddellijk verband met de relatieve waarde van B, de

foutpositieven, ten opzichte van C, de foutnegatieven. Vóór correctie wordt A+C, het

aantal personen met de aandoening, geschat door A+B, het aantal personen geregistreerd

met de aandoening. Door het controleren van alle personen met een registratie van AMI,

worden de fout positieve gevallen, de groep B, opgespoord en gereclasseerd in D. De D*,

in de tabel na correctie, is dus gelijk aan B+D van vóór de correctie. Wat verandert, is de

schatting van A+C, die na correctie nog uitsluitend geschat wordt door A. De

nuttigheidsdrempel van de verbetering wordt bereikt wanneer B, de groep van fout

positieven, gelijk is aan 2 maal C, de groep van fout negatieven:

(A+B)- (A+C) = (A+C)-A B = 2 x C,

waarin (A+B)-(A+C) het verschil is tussen de oude schatter, (A+B), en de gezochte

waarde, (A+C), en (A+C)-A, het verschil is tussen de gezochte waarde en de nieuwe

schatter.


31

Tabel 2: Vergelijking van de verdeling van een acuut myocardinfarct bij 20-jarige mannen zoals ze geregistreerd en gediagnosticeerd werd, vóór en na correctie. Voorbeeld van een correctie, die tot een “slechtere” schatter leidt. Vóór “correctie” Na “correctie” Diagnose Diagnose

Aanwezig Afwezig Totaal Aanwezig Afwezig TotaalAanwezig 1000 50 1050 1000 - 1000

Ami in de Registratie Afwezig 50 3900 3930 50 3950 4000 Totaal 1050 3950 5000 1050 3950 5000

In tabellen 2 en 4 worden cijfermatige voorbeelden gegeven van nieuwe schatters, die

respectievelijk slechtere en betere schatters zijn, dan de oorspronkelijke. In tabel 2 is het

verschil tussen respectievelijk 1050 en1050 inderdaad kleiner dan dat tussen 1000 en

1050 en is de nieuwe schatter verder verwijderd van de geschatte waarde, waar dit in tabel

4 net het omgekeerde is. In tabel 2 is 2*C immers gelijk aan 100 waar B gelijk is aan 50

en in tabel 4 belopen deze waarden respectievelijk 100 voor 2*C en 120 voor B.

Tabel 3 illustreert de nuttigheidsdrempel. Dit is de waarde, waarbij een correctie geen

verbetering maar ook geen verslechtering van de schatter tot gevolg heeft en die de

overgang vormt tussen een “nadelige” en een “voordelige” verbetering.

Tabel 3: Vergelijking van de verdeling van een acuut myocardinfarct bij 20-jarige mannen zoals ze geregistreerd en gediagnosticeerd werd, vóór en na correctie. Voorbeeld van de nuttigheidsdrempel: correctie leidt noch tot een “betere” noch tot een “slechtere” schatter. Vóór “correctie” Na “correctie” Diagnose Diagnose




32

Tabel 4: Vergelijking van de verdeling van een acuut myocardinfarct bij 20-jarige mannen zoals ze geregistreerd en gediagnosticeerd werd, vóór en na correctie. Voorbeeld van een correctie, die tot een “betere” schatter leidt. Vóór “correctie” Na “correctie” Diagnose Diagnose



Het probleem blijft het inschatten van de relatieve waarden van B en C. Dit probleem is

situatiegevoelig. In een context van mortaliteit bijvoorbeeld, is het voorkomen van een

goedaardige tumor als doodsoorzaak dermate weinig waarschijnlijk dat het probleem van

foutnegatieve tumoren als nagenoeg onbestaande kan beschouwd worden. Wanneer het

gaat over variabelen zoals lengte, gewicht en andere meetbare grootheden zullen andere,

distributionele overwegingen duidelijk moeten maken of de extremen van de verdeling

dermate oververtegenwoordigd zijn dat men inderdaad kan aannemen dat B > 2*C. In

sommige gevallen, zoals voor de AMI casus, kan er beroep gedaan worden op bestaande

en gevalideerde leeftijds- en geslachtsverdelingen van de bestudeerde aandoening om de

probabiliteiten in te schatten. Dit gegeven zijnde, lijkt een benadering, uitsluitend

gebaseerd op foutpositieven een betwistbare aanpak.

Het opsporen van fouten en outliers vormt een belangrijk onderdeel van de

gegevensverwerking en –analyse. “Editing”, het controleren van de gegevens op fouten, en

“Cleaning” zijn de daarvoor gebruikte procedures. Editing kan omschreven worden als het

proces waarbij de accuratesse, de consistentie en de volledigheid nagegaan wordt.121 Op

het gebied van codering bestaat editing uit het testen van de validiteit - bestaat de code? -

of de consistentie van de toegekende code.122 Onder data cleaning verstaat men het

iteratieve voortdurende proces, waar door gebruik van logische en statistische controles,

fouten opgespoord, verbeterd of verwijderd worden23;117 Andere auteurs spreken over

cleaning als het proces van het verwijderen van incomplete records of records met

inconsistente informatie.9 Het is duidelijk dat “cleaning”, zeker in de zin van het

verwijderen van foute gegevens, dient gerapporteerd te worden 9 en indien mogelijk door

een op probabiliteiten gesteunde benadering vervangen te worden.23


33

Fouten kunnen opgespoord worden via controles i.v.m. geloofwaardigheid (“range test”:

valt een waarde buiten het op voorhand gespecificeerde bereik van plausibele waarden),

consistentie (vergelijking van leeftijd met geboortedatum en overlijdensdatum, van

geslacht met bepaalde aandoeningen) en volledigheid. Ook de frequentiedistributie van de

variabelen aan de hand van histogrammen, kruistabellen, boxplots en scatterplots van

paren variabelen laten toe outliers of systematische fouten op te sporen.23;121,123

Wanneer een gegeven als outlier wordt geïdentificeerd dient het verbeterd te worden waar

mogelijk of verwijderd waar het moet. Voor extreme observaties kan het wijs zijn het

advies te vragen van een expert ad-hoc. Robuuste methodes zoals trimming, i.e. het

weglaten van enkele van de meest extreme observaties (bijvoorbeeld een vaste proportie in

de uiteinden van een verdeling), kunnen aangewezen zijn117 of het nagaan van de

invloedrijkheid van een outlier door het vergelijken van de resultaten met en zonder de

outlier. Tenslotte dient er een duidelijke en liefst simpele volgorde te bestaan van te

ondernemen stappen voor het aanbrengen van de vereiste verbeteringen.

1.1.1.4 Ontbrekende waarden en volledigheid van de registratie. Het is belangrijk te weten of en waarom er een waarde ontbreekt. Gaat het over een

“missing completely at random” ( MCAR), onafhankelijk van zowel de afhankelijke als de

onafhankelijke variabelen, of niet.23 Dit is de meest gunstige situatie. Het verwijderen van

onvolledige records, de “complete-subject approach”, kan hier toegepast worden,

tenminste als er niet teveel records ontbrekende waarden vertonen.121 Soms echter is een

ontbrekende waarde gerelateerd met de independente of met de dependente variabele. In

dergelijke gevallen kunnen multipele imputatie of specifieke, onvolledige-gegevens

analysemethoden noodzakelijk zijn en is de benadering voldoende accuraat wanneer er een

aantal covariaten aanwezig zijn. 23 De software waarover men vandaag beschikt laat een op

een modellering gebaseerde imputatie toe.124 Het creëren van een speciale categorie voor

ontbrekende waarden of het creëren van een indicator variabele voor elke variabele met

ontbrekende waarden zijn foutieve oplossingen voor het omspringen met ontbrekende

waarden. Deze methoden kunnen immers tot vertekende schatters leiden, zeker als de

ontbrekende waarde een confounder van de studie is.121


34

Een ander aspect van ontbrekende waarden is de volledigheid van de registratie. Hierbij

wordt bijvoorbeeld nagegaan of elk ziekenhuisverblijf al dan niet geregistreerd werd en of

de verdeling van de niet-geregistreerde verblijven dezelfde is over de verschillende

diensten van het ziekenhuis en over verschillende perioden van het jaar.60

Verder is het belangrijk ook de volledigheid van de deelaspecten van een verblijf, zoals

ingrepen, diagnoses en voorschriften, na te gaan. Het verwachte volume kan bepaald

worden aan de hand van op een zelfde manier berekende cijfers voor vergelijkbare

periodes of voor een vergelijkbare bevolking. Men dient hierbij rekening te houden met

eventuele seizoensgebonden fluctuaties, veranderingen in beschikbaarheid van diensten

(toegankelijkheid en dekkingsgraad), verschillen over subgroepen (onder meer

leeftijdsgroepen en geslacht), en geografische verschillen. Dergelijke oefeningen maken

het mogelijk om de gegevens te toetsen en hun geloofwaardigheid in te schatten.2;21

1.1.1.5 Accuratesse en validiteit De accuratesse en validiteit van de gegevens zijn van uitzonderlijk belang voor de

evaluatie van diensten, het monitoren van de evolutie van gezondheidsproblemen in de

bevolking en het bepalen van beleidsprioriteiten.113-115Accuratesse is de mate waarin een

meting of een schatting gebaseerd op metingen de werkelijke waarde weergeeft van het

attribuut dat gemeten wordt.9 In geval van uniform verdeelde variabelen kan een

onderzoek naar “last-digit-preference” problemen in verband met accuratesse aan het licht

brengen. Zo stelden we een duidelijke “last-digit-preference” bij het medisch

schooltoezicht (MSTgegevens 1994) vast voor lengte en gewicht, die volgens de

richtlijnen dienen gemeten te worden op respectievelijk 100g en 1 mm na, en die

belangrijke variabelen zijn voor het opvolgen van de groei.125 Omgekeerd biedt het nagaan

van een ontbrekende laatste digit een mogelijkheid voor kwaliteitsbewaking.123

In de context van ontslaggegevens wordt accuratesse gedefinieerd als de proportie van

ziekenhuisontslaggegevens, die dezelfde code (voor de hoofddiagnose) hebben als

dewelke die toegekend werd door een onafhankelijk review van het ontslagformulier en/of

van het medisch dossier.115

Een klassieke methode van peiling naar accuratesse en vaak de finale stap in het

controleren van de gegevenskwaliteit is de “Chart review ”, de vergelijking van de


35

geregistreerde gegevens met de gegevens van het originele medisch dossier. De bedoeling

van deze vergelijking is het vaststellen of de opgeslagen medische gegevens op een

accurate manier de diagnoses, de diensten en ingrepen, die uitgevoerd of gepresteerd

werden, weergeven.2;60 Het hoeft geen betoog dat deze voortreffelijke methode erg

omslachtig en arbeidsintensief is.

Bij de beoordeling van de kwaliteit van gegevens speelt het concept “validiteit” een

hoofdrol. In functie van de context kan het gaan over de validiteit van een meting of

meetmethode, van een onderzoek of van een gegevensbank.

Validiteit van een meetmethode (validity, measurement) kan gedefinieerd worden als de

mate waarin een meetmethode meet wat ze bedoelt te meten.9;126

Een eerste facet van validiteit is de begripsvaliditeit (“construct validity”), of de mate

waarin de meetresultaten overeenkomen met de theoretische concepten (het

begrippenkader) betreffende het bestudeerde gezondheidsfenomeen: bvb. indien de

bloeddruk verandert in functie van de leeftijd dienen de meetresultaten dit te

weerspiegelen.

Een tweede facet is de inhoudsvaliditeit (“content validity”), of de mate waarin de meting

overeenkomt met het domein van het bestudeerde verschijnsel: bvb. een meting van de

functionele gezondheidsstatus dient onder meer de Activities of Daily Living (ADL,

Activiteiten van het Dagelijkse Leven) te bevatten, en verder het beroeps, familiaal en

sociaal functioneren.9 In geval van een klinische indicator spreekt men van content

validiteit als de mate waarin de indicator ook werkelijk het probleem, dat men wenst te

benaderen, weergeeft. Een voorbeeld: het voorkomen van een postoperatief longembool

(de indicator) suggereert een inadequate preoperatieve profylaxe (het probleem) bij

patiënten waarbij een belangrijke operatieve ingreep gepland was.127 De content validiteit

kan verbeterd worden door het ontwikkelen en het gebruiken van duidelijk gedefinieerde

registratie-items en door hun extensieve (over het ganse land) uittesten met feedback naar

en beoordeling door de participanten.127

Een derde facet is de criterium validiteit, of de mate waarin de meting overeenstemt met

een criterium, onafhankelijk van het bestudeerde verschijnsel. Hierin onderscheidt men de

gelijktijdige en de voorspellende validiteit. Bij de gelijktijdige validiteit wordt nagegaan of

de meting overeenkomt met een onafhankelijke toets, die op hetzelfde tijdstip uitgevoerd


36

wordt. Een voorbeeld ervan is de visuele inspectie van een wonde en het bacteriologisch

onderzoek van een specimen genomen op het ogenblik van de inspectie. De voorspellende

validiteit van een meting wordt uitgedrukt als zijn bekwaamheid om het toetsingsresultaat

te voorspellen. Zo wordt een test i.v.m. de academische geschiktheid van studenten

getoetst aan de hand van de daaropvolgende academische performance.127 Een vierde en

laatste facet van validiteit is de indruksvaliditeit (“face validity”), of de mate waarin een

meting, na oppervlakkige inspectie, als aanvaardbaar bestempeld wordt. In een context van

klinische indicatoren spreekt men van klinische experts, benoemd door hun peers, die de

medische deugdelijkheid en het geëigend zijn van de indicatoren waarborgen, door middel

van een proces van uitgebreide gedachtewisseling en review.77;127

Validiteit van een onderzoek (validity, study), is de mate waarin de conclusies, die uit

de studie afgeleid werden, gerechtvaardigd zijn. Hierbij wordt er rekening gehouden met

de gebruikte studiemethoden, de representativiteit van de studiesteekproef en de natuur

van de bevolking waaruit de steekproef getrokken werd.

Men onderscheidt de interne en de externe validiteit.9;128 Om de interne validiteit te

bepalen werden de index- en de vergelijkingsgroep(en) dusdanig geselecteerd en

vergeleken dat de tussen hen geobserveerde verschillen wat de bestudeerde afhankelijke

variabelen aangaat, behoudens een steekproeffout, alleen kunnen toegeschreven worden

aan het bestudeerde veronderstelde effect. De externe validiteit of “generalizability” gaat

de veralgemeenbaarheid van een studie na of m.a.w. stelt de vraag of de studie al dan niet

tot vertekende conclusies leidt in een doelpopulatie. Bijvoorbeeld wanneer een studie

alleen werd uitgevoerd op mannen en de ganse bevolking is de doelpopulatie, vraagt men

zich af of de bevindingen ook geldig zijn voor vrouwen. De evaluatie van de

veralgemeenbaarheid vereist veel meer een inhoudelijke beoordeling dan bij een evaluatie

van de interne validiteit.9

De validiteit van een gegevensbank, of de mate waarin de gegevensbank de werkelijke

biologische toestand van de geregistreerde weergeeft, geeft aan in welke mate de gestelde

diagnoses correct zijn en de in het medisch dossier vermelde diensten of ingrepen ook

werkelijk gepresteerd of uitgevoerd werden.129 Hierbij stelt de validiteit van een

geregistreerde diagnose een speciaal probleem. De International Classification of Diseases

(ICD), zowel ICD-9 als ICD-10, bevat immers, op enkele uitzonderingen zoals

psychiatrische aandoeningen na, geen expliciete definities van ziekten.27;130 Het is dus een


37

zaak van klinisch oordeel of een ziekte aanwezig is of niet, en, wanneer bijkomende

criteria voor de diagnose van sommige ziekten werden ontwikkeld door de WHO of door

andere instanties, werden ze meestal niet op eenvormige manier toegepast.131

1.1.1.6 Betrouwbaarheid, herhaalbaarheid en reproduceerbaarheid Betrouwbaarheid (“Reliability”) is de mate van stabiliteit, die bereikt wordt bij herhaling

van een meting onder dezelfde voorwaarden.9;126 Een gebrek aan betrouwbaarheid kan

ontstaan wegens onenigheid onder waarnemers of meetinstrumenten, of onstabiliteit van

het te meten kenmerk. De betrouwbaarheid van de gegevens van een gegevensbank kan in

vergelijking met de medische dossiers uitgedrukt worden als de accuratesse waarmee het

medisch dossier in de gegevensbank weergegeven wordt.129 De betrouwbaarheid van een

indicator hangt sterk af van een zelfde manier van rapporteren door de participanten van

een studie of een project.127

Herhaalbaarheid (“repeatability”) of reproduceerbaarheid (“reproducibility”) geven aan of

een test of een meting herhaalbaar zijn. Deze begrippen refereren aan de actie van het

herhaald uitvoeren van iets en niet naar de kwaliteit van de meting.

1.1.2 Kwaliteit van de gegevens van administratieve gegevensbanken.

Aan de hand van concrete voorbeelden uit de literatuur en uit eigen onderzoek,

uitgevoerd21;132 in 2001-2, wordt getracht een beeld te schetsen van de manier waarop

gegevensbanken op hun kwaliteit beoordeeld worden en van de factoren, die de kwaliteit

beïnvloeden.

1.1.2.1 Epidemiologische en statistische methoden voor het beoordelen van de gegevenskwaliteit.

1.1.2.1.1 Vergelijking van gegevens binnen en tussen bestanden of gegevensbanken. Een manier om de kwaliteit van de gegevens van een register te onderzoeken bestaat erin

ze te vergelijken met de gegevens uit een andere, onafhankelijke bron. Een voorbeeld

hiervan is de vergelijking van het aantal incidente kankers uit een kankerregister met het

aantal sterfgevallen door kankers van hetzelfde type in de overlijdensstatistieken, of door


38

een vergelijking van gelijkaardige gegevensbanken, zoals het aantal AIDS- en

tuberculosepatiënten in een AIDS en een Tuberculose register, of het aantal

ziekenhuisopnamen met een verblijfsduur van minstens een dag in geval van

verkeersongevallen in de MKG en het Belgisch Instituut voor Verkeersveiligheid (BIVV)

(Figuur 1), of de overeenkomst tussen MKG en het Nationaal Instituut voor de Statistiek of

het Studiecentrum voor Perinatale Epidemiologie i.v.m. een aantal gegevens rond

bevallingen (zie hoofdstuk 5: het Keizersnedencijfer).21;132-136

Figuur 1: Evolutie van het aantal niet-fatale verkeersongevallen zoals geregistreerd in het BIVV en de MKG, 1996-2001.

Evolutie van niet-fatale verkeersongevallen in het BIVV en de MKG

0

2500

5000

7500

10000

12500

1996 1997 1998 1999 2000 2001

BIVV MKG

Een volgende methode bestaat erin twee types van gegevens in een zelfde register met

mekaar te vergelijken, zoals bijvoorbeeld overlevingsgegevens met incidente

kankergevallen, wat een idee geeft over de volledigheid van de overlevingsgegevens137, of

bijvoorbeeld, zoals we elders meer uitvoerig rapporteerden21, door het nagaan of er bij

registratie van een letsel ook de bijbehorende manier van ontstaan (de zogenaamde E-

code) geregistreerd werd of omgekeerd (Tabellen 5 en 6).


39

Om de volledigheid van het totale bestand na te gaan kan men verder, in afwezigheid van

een andere, onafhankelijke bron, gebruik maken van “indirecte indicatoren”. Zo is het

mogelijk gestandaardiseerde overlevingsgegevens voor een aantal kankers in een aantal

landen te berekenen. Wanneer dan voor een bepaald type kanker de overleving in een land

sterk verschilt vergeleken met die van de andere, is dit een aanduiding voor een

onvolledigheid van de gegevens.137 Een andere methode is de vergelijking tussen de

geregistreerde gegevens en het medisch dossier of het logboek van het

operatiekwartier.94;138;139 De audit van de MKG is hier een andere illustratie van (zie sectie

4.2).


40

Tabel 5: Percentage van ontbrekende letselcodes wanneer de E-code aanwezig is. MKG 1996-8.

Gewest Geslacht 1996 1997 1998

Brussel M 34,68 31,31 30,55

V 34,68 32,96 30,95

Vlaanderen M 20,63 20,95 22,62

V 24,20 25,91 26,75

Wallonië M 26,98 27,41 28,46

V 30,54 31,86 32.19

Tabel 6: Percentage van ontbrekende E-codes wanneer de letselcode aanwezig is. MKG 1996-8.

Gewest Geslacht 1996 1997 1998

Brussel M 82,00 77,18 74,79

V 79,85 74,65 72,76

Vlaanderen M 82,74 81,55 80,71

V 80,90 80,08 78,91

Wallonië M 75,76 73,36 71,53

V 75,01 72,88 70,65

In het kader van een gezondheidssysteem met een structurele uitbouw van de verwijzing

van eerste lijn naar tweede lijn en omgekeerd, is de informatie in het ziekenhuisdossier

over patiënt (naam en adres), de verwijsmodaliteit en de huisarts (naam en adres)

essentieel. Dit systeem houdt tevens mogelijkheden van validatie in van diagnostische

gegevens, waarvan de kwaliteit kan nagegaan worden door een vergelijking van bepaalde

gegevens uit het ziekenhuisdossier met dezelfde informatie ingewonnen bij huisartsen via

interviews en dossiers.78 Dit is een vooralsnog onontgonnen validatie mogelijkheid voor de

MKG.


41

Bij dergelijke vergelijkingen is de nagestreefde precisiegraad belangrijk, bijvoorbeeld tot

op de 3de of de 4de digit van de gecodeerde diagnose in functie van het kankertype,

diagnose of ingreep.82;137

Voor de formulering van correcte besluiten en ook in een optiek van toetsing van de

gegevenskwaliteit van administratieve gegevensbanken is het aangewezen bij dergelijke

oefeningen zowel de geslaagde als de mislukte koppeling aan te geven, benevens de

redenen van een mislukte koppeling.22;139

1.1.2.1.2 Steekproefsgewijze versus exhaustieve validatie. Het valideren van alle records in een volledige (ziekenhuis)registratie is praktisch

onmogelijk. Vaak is werken op een steekproef hiervoor het enig werkbare alternatief.

Verschillende methoden werden hiervoor gebruikt: werken op een aselecte

steekproef138;140, op een gestratificeerde steekproef139, eventueel met een oversampling van

patiënten die behoren tot een categorie met een lagere positieve voorspellende waarde141,

liefst met een op voorhand bepaalde steekproefgrootte.60

Een alternatief voor een steekproefsgewijze benadering is een vergelijking van de

gegevenskwaliteit uit te voeren op subpopulaties van patiënten met een zeer beperkt

spectrum van diagnoses of ingrepen in een administratieve gegevensbank en een

gegevensbank, die kan beschouwd worden als de gouden standaard. De bevindingen uit

deze vergelijking worden in een tweede tijd veralgemeend over de ganse administratieve

gegevensbank. Zo werden uit een administratieve gegevensbank een groep patiënten met

een myocardinfarct en een groep van vrouwen, die een obstetrische ingreep ondergingen,

vergeleken met deze uit een peer review programma en werden de bevindingen uit deze

vergelijking veralgemeend over het ganse administratieve bestand.82

1.1.2.1.3 Maten van overeenkomst. Bij de bestudering van de kwaliteit van bepaalde gegevens, zoals een diagnosestelling,

wordt, in afwezigheid van een gouden standaard, vaak beroep gedaan op maten van inter-

beoordelaarsovereenstemming (“interrater agreement”), waarbij twee of meerdere

onderzoekers hetzelfde studieobject beoordelen en de onderlinge overeenkomst gemeten

wordt. Het nagaan van de overeenkomst tussen twee of meerdere waarnemers is immers

een vaak aanwezig onderdeel van kwaliteitsbewaking van de gegevens in de


42

geneeskunde.142-149Andere voorbeelden zijn: vergelijking van een aantal items in een

gegevensbestand en in de overeenstemmende medische dossiers, de abstractie van dezelfde

gegevens door twee personen, het vergelijken van patiëntenkarakteristieken van dezelfde

patiënten, die zich in twee gegevensbestanden bevinden.

De hierbij gebruikte maten zijn de al dan niet gewogen kappa63;79;82;109;138;150-154, het

percentage van overeenkomst of van afwijking23,26,44,73,105,106, intraclass correlation

coefficient 45,89,109, Cronbach’s alfa 118;126 en χ2 analyses van waargenomen versus te

verwachten waarden op basis van een bepaald percentage van overeenkomst109. Bij een

kappatoets, zeker indien hij een tamelijke tot goede overeenkomst aangeeft, zoals een

kappa tussen 0.4 en 0.75155, is het aangewezen de niet-diagonale elementen te analyseren

om een systematische afwijking door een van de beoordelaars na te gaan.156 Standaard

software zoals SAS® stelt hiervoor bepaalde symmetrietoetsen ter beschikking zoals de

Mc Nemar en Bowker toetsen.157

Een andere reeks toetsen wordt gebruikt, wanneer bij een vergelijking één waarnemer als

referentie fungeert, de zogeheten “Gouden standaard”, waaraan de andere waarnemer

wordt getoetst. Sensitiviteit, specificiteit, positieve voorspellende waarde (PPV) en

negatieve voorspellende waarde (NPV) en de “comparability ratio” (CR) worden hierbij

nagegaan.113;158-160Wanneer men ontslagdiagnoses vergelijkt met gevalideerde gevallen

weerspiegelt de CR het algemeen effect van misclassificatie.113

Kennedy et al.114 geven een belangwekkend voorbeeld van het belang van een juiste

codering voor de registratie van een acuut myocardinfarct. Zij vergeleken de resultaten van

de ziekenhuisregistratie met die van het cardiologisch surveillanceteam dat volgens strikte

richtlijnen werkte (Tabel 7). Indien men dan de ziekenhuisregistratie wil gaan gebruiken

als een indirecte indicator voor de incidentie van AMI , wordt het belang van een accurate

en volledige gegevensabstractie en codering evident. Op basis van de ziekenhuisregistratie

bekomen we een schatter van 110/20.386 of 0,54%, waar deze voor het cardiologische

surveillanceteam 71/20.386 of 0,35% bedraagt, m.a.w. ⅓ lager.


43

Tabel 7: Sensitiviteit, specificiteit, PPV, NPV en CR van een ziekenhuis vergeleken met een cardiologisch surveillance team

Cardiologisch surveillance team

ICD-9: 410 Andere Totaal

ICD-9: 410 67 43 110 Ziekenhuis-

registratie Andere 4 20.272 20.276

Totaal 71 20.315 20.386 Sensitiviteit: 94% (67/71); Specificiteit = 99% (20.272/20.315); PPV = 61% (67/110); NPV = 99% (20.272/20.276);CR= 65 % (71/110)

Een klassiek voorbeeld is de vergelijking van de resultaten, die behaald worden met een

nieuwe test, met de resultaten van een referentie test.159 Dergelijke vergelijking wordt ook

toegepast om bvb. de overeenkomst na te gaan tussen de code, zoals hij werd opgeslagen

in de gegevensbank en de code zoals hij zich in het medisch dossier

bevond.63;82;94;95;135;138;141;152 Ook in de ambulante praktijk werd een gelijkaardige

vergelijking gemaakt tussen drie methoden voor het beoordelen van de bekwaamheid van

een arts en de kwaliteit van zijn praktijkvoering: de gestandaardiseerde patiënt (de gouden

standaard), dossierabstractie en vignetten ( uitgeschreven ziektegevallen). Waar de

vignetten als ongeveer gelijkwaardig kunnen beschouwd worden aan gestandaardiseerde

patiënten, gaf de dossierabstractie over de meeste criteria minder goede resultaten.161;162

Waar wij het tot zover hadden over de vergelijking van de overeenkomst op het

individuele niveau, gebeurt het vaak dat vergelijkingen gebeuren op geaggregeerd niveau

tussen meer dan één gegevensbank. Bij het vergelijken van twee gegevensbanken, waarin

gegevens verzameld worden over hetzelfde onderwerp bij ongeveer dezelfde bevolking,

wordt voor categorische variabelen beroep gedaan op χ2-analyses, exacte Wilcoxon

toetsen, odds ratio's en op de t-test voor continue variabelen.81 Indien men de vergelijking

wil corrigeren voor een aantal covariaten, bvb. in een analyse van ziekenhuismortaliteit,

kan een multipele logistische regressie gebruikt worden (zie sectie 5.2 Intramurale letaliteit

na een acuut myocardinfarct).79;135;163


44

Meer en meer worden administratieve gegevens ook gebruikt voor predictieve doeleinden

en doet men beroep op technieken zoals logistische regressie, Cox proportional hazard

model, artificiële intelligentie en neurale netwerken.80;163 Het hoeft geen betoog dat voor

dergelijke oefeningen de kwaliteit van de administratieve gegevens een vereiste is. Zo

werd op basis van administratieve gegevens een gewogen comorbidity-index berekend en

nadien ook uitgetest door de door het model voorspelde mortaliteit, bekomen via

logistische regressie, te vergelijken met die van de herabstrahering.80

1.1.2.1.4 Accuratesse. Zoals voormeld is abstrahering het proces waarbij aan de hand van het medisch dossier

van de patiënt de hoofddiagnose of hoofdingreep bepaald worden en tevens de eventuele

nevendiagnosen en –ingrepen. Deze diagnosen en ingrepen worden vervolgens gecodeerd

en opgeslagen. Het is evident dat tijdens deze fasen van de gegevensverwerking

accuratesse van vitaal belang is.

In de literatuur worden verschillende methoden vermeld, die gebruikt worden om de

kwaliteit van het abstraheringsproces te onderzoeken. Een eerste manier bestaat in een

herabstrahering door één gekwalificeerde abstractor, die gebruikt maakt van expliciete

criteria.129 Een volgende is een dubbele herabstrahering door twee gekwalificeerde

abstractors (waar de originele abstraheringen verricht werden door een niet

gekwalificeerde klerk).1 Nog een andere is een dubbelblinde herabstrahering van het

medisch dossier, uitgevoerd door twee onafhankelijke geneesheren uit dezelfde dienst. De

gekozen observatieperiode is intentioneel van korte duur, dit om seizoensgebonden en

leereffecten van de originele abstrahering zoveel mogelijk te vermijden. Alleen wanneer de

twee “nieuwe” abstraheringen van de originele abstrahering verschillen werd de originele

als fout bestempeld. Deze werkwijze laat toe het probleem van de gouden standaard te

vermijden, die zeer moeilijk te bepalen kan vallen wegens het gebrek aan precisie bij de

definitie van de hoofddiagnose60

Soms wordt in één onderzoek zowel de kwaliteit van de abstractie van gegevens uit het

medisch dossier onderzocht als de toegekende code. In een dergelijke studie werden de

opnieuw geabstraheerde en opnieuw gecodeerde hoofddiagnose of hoofdingreep, de

standaard, vergeleken met de geregistreerde diagnoses of ingrepen in alle posities en


45

vervolgens met de hoofddiagnose of ingreep.95 De accuratesse van diagnosecodering

varieerde sterk: wanneer alle posities in aanmerking genomen werden, varieerde de

sensitiviteit van 0.58 voor perifere vaataandoeningen tot 0.97 voor borstkanker. Een

gelijkaardig bereik werd aangetroffen voor de PPV. Voor de ingrepen was de accuratesse

substantieel hoger: de sensitiviteit, alle posities, had een range van 0.88 voor

hartkatheterisatie tot meer dan 0.95 voor 10 van 15 chirurgische ingrepen. Ook de PPV,

voor alleen de hoofdingreep, had een tamelijk breed bereik: van een 0.89 voor

hartkatheterisatie tot een 0.99 voor 7 chirurgische ingrepen.95

Bij dit soort oefeningen dient men er rekening mee te houden dat er een duidelijk verschil

in precisie van definitie bestaat tussen klinische toestanden, vaak weinig precies of zelfs

helemaal onbestaande, en de meer expliciet gedefinieerde codeerregels. Een verbetering

van de codeerregels, zonder een verbetering van de omschrijving van de klinische toestand

leidt derhalve niet steeds tot een verbetering van de kwaliteit van de gegevens. Zo werden

er bijvoorbeeld nieuwe regels voor het coderen van AMI ontwikkeld, maar blijft de

epidemiologische interpretatie van toegekende codes onzeker omdat er geen eenduidige

klinische criteria vastgesteld en toegepast worden. Dit is veel minder een probleem voor

chirurgische ingrepen omdat zij zeer precies gedefinieerd zijn en meer accuraat gecodeerd

worden.95

In een gelijkaardige studie werd in een dienst van oncologische chirurgie in een

universitair ziekenhuis gepeild naar de overeenkomst tussen de financieringsgegevensbank

(“physician billing”), de medical record database en het persoonlijk handgeschreven

logboek van de chirurg. Zeven fundamentele variabelen werden hierbij onder de loep

genomen: het toevoegen of verwijderen van ziekenhuisopnamen, het identificatienummer

van de patiënten, geboortedatum van de patiënt, datum van de ingreep, datum van opname

en ontslag, code van de ingreep en code van de diagnose.

Voor de beoordeling van de diagnosecode werd een uitgeschreven omschrijving van de

code gebruikt en werd er nadien beoordeeld of de gedachte of de eruit voortvloeiende

implicatie de gestelde diagnose voldoende benaderde. Bvb. indien er “malignant soft tissue

tumor” i.p.v. “soft tissue sarcoma” genoteerd was, werd dit als correct aanvaard.109 De

studie concludeert dat er slechts een gebrekkige overeenkomst bestaat tussen de


46

verschillende databases. De auteurs formuleren dan ook de aanbeveling dat, indien

mogelijk, de informatie van een gegevensbank dient gevalideerd te worden vooraleer de

resultaten van een daarop gebaseerde studie te interpreteren.

Bij de audit wordt de accuratesse van onze MKG getoetst. In sectie 4.2 komen we hier

uitvoerig op terug.

1.1.2.1.5 Betrouwbaarheid. Hierbij wordt nagegaan in welke mate dezelfde abstractor of codeur het abstraheren of het

coderen bij herhaling op dezelfde manier doen.152

Een eenvoudige manier om de betrouwbaarheid van een gegevensbank na te gaan, is de

vergelijking van (praktisch) onveranderlijke gegevens zoals geslacht, geboortedatum of

sociaal-economische status (tijdens een zelfde kalenderjaar) bij patiënten met herhaalde

opnamen.22;60

Uit eigen onderzoek22, uitgevoerd in 2002 in verband met de minimale klinische gegevens

(MKG) en de minimale financiële gegevens (MFG), namen we dit voorbeeld over deze

registraties m.b.t. 1996. Om de invloed van sociale factoren op de verblijfsduur in de

acute ziekenhuizen22 te bestuderen werden de financiële aan de klinische gegevens

gekoppeld om aan de patiënten een sociaal-economische status, berekend op basis van de

financiële gegevens, toe te kennen (Figuur 2). Als koppelingsvariabelen werden het

ziekenhuis- en het patiëntnummer gebruikt, die door dezelfde administratieve diensten

voor MKG en MFG geregistreerd worden.


47

Figuur 2: Schematische weergave van de koppeling van de MKG- en MFG-bestanden.

MKG MFG

Verblijven Ziekenhuizen Verblijven Ziekenhuizen

1.645.151 174 1.588.664 174

Gekoppeld bestand

MKFG

Verblijven Ziekenhuizen

1.515.885 159

Wij verwijderden uit het MKG-bestand 67 verblijven van personen met een onbekend

geslacht en 33 verblijven niet bruikbaar voor de berekening van een z-score wegens een te

klein aantal (< 30) in een bepaalde DRG en leeftijdsgroep. Verder werden ook 105.252

verblijven van de 15 ziekenhuizen, die geen MFG-bestand afleverden, verwijderd en

23.914 verblijven in 108 ziekenhuizen, waarvoor geen koppeling met het MFG-bestand

kon gemaakt worden. De oorzaken voor het niet realiseren van de koppeling waren de

volgende: registratiefouten met betrekking tot de koppelingsvariabelen (Ziekenhuiscode en

Patiëntnummer) of het toeleveren van een bestand waarin alleen mutualiteitpatiënten

opgenomen werden.

1.1.2.1.6 Validiteit. Voor een beoordeling van de validiteit van gegevens is het gebruik van expliciete criteria

of, minstens, van gestructureerde impliciete criteria vereist.152;164 Om de validiteit van een

ziekenhuisgegevensbank op basis van ontslaggegevens na te gaan werd in een studie een

gefaseerde methodologie gevolgd: eerst werd de accuratesse nagegaan door een

vergelijking van de geregistreerde diagnoses met de ontslagdiagnoses in het medisch

dossier. Ontslag diagnoses kunnen op een vage manier opgeschreven worden (bvb. reuma

i.p.v. reumatoïde artritis) en gecodeerd (bvb. polyartritis i.p.v. reumatoïde artritis) of


48

gewoon fout ingetikt (“ lack of reliability”). Voor het toetsen van de validiteit werd

vervolgens op een steekproef van ontslagdiagnoses met een vermelding van reumatoïde

artritis een vergelijking gemaakt met een herabstrahering, uitgevoerd door een getrainde

abstractor aan de hand van de criteria voor reumatoïde artritis van de Amerikaanse

Vereniging ter bestrijding van gewrichtsreuma (ARA).129

De koppeling van twee ziektespecifieke gegevensbanken met aan elkaar gerelateerde

aandoeningen (AIDS en TBC) bleek niet alleen de validiteit maar ook de volledigheid van

de registers te verbeteren.135

In België werd het aantal gevallen en het aantal sterfgevallen door een acuut

myocardinfarct (AMI) vergeleken tussen het MONICA register (Multinational monitoring

of trends and determinants in cardiovascular diseases) en de MKG voor de regio’s Gent en

Brugge (zie hoofdstuk 5) en het aantal sterfgevallen door AMI in de regio’s Gent en

Charleroi tussen het MONICA register en de overlijdensstatistieken. In deze laatste studie,

uitgevoerd in 1997-8 en waaraan we meewerkten, werd een belangrijke onderschatting van

de AMI-sterfte aangetoond: slechts 65% der goed gedocumenteerde AMI gevallen werden

in de overlijdensstatistieken als ischemische hartaandoeningen teruggevonden.165 Deze

studie resulteerde in de publicatie: “De Henauw S, de Smet P, Aelvoet W, Kornitzer M, De

Backer G. Misclassification of coronary heart disease in mortality statistics. Evidence from

the WHO-MONICA Ghent-Charleroi Study in Belgium. J Epidemiol Community Health

1998;52:513-9.”

Een andere methode voor het onderzoek van validiteit is de autopsie. Meer speciaal op het

gebied van mortaliteit door cardiovasculaire epidemiologie is dit een noodzaak gebleken.96-

98;166 Laten we hierbij aanstippen dat de rol van de obductie als “Gouden Standaard” niet

perfect is. Zo zal bij een gewone obductie in geval van een zeer snel optredende dood na

een acuut hartinfarct, waarvan de letsels op dat ogenblik slechts zichtbaar zijn mits gebruik

van speciale technieken, geen myocardinfarct vastgesteld worden en omgekeerd kan

obductie tot een fout positieve vaststelling leiden, wegens een eventuele grotere

gedrevenheid van de obductor wanneer hij weet dat de overledene leed aan een coronaire

aandoening.97 Op het gebied van acuut myocard infarct is men derhalve de mening


49

toegedaan dat er een belangrijk aantal zowel foutpositieve als foutnegatieve gevallen zijn,

waarvan de verhoudingen niet constant zijn over de tijd.96;97

Een volgende methode om naar validiteit te peilen bestaat in de vergelijking van gegevens

uit twee gegevensbanken waarin (grotendeels) dezelfde patiënten geregistreerd werden

maar via een andere gegevensverzameling en met een andere vaststellingsmethode van de

gevallen (case ascertainment).79 Voor acuut myocardinfarct werd de interne validiteit van

twee gegevensbanken beoordeeld door een globale vergelijking op ziekenhuisniveau en

een individuele vergelijking op patiëntenniveau en dit op het gemeenschappelijk patiënteel

van beide gegevensbanken. Op ziekenhuisniveau werden basiskarakteristieken, klinische

manifestaties en het gebruik van cardiologische ingrepen en uitkomsten vergeleken. Op

patiënten niveau werden naast baselinekarakteristieken ook gegevens over behandeling,

ziekteverloop, medicatie en ziekenhuismortaliteit vergeleken. De externe validiteit werd

onderzocht aan de hand van vergelijkingen tussen patiënten met een bepaald sociaal

profiel (Medicare), maar die niet in beide databases opgenomen waren.79

1.1.2.2 Ervaringen en moeilijkheden i.v.m. gegevenskwaliteit en aangereikte oplossingen.

1.1.2.2.1 Validiteit en volledigheid De validiteit van de gegevens en in het bijzonder die van de diagnose, is van fundamenteel

belang voor de kwaliteit van administratieve gegevens. Deze bekommernis uitte zich onder

meer in de controverse over het al dan niet bestaan van een epidemie van ischemische

hartziekten in de twintigste eeuw.67;98;99;166-168 Het gebrek aan eenduidige, aanvaarde

definities (zie sectie 1.1.5) heeft het ontstaan van dergelijke controverse zeker in de hand

gewerkt en men kan, meer algemeen, stellen dat totaal ontbrekende of suboptimale

definities een bron van problemen zijn.

Een gebrekkige definitie van wat precies de hoofddiagnose is maakt het soms moeilijk de

kwaliteit van de gegevens te beoordelen60, kan tot abstractiemoeilijkheden leiden1 en zo

de vergelijkbaarheid van gegevensbanken bemoeilijken 163. Dezelfde aandoening kan op

verschillende wijzen gedefinieerd worden wat bij een onderzoek naar de volledigheid van

een register door een vergelijking met een ander register tot moeilijkheden kan leiden.135

Ook in de studie van Every et al. bleek het gebruik van verschillende definities voor


50

eenzelfde begrip zoals een recurrent myocardinfarct de vergelijking tussen

gegevensbanken te bemoeilijken.79

Een ander meldenswaardig aspect van deze studie betrof het koppelingsmechanisme. Dit

bestond erin om door middel van samengestelde sleutels, gebaseerd op

gemeenschappelijke variabelen, de gegevensbestanden te linken via een iteratief proces

waarbij in een dalend aantal sleutelvariabelen en met bij elke iteratie relaxerende vereisten

een koppeling bereikt werd.79

Uit de literatuur blijkt ook dat artsen van verschillende disciplines het oneens zijn over de

diagnose bij een zelfde patiënt. Osteoarthritis van de heup en benigne prostaathypertrofie

zijn hier voorbeelden van.131Verder werd de validiteit bestudeerd in functie van het type

personeel, dat verantwoordelijk was voor de ontslagdiagnoses.129 Validiteit van de

gegevens is tenslotte ook functie van het type eigenaarschap: publiek of privaat. Dit heeft

te maken met het afleggen van verantwoording, het voldoen aan de performance- en

rapporteervereisten van de zorgverzekeraars (“purchaser”), en de “reimbursement

benefits” van deze organisaties. Dit zijn de directe geldelijke compensaties, ontvangen

door een instelling, wanneer zij kan bewijzen dat ze diensten aan een bepaalde cliënt heeft

bewezen. In functie van de vereisten van de zorgverzekeraar en van de baten voor de eigen

instelling zal de gegevensverzameling met grotere accuratesse verlopen en zal de

rapportage gemakkelijker waarheidsgetrouw gebeuren. “ … we found that measurement

errors within administrative data systems were not small, random, or uncorrelated

errors”.169

Vergelijkingen tussen gegevensbanken zijn een veelgebruikt middel voor validatie van de

gegevens. Degelijke vergelijkingen kunnen nochtans bemoeilijkt worden door verschillen

in volledigheid136 en/of van definities aangaande de gebruikte termen163. Ook

internationale vergelijkingen tussen registers kunnen bemoeilijkt worden door de

incomplete dekkingsgraad van de registers maar ook door de samenstelling van de

“standaardbevolking”.137


51

1.1.2.2.2 Het abstraheerproces. De kwaliteit van de medische informatie is niet alleen problematisch vanuit een standpunt

van validiteit, maar ze is vervolgens de meest kritische factor tijdens het

abstraheerproces.1;60 In een review werd opgemerkt dat de hoofddiagnose in de

samenvatting van het medisch dossier vaak niet in dezelfde bewoordingen geschreven was

als deze op het ontslagformulier, dat nochtans door dezelfde arts was ingevuld.1 Het

vermogen van de arts om de medische informatie volgens vaste regels te abstraheren blijft

het sleutelelement voor datakwaliteit en dit probleem werd anno 1994 niet opgelost door

beslissingsbomen noch door gecomputeriseerde expertsystemen.60 Als aanknopingspunten

voor verbetering werden de vorming van de artsen over het invullen en het belang van de

formulieren1 en de rigoureuze kwaliteitsbewaking van de gegevens in samenwerking

tussen elke participant in het registratiegebeuren 60 vooropgesteld.

1.1.2.2.3 Ontbrekende en foutieve waarden. Ontbrekende en foutieve waarden zijn een meermaals optredend probleem. Vaak gaat het

eerder over het niet voorhanden zijn van de informatie dan over een rapportagefout en deze

lijken zich eerder voor te doen in de minder belangrijke gegevenscategorieën.138

De proportie ontbrekende records kan verschillen over de diensten en over de maanden

van opname. Verder werd vastgesteld dat meer langdurige verblijven gepaard gaan met

ontbrekende records.60

Fouten bij de gegevensopslag zijn eerder zeldzaam. In een studie werd een globaal cijfer

van 1,5% dergelijke fouten vastgesteld.138 In een andere werden voor de codes 2% data

entry fouten gevonden, met in 0,2% der gevallen een weerslag op het toekennen van

DRGs.60 Dit type fouten deed zich minder vaak voor in de belangrijkste

gegevenscategorieën, waar een cijfer van 0,6% werd vastgesteld.138Het niet terugvinden

van het originele medisch dossier bij een vergelijking tussen gegevensbank en medisch

dossier lijkt vrij beperkt: in twee studies werden volgende percentages opgegeven: 0,5% en

van 0,7 % tot 3,4%.129;141

Codeerfouten zijn een vaak optredend euvel, verschillen in frequentie in functie van het

type ziekenhuis, maar hebben slechts een kleine invloed op het toekennen van een DRG.60

Zij treden vaker op bij diagnosen dan bij ingrepen, die dikwijls belangrijk zijn voor de


52

terugbetaling.82;115;141In sectie 1.2.7 presenteren we de resultaten van de audit van de MKG

2003.

Studies uit de negentiger jaren in het UK gaven als codeeraccuratesse voor diagnosen 84%

aan en 97% voor ingrepen.115 Sommige ingrepen zoals bloedtransfusie worden echter vaak

niet gecodeerd.82 Het aantal codeerfouten met betrekking tot diagnosen of ingrepen

verhoogt bij toenemend aantal vergeleken digits: er worden meer fouten gemaakt op het

niveau van de 4de digit dan op dat van de 3de digit.82;95 Hoewel deze vaststelling enigszins

vanzelfsprekend is, kan ze in belangrijke mate een invloed hebben op de eindbeoordeling

van een administratieve gegevensbank en geeft ze een eerste indicatie in verband met hun

bruikbaarheid op gebied van volksgezondheid en epidemiologie. Zoals reeds gezegd is de

codering van diagnosen minder accuraat dan die van de ingrepen, en kan men voor vele

klinische aandoeningen van een beperkte accuratesse gewagen, al worden belangrijke

medische aandoeningen zoals, heupfractuur, AMI en de meeste kankers correct

gecodeerd.95

Verder worden de ernstiger letsels beter geregistreerd dan de relatief minder ernstige 139 en

worden middelenverbruikende ingrepen zoals een CABG of een keizersnede met de

grootste accuratesse geregistreerd.82;95Het gebruik van een exclusie algoritme kan de

bruikbaarheid van administratieve gegevens voor de studie van een bepaalde aandoening

verhogen. Zo bleek de PPV van een acuut myocard infarct in administratieve

gegevensbanken door het gebruik maken van een exclusie algoritme, waarin onder meer

een verblijfsduur van minder dan drie dagen en het ziekenhuis levend verlaten hebben,

duidelijk hoger in dergelijke studie dan in andere studies, die niet zo een algoritme

hanteerden.112

In de VS werden daarom een aantal richtlijnen gedefinieerd voor het gebruik van de

gegevens van administratieve gegevensbanken. Hierin wordt aangeraden eerder te

focussen op de codering van ingrepen dan op die van diagnosen. Hieronder wordt ook de

techniek begrepen die erin bestaat om het uitvoeren van ingrepen te gebruiken als

surrogaat voor bepaalde diagnosen. Verder wordt er aangeraden de interpretatie van de

diagnose- of procedurecode te beperken tot de derde digit waar mogelijk, en te erkennen

dat de meer objectief gedefinieerde en middelenverbruikende diagnosen en ingrepen meer

accuraat gecodeerd worden.82 Het verweven zijn van diagnose en ingreep maakt dat deze


53

benadering niet altijd opgaat. Voor carotis-endarterectomie bijvoorbeeld wordt bij de

indicatiestelling de graad van stenose, een diagnostisch begrip, als expliciet richtsnoer

gebruikt en is er een hele discussie gaande over hoe die stenose dient gemeten te worden.

In het raam van kwaliteitsbewaking is het duidelijk dat een vergelijking van het

sterftecijfer naar aanleiding van een carotis-endarterectomie slechts zinvol is indien er ook

rekening gehouden wordt met de indicatiestelling.170-175

Voor administratieve gegevensbanken is het cijfer van fout positieven (het registreren van

een diagnose of een ingreep die niet aanwezig was of niet uitgevoerd werd) laag waar het

cijfer van de fout negatieven (het niet registreren van een gestelde diagnose of een

uitgevoerde ingreep) meer variabel is.82

1.1.2.2.4 Relatieve waarde van enkele gegevenstypes bij toegepast wetenschappelijk onderzoek. Het leek wenselijk de relatieve waarde van, bij toegepast wetenschappelijk onderzoek,

vaak gebruikte gegevenstypes te omschrijven. Verschillende auteurs61;76;78;176-193 hebben de

vóór- en nadelen van de verschillende gegevensbronnen nagegaan vanuit het standpunt van

de kwaliteit van de zorgen (Tabellen 8 en 9). Het betreft hier overigens een zeer belangrijk

aspect van het gebruik van administratieve gegevensbanken ten behoeve van de

volksgezondheid dat verder meer uitvoerig behandeld zal worden

1.1.2.2.5 Codeerregels, registratiebeperkingen en het verlies van belangrijke informatie. Symptomen of tekens kunnen belangrijke uitkomsten zijn, die meestal niet gecodeerd

worden tenzij de etiologie ervan onbekend is. Een voorbeeld hiervan is incontinentie bij

bejaarden.136 Een mogelijke oplossing voor dergelijke problemen zou erin bestaan dat

symptomen en tekens met een impact op de zorgenverstrekking op de ontslagformulieren

vermeld zouden worden en vervolgens geregistreerd in de gegevensbank.136

Een speciaal probleem, inherent aan ziekenhuisontslaggegevens, bestaat in de moeilijkheid

het onderscheid te kunnen maken tussen bij de opname bestaande aandoeningen (co-

morbiditeit) en verwikkelingen bij behandelingen. De ICD-9-CM codes en de All Patient

Refined Diagnosis Related Groups zijn hiervoor ontoereikend.188;194-196 Dit fenomeen


54

belemmert het gebruik van administratieve gegevensbanken als instrument voor

kwaliteitsbewaking: een verwikkeling tijdens een verblijf kan immers niet onderscheiden

worden van een bestaande co-morbiditeit bij opname.136;188;196;197Bijvoorbeeld kan een

ziekenhuis met een hoge mortaliteit door myocardinfarct na een bypass operatie, wegens

de gebrekkige informatie onterecht beschouwd worden een laag, risicogecorrigeerde

CABG letaliteitcijfer te hebben, indien verondersteld wordt dat die myocardinfarcten zich

voorgedaan hebben vóór de ziekenhuisopname.198 Een voorgestelde oplossing voor dit

probleem bestaat erin te noteren of een aandoening aanwezig was bij opname of niet en het

registreren van labgegevens bij opname.93;198-200

Hoofdstuk 1: Administratieve gegevensbanken 55

N

Tabel 8: Voor- en nadelen van secundaire gegevens bij het meten van de kwaliteit van zorgen.

VOORDEEL ADEEL

Gemakkelijk te verkrijgen. Gebrek aan specificiteit en detail

Goedkoop. Slechts een beperkt aantal uitkomsten kan bestudeerd worden:

ziekenhuismortaliteit of mortaliteit binnen een gespecificeerde

tijdsspanne, ziekenhuis verwikkelingen en heropnamen.

Mensen kunnen longitudinaal opgevolgd worden. Studies op ziekenhuispatiënten lijden aan verwijzingvertekening: het is

moeilijk op een adequate manier te corrigeren voor het feit dat iemand

opgenomen wordt in een bepaald ziekenhuis.

Specifieke zorgverstrekkers kunnen opgevolgd worden. Zorgen en diagnosen in een setting van ambulante zorgen kunnen een

belangrijke invloed hebben op het ziekenhuisgebeuren.

Geen introductie van vertekening door de inclusie van alleen

maar kwaliteitsvolle centra.

Laat slechts in geringe mate het opsporen van onbedoelde uitkomsten

(“adverse events”) en “near misses” toe.

Onderzoekers beïnvloeden de praktijkvoering niet (geen

Hawthorne effect).

Verschillen in registratiepraktijken en verandering van praktijken in de

tijd.

Uniforme registratie over de ziekenhuizen wat toelaat

ziekenhuizen te vergelijken

Beperkte correctie voor case mix en het ontwikkelen van een

scoringssysteem is zeer technisch en complex. Overschatting van het

volume-uitkomst verband.

Ook zeldzame ziekten kunnen bestudeerd worden.

Minder ethische beperkingen dan andere studies


56

N

Tabel 9: Voor- en nadelen van primaire medische gegevens bij het meten van de kwaliteit van zorgen

VOORDEEL ADEEL

1) Gegevens uit het medisch dossier

Verkrijgbaar. Kostelijk om te bekomen.

Rijkere details dan administratieve gegevens. Kunnen te weinig gedetailleerd zijn.

Indien ze gestandaardiseerd zijn en opgeslagen in een

elektronisch medisch dossier, reduceert dit de

gegevensverzameling.

Rekening houden met beroepsgeheim en privé-sfeer

2) Prospectief verzamelde klinische gegevens.

Het meest specifiek; men kan exact definiëren welke gegevens

vereist zijn.

Niet gemakkelijk te bekomen.

Er bestaat een kwaliteitscontrole van de gegevensverzameling. Kostelijk om te verkrijgen tenzij ze reeds vervat zijn in een elektronisch

dossier.

Strengere (dan voor administratieve gegevens) eisen op ethisch gebied

3) Enquête gegevens.

Men kan verzamelen wat belangrijk is voor de patiënt. Niet gemakkelijk verkrijgbaar.

Men verzamelt gegevens die anders niet beschikbaar zijn. Kostelijk om te verzamelen.

Een valide instrument is vereist.

Hoofdstuk 1: Administratieve gegevensbanken 57

Hoewel administratieve gegevensbanken proces- en uitkomstgegevens verschaffen,

bemoeilijken de onderrapportering van letsels en het niet registreren van belangrijke

prognostische variabelen de evaluatie van het ziekenhuisgebeuren in die mate, dat het

waarschijnlijk beter is over een “screening” van mogelijke problemen te spreken veeleer

dan over een echte evaluatie.77;139 In administratieve gegevensbanken wordt vaak ook geen

onderscheid gemaakt tussen een opname van een patiënt met een nieuw letsel en een

heropname van een patiënt met een chronisch letsel, wat implicaties heeft voor

performance-evaluatie. Indien daarenboven de antecedenten van het letsel niet of

onvoldoende geregistreerd worden kan een vergelijking van kosten-baten i.f.v. het type

personeel vertekend zijn.81

Daarentegen verstrekken klinische gegevensbanken, gecreëerd op basis van abstraheringen

van medische dossiers, gemaakt door artsen in het kader van een extern peer review

programma, belangrijke uitkomstevaluaties, maar zijn vaak toegespitst op enkele

ziekteaandoeningen wat hun veralgemeend gebruik beperkt.82;201

1.1.2.2.6 Het beheer van, of het opzetten van gegevensbanken en de gegevenskwaliteit. In een Engelse studie werd er gepeild naar de bruikbaarheid van ontslagabstraheringen

voor het opzetten van een gegevensbank, die een vergelijking tussen diensten zou toelaten

ten behoeve van zowel de clinici als de managers.150 Dit bleek voor de diensten inwendige

ziekten en chirurgie niet mogelijk, maar wel voor de dienst verloskunde. Indien er in die

dienst problemen werden opgemerkt i.v.m. de registratie, bleken die fouten systematisch te

zijn en waren zij rechtstreeks te herleiden tot problemen i.v.m. definities.

Een belangwekkende vaststelling was dat in die dienst de geregistreerde gegevens

operationeel gebruikt worden door de vroedvrouwen, die ook voor een groot deel

verantwoordelijk waren voor de gegevensinvoer. Verder werd de gegevensbank ook

gebruikt voor routine audit, voor ad hoc vragen, voor meer gedetailleerde klinische studies

en voor het definiëren van contracten met zorgverzekeraars. Het succes van het systeem

kan gedeeltelijk toegeschreven worden aan het feit dat de dataset oorspronkelijk

ontworpen was voor de behoeften van de dienst.

De auteurs stellen deze ervaring tegenover de algemene bevinding dat routine gegevens

van een onaanvaardbare kwaliteit zijn, een veelvoorkomend verschijnsel bij


58

gecentraliseerde ziekenhuiscomputersystemen. Zij schrijven dit fenomeen toe aan een

vicieuze cirkel waarbij van de gegevens geen gebruik gemaakt wordt wegens hun

onvolledigheid en onnauwkeurigheid, en dat eens de potentiële gebruikers hun vertrouwen

verloren hebben er nog weinig ondernomen wordt om het peil van de registratie te

verbeteren.150

Het ontwerpen van protocollen, met een gedefinieerde manier voor het opstellen van een

problemenlijst op basis van overeengekomen diagnostische criteria, werd voorgesteld om

tot een betere registratie te komen.78 Ook het gebruik van aangepaste formulieren

bevordert de gegevenskwaliteit138 en gestructureerde rapportering is een leefbaar

alternatief voor gedicteerde vrije tekst, zeker wanneer het alleen gaat over de beschrijving

en interpretatie van een technisch onderzoek, waar het superieur is151.

Buiten de specifieke bevindingen van de studie van Every et al. op gebied van validiteit,

bevatte ze ook implicaties voor het beheer en het opzetten van gegevensbanken. In de

gecentraliseerde gegevensbank met centrale diagnosestelling op basis van

gestandaardiseerde abstraheerprocedures en validatie door steekproefsgewijze

herabstrahering was er een twee jaar interval tussen gegevensopslag en feedback. In het

meer gedecentraliseerd systeem, met eenvoudiger registratieformulieren en zonder

validatie door steekproefsgewijze herabstrahering, werd er een driemaandelijkse feedback

gerealiseerd. Deze snelle, continue feedback en het betrokken zijn van de lokale

dienstenverstrekkers in het verzamelen en verwerken van de gegevens zijn erkende

karakteristieken van kwaliteitsbevorderende activiteiten. Verder was het “gecentraliseerd”

systeem beduidend duurder dan het “meer eenvoudige” maar kende het “meer eenvoudige”

systeem ook een aantal tekortkomingen: mineure onderregistratie van in aanmerking

komende patiënten, een geringe niet-overeenkomst voor CVA en recurrent myocardinfarct.

De onderrapportering van deze “sentinel events” kan misschien een probleem vormen voor

kwaliteitsverzekering.79

1.1.2.2.7 De algehele doelmatigheid van het registratie-instrument. Naast accuratesse en betrouwbaarheid dient ook met de algehele doelmatigheid van het

instrument van de gegevensverzameling rekening gehouden te worden.152 De vooruitgang


59

van de IT-mogelijkheden zoals het automatiseren van de gegevensabstractie kunnen tot

hooggestemde verwachtingen leiden over een winst in tijd en uitgaven. Dit bleek echter in

een pilootstudie niet te kloppen en leidde tot het besluit dat de methodes van

gegevensabstractie dienden verbeterd te worden of dat het aantal te registreren items

diende verminderd te worden zodat de gegevensverzameling tijdig zou gebeuren en op een

kosteffectieve manier.152

1.2 DOODSOORZAKENSTATISTIEK. KWALITEIT EN VOLLEDIGHEID VAN DE GEGEVENS.

Bij hun invoering hadden overlijdenscertificaten in de eerste plaats wettelijke bedoelingen

en met name het verlenen van de toelating tot begraven4;56;64-66 Daarom mag men aanne-

men dat, op de perinatale periode33;202-204na, praktisch alle sterfgevallen geregistreerd

worden en we dus van complete bevolkingsstatistieken kunnen gewagen.56;205 Deze

wettelijke bepaling, die een quasi-exhaustiviteit waarborgt, heeft ook een minder

begerenswaardig facet: elke arts, die een overlijden vaststelt, is gemachtigd een

overlijdensbericht in te vullen en zal dit om begrijpelijke redenen vaak ook doen.

De criteria, methodes en bevindingen die we presenteerden in verband met de kwaliteit

van administratieve gegevens zijn vanzelfsprekend ook van toepassing op de

doodsoorzakenstatistieken.

Wij belichten hierna enkele, voor deze statistieken specifieke problemen i.v.m. de

gegevenskwaliteit.

1.2.1 Invloed van het genererings- en het verwerkingproces, en van de epidemiologische transitie op de kwaliteit van de gegevens.

“Vele werkers in de gezondheidszorg menen dat deze registratie een grote

onbetrouwbaarheid combineert met een geringe toegevoegde waarde.”206Gegeven hun

finaliteit en hun ontstaanswijze, lijkt enige argwaan aangaande de kwaliteit van de

gegevens overigens gewettigd. Het gaat hier immers over gegevens, die niet uit een

degelijk opgezette studie voortkomen, maar wel uit de ambtelijke registratie van geboorten

en sterfgevallen.4 Vervolgens zijn er verschillende personen en diensten betrokken bij het


60

aanmaken van deze statistieken: de gegevenstoeleveraars, namelijk artsen en gemeentelijke

diensten, en de ambtelijke registrators, namelijk encodeurs en codeurs.

Toch stelde Friedman in 1980: “Er worden belangrijke problemen en onnauwkeurigheid

toegeschreven aan overlijdensberichten. Nochtans vormen zij een wijd toegepaste

gegevensverzameling over fatale aandoeningen, die gebruikt kunnen worden om het

voorkomen van ziekten te bestuderen op het lokale, nationale en internationale niveau.”207

Een gelijkaardig geluid horen we ook op het einde van de negentiger jaren bij Moolgavkar:

“Ondanks de beperkingen van de gegevens en de methodologie, zijn de analyses van

incidentie en mortaliteitsgegevens in staat ons bruikbare inzichten te verschaffen in de

temporele evolutie van een ziekte in een bevolking. Deze analyses laten ons soms toe

kwesties te behandelen die niet gemakkelijk op een andere manier behandeld kunnen

worden, voornamelijk wanneer trends zich uitstrekken over periodes die ruim de

tijdsspanne van follow-up en case-control studies overschrijden.”208

In de volgende paragrafen trachten we elementen aan te reiken over de waarde van deze

gegevens. Hierbij wordt aandacht geschonken aan aspecten van reproduceerbaarheid /

precisie en validiteit / vertekening.128;160;207 Vervolgens komen ook kwantitatieve aspecten

aan bod.

Een diagnose stellen is uiteraard geen eenvoudige taak. Daarenboven veranderen de dia-

gnostische hulpmiddelen en dus de precisie niet alleen over de tijd maar ook volgens de

plaats en de situatie: behandelende arts, reanimerende arts of arts die de dood komt

vaststellen, ervaren arts of arts in opleiding.4;209 Ook in functie van het type van

aandoening worden er verschillen in accuratesse van de overlijdensstatistieken vastgesteld.

Ze is groter wanneer het gaat over langdurige, goed gekarakteriseerde aandoeningen dan

over relatief plots en niet geobserveerde sterfgevallen.210 Verder kunnen ook verschillen in

opleiding van de artsen een rol spelen bij de diagnosestelling211; maken huisartsen minder

certificatiefouten dan ziekenhuis artsen212; nemen die fouten toe bij toenemende leeftijd

van de overledene, bij toenemende leeftijd van de arts en verminderen zij bij toenemend

kwalificatieniveau van het ziekenhuis212; en, zijn de kennis en vorming op het gebied van

het invullen van een overlijdensbericht onvoldoende met onder meer een verwarring tussen

het principe van ernst en het toe te passen principe van causaliteit.206;212;213 Tenslotte is de


61

kwaliteit van de diagnose ook een functie van de bekendheid van de certificerende arts met

de overledene: een reanimerende arts kan een stervende aantreffen op een ogenblik dat het

al te laat is om de doodsoorzaak vast te stellen.

Naast het hierboven beschreven diagnoseprobleem stellen er zich vaak nog een aantal

specifieke certificatieproblemen. De sterfgevallen worden gecertificeerd door een groot

aantal artsen, die dit uiteraard op een gedecentraliseerde manier doen wat duidelijk de

eenvormigheid van certificeren niet in de hand werkt.32 Ook andere factoren spelen een rol

in de variabiliteit tussen de certificerende artsen. Met name het correct weergeven van de

causale keten, die leidt tot een overlijden, is niet eenvoudig. Het beginpunt van deze

causale keten is de oorspronkelijke doodsoorzaak of “underlying cause of death”, die via

één of meerdere intermediaire doodsoorzaken verder verloopt en eindigt met een

onmiddellijke doodsoorzaak.27 Nu is de eerste bedoeling van de overlijdensstatistieken

preventief: men tracht namelijk het leven te verlengen door te verhinderen dat de

oorspronkelijke doodsoorzaak optreedt. Het is dus bij uitstek deze doodsoorzaak die

gepubliceerd wordt en vaak is het de enig beschikbare214.

De steeds toenemende vergrijzing van de bevolking heeft echter het overlijdenspatroon

gewijzigd van een meer eenvoudig, door infectieziekten206;215;216 en maternale sterfte217

gedomineerd beeld, tot een meer complex geheel waarin chronische aandoeningen een

steeds meer prominente rol zijn gaan spelen en waarin bij één individu meerdere

chronische aandoeningen kunnen aanwezig zijn. Wegens deze epidemiologische transitie

is het dan ook veel moeilijker geworden een unieke oorspronkelijke doodsoorzaak aan te

duiden.210;215;218 Voor een groot aantal van de sterfgevallen zal deze unieke doodsoorzaak,

hoe goed ze ook geselecteerd werd, de aan de dood voorafgaande morbide condities niet

langer op adequate manier beschrijven.

Vandaar de nood aan een multipele doodsoorzaken statistiek die naast de oorspronkelijke

doodsoorzaak ook andere op het certificaat vermelde doodsoorzaken opneemt. 214;215;219-226

Zo rapporteerden we bijvoorbeeld in de doodsoorzakenstatistiek 1994 dat de

oorspronkelijke doodsoorzaak van zelfmoord door de certificerende arts soms spontaan

verder werd verduidelijkt door een andere doodsoorzaak zoals het aanwezig zijn van een

kanker. Deze andere of “secundaire doodsoorzaken” verschaffen bijkomende medische

informatie en leveren inzichten in de onderlinge samenhang van doodsoorzaken.33;220-


62

222;227;228 Het registreren van meerdere doodsoorzaken biedt daarenboven de mogelijkheid

om de invloed op de overlijdensstatistieken na te gaan van een verandering in de

selectiemethode van de oorspronkelijke doodsoorzaak zoals bij het invoeren van een

nieuwe classificatie, bij een verandering van interpretatie van een codeerregel van de

Internationale Classificatie van Ziekten of bij het overschakelen op geautomatiseerd

coderen.27;214;229

In het perspectief van beleidsvoorbereiding is het begrip van onderlinge samenhang

belangrijk - men spreekt dan van “competing risks” - wanneer men tracht na te gaan wat

de impact van het elimineren van één bepaalde doodsoorzaak op de totale sterfte is.223;230

Conventioneel worden doodsoorzaken als onafhankelijk van elkaar beschouwd in die zin

dat wanneer men een oorzaak van een voortijdig overlijden wegneemt de winst gelijk

gesteld wordt aan het aantal levensjaren dat door de geëlimineerde doodsoorzaak zou

ontnomen zijn. Nu is het zo dat een mens voortdurend blootgesteld wordt aan

verschillende gelijktijdig optredende risico’s zoals kanker of hartziekte en dat deze risico’s

met elkaar in competitie treden om als oorspronkelijke doodsoorzaak te fungeren. Verder

bestaat er onder concurrerende risico’s een grote verscheidenheid in termen van

afhankelijkheid, inclusief totale onafhankelijkheid. Ook kunnen personen die overlijden

t.g.v. een aandoening een groter of kleiner risico hebben te sterven aan een concurrerende

oorzaak dan deze die weerspiegeld wordt door het overlijdenspatroon van de algemene

bevolking.223Nochtans zou onafhankelijkheid van doodsoorzaken geredelijkerwijze

aangenomen kunnen worden indien er bij de geanalyseerde doodsoorzaken geen

gemeenschappelijke risicofactoren aanwezig zijn.223;230 In het algemeen kan men stellen

dat, vermits er goede redenen bestaan om te geloven dat er een onderregistratie bestaat van

concurrerende doodsoorzaken, het wijs lijkt de op conventionele manier berekende

winsten op gebied van levensverwachting ten gevolge van de uitschakeling van een

doodsoorzaak als een overschatting te beschouwen van de werkelijk te verwachten

winst.223

Om de vergelijkbaarheid van de overlijdensstatistieken te bevorderen heeft de Wereld

Gezondheidsorganisatie (WGO) een aantal initiatieven genomen.


63

Om het eenvormig certificeren te bevorderen stelt ze een formulier ter beschikking voor

het certificeren van een overlijden met tevens een aantal begripsomschrijvingen.27 Wegens

zijn fundamenteel belang voor de statistiek geven we hier de definitie weer van de

oorspronkelijke doodsoorzaak: “De oorspronkelijke doodsoorzaak is (a) de ziekte of de

verwonding die de aaneenschakeling van gebeurtenissen, die uiteindelijk tot de dood

leidden, teweegbracht, of (b) de omstandigheden van het ongeval of geweld die de fatale

verwonding veroorzaakten.”231;232 Het “Internationaal Formulier van Medisch Certificaat

van Doodsoorzaak” is onderverdeeld in een deel I, bedoeld voor de weergave van de

causale keten waarvan de oorspronkelijke doodsoorzaak de basis vormt, en een deel II

waarin ander significante aandoeningen - de zogenaamde bijkomende doodsoorzaken -

opgenomen kunnen worden, die bijgedragen hebben tot het overlijden zonder nochtans

verband te houden met de ziekte, de verwonding of de aandoening die de dood

veroorzaakte. Een approximatief tijdsinterval biedt een ruggensteun voor het correct

invullen van het certificaat.232Waar België er voordien een eigen(gereid) model op nahield,

is het Belgisch certificaat sinds 1998 conform gemaakt aan het WGO-model (Figuur 1).


64

Figuur 1: Het Belgische Certificaat en het WGO-model

Naast certificeringrichtlijnen heeft de WGO ten behoeve van de codering een aantal regels

en nota’s uitgevaardigd met als bedoeling de meest bruikbare of informatieve

oorspronkelijke doodsoorzaak te identificeren.232 Al zijn een aantal regels en richtlijnen


65

aanvechtbaar – zo wordt bijvoorbeeld wel aangenomen dat HIV een Kaposi-sarcoom maar

niet dat Schistosoma Haematobium een uretercarcinoom kan veroorzaken of een

hepatitisvirus een levercarcinoom233 - toch menen wij dat door dit geheel van richtlijnen,

definities en regels de vergelijkbaarheid van de overlijdensstatistieken over de

verschillende landen gemaximaliseerd wordt.

Een herziening van de ICD-classificatie, noodzakelijk om de classificatie aan te passen aan

het veranderend relatief belang van aandoeningen, de veranderende medische terminologie

of het opnemen van nieuwe aandoeningen, brengt een ander type probleem met zich mee,

namelijk een artificiële breuk in tijdsreeksen, zeker indien de herziening gepaard gaat met

een wijziging in de codeerregels, zoals dit gebeurde bij de overgang van de negende naar

de tiende herziening.229 Zoals bij elke herziening werd ook nu het aantal ziektecategorieën

gevoelig verhoogd van een 5.000-tal naar een 8.000-tal met bijvoorbeeld een opsplitsing

van de unieke code voor acuut myocardinfarct in ICD-9 tot zes codes in ICD-10, die de

plaats van het infarct preciseren.

Hoofdstukken van de classificatie werden herbenoemd, herschikt of nieuwe hoofdstukken

werden aan de classificatie toegevoegd. Zo werd bijvoorbeeld het hoofdstuk gewijd aan

het Zenuwstelsel en de Zintuigen opgesplitst in drie hoofdstukken namelijk dat van het

zenuwstelsel, dat van het oog en zijn adnexa, en dat van het oor en van de processus

mastoideus. Regel 3, die stipuleert dat wanneer een door de algemene regel, of door regels

1 of 2 geselecteerde oorzaak duidelijk het rechtstreeks gevolg is van een andere op het

certificaat vermelde oorzaak deze oorzaak dient geselecteerd te worden, werd uitvoerig

uitgewerkt met als meest in het oog springend gevolg dat het aantal sterfgevallen ten

gevolge van pneumonie of bronchopneumonie gevoelig daalden.229;233 Ook ziekten of

symptomen werden herbenoemd en/of geherklasseerd. Zo werden septische shock en

respiratoir falen van het hoofdstuk symptomen in ICD-9 overgebracht respectievelijk naar

het hoofdstuk infecties en ziekten van ademhalingsstelsel, en verhuisde de groep van

myelodysplastische syndromen van het hoofdstuk “Bloed en bloedvormende organen”

naar dat van ”Nieuwvormingen”.229


66

Al deze veranderingen maken dat vergelijkingen over de tijd, ook op

hoofdstukniveau, niet onmiddellijk uitgevoerd kunnen worden maar het uitwerken

vereisen van een vergelijkbaarheidsratio, met als formule Ci = Di,ICD-10/Di,ICD-9.In

deze formule staat Ci voor de vergelijkbaarheidratio voor ziekte i, Di,ICD-10 voor het

aantal sterfgevallen ten gevolge van ziekte i bij toepassing van de ICD-10-

classificatie en Di,ICD-9 voor het aantal sterfgevallen ten gevolge van ziekte i bij

toepassing van ICD-9. In de Verenigde Staten leidden deze veranderingen voor

hartziekten tot een Ci van 0,9858 of een artificiële vermindering van ongeveer

1,5%. Voor kwaadaardige neoplasmata bedroeg de Ci 1,0068 maar bleken er

belangrijke verschuivingen te bestaan van pneumonie naar kanker, van kanker naar

HIV, en van respiratoire kanker naar andere types van kanker. Voor influenza en

pneumonie bedroeg de Ci 0.6982, voor HIV 1,0637, voor virale hepatitis 0,8343,

voor verkeersongevallen door motorvoertuigen 0,8527 en voor accidentele val

0,8409. Voor een uitvoerige bespreking van het onderzoek naar de invloed van de

ICD-10 herziening op de overlijdensstatistieken van de Verenigde Staten verwijzen

we naar het werk van Anderson et al.229;234

Teneinde een grotere eenvormigheid te bereiken op gebied van het coderen – de

regelgeving van de WGO laat immers ruimte voor interpretatie235 - werden in de

Verenigde Staten een aantal softwareprogramma’s ontwikkeld.236;237

Het eerste programma was het Automated Classification of Medical Entities (ACME) en

had als bedoeling uit de op het certificaat vermelde doodsoorzaken de oorspronkelijke

doodsoorzaak te selecteren aan de hand van een geheel van beslissingstabellen waarin de

ICD-9 regels en nota’s verwerkt zijn. Deze beslissingstabellen vormen de kern van het

systeem waarop de hele automatisering gebaseerd is.

Nadien werden hieraan de Mortality Medical Indexing, Classification, and Retrieval

(MICAR) en SuperMICAR systemen toegevoegd, die een verdere automatisering van het

coderen mogelijk maakten. SuperMICAR laat het invoeren toe van een totaal vrije,

literaire tekst, zoals hij door een arts op het overlijdensbericht wordt ingevuld, en

converteert deze literaire tekst tot Entity Reference Numbers (ERN’s), die via MICAR, die


67

de ENRs tot ICD-codes omzet, en vervolgens via ACME gecodeerd worden. Van de

certificaten, die niet automatisch verwerkt kunnen worden via MICAR en SuperMICAR,

worden de doodsoorzaken manueel tot codes omgezet en vervolgens verder verwerkt via

ACME.

Ondanks enkele mineure problemen onder meer het overcoderen van het

overlijdensmechanisme zoals verschillende aritmieën, nierfalen, in plaats van een

etiologische, specifieke doodsoorzaak.237, zijn deze systemen de facto de internationale

standaard geworden voor het automatisch coderen van sterftegegevens.229;237 Noteren we

ook dat deze software het voor de Verenigde Staten mogelijk maakte de

vergelijkbaarheidstudie uit te voeren voor de overgang van ICD-9 naar ICD-10 aan de

hand van de bestaande 1996 sterftegegevensbestanden.229

1.2.2 Internationale studies in verband met kwaliteit van certificatie en codering. Een aantal studies hadden als opzet na te gaan of, en in welke mate, de internationaal

verschillende overlijdenspatronen ook werkelijke verschillen waren dan wel artefacten te

wijten aan certificatie- en/of coderingspraktijken.211;235;238-242Voor dergelijke studies werd

vaak gebruik gemaakt van papieren patiënten. Een medische geschiedenis werd in de

deelnemende landen aan een aantal artsen ter certificatie voorgelegd. Deze certificaten

werden vervolgens door de nationale centra gecodeerd en door een referentie-eenheid

opnieuw gecodeerd.211;238-240 Soms bleef de opzet beperkt tot het vaststellen van eventuele

verschillen in codeerpraktijken en werden bestaande certificaten door een referentie-

eenheid opnieuw gecodeerd.235;241Deze studies toonden aan dat internationale verschillen

gedeeltelijk reëel waren, maar dat er toch belangrijke vertekeningen waren wegens

uiteenlopende certificatie- en codeerpraktijken en dat de vertekeningen in functie van het

bestudeerde onderwerp in belangrijkheid verschilden.

In andere studies werden certificaten vergeleken met autopsie rapporten243, met

hospitaaldossiers244;245, met registers134;165 en soms werd een specifieke enquête georgani-

seerd246 waarbij aan de informant gevraagd wordt een aantal vragen te beantwoorden over

de gezondheidsgeschiedenis van de overledene. Ook een vergelijking van

overlijdensberichten met meerdere andere gegevensbronnen werd uitgevoerd.247


68

De resultaten van dergelijke vergelijkingen tonen aan dat de juistheid van de gegevens niet

feilloos is.247;248 In het algemeen varieert de overeenkomst tussen overlijdenscertificaten en

diagnose afkomstig uit andere bronnen (autopsie, hospitaal dossiers) sterk in functie van de

beschouwde doodsoorzaak en vermindert bij stijgende leeftijd.36;246

Voor coronaire hartaandoeningen (CHD), een van de belangrijkste doodsoorzaken, bestaat

er in de VS een aanzienlijke overschatting249 en in andere landen onder meer België een

aanzienlijke onderschatting (meer dan 40%).165;250 In de VS bleken overigens de

sensitiviteit en de positieve voorspellende waarde van een beroerte kleiner dan die van

CHD, die op haar beurt kleiner was dan die van kankers. De specificiteit en de negatieve

predictieve waarde bleken groot te zijn voor deze aandoeningen, waren lager bij vrouwen

dan bij mannen en daalden bij toenemende leeftijd. Verder bleek er geen trend te bestaan

van deze waarden over drie decades.249

Een moeilijkheid bij CHD bestaat erin dat een aantal sterfgevallen zich buiten het

ziekenhuis voordoen en dat die vaak onterecht gecertificeerd worden als CHD.64 Een

studie, waarbij het overlijdensbericht vergeleken werd met alle beschikbare medische

informatie, leverde een vergelijkbaarheidratio op van 1,44 voor “de out-of-hospital” CHD-

gevallen en 0,90 voor de “in-hospital” gevallen; verder een PPV van 0,83 vs 0,60, een

sensitiviteit van 0,75 versus 0,87 en een fout positieve fractie van 0,08 versus 0,63 voor

respectievelijk in-hospital versus out-of-hospital CHD.64Uit een andere, op een

gelijkaardige manier opgezette studie bleek dat het gelijkstellen van hartstilstand (ICD-9

code: 427.5) met een “sudden cardiac death” (SCD) een sensitiviteit had van 24% en een

specificiteit van 85%.251 Het interpreteren van een hartstilstand als een SCD en vervolgens

in afwezigheid van ander belangrijke pathologie als een CHD geeft aanleiding tot een

overschatting van de CHDs.

Voor colo-rectale kanker als oorspronkelijke doodsoorzaak bleek in de VS de ratio van het

aantal kankers bekomen op basis van de doodsoorzakenstatistiek over dit aantal bekomen

via experten-review praktisch gelijk aan 1 en dit zowel in 1937 als in 1947, 1970-1, en in

1975-1987. Voor colo-rectale kanker, als bijkomende doodsoorzaak, bleek dit veel minder

het geval.252


69

Voor een eerder zeldzame aandoening zoals Amyotrofische Lateraalsclerose (ALS) bleek

de overlijdensstatistieken een voldoende betrouwbaar instrument voor epidemiologische

doeleinden, al is er ook voor deze aandoening sprake van een verminderende

betrouwbaarheid in functie van de leeftijd maar niet in functie van het jaar van

overlijden.247

Om het belang van chronisch obstructief longlijden behoorlijk in te schatten bleek het

noodzakelijk een analyse op alle doodsoorzaken uit te voeren omdat chronisch obstructief

longlijden in aanwezigheid van ischemische hartaandoeningen vaak als bijkomende

doodsoorzaak vermeld wordt. Waar chronisch obstructief longlijden op 8,0% van alle

overlijdenscertificaten vermeld werd, was het slechts in 59,8% ervan als oorspronkelijke

doodsoorzaak vermeld. Verder bleek het onderscheid tussen astma en chronisch obstructief

longlijden vaak niet correct gemaakt te worden met een voorkeur van astma voor vrouwen

en jongere leeftijdsgroepen; bleken bronchitis en niet nader gespecificeerd chronisch

obstructief longlijden meer frequent gebruikt te worden in de oudste leeftijdsgroepen dan

de specifieke vormen van chronisch obstructief longlijden.205;209

Een in het Verenigd Koninkrijk toegepaste techniek bestaat erin het overlijdensbestand te

linken met ziekenhuisontslag gegevensbestand om de “uitkomst” van levensbedreigende

aandoeningen, zoals femurhalsfractuur en beroerte (ICD-9 codes: 431-4,436), na te

gaan.176;184;185;253

Dit soort studies werd opgezet naar aanleiding van de vaststelling in autopsiestudies dat

een ziekte wel aanwezig kan zijn bij het overlijden, maar niet noodzakelijk op het

overlijdensbericht vermeld wordt.185

Zo werden er in functie van het type aandoening grote verschillen vastgesteld in de

overeenkomst tussen de hoofddiagnose in het ontslagbericht van het ziekenhuis en het

certificaat, bij personen die binnen de vier weken na de ziekenhuisopname overleden.185

Voor verschillende kankertypes, beroerte, ischemische hartaandoeningen, spina bifida,

ziekten van de voorhoorncellen en multipele sclerose bleek de hoofddiagnose voor

ongeveer 90% van de gevallen terug te vinden op het overlijdenscertificaat.


70

Voor intracraniaal letsel, diabetes, en niet-medicinale intoxicaties was dit tussen de 60 en

70%, en voor femurhalsfractuur, anemie, astma en medicamenteuze en drugsintoxicaties

bedroeg dit 40% of minder.

Ook de mate waarin deze aandoeningen gecertificeerd waren als oorspronkelijke of

bijkomende doodsoorzaak verschilde in functie van het type aandoening.185

Uit een gelijkaardige studie maar nu bij personen, die binnen een tijdsspanne van een jaar

na de ziekenhuisopname overleden, bleek dat een femurhalsfractuur vaak niet vermeld

wordt op een overlijdensbericht zelfs wanneer het overlijden zich vlug na de fractuur

voordeed en dat de Standardised Mortalty Ratio (SMR) voor femurhalsfractuur niet alleen

veel hoger is dan in de algemene bevolking van vergelijkbare leeftijdsgroepen maar dat de

SMR gedurende verscheidene maanden verhoogd bleef.253

Verder bleek er in de periode 1994-8 over de ziekenhuizen heen geen significante

verschillen in ziekenhuissterfte ten gevolge van femurhalsfractuur te bestaan, bestond er

een duidelijke sociaal-economische trend en bleek er voor de periode 1968-98 na een

aanvankelijke vermindering van de letaliteit sinds het begin van de tachtiger jaren geen

verdere vermindering op te treden in de letaliteit van de aandoening.

Ook werd een toename van leeftijdsspecifieke incidenties vastgesteld met derhalve een

duidelijke implicatie in termen van preventie van osteoporose.176;253 Voor beroerte gingen

de bevindingen eerder in de tegenovergestelde richting: het beroerte sterftecijfer daalde

over de laatste decennia en letaliteitcijfers bleken goede predictoren te zijn voor

ziekenhuisrangen, indien de cijfers berekend werden berekend op basis van de gekoppelde

bestanden.184

Naast deze oorzaakspecifieke studies werd voor de periode 1963-1998 ook de

chirurgiegerelateerde mortaliteit via deze koppelingsstrategie onderzocht. Dit onderzoek

wees uit dat de 30-dagen ziekenhuissterfte voor de periode 1963-74 79,3% van de totale

sterfte bedroeg, voor de periode 1975-86 bedroeg haar aandeel 71,2% en voor 1987-98

61,2%. Hieruit leiden de auteurs van de studie af dat ziekenhuissterfte alleen een

onvoldoende maat is voor de chirurgie gerelateerde mortaliteit wegens de toegenomen


71

transfer van kritisch zieke patiënten en wegens de afgenomen

ziekenhuisverblijfsduur.183Dergelijke studies zijn belangrijk bij de interpretatie van

interziekenhuis verschillen in letaliteit en verblijfsduur.

1.3 BESLUIT

Om over te gaan van een klassieke vraaggestuurde en ziekenhuisgecentreerde benadering,

naar een meer behoeftengestuurd en bevolkingsgericht gezondheidsbeleid is een degelijk

gezondheidsinformatiesysteem nodig. Hierin krijgen secundaire gegevensbanken een

belangrijke rol toebedeeld, met name het in kaart brengen van de gezondheidsstatus van de

bevolking en het mogelijk maken om verantwoording af te leggen over het gebruik van de

toegekende middelen en over de kwaliteit en de uitkomsten van de verstrekte zorgen.

Vraag is dan in welke mate administratieve gegevensbanken die rol ook kunnen vervullen.

Om hierop een antwoord te kunnen geven werd op basis van literatuurgegevens een

referentiekader voor het beoordelen van kwaliteit uitgewerkt en werden statistische en

epidemiologische onderzoeksmethoden voor het bestuderen van gegevenskwaliteit

verkend.

Een zorgvuldig design van de registratie met inbegrip van de te gebruiken formulieren of

beeldschermen; de selectie van te registreren items (zoals klinische, radiologische en

labgegevens, EKG en beeldvorming); eenduidige instructies; het toepassen van

internationaal aanvaarde classificatiesystemen en bijbehorende codeerregels; het op

systematische wijze verzamelen, verwerken en interpreteren van de gegevens en het

monitoren ervan over de tijd zijn basisvereisten voor kwaliteitsverzekering.

73

Hoofdstuk 2: Gebruik van administratieve gegevensbanken in een perspectief van een kwaliteitsvol volksgezondheidsbeleid.

Volksgezondheid, epidemiologie en gezondheidsdiensten zijn brede terreinen waarbinnen

intensief gebruik gemaakt wordt van administratieve gegevensbanken. Hoewel deze drie

domeinen een eigen specificiteit hebben, is het duidelijk dat ze niet los van elkaar staan en

dat er overlapping optreedt. Deze concepten werden immers als volgt omschreven9:

“Volksgezondheid is één van de inspanningen georganiseerd door de gemeenschap om de

gezondheid van de bevolking te beschermen, te bevorderen en te herstellen. Het is een

combinatie van wetenschappen, vaardigheden en overtuigingen, die erop gericht is de

gezondheid van de ganse bevolking te bewaren en te verbeteren door collectieve of sociale

acties. De erbij betrokken programma’s, dienstverlening en instellingen benadrukken de

ziektepreventie en de gezondheidsnoden van de bevolking in zijn geheel. De activiteiten

op het gebied van volksgezondheid veranderen samen met de veranderende technologie en

sociale waarden, maar de doeleinden blijven dezelfde: het verminderen van de ziektelast,

van voortijdig overlijden, van door ziekte geïnduceerde ongemakken en van tijdelijke of

definitieve beperkingen in de bevolking. Volksgezondheid is dus een sociale institutie, een

tak van de wetenschap, en een praktijk”.

“Gezondheidsdiensten leveren diensten, die uitgevoerd worden door professionele

beoefenaars van de gezondheidszorg, of door anderen onder hun leiding, met de bedoeling

de gezondheid te bevorderen, te bewaren of te herstellen. Naast individuele

gezondheidszorg, treffen gezondheidsdiensten maatregelen ter bescherming en ter

bevordering van de gezondheid, en van ziektepreventie”.

“Epidemiologie is de studie van de verspreiding en de determinanten van

gezondheidsgerelateerde toestanden of gebeurtenissen in bevolkingen, en de toepassing

van deze studie om gezondheidsproblemen onder controle te houden.”

Niettegenstaande hun conceptuele overlapping zijn volksgezondheid en

gezondheidsdiensten vaak twee verschillende werelden, zowel in de geest van de

betrokken sectoren als van het beleid.15;254 Nochtans bestaat er conceptueel geen verschil

tussen de volksgezondheidsindicator van vermijdbare sterfte en het gebruik van

Hoofdstuk 2: Gebruik van administratieve gegevensbanken 74

onbedoelde uitkomsten - “adverse events” in de Engelstalige literatuur – als indicatoren

voor gezondheidsdiensten.254 Er bestaan overigens voorbeelden van het gebruikmaken van

ziekenhuisgegevens als evaluatie-instrument voor de volksgezondheid.15;77;85-90;92;255

Meer en meer groeit het bewustzijn dat effectieve gezondheidstussenkomsten een op

elkaar afstemmen vereisen van het zorgsysteem, dat voornamelijk op individuen gericht is

en op het gezond maken van zieken, en het volksgezondheidssysteem, dat op de bevolking

gericht is en het verhinderen dat gezonde mensen ziek worden.256

Er bestaan nochtans tal van voorbeelden van potentiële synergie tussen beide werelden,

zoals bijvoorbeeld het versterken van gezondheidsbevorderende activiteiten via de

massamedia wanneer een gerenommeerd clinicus in die activiteit betrokken wordt.256

Het ontwikkelen van gemeenschappelijke prestatie indicatoren in een context van

gezamenlijke verantwoordelijkheid en verantwoording afleggen kan een vertrekpunt zijn

voor een integratie van beide benaderingen in een biopsychosociaal interventiemodel.256

Toepassingsvoorbeelden hiervan zijn seksuele gezondheid (bvb. ongewenste

zwangerschappen) en geweld (bvb. kindermisbruik) die zowel bevolkingsgebaseerde

(zoals een gezonde, sociale omgeving) als klinische (zoals behandeling, identificeren van

risico-individuen) benaderingen vereisen.256

De essentiële, initiële stappen om tot de gewenste integratie te komen bestaan uit (1) een

nationaal forum waar experts uit beide werelden elkaar ontmoeten; en, (2) de afbakening

van de rol en verantwoordelijkheid van de verschillende belanghebbenden

(“stakeholders”).

Het verwezenlijken van de eerste stap veronderstelt naast politieke wil, ook technische en

politieke vaardigheden. De realisatie van de tweede stap is nog problematischer, want hij

veronderstelt het overstijgen van de bestaande breuk tussen twee culturen, tussen

organisaties, en verder de definitie van verantwoordelijkheid en het toekennen van de

nodige middelen.256

In een recent rapport, waarin in opdracht van de Nederlandse overheid een raamwerk voor

het ontwikkelen van prestatie-indicatoren werd ontwikkeld, werd in figuur 1 een synthese

voorgesteld van de benadering vanuit de wereld van de volksgezondheid en

Hoofdstuk 2: Gebruik van administratieve gegevensbanken

75

vanuit de wereld van de kwaliteitssystemen. Daarbij worden respectievelijk indicatoren

van gezondheid en informatie over de kwaliteit van de geleverde zorg verzameld.72

Figuur 1: Determinanten en indicatoren van gezondheid (volksgezondheidsinformatie) en domeinen van managementinformatie over het zorgsysteem in één raamwerk.

Bron: Delnoij et al.13


76

Dit proefschrift beoogt dan ook bij te dragen tot een vervaging van deze kunstmatige

scheiding tussen volksgezondheid en gezondheidsdiensten om een efficiënt

volksgezondheidsbeleid te bevorderen. Het omschrijven van de mogelijkheden die

administratieve gegevensbanken bieden i.v.m. de beoordeling van kwaliteit van

gezondheidsdiensten lijkt ons een uitgelezen toepassing van dit streven. De beoordeling

van dit fundamenteel aspect en de eruit voortvloeiende bijsturing van het

gezondheidsbeleid is immers alleen maar mogelijk door het samenbrengen van gegevens

uit de verschillende ondersystemen van het gezondheidssysteem (onder meer eerste lijn en

ziekenhuizen). Het is tevens een peilen naar de bruikbaarheid van dergelijke

gegevensbanken voor het beleid, waarbij ook de complementariteit met alternatieve

benaderingen van kwaliteitsbeoordeling aan bod komt.

2.1 KWALITEIT

“The quality of care. How can it be assessed? There was a time, not too long ago, when

this question could not have been asked. The quality of care was considered to be

something of a mystery: real, capable of being perceived and appreciated, but not subject

to measurement. The very attempt to define and measure quality seemed, then, to denature

and belittle it. Now, we may have moved too far in the opposite direction. Those who have

not experienced the intricacies of clinical practice demand measures that are easy,

precise, and complete – as if a sack of potatoes was being weighted”.257

“Although adverse events and iatrogenic injury are relatively common among hospitalized

patients, identifying substandard care is elusive”. 258

2.1.1 Kwaliteit, prestatie en een beleid gebaseerd op kostenbeheersing.

Kwaliteit kan op meerdere manieren gedefinieerd worden, afhankelijk van de plaats

waarop men zich binnen het zorgsysteem bevindt en van de natuur en de omvang van zijn

verantwoordelijkheid.257 Het Insitute of Medecine (IOM) definieert kwaliteit als volgt:


77

“De mate waarin gezondheidsdiensten voor individuen en bevolkingen de

waarschijnlijkheid van verlangde gezondheidsuitkomsten verhogen en in overeenstemming

zijn met de huidige beroepskennis”. 259

In het conceptueel kader voor het Amerikaanse National Healthcare Quality Report

worden twee te meten dimensies vermeld, namelijk kwaliteit van zorg (met aspecten zoals

veiligheid, effectiviteit, patiëntgerichtheid en tijdigheid) en consumentenperspectief (met

aspecten zoals gezond blijven, beter worden, leven met ziekte of beperkingen, omgaan met

sterven) met een voortdurende toetsing aan het principe van billijkheid (“equity”).

Efficiëntiemeting is in dit opzet vooralsnog in beperkte mate aanwezig.260 Een gelijkaardig

kader voor kwaliteitsverbetering werd ook voor België aanbevolen.261

Het begrip prestatie - performance in de Angelsaksische literatuur - overlapt in grote mate

het begrip kwaliteit.72;262 Soms wordt het, zoals in het European Community Health

Indicators project van de Europese Commissie, min of meer als een synoniem ervoor

gebruikt.72 Prestatie omvat onder meer aspecten van aansprakelijkheid/verantwoording

afleggen (“accountability”), rendement (”return”), maar ook kwaliteit van

gezondheidsdiensten70-72;263;264, hoewel een prestatie-indicator, strikt genomen, niet

noodzakelijk inferenties over kwaliteit maakt.263 Delnoij omschrijft prestatie-indicatoren

als volgt: ”Dit zijn indicatoren die iets zeggen over het functioneren van het

gezondheidssysteem: doet het systeem wat het geacht wordt te doen (mensen beter maken,

onnodige sterfte vermijden) en gebeurt dit op een veilige en patiëntvriendelijke manier?”72

Prestatie-indicatoren zijn derhalve meestal gericht op het meten van de mate waarin

doelstellingen bereikt werden.72;73 De volgende definitie, die ten behoeve van het U.S.

Department of Health and Human Services door een panel experts werd gegeven,

illustreert deze zienswijze: “Performance Measure: a quantitative indicator that can be

used to track progress toward an objective, i.e., to detect change over time and difference

in change across programs”.73

Degelijke informatie is fundamenteel voor het voeren van een gezondheidsbeleid.

Prestatie- en kwaliteitsindicatoren vormen hiervan een essentieel onderdeel, zeker voor een

“terugtredende” overheid, die de dagdagelijkse verantwoordelijkheid voor de zorgen


78

“uitbesteedt” maar wel de “toezichthouder, marktmeester en de borger van publieke

belangen”72 blijft.

Om tot het concept kwaliteitsvolle volksgezondheid te komen en zo de synthese tussen

volksgezondheidsbenadering en kwaliteitssystemen te concretiseren, volgen we hier de

overkoepelende kwaliteitsbenadering van Donabedian, waarin zowel technische als

interpersonele aspecten (Figuur 1) aan bod komen en kwaliteit in een ruime,

maatschappelijke context geplaatst wordt, waarin ook de aspecten opgenomen zijn, die

onder performance verstaan worden.257;265

Het voortreffelijk zijn van technische zorgen wordt beoordeeld door de verwachte

verbetering van de gezondheidstoestand te vergelijken met de gerealiseerde, rekening

houdend met wat de huidige wetenschap en technologie van gezondheidszorg hebben

mogelijk gemaakt. Wanneer we “doeltreffendheid” (“effectiveness”) omschrijven als de

gerealiseerde fractie van wat mogelijk(“efficacy”) is, dan wordt de kwaliteit van de

technische zorg proportioneel tot zijn doeltreffendheid en wordt er een verband gelegd

tussen kwaliteit en prestatie.257


Figuur 1: Kwaliteit in zijn maatschappelijke context.


Een volgende stap is het uitzetten van de teweeggebrachte verbetering van de gezondheid

tegen de kost waarmee ze gepaard gaat of doelmatigheid (“efficiency”). Hoewel zij niet

hoeven te interfereren met een optimale uitkomst zijn onnodige zorg en onnodig kostelijke

zorg dermate verbonden met zorgeloosheid en sociale onverantwoordelijkheid dat men het

doelmatigheidsaspect bezwaarlijk kan loskoppelen van kwaliteit.265 Ook voor de Wereld

Gezondheidsorganisatie heeft doelmatigheid een hoge prioriteitswaarde wanneer ze

prestatie omschrijft als het beste resultaat dat kan bereikt worden gegeven de beschikbare

middelen.70;72;265

Kost en kwaliteit zijn in mekaar verstrengeld: tot op zekere hoogte zal de winst in

gezondheid toenemen bij toenemende uitgaven. Nochtans gaat de toename in kosten

onverminderd door waar dit voor de gezondheidswinst niet zo is (wet van het degressief

rendement14). Dit leidt tot twee punten op de curve van de nuttige toevoegingen aan zorg:

enerzijds een punt van “optimaal” doeltreffende zorg (beste verhouding kwaliteit en

kosten), door Donabedian “optimaliteit” (Figuur 2) genoemd, en anderzijds een punt van

“maximaal” doeltreffende zorg (best mogelijke kwaliteit maar met proportioneel hogere

kosten dan op het optimaliteitspunt, respectievelijk punten B en A in figuur 2.1.2).257;265


81

Figuur 2: Definiëren van doelmatigheid en doeltreffendheid bij het beoordelen van

kwaliteit

Bron: Donabedian257

Een andere, minder optimistische visie stelt dat de relatie tussen kost en kwaliteit niet

monotoon is. Wanneer de investeringen in het gezondheidssysteem zich op een laag niveau

bevinden, zullen grotere investeringen waarschijnlijk resulteren in meer gezondheid en

betere kwaliteit. Maar op een bepaald ogenblik zullen bijkomende investeringen en

veranderingen in financiële stimulansen waarschijnlijk uitmonden in het verstrekken van

niet geëigende zorg.266 Heel wat mensen uit de sector van de volksgezondheid zijn

overigens de mening toegedaan dat het verhogen van budgetten of enkel het behouden van

dezelfde budgetten niet kan zonder een betere verantwoording van het rendement t.o.v. de

gedane investeringen in programma’s.73

Donabedian voegt de begrippen aanvaardbaarheid van de behandeling, legitimiteit en

billijkheid (“equity”) toe aan potentiële doeltreffendheid (“efficacy”), doeltreffendheid 13


82

(“effectiveness”), doelmatigheid en optimaliteit – samen de “zeven pijlers” die de kwaliteit

schragen – om tot een overkoepelende visie van kwaliteit te komen.265 Aanvaardbaarheid

van de behandeling houdt in dat artsen rekening houden met patiëntenvoorkeuren, met zijn

vragen en bekommernissen waaronder de kosten, en hem de doeltreffendheid van de zorg

zodanig uitlegt dat de patiënt een geïnformeerde keuze kan maken. Deze speciale focus op

de patiënt, de zogenaamde patient-centeredness en ook op het tijdig verstrekken van

zorgen krijgen overigens heden ten dage steeds meer aandacht bij de beoordeling van

kwaliteit.265;267;268 Legitimiteit betekent dat de zorg aanvaardbaar moet zijn voor de

maatschappij.

Kwaliteitselementen kunnen elkaar versterken of integendeel met mekaar in conflict

komen. De meest storende conflicten ontstaan wanneer maatschappelijke en individuele

voorkeuren verschillen. Het is dan de billijkheid, de faire verdeling over de ganse

bevolking van zorgen en het nut ervan, die het arbitrageproces dient te leiden.265 Kwaliteit,

waarin de begrippen van aanvaardbaarheid voor de individuele patiënten en voor de

maatschappij vervat zijn, kan dus niet alleen in technische termen beoordeeld worden

door gezondheidszorgprofessionelen.257;265;269 De notie van kwaliteitszorg impliceert dat

middelen toegekend worden in functie van medische noden, risico en nut.270

Het interpersonele element is het vehikel waarmee de technische zorg wordt uitgevoerd en

waarvan zijn succes afhangt. Respect voor privacy, confidentialiteit, het mogelijk maken

van een onderbouwde keuze, bezorgdheid, empathie, eerlijkheid, takt, gevoeligheid zijn

kenmerken van een goede interpersonele relatie.257;265 Donabedian

vraagt zich af: “Als dit aspect van zorg zo belangrijk is, waarom wordt er dan zo vaak aan

voorbij gegaan bij de beoordeling van de kwaliteit van zorgen257?” Vooreerst is dit soort

informatie vaak niet beschikbaar, bestaan er vooralsnog weinig goed ontwikkelde criteria

en standaarden waaraan de interpersonele relatie kunnen getoetst worden, en zijn ze

moeilijk te ontwikkelen omwille van de zeer uiteenlopende verwachtingen en voorkeuren

van individuele patiënten.257


83

Het IOM echter stelt dat kwaliteit kan gemeten worden, dat er een substantieel verschil

bestaat tussen de gemiddelde kwaliteit en de beste die bereikt kan worden, en dat dit zowel

geldt in de setting van de prestatiegeneeskunde als in het zorgmanagement (“managed

care”).266;271;272Met een uitdrukkelijke referentie naar de IOM definitie van kwaliteit en

aansluitend bij het kiemkrachtig werk rond belangrijke verschillen in kwaliteit, besprak de

nationale rondetafel over kwaliteit van de gezondheidszorg in de US drie manieren waarop

kwaliteit van zorgen en diensten in het gedrang kunnen komen:

- overgebruik zoals het toedienen van antibiotica als ze niet effectief zijn,

- ondergebruik zoals het niet voorschrijven van β-blockers in geval van AMI

- en, misbruik namelijk de te voorkomen verwikkelingen van behandelingen.271-273

“De convergentie van de bezorgdheid over de kost van medische zorg, het beschikbaar zijn

van grote hoeveelheden van klinische uitkomstgegevens in gecomputeriseerde

gegevensbestanden, en de opzienbarende vooruitgang in de beoordelingsmethodes van

factoren gerelateerd aan uitkomsten hebben een nieuw tijdperk ingeluid van het afleggen

van verantwoording door artsen, ziekenhuizen en gezondheidssystemen.”274 Zorgverleners,

ziekteverzekeraars, ziekenfondsen, beleidsmakers en patiënten maken meer en meer

gebruik van kwaliteits- en prestatie-indicatoren en dit voor kwaliteitsverbetering, voor het

nemen van beslissingen en voor beleidsvoering. 13;70;72;77;254;262;269;275

Er wordt sinds een twintigtal jaren in de gezondheidssector van de meeste Westerse

landen, waaronder België, een beleid van kostenbeheersing gevoerd. 72;73;266;275-278 Men

vreest dat dit ten nadele van de kwaliteit van de zorgen zal uitvallen,266;277kwaliteit die zelf

al verontrustend is271;279. In de VS worden tienduizenden ziekenhuissterfgevallen per jaar

toegeschreven aan medische fouten279 en krijgen slechts 54,9% van de patiënten de

aanbevolen zorgen.280 Men spreekt over een wijder wordende kloof tussen optimale en

verstrekte kwaliteit.271;281Er wordt gesteld dat kwaliteit ongelijk verdeeld is over de

bevolking277 en dat er praktisch geen gegevenssets van klinische kwaliteitsmaten in

veralgemeend gebruik zijn277.


84

Tezelfdertijd groeit het besef dat verantwoording dient afgelegd te worden zowel door de

gezondheidssector zelf als door de overheid.72;73;266;276;282-284 Waar iedereen het erover eens

is dat de kwaliteit van de verstrekte zorgen beoordeeld moet worden, blijft de operationele

vertaling ervan, vooral in ambulante setting, een probleem.269;285In deze context is de

ontwikkeling van kwaliteitsindicatoren een noodzaak.70;72;262Dit is echter een complexe

aangelegenheid en veronderstelt een waaier aan competenties.72;77;181;254;262;263

Het invoeren van performance metingen in openbare diensten had als bedoeling het

afleggen van verantwoording te bevorderen. Dit soort metingen zou toelaten outliers te

identificeren, gevolgd door een meer diepgaand onderzoek bij minder goed of beter

presterende zorgverleners. Hierbij is een afzetten tegen een gemiddelde een belangrijk

kenmerk van deze metingen.286 Het opkrikken van de performance van ondermaatse

zorgverleners of hun verwijdering uit het systeem, én het identificeren van aspecten die

leiden tot beter dan gemiddelde uitkomsten zou leiden tot een algemene verbetering.272;286

Vaak worden gezondheidsuitkomsten zoals niet-gecorrigeerde opnamecijfers voor astma,

epilepsie en diabetes gebruikt als prestatie-indicatoren. Dit is een oneigenlijk gebruik van

uitkomsten omdat bij prestatiemeting alleen die aspecten van zorg in aanmerking genomen

dienen te worden, die hadden kunnen beïnvloed worden door het gezondheidspersoneel,

dat beoordeeld wordt, en er hier ook patiëntgebonden factoren een rol spelen.287 Als er

vergelijkingen gemaakt worden dient dit immers op een correcte manier te gebeuren en

dient de eventuele kritiek geuit te worden aan het adres van hen die ervoor

verantwoordelijk zijn. Of dit toepasbaar is op de performance maten die nu gebruikt

worden is vooralsnog onzeker.286 “... De suggestie dat een uitkomst van een substantiële

publieke investering opgevolgd en beoordeeld dient te worden is niet onredelijk. Een

bijkomend argument stelt dat, indien klinische richtlijnen en de audit ervan betekenisvol

willen zijn, hun doeltreffendheid ook gemeten dient te worden in termen van de bevolking

die ziekenhuizen bedienen. De kwestie is daarom niet “al dan niet” maar wel “hoe?”.286

Deze visie wordt door andere auteurs bijgetreden.269;285


85

2.1.2 Beoordeling van kwaliteit: de visie van de consument en van de zorgverlener.

Ondanks het bestaan van een arsenaal kwaliteitsindicatoren weten we onvoldoende wat de

waarden en voorkeuren zijn van de consumenten aangaande de kwaliteit van zorgen.

Recent onderzoek dat erop gericht was hoe consumenten kwaliteit definiëren leverde een

aantal belangrijke bevindingen op. Vooreerst worden gemaksvoorzieningen zoals voeding,

parking en netheid als zeer verschillend beschouwd van kwaliteitszorg. Vervolgens dient

het begrip van tevredenheid onderscheiden te worden van kwaliteit. Een consument kan

tevreden zijn met zorgen, die niet een hoge kwaliteitswaarde hebben en ontevreden zijn

met kwaliteitszorg. Tenslotte bleken kwesties zoals met respect behandeld te worden en

betrokken te worden in beslissingen over behandelingen, aspecten van gezondheidszorg

die niet vaak in satisfactie-enquêtes opgenomen worden, van zeer groot belang voor de

patiënten.288

Toch blijven er nog een aantal vragen open over welke informatie betreffende kwaliteit

consumenten wensen te beschikken en hoe zij kwaliteit definiëren. Een aantal uitgeteste

vragen (valide en betrouwbaar) aan consumenten laten een beoordeling van de

zorgkwaliteit toe. Die vragen gaan over zowel proces (ervaringen van de consument

gedurende een bepaalde klinische episode) als uitkomst (gezondheidsgerelateerde

levenskwaliteit [“health-related quality of life” (HRQL)] voor en na een behandeling).

Dergelijke, gerichte vragen geven beter de kwaliteit van zorgen weer, zijn beter

interpreteerbaar en meer bruikbaar voor actie dan bevraging over satisfactie en excellentie

van zorgen.

Ondanks de vele dwingende argumenten voor het verzamelen en het onder het publiek

verspreiden van informatie over HRQL, bestaan er praktische en theoretische bezwaren om

dit te doen. Vooreerst zijn veel van die HRQL uitkomsten niet nauw verbonden met

kwaliteit. Dit veronderstelt immers een wel gedefinieerde patiëntengroep (medisch en

demografisch) en een welbepaald etiologisch mechanisme, dat de medische tussenkomst

relateert met de uitkomst, en verder dienen de uitkomsten specifiek te zijn voor de

medische aandoening. Aan deze voorwaarden wordt zelden voldaan. Tenslotte is de

noodzakelijke risicocorrectie voor HQRL uitkomsten meestal zeer moeilijk.60;288;289 Meer


86

algemeen dient men bij studies, waarbij de gezondheidszorg door consumenten beoordeeld

wordt, aandacht te schenken aan de manier waarop correctie voor case mix (voornamelijk

de inschatting van de eigen gezondheidstoestand) werd doorgevoerd en hoe er omgegaan

werd met het probleem van response vertekening ( hogere opleidingsgraad wordt soms

geassocieerd met minder positieve evaluaties).60

Het meten van het “goed zijn” vereist accurate gegevens, die op een gepaste manier

gebruikt worden zonder het gezondheidspersoneel te demoraliseren of te demotiveren.269

Vermits er niet zoiets bestaat als de perfecte of juiste maatstaf, kunnen niet-geëigende

maatstaven uitmonden in perverse stimulansen en de rechtvaardiging zijn van

gegevensmanipulatie of leiden tot demotivatie, disfunctie of crisis.

Momenteel wordt de selectie van kwaliteitsmaatstaven vaak eerder gestuurd door wat kan

gemeten worden, dan door een definitie van wat goed is gevolgd door een daarvan

afgeleide maatstaf.269

Kenmerken van kwaliteitsmaatstaven zijn: het valide, mededeelbaar, doeltreffend,

betrouwbaar, objectief, beschikbaar, contextueel, toeschrijfbaar, interpreteerbaar,

vergelijkbaar, remedieerbaar, aanvaardbaar en herhaalbaar zijn.263;269

Bij de keuze van een maatstaf moet de bedoeling duidelijk zijn, de alternatieven besproken

worden en de beperkingen openlijk erkend worden. Verder moet het duidelijk zijn dat de

bedoeling verbetering is, niet veroordeling. Tenslotte is geduide feedback belangrijk. Hij

moet gedragen worden door leiderschap en dient over de nodige middelen te

beschikken.269 Laten we eraan herinneren dat naast de toetsing aan professionele

maatstaven kwaliteit eveneens functie is van de appreciatie van gezondheidszorgen door

de patiënten en door het publiek.257;265;269 Nu berust de keuze van een wel bepaalde

zorgverlener - de uitdrukking van hoe de patiënt de graad van “goed zijn” bepaalt - niet

alleen op vergelijkingen van de zorguitkomst, maar ook van wachttijden en van de

vroegere individuele ervaringen.269


87

2.1.3 Beoordeling van kwaliteit en administratieve gegevens.

Na het omschrijven van een algemeen kader voor het voeren van een kwaliteitsvol

volksgezondheidsbeleid, met de ruime betekenis van het concept kwaliteit zoals

Donabedian het formuleerde, verkennen we vervolgens de mogelijkheden, die

administratieve gegevensbanken bieden, om de onderdelen zorgen- en

consumentenperspectief en de eraan grenzende onderdelen van de volksgezondheid- en

managementinformatie gestalte te geven en hun verwevenheid aan te tonen.

Het is vanzelfsprekend dat administratieve gegevens onmogelijk over alle aspecten van

kwaliteit informatie kunnen verschaffen. Ziekenhuisontslaggegevens bevatten immers

slechts diagnostische en therapeutische informatie, die uit het medisch dossier werden

geabstraheerd. De diagnostische informatie is in België beperkt tot diagnoses, waarvoor er

meestal geen dwingende definitie bestaat, en bevat geen informatie over de resultaten van

laboratorium en andere technische onderzoeken. Hierbij dient opgemerkt dat het aantal

registreerbare diagnoses en ingrepen in ons land onbeperkt is, met derhalve de

mogelijkheid om co-morbiditeit en (iatrogene) verwikkelingen te vermelden.

Administratieve gegevens kunnen behulpzaam zijn om problemen in verband met

klinische performance te signaleren, kwaliteitsverbeterende activiteiten te onderbouwen,

het nadenken over de klinische praktijk uit te lokken, en belangrijke problemen te

identificeren ten behoeve van verder onderzoek.290Ook is het gebruik van dit soort

gegevens aantrekkelijk: de gegevens zijn gemakkelijk beschikbaar en stellen minder

ethische problemen dan het plannen, werven van fondsen en uitvoeren van langdurige

experimentele studies.180;182 De keerzijde van de medaille is echter niet onbeduidend en

wanneer men onderzoek wenst te doen met dit soort gegevens dient men rekening te

houden met de beperkingen eigen aan administratieve gegevens.182Onderzoek

veronderstelt immers (1) een precieze omschrijving van welke patiënten in de studie

worden opgenomen of niet, (2) een adequate risicocorrectie, (3) een correcte weergave van

de werkelijkheid door de geregistreerde behandelingen of zorgprocessen, en (4) een


88

correcte weergave van de uitkomst met inbegrip van eventuele verwikkelingen.182

Onderzoek vergt derhalve een toetsing van al deze veronderstellingen.

Een eerste reeks tekortkomingen heeft te maken met de validiteit, accuratesse, volledigheid

en betrouwbaarheid van de gegevens180;182 en gaat over opzettelijk fout coderen, het niet bij

machte zijn gevallen van ondermaatse zorg op te pikken177, slechts het intramuraal facet

van de sterfte te bevatten176;182-185, het veranderen van codeerpraktijken in de tijd180 (zie

ook 1.1.2 en 4.2), en conflicterende bevindingen met bijvoorbeeld een gering verband

tussen onbedoelde uitkomsten (“adverse events”) en sterfte180. In vergelijking met

ingreepgegevens zijn vooral diagnoses problematisch.82;182 Dit onderscheid is misschien

overschat omdat de reden waarvoor een ingreep verricht wordt op de diagnose berust en

dat ze belangrijk is zowel bij de evaluatie van processen als van uitkomsten. Verder zijn

administratieve gegevens gekenmerkt door een lage sensitiviteit en een niet-adequate

betrouwbaarheid.290

Een tweede reeks tekortkomingen gaat over de gebrekkige risicocorrectie en andere

belanrijke factoren178;180 De verschillende, bestaande manieren om de ziekte-ernst te

bepalen kunnen tot verschillende resultaten leiden188;196Geen risicocorrectie uitvoeren is

overigens geen optie.192 Het verband tussen volume en kwaliteit wordt in observationele

studies op basis van administratieve gegevens soms overschat.193De beschikbaarheid van

diensten is een andere vertekenende, contextuele factor.287Verder heeft een aantal

beperkingen te maken met de ICD-9-CM codering.290;291 Het gaat hierbij vooral over het

beperkte aantal standaard en E-codes om medische fouten te identificeren, het ontbreken

van precieze klinische definities, aan PPS gerelateerde discoding en, zoals voormeld, het

moeilijk onderscheid tussen bestaande co-morbiditeit en in het ziekenhuis verworven

verwikkelingen, wanneer niet aangegeven is welk pathologieën aanwezig waren bij

opname of niet.93;180;186;187;189;196;198;200;290;292 In tegenstelling met gegevensbanken van

ziekenfondsen, die “levenslange” informatie heeft over haar leden, heeft de MKG alleen

longitudinale informatie over zieken, die in een bepaald ziekenhuis gedurende een bepaald

jaar werden opgenomen.182


89

Het is de bedoeling van dit proefschrift te onderzoeken of, ondanks deze tekortkomingen,

administratieve gegevens bruikbaar zijn voor kwaliteitsscreening. Dit onderzoek lijkt ons

aangewezen omdat administratieve gegevens het enige middel is dat ter beschikking staat

van de overheid om haar verantwoordelijkheid als borger van de publieke belangen op te

nemen.

We zullen hierbij twee benaderingen volgen: een eerste, gebaseerd op

kwaliteitsindicatoren, en een tweede, gebaseerd op een analyse van onbedoelde

uitkomsten293 (“adverse events”). Kwaliteitsindicatoren gaan uit van structuur, proces en

uitkomst van de gezondheidszorg - de triade van Donabedian - met aandacht voor

overgebuik (“overuse”), ondergebruik (“underuse”) en een foutief gebruik (“misuse”) van

een zorg. Zij gaan over specifieke aandoeningen en ingrepen en worden uitgedrukt onder

vorm van een cijfer (“rate”).

De benadering via onbedoelde uitkomsten vertrekt van een foutief gebruik van zorg, van

een ongustig voorval of een incident, is generisch van natuur en wordt op individueel of

geaggregeerd niveau behandeld.

2.2 BENADERING GEBASEERD OP KWALITEITSINDICATOREN.

2.2.1 Types en gebruik van kwaliteitsindicatoren.

2.2.1.1 Domeinen waarbinnen kwaliteitsindicatoren gebruikt worden.

Kwaliteitsindicatoren worden in drie domeinen toegepast: structuur, proces en

uitkomst.72;77;257;261;276;294;295

Structuur wordt door de American Medical Association (AMA) omschreven als “ ...

voorzieningen, uitrusting, diensten , en de mankracht beschikbaar voor zorg, benevens de

credentialen en kwalificaties van de professionele beoefenaars van de

gezondheidszorg”.276 Zij verwoordt proces als “ ... de inhoud van de zorg, d.w.z. hoe de

patiënt zich beweegt in, doorheen, en uit het gezondheidszorgsysteem en de diensten die

verstrekt werden tijdens de zorgepisode”.276


90

Uitkomst wordt geformuleerd als “... de resultaten van de zorg, en omvat onder meer

biologische veranderingen in ziekte, komfort, het vermogen tot zelfzorg, fysiek

functioneren en mobiliteit, emotionele en intellectuele prestaties, patiëntensatisfactie en de

perceptie van de eigen gezondheid, gezondheidskennis en therapietrouw, en leefbaarheid

van de familie, baan, en het sociaal functioneren”.276

Uitkomsten zijn derhalve multidimensioneel, vaak kwalitatief en wisselend over

subgroepen.296

De veronderstelde schakel tussen deze domeinen en kwaliteit bestaat erin dat goede

structuren, waarschijnlijk goede zorg bevorderen en dat dit waarschijnlijk tot betere

uitkomsten leidt. Het is noodzakelijk dat deze relatie ook werkelijk aangetoond

wordt257;276;294 vooraleer enige afzonderlijke component van een structuur, proces of

uitkomst kan gebruikt worden voor het beoordelen van kwaliteit257. Indien criteria op

gebied van zorgenkwaliteit, gebaseerd op structuur- of procesgegevens, geloofwaardig

willen overkomen, dan moet aangetoond kunnen worden dat verschillen in de kenmerken,

die zij meten, leiden tot verschillen in uitkomst. Voor uitkomst criteria zal er aangetoond

moeten worden dat veranderingen in zorgprocessen ook leiden tot veranderingen in

uitkomsten.297

Over structuren weten we relatief weinig en structuren zijn vooralsnog een eerder stomp

instrument voor kwaliteitsbewaking. Ook de beoordeling van interpersonele relaties

bevindt zich nog in de kinderschoenen. De relatie tussen technische zorg en uitkomst is op

sommige gebieden vaststaand, op andere helemaal niet, en hetzelfde type beperkingen

geldt ook voor procesbeoordelingen. Het kan daarbij niet sterk genoeg benadrukt worden

dat ons vermogen om kwaliteit te beoordelen gebonden is aan de sterkten en zwakten van

de klinische wetenschap. Dit geldt zeker wanneer men uitkomsten bestudeert, gegeven de

veelvuldigheid van factoren die een uitkomst beïnvloeden. Bevestiging is nodig door

beoordeling van het proces zelf.257

Wat ook de sterkte en beperkingen zijn van patiëntensatisfactie, er dient terdege rekening

mee gehouden te worden.257;276;288;294Zij kan gezien worden als een uitdrukking van (1) de


91

interpersonele relatie, (2) de kwaliteit van specifieke componenten van technische zorg en

de uitkomst. Hierbij dienen ook gedragingen gerekend te worden, die onrechtstreeks

ontevredenheid suggereren zoals gebrekkige therapietrouw, voortijdig stopzetten van

behandeling, veranderen van arts of van gezondheidsplan of hulp zoeken buiten het

zorgsysteem.257;276

2.2.1.2 Processen of uitkomsten? Er bestaat nog steeds onenigheid of proces- dan wel uitkomstmetingen een betere

weergave van kwaliteit van zorgen zijn.288 Hoewel de uiteindelijke beoordeling van de

kwaliteit van gezondheidszorg gebeurt aan de hand van patiëntenuitkomsten, waarin

patiënten en zorgverzekeraars bij uitstek geïnteresseerd zijn, zijn er een aantal voordelen

verbonden om procesmetingen te gebruiken voor de evaluatie van zorgkwaliteit boven

uitkomsten.257;273;277

Mortaliteit, de meest gebruikte uitkomstindicator levert immers minder aanknopingspunten

voor kwaliteitsverbetering258 dan procesindicatoren, waarvoor artsen veel gemakkelijker

hun verantwoordelijkheid aanvaarden en die bruikbaarder zijn in veel voorkomende

chronische aandoeningen dan uitkomsten, die zich vaak jaren later voordoen, zoals

hypertensie en een beroerte.273;298Verder zijn in de praktijk procesgegevens in het medisch

dossier aanwezig, als het ware op het ogenblik dat ze zich voordoen zodat onmiddellijke

actie kan ondernomen worden en bestaat er een grotere consensus over geëigende

processen en over streefcijfers (ongeveer 100%).257;294 Ook vereist het meten van

zorgprocessen vaak geen risicocorrectie, die zo vaak omstreden is bij vergelijkingen van

uitkomsten. Tenslotte is het gemakkelijker kritische zorgprocessen die niet uitgevoerd

werden te identificeren, onder meer door ze te vergelijken met bestaande richtlijnen, en te

corrigeren dan te bepalen waarom uitkomsten niet optimaal zijn.263;277;280

Uitkomsten hebben dan het voordeel dat ze alle bijdragen tot zorg weerspiegelen met

inbegrip van de bijdrage van de patiënt.257;294 Maar het kan meerdere jaren duren voor een

aantal belangrijke uitkomsten zich manifesteren, en, vermits significante en


92

verwezenlijkbare verbeteringen in uitkomsten meestal veel kleiner zijn in relatieve termen

dan verbeteringen in processen, zijn er onrealistische grote steekproeven nodig voor het

meten van significante verbeteringen in uitkomsten. In tegenstelling hiermee is de

steekproefgrootte voor processen veel realistischer en zijn ze gemakkelijker

interpreteerbaar.277 Daarenboven dient men er bij uitkomstmetingen, hoe goed de correctie

voor ziekte-ernst ook was, rekening mee te houden dat er steeds plausibele verklaringen

kunnen gegeven worden, die niets van doen hebben met kwaliteit, en dat, in geval van

werkelijke verschillen in sterfte, er steeds onderzocht dient te worden waaraan ze te wijten

zijn.178

Verder kan de keuze tussen uitkomst en procesmaten bepaald worden aan de hand van een

aantal operationele elementen zoals het verkiezen van een procesindicator, indien de

beschikbare tijd kort is.299 Ook voor- en nadelen in termen van middelen spelen een rol bij

de keuze: men kan een uitkomstmaat verkiezen omdat die minder vaak moet aangepast

worden dan een procesmaat.300 Tenslotte zijn validiteit en gebruiksvriendelijkheid factoren

waarmee bij de keuze van het type indicator rekening gehouden wordt.300 Zo zijn

procesindicatoren vaak onbegrijpelijk voor de leek, maar zijn overleving en

levenskwaliteit zeer vatbare begrippen.294;300 Ook de overheid, die verantwoordelijk is voor

het borgen van de publieke belangen en met name het garanderen van kwaliteitsvolle en

betaalbare zorgen, hecht groot belang aan resultaatindicatoren.70;72;262;301

In het algemeen is het best in een beoordelingssysteem elementen van structuur, proces en

uitkomst op te nemen.257;294 Dit laat de aanvulling toe van de zwakte van één benadering

door de sterkte van een andere, het helpt de bevindingen te interpreteren en, indien die

bevindingen zinloos lijken, kan dit leiden tot een herbeoordeling van de studieopzet en een

in vraag stellen van de accuratesse van de gegevens.257 Tenslotte kan men stellen dat de

meest doeltreffende manier van kwaliteitsverbetering erin bestaat processen en

zorgstructuren te identificeren, die de grootste impact hebben op patiëntenuitkomsten en

daaraan middelen toe te kennen.294

Nochtans bestaan er grenzen aan deze op uitkomsten gebaseerde benadering van

kwaliteitsverbetering. Sterfte, de meest gebruikte uitkomstmaat, is gewoonlijk een


93

zeldzaam voorval wat resulteert in onvoldoend statistisch vermogen of, in tegendeel, is

voor ziekten zoals longkanker een verwachte uitkomst. Verder is risicocorrectie een

belangrijk aspect bij de interpretatie van een op sterfte gebaseerde indicator.

Niet-fatale uitkomsten zijn veel moeilijker te meten en uitkomsten doen zich vaak slechts

geruime tijd na een zorgepisode voor, wat een terugkoppeling naar kwaliteitsverbetering

inefficiënt maakt. Tenslotte is er een toenemende deelname in de besluitvorming vanwege

de patiënten.

Ondanks haar beperkingen bestaat er een sterke, heroplevende belangstelling voor dit type

van indicatoren: men erkent dat het gebruik van structuur- of procesvariabelen alleen niet

valide kunnen zijn en dat uitkomstmaten meer valide zijn omdat ze direct gericht zijn op

gezondheidsstatus.294

2.2.1.3 Verband tussen structuur of proces en uitkomst. Structuur beschrijft het kader waarin zorg verstrekt wordt en het vermogen van de setting

om kwaliteit te produceren.72;77;257;276Slechts een beperkt aantal verbanden tussen structuur

en uitkomst werden bestudeerd: het patiënten- en ingrepenvolume van ziekenhuizen, het

feit een academisch ziekenhuis te zijn of niet, de erkende kwalificatie van de artsen, het

percentage geregistreerde verpleegkundigen, het percentage van de artsenpraktijk binnen

het ziekenhuis en de deelname van de zorgverleners in de besluitvorming van het

ziekenhuis.15;77;294;297;302-309

Voor vele van deze structuurgebonden variabelen werden tegenstrijdige resultaten i.v.m.

patiëntenuitkomst geobserveerd en voor anderen bleek de omzetting ervan in beleid- of

praktijkverandering moeilijk, indien niet onmogelijk.294 Overigens is van deze

structuurelementen eigenlijk alleen het volume een goed vehikel voor

kwaliteitsverbetering, vermits de andere niet gemakkelijk te veranderen zijn.77;104

De volume-uitkomst verbanden schijnen een surrogaat marker te zijn voor een aantal met

structuur en proces verbonden variabelen, die beter rechtstreeks gemeten zouden

worden.294 Toch worden volume-indicatoren ook nu nog gebruikt en tonen studies met een

hoge graad van risicocorrectie het verband tussen volume en uitkomst aan en dit op


94

ziekenhuisniveau.218;310;311 In een review over het verband tussen volume en kwaliteit

geven Halm et al.312 de volume-uitkomst weer in een conceptueel raamwerk (Figuur 1).

Figuur 1: Conceptueel raamwerk: Hoe zou volume kwaliteit kunnen beïnvloeden?

Bron: Halm et al. 312

Bij dit kader formuleren de auteurs volgende bedenkingen. Patiëntenselectie gebeurt op

verschillende manieren. Soms hebben patiënten weinig tijd of keuze (bvb. patiënten met

een geruptureerd aorta abdominalis aneurysma) maar in minder dringende situaties en

zeker voor electieve chirurgie is het omgekeerde waar. We weten ook weinig over het

verband tussen patiëntenselectie en -volume. Is het aannemelijk dat patiënten in groot-

volume ziekenhuizen meer of minder aangewezen kandidaten zijn voor chirurgie dan

patiënten in kleinvolume ziekenhuizen? Een enkele studie toont aan dat grootvolume

chirurgen meer geneigd waren een niet-aangewezen carotisendarterectomie uit te voeren

dan kleinvolume chirurgen.312

Bij vergelijkingen tussen ziekenhuizen is een terdege risicocorrectie (ziekte-ernst en co-

morbiditeit) een fundamentele vereiste, zeker als grootvolume chirurgen de ziekere of

minder zieke patiënten behandelen. Zoniet zouden zij tot niet-valide besluiten leiden.

Volumes kunnen niet rechtstreeks betere resultaten teweeg brengen, maar wel via

verschillen in de zorgcomponenten: vaardigheden van de arts en andere zorgverleners of

organisatorische vaardigheden.312


95

Er werden een aantal significante verbanden gelegd tussen processen en uitkomst wanneer

de patiënt als eenheid van analyse genomen werd. Dit was bijvoorbeeld het geval voor

hartfalen, acuut hartinfarct en pneumonie.294

Maar de meeste pogingen om zulk een verband te leggen met het ziekenhuis als eenheid

van analyse, waren niet overtuigend omwille van beperkingen van de studieopzet, niet-

adequate risicocorrectie, of het gebruik van ondertussen achterhaalde procescriteria.294

2.2.1.4 Risicocorrectie en maten van ziekte-ernst (“severity of illness”).

2.2.1.4.1 Waarom dient men voor risico te corrigeren? Ziekenhuissterfte is een veel gebruikte kwaliteitsindicator waarmee ziekenhuizen of artsen

vergeleken worden.69;313 Dergelijke vergelijkingen dienen voorzichtig doorgevoerd te

worden want ook nu nog is het zo dat verschillen in sterfte naast verschillen in kwaliteit

van zorgen ook te wijten kunnen zijn aan verschillen in case mix76;101;302;314-316, leeftijd

en/of geslacht101;314;317. Verschillen in volledigheid, betrouwbaarheid en validiteit van de

gegevens (onder meer in codeerpraktijken)101;191;275;282;318;318-322, en in nomenclatuur of

definities van diagnoses en ingrepen163;318spelen hierbij eveneens een rol. Verder

beïnvloeden verschillen in ziekte-ernst en co-morbiditeit,74;105;313;314;317;319;323-326 en het in

rekening nemen of niet van de co-morbiditeit geregistreerd tijdens (een) vorige

opname(s)327de uitkomst. Ook kunnen verschillen in uitkomst te wijten zijn aan

onvoldoende risicocorrectie101-105;328, aan het feit of een ingreep gepland was of niet314;317,

en aan patiëntenselectie312;319. Tenslotte kunnen het ontbreken van het tijdsinterval tussen

diagnose en overlijden302;317 en de beperkingen van de gebruikte risicomaten, die

voornamelijk op de eerste drie dagen van de opname gericht zijn319artificiële verschillen in

ziekenhuisletaliteit veroorzaken.

Uit een review over het volume-uitkomst verband bij CABG stelden Sowden et al. vast

dat, naarmate men bij dit type studies sterfte beter gaat corrigeren, de “klaarblijkelijke”

winst van grootvolume t.o.v. kleinvolume ziekenhuizen verdwijnt.192 Dergelijke

“shrinkage” van volume-uitkomst verbanden en/of van een betere risicocorrectie werd

overigens door meerdere auteurs vermeld en wijst op haar belang.74;101;102;105;192;320;329-331


96

Uitkomsten van behandelingen, waaronder sterfte, kunnen uitgedrukt worden als de som

van de doeltreffendheid van de behandeling plus risicofactoren, die het antwoord op de

behandeling beïnvloeden, plus kwaliteit van de zorg plus toeval.188

Vermits de doeltreffendheid van een behandeling gekend is en de toevalsfactor door

statistische methodologie kan ondervangen worden, is het mogelijk de kwaliteit van de

verstrekte zorgen te beoordelen op voorwaarde dat men corrigeert voor de

risicofactoren.178;188 Nu beïnvloeden verscheidene patiëntenkenmerken het risico,

waaronder leeftijd, geslacht, acute fysiologische stabiliteit, hoofddiagnose en haar ernst,

co-morbiditeit, functionele status, psychosociale en culturele factoren, sociaal-

economische karakteristieken. Het meten van sommige kenmerken is echter niet

eenvoudig en kan duur zijn. Verder kunnen patiënten en artsen een totaal andere mening

hebben over het functioneren van de patiënt. Met wiens zienswijze moet men dan rekening

houden? Ook is het mogelijk dat niet-verzekerde patiënten minder kwaliteitsvolle

ziekenhuiszorgen krijgen dan andere. Correctie voor type betaler kan deze belangrijke

verschillen verdoezelen.188

“Gecorrigeerde” uitkomstcijfers zijn aantrekkelijk 1) voor clinici, die ze zouden kunnen

gebruiken voor audits, 2) voor verzekeraars, ziekenhuisverantwoordelijken en huisartsen,

die ze zouden kunnen gebruiken voor het opstellen van zinvolle en meetbare standaarden

en om hun patiënten/cliënten te informeren over hun keuze van zorgverlener, en 3) voor de

patiënten, die hierop hun keuze van een zorgverlener kunnen baseren.178

Er werd echter te weinig aandacht besteed aan het vermogen van uitkomstmaten om

werkelijke verschillen in performance aan te tonen.178 Zo werden twee ziekenhuizen

vergeleken, elk met een verzorgingsgebied van ongeveer 300.000 inwoners en een

gelijkaardige demografische samenstelling (leeftijd, sociale klas, etnische mix). Voor

beide ziekenhuizen waren sterftegegevens over drie jaar beschikbaar, die perfect

gecorrigeerd waren voor ernst en waarbij eenzelfde methode gebruikt werd voor het

definiëren en het vaststellen van gevallen. Ondanks haar omvang bleek de studie

onvoldoende gevoelig om sterfte door hartinfarct te gebruiken als een maat voor

kwaliteit.178 Daartegenover staat dat relatief korte audits over het zorgproces in staat zijn

relevante verschillen tussen ziekenhuizen vast te stellen.178


97

Wenst men met factoren zoals leeftijd, geslacht, co-morbiditeit en ziekte-ernst rekening te

houden dan doet men hiervoor in principe beroep op statistische technieken zoals onder

meer stratificatie, multipele lineaire of logistische regressiemethoden, en hiërarchische

modellen. Nochtans maakt geen enkele van de gangbare risicocorrigerende systemen

gebruik van deze technieken.77

Al is iedereen het er over eens dat een of andere vorm van risicocorrectie noodzakelijk is,

toch bestaat er onenigheid over welke risicofactoren en hoe ze te meten.163;188 Orchard

formuleert het als volgt: “Bruto ziekenhuiscijfers kunnen gevaarlijk misleidend zijn en

dienen voor case mix gecorrigeerd te worden, maar het identificeren van en wegen voor

prognostisch belangrijke patiëntenkarakteristieken is problematisch omwille van

conceptuele, methodologische en praktische redenen.”316 Hoewel onderzoekers

gedetailleerde risicocorrectoren hebben ontworpen, bleken deze methoden vaak te duur om

op brede schaal te worden toegepast voor ziekenhuisrapportering.188;190

Waarmee beginnen? Vaak wordt er een compromis gesloten tussen gedetailleerde

klinische risicobepaling, logistieke uitvoerbaarheid en redelijke kosten. Daarenboven is het

opzetten van een totaal nieuwe methode zeer duur. Dus is de keuze van een reeds

bestaande methode zeer aantrekkelijk.77;188

Heden ten dage bestaan er heel wat methoden, de “severity measures” genaamd, voor het

voorspellen van de ziekenhuismortaliteit als middel voor ziekenhuisvergelijking. De meest

belangrijke praktische aangelegenheid is dan het kiezen van een gegevensbron: klinische

gegevens of ontslagabstracties. In de eerste groep horen onder meer APACHE III (Acute

Physiology And Chronic Health Evaluation), CSI (Computerized Severity Index), MMPS

(Medicare Mortality Predictor System), in de tweede AIM (Acuity Index Method), APR-

DRGs (All Patient Refined Diagnosis Related Groups) en PMC (Patient Management

Categories).188

Om tot een grotere vergelijkbaarheid te komen werd er naar gestreefd naast klinische

gegevens ook laboratoriumgegevens te verzamelen en bevindt er zich bijvoorbeeld in

APACHE III een module “acid-base subscore”.332 Verder bleek dat het toevoegen van

laboratoriumgegevens de voorspelling van het middelengebruik verbeterde, de nood aan


98

diagnostische gegevens verminderde en, wanneer gekoppeld aan beperkte administratieve

gegevens, accurate predicties toelaten in termen van ziekenhuismortaliteit voor

aandoeningen zoals AMI, CVA,CHF of pneumonie.332;333 Ook het opnemen van

verpleegkundige gegevens draagt bij tot een betere uitkomstvoorspelling en is

complementair aan DRGs en APR-DRGs.334;335

Met het invoeren van het prospectieve financieringssysteem (PPS) in 1983, dat gebaseerd

is op DRGs, werd de bekommernis voor maten van ernst een uiterst belangrijke

aangelegenheid. Zoals voormeld maken de DRGs gebruik van geabstraheerde

ontslaggegevens. Dit zijn in feite demografische gegevens, betalerinformatie,

hoofddiagnose en nevendiagnosen en ingrepen, gecodeerd volgens de ICD-9-CM, en wijze

van ontslag. Nadelen van een op DRGs gebaseerde aanpak zijn enerzijds het gevaar voor

“creep” en anderzijds het ondercoderen van belangrijke risicofactoren zoals chronische

aandoeningen.1;83;140;336-338 Voordelen zijn de uniformiteit, de algemene verspreidheid en de

leesbaarheid voor de computer.

PPS deed de bekommernis toenemen over de kwaliteit van zorgen en meer bepaald

over het gevaar dat ziekenhuizen zouden beknibbelen op de uit de pan rijzende

kosten en (ziekere) patiënten sneller zouden ontslaan.188 De eerste gegevens over

ziekenhuismortaliteit in het Medicare systeem bleken problematisch en

verschillende methodologische gebreken, onder meer niet-adequate correctie voor

ernst, werden vastgesteld.

Op basis van klinische gegevensbanken werden op het einde van de tachtiger jaren

ernstmaten ontworpen, die zowel wetenschappelijk geldig als klinisch

geloofwaardig waren. Maar de kosten voor het verzamelen van deze klinische

gegevens bleken een hinderpaal. In een studie in Pennsylvania bijvoorbeeld

bedroegen ze 17.43$ /patiënt.188 Daarom gingen in de negentiger jaren

verschillende staten over tot het gebruik van APR-DRGs, maar terechte


99

bekommernis over de geloofwaardigheid en de accuratesse van ontslaggegevens

bleef bestaan.101;103;188;333

In een studie in Californië bleek dat de verschillen in sterftecijfers tussen ziekenhuizen

voor een belangrijk deel te verklaren waren door verschillen in codeerpraktijken: zo bleek

in de ziekenhuizen met een veronderstelde hoge mortaliteit er voor 10 % “upcoding” plaats

te vinden waar dit in ziekenhuizen met een veronderstelde lage mortaliteit 74% was.

Derhalve bevinden zich de huidige initiatiefnemers van een vergelijking van

risicogecorrigeerde mortaliteitscijfers in twee kampen: zij die bereid zijn en zij die het niet

zijn om te betalen voor de abstractie van de klinische gegevens uit de medische dossiers.188

Niet alleen bij het bestuderen van ziekenhuissterfte is het noodzakelijk te corrigeren voor

risico, dit geldt ook voor de financiering van het gezondheidszorgsysteem, de tweede

invalshoek.339 Waar het DRG-systeem aanvankelijk uitsluitend gericht was op “resource

intensity” werd de nood aan een uitgebreider systeem gaandeweg duidelijker.195 Dit

systeem diende volgende toe te laten: (1) de vergelijking van ziekenhuizen in een wijde

waaier van middelen en uitkomstmaten; (2) de evaluatie van verschillen in “inpatient ”

mortaliteitscijfers; (3) het uitvoeren en ondersteunen van klinische paden; 4) het

identificeren van “continue kwaliteitsverbeterende” projecten; (5) de basis te vormen voor

intern management en planning systemen; en (6) het management van “capitated payment

arrangements”.114 Dit leidde tot de ontwikkeling van de APR-DRGs195, het algoritme dat

ook in onze MKG wordt gebruikt.

Reeds in de negentiger jaren stelde men in de US en West-Europa een toename vast van

zorgmanagement, een antwoord op het groeiende bewustzijn van de onomkeerbare

schaarste van de middelen die ter beschikking van de gezondheidszorg gesteld worden en

werd het meer en meer duidelijk dat de gezondheidssector verantwoording diende af te

leggen voor de toegekende middelen.71;72;263;339;340 Terzelfder tijd streefde men naar een

financiering die een gelijke toegang tot de zorgen zou verzekeren aan de ganse bevolking.

Bij dit soort oefeningen dient men rekening te houden met de zorgbehoeften, die ongelijk

verdeeld zijn over de bevolking, of anders uitgedrukt, men dient een risicocorrectie toe te

passen.339


100

2.2.1.4.2 Onderlinge vergelijking van de maten van ernst. Om te kiezen uit de verschillende voorgestelde maten van ernst lijkt het aangewezen na te

gaan in welke mate de verschillende systemen tot hetzelfde beoordelingsresultaat komen.

Totnogtoe is er echter weinig “extern” onderzoek geweest van de diverse maatstaven.

Vergelijkingen zijn trouwens zeer moeilijk bij gebrek aan één gegevensbank, die over alle

gegevenselementen in de juiste vorm beschikt zoals dit voor de verschillende maten van

ernst vereist is.188

Iezzoni et al. waren tot in 1997 de enige groep, die een uitgebreid extern onderzoek

verrichtten over de predictieve waarde van commerciële “maten van ernst” voor

sterftecijfers.188;189 In termen van de c statistiek56;333;341 ook c index342 genaamd, die

aangeeft hoe goed de maat van ernst patiënten die bleven leven onderscheidde van

degenen die overleden, en van de R² 56;341 bleken de “klinisch gebaseerde maten van ernst”

het beter te doen dan de “op ontslagabstractie gebaseerde maten van ernst” voor

pneumonie en beroerte maar was het omgekeerde waar voor AMI en CABG.188;189 Hierbij

dient echter opgemerkt dat in de “ontslagabstractie gebaseerde maten van ernst” in

tegenstelling tot de “klinisch gebaseerde maten van ernst” ook laattijdige diagnosen,

bijvoorbeeld verwikkelingen na een ingreep, in de ernstbepaling meegenomen wordt. Dit

verhoogt weliswaar het discriminatievermogen maar ondergraaft terzelfder tijd de

validiteit van het kwaliteitsonderzoek.188;189;333

Een aantal studies gingen verder in op de waarde van APR-DRGs als instrument voor

risicocorrectie. Hieruit bleek dat, indien men alleen rekening hield met de ziekte-ernst

(Severity of Illness (SOI)) toegekend door het algoritme, de SOI beter de

ziekenhuisletaliteit van AMI en CABG voorspelde, dan systemen, die een uitgebreide

abstractie van klinische variabelen vergden. De Risk Of Mortality (ROM) module van

APR-DRG, bezat een minder goede voorspellende waarde dan de SOI, indien de

diagnosen beperkt bleven tot de aandoeningen, aanwezig bij de opname en men niet met

de nadien ontstane verwikkelingen rekening hield.196 Het gebruik van de verblijfsduur als

studieobject lijkt wat minder problematisch, indien het middelengebruik het voorwerp van

studie is. Mozes et al. menen overigens dat in geval van tijdens het verblijf optredende

verwikkelingen het vaker om niet-vermijdbare verwikkelingen gaat dan om iatrogene en


101

dat de laatste categorie dient opgespoord te worden via maatregelen op het gebied van

kwaliteitsverzekering.332

Een volgend aspect betreft het voorspellen van de ziekenhuismortaliteit niet in functie van

een pathologie maar van een patiënt. In dit soort oefeningen wordt nagegaan in welke mate

het stervensrisico voor een zelfde patiënt door de verschillende maten van ernst op

dezelfde manier wordt ingeschat. Dit verschil bleek substantieel te zijn niet alleen tussen

de “klinische maten van ernst” en de “op ontslagabstractie gebaseerde maten van ernst”

maar ook tussen de “op ontslagabstractie gebaseerde maten van ernst” onderling, bvb. in

60.7% van de CABG patiënten waren PMC en APR-DRG het oneens.188;189De vaststelling

van verschillen tussen maten van ernst op patiëntenniveau leidde tot een vergelijking van

globale mortaliteitscijfers op ziekenhuisniveau, en ook hier bleken er verschillen tussen

maten van ernst te bestaan. Het viel in deze studie overigens op dat de overeenkomst

tussen bruto-sterftecijfers en gecorrigeerde sterftecijfers volgens een bepaalde maat van

ernst soms beter was dan tussen gecorrigeerde sterftecijfers gemeten met een andere maat

van ernst.188

Implicaties

1) Globaal genomen suggereren deze analyses dat individuele ziekenhuizen zich zorgen

kunnen maken over op basis van welke sterftecijfers (al dan niet gecorrigeerde) en van

welke maat van ernst ze beoordeeld worden.188 Het punitieve gebruik van sterftecijfers,

gecorrigeerd voor ernst, is niet aangewezen vermits de beoordeling afhankelijk is van het

gebruikte type correctie.343 Ondanks hun statistische performance, pleiten de

codeervolledigheid en de financiële motivatie voor het coderen tegen de op

“ontslagabstractie gebaseerde maten van ernst”. Hierbij is het zo dat het coderen van de

ziekte-ernst niet beperkt blijft tot de vooraf bestaande aandoeningen, maar ontaardt in

“death code creep”, het overcoderen van catastrofale gebeurtenissen bij stervende

patiënten als ziekenhuisantwoord op ziekenhuisprofielen, gebaseerd op ontslaggegevens.188

2) Wat betekenen risicogecorrigeerde ziekenhuis sterftecijfers dan?


102

Ziekenhuizen verschillen in hun niet-gecorrigeerde sterftecijfers maar ook de maten van

ernst falen om deze verschillen volledig uit te leggen en een deel van de verschillen

kunnen toegeschreven worden aan de nauwkeurigheid van de gegevens. De centrale en

vooralsnog onopgeloste vraag van “Is de risicocorrectie zo goed dat de verschillen in

uitkomsten tussen ziekenhuizen alleen aan verschillen in kwaliteit toe te schrijven zijn?”

blijft open en uitsluitsel is onwaarschijnlijk op korte termijn. De vereiste research is duur,

tijdsverslindend, logistiek moeilijk en methodologisch complex. Slechts een handvol

dergelijke studies werden uitgevoerd en kwamen tot tweeslachtige bevindingen.188

Vergelijkingen van mortaliteitscijfers over ziekenhuizen, die alleen gebaseerd zijn op

administratieve gegevens, kunnen vertekend zijn en misleidend, zelfs indien de c-statistiek

excellente resultaten oplevert. Administratieve gegevens kunnen derhalve alleen gebruikt

worden als een initiële screening of als een aanzet tot verdere studies.333

3) Waarom dan corrigeren voor risico?

De voornaamste reden is dat hoe onvolmaakt ook er geen andere manier bestaat om een

productieve dialoog te beginnen met de artsen en andere zorgverleners over het

gebruikmaken van informatie van uitkomsten om kwaliteitsverbetering te motiveren.188

Een tweede dwingende reden voor het uitvoeren van risicocorrectie is te vermijden dat

zorgverleners die hoogrisico patiënten behandelen gestraft zouden worden.188;344

2.2.1.5 Evaluatiekader voor het ontwikkelen van kwaliteitsindicatoren (QI). Het ontwikkelen van kwaliteitsindicatoren is erg complex en vraagt de inzet van een aantal

onderzoekers met een waaier van deskundigheden72;181;262;345, wat duidelijk buiten het

bestek van dit proefschrift ligt en overigens voor België nog niet uitgevoerd werd. Een

alternatief is dan het gebruiken van in het buitenland ontwikkelde indicatoren,

waarbij er aandacht besteed wordt aan de gegevens die gebruikt werden voor het

ontwikkelen van de indicatoren, aan de manier waarop en de redenen waarvoor die

indicatoren geselecteerd worden, en aan de interpretatie van de bekomen resultaten.346 In

een Amerikaans project: “Refinement of the Healthcare Cost and Utilization Project

Quality Indicators”77 , ontwikkeld door het Stanford Evidence-based Practice Center ten

behoeve van de Agency for Healthcare Research and Quality, wordt volgend

evaluatiekader gebruikt voor de ontwikkeling van kwaliteitsindicatoren (QI):


103

1) “Face validity” of indruksvaliditeit: ook wel “logische validiteit” genoemd (bvb. het

op één voet kunnen staan als indicator voor evenwicht), gezonde klinische en/of

empirische basis voor het gebruik van een QI. Vat de indicator een kwaliteitsaspect dat

algemeen als belangrijk beschouwd wordt en dat voldoende beïnvloedbaar is voor de

dienstverstrekker of het systeem van volksgezondheid?

2) Precisie: grote variabiliteit van de QI over de zorgverleners of areas, en die niet te

wijten is aan toevalsvariabiliteit (niet waargenomen omgevings- of

patiëntenkarakteristieken);

3) Minimale vertekening: de QI is weinig of niet gevoelig voor systematische

verschillen in patiënten case mix of voor verschillen in opnamepolitiek. Mocht er

vertekening aanwezig zijn, dan is het mogelijk risicocorrectie of statistische methoden

(Bayesiaans) toe te passen om het grootste deel van of gans de vertekening weg te

nemen. Risicocorrectie wordt echter bemoeilijkt door codeerproblemen (codeerfouten,

upcoding en undercoding), beperkingen op het aantal toegelaten nevendiagnosen en

het ontbreken van een onderscheid tussen ziekenhuiscomplicaties en reeds bij de

opname bestaande ziektetoestanden.

4) “Construct validity” of begripsvaliditeit: sensitiviteit, specificiteit en voorspellende

waarde van een indicator zijn belangrijke eigenschappen voor het opsporen van een

echt kwaliteitsprobleem t.h.v. een ziekenhuis of eerste lijn. Daarom wordt de

begripsvaliditeit uitgetest waarbij men nagaat in welke mate de QI onderbouwd wordt

door resultaten die in dezelfde richting gaan als deze van andere indicatoren, die

dezelfde of gelijkaardige kwaliteitsaspecten meten, of door de bewezen performance in

het identificeren van zorgverleners met kwaliteitsproblemen.

5) De QI bevordert een reële kwaliteitsverbetering. Er wordt nagegaan of de indicator

ongevoelig is voor perverse stimulansen waarbij de zorgverleners “aangemoedigd”

worden hun gerapporteerde performance te verbeteren door het vermijden van

moeilijke of complexe gevallen, of tegen andere “antwoorden”, die niet met een

kwaliteitsbevordering gepaard gaan bvb. voortijdig ontslag om tot een lager cijfer van

ziekenhuismortaliteit te komen.

6) De QI werd reeds toegepast in het verleden en/of heeft een groot potentieel voor

complementariteit met andere indicatoren, die momenteel in gebruik zijn.


104

Ook in Nederland,waar men een kader geschetst heeft voor de ontwikkeling van prestatie-

indicatoren, formuleerde men een zeer vergelijkbare lijst van vereisten, waaraan prestatie-

indicatoren moeten voldoen: gebaseerd zijn op heldere en consistente definities; valide zijn

(werkelijk meten wat zij pretenderen te meten); niet vatbaar zijn voor manipulatie; beknopt

zijn en beperkt zijn in aantal; gebaseerd zijn op geloofwaardige, betrouwbare informatie;

acceptabel zijn voor de organisatie; betekenisvol zijn.72

2.2.1.6 Een alternatief voor kwaliteitsindicatoren: het peer review. Methoden voor het beoordelen van kwaliteit kunnen gaan van het gebruikmaken van totaal

expliciete tot totaal impliciete criteria/standaarden. Waar impliciete criteria kunnen

aangepast worden aan de precieze karakteristieken van ieder geval, wat individuele

beoordelingen mogelijk maakt die beantwoorden aan het multidimensionele concept van

kwaliteit, zijn ze echter zeer kostelijk en minder precies dan expliciete criteria.257

Voornamelijk de reproduceerbaarheid en accuratesse van impliciete criteria stellen

problemen.181;347 Expliciete criteria zijn duur om te ontwikkelen, maar laten, eenmaal zij

ontwikkeld zijn, meer precieze metingen tegen een lagere kost toe. Een sequentiële

combinatie van beiden kan aangewezen lijken: beginnen met een korte expliciete om

verdachte gevallen te identificeren en voortgaan met een impliciete benadering voor de

verdachte gevallen.257

Tussen beide in bevinden zich wat men gestructureerde, impliciete reviews noemt en die,

indien mogelijk, op een blinde manier uitgevoerd worden, zodat de onderzoeker niet weet

welke de uitkomst van het bestudeerde geval is. Het formulier geeft geen expliciete

instructies aan de arts hoe hij de kwaliteit moet rangschikken, wel is het eerder bedoeld om

de arts te helpen een aantal topics in de beoordeling te betrekken. Bij een gestuctureerd

impliciet review worden vragen gesteld zoals “tijdigheid van de diagnostische evaluatie

van zich presenterende problemen”.164;181;279

Er bestaan een aantal algemene bezwaren i.v.m. (gestructureerde, impliciete) reviews.

Voorzichtigheid is geboden bij de interpretatie van causale verklaringen op basis van

retrospectieve reviews. Medische fouten kunnen onderschat zijn (men kan weigerachtig

staan tegenover het inschatten van de zorg van een collega en veel fouten kunnen niet in


105

het dossier opgenomen zijn). Maar medische fouten kunnen ook overschat worden precies

omdat men weet dat het over sterfgevallen of ongunstige gebeurtenissen gaat. Verder zijn

artsen geneigd om de overlevingskansen van zieke patiënten te hoog in te schatten en om

gecorrigeerde fouten zonder onbedoelde uitkomsten of minimaal onbedoelde uitkomsten

niet als een fout te bestempelen. Beoordelaar overeenstemming is overigens steeds een

pijnpunt ook al gaat het over fundamentele dingen zoals het vaststellen of een ongunstige

gebeurtenis zich al dan niet heeft voorgedaan.258;279;348;349Bijvoorbeeld de overeenstemming

tussen verschillende beoordelaars was slechts matig in de Harvard Medical Practice

Study en in de Quality in Australian Health Care Study350;351met kappas van ongeveer 0,6.

Het zijn onder meer deze studies waarop het IOM zich baseert om van tienduizenden,

vermijdbare sterfgevallen te gewagen284;352.

Een studie, waarbij overeenstemming tussen verschillende beoordelaars centraal stond,

toonde aan dat de meningen van beoordelaars in verband met de voorkoombaarheid van

onbedoelde uitkomsten sterk verschilden; dat ze een schuine verdeling hadden; en, dat de

notie van vermijdbaarheid ook sterk verschilde in functie van de klinische toestand en dus

de te verwachten uitkomst. Bijvoorbeeld meningen van beoordelaars kunnen verschillen

wanneer men de vermijdbaarheid van eenzelfde sterfgeval achtereenvolgens gaat

beschouwen als een vermijdbaar sterfgeval; of, als een vermijdbaar sterfgeval gecorrigeerd

voor de probabiliteit van het ziekenhuis levend te verlaten; of, als een

vermijdbaar sterfgeval gecorrigeerd voor de probabiliteit van het ziekenhuis levend te

verlaten en in goede cognitieve gezondheid.279

Toch wordt het impliciet interview om een aantal redenen nog steeds gebruikt. Het is

gemakkelijk te ontwerpen en toe te passen, en heeft een goede indruksvaliditeit (“face

validity”). Het is verder vrij eenvoudig om het interview te actualiseren door beroep te

doen op up-to-date experts. Het weerspiegelt overigens de volledige waaier van klinische

beslissingen die op een bepaalde patiënt van toepassing zijn en heeft het vermogen om, in

tegenstelling tot kwaliteitsindicatoren, de interpersonele relaties bij de beoordeling te

betrekken.257;349 Tenslotte is men erin geslaagd de bruikbaarheid van het gestructureerd

impliciet interview te verbeteren door zich te beperken tot aandoeningen, waarbij men

beschikt over goede evidentie over wat kwaliteitszorg is.349


106

2.2.2 Kwaliteitsindicatoren op basis van administratieve gegevens.

2.2.2.1 Aan structuur gerelateerde maten: volume. Kwaliteitsbevorderende strategieën gebaseerd op volume werden aanbevolen 104;218;297;302-

308;310-312;314;353 niet alleen wegens de onomstotelijke evidentie over het verband tussen

volume en uitkomst maar ook omdat andere opties voor kwaliteitsverbetering als

onpraktisch of ineffectief beschouwd werden.104 Procesmaten werden niet goed verstaan,

regulerende benaderingen werden met weinig enthousiasme begroet, continue

kwaliteitsverbetering werd buiten het gebied van de hartchirurgie nauwelijks

toegepast104;320 en het publiekelijk vrijgeven van sterftecijfers bleek niet in staat het

consumentengedrag significant te doen veranderen.104;354

In tegenstelling hiermee bleken op volume gebaseerde verwijzingsstrategieën in het

algemeen te leiden tot betere uitkomsten.104 Verder kunnen op volume gebaseerde

drempels gebruikt worden om consumenten aan te sporen om naar bepaalde ziekenhuizen

te gaan, om vereisten van erkenning voor referentiecentra te rechtvaardigen, om het

opzetten van nieuwe diensten onder controle te houden en om als leidraad voor de

professionele vormingsvereisten te dienen.104;320

Laten we nagaan in welke mate volume als proxy bruikbaar is voor kwaliteitsvolle,

risicogecorrigeerde ziekenhuissterfte, de meest gebruikte uitkomstmaat.104 Modern

onderzoek naar het verband tussen volume en uitkomst begon met het baanbrekend werk

van Luft en collega’s.330. Voor een aantal ingrepen, waaronder CABG, werd vastgesteld

dat ziekenhuizen met meer dan 200 ingrepen per jaar een 25 tot 41 % lagere voor case mix

gecorrigeerd sterftecijfer hadden dan in ziekenhuizen met minder dan 200 dergelijke

ingrepen.Voor een tweede groep aandoeningen, waaronder colectomie, was er nog steeds

een dergelijk verband maar lagen de volumedrempels een behoorlijk stuk lager, namelijk

10 tot 50 ingrepen. Voor een laatste groep ingrepen, waaronder cholecystectomie bleek er

geen dergelijke verband te bestaan.

Deze auteurs identificeerden een aantal principes en vragen, die de basis vormden voor

verder onderzoek. Hierbij werd het duidelijk dat de toepasbaarheid van het volume-


107

uitkomst verband zich beperkte tot complexe ingrepen en het uitwerken van

ingreepspecifieke functionele verbanden en drempels. Verder diende de respectievelijke

rol van chirurgen- en ziekenhuisvolume nagegaan te worden. Het werd belangrijk geacht

de onzekere causaliteit van het volume-uitkomst verband verder uit te klaren. Ook aan het

onderzoeken van de potentiële risico’s en voordelen van regionalisatie diende aandacht

besteed te worden. Tenslotte bleef men de nood aan uitgebreide, risicogecorrigeerde

gegevens als een belangrijke, op te vullen leemte beschouwen.

Latere studies hebben dit volume-uitkomst verband bevestigd.104 In een recent artikel

bijvoorbeeld werd de invloed van ziekenhuisvolume op postoperatieve mortaliteit

bestudeerd voor 14 complexe ingrepen. Hierbij werden vergelijkingen gemaakt, gebaseerd

op zo homogeen mogelijke patiëntengroepen in termen van leeftijd, indicaties voor

ingrepen (bvb geen thoraco-abdominaal aneurysma bij ingrepen voor abdominaal

aneurysma), en zekerheid van diagnose. Mortaliteit verminderde bij toenemend volume

voor de 14 bestudeerde ingrepen, maar het relatief belang van het volume varieerde sterk

in functie van de ingreep: bvb voor pancreasectomie bedroeg het absoluut verschil 12,5 %

tussen laag (16.3%) en hoog volume (3,8%) ziekenhuizen.310 De auteurs menen dat de

vastgestelde resultaten het verschil in chirurgische kwaliteit weerspiegelen tussen “hoog

volume” en “laag volume” ziekenhuizen. Zij geven ook een aantal beperkingen aan zoals

het niet in de studie opnemen van mensen van minder dan 65 jaar, de niet perfecte meting

van volume, een gebrekkige benadering van de sociaal-economische status van de

patiënten, een aantal factoren, die eventueel de uitkomst beïnvloeden (grootte van het

ziekenhuis, teaching status, het volume per individuele chirurg en personeelspatronen van

de intensieve zorgen) en, vermits er gebruik gemaakt werd van administratieve gegevens,

een eventueel onvoldoende rekening houden met case mix verschillen.310

Kankerstudies hebben overigens de impact aangetoond van volume op andere uitkomsten

dan ingrepenmortaliteit. Dit weerspiegelt het belang niet alleen van chirurgische

vaardigheid maar ook van procesaangelegenheden zoals keuze van behandeling, adjuvante

therapie en follow-up op lange termijn.104;311

Verder is het verband tussen volume en uitkomst merkwaardig consistent over de tijd en

over de studies. Dit verband is ook klinisch plausibel: waarschijnlijk meer gespecialiseerde

chirurgen, meer consistente processen voor postoperatieve zorg, beter van personeel


108

voorziene eenheden voor intensieve zorg, en in het algemeen grotere middelen om met

postoperatieve verwikkelingen om te gaan.

Een recent review kwam tot gelijkaardige bevindingen over het verband tussen hoog

volume en betere uitkomst, de variabele graad van sterkte van het verband over de

ingrepen maar ook de vermindering van de sterkte van het verband bij gebruik van

klinische i.p.v. administratieve gegevensbanken.355 Andere auteurs zijn de mening

toegedaan dat de omgekeerde relatie tussen volume en uitkomst voor een ingreep niet

specifiek is voor die ingreep maar dat het veeleer gaat over het algemeen functioneren van

een ziekenhuis en met name de gemeenschappelijke structurele en proceskarakteristieken

en stellen dat het vermijden van een aantal ingrepen gerelateerde sterfgevallen niet het

meest overtuigende argument voor regionalisatie is.356;357Verder blijkt er een aanzienlijke

overlap te bestaan qua resultaten tussen hoogvolume en laagvolume zorgverleners.104

Het volume-uitkomst verband werd beschreven voor ziekenhuizen en voor artsen.

Sommige onderzoekers menen dat dit verband sterker is voor ziekenhuizen dan voor

artsen; het aandeel van de proportie zieken behandeld door laagvolume artsen is hierbij

echter belangrijk en in hoogvolume ziekenhuizen kunnen de prestaties van laagvolume

artsen verdoezeld zijn.104;307;308 Er blijven nog veel onbeantwoorde vragen over het belang

van de algemene operatieve ervaring van chirurgen, het uitvoeren van nauw aanverwante

ingrepen, het gelijktijdig uitoefenen in meerdere ziekenhuizen, aanvankelijke verwerving

van versus onderhouden van vaardigheden, over voorbijgaand of permanent laagvolume

chirurgen.104;218

Ondanks het overwicht aan studies die het volume-uitkomst verband schragen en het

toenemend gebruik358 van deze hypothese om belangrijke beslissingen op gebied van

gezondheidspolitiek te verrechtvaardigen, blijven er vele vragen onbeantwoord.320

Er zijn gevallen bekend van klein/matig volume en hoge kwaliteit en omgekeerd.

Hoewel enkele studies gebaseerd zijn op klinische gegevens, steunde het merendeel op

ontslaggegevens, wat hun waarde beperkt: over het algemeen is de risicocorrectie minder

goed dan bij klinische gegevens en bestaan er belangrijke rapporteringproblemen met

onder meer up- en undercoding van morbiditeiten.320 Overigens zijn vele van de studies

achterhaald t.o.v. de gemaakte vorderingen in medische en chirurgische zorg. Verder


109

stelde men vast dat naarmate de risicocorrectie verbeterde de odds ratio (laag versus hoog

volume) van sterfte daalde, hoewel het onwaarschijnlijk is dat dit de algemene natuur van

het waargenomen verband zou omkeren.104;320;359

Een andere methodologische bekommernis gaat over de cross-sectionele natuur van de

meeste studies. In een recente longitudinale studie, die gebruik maakt van hiërarchische

modellen, werd daarentegen geen verband vastgesteld tussen chirurgvolume en

ziekenhuissterfte bij CABG.104Daarenboven is de prestatie van enkele extreem laagvolume

zorgverleners grotendeels verantwoordelijk voor de significante resultaten van vele

studies. In de meeste studies heeft het eindpunt, gewoonlijk de mortaliteit, immers een lage

incidentie. Uit de aard van de studieopzet verschilt de steekproefgrootte substantieel tussen

de ziekenhuizen en is hij soms zeer klein, wat om speciale statistische methodes vraagt

(“shrinkage”, hiërarchische modellen). Daarom beschouwen onderzoekers kleine

steekproeven als een van de meest verontrustende methodologische zwakheden van de

volume-uitkomst research, net zoals het een limiterende factor is in het produceren van

geloofwaardige uitkomst rapporten.104

Het gebrek aan een formele statistische benadering voor het identificeren en schatten van

het volume veranderingspunt is een ander controversieel punt in het volume-uitkomst

debat. Vooraf moet bepaald worden of het selectief verwijzen naar de zorgverleners met de

beste prestaties de bedoeling is, wat een drempel probleem is, of dat het erover gaat te

voorspellen welk volumeniveau zal toelaten een vooraf bepaalde standaard te bereiken,

wat een omgekeerd voorspellingsprobleem is.

Ook andere aspecten van volume-uitkomst studies stellen problemen bij een klassieke

statistische analyse omwille van de sterke correlatie van zorgverleners karakteristieken die

de relatie volume-uitkomst beïnvloeden: bvb. hoog volume en universitair ziekenhuis. Het

is moeilijk hier het effect van het volume te isoleren, zelfs met gesofisticeerde statistische

technieken.104

De juiste aard van de relatie tussen volume en uitkomst is nog steeds niet uitgeklaard. De

literatuur suggereert twee basismodellen voor de verhouding tussen volume en

uitkomst77;104;304;306;307;309. Een eerste model is dat van “oefening baart kunst” (“practice

makes perfect”), waarbij de nadruk gelegd wordt op de noodzakelijkheid om een


110

technische vaardigheid te onderhouden (“maintenance”). Een tweede model is dat van de

“selectieve verwijzing”, waar kwaliteit niet het gevolg is van het grote volume, maar waar

het grote volume het gevolg is van de hoge kwaliteit. Het eerste model domineert in

spoedsituaties zoals een acuut myocardinfarct of een niet geplande CABG. Selectieve

verwijzing treedt op in situaties zoals geplande CABG en heupprothese. In geval van

selectieve verwijzing is een op volume gebaseerde indicator een “signaal” van een lage of

hoge kwaliteit van de verstrekker, die alleen de toestand kan verbeteren door de algemene

kwaliteit van de zorgen te verbeteren, dit aan de potentiële patiënten mee te delen en op

bijkomende patiënten te wachten. In geval van “oefening baart kunst” is de situatie vanuit

een standpunt van kwaliteit soms minder gunstig: een beleid dat erop gericht is

bijkomende patiënten naar dergelijke centra te verwijzen is immers niet altijd optimaal.

Het kan immers dat een surplus aan zieken teveel de mogelijkheden van een zorgverlener

onder druk zet en de zorguitkomsten verslechtert.77;360

Wij menen op basis van voorgaande een aantal besluiten te kunnen formuleren.

Volumegebaseerde verwijzingsstrategieën zijn aangewezen voor complexe ingrepen met

grote uitkomstverschillen i.f.v. het volume zoals oesofagectomie en pancreatectomie en

voor bepaalde hoogrisico subgroepen. Voor andere complexe ingrepen met een kleiner

uitkomstverschil kunnen volumestandaarden gebruikt worden als een rode vlag om de

aandacht te vestigen op de kleinste volume ziekenhuizen, niet omdat zij eenvormig minder

kwaliteit zouden bieden, maar omdat hun kleine aantallen het moeilijk maken om

nauwkeurig hun prestaties te beoordelen. Indien mogelijk dienen risicogecorrigeerde

uitkomstgegevens deze volumestandaarden aan te vullen of te vervangen.104

2.2.2.2 Aan proces gerelateerde maten: gebruik van ingrepen in ziekenhuizen. Tegenover het begrip van volume staat dat van “gebruik” (“utilization”). Dit berust erop

dat er een grote variatie bestaat over ziekenhuizen of gebieden en dat er zowel over- als

ondergebruik bestaat. Daarbij kan het dat een hoog volume vereist is voor het bewaren van

de nodige technische vaardigheid voor het uitvoeren van ingreep, die alles samen genomen

schadelijk is voor de patiënten en zich gemakkelijk leent tot overgebruik. Small-area

onderzoek laat toe het onderscheid te kunnen maken tussen de uitkomst effecten van hoog

volume en overgebruik. Het suggereert soms dat de gezondheidsgevolgen van variaties in


111

de geneigdheid van zorgverleners om patiënten aan een bepaalde therapie te onderwerpen

(het gebruikseffect) de effecten verkleint van de variaties in technische vaardigheid, die

vereist is voor het uitvoeren van deze therapieën (het volume effect). Dit suggereert dat het

gebruik van en niet het volume een meer belangrijke determinant is van kwaliteit.77

Carotisendarterectomie (CEA) is hiervan een illustratie. De publicatie van gunstige

klinische studies leidde tot een dramatische verhoging van het aantal uitvoeringen van

CEA. Hierbij ontstond er bezorgdheid over de ontstane discrepantie tussen de potentiële

doeltreffendheid in de klinische studies en de veel lagere doeltreffendheid in de dagelijkse

praktijk, vooral in geval van asymptomatische carotisstenose.77;170;171;308;361-363 Een deel van

de uitleg is waarschijnlijk toe te schrijven aan een “verruiming” van de indicatie van de

ingreep tot patiënten, die uit de klinische studie waren uitgesloten.77;171;308 Concluderend

gesteld, hoog volume kan een indicator zijn voor goede kwaliteit in een specifieke

populatie, en hoge gebruikscijfers voor een bredere bevolking kan in feite een indicator

zijn van ondermaatse kwaliteit.77

Gebruiksmaten van ingrepen worden gebruikt voor het vaststellen van zowel overgebruik

als ondergebruik. Overgebruik kan leiden tot 1) nadelige uitkomsten (ziekte, handicap,

dood) door patiënten bloot te stellen aan het risico van nevenwerkingen of van

verwikkelingen en 2) onnodige kosten voor gezondheidszorg. Ondergebruik kan leiden tot

vermijdbare nadelige uitkomsten.77

Variatie in ingrepencijfers over geografische gebieden en over zorgverleners kunnen heel

wat redenen hebben. Geografische variatie kan te wijten zijn aan verschillen in case mix,

toegang tot zorgen of verschillen in praktijkvoering, die een weerspiegeling zijn van een

combinatie van onzekerheid over de effecten van ingrepen in bepaalde patiënten en van de

vertrouwdheid van de zorgverlener met bepaalde behandelingsmethoden.255;364 Daarom

kan men stellen dat geografische variatie een indicatie is van eventueel overgebruik of

ondergebruik van een ingreep, maar ook kan veroorzaakt zijn door andere belangrijke

verklaringen die verder onderzocht moeten worden.77;255;365 Om verschillen in

praktijkvoering te kunnen isoleren van geografische verschillen in gediagnosticeerde

ziekte, dient men zowel over ziekenhuisontslaggegevens als over gegevens uit de

eerstelijns geneeskunde te beschikken.365


112

De ingrepen, die het meest bestudeerd werden, zijn veel gebruikte ingrepen (bvb. het

keizersnedencijfer waar we in hoofdstuk 5 uitvoerig op terugkomen), die op gebiedsniveau

waarschijnlijk geen noemenswaardige variatie kennen ten gevolge van kleine aantallen.

Elk van die potentieel te veel gebruikte ingrepen heeft een geëigend gebruik bij sommige

patiënten. Vandaar de nood aan risicocorrectie bij een vergelijking van gebruikscijfers.

Verder is het zo dat patiëntenvoorkeur in ruime mate de gebruikscijfers beïnvloeden.

Daarom kan men stellen dat het ideale cijfer voor vele ingrepen niet gekend is en wordt er

in de US nog steeds gedebatteerd over het “correcte” streefcijfer voor keizersnede en

vaginale verlossing na keizersnede, twee gebruiksmaten, die opgenomen waren in de

doelstellingen van “Healthy people 2010”.77

Tenslotte dient erop gewezen te worden dat de klinische gegevens, nodig voor

risicocorrectie, vaak niet in de ontslaggegevens, zoals onze MKG, opgenomen zijn. Het is

derhalve aangewezen voorzichtig om te springen met kwaliteitsindicatoren, gebaseerd op

gebruikscijfers berekend op basis van ontslaggegevens. Dit kan immers leiden tot

ongewenste effecten zoals het toepassen van ingrepen, die ondergebruikt worden, bij

mensen, die geen geëigende kandidaten zijn, of het niet toepassen van een ingreep op

mensen, die hem nodig hebben, omwille van een bestaand overdadig gebruik.77

2.2.2.3 Uitkomstmaten. Sterfte, morbiditeit, functionele status, levenskwaliteit, zorgenkosten, verblijfsduur, terug

gaan werken en patiëntensatisfactie zijn de belangrijke uitkomsten.163 In grote

gegevensbestanden is sterfte echter de meest geanalyseerde uitkomstmaat en als dusdanig

is sterfte ook het onderwerp geweest van de meeste debatten.77;163

Er werden overigens sterke variaties in sterftecijfers genoteerd, vooral voor niet-

chirurgische aandoeningen.77;343 Ook suggereren een aantal recente overzichtsartikelen dat

duizenden te voorkomen chirurgische sterfgevallen zich elk jaar in de US voordoen omdat

electieve maar hoogrisico chirurgie uitgevoerd wordt in ziekenhuizen, waar er

onvoldoende ervaring is met die chirurgische ingrepen.255;310;312 Er wordt patiënten

aangeraden voor een aantal ingrepen naar hoog volume ziekenhuizen te gaan en een aantal

consumentgerichte websites beginnen informatie te verstrekken over bereikte volumes in

ziekenhuizen in hun buurt.310


113

Toch stellen velen de toepasbaarheid heden ten dage van oudere studies in vraag, vermits

deze mortaliteit sindsdien aanzienlijk gedaald is en het relatief belang van het volume

misschien aan het dalen is.310 Vervolgens hebben de meeste van die studies gebruik

gemaakt van gegevensbanken op staatsniveau of van regionale bevolkingen, die bediend

werden door een klein aantal centra met hoge volumes. Verder zijn die studies meestal

beperkt gebleven tot hartchirurgie of uitgevoerd op te kleine steekproeven.310

“Het zou handig zijn mochten ziekenhuizen met hogere sterftecijfers, geïdentificeerd op

basis van gemakkelijk verzamelde administratieve gegevens (leeftijd, geslacht, vorige

ziekenhuisopname, diagnose), inderdaad ook blijken zorgen te verstrekken van lagere

kwaliteit”.319 Maar is een hoog sterftecijfer inderdaad een marker van slechte kwaliteit?

Waar we weten dat sterftecijfers verschillen in functie van specifieke

ziekenhuiskarakteristieken en van ervaring ( i.e. volume), weten we weinig over hoeveel

van de variabiliteit te wijten is aan verschillen in ziekte-ernst en co-morbiditeit, hoeveel

aan verschillen in kwaliteit en hoeveel aan toeval of selectie-effecten, zoals onder meer

verschillen in opnamepraktijken.54;319 Een ander probleem wordt gevormd door de

gelukkig kleine aantallen, die vaak leiden tot niet significante resultaten, en, zelfs als dan

significantie kan worden aangetoond, door de moeilijkheid om het falende proces aan te

tonen.77

In een studie waarin het verband bestudeerd werd tussen kwaliteit van zorgen, sterftecijfers

en ziekte-ernst voor congestief hartfalen (CHF) en acuut myocardinfarct (AMI) bleken de

verschillen in sterftecijfers tussen ziekenhuizen niet verklaard te kunnen worden door

verschillen in de kwaliteit van zorgen. Een deel van de niet-uitgelegde variabiliteit kan

voortvloeien uit de manier waarop de kwaliteit gemeten wordt, die voornamelijk de

processen van de eerste drie dagen onderzoekt. Op het niveau van de individuele patiënt

bleek hogere ziekte-ernst op een merkbare manier het stervensrisico te verhogen en bleek

betere kwaliteit, zij het in minder uitgesproken mate dan de ernst, een vermindering van

het stervensrisico te veroorzaken. Het is echter onwaarschijnlijk dat ziekenhuizen, die

zorgen van lagere kwaliteit verstrekken, kunnen geïdentificeerd worden door middel van

administratieve gegevens en 1-jaars sterftecijfers.319


114

Al lijden beoordelingen van vermijdbare sterfte door experts onder een gebrekkige

overeenkomst tussen beoordelaars, toch schijnt er enige correlatie te bestaan tussen

risicogecorrigeerde sterftecijfers en kwaliteitsproblemen, geïdentificeerd door peer review

organisaties.77 Significant hogere sterftecijfers kunnen gedeeltelijk toegeschreven worden

aan moeilijk te meten verschillen in ziekte-ernst, al werd er in een aantal studies

vastgesteld dat potentieel te voorkomen onbedoelde uitkomsten tenminste zwak

geassocieerd zijn met de gemeten sterftecijfers.77

Ziekenhuismortaliteit wordt verder beïnvloed door de verblijfsduur en men weet overigens

dat factoren die korte termijnsterfte beïnvloeden, verschillen van lange termijnsterfte.191

Oplossingen zoals de “dertig dagen ziekenhuissterfte” zijn niet vrij van vertekening366: de

verandering van de uitkomstdefinitie: “eender welke ziekenhuissterfte” tot de “dertig

dagen ziekenhuissterfte” veranderde in een studie over hartchirurgen hun

rangorde op ingrijpende manier: op 78 chirurgen veranderde de rangorde bij 30 van hen

met meer dan tien plaatsen191 al moet men voorzichtig omspringen met rangorden, zeker

wanneer het gaat over sterfte76. Nochtans bleek uit een meer recente studie over

hartinsufficiëntie dat ziekenhuizen met lagere ziekenhuissterfte SMRs geen hogere na-

ontslag sterftecijfers hadden en besluiten de auteurs dat ziekenhuissterfte een redelijk

valide marker mag genoemd worden voor 30-dagen mortaliteit367. Birkmeyer et al.310

kwamen in hun studie over een aantal belangrijke ingrepen tot een gelijkaardige conclusie

evenals studies in het UK183;184. In een enkele recente studie over femurhals fracturen bleek

de dertig dagen mortaliteit tot vertekende conclusies te leiden.253

Wanneer andere ongunstige uitkomsten dan sterfte het onderwerp van studie uitmaken

zoals bijvoorbeeld postoperatieve verwikkelingen, wordt een analyse op basis van

ontslaggegevens bemoeilijkt door de beperkingen van de ICD-9-CM, die alleen het zich al

dan niet voordoen van verwikkelingen aangeeft en niet de ernst van de verwikkeling. Een

voorbeeld van verwikkelingen bij laparoscopische cholecystectomie wordt door Taylor

gegeven.368

Tenslotte kan men stellen dat het gebruiken van uitkomstgegevens voor vergelijkingen het

nuttigst is wanneer men wenst de zorg op te volgen bij hoogvolume verstrekkers en dit


115

over lange tijdsperiodes. Andere waardevolle toepassingen zijn het opsporen van gebieden

voor kwaliteitsverbetering of van problemen bij het implementeren van zorgprocessen.

Een laatste nuttig gebruik van uitkomstgegevens is het bestuderen van het ganse

zorgsysteem.299

Wanneer een studie afgesloten is stelt zich onvermijdelijk het probleem van het kenbaar

maken van de resultaten. Het publiekelijk vrijgeven van de resultaten van uitkomsten

procesvergelijkingen tussen ziekenhuizen of individuele zorgverleners neemt meer en

meer toe. Hierbij moet een evenwicht gezocht worden tussen de mogelijke schade die men

kan aanrichten door onjuiste informatie te verstrekken, omwille van methodolgische

tekortkomingen, en het recht van de consument om een voor hem zo goed mogelijke

keuze te maken voor de zorgverlening die hij nodig heeft. Wij komen hier later uitgebreid

op terug.

2.3 BENADERING GEBASEERD OP INCIDENTEN.

2.3.1 Patiëntveiligheid Patiëntveiligheid beantwoordt ongetwijfeld aan de definitie van een prioritair

gezondheidsprobleem in termen van ernst, frequentie, sociale en economische kosten, en

perceptie door het beleid en de gemeenschap. Dit vertaalde zich onder meer in rapporten

en het opzetten van agentschappen om dit probleem aan te pakken.291

Verschillende initiatieven werden genomen zoals veiligheidsorganisaties, rapportage

systemen voor onbedoelde uitkomsten (“adverse events”) en oproepen tot het hertekenen

van het gezondheidszorgsysteem.291 Vraag is dan welke zijn de sleutelelementen van deze

inspanningen, waar zijn ze werkelijk op gericht, en zijn ze voldoende rijp voor een

toepassing in andere landen?

Arah en Klazinga291 geven enkele behartigenswaardige beschouwingen. Zij stellen onder

meer dat er te veel organisaties actief zijn die zich met deze problematiek bezig houden.

Verder observeren ze dat er te veel onenigheid bestaat rond basisbegrippen, dat de

gevolgde benadering te beperkt is, met name praktisch exclusief op de patiënt gericht, en

te weinig oog heeft voor het gezondheidssysteem en zijn bredere omgeving. Ook stellen ze


116

vast dat de medische praktijkomgeving “prohibitief procesziek” blijft. Verder menen ze

dat de verwachtingen van zero tolerantie te hoog gespannen zijn en dat “safety”

indicatoren gebaseerd op administratieve gegevens nog problematischer zijn dan andere

kwaliteitsindicatoren voor eindgebruikers.

Ook Chang et al. betreuren het fragmentarisch karakter van de verschillende benaderingen,

die in de zorgsector gebruikt worden om “near misses”, onbedoelde uitkomsten (“adverse

events”) en andere concepten i.v.m. patiëntveiligheid te definiëren.369Deze auteurs

ontwierpen een overkoepelend concept over patiëntveiligheid, dat berust op een

systeembenadering, en benadrukken het belang van a priori

beslissingen over de sleutelveranderingen in structuur en proces die in verband gebracht

worden met elk voorval i.v.m. patiëntveiligheid.369 De moeilijkheid om tot dit concept te

komen bestond uit het ontrafelen van het ingewikkelde netwerk van informatie

gekarakteriseerd door gebeurtenissen, setting, individuen, teams, protocollen, procedures,

beleid, en communicatie in een onzekere omgeving.369

Het vertrekpunt voor een benadering van patiëntveiligheid is vaak de onbedoelde uitkomst,

die als volgt kan omschreven worden: “Onbedoelde of ongewenste voorvallen in het

gezondheidszorgproces, die een negatieve impact hebben of kunnen hebben op een patiënt

of patiënten, en resulteren of kunnen resulteren uit een onderdeel van een

gezondheidszorgproces”.370 Een andere omschrijving luidt als volgt: “... schade, die

veroorzaakt werd door het medisch beleid eerder dan door de onderliggende ziekte en die

tot de dood leidde, een levensbedreigende ziekte veroorzaakte, een ziekenhuisverblijf

verlengde of veroorzaakte, een lichamelijke ongeschiktheid veroorzaakte op het ogenblik

van het ontslag, of beide.”293;350;371

Bij een onbedoelde uitkomst treft men volgende drie karakteristieken370 in mindere of

meerder mate aan:

- negativiteit: het gaat over een nadelig voorval dat uit de aard van zijn natuur

onwenselijk of schadelijk is voor het gezondheidszorgproces of voor de patiënt,


117

- (potentieel) impact op de patiënt. Bredere definities beschouwen een potentiële impact

als een ongunstige gebeurtenis waar meer strikte definities een definieerbaar en

identificeerbaar schadelijk gevolg voor de patiënt vereisen,

- oorzakelijk verband: er moet een aanduiding bestaan dat het voorval het resultaat is

van een onderdeel van het zorgproces zelf (ofwel door het begaan van een fout ofwel

door verzuim) eerder dan door een voorval van buiten het proces zoals handelingen

van de patiënt of het natuurlijk verloop van de ziekte.

De voormelde omschrijvingen van onbedoelde uitkomst hebben slechts een beperkte

bruikbaarheid omdat zij de omstandigheden of voorvallen, die een onbedoelde uitkomst

uitmaken, in onvoldoend concrete termen definiëren om zulke voorvallen op

betrouwbare wijze te identificen.370 Daarom maken metingen van onbedoelde uitkomsten

meestal gebruik van een reeks uitdrukkingen of criteria zoals niet-geplande terugkeer naar

de operatiezaal, transfer naar een andere instelling voor acute zorgen, lage Apgar score.370

Verdere analyses (1) beschrijven de weerslag op de patiënt in termen van ernst en

persistentie; (2) gaan de oorzakelijke genese na van het voorval om het te kunnen

toeschrijven aan bepaalde onderdelen van de gezondheidszorgorganisatie; en, (3)

beoordelen de vermijdbaarheid om een expliciet professionele beoordeling van de

zorgkwaliteit te maken.370

Nalatigheid (“negligence”) werd gedefinieerd als: “.. zorg die onder de standaard viel, die

van artsen in hun gemeenschap verwacht werd.”350 De oorzaken van onbedoelde

gebeurtenissen (incident of “event”) en uitkomsten werden omschreven als het niet

uitvoeren van een geplande actie (fout in de uitvoering); het toepassen van een verkeerd

plan om het doel te bereiken (fout in de planning); onzorgvuldigheid, slordigheid (door

vaardigheden bepaalde fout); manier waarop processen zijn ingericht in de organisatie

(organisatiegebonden factoren); fouten ontstaan door een technisch falen en

patiëntgerelateerde factoren zoals co-morbiditeit en gebrek aan therapietrouw.293

De scheidingslijn tussen fout en nalatigheid is niet altijd even gemakkelijk: bijvoorbeeld

een verkeerde radiografie-interpretatie van een hartfalen als een pneumonie, een

pleurapunctie bij het plaatsen van een centraal veneuze katheter of een perforatie van de


118

darm bij een ingreep voor een adhaesieve darmobstructie. Ook zijn de beoordelingscriteria

vaak niet gedefinieerd wat kan leiden tot uiteenlopende beoordelingen. Daarom dienen

praktijkstandaarden altijd een zekere mate van fouten te aanvaarden.372 Een moeilijkheid

bij de op fouten gebaseerde benadering zijn haar methodologische beperkingen: de studies

hebben het over “verbanden” maar meten de sterkte van de relatie tussen fout en slechte

uitkomst niet. Verder stelt zich het probleem van de typische post hoc situatie: men

vertrekt van een slechte uitkomst en gaat dan zoeken wat er fout gelopen is met vaak een

door die wetenschap bijgekleurde conclusie348;352 Ook zijn de concepten “fouten” en

“onbedoelde uitkomsten” begrippen die mekaar gedeeltelijk en in onbekende mate

overlappen348 zoals blijkt uit figuur 1.

Dikwijls wordt overigens de aandacht gevestigd op uitzonderlijke en zeer ernstige fouten

en gaan meer frequente en niet onbelangrijke fouten vaak onopgemerkt voorbij zoals het

niet toe dienen van ß-blockers na een AMI.348 In de figuur 2 worden fouten voorgesteld in

functie van hun enormiteit en van hun causaliteit. Hofer et al. stellen dat medische fouten

gedefinieerd moeten worden in termen van gefaalde processen, waarvan op een rigoureuze

manier werd aangetoond dat zij nadelige gevolgen veroorzaakten.348


119

Figuur 1: Conceptuele definities van te voorkomen, nalatige, onbedoelde en ongewenste

uitkomsten en fouten.348

Bron: Hofer348

Figuur 2: Classificatie van fouten in functie van hun enormiteit (“egregiousness”) en van hun bijdrage tot de uitkomst (“contribution to outcome”).

Bron: Hofer.348


120

Een dergelijke classificatie van onbedoelde uitkomsten wordt meestal uitgevoerd via een

professioneel peer review.370 De wetenschappelijke rigor waarmee reviews doorgevoerd

worden is erg wisselend en gaat van één beroepsbeoefenaar, die een op impliciete criteria

gebaseerde beoordeling uitvoert, tot een multidisciplinair team dat expliciete en

gedefinieerde criteria gebruikt.370Ook de ervaringen over intra-rater en inter-rater

betrouwbaarheid lopen uiteen en leren dat het bereiken van een betrouwbaar oordeel meer

meervoudige beoordelingen vergt dan praktisch doenbaar.370

2.3.2 Gegevensbronnen over onbedoelde uitkomsten Een eerste bron is het screenen van het klinisch dossier van patiënten, gedurende of na het

zorgproces, door personeel dat beslist of er al dan niet een ongunstige gebeurtenis geweest

was en hoe dit dient geklasseerd te worden. Hieraan zijn twee belangrijke nadelen

gekoppeld. De klinische informatie kan ontoereikend zijn om tot een besluit te komen en

het is mogelijk dat onbedoelde uitkomsten niet geregistreerd worden. Medische dossiers

zijn daarenboven een samenvatting van de verstrekte zorgen en behandelingen eerder dan

een weergave van elke handeling en incident.370

Een andere bron van informatie over onbedoelde uitkomsten is de zelfrapportering van

incidenten door klinische beroepsbeoefenaars. Omwille van het weinig voor de hand

liggende karakter van deze handelswijze en omwille van de verschillen in definities van

onbedoelde uitkomsten, die de verschillende beroepsbeoefenaars kunnen hanteren, kan de

betrouwbaarheid van dit soort gegeven nog meer in vraag gesteld worden.370

Een laatste bron van gegevens zijn ziekenhuisontslaggegevens. De meeste onbedoelde

uitkomsten kunnen op deze manier echter niet geïdentificeerd worden tenzij het volledig

medisch dossier geïnformatiseerd en beschikbaar is.370

Wanneer onbedoelde uitkomsten gebruikt worden in kwaliteitsmeting worden twee wegen

bewandeld. Sommigen identificeren eenvoudig de onbedoelde uitkomsten en onderzoeken

ze, in navolging van het “kritische incident”-techniek, op een kwalitatieve manier.370


121

Velen maken gebruik van een kwantitatieve analyse waarbij de onbedoelde uitkomsten

geteld worden, geaggregeerd, en omgezet tot cijfers (“rates”), gecorrigeerd voor een aantal

factoren.370

De “face” en “content” validiteit van “onbedoelde uitkomsten”-maten kunnen als goed

beschouwd worden.370 De criterion validiteit is niet afdoend onderzocht. De enkele studies

hieromtrent gebeurden op basis van een impliciete beoordeling door een

beroepsbeoefenaar, waarvan de beperkte validiteit (hoog fout positief cijfer) en

betrouwbaarheid bekend zijn.370 Voor de “construct” validiteit liggen, omwille van de

schaarsheid van onderliggende theorie en constructs, de zaken nog moeilijker. Nochtans

kon onder meer worden aangetoond dat onbedoelde uitkomsten verband houden met een

toename van de verblijfsduur en verhoogd middelengebruik, dat de cijfers verschillen over

specialiteiten, type van ziekenhuizen, en type patiënten (urgente gevallen, ernstiger zieken

hebben meer onbedoelde uitkomsten).370

2.3.3 Omvang van en acties rond onbedoelde uitkomsten Hoewel de overgrote meerderheid van de medische fouten zonder nadelen gepaard gaat of

slechts met minimale, tijdelijke effecten, toch is de schade door medische fouten

belangrijk en schat het IOM dat er in de US jaarlijks tussen de 44.000 en 98.000 mensen

sterven tengevolge van een fout in het medische management.284;350;372;373

Over de precieze omvang van deze cijfers werd uitvoerig gedebatteerd en een groot deel

van de discussie kan teruggevoerd worden op beperkingen van de Harvard Medical

Practice Study(MPS)350;372: het gaat over een retrospectieve studie gebaseerd op het

medisch dossier waarin 1) veel belangrijke voorvallen niet opgetekend werden, 2) fouten

geïdentificeerd werden door een impliciet oordeel door een arts, en 3) waar, omwille van

zijn retrospectief karakter, een “hindsight”-vertekening, de neiging om een causaliteit toe

te kennen aan een handeling wanneer de (slechte) uitkomst gekend is.

Ad 1) kan men zich aan een belangrijke onderschatting verwachten, ad 2) vallen zowel

onderschatting als overschatting te verwachten, die mekaar waarschijnlijk opheffen, en ad

3) is een overschatting de te verwachten vertekening 352.

Er bestaan redenen om aan te nemen dat het IOM niet overdreef. Het lijkt onwaarschijnlijk

dat beoordelaars onbedoelde uitkomsten zouden vinden die niet bestonden en dat het hier


122

eerder om een benedengrens zou gaan dan om een overschatting. Ook werd alleen

ziekenhuismortaliteit in rekening genomen en niet de ambulante chirurgie. Tenslotte liggen

in prospectieve studies de fouten- en schadecijfers meestal veel hoger.352

Tegenstanders stellen dat het IOM noch de auteurs van de MPS uitleggen hoe zij precies

aan die cijfers komen374; dat veel van die vermijdbare sterfgevallen zich voordoen bij

mensen die anders sowieso op korte termijn gestorven zouden zijn – wat de auteurs van de

MPS ook vermeldden350 –, en, dat een cijfer zoals 100.000 ziekenhuissterfgevallen toe te

schrijven is aan outlieropinie en de geringe betrouwbaarheid van een impliciet review door

een arts.279;375-378

Laten we hierbij opmerken dat de auteurs van de MPS zelf ook aangeven dat het aantal

opgegeven sterfgevallen in economisch opzicht niet vergelijkbaar is met hetzelfde aantal

sterfgevallen bij verkeersongevallen waar de slachtoffers over het algemeen jonger en

gezonder zijn.350 Uit een andere studie bleek dat een beoordelaarovereenkomst met een

intraclass correlation coefficient (ICC) van 0,34 – in de MPS studie bedroeg de ICC

slechts 0,24 - een beperkende factor is. Dergelijk ICC geeft aan dat wanneer de eerste

beoordelaar een overlijden bestempelt als “zeker, of waarschijnlijk het gevolg van een

medische fout”, de tweede beoordelaar dit overlijden zou bestempelen als “zeker niet” met

een waarschijnlijkheid van 16% voor de eerste versus 18% voor de tweede beoordelaar.

Zoals voormeld bleken er zich duidelijk minder “waarschijnlijk of zeker” te

voorkomen sterfgevallen voor te doen indien er rekening werd gehouden met de

probabiliteit het ziekenhuis levend te verlaten, met de betrouwbaarheid van de

beoordelaars en met de probabiliteit van drie maanden later in leven te zijn en in goede

cognitieve toestand.279 Hoewel ook de opzet van deze studie zijn beperkingen heeft en dat

ook terminale patiënten recht hebben op een zo kwaliteitsvol mogelijke zorg350;379;380, toch

menen wij dat zij terecht de aandacht vestigt op het heikele probleem van het

overeenstemming tussen verschillende beoordelaars381 en op een goede omschrijving van

wat men onder “vermijdbaar” en “dood ten gevolge van een medische fout”378;382 verstaat.

Verder is het duidelijk dat een juiste risicocorrectie vereist is om tot betrouwbare

schattingen van het aantal sterfgevallen ten gevolge van medische fouten te komen.283;383

Tenslotte kan men aanvoeren dat mocht het gaan over 10.000 sterfgevallen per jaar in


123

plaats van 100.000, het nog steeds een belangrijk probleem blijft voor de

volksgezondheid.384 Dit argument samen met de uitspraak van het IOM, dat een vork

aangeeft van 44.000 tot 98.000 vermijdbare sterfgevallen, maken duidelijk dat de omvang

van dit belangrijk probleem vooralsnog slechts zeer ruw kan geschat worden.

Reeds uitgevoerde studies leggen de nadruk op een aantal behartigenswaardige feiten.

Hoewel medische tijdschriften uitvoerig rapporteren en debatteren over onbedoelde

uitkomsten en medische fouten284;376-385 schijnt er een kloof te bestaan tussen het kennis

hebben van dergelijke feiten en de opleiding van artsen - seminaries van artsen in

opleiding zijn hier nochtans een uitgelezen plek voor – waar aan dit soort problemen te

weinig aandacht wordt besteed.385

Het type eigenaarschap van ziekenhuizen bleek in een studie uit de US geen verband te

houden met ongelukkige voorvallen, maar wel met nalatigheid, die veel kleiner was in

private en universitaire ziekenhuizen en groter in ziekenhuizen met een groot percentage

minderheidspatiënten.386

Ook de invloed van leeftijd op onbedoelde uitkomsten werd meermaals bestudeerd. Bij

oudere patiënten ( 65 jaar+) worden meer onbedoelde uitkomsten genoteerd.350;372;373;387 Dit

zou te wijten zijn aan de grotere complexiteit van de ziektegevallen of behandelingen en

aan de langere risicoblootstelling en niet aan een leeftijdsdiscriminatie.372;373;387

Tenslotte zijn fouten door verzuim meer frequent dan bedreven fouten.351

Agressieve casusopsporing via observationele en autopsie studies identificeerden schade

en fouten, die zich niet in het medisch dossier bevinden.387

Een prospectieve gegevensverzameling lijkt derhalve te verkiezen boven een cross-

sectionele (met duidelijk minder gevallenopsporing) of een retrospectieve (met een

gelijkaardige gevallenopsporing) omdat ze beter past in het raam van

kwaliteitsverbetering. Ze is meer geschikt (1) om artsen ervan te overtuigen dat hun fouten

bijdragen tot het ontstaan van onbedoelde uitkomsten; (2) voor het bestuderen van

organisatorische en menselijke factoren; en, (3) voor het meten van programma’s die een

risicoreductie nastreven.371

Een laatste invalshoek betreffende acties i.v.m. “medische fouten” bestaat uit het trekken

van lessen uit de pogingen om kwaliteit te verbeteren in organisaties buiten de


124

gezondheidszorg. Ambiguïteit en het veronachtzamen van problematische handelswijzen

om toch maar de “job uitgevoerd te krijgen” zijn belangrijke en verbeterbare factoren die

bijdragen tot het ontstaan van medische fouten. In deze context wordt ambiguïteit verstaan

als een gebrek aan perfecte klaarheid rond (1) de doelstellingen van wat men tracht te

bereiken, (2) wie verantwoordelijk is voor welke taak, (3) hoe informatie, diensten of

materiaal uitgewisseld dienen te worden, en (4) hoe precies een taak moet uitgevoerd

worden.

Verbeteringsacties worden best “klein en simpel” opgezet. Niet het ganse systeem ineens

maar wel enkele specifieke acties zoals patiënten dienen hun geneesmiddelen tijdig te

krijgen, op de vereiste manier en in de vereiste dosis.388

2.3.4 Indicatoren van patiëntveiligheid De eerste aanzetten op het gebied van patiëntveiligheid, die in de US gegeven werden,

waren niet erg hoopgevend. In een belangrijke studie werd het Complications Screening

Program (CSP) toegepast op administratieve gegevens met als bedoeling op een

geautomatiseerde manier ondermaatse zorg op te sporen.177;258In tegenstelling tot andere

gelijkaardige programma’s, beperkt het zich niet tot de complicatiecodes (ICD-9-CM:

996-999), wat een aansporing kan betekenen voor niet-invulling, maar bevat 28 “screens”

over heel de classificatie. De door het programma geflagde gevallen werden op twee

manieren onderzocht: een review van de gevallen door verpleegkundigen aan de hand van

expliciete criteria177en een review door artsen op een aselecte steekproef van geflagde

gevallen258. Uit de eerste studie kon niet besloten worden dat het CSP enig

screeningsvermogen had waar uit de tweede bleek dat de geflagde gevallen een duidelijk

hogere proportie kwaliteitsproblemen vertoonde dan de niet-geflagde. De predictieve

waarde van de geflagde gevallen was duidelijke hoger voor chirurgische dan voor

medische gevallen. De auteurs, waaronder er een aantal ook auteurs waren van het eerste

artikel waarnaar verwezen wordt, besluiten dat voor sommige types van verwikkelingen

het CSP op nuttige wijze gevallen kan identificeren ten behoeve van een artsen review.258

Ondanks deze eerste ervaringen, de codeerproblemen en de beperkte klinische details,

stellen ander auteurs dat indicatoren van patiëntveiligheid (PSI) gegenereerd op basis van

administratieve gegevens gebruikt kunnen worden als een “screen” voor potentiële


125

problemen, die verder onderzoek verrechtvaardigen.290 Het is dan, gegeven hun

beperkingen, wel belangrijk hun toepassingsgebied duidelijk te omschrijven. Naast hun

screeningsfunctie komen ze verder in aanmerking voor epidemiologisch onderzoek naar de

incidentie, de gevolgen van en factoren die verband houden met medische

schadegevallen.290;389PSIs kunnen ook gebruikt worden als instrumenten voor screening op

lokaal en nationaal vlak.290Verder onderzoek is nochtans vereist om te bepalen of en onder

welke omstandigheden ze op een valide manier kunnen gebruikt worden voor een

vergelijking tussen ziekenhuizen.290 Wellicht zal informatie technologie toelaten om via

elektronische screens, toegepast op elektronische patiëntengegevens, een betere

voorspellende waarde te bekomen dan die we nu kennen.292

Toch kunnen administratieve gegevens reeds nu nuttig zijn voor het opsporen van

onbedoelde uitkomsten. Het bestaan van conflicterende gegevens in hetzelfde record

kunnen een aanwijzing vormen, zoals bijvoorbeeld een acuut myocardinfarct bij een

patiënt met een urineweg infectie als opnamediagnose.292 Dergelijke benaderingen zijn

een efficiënt en relatief goedkoop alternatief voor de huidige, spontane rapportering van

onbedoelde uitkomsten, die slechts een klein aantal van die uitkomsten identificeert.390

Zij bieden ook het voordeel dat ze op reeds bestaande gegevens kunnen toegepast worden

en zo een minder vertekende indruk kunnen geven van een eventuele evolutie.390Dit zou

echter een groter risico voor rechtszaken met zich kunnen meebrengen al hoeft dit niet zo

te zijn indien wetgeving en regelgeving een betere bescherming zouden bieden aan

gezondheidszorgdiensten.390;391

2.4 HET ONTSLUITEN VAN KWALITEITSINDICATOREN.

Na door middel van kwaliteitsindicatoren eventuele kwaliteitsproblemen gescreend

gescreend te hebben en het daaropvolgende onderzoek te hebben uitgevoerd stelt zich de

vraag wat met de resultaten van het onderzoek moet gebeuren. Kwaliteitsprogramma’s

gebaseerd op indicatoren omspannen een breed methodologisch gamma van manieren

waarop deze vraag beantwoord kan worden, gaande van “Profielen” tot “Collaborative

peer education”, gebaseerd op de filosofie van de voortdurende kwaliteitsverbetering

(Continuous Quality Improvement) .392


126

Het gebruik van administratieve gegevens is de invalshoek waarop in de volgende

paragrafen op deze vraag nader wordt ingegaan

2.4.1 De publiekelijke ontsluiting van kwaliteitsindicatoren: reacties van zorgverleners, consumenten, verzekeraars en ziekenhuisdirecties.

“The people and communities who depend on health care have a right to know how good

that care is. The organizations that arrange and provide that care have a duty to tell

them”.393

De publiekelijke ontsluiting van kwaliteitsgegevens door een overheid of instelling is een

belangrijk concept. Een beproefde vorm hiervan zijn de “profielen”. De methode bestaat

erin ziekenhuizen in volgorde te rangschikken volgens de resultaten van een meting,

bijvoorbeeld het postoperatieve sterftecijfer bij CABG, en de rangen vervolgens onder

vorm van een profiel weer te geven. Het is duidelijk dat dergelijke profielen op een zeer

begrijpelijke manier een keuzemogelijkheid aanreiken aan onder meer consumenten,

verzekeraars, peer review, verzekeringsinstellingen en overheid om in één oogopslag de

prestaties te beoordelen en uit te maken wie “beter” of “slechter” scoort dan het

“gemiddelde”.394-396

“Informatie over ziekenhuisperformance, professionele beoefenaars van gezondheidszorg,

en gezondheidszorgorganisaties zijn in de US al meer dan een decennium publiekelijk

vrijgegeven. De te verwachten winst van deze onthullingen werd nooit duidelijk gemaakt,

en zowel de voordelen als de potentiële risico’s kregen slechts minimale empirische

aandacht. Het blijkt dan ook moeilijk te oordelen of de voordelen van publiekelijke

ontsluiting opwegen tegen de nadelen”.397

De meest gangbare verwachting is dat de publicatie van uitkomsten de zorgverleners wel

degelijk motiveert en verder, in een context van markteconomie, een geïnformeerde

consumentenkeuze toelaat, waarbij voor betere kwaliteit gekozen wordt. Als gevolg

hiervan zouden minder kwaliteitsvolle zorgverleners verdwijnen of hun kwaliteit

verbeteren.397-403


127

Dit uitgangspunt berust op een dubbele veronderstelling: zorgprocessen en -uitkomsten

kunnen gemeten worden én de variaties in deze metingen zijn een teken van variatie in

kwaliteitszorg.401

Andere elementen voor de motivering van het gebruik van profielen zijn: het bevorderen

van het verantwoording afleggen door de zorgverstrekkers en de systeembewakers aan de

gemeenschap; kwaliteitsverbetering te bevorderen, onder meer door het identificeren van

“benchmarks” voor zorg; het bevorderen van een regelgeving, gebaseerd op valide

informatie; en, te helpen bij het afsluiten van doeltreffende verzekeringsovereenkomsten

tussen verzekeraars en zorgverstrekkers.286;400;401;403;404

Weinigen zullen het met deze doelstellingen oneens zijn, maar gegeven de kwaliteit van de

gegevens die gepubliceerd worden en de belangen die op het spel staan voor zowel de

consument (kwaliteitsvolle zorgen) als de zorgverlener (goede naam, financiële belangen,

werkvoorwaarden en werkgelegenheid), is het belangrijk het openbaar maken van

zorggegevens op een correcte en begrijpbare manier te organiseren.72;301;394;398;405-408

Het sterkste argument ten voordele van de profielen is dat het een van de weinige middelen

is waarover de systeemregulatoren beschikken voor het monitoren van en het bekomen van

aansprakelijkheid van de zorgverleners. Vastgestelde belangrijke afwijkingen zouden dan

gebruikt kunnen worden als vertrekpunt voor verder onderzoek. Maar dit werd vooralsnog

te zelden doorgevoerd.394 Verder leerde ervaring dat het gebruik van performancegegevens

bij interne audit niet leidde tot de verhoopte kwaliteitsverbetering, al hoopte men dat het

publiceren van dergelijke informatie door een verhoogde gevoeligheid voor de eigen

performance dit wel zou verwezenlijken.400

De klaarblijkelijke successen, die door zijn voorstanders aan het profileringsysteem

worden toegeschreven, zoals een terugdringen van sterftecijfers bij CABG over het geheel

der ziekenhuizen en nog meer in het terciel met de hoogste sterftecijfers, zijn niet

noodzakelijk het gevolg van het openbaar maken van ziekenhuiscijfers.392 Alleen het feit

van gegevens te verzamelen kan immers ziekenhuizen stimuleren om zich toe te leggen op

het verbeteren van uitkomsten en kwaliteit, lang voor dergelijke gegevens naar het publiek


128

toe worden vrijgegeven.392 De grote verlooptijd tussen gegevensverzameling en publicatie,

zeker als het over individuele chirurgen gaat, maken het moeilijk een direct, causaal

verband te leggen tussen publicatie en daaropvolgende verbeteringen in

ziekenhuissterfte.392;409 Ondertussen doen er zich wijzigingen voor in het

ziekenhuispersoneel; treden er veranderingen op in interne processen en worden er

structurele veranderingen doorgevoerd; worden er nieuwe patiëntengroepen behandeld; en

evolueert de techniek op gebied van diagnose en behandeling.392 Zo kunnen de verbeterde

CABG mortaliteitcijfers grotendeels toegeschreven worden aan de veralgemeende

ontwikkeling van interne kwaliteitsprogramma’s van ziekenhuizen met onder meer het

onderkennen en corrigeren van suboptimale processen zoals het preoperatief stabiliseren

van niet-stabiele angina en standaardisatie van operatieve technieken.392 Verder dient er

rekening gehouden te worden met een verbetering van deze sterftecijfers over het ganse

land ook in staten waar geen profielen gebruikt worden. Zo was bijvoorbeeld de

verbetering in Massachussets (geen profielen, noch enig specifiek

kwaliteitsbevorderend programma) identiek met die van New York (wel profielen). De

proportionele, risicogecorrigeerde verbetering van de CABG sterftecijfers van de staat

New York werden alleen geëvenaard door die van New England, waar er een agressieve

maar volledig confidentiële CQI benadering plaatsvond.392;410 Shahian et al. besluiten:

“Deze vaststelling suggereert dat het opzetten van een formeel kwaliteitsbevorderend

proces de sleutel is, ongeacht of het over een publieke of een confidentiële inspanning

gaat.”392

Andere auteurs menen dat er toch enige verbeteringen in gezondheidszorg gestimuleerd

werden door het openbaar maken van kwaliteitsindicatoren397;400;402 en dit waarschijnlijk

door het onthullen van ondermaatse praktijken aan organisatiemanagers.402 Zo stelde men

voor de periode 1996-1999 bijvoorbeeld vast dat de inentingsgraad voor varicella en voor

mazelen, dikoor en rubella respectievelijk van 40% tot 64%, en van 52% tot 59% opliepen

en dat bij patiënten met een acuut myocardinfarct het toedienen van β-blockers van 62%

naar 85% steeg.402 Maar de afwezigheid van een controlegroep, met name een groep niet

blootgesteld aan openbare rapportering, blijft een zwakte voor deze stelling.402 Nochtans

toonde een meta-analyse van gerandomiseeerde klinische studies van profielen een


129

significant positief effect aan op het gebruik van zorgen maar met een minimaal klinisch

belang.273

Toch is dit instrument gevaarlijk en dit om verscheidene redenen. Het houdt geen rekening

met de stochastische variabiliteit, die zeer uitgesproken kan zijn wanneer het gaat over zeer

kleine aantallen zoals bij postoperatieve mortaliteit, wat niet alleen hoge of lage

puntschatters oplevert voor “normale” ziekenhuizen maar anderzijds vaak te weinig

statistische power heeft om slecht presterende ziekenhuizen te identificeren.407 Verder –

ook al worden er betrouwbaarheidsintervallen rond de puntschatters gebouwd – impliceren

profielen een rangorde, die zeer misleidend kan zijn (zie hoofdstuk 3).396 Vermits er bij

het opstellen van profielen er steeds een “eerste” en een “laatste” zijn, ook al is het verschil

klinisch en of statistisch niet significant, kan dit, zeker indien er geen rekening gehouden

wordt met case mix, een ziekenhuis of een arts ten onrechte

stigmatiseren.77;191;296;394;395;405;407;411

Daar profielen gebaseerd zijn op gecomputerizeerde gegevens dient men een onderscheid

te maken tussen reële kwaliteitsproblemen en artefacten ten gevolge van de gebrekkige

kwaliteit van de gegevens, wat er bijvoorbeeld de Health Care Financing Administration

toe leidde de in 1988 aangekondigde plannen voor het publiceren van de rangordening van

artsenspecifieke uitkomstgegevens al in 1993 stop te zetten wegens de beperkte

gegevenskwaliteit.275 We verwijzen hier verder naar het onderhoofdstuk over

risicocorrectie waar de kwaliteit van de gegevens als belemmerende factor voor een goede

risicocorrectie uitvoerig besproken werd. Ook bevat dit soort gegevens geen informatie

over eventuele voorkeur van artsen en patiënten voor een chirurgische behandeling boven

een alternatieve medische behandeling, wat eveneens een weerslag heeft op een

chirurgische mortaliteit.275;412

Het vermijden van hoogrisicopatiënten – de mensen die de behandeling het meest nodig

hebben en er het meest baat bij ondervinden – te behandelen, ook “cherry picking”296 of

“skimming”413 genaamd, is een potentieel ongewenste nevenwerking van

profielen.274;392;403 Waar de empirische evidentie suggereert dat afdoende risicocorrectie

voldoende waarborg biedt aan de chirurg om dit type patiënt te behandelen, bestaat er


130

tegenstrijdige evidentie over het al dan niet meespelen van het “cherry picking” fenomeen

in de vermindering van het CABG-sterftecijfer van de staat New York191;392;410 percipiëren

chirurgen het behandelen van hoogrisico patiënten als een gevaar voor hun carrière; en,

rapporteren cardiologen dat het moeilijk is een chirurg te vinden voor dergelijke

patiënten.344 Verder werd vastgesteld dat hoogrisico CABG-kandidaten minder vaak de

geëigende behandeling krijgen dan gelijkaardige hoogrisicopatiënten met aorta dissectie.392

Ook voor diabetes werd het potentieel voor “cherry picking” aangetoond en werd de

onbetrouwbaarheid van profielen van individuele artsen zowel voor het beoordelen van de

kwaliteit als de kosten van een diabetesbehandeling aangetoond.329 Om “cherry picking” te

ontmoedigen werden een aantal oplossingen voorgesteld: het maken van specifieke

rapporten voor hoogrisico patiënten, wat echter het probleem van de kleine aantallen

verergert; het uitsluiten van dit type patiënten uit de profielen – maar dit soort patiënten

zijn vaak het meest leerrijk in het kader van kwaliteitsverbetering –, en, naast sterftecijfers,

ook andere eindpunten voor kwaliteitsbeoordeling te gebruiken.392

“Gaming”, een andere nevenwerking van profielen, tracht op kunstmatige wijze de

performance te verbeteren. Hieronder worden onder meer volgende technieken verstaan:

het opwaarderen van preoperatieve co-morbiditeit; het veranderen van de ingreepklasse;

en, het transfereren van postoperatieve patiënten in kritieke toestand naar een andere

verzorgingsinstelling.77;83;191;274;296;301;338;354;392;394;402;403 Zo werden er om de vermindering

van de CABG sterfte in New York te beschrijven twee componenten onderscheiden:

enerzijds een vermindering van de waargenomen sterfte en anderzijds een verhoging van

de verwachte sterfte. Deze laatste bleek vooral het gevolg van een stijging in het coderen

van risicofactoren zoals preoperatief nierfalen, hartinsufficiëntie, COLD, niet-stabiele

angina en kleine ejectiefractie.191 Ook in andere staten werden gelijkaardige fenomenen

vastgesteld.392

Het veranderen van een ingreepklasse naar een andere, die eventueel niet in het profielen

systeem voorzien is, zoals bijvoorbeeld die van een CABG in een geval van een

ischemische mitralis regurgitatie, met een “grijze zone” regurgitatie die niet imperatief een

ingreep vereist, naar een CABG-mitralisklep herstelling door het aanbrengen van enkele

commissuurhechtingen, is vrij eenvoudig. Zij realiseert daarenboven een optimalisatie van

zowel de CABG-cijfers als de CABG-mitralisklep herstellingcijfers door het herklasseren


131

van een geval met een mindere gunstige prognose uit de CABG-klasse in de CABG-

mitralis herstelling klasse waar ditzelfde geval een relatief gunstigere prognose heeft.392;412

Om deze “grijze zone” transacties tegen te gaan wordt voorgesteld de mortaliteit voor het

ganse spectrum van de ziekte te rapporteren ook al verschillen de ingrepen uitgevoerd voor

de subgroepen ervan.412 Meer algemeen gesteld heeft een lage chirurgische mortaliteit

slechts betekenis wanneer zij gerapporteerd wordt voor de ganse bevolking met inbegrip

van hen die geen ingreep ondergingen.412 De laatste vorm van gaming, namelijk het

transfereren naar een andere verzorgingsinstelling van patiënten in een kritieke toestand

wordt in de hand gewerkt doordat vaak sterftegevallen in andere verzorgingsinstellingen

niet in verband gebracht (kunnen) worden met de indexingreep. Het verzamelen van

uitkomstgegevens voor alle patiënten op een vastgesteld ogenblik,

zoals een dertig dagen mortaliteit, en dit ongeacht een eventuele transfer, kan hiervoor een

oplossing betekenen.392

Toch bestaan er naast upcoding andere deelverklaringen voor de stijging van gecodeerde

risicofactoren en met name een verfijning van definities en initiële onderraportering354, wat

niet wegneemt dat een zekere graad van upcoding ten gevolge van publiekelijke vrijgave

van profielen waarschijnlijk is392. Het opstellen van zo eenduidig mogelijke definities, het

trainen van gegevensabstraheerders en het aselect uitvoeren van externe audits om de

accuratesse van de gegevens te bewaken worden aanbevolen om upcoding tegen te gaan.392

Uit de opgedane ervaring in de US blijkt dat consumenten en zorgverzekeraars erg

uiteenlopende vragen stellen in verband met kwaliteitsinformatie, vaak de rapporten niet

begrijpen en er relatief weinig gebruik van maken.397;398;400;402

Consumentenenquêtes leren dat minder dan 50% van de Amerikanen gelooft dat er grote

kwaliteitsverschillen bestaan tussen ziekenhuizen, huisartsen en gezondheidsplannen; dat

minder dan 1/3 gelooft dat er grote verschillen bestaan tussen specialisten; en dat minder

dan 1/3 rapporteert enige kwaliteitsinformatie rond gezondheidszorg gezien te hebben.402In

Pennsylvania, de staat die een voortrekkersrol gespeeld heeft op gebied van openbare

ontsluiting van performance-indicatoren met sterftegegevens op individueel ziekenhuis- en

artsenniveau315;414 en waar de overheid voor een extensieve verspreiding van die gegevens


132

zorgde, leverde een patiëntenenquête volgende resultaten op: < 20% waren op de hoogte

van het bestaan van sterftegegevens, < 12% bekeek ze voor een ingreep, en < 1% meldde

dat die informatie hen van arts of ziekenhuis deed veranderen.402

Verder verwijten de consumenten aan de profielen 1) dat ze teveel informatie bevatten, die

niet genoeg aangeeft hoe ermee moet omgesprongen worden, 2) dat ze geen

prijsinformatie bevatten, 3) dat het moeilijk is deze informatie te verzamelen en

zorgverleners te vergelijken, en 4) dat de informatie te weinig in het oog

springt.402Gelijkaardige bevindingen werden bij consumenten vastgesteld wanneer het

ging over verschillen tussen een systeem gebaseerd op terugbetaling per prestatie (fee for

service) versus een vast periodisch bedrag per patiënt (“capitation”) en die konden kiezen

tussen beide systemen: ongeveer 30% van de ondervraagden wisten bijna niets over Health

Maintenance Organisations322, die werken met een vast periodisch bedrag, en 41% van de

overigen wist er duidelijk veel te weinig over.415

Tenslotte lijken bij consumenten quantitatieve gegevens minder zwaar te wegen dan

persoonlijke ervaring, zoals de aanbevelingen van vertrouwde zorgverleners, informele

netwerken en aanbevelingen van familieleden en vrienden.309;397;400;402 Het lijkt derhalve

weinig waarschijnlijk dat de “slapende reus” van de consumentenkeuze zal ontwaken.402

Vaak gebruiken zorgverzekeraars dit soort informatie niet op een zinvolle manier. In

tegenspraak met de conventionele markteconomische theorie, domineerden enkele plannen

met de slechtste resultaten op gebied van consumentensatisfactie de markt. Andere dan

kwaliteitsbeschouwingen spelen hierbij een rol: snelle uitbetaling in geval van claims,

netwerken, lage prijzen, en het niet verplicht karakter van de performance van de

gezondheidsplannen (21 op de 54 van die plannen gaven geen gegevens vrij en scoorden

significant slechter dan de andere).402

Kleine werkgevers ( < 50 werknemers) vertegenwoordigen 96% van de US arbeidsmarkt.

Bij hen komen kwaliteitszorg en accreditatie op de vijfde en zesde plaats op de zes

factoren, die beschouwd werden voor de aankoop van een verzekering voor hun

werknemers, na prijs, voordelenpakket en beschikbaarheid van de artsen.402


133

De rol van de media lijkt vrij beperkt: de mensen schijnen weinig rekening te houden met

de ziekenhuisrangen en media krijgen meer reacties vanwege ziekenhuizen en

gezondheidssystemen dan vanwege consumenten.402

Artsen staan sceptisch ten opzichte van profielen en maken er weinig gebruik van

bijvoorbeeld bij verwijzing van patiënten, hoewel een studie vaststelde dat huisartsen

rekening houden met de geboden kwaliteit bij een verwijzing.283;309;344;397;400;402;407 In een

studie in Schotland bleek dat de redenen voor de geringe impact van publiekelijke

ontsluiting op artsen de volgende waren: de geloofwaardigheid van de indicator omwille

van de kwaliteit van de gebruikte gegevens, de grote tijdsspanne tussen de feiten en de

publicatie ervan, de geringe doorstroming van de indicatoren naar alle leden van de

ziekenhuisstaf, gebrek aan vorming over het gebruik van en interpretatie van

kwaliteitsindicatoren en het afwezig zijn van een verantwoordelijke voor het begeleiden

van het gebruikmaken van de indicatoren, het ontbreken van een formeel systeem van

performance beoordeling waaraan een stimulans verbonden is, het belang van bijkomende

informele informatie via professionele netwerken die belangrijker leken dan “laattijdige”

indicatoren, procesindicatoren worden verkozen boven uitkomstindicatoren, de geringe

externe aansprakelijkheid vanwege patiënten, vertegenwoordigers van patiënten en

gezondheidsdiensten.416

In tegenstelling met deze relatieve inertie bij artsen bleken kwaliteitsrapporten in Ontario

wel tot kwaliteitsverbeterende initiatieven aanleiding te geven in veel ziekenhuizen.298

Ziekenhuizendirecties reageren immers wel op dit soort informatie, zij het op

uiteenlopende wijze: ofwel op een negatieve en defensieve manier door het rapport te

bekritiseren, ofwel door een concrete kwaliteitsverbetering en men stelt vast dat de

weerstand van zorgverleners t.o.v. profielen in de VS toeneemt.397;400;402In Canada schijnt

de afkeer voor profielen veel minder uitgesproken te zijn, maar worden ze vooral als nuttig

beschouwd wanneer het over procesindicatoren gaat.298

Er werden pogingen ondernomen om aan de nadelen van profielen te verhelpen. Een betere

en tevens meer gebruiksvriendelijke benadering komt uit de industriële wereld, namelijk

de “control chart”.394;417-420 Bij deze benadering, die afgeleid is van de statistische


134

procescontrole, beschouwt men de performance van ziekenhuizen als één industrieel

proces waarvan men aanneemt dat het homogeen is, wat niet uitsluit dat er zelfs in het

meest perfect opererend systeem onvermijdelijk enige variabiliteit optreedt in het

eindproduct.394;420 In tegenstelling tot de “league tables”, die een 95%

betrouwbaarheidsinterval gebruiken voor de individuele zorgverstrekker en wat leidt tot

het beschouwen als outlier van 1 op 20 zorgverleners, wordt hier een gemiddelde berekend

en twee controle limieten, die er 3 σ van verwijderd zijn, wat leidt tot een

interval dat 99.7% der observaties bevat in geval van een normaal verdeling.421 Verder

suggereert deze manier van voorstellen geen rangen, al worden outliers wel in beeld

gebracht en is de methode die voor het bepalen van outliers gebruikt wordt (zij houdt geen

rekening met correlaties) niet helemaal correct. Hoewel conceptueel erg aanlokkelijk, toch

lijkt ons deze benadering enigszins gewaagd. In de industriële setting gaat het immers over

een proces dat zich afspeelt in een tijdsperspectief, wat hier duidelijk niet het geval is

vermits het ziekenhuisuitkomsten op een bepaald ogenblik vergelijkt. Wij werkten zelf een

alternatieve aanpak uit (Zie hoofdstuk 3).

We wensen hier enkele woorden te wijden aan het probleem van het profileren van

individuele artsen omdat hier de nadelen van profielen maximaal uitvergroot worden.

Hofer et al.329trokken uit een profielenstudie m.b.t. bloedwaarden (HbA1c-spiegel) bij

diabetici in een huisartsensetting een aantal belangrijke conclusies. Vooreerst dienen de

makers van profielen een realistischer beoordeling te maken van de betrouwbaarheid van

hun methoden, die vooralsnog niet in staat bleken echte verschillen in praktijkvoering op

een betrouwbare manier aan te tonen. Vervolgens dient de case mix geoptimaliseerd te

worden - correctie voor leeftijd en geslacht is amper beter dan helemaal geen correctie – en

dienen er genoeg observaties per zorgverlener en genoeg zorgverleners te zijn om de echte

betrouwbaarheid van hun meting te schatten. Tenslotte moet men er zich van bewust te

zijn dat de toepassing van profielen gaming kan uitlokken (het “verwijderen” van 1 tot 3

van de zwaarste gevallen is voldoende om een outlier status om te buigen naar een inlier

status) en dat dit fenomeen de meest zieke en meest kwetsbare patiënten treft.329

Of de bestaande evidentie voor of tegen publiekelijke ontsluiting pleit, is open voor debat.

Voorstanders focussen op de kleine maar significante winst, die geboekt werd, stellen dat


135

traditionele methoden onvoldoende subtiele veranderingen meten en dat de voornaamste

impact zich pas over jaren zal laten voelen. Tegenstanders concentreren zich op de

negatieve bevindingen en op de kleine winst in verhouding tot de belangrijke investering

in tijd en middelen.397

Concluderend kan men stellen dat een toenemende graad van publiekelijke ontsluiting van

gezondheidszorg performance gegevens onvermijdbaar is en de grotere vraag naar

informatie en aansprakelijkheid in alle levensdomeinen weerspiegelt.397;422 Men mag

aannemen dat het gebruik van dergelijke gegevens door de consumenten en zorgenkopers

of voor reguleringsdoeleinden relatief minder belangrijk zal zijn dan als een katalysator

om interne kwaliteit te stimuleren en te bevorderen bij zorgverleners.397

2.4.2 Continuous Quality Improvement (CQI). In tegenstelling met profielen legt CQI de klemtoon op proces en systeemverbetering

veeleer dan op de opsporing en rapportering van outliers, waarvan het de onbedoelde

negatieve consequenties, voornamelijk het niet uitvoeren van ingrepen bij de hoogrisico

patiënten en “gaming” zoekt te vermijden.392 Verder is het onrealistisch eerlijk

zelfonderzoek te verwachten onder de bedreiging van publiekelijke ontsluiting.392 De CQI-

benadering wordt dan ook als volgt omschreven “... CQI maakt gebruik van

samenwerking, uitwisselingsbezoeken in een niet-bedreigende sfeer, en vaststelling van de

beste praktijken om de kwaliteit te verhogen en de variabiliteit onder de samenwerkende

instellingen te verbeteren”.392

In New England heeft CQI een werkelijke kwaliteitsverbetering teweeg gebracht. Vraag is

echter in welke mate deze specifieke setting, gekenmerkt door vrijwillige deelname en

geringe competitie onder de deelnemers, veralgemeenbaar is naar een nationale setting met

competitie onder de deelnemers.392

2.4.3 Hybriede vormen CQI, hoe aantrekkelijk ook als systeem, voldoet echter niet aan het

aansprakelijkheidsprincipe. Vandaar dat er gezocht wordt naar vormen van

kwaliteitsborging, die wel aan deze basisvereiste beantwoorden zonder de voordelen van

CQI te verliezen noch in de nadelen van profielen te delen.392


136

Hybriede vormen, die een CQI benadering combineren met een basis report card, kunnen

misschien het beste compromis zijn.392 Zo stellen Topol en Califf274, en Califf et al.289 een

benadering voor, die wellicht minder tot misinterpretatie zou leiden dan bij profielen. Zij

zou erin bestaan een aanvaardbare spreidingsbreedte van de uitkomst te definiëren en

alleen tot publiceren van specifieke puntschatters over te gaan indien de waargenomen

waarde voor een arts of een instelling buiten deze spreidingsbreedte ligt of wanneer de

geobserveerde verschillen statistisch significant zijn en na bevestiging van de outlier status

door een adequaat peer review. Dezelfde auteurs bepleiten verder dat cardiologen en

hartchirurgen ook een vermelding maken op het formulier van de geïnformeerde

toestemming van het risicoprofiel en de uitkomstcijfers in hun patiëntenpraktijk, met 95%

betrouwbaarheidsintervallen, én gecertificeerd door een onafhankelijke peer review

groep.274;289 Naast een adequate risicocorrectie zou de uitkomstenbeoordeling ook baat

vinden bij een meer volledige registratie namelijk vanaf de verwijzing voor hartchirurgie

en voor een langere follow-up. Dit zou het mogelijk maken “skimming” op te sporen en de

langere termijn uitkomsten in rekening te brengen.289 Aangepaste statistische modellen

kunnen hierbij nuttig zijn. Bayesiaanse hiërarchische modellen laten toe bij profielen een

grenswaarde te kiezen, die niet op probabiliteiten of op een vergelijking met de

gemiddelde performance van de zorgverleners berust maar op een standaard gebaseerd op

een aanvaardbare medische praktijkvoering en op kost en nut voor het publiek.423 Een

alternatief voor de “aanvaardbare” praktijkvoering kan de “beste” praktijkvoering zijn wat

overeenkomt met de twintigste percentiel.403

2.4.4 Slotbeschouwingen rond het ontsluiten van kwaliteitsgegevens De ervaring uit de US leert dat een of andere vorm van publiekelijke ontsluiting van

perfomancegegevens in de zorgensector waarschijnlijk onvermijdbaar is.397;400 Ze is

overigens wenselijk in een context van kostenbeheersing, waar alléén de kosten zouden

bepalen welke artsen bepaalde ingrepen zouden uitvoeren zonder enige

kwaliteitsoverweging als inbreng bij de beslissing.424

Deze ervaring suggereert verder dat gesofisticeerde kwaliteitsmetingen en

rapporteringsystemen niet geleid hebben tot de consumentenkeuzes zoals ze te verwachten

waren in een context van markteconomie, waarbij voor betere kwaliteit gekozen wordt


137

met het verdwijnen van minder kwaliteitsvolle zorgverstrekkers als gevolg of het

verbeteren van hun kwaliteit.402

Verder dienen we er ons bewust van te zijn “dat het gezondheidszorgsysteem zich

gewoonweg de kosten niet kan veroorloven van een voldoende encyclopedische set van

kwaliteitsmaten te maken, die beantwoordt aan de noden van iedere patiënt en dat voor alle

aandoeningen.”402 Waarschijnlijk hebben we het einde bereikt van de inspanningen om de

presentatieformaten van kwaliteitsinformatie te verbeteren en is het verspreiden de te

nemen horde.402 Zorgverleners kunnen immers gemakkelijk informatie die hen ‘bijt’

ondermijnen, consumenten hebben waarschijnlijk tijd noch zin om de nodige inzichtingen

te verwerven en internet is hiervoor geen oplossing want consumenten interesseren zich

voor ziekten en behandelingen niet voor kwaliteit.402 We dienen echter beter te weten

welk type van informatie consumenten en verzekeraars nodig hebben en kunnen

gebruiken. 397;400;402Het meten van kwaliteit dient verder te gaan maar de resultaten moeten

bij voorkeur naar organisaties gaan, zoals de National Committee for Quality Assurance

(NCQA).402

Op een aantal fundamentele vragen moet een antwoord verschaft worden zoals op de te

gebruiken types van indicatoren (proces en/of uitkomst), de vereiste graad van

risicocorrectie nodig om faire en betekenisvolle vergelijkingen te maken, hoe de

informatie verspreiden en hoe de nevenwerkingen best op te vangen.400 Dit veronderstelt

enerzijds een evenwichtige afweging van wetenschappelijke rigorisme, dogma en gezond

verstand, maar ook een aanvaarding door de professionele beoefenaar van

gezondheidszorgen en de gezondheidssector.400

Het gebruik van hiërarchische modellen, inclusief een afdoende correctie voor multipele

toetsing, ondervangt de meeste van de statistische en rapporteringproblemen waarmee de

klassieke profileringmethoden gepaard gaan. Hun waarde is functie van de kwaliteit van

het gegevensbestand, van de correcte specificatie en fit van het model.423

Naylor stelt voor vormen van op maat gesneden partnership te ontwikkelen tussen clinici,

medische centra en regulatoren en geloofwaardige agentschappen voor


138

kwaliteitsbevordering, die niet alleen de inspanningen tot kwaliteitsverbetering

ondersteunen maar ook de resultaten zullen genereren, die openlijk met patiënten gedeeld

worden.409 “But public disclosure of information about the quality of healthcare is a weak

strategy for ensuring quality”.402

Ongunstige gevolgen zijn duidelijk belangrijk voor gezondheidszorgorganisaties, niet

alleen omwille van hun impact op patiënten maar ook omdat ze inlichtingen kunnen

verschaffen over de kwaliteit van de gezondheidszorg en tevens aan de clinici de kans

bieden voor kwaliteitsverbetering.370 Anderzijds kan kwaliteitsverbetering niet uitsluitend

gebaseerd zijn op negatieve ervaringen want dat werkt demotiverend voor de clinici en

geeft een vertekend beeld van kwaliteit dat gebaseerd is op outliers, technische kwaliteit en

problemen van patiëntenveiligheid.370 Verder dient men rekening te houden met een aantal

belangrijke praktische problemen, zeker indien een kwantitatieve benadering gevolgd

wordt: 1) het ontwikkelen van definities van onbedoelde uitkomsten die betekenisvol,

betrouwbaar en valide zijn is moeilijk, 2) meestal wordt gebruik gemaakt van impliciet

professioneel review dat vaak onbetrouwbaar is, en 3) de meeste van de gebruikte

maatstaven werden onvoldoende uitgetest in termen van validiteit, betrouwbaarheid en

veralgemeenbaarheid.370

In een optiek van kwaliteitsverbetering is het noodzakelijk dat men zich, in geval van een

“ramp” zoals bij de pediatrische hartchirurgie in Bristol318;425, niet beperkt tot het

individueel falen van artsen maar er zich rekenschap van geeft dat het meestal over een

“organisatorische pathologie” gaat en dat de ervaring leert dat het niet gemakkelijk is

systemen te veranderen.426 Dit soort problemen doet zich namelijk veelal voor in een

organisatie met een zwak leiderschap, met geografische isolatie en zonder zelfevaluatie,

met een gebrek aan basis management systemen en processen, met ondermaatse interne en

externe communicatie, en waar de staf noch de patiënten hun bekommernis kunnen

uiten.426 Ook het IOM beklemtoont dat medische fouten meestal resulteren uit fouten van

het systeem niet uit die van onzorgvuldige zorgverleners. Het voorkomen van fouten en

schade vereist een hertekening van het systeem niet het straffen van individuën284 of zoals

Leape het stelt: “Errors result from faulty systems not from faulty people, so it is systems

that must be fixed. Errors are excusable; ignoring them is not.”352


139

Het IOM beveelt twee types van rapportage aan: 1) een vrijwillige in geval van minimale

of geen schade, en 2) een verplichte, wanneer het gaat over een sterfgeval of over een

ernstige blijvende schade.284 Dergelijke aanbevelingen omzetten tot realiteit vergt een

nationale inspanning.284

2.5 BESLUIT

De concepten volksgezondheid, gezondheidsdiensten en epidemiologie overlappen elkaar

grotendeels waar zij erop gericht zijn de gezondheid van de ganse bevolking te bewaren, te

bevorderen en te herstellen. Toch lijken er twee, los van elkaar staande werelden te

bestaan: een van volksgezondheid en een andere van gezondheidsdiensten, met twee eigen

informatiesystemen, respectievelijk volksgezondheidsinformatie en

managementinformatie.

Het is dan zaak om naar Nederlands voorbeeld de conceptuele eenheid te herstellen door te

streven naar een kwaliteitsvolle volksgezondheid. Hiervoor wordt de benadering gevolgd

van Donabedian, een op zeven pijlers gebaseerde globale zorgenkwaliteit bestaande uit:

de maximale doeltreffendheid, de gerealiseerde doeltreffendheid, de doelmatigheid, de

optimaliteit, de aanvaardbaarheid voor de patiënt, de legitimiteit ten overstaan van de

maatschappij en de billijkheid. In deze visie wordt er rekening gehouden met zowel met

technische aspecten als met interpersonele relaties.

Na een omschrijving van wat kwaliteit is, wordt nagegaan welke van haar aspecten aan de

hand van administratieve gegevens kunnen beschreven worden. Hierbij worden twee

benaderingswijzen gevolgd.

Een eerste benadering is gebaseerd op kwaliteitsindicatoren. Achtereenvolgens worden de

types en het gebruik van kwaliteitsindicatoren besproken, en de mogelijkheden van

administratieve gegevens om ondermaatse of bovenmaatse kwaliteit aan te tonen

onderzocht.

Een tweede benadering is deze gebaseerd op incidenten n.a.v. toegediende zorgen. Het

begrip “onbedoelde uitkomst” wordt omschreven, gegevensbronnen worden vermeld, de


140

omvang van het fenomeen geschetst en de bruikbaarheid van administratieve

gegevensbanken aangegeven.

Administratieve gegevensbanken laten niet toe de kwaliteit van zorgen te meten omwille

van hun inherente beperkingen, zij zijn immers alleen een neerslag van technische

aspecten van zorg en zijn verder gekenmerkt door onvolledigheid en onvolmaaktheid van

de gegevens. Een screening van onder- en bovenmaatse kwaliteit van zorgen lijkt wel een

bruikbare werkhypothese. Op gebied van incidenten lijkt de rol van administratieve

gegevens nog beperkter.

In een laatste deel van het hoofdstuk wordt nagegaan hoe, in het licht van buitenlandse

ervaringen, met de resultaten van de uitgevoerde screening kan omgegaan worden

rekening houdend met de fundamentele plicht van aansprakelijkheid van de gescreende en

van de overheid, en het fundamentele recht op persoonlijke integriteit van de gescreende.

Hierbij is het duidelijk dat de aandacht uitgaat naar organisaties, naar het verbeteren van

hun functioneren, en niet naar individuele artsen. Het identificeren van de inhoud en vorm

van de informatie ten behoeve van de consument, ziekenhuismanagers en

verzekeringsinstellingen, is een nog lopend proces benevens de wijze van

bevestiging/ontkenning van screeningsresultaten.

141

Hoofdstuk 3: Methodologische aspecten

Zowel het opsporen van ziekenhuizen met een afwijkend codeergedrag als het

identificeren van ziekenhuizen met een ondermaatse of bovenmaatse zorgenkwaliteit, zijn

twee belangrijke onderdelen van dit proefschrift, die we verder (Hoofdstukken 4 en 5)

uitvoerig zullen behandelen. Zij doen een beroep op dezelfde statistische methodologie, zij

het in een totaal andere setting. Het gaat hierbij immers over het opsporen van outliers.

Het leek dan ook de moeite aan deze technieken een hoofdstuk te wijden en hierin tevens

de beperkingen van deze methoden en de daarop gebaseerde analyses op te nemen.

Wij trachtten hierbij het aspect van de omvang van het bestudeerde fenomeen aan bod te

laten komen naast het statistisch concept van significantie, vermits we hier immers vaak te

maken hadden met zeer grote aantallen en derhalve gemakkelijk significant.

Bij de analyse diende verder de nodige aandacht geschonken te worden aan de

beperkingen eigen aan administratieve gegevens.

3.1 AUDIT: STATISTISCHE METHODOLOGIE

3.1.1 Globale beoordeling van de evolutie van het ziekenhuissysteem op gebied van ligduur en ziekte-ernst, en opsporing van afwijkende ziekenhuizen

De beoordeling van de doeltreffendheid en doelmatigheid van het zorgsysteem is

fundamenteel voor de beleidsonderbouwing. Het is daarbij belangrijk ziekenhuizen op te

sporen, die door hun systematisch afwijkend codeergedrag deze beoordeling bemoeilijken

(zie Hoofdstuk 4, Sectie 4.2). Het is verder de bedoeling deze systematisch afwijkende

ziekenhuizen in geval van bewust over- of ondercoderen te bestraffen en zo de financiële

motivatie voor frauduleus codeergedrag weg te nemen. Het lijkt dan ook belangrijk de

statistische methodologie van de beoordeling van het ziekenhuissysteem en de opsporing

van de afwijkende ziekenhuizen meer in detail te bespreken.


142

Onze analyses bestaan uit drie verschillende onderdelen.

1) In een eerste onderdeel wordt de evolutie van het ziekenhuisgebeuren op nationaal

niveau, de stabiliteit van het systeem, onder de loep genomen. Dit gebeurt door middel van

een klassieke variantie-analyse (van het type herhaalde metingen, “repeated

measurements”)427 en linear mixed models428 voor continue antwoordvariabelen, en door

middel van marginale modellen (Generalized Estimating Equations of GEE) 429-431 voor

categorische antwoordvariabelen. Deze modellen laten toe rekening te houden met

correlatie van de gegevens.

2) In een tweede onderdeel bestuderen we de ziekenhuizen op een globale manier. Hierbij

is het de bedoeling ziekenhuizen met een globaal afwijkend codeergedrag, de “outliers”,

op te sporen. Vermits onze aandacht uitgaat naar het geheel der Belgische ziekenhuizen en

we geïnteresseerd zijn in het identificeren van outliers, maken we gebruik van zogenaamde

“fixed- effects” modellen.432;433 Hiërarchische modellen, vaak de zogenaamde “random-

effects” modellen, hadden een alternatief kunnen zijn.434 Het is echter zo dat deze

modellen niet bedoeld zijn om outliers te identificeren. Verder moet de theoretische

grondslag voor het vaststellen van outliers nog ontwikkeld worden voor “linear mixed”

modellen en is het voor “non-linear mixed” modellen onmogelijk outliers te

identificeren.434;435Herinneren we er tenslotte aan dat bij “random-effects” modellen de

ziekenhuizen beschouwd worden als een aselecte steekproef uit een ruimere populatie van

ziekenhuizen, wat in tegenspraak is met ons studieobject, namelijk het geheel der

Belgische ziekenhuizen.

Om de evolutie van het systeem te beoordelen doen we, in geval van een continue

antwoordvariabele, beroep op een multivariate variantie analyse (van het type herhaalde

metingen).427 Ook fitten we in een “linear mixed” model, dat rekening houdt met de

correlatie van de gegevens, het verschil tussen geobserveerde en de gestandaardiseerde

verblijfsduur om de stabiliteit van het systeem op te volgen. Deze benadering laat toe (1)

de tijdsevolutie in zijn geheel te beoordelen en dus niet door middel van een paarsgewijze

vergelijking van de jaargemiddelden, (2) rekening te houden met de correlatie die tussen

de herhaalde metingen bestaat, en (3) afwijkende ziekenhuizen te identificeren. We

modelleren het (gewogen) verschil tussen de geobserveerde en gestandaardiseerde

40BHoofdstuk 3: Methodologische aspecten

143

gemiddelde verblijfsduur omdat ze gemakkelijk kunnen vertaald worden in een statistisch

model en verder omdat ze op een gemakkelijker interpreteerbare manier grafisch kunnen

weergegeven worden dan een gelijktijdige vergelijking van twee curven per ziekenhuis

voor een geheel van 114 ziekenhuizen.

Een zelfde multivariate variantie analyse (van het type herhaalde metingen), ditmaal

uitgebreid met een interactie term tussen een lineaire tijdstrend en de individuele

ziekenhuizen, wordt uitgevoerd om ziekenhuizen met een abnormaal codeergedrag te

identificeren. Meer precies vergelijken we de “slope” van de tijdstrend van elk ziekenhuis

met die van alle ziekenhuizen (de “nationale trend”) door middel van lineaire

contrasten.117;427;436 Ook deden we beroep op de Mahalanobis437-440 afstand [een

probabilistische afstand tussen twee punten (t.t.z. rekening houdend met verschillen in

variantie en correlatie tussen twee variabelen) in een multivariate context], om “outlying”

ziekenhuizen op te sporen. De Mahalanobis-afstand is verwant met een z score [z = (x-

μ)/σ] in het kwadraat, waarbij x de waarde voor het bestudeerde ziekenhuis is, μ de

gemiddelde ziekenhuiswaarde en σ de standaardafwijking van de ziekenhuiswaarden.

In geval van een categorische antwoordvariabele maken we gebruik van de logistische

regressie waarbij de ratio van het aantal gevallen / aantal verblijven, de antwoordvariabele

vormt en waarbij de tijdsevolutie wordt weergegeven door een variabele die het jaar of het

semester van de waarneming weergeeft. Ook hier wordt de tijdsevolutie in zijn geheel

geanalyseerd. Deze benadering laat verder de opsporing toe van eventueel afwijkende

ziekenhuizen door de interactie tussen tijdsevolutie en individueel ziekenhuis versus het

nationale gemiddelde na te gaan. De analyse gebeurt op “globale” indicatoren zoals

ligduur (LOS), Severity of Illness (SOI), Comorbiditeit, en outliers op gebied van

financiering (zie hoofdstuk 4).

De eerste twee onderdelen vormen samen de analyse op macroniveau.

3) In een derde onderdeel, het microniveau, gaan we gericht te werk. Indien een ziekenhuis

op macroniveau een outlier is, wordt zijn codeergedrag bestudeerd op een aantal

pathologieën, ingrepen of behandelingen, de zogenaamde “knipperlichten” waarvan


144

aangenomen wordt dat zij zich gemakkelijk lenen tot lucratief overcoderen. Ook hiervoor

maken we gebruik van de logistische regressie met als bedoeling na te gaan of de globaal

afwijkende ziekenhuizen voor een bepaald knipperlicht een duidelijk afwijkend patroon

vertonen. In statistische termen wordt dit uitgedrukt door het nagaan van een significante

interactieterm tussen de tijdstrend en de individuele ziekenhuizen (via het gebruik van

contrasten). Bij de analyse dient er een correctie te gebeuren voor de tijdscorrelatie en

voor het meervoudig gelijktijdig toetsen (zie 3.3.3).313;438

3.1.2 Trend en interactie Elke modellering tracht een goede fit te bereiken en zo eenvoudig mogelijk de relatie

tussen de antwoordvariabele en het geheel van verklarende variabelen te beschrijven. Het

meest gewone voorbeeld van modellering is de lineaire regressie, waarvan de uitkomst

variabele verondersteld wordt continu te zijn.

Laten we trachten het begrip trend in deze regressiecontext te verduidelijken. Voor ieder

probleem, dat men aan de hand van regressietechnieken tracht op te lossen, vormt de

gemiddelde waarde van de uitkomstvariabele de “sleutelwaarde”. Deze waarde wordt het

“conditioneel gemiddelde” genoemd of de verwachte waarde van Y gegeven de waarde

van X. Ze wordt uitgedrukt als: E(Y|x)441. De lineariteit van een verklarende variabele laat

een eenvoudige interpretatie van het regressieprobleem toe: de toename met 1 eenheid van

X heeft een lineaire toename in Y als gevolg.

Indien Y dichotoom is, dan is E(Y|x) niet lineair maar S-vormig (Figuur 2, bovenste deel).

Onder dichotoom verstaan we hier de aanwezigheid van een uitkomst of niet: bvb.

overleden of niet, gezond of ziek. In het probleem dat ons nu bezig houdt gaan we na of

het aantal keren dat een fenomeen zich voordoet op dezelfde wijze in de tijd evolueert in

het geheel der ziekenhuizen. Bijvoorbeeld de per semester evolutie (de verklarende

variabele) van het aantal verblijven met als nevendiagnose septicemie (de

antwoordvariabele). Indien met een transformatie van de antwoordvariabele de linearisatie

van de tijdsvariabele kan bereikt worden, spreekt men van een lineaire tijdstrend en kan

deze tijdstrend tussen ziekenhuizen vergeleken worden door middel van de interactie

tussen tijdstrend en ziekenhuizen.442


145

De eventuele correlatie tussen zieken in een ziekenhuis en van ziekenhuizen over de tijd

uit zich in het fenomeen van de “overdispersion”443, waarbij de variabiliteit van de

gegevens groter is dan degene die voortvloeit uit de veronderstelde binomiale, Poisson of

normale verdeling. We corrigeren voor “overdispersion” door middel van de “rescaling”-

techniek (de standaardfouten gebruikt voor de testen worden vermenigvuldigd met een

factor die gelijk is aan de vierkantswortel van de ratio van de goodness-of-fit chi-kwadraat

en het aantal vrijheidsgraden)444.

Om een correcte beoordeling te maken van de tijdsevolutie in een bepaald ziekenhuis

vergeleken met die van het nationale gemiddelde gebruiken we contrasten.427;428;436;445-447

We trachten dit begrip aan de hand van een voorbeeld duidelijk te maken. Stel dat we vier

ziekenhuizen willen vergelijken. Het is mogelijk hieraan aangepaste hypothesetoetsen uit

te voeren door een L vector te specificeren voor het toetsen van de hypothese Lβ = 0, die

aangeeft dat de trends van de bestudeerde ziekenhuizen niet verschillen. In een eerste stap

vergelijken we de trend van ziekenhuis 1 (ZH1 in figuur 1) met de gemiddelde trend van de

vier ziekenhuizen (H1, H2, H3, H4). De nul hypothese wordt dan:

1β1 + 1β2 + 1β3 + 1β4 H0: 1β1 = ---------------------------

4

waarbij βi de trend is voor ziekenhuis i.

We herhalen dit procédé voor alle ziekenhuizen en uiteindelijk wordt de matrix van

contrasten gefit in de logistische regressie.

Om te kunnen besluiten of een ziekenhuis een significant afwijkende trend heeft, gaan we

na of de interactie term tussen trend en ziekenhuis significant is. Hiervoor “contrasteren”

we op de hierboven beschreven manier de trend van een ziekenhuis versus de nationale

trend. Interactie betekent in deze context een niet parallel verloop van de trend van een of

meerdere ziekenhuizen met die van het nationale gemiddelde. In figuur 1 vertonen

ziekenhuizen drie (ZH3) en vier (ZH4) onderling een significante interactie en ook met de


146

ziekenhuizen 1 (ZH1) en 2 (ZH2). De trends van de ziekenhuizen één en twee verlopen

daarentegen parallel, wat interactie uitsluit.

Bij opsporing van mogelijke fraude via de knipperlichten gaat de aandacht naar de

“stijgers” of “dalers”, zoals ziekenhuis 3 op de grafiek. Een “stijger” of “daler” kan zowel

een ziekenhuis zijn dat van onder-codering evolueert naar correcte codering als een

ziekenhuis dat evolueert naar up-coding of creep, of dat meer en meer zwaardere

pathologieën aantrekt. Alleen de audit kan bepalen of het een geval van up-coding is of

niet.

Figuur 1: Interziekenhuis verschillen in evolutie van een cijfer in de tijd: interactie

Interactie

0

10

20

30

40

50

60

70

80

Jaar 1 Jaar 2 Jaar 3 Jaar 4

Evolutie in de tijd

Rat

e (%

)

ZH1 ZH2 ZH3 ZH4

3.1.3 Interpretatie van een odds ratio bij interactie van een trend en een categorische variabele Zoals hoger vermeld is de antwoordvariabele in de logistische regressie binair, ligt E(Y|x),

het conditionele gemiddelde, tussen 0 en 1 en heeft een S-vorm (Figuur 2, bovenste deel).

Dit betekent dat de verandering in E(Y|x) per eenheid verandering in x progressief kleiner


147

wordt naarmate het conditioneel gemiddelde de waarden 0 of 1 benadert.441 Dit laat, in

tegenstelling met de lineaire regressie, geen eenvoudige interpretatie toe van een toename

met een eenheid in X van een continue verklarende variabele, die een toename met een

vaste grootte in Y ten gevolge heeft.

Om aan dit euvel te verhelpen en deze eenvoudige interpretatie mogelijk te maken, wordt

een logit transformatie toegepast. De verklarende variabelen worden omgevormd tot logits.

Laten we om de notatie te vereenvoudigen de gezochte E(Y|x) in de logistische distributie

voorstellen als π(x), met

exp(ß0 + ß1x) π(x) = -------------------------

1+exp( ß0 + ß1x)

De logit transformatie van π(x), weergegeven als

π(x) g(x) = ln ---------- = ß0 + ß1x, 1- π(x]

maakt de S vorm lineair (Figuur 2, onderste deel).

Noteren we dat de logit,

π(x) logit = ln ---------- , 1- π(x]

π(x) waarvan ---------- 1- π(x]

de ziekte odds aangeeft, ook de log odds genoemd wordt.448


148

In zijn eenvoudigste vorm, waar de verklarende variabele, x, gecodeerd wordt als nul of

een, is

π(x) π (1) / [1- π (1)] ---------- = --------------------- 1- π(x] π (0) / [1- π (0)]

waar π (1) / [1- π (1)], de “odds”, de kans is van een ziekte te hebben over de kans ze niet

te hebben in aanwezigheid van een bepaalde karakteristiek en π (0) / [1- π (0)] dezelfde

odds is, maar dan in afwezigheid van die karakteristiek. De logit transformatie wordt

doorgevoerd in de logistische regressie.

Laten we nogmaals veronderstellen dat de verklarende variabele, x, gecodeerd wordt als

nul of een. Het verschil in de logit van een bepaald ziekenhuis (met x = 1) en de logit van

het geheel der ziekenhuizen (met x = 0) is

g(1)-g(0) = (ß0 + ß1) - (ß0) = ß1.

Dit verschil in logits is, na het nemen van het antilogaritme, gelijk aan de “odds ratio”

(OR), een gekende associatiemaat:

OR = exp ln [π 1/(1- π 1)] – ln [ π 0/(1- π 0)] = exp[(β0+β1) -β0] = exp(β1).

De odds ratio (OR) wordt vaak gebruikt in de epidemiologie (Tabel 1) omdat ze

benaderend aangeeft hoe veel meer (on)waarschijnlijk het is dat een uitkomst aanwezig is

bij iemand waar X = 1 (blootstelling aanwezig) dan waar X = 0 (blootstelling niet

aanwezig). Zij is gelijk aan A x D / C x B. Een eenvoudige schatter van de standaardfout

van de log-odds ratio is de vierkantswortel van 1/A +1/B +1/C +1/D, die, na het nemen

van het antilogaritme, kan gebruikt worden als standaardfout voor de odds ratio.449Deze

standaardfout laat toe een betrouwbaarheidsinterval te berekenen en tevens de probabiliteit

bij een Wald toets voor het toetsen van de hypotheses dat de odds ratio al dan niet gelijk is

aan één. Noteren we dat een OR=1 aangeeft dat blootstelling geen effect heeft.

Passen wij de odds ratio meer specifiek toe in een audit context (Tabel 1, sectie b) dan

wordt het voorkomen van een verblijf, met als nevendiagnose knipperlicht Y, in een


149

bepaald ziekenhuis Z vergeleken met het voorkomen van een gelijkaardig verblijf in het

geheel van de Belgische ziekenhuizen tijdens het jaar A.

Tabel 1: De odds ratio in zijn epidemiologische en audit context.

A) EPIDEMIOLOGISCHE CONTEXT B) AUDIT CONTEXT

Blootstelling Totaal Ziekenhuizen Totaal

X=1 X=0 ZH Alle ZH

Y=1 A B A+B + A B A+B Uitkomst

Y=0 C D C+D

Knipperlicht

- C D C+D

Totaal A+C B+D N Totaal A+C B+D N

Hoe wordt dan een odds ratio geïnterpreteerd in geval van een interactie van een trend (X),

een continue variabele, en een categorische variabele(F)?

De logistische regressie drukt de twee categorieën van de verklarende variabele (het

bestudeerde ziekenhuis versus alle ziekenhuizen) als een log-odds ratio uit. Deze log- odds

ratio is niet constant in het verloop van de tijd maar moet met een factor vermenigvuldigd

worden om de gezochte log-odds te bekomen voor jaar A+1. Deze factor echter is wel

constant - vandaar de naam (lineaire) trend – tenminste zolang we met de log-odds ratio

werken, maar is niet langer constant wanneer we de antilog nemen om de odds ratio te

bekomen. De geïnteresseerde lezer wordt naar het boek van Hosmer en Lemeshow

verwezen voor de volledige details van deze modellering.442


150

Figuur 2: CHD prevalentie per leeftijdsgroep uitgedrukt als een proportie en als een log-

odds ratio

Bron: Hosmer en Lemmshow441


151

In essentie stellen deze auteurs volgende drie-stappen procedure voor om tot de gewenste

odds ratio te komen:

1) g(f1,x) = ß0 + ß1f1+ß2x+ß3f1*x , en

g(f0,x) = ß0 + ß1f0+ß2x+ß3f0*x

bepaal de log-odds ratio door hun verschil te berekenen

2) log OR = ß1(f1-f0) + ß3x (f1-f0)

exponentieer de log-odds ratio

3) OR= exp[ß1(f1-f0) + ß3x (f1-f0)]

Als de risicofactor F dichotoom is en we nemen aan dat f1=1 en f0=0, dan herleidt de

formule zich tot:

ln[OR(F=1,F=0,X=x)] = ß1+ß3x.

Dit is het geval in onze studie, vermits we een ziekenhuis (F=1) vergelijken met het geheel

der Belgische ziekenhuizen (F=0). Omdat we de case mix van de ziekenhuizen

onvoldoende kennen, zijn we voornamelijk geïnteresseerd in de evolutie van de odds ratio

en minder in zijn werkelijke waarde. Wij spitsen dan ook onze aandacht toe op ß3x, de

evolutie in de tijd van de log-odds ratio (de trend) van een specifiek ziekenhuis en

identificeren outliers in functie van hun trend.

De interpretatie van een odds ratio (OR) bij interactie van een trend en een categorische

variabele illustreren we aan de hand van volgend voorbeeld, overgenomen uit het

gerefereerde boek (Figuur 3).442 In deze studie wordt het verband bestudeerd tussen het

gewicht (< 50 kg of ≥ 50kg), de categorische variabele (F), en de leeftijd van de moeder,

de continue variabele, op het geboortegewicht van haar kind, de dichotome

uitkomstvariabele [aanwezigheid van een laag geboortegewicht (LBW) of niet]. Het

model LBW= F + X + F*x wordt gefit met als resultaat: intercept (β0 = 0,744), gewicht

van de moeder minder dan 50 kg (β1 = -1,9444), leeftijd van de moeder (β2 = -0,080), en

interactie laag gewicht van de moeder en leeftijd van de moeder (β3x = 0,132). Wanneer

we ln [OR(F=1,F=0, X=x)] = β1 + β3x exponentiëren komen we tot een OR van1,04 op de

leeftijd van 15 jaar, van 2,01 op de leeftijd van 20 jaar, van 3,90 op de leeftijd van 25 jaar,


152

en van 7,55 op de leeftijd van 30 jaar. Uit figuur 3, waarin de neperiaanse logaritme van de

odds ratio (lnOR) en de OR worden weergegeven, blijkt duidelijk dat de log-odds ratio van

de interactie gewicht en leeftijd van de moeder op het geboortewicht van het kind lineair is

maar niet de OR.

Vertaald naar onze setting van detectie van over-codering of onder-codering is het

ziekenhuis de categorische variabele (F) en de semestriële trend de continue variabele.

Figuur 3: Effect van gewicht (< 50kg) en leeftijd van de moeder op laag geboortegewicht

0

1

2

3

4

5

6

7

8

15 jaar 20 jaar 25 jaar 30 jaar

Ln(OR) OR

3.1.4. Steekproefgrootte voor de knipperlichten

3.1.4.1 Principe van de berekening De overheid neemt aan dat het verschil tussen auditeur en geauditeerde tenminste 5% moet

bedragen (het “toegelaten verschil”) vooraleer men frauduleus coderen kan

veronderstellen. Het minimum aantal onenigheden, nodig om fraude te laten vermoeden,

kan dan als volgt bepaald worden. Men berekent het 95% betrouwbaarheidsinterval van de

proportie van verblijven waarvan de ondergrens groter is dan, maar tevens zo kort

mogelijk de grens van de toegelaten verschilmarge benadert155. Indien men in het kader

van een audit op knipperlichten bijvoorbeeld 60 verblijven nakijkt moeten er tenminste 7

onenigheden vastgesteld worden vooraleer men fraude kan veronderstellen. Indien men 70

verblijven nakijkt bedraagt dit aantal 8 (zie tabel 2).


153

Voor zover de theorie wanneer het aantal beschikbare verblijven waaruit de steekproef

getrokken wordt als oneindig (bvb. 500 of meer) beschouwd kan worden. Wanneer de

steekproef getrokken wordt uit een eindig aantal verblijven dan gaat deze benadering niet

meer op en dient in de formule van het betrouwbaarheidsinterval een correctie aan de

standaardfout aangebracht te worden. Immers, hoe meer de steekproef het totaal aantal

beschikbare verblijven benadert, hoe minder variabiliteit er bestaat bij het schatten van de

te verwachten proportie. In dergelijke gevallen gebruikt men een ‘finite population

correction’, met name door de standaardfout te vermenigvuldigen met √ ((N- n)/N), de

‘sampling fraction’, waarbij n de steekproefgrootte is en N het aantal verblijven met het

knipperlicht waaruit de steekproef getrokken wordt.450 Stel n=N dan wordt de

correctiefactor gelijk aan 0 en is er geen variabiliteit meer. Indien we bvb. een ‘steekproef’

van 80 verblijven hebben uit 80 verblijven met de knipperlichtcode, dan wordt de

toegelaten marge van 5% of 4 verblijven overschreden wanneer er bij 5 verblijven geen

elementen gevonden worden om deze diagnose te verrechtvaardigen.

3.1.4.2 Berekening van het aantal onvoldoend gemotiveerde verblijven nodig om tot een waarschijnlijke fraude te kunnen besluiten

Stel n = het aantal te controleren verblijven (de steekproefgrootte); N = het aantal

verblijven met het knipperlicht waaruit de steekproef getrokken wordt; y = het aantal

onvoldoend gemotiveerde verblijven nodig om tot een waarschijnlijke fraude te kunnen

besluiten; P= de proportie van onvoldoend gemotiveerde verblijven; PL = de ondergrens

van het 95% betrouwbaarheidsinterval van P, die groter is dan de toegelaten proportie

(5%) en tevens de toegelaten proportie zo kort mogelijk benadert.

- Indien ((N-n)/N) groter dan of gelijk is aan 0.9, dan verloopt de berekening451 van PL,

als volgt:

(2*n*P)+ ((CI²)-1)-A)

PL= ----------------------------------

2*(n+(CI²))


154

Waar: CI=1.96 (95% betrouwbaarheidsinterval); P=y/n; q=1-P; A=CI*(√((CI²)-

(2+(1/n))+(4*P*((n*q)+1))))

Aan de hand van deze formule werd tabel 1 opgesteld.

- Indien het aantal beschikbare verblijven klein is en met name indien ((N-n)/N) kleiner is

dan 0.9 wordt de formule voor het bepalen van de PL als volgt aangepast:

(2*n*P)+(CI²)*((N-n)/N)-1)-A PL = ---------------------------------------

2*(n+(CI²)*(N-n)/N)

Waar CI=1.96 (95% BI); P=y/n; q=1-P; A=CI*√((N-n)/N)*(√((CI²)*((N-n)/N)-2

+(1/n))+(4*P*((n*q)+1)))) ;

Indien men in het kader van een audit op knipperlichten bijvoorbeeld 60 verblijven nakijkt

uit 1000 beschikbare verblijven met dat knipperlicht, dan is ((N-n)/N) groter dan 0.9 en

moeten er tenminste 7 onenigheden vastgesteld worden vooraleer men fraude kan

veronderstellen. Indien men 70 verblijven nakijkt bedraagt dit aantal 8. Indien men uit 80

beschikbare verblijven 70 verblijven nakijkt dan is ((N-n)/N) kleiner dan 0.9 en bedraagt

dit aantal 6.


155

Tabel 2: Minimum aantal verblijven nodig om een waarschijnlijke fraude op te sporen.

n Y P PL

30 5 .1667 .0630

35 5 .1429 .0538

40 6 .1500 .0625

45 6 .1333 .0554

50 7 .1400 .0628

55 7 .1273 .0569

60 7 .1167 .0521

65 8 .1231 .0584

70 8 .1143 .0541

75 8 .1067 .0505

80 9 .1125 .0559

85 9 .1059 .0526

90 10 .1111 .0575

95 10 .1053 .0544

100 10 .1000 .0516

n = aantal te controleren verblijven; y = aantal onvoldoende gemotiveerde verblijven nodig om tot een waarschijnlijke fraude te kunnen besluiten; P= proportie van onvoldoend gemotiveerde verblijven; PL = ondergrens van het 95% betrouwbaarheidsinterval van P, die groter is dan de toegelaten proportie en de toegelaten proportie zo kort mogelijk benadert.


156

3.2 STATISTISCHE AANDACHTSPUNTEN BIJ HET OMGAAN MET EN RAPPORTEREN VAN

KWALITEITSGEGEVENS: KLEINE AANTALLEN, CORRELATIE, CASE MIX VARIATIE EN

MEERVOUDIG GELIJKTIJDIG TOETSEN.

De analyse en de rapportering van kwaliteitsmetingen blijven een belangrijke

uitdaging.104;452 De consument verwacht van kwaliteitsmeting onder meer een antwoord op

de vraag of de “uitkomst” er anders zou uitzien mocht hij in een andere eenheid behandeld

geweest zijn.452 Derhalve zouden verschillen tussen zorgeenheden te wijten aan verschillen

in patiëntenkarakteristieken en niet aan reële verschillen tussen zorgeenheden uit de

vergelijking moeten “verwijderd” worden.452 Directe en indirecte standaardisatie komen

hiervoor niet in aanmerking omwille van het zeer beperkt aantal variabelen waarvoor zij

kunnen corrigeren en omwille van de moeilijk te vervullen voorwaarden voor een niet-

vertekende toepassing: een gelijkaardige bevolkingsverdeling bij de te vergelijken

zorgeenheden en constante risicoverhouding.155;452-454

Aanvankelijk werden niet-adequaat risicogecorrigeerde sterfteresultaten vrijgegeven wat

tot verhitte discussies aanleiding gaf. Derhalve werden er talrijke statistische modellen

ontwikkeld om aan dit euvel te verhelpen.104;163;188;359;392;452;455 Het gaat hierbij typisch over

een schatting van de waarschijnlijkheid van een postoperatief sterfgeval op individueel

patiëntenniveau, gevolgd door aggregatie op ziekenhuis- of artsenniveau, waarbij het

aantal vastgestelde sterfgevallen vergeleken wordt met het te verwachten, gevolgd door

een outlier-status bepaling.392 De resultaten van deze oefening worden dan gepubliceerd392

onder vorm van “report cards” in de US of “league tables” in het UK, die we in een

Belgische context het best benaderen met het woord “profielen” (Zie hoofdstuk 2.4.1).

De gesofisticeerde statistische modellen (logistische regressie) waarop deze bepalingen in

de US steunden, benevens de precisiegraad waarmee zij publiekelijk gerapporteerd werden

zoals bijvoorbeeld in Pennsylvanië315;414, verleenden aan deze profielen een overdreven

aura van wetenschappelijke nauwkeurigheid.392 In werkelijkheid zijn de beschikbare

gegevens en methodes niet volmaakt, zijn ze onderhevig aan uiteenlopende interpretaties

en zijn ze vaak te technisch om voor de gewone leek volledig vatbaar te zijn.392


157

Belangrijke redenen voor bekommernis zijn: 1) de inherente beperkingen van risico-

predictie modellen op patiëntenniveau, 2) het onvermogen van profielen om de statistische

onzekerheid van hun resultaten voldoende en adequaat weer te geven, 3) het gelijktijdig

meervoudig toetsen, 4) het geen rekening houden met correlatie binnen zorgeenheden en

over de tijd, en 5) het gebruik van niet-adequate maatstaven en

risicocorrectie.275;283;313;392;423;456

Logistische regressie modellen op patiëntenniveau – maar ook Bayesiaanse of neurale

netwerken - berusten op een niet-exacte benadering van de complexiteit van biologische

processen.392;423 Niet-verklaarde variatie is in belangrijke mate aanwezig omwille van

risicofactoren die niet werden opgenomen in het risicoalgoritme of omwille van het

herleiden van complexe ziektetoestanden tot dichotome of discrete variabelen met een

verlies aan predictief vermogen.191;289;392;423;457

Ook de performance van deze modellen is niet maximaal. Hun discriminatoir vermogen

kan bijvoorbeeld als goed bestempeld worden maar niet als perfect: typisch ligt de C-index

voor CABG-sterfte in een spreidingsbreedte van 0,76 tot 0,82 wat kan leiden tot een niet-

correcte risicobepaling voor vele patiënten. Ongekende predictoren zijn hiervoor de

waarschijnlijke verklaring.392 Gegeven de argwaan van artsen ten aanzien van de gebruikte

risicocorrecties274 leek het geraadzaam hen eraan te herinneren dat statistische modellen

even goed of zelfs beter zijn in het voorspellen van uitkomsten dan klinische experts.289

Vermits het aantonen van variabiliteit tussen zorgverleners en het bepalen van outliers de

hoofdbedoelingen zijn van profielen, dient met de verschillende componenten van de

variabiliteit rekening gehouden te worden. Variabiliteit tussen zorgverleners kan

voortspruiten uit 1) systematische patiëntenverschillen ten gevolge van gemeten of

ongemeten co-morbiditeit, 2) stochastische variabiliteit, of 3) werkelijke verschillen in

zorgenkwaliteit. Meestal echter werd, voor het opstellen van profielen, een logistische

regressie, die geen rekening houdt met correlatie, gebruikt met als gevolg een

overschatting van systematische verschillen en een onderschatting van stochastische

variatie (extra-binomiale of extra-Poisson variatie399;443;444;458).275;392;423;459

Alleen wanneer de steekproeven groot genoeg zijn om de standaard fouten van de intra-

unit variabiliteit verwaarloosbaar te maken t.o.v. de inter-unit variabiliteit is deze


158

vertekening verwaarloosbaar. Maar dit is niet vaak het geval bij profielen, zeker wanneer

het over mortaliteit gaat.459

Een longitudinale benadering kan de intra-unit variabiliteit grotendeels opvangen én de

temporele evolutie weergeven.287;319;401;455 Ook bij deze benadering blijft een hiërarchische

modellering verkieselijk omdat op die manier rekening wordt gehouden met de

hiërarchische structuur, wat leidt tot meer precieze schatters.401;430

Derhalve vergen deze twee problemen: kleine aantallen en variabiliteit een speciale

aandacht. Kleine aantallen (ie met een verwachte frequentie van minder dan 10)423, een

vaak voorkomend gegeven bij sterfte318;459, vormen een probleem i.v.m. de bepaling van

betrouwbaarheidsintervallen. Hierbij gaat de vaak gebruikte benadering van de Poisson

verdelingen door de normaal verdeling niet op - met voornamelijk vals positieve outliers

bij de hoge mortaliteitscijfers – maar is de exacte bepaling van de

betrouwbaarheidsintervallen noodzakelijk.156;275;392;423;460;461 Verder is het gemiddeld

sterftecijfer niet de beste schatter van het “echt” onderliggend sterftecijfer maar wel de

“gekrompen” (“shrunken”) schatter bekomen via een hiërarchisch model.392;423

Daarenboven is de patiënt de eenheid van analyse in de gebruikte modellen en is de

eenheid van inferentie de zorgenverstrekker. Hoe geëigend zijn deze geaggregeerde

kengetallen? Als we wensen een onderscheid te maken tussen intrazorgverlener en

interzorgverlener variabiliteit, die zowel stochastische als systematische componenten

bevat, is dit onmogelijk door middel van de vaak gebruikte logistische regressie, die

hiermee geen rekening houdt. Hiërarchische of multilevel modellen daarentegen corrigeren

voor verschillen in steekproefgrootte door middel van shrinkage schatters, houden

rekening met clustering van de gegevens, maken op een adequate manier het onderscheid

tussen intra- en interzorgverlener variabiliteit, verhinderen het optreden van een

regression-to-the-mean462-466 vertekening, laten toe performance te toetsen aan medisch,

sociaal en economisch relevante standaarden (met waarden van het

betrouwbaarheidsinterval die substandaard en voorbeeldige zorg weerspiegelen) en kunnen

– in tegenstelling met de logistische regressie - in staat blijken in grote mate het probleem

te corrigeren van het meervoudig gelijktijdig toetsen, inherent aan

profileringen.76;104;275;286;392;423;425;428;430;452;459;467;468


159

Het probleem van het meervoudig gelijktijdig toetsen doet zich voor wanneer men

verschillende zorgverleners gaat vergelijken met een standaard. Past men voor één

vergelijking het klassieke 95%-betrouwbaarheidsinterval toe dan bedraagt de probabiliteit

van één vals alarm 5 op 100. Maar wanneer men twintig vergelijkingen maakt bedraagt de

kans op minstens één vals alarm 1- (1-.05)N of .642.469

Om de inflatie van fout positieven tegen te gaan bestaan er verschillende methodes die

gebaseerd zijn op de Bonferroni-procedure117;417;470-473, die er benaderend in bestaat de alfa

van het significantieniveau (gewoonlijk 0,05) te delen door het aantal toetsen dat men

wenst uit te voeren, wat echter een zeer conservatieve techniek is. Deze benadering is erop

gericht te behoeden voor een type I fout of het onterecht verwerpen van de nul hypothese,

maar de prijs die hiervoor betaald wordt is de type II fout, het onterecht niet verwerpen van

de nul hypothese, of zoals Rothman het formuleert: “Loont het de moeite de fout

positieven te doen dalen ten koste van een stijging van de fout negatieven?”473

Verder is het zo dat een Bonferroni-correctie de gelijktijdige vergelijkingen als

onafhankelijk van elkaar beschouwt wat tot een veel te conservatieve test leidt indien de

set vergelijkingen met elkaar gecorreleerd zijn.474-476 Het is daarom raadzaam beroep te

doen op minder conservatieve verfijningen op de Bonferroni zoals die van Holm en

Hochberg.477-480 Het is echter mogelijk door middel van bootstrap- en

permutatietechnieken, toegankelijk gemaakt voor een breder publiek via de MULTTEST

procedure van SAS481, rekening te houden met correlaties. Deze technieken zijn

alternatieven voor de Bonferroni-correctie en de erop geïnspireerde technieken.


160

3.3 METHODEN VOOR HET BEOORDELEN VAN KWALITEIT/PERFORMANCE

“The desire of health care payers for simple measures of hospital performance, conflicts

with the skepticism of health care providers about the validity and fairness of the

assessment process” 313

3.3.1 Rangorde, een aantrekkelijke maar vaak misleidende methode Op het eerste zicht lijkt het toekennen van een rang of “ranking” een aantrekkelijke

vergelijkingsmethode.394 Toch hebben we ze niet weerhouden. Rangen van instellingen

zijn uiterst onbetrouwbare statistische samenvattingen van performance en het is mogelijk

dat instellingen met kleinere aantallen gevallen ten onrechte “gestraft” of “beloond”

worden bij vergelijkingsoefeningen, waar aan de hand van bijkomende statistische analyse

het mogelijk kan zijn om de enkele instellingen te identificeren waarvoor verder onderzoek

de moeite loont. Verder zou elke puntschatter van een performance indicator altijd

vergezeld moeten zijn van een geassocieerde statistische maat van onzekerheid

(betrouwbaarheidsinterval) te wijten aan de steekproefvariabiliteit (“sampling

variability”).396

Het gerefereerde artikel396 gebruikt hiervoor de analyse van het succescijfer van klinieken,

die in vitro fertilisatie aanbieden, als een mooi voorbeeld (Figuur 1).

Figuur 1: Geschat cijfer van levende geboorten : mediaan en 95% BI van de rang van elk

ziekenhuis.

Bron: Marshall EC396


161

“Why use league tables at all? The main advantage is that they are easy to read. One can

see at a glance who is at the top and who is at the bottom. But if the information is both

high impact and misleading, poor decisions are made and the source loses credibility.”395

Vermits er bij het opstellen van profielen er steeds een “eerste” en een “laatste” is, ook al

is het verschil klinisch en of statistisch niet significant, kan dit, zeker indien er geen

rekening gehouden wordt met de case mix, een ziekenhuis of een arts ten onrechte

stigmatiseren.77;191;296;394;395;405;407;411

3.3.2. Schatting van het relatieve risico (RR) door middel van een logistische regressie In plaats van rangen toe te kennen, trachten we een methode uit te werken waarbij

kwaliteit centraal staat en die met standaard statistische software, routinematig uitgevoerd

kan worden. We trachten daarbij in eerste instantie een benchmark voor goede kwaliteit te

bepalen en ziekenhuizen met belangrijke kwaliteitsproblemen op te sporen, om hen, indien

de kwaliteit inderdaad ondermaats blijkt te zijn, te stimuleren de kwaliteit te verbeteren.

Onze aandacht gaat derhalve voornamelijk uit naar het identificeren van zowel

bovenmaatse als ondermaatse kwaliteit, m.a.w. naar outliers.

Vermits we alle Belgische ziekenhuizen daarop onderzoeken, doen we beroep op

zogenaamde fixed effects modellen en, omwille van de categorische antwoordvariabele, op

de logistische regressie. Zoals in sectie 3.1.1 vermeld, staat de theorie voor het bepalen van

outliers in linear mixed models overigens nog niet vast en is GEE hiervoor niet bedoeld.

Non-linear mixed models komen zeker niet in aanmerking omdat hier geen outliers kunnen

bepaald worden.

De logistische regressie is een elegante methode maar houdt geen rekening met correlatie

van de gegevens - hiervoor corrigeren we echter door “rescaling” (zie 3.1.2) - en kent ook

gemakkelijker een outlier status toe aan de hoogste waarden van de verdeling.275;392;461

Voor de resultaten op nationaal niveau voeren we naast de logistische regressie ook

analyses uit van het type Generalized Estimating Equations (GEE) 431;482-484 , die wel

rekening houden met correlatie van de gegevens.


162

Verder wordt er met de andere in 3.2 vermelde aandachtspunten zoveel mogelijk rekening

gehouden: we kozen eerst prioritaire problemen (belangrijke incidentie) als indicatoren en

doen omwille van de onvolmaakte risicocorrectie (zie voorbeeld hieronder) geen

uitspraken maar spreken van “screening”. Verder corrigeren we voor meervoudig

gelijktijdig toetsen door middel van de Bonferroni-correctie en verstrekken een anonieme

feedback aan de ziekenhuizen, Artsencolleges en het centrale beleid. Ook geven we de

graad van de bestaande evidentie aan en bieden hulp aan voor de interpretatie (sectie

3.3.6). Rekening houdend met de problemen van accuratesse en volledigheid van

administratieve gegevens, bepalen we daarenboven een zone van niet-interpretatie.100

In een optiek van het bepalen van een eerste benchmark (de bovenmaatse kwaliteit) en

vermits dit de eerste analyses zijn, trachten we verder zoveel mogelijk het voorkomen van

vals positieven te vermijden en gebruiken daarvoor de meest conservatieve techniek, de

Bonferroni-correctie.

Het is verder zo dat deze eerste, “data-driven” benchmark dient gezien te worden als een

eventueel beter vergelijkingspunt dan het nationale periodecijfer of trend in termen van

identificatie van ondermaatse kwaliteit en zelfevaluatie voor de ziekenhuizen.485 De keuze

van de uiteindelijk te gebruiken benchmark zal in overleg met de sector moeten gebeuren

in functie van wat haalbaar en wenselijk lijkt.485Benchmarks zoals het gemiddelde van de

beste performance voor tenminste 10 %van de bevolking werden voorgesteld.485

Door middel van de logistische regressie gaan we na of er in ziekenhuis ‘A’ een groter

risico bestaat op een mindere behandeling dan in het geheel der ziekenhuizen ‘A-Z’. We

illustreren dit aan de hand van het sterftecijfer van een hersenbloeding (Tabel 1). In

ziekenhuis ‘A’ sterven er 10 van de 100 patiënten met een hersenbloeding. Voor het geheel

der ziekenhuizen ‘A-Z’ is dit 100 op 2000.


163

Tabel 1: Relatief risico en odds ratio voor een overlijden t.g.v. een hersenbloeding in ziekenhuis A vergeleken met het geheel der ziekenhuizen Uitkomst Ziekenhuizen Totaal Uitkomst Ziekenhuizen Totaal

ZH ‘A’ ZH ‘A-Z’ ZH ‘A’ ZH ‘A-Z’

Dood A B A+B Dood 10 100 110

Levend C D C+D Levend 90 1900 1990

Totaal A+C B+D N Totaal 100 2000 2100

Hier kan het relatief risico (RR) gemakkelijk als volgt berekend worden:

1) berekenen van het sterftecijfer: 10/100 = 10% voor ZH ‘A’ en 100/2000 = 5%

voor het geheel der ziekenhuizen ‘A-Z’,

2) de ratio berekenen van deze cijfers = RR = 2.

In deze tabel wordt het relatief risico (RR) als volgt berekend: RR= (A/A+C)/(B/B+D) en

de odds ratio (OR) als: OR= (A/C)/(B/D).

Indien men nu rekening wenst te houden met ernst en co-morbiditeit is deze eenvoudige

methode niet langer mogelijk en maakt men gebruik van de logistische regressie, die het

RR schat via de OR. Deze is gelijk aan (A/C)/(B/D), - in ons voorbeeld OR = 2.11 - een

overschatting van het werkelijke relatief risico. Zolang het gezondheidsverschijnsel dat we

bestuderen relatief klein is (t.t.z. < 10%, bijvoorbeeld mortaliteit) en de 0.5 <OR< 2.5, is

de odds ratio een goede tot behoorlijke schatter van het gezochte relatief risico.

In de andere gevallen schatten we het RR, vertrekkend van de resultaten van de logistische

regressie via de formule RRZ= OR/(1-P0)+(P0*OR)), waarbij P0 staat voor de bestudeerde

uitkomst in de niet-blootgestelde groep, in ons voorbeeld respectievelijk mortaliteit en ZH

‘A-Z’.486 95% betrouwbaarheidsintervallen kunnen berekend worden en bedragen

respectievelijk 1.08, de ondergrens, en 3.21, de bovengrens, voor het RRZ en 1.00 en 4.33

voor de OR.486


164

Deze betrouwbaarheidsintervallen geven de mate van onzekerheid aan in de schatting van

de RRZ of OR.487 en laten toe vast te stellen hoe groot het effect, de RRZ of OR, is - het

belangrijkste aandachtspunt - en of het al dan niet statistisch significant is.

Een ondergrens ≥ 1 geeft aan dat de RRZ/OR groter is in ZH ‘A’ dan in de andere

ziekenhuizen, en een bovengrens ≤ 1 geeft het omgekeerde aan.

Een betrouwbaarheidsinterval biedt overigens bescherming tegen de misinterpretatie van

niet-significante resultaten in kleine studies, waar door onvoldoende statistische power een

werkelijk effect niet aangetoond kan worden.488;489 Daarentegen geeft een p-waarde alleen

aan of een bevinding statistisch significant is of niet, en geeft geen indicatie betreffende de

grootte van het bestudeerde effect, maar biedt anderzijds hulp om niet al te vlug een grote

puntschatter in kleine studies als belangrijk te gaan interpreteren. Vooraanstaande

tijdschriften zoals het “British Medical Journal”, “The Lancet”, het “American Journal of

Public Health”, en het “International Journal for Quality in Health Care” vragen dat de

voornaamste resultaten van een studie meegedeeld worden met

betrouwbaarheidsintervallen, en wordt deze zienswijze gedeeld door het “Committee of

Medical Journal Editors.”460;490 Een p-waarde kan vervolgens aan het

betrouwbaarheidsinterval toegevoegd worden. Wij berekenden hiervoor een Wald toets,

gebaseerd op RRZ en zijn standaard fout.441;491;492

Een Bayesiaanse aanpak is een interessant alternatief voor de hier voorgestelde methode.

3.3.3. Meervoudig gelijktijdig toetsen Wanneer we in een groep ziekenhuizen de performance van elk ziekenhuis vergelijken met

het gemiddelde van die ziekenhuizen, stelt zich het probleem van het meervoudig

gelijktijdig toetsen met als gevolg een sterke stijging van het aantal vals positieven (VP).

Om dit effect tegen te gaan passen we de Bonferroni-correctie313;474-476;480 toe, waarbij de

alfa van de gebruikte toets gedeeld wordt door het aantal gelijktijdige vergelijkingen, hier

het aantal ziekenhuizen. Het nadeel hiervan is het optreden van vals negatieven (VN) of

het ten onrechte niet vaststellen van een werkelijk verschil.

We verstrekken daarom twee types betrouwbaarheidsintervallen waarbinnen de

vermoedelijke performance van het ziekenhuis zich bevindt: een zeer ruim interval met


165

Bonferroni-correctie (weinig VP maar meer VN) dat moet toelaten ziekenhuizen met zeer

vermoedelijk bovenmaatse of ondermaatse kwaliteit te identificeren en een nauwer interval

zonder Bonferroni-correctie (minder VN maar meer VP) dat aangeeft dat er een kans

bestaat dat het ziekenhuis eerder ondermaats of bovenmaats presteert. Het ruime interval

(Bonferroni) dient tot een meer diepgaand onderzoek te leiden indien de puntschatter van

het betrouwbaarheidsinterval zich buiten de zone van niet-interpretatie bevindt (zie sectie

3.3.7). Het nauwere interval (95 % BI) tracht aan het ziekenhuis een gevoeliger

aanknopingspunt te verschaffen voor zelfanalyse en eventuele actie.

3.3.4 Risicocorrectie Bij het uitvoeren van de logistische regressie trachten we rekening te houden met de ernst

van de aandoening en co-morbiditeit (risicocorrectie).105 Volgende figuren illustreren dat

statistische significantie m.b.t. over- of ondermortaliteit ook functie is van de gebruikte

risicocorrectie. Wij presenteren hier de positieve of negatieve “afwijking” ( afwijking =

RRZ –1, uitgedrukt onder vorm van een percentage) van de ziekenhuizen t.o.v. het

nationale gemiddelde. In deze figuren worden significant afwijkende ziekenhuizen

gevisualiseerd door de weergave van hun anoniem ziekenhuisnummer. Volgende

risicocorrecties werden doorgevoerd: figuur 2:geen; figuur 3: leeftijd en geslacht; figuur 4:

leeftijd, geslacht en severity of illness (SOI); figuur 5: leeftijd, geslacht en risk of mortality

(ROM); figuur 6: leeftijd, geslacht en Charlson’s comorbidity index, zoals toegepast door

D’Hoore (drie digit ICD-9-CM codes) (Tabel 2).325;326;493

Uit de figuren blijkt dat in functie van de gebruikte correctie de afwijking en eventueel de

significantie van de afwijking veranderen. Voor ZH 54 bijvoorbeeld bedraagt de afwijking

ongeveer + 110 indien er 1) geen risicocorrectie uitgevoerd wordt, of 2) er gecorrigeerd

wordt voor leeftijdsgroep en geslacht. In deze gevallen is de afwijking niet alleen

belangrijk wegens zijn omvang maar ook statistische significant na een Bonferroni

correctie. Daarentegen indien er gecorrigeerd wordt voor leeftijd, geslacht en 1) Severity

of Illness (SOI), of 2) Risk of Mortality (ROM), of 3) Charlson daalt de afwijking tot

ongeveer + 70 en is het niet langer significant bij Bonferroni correctie.

Voor ZH 77 zien we een omgekeerd beeld, behalve wanneer we corrigeren voor leeftijd,

geslacht en Charlson. Dit fenomeen van veranderende significanties gaat, bij toenemende


166

risicocorrectie, vaak in de richting van een verminderende interziekenhuis

variabiliteit.101;189;329;331

Naast leeftijd en geslacht kozen we de Charlson comorbidity index voor de risicocorrectie

in deze studie. Deze index is gebaseerd op ICD-9-CM codes waarover we in de MKG

beschikken en houdt minder dan SOI en ROM rekening met verwikkelingen die optraden

tijdens het ziekenhuisverblijf. SOI en ROM kunnen dus eventueel mindere kwaliteit

reflecteren, hiervoor corrigeren leidt dan tot overadjustment.188;196;197;494

De risicocorrectie met de Charlson’s comorbidity index leidt in het heupfractuur voorbeeld

tot het verdwijnen van alle significantie t.o.v. het nationale gemiddelde. Dit neemt niet

weg dat er tussen ziekenhuizen significante verschillen bestaan: wanneer anoniem

ziekenhuis 45 als vergelijkingsbasis genomen wordt i.p.v. het nationale gemiddelde zijn er

11 ziekenhuizen die significant verschillen met p <0,0001 wat beduidend kleiner is dan de

Bonferroni-drempel van p =0,000439.

Figuur 2: Afwijking van de intramurale letaliteit (in %), per ziekenhuis, ten opzichte van het nationale gemiddelde na een opname voor heupfractuur, geen risicocorrectie.


167

Tabel 2: Charlson’s comorbidity index (naar D’Hoore)

Punten Nevendiagnosen ICD-9-CM codes

1 Myocardinfarct 410

Hartinsufficiëntie 398, 402, 428

Aandoeningen van de perifere

bloedvaten

440 – 447

Cerebro-vasculair accident 430 – 433, 435

Dementie 290, 291, 294

Chronische pulmonaire aandoeningen 491 – 493

Systeemziekten 710, 714, 725

Gastro-duodenaal ulcus 531 – 534

Minder ernstige leverziekten 571, 573

2 Hemiplegie 342, 434, 436, 437

Nierziekten 403, 404, 580 – 586

Diabetes 250

Tumoren 140-195

Leukemie 204 – 208

Lymfomen 200, 202, 203

3 Ernstige leverziekten 070, 570, 572

6 Metastasen 196 – 199

Voor een eerste analyse over performance / kwaliteitsindicatoren opteerden we er voor het

nationale gemiddelde als referentiepunt te nemen, dat later in het licht van de toetsing van

de screening aan de werkelijkheid aangepast kan worden.


168

Figuur 3: Afwijking van de intramurale letaliteit (in %), per ziekenhuis, ten opzichte van het nationale gemiddelde na een opname voor heupfractuur, risicocorrectie voor leeftijd en geslacht.

Figuur 4: Afwijking van de intramurale letaliteit (in %), per ziekenhuis, ten opzichte van het nationale gemiddelde na een opname voor heupfractuur, risicocorrectie voor leeftijd, geslacht en SOI


169

Figuur 5: Afwijking van de intramurale letaliteit (in %), per ziekenhuis, t.o.v. het nationale gemiddelde na een opname voor heupfractuur, risicocorrectie voor leeftijd, geslacht en ROM

Figuur 6: Afwijking van de intramurale letaliteit (in %), per ziekenhuis, ten opzichte van het nationale gemiddelde na een opname voor heupfractuur, risicocorrectie voor leeftijd, geslacht en Charlson’s comorbidity index.


170

3.3.5 Type van uitgevoerde analyses Bij de analyse van een indicator komen er twee aspecten aan bod: een periodeaspect en

een evolutie-over-de-tijd aspect (de trend).

Door middel van het periodeaspect gaan we na of er ziekenhuizen zijn, die over gans de

beschouwde periode samen genomen en vergeleken met al de andere ziekenhuizen

significant meer of minder processen of uitkomsten van een bepaald type uitvoeren

respectievelijk registreren.

Door middel van het evolutieaspect gaan we na of er ziekenhuizen zijn, die over de tijd

(per semester/jaar) en vergeleken met al de andere ziekenhuizen significant meer of minder

processen of uitkomsten van een bepaald type gaan uitvoeren of registreren. Het is niet

eenvoudig een trendanalyse te interpreteren wanneer het aantal observaties per semester

klein is (bvb. in geval van mortaliteit) en daarenboven dient men rekening te houden met

het fenomeen van de in sectie 3.2 vermelde “regression towards the mean”.

De twee types van analyse zijn complementair. Het periodeaspect is preciezer want

gebaseerd op grotere aantallen maar is terzelfder tijd meer blootgesteld aan bias omwille

van patiëntenselectie en differentiële kwaliteit van de gegevens.313;355;355 Het evolutieaspect

daarentegen is minder precies maar minder gevoelig voor bias: het is weinig waarschijnlijk

dat patiëntenselectie en gegevenskwaliteit in belangrijke mate gaan veranderen in een

korte tijdsspanne. Wel dient er rekening gehouden te worden met een mogelijk fenomeen

van “regression to the mean”.

3.3.6 Hulp bij de interpretatie De bedoeling van de analyse is het aanreiken van elementen ter verbetering van de

kwaliteit van zorgen binnen het ziekenhuis en niet het “shame and blame of

individuals”.495;496

Vooraleer uitspraken te doen over de vermoedelijke kwaliteit van de zorgen dient men na

te gaan of codeerproblemen niet de verklaring zijn van de voorgestelde resultaten.

Indien er zich geen belangrijke codeerproblemen voordoen, stellen we volgende werkwijze

voor. Neem de omvang van de afwijking als aanknopingspunt voor de interpretatie.

Vooralsnog nemen we her nationale gemiddelde als “benchmark” waarmee de afwijking


171

van de individuele ziekenhuizen wordt vergeleken. Verder stellen we voor eerst aandacht

te besteden aan het periodeaspect en nadien aan het evolutieaspect (trend).

Wegens de inherente beperkingen van administratieve gegevens lijkt het voorzichtig geen

“uitspraak” te doen indien de afwijking voor de periode zich tussen + 35% en - 25%

bevindt100, een zone van niet-interpretatie, en bij dergelijke waarden eerder aandacht te

besteden aan het implementeren van “Algemene maatregelen” (zie verder).

Indien de afwijking groter is dan + 35% of kleiner dan – 25% stellen we voor de

beschikbare evidentie om tot een outlying ziekenhuis te besluiten als volgt te omschrijven:

1. sterk: indien de probabiliteit om een afwijking te vinden met een waarde,

gelijk aan de waarde van het beschouwde ziekenhuis, die kleiner of gelijk is

aan 0,05/aantal vergeleken ziekenhuizen (significant na Bonferroni correctie),

2. matig: indien de probabiliteit om een afwijking te vinden met een waarde,

gelijk aan de waarde van het beschouwde ziekenhuis, die kleiner of gelijk is

aan 0,05 maar groter dan 0,05/aantal ziekenhuizen,

3. zwak: indien de probabiliteit om een afwijking te vinden met een waarde,

gelijk aan de waarde van het beschouwde ziekenhuis, die groter is dan 0,05.

Voor de trendanalyse volgen we een gelijkaardige benadering. Hier stellen we echter voor

1) alleen een uitspraak te doen indien de omvang van de afwijking voor de trend groter is

dan + 5% of kleiner is dan – 5%, en 2) rekening te houden met het fenomeen van

“regression to the mean”464 , indien de omvang van de afwijking voor de periode groter of

gelijk is aan + 5% of kleiner of gelijk is aan –5%.

Wij trachten bij de interpretatie te helpen door ziekenhuizen met zowel potentieel

bovenmaatse als met potentieel ondermaatse kwaliteit te identificeren. Voor beide

extremen wordt een externe audit aanbevolen om uit te maken of het gaat over een

werkelijk (on)gunstige toestand. Verder wordt, in functie van de graad van de aanwezige

evidentie, interne audit aanbevolen of ter overweging aangeboden. In alle gevallen worden

“Algemene maatregelen” aanbevolen zoals het opvolgen van richtlijnen en protocollen, en

het scheppen van een verbeteringsklimaat. Dit bestaat uit sterk en gedreven leiderschap,

duidelijke organisatorische verantwoordelijkheid m.b.t. kwaliteit, het toekennen van de


172

nodige middelen voor verbeteringsactiviteiten, klinische audit en zorgvuldige monitoring

van vooruitgang en impact.496-498

De beslisboom voor de interpretatie wordt als “Bijlage 1” in hoofdstuk 5, sectie 5.2

verstrekt.

3.3.7 Trend Simulatie Voor het periode aspect van de analyse hadden we in de literatuur een aanknopingspunt

voor het bepalen van een zone van niet-interpretatie. Voor het trend aspect hadden we dat

niet.

We hebben ons derhalve zeer voorzichtig opgesteld. Een kleine simulatie (Tabel 3) waarbij

afwisselend een bovengrens en ondergrens van een zone van niet interpretatie voor de

trend worden verstrekt geeft aan hoe groot de reële “toegelaten” afwijking wordt bij een

trend van 5%, 4%, 3% en 2% boven en onder de nationale trend. Onze gebruikte 5% is

werkelijk zeer tolerant.

Tabel 3: Trend: simulatie van de invloed van de waarde van de toegestane afwijking (in %) op de boven- en ondergrens van de zone van niet-interpretatie.

5% 4% 3% 2%

OG BG OG BG OG BG OG BG

Semester 1 1,05 0,95 1,04 0,96 1,03 0,97 1,02 0,98

Semester 2 1,10 0,90 1,08 0,92 1,06 0,94 1,04 0,96

Semester 3 1,16 0,86 1,12 0,88 1,09 0,91 1,06 0,94

Semester 4 1,22 0,81 1,17 0,85 1,13 0,89 1,08 0,92

Semester 5 1,28 0,77 1,22 0,82 1,16 0,86 1,10 0,90

Semester 6 1,34 0,74 1,27 0,78 1,19 0,83 1,13 0,89

Semester 7 1,41 0,70 1,32 0,75 1,23 0,81 1,15 0,87

Semester 8 1,48 0,66 1,37 0,72 1,27 0,78 1,17 0,85


173

3.4 BESLUIT

De gevolgde methodologie is een eerste benadering. De opvolging van deze screening zal

moeten uitwijzen in welke mate de ziekenhuizen die vermoedelijk outliers zijn dat ook

werkelijk zijn.

Het valt te verwachten dat de grenzen van de zone van niet-interpretatie voor het trend

aspect moeten herzien worden, want te weinig gevoelig.

De huidige benchmark bepaling heeft als voornaamste objectief een zinvolle screening

mogelijk te maken, waarbij het nationale periodecijfer of trend niet noodzakelijk een ideaal

instrument zijn. De keuze van de uiteindelijk te gebruiken benchmark zal in overleg met de

sector moeten gebeuren in functie van wat haalbaar en wenselijk lijkt.

Het is daarbij belangrijk dat de overheid de nodige middelen ter beschikking stelt en de

anonimiteit van de ziekenhuizen opheft voor een visitatie door uit en door de sector

erkende experts.

DEEL II: CASUSSEN

177

Hoofdstuk 4: Kwaliteit van administratieve gegevens in België:

overlijdensstatistieken en MKG

Na in hoofdstuk 1 een referentiekader uitgewerkt te hebben voor het beoordelen van

administratieve gegevens, passen we het hier toe op de kwaliteit van de gegevens van de

Overlijdensstatistieken en de Minimaal Klinische Gegevens. De bedoeling van dit

onderzoek was na te gaan in welke mate deze gegevens bruikbaar zijn voor de

beleidsvoering en hoe deze bruikbaarheid kan verhoogd worden.

4.1 KWALITEIT VAN CODERING EN CERTIFICATIE IN VLAANDEREN EN BELGIË, 1980-

1997.

We vatten hier het werk samen dat we uitgevoerd hebben tussen 1988 en 2004. Meer

uitgebreide versies werden elders gepubliceerd.20;21;33;34;36;120;499-505

Vertrekkend van de vaststelling dat het geïnformatiseerd controleprogramma, dat in België

gebruikt werd voor het nagaan van de codeerkwaliteit, slechts een beperkte predictieve

waarde had, hebben we een codeervergelijking doorgevoerd met het WGO

referentiecentrum van Parijs, waaruit duidelijk de beperkingen van onze codering bleken.

Op basis van deze ervaring, van de uitgevoerde kwaliteitscontroles op de gegevens met

feedback en discussie naar de codeurs toe (1988-1993) en het informatiseren van de WGO

codeerregels werd geleidelijk aan het controleprogramma verder ontwikkeld (1993-1997).

Naast de codeerproblematiek hebben we ook de kwaliteit van de certificering onderzocht

en meegewerkt aan het conform maken van de Belgische certificaten aan de WGO

modellen.

Het inzetten van een gecentraliseerd en opgeleid codeerteam in 1993 en dit initiële werk

leidden tot een progressieve verbetering van de codeerkwaliteit. Dit vond onder meer een

neerslag in volgende publicaties20;120;500:

- Aelvoet W, Humblet PC, Lagasse R. Het in routine gebruikmaken van een

geïnformatiseerd controleprogramma als middel tot kwaliteitsbewaking van de statistieken

van de burgerlijke stand in Vlaanderen. Arch Public Health 1991;49:1-8.

- Aelvoet W. Mortaliteitsstatistieken voor een gezondheidsbeleid. In: Nijs H, Denekens J,

editors. Preventieve Gezondheidszorg.Diegem Editorial: Kluwer; 1997. p. 914-21.

Hoofdstuk 4: Kwaliteit van administratieve gegevens in België 178

- Aelvoet W, Molenberghs G, van Sprundel M. Mortality Statistics in Belgium 1980-1997:

Quality of coding. Arch Public Health 2005;63(2):127-48.

Een verdere neerslag was een master thesis36 en een aantal rapporten21;33;34;499;501-503. Naast

de beperkingen op gebied van de kwaliteit van de gegevens hebben we ook andere

beperkingen van de overlijdensstatistieken, waaronder het gebrek aan bruikbare sociaal-

economische gegevens, verkend en gepubliceerd.504;505

4.1.1 Codering 4.1.1.1 Inleiding

De doodsoorzakenstatistieken zijn in België, zoals in andere landen, een zeer belangrijke

informatiebron voor de volksgezondheid.4;35;207;208;227;246;506

Hoewel deze statistieken, op enkele perinatale randgevallen na, als exhaustief kunnen

beschouwd worden, is hun accuratesse beperkt zoals onder meer bleek uit de vergelijking

van overlijdenscertificaten met medische dossiers of autopsiebevindingen.203;243;244;507;508

Zowel nationale als internationale verschillen in sterftepatronen werden onder meer op

gebied van vaatziekten, neoplasmata en diabetes aangetoond.235;509-515De interpretatie van

die verschillen was echter moeilijk wegens verschillen in certificering- en

coderingpraktijken, en dit ondanks het bestaan van internationaal geldende regels voor

certificering en codering.211;238-242;516Voor ons land bijvoorbeeld werden er in vergelijking

met andere Europese landen zowel verschillen in certificering als codering

vastgesteld.238Ook de vergelijking van de mortaliteit t.g.v. een acuut myocardinfarct in de

doodsoorzakenstatistiek en in de “Multinational Monitoring of Trends and Determinants

in Cardiovascular Diseases (MONICA)” registratie toonde een belangrijk probleem van

misclassificatie van ischemische hartziekten aan.165

Het gebruik van een van het WGO model27 afwijkend certificaat (Figuur 1), het tot 1993

gedecentraliseerd coderen, en de voormelde vastgestelde coderingen

certificeringproblemen zetten ons er toe aan de codeerkwaliteit verder te onderzoeken.

Voor de evolutie van de codeerkwaliteit in Vlaanderen is het niet onbelangrijk de

oprichting in 1993 te vermelden van een centraal codeerteam, dat bestaat uit

Hoofdstuk 4: Kwaliteit van administratieve gegevens in België

179

Figuur 1: Het Belgisch Certificaat en het WGO-model


medewerkers van de Vlaamse Vereniging voor Respiratoire Gezondheidszorg en

Tuberculose bestrijding (VRGT).

Het Belgische certificaat, dat geldig was tijdens de ganse studieperiode (1980-1997), week

in belangrijke mate af van het internationaal model. Het stelde in principe slechts ruimte

ter beschikking voor het invullen van een oorspronkelijke en een onmiddellijke doods-

oorzaak, hoewel er in de praktijk soms meerdere doodsoorzaken ingevuld werden.33 In

figuur 1 worden ter vergelijking het toenmalige Belgische certificaat en het WGO-model

nogmaals afgebeeld. Het is evident dat ons certificaat een adequate rapportering van een

ingewikkelde causale keten niet echt vergemakkelijkte.

4.1.1.2 Materiaal en methoden De voor de codering gebruikte ICD-9 classificatie bestaat uit 17 hoofdstukken en een

bijkomende classificatie voor uitwendige oorzaken. Zij is verder opgedeeld in een aantal

onderhoofdstukken, die een aantal verwante aandoeningen groepeert. Aan elke aandoening

wordt een code toegekend bestaande uit drie of vier digits, waarbij de vierde digit vaak een

verdere verfijning is van een in drie digits weergegeven aandoening. Zo staat 157 voor

pancreaskanker en 157.0 voor kanker van de pancreaskop.

Om de internationale vergelijkbaarheid te bevorderen bevat de ICD-classificatie in de

secties “Regels” en “Noten” een aantal richtlijnen over de manier waarop de

oorspronkelijke doodsoorzaak dient geselecteerd te worden.231

Op deze “Regels” en “Noten” hebben wij ons gebaseerd om vier codeeroefeningen uit te

voeren. Hierbij werden de codeerfouten als volgt geklasseerd: 0: totale overeenkomst

tussen coderen en hercoderen; 1: fout ter hoogte van de vierde digit; 2: fout ter hoogte van

de derde digit; 3: fout ter hoogte van een onderhoofdstuk; en, 4: fout ter hoogte van een

hoofdstuk. Tabel 1 geeft hier een voorbeeld van.

Volgens de Belgische wetgeving dienen de geboorte- en overlijdenscertificaten vernietigd

te worden zodra het verificatieproces van de certificaten afgesloten is. Een belangrijk

onderdeel van dit proces is het toetsen van de aan de medische gegevens toegekende codes

aan de richtlijnen van de ICD-classificatie. Dit houdt in dat na het beëindigen van dit


181

proces alleen gecodeerde medische gegevens beschikbaar zijn en dat men niet langer een

directe vergelijking tussen certificaat en geregistreerde doodsoorzaak kan maken.

Een eerste oefening had als doel de predictieve waarde van het nationale, geautomatiseerde

controleprogramma na te gaan, dat de codes en/of anthropometrische waarden van de

geboorte- en overlijdenscertificaten verifieert. Van de 10.679 nog niet-vernietigde

certificaten van de maand maart 1987 werden er door het programma 122 codes als “na te

kijken” opgegeven en verder 178 anthropometrische waarden, die we hier verder buiten de

bespreking laten. We gingen na of de 122 als fout bestempelde codes inderdaad fout

waren. Om een idee te krijgen over de negatieve voorspellende waarde van het

programma, werd ook de accuratesse van de niet gewraakte codes nagegaan. Hierbij was

het mogelijk alle codeerregels en -noten te toetsen.

Een tweede codeeroefening voerden we uit in samenwerking met het Parijse WGO

referentiecentrum op een systematische steekproef van 566 nog niet vernietigde

certificaten van het jaar 1988. Ook hier konden alle codeerregels en -noten getoetst

worden.

Bij het inzetten van een Vlaams gecentraliseerd codeerteam in 1993 werd een derde

codeeroefening uitgevoerd. Ditmaal werden in een systematische steekproef van 704

certificaten, gecodeerd door provinciale codeurs van de gezondheidsinspecties in 1989-

1990 en blind hergecodeerd door het nieuwe team in opleiding, de toegekende codes

vergeleken met een referentiecode, die met alle codeerregels en –noten rekening hield.

Voor een vierde codeeroefening bezorgden het Nationaal Instituut voor de Statistiek en de

Administratie Gezondheidszorg van het Ministerie van de Vlaamse Gemeenschap ons de

mortaliteitsgegevens voor België voor de jaren 1980-1997 over personen van tenminste

één jaar oud. Per individu werden het geslacht, de leeftijdsgroep (minder dan 25 jaar, 25-

64 jaar en 65 jaar en meer), de woonplaats, de gecodeerde oorspronkelijke en

onmiddellijke doodsoorzaken verstrekt. Hier was uiteraard slechts een partiële toetsing van

regels en noten mogelijk. Zij beperkte zich tot een beoordeling van de mate waarin een

aantal codeerregels opgevolgd werden, die bepalen hoe de oorspronkelijke doodsoorzaak

moet gekozen worden.


182

Belangrijke oorzaken voor het ontstaan van codeervertekeningen zijn het niet toepassen

van de regels in verband met “Senilitas”, “Slecht gedefinieerde aandoeningen”, en de

zogenaamde “linkage” regel. Deze laatste stelt dat een doodsoorzaak, aanvankelijk geko-

zen als oorspronkelijke doodsoorzaak, in welomschreven gevallen uiteindelijk niet als

oorspronkelijke doodsoorzaak weerhouden wordt. Wanneer de certificerende arts bvb.

atherosclerose (ICD-9: 440) als oorspronkelijke doodsoorzaak opgeeft en hartinfarct (ICD-

9:410) als onmiddellijke, wordt door toepassing van de regel het hartinfarct weerhouden

als oorspronkelijke doodsoorzaak en wordt de atherosclerose als bijkomende geregistreerd.

Na de voormelde Regels en Noten van de classificatie geprogrammeerd te hebben was het

vervolgens mogelijk de gepubliceerde statistieken hieraan te toetsen en een

“gecorrigeerde” versie te produceren, die ermee in overeenstemming was gebracht.

Tenslotte vergeleken we de “gepubliceerde” met de “gecorrigeerde” versie.

Voor deze oefening voerden we voornamelijk grafische analyses uit, aangevuld met een

meer formele statistische benadering om op een synthetische manier de determinanten van

codeerfouten weer te geven benevens evoluties in de tijd, en conclusies te kunnen trekken

over onze nationale en regionale statistieken. We gebruikten hiervoor een multinomiaal

logistisch regressie model.517Hierbij groepeerden we, wegens de kleine aantallen, de

leeftijdsgroepen van minder dan 25 jaar en die van 25-64 jaar en corrigeerden voor

“overdispersion” ten gevolge van correlatie van de gegevens.484

Om de performance van de geprogrammeerde foutendetectie te beoordelen pasten we de

geprogrammeerde foutendetectie ook toe op het bestand, dat we gebruikten voor de

vergelijking tussen Vlaanderen en het WGO referentiecentrum. Vermits de

geprogrammeerde foutendetectie alleen fouten kan opsporen als de gecodeerde

onmiddellijke doodsoorzaak verschilt van de gecodeerde oorspronkelijke doodsoorzaak,

analyseerden we hier ook de “subset” van gegevens waarin meer dan één doodsoorzaak

gecodeerd was.


Tabel 1: Classificatie van codeerfouten.

Originele codering Hercodering Classificatie van een codeerfout

Onmiddellijke doodsoorzaak

Beschrijving Oorspronkelijke doodsoorzaak

Beschrijving Oorspronkelijke doodsoorzaak

Beschrijving

198.3 Secundair kwaadaardig neoplasma van de hersenen

162.0 Trachea kanker 162.0 Trachea kanker 0

036.0 Meningokokken meningitis

036.2 Meningokokken septicemie

036.0 Meningokokken meningitis

1

410.x Acuut myocard infarct

413.x Angina pectoris 410.x Acuut myocard infarct

2

304.9 Drugsverslaving 292.9 Drugspsychose 304.9 Drugsverslaving 3 571.2 Levercirrose 303.x Alcoholafhankelijkheid 571.2 Levercirrose 4


4.1.1.3 Resultaten Predictieve waarde van het geautomatiseerd controleprogramma.

Van de 122 als fout bestempelde codes bleken er 109 ook fout, of een positieve predictieve

waarde van 89%. Daarenboven bleken er zich in deze groep certificaten nog 122

codeerfouten te bevinden, die niet door het programma als verdacht gesignaleerd waren.

Niet alleen waren deze door het programma niet-gedetecteerde fouten talrijker maar ook

ernstiger (RR:1,35 [95% BI: 1,06;1,72]) dan de gedetecteerde fouten (Tabel 2).

Tabel 2: Ernstigheidsgraad en frequentie van de gedetecteerde en niet-gedetecteerde fouten

Foutentype Ernstigheidsgraad

3 of 4 1 of 2 Totaal

Gedetecteerd 51 58 109

Niet-gedetecteerd 77 45 122

Vergelijking Vlaanderen versus WGO Referentie centrum

De vergelijking tussen Vlaanderen en het WGO Referentie centrum brengt een groot

aantal belangrijke codeerfouten aan het licht: in ¼ van de gevallen betrof het een fout op

het niveau van hoofdstuk of onderhoofdstuk (Tabel 3). Vooral in de hoofdstukken van de

symptomen (overschatting) en uitwendige oorzaken (onderschatting) werden heel wat

codeerfouten aangetroffen.36In de onderhoofdstukken bleken voornamelijk arteriosclerose

en “andere respiratoire aandoeningen” overschat en bleken de hartvaatziekten (zonder

arteriosclerose) onderschat.


185

Tabel 3:Verschil tussen de oorspronkelijke (Vlaanderen) en referentie (WGO Frankrijk) codering. Vlaanderen 1988.

Verschil Frequentie Percent

Geen 315 55,7

4e digit 36 6,4

3e digit 74 13,1

Onderhoofdstuk 66 11,7

Hoofdstuk 75 13,3

Totaal 566 100.0

Vergelijking van provinciale codeurs met de vier leden van een centraal team

Uit deze vergelijking blijkt duidelijk dat de leden van het nieuw codeerteam significant

minder fouten maakten dan de provinciale codeurs (Tabel 4). Wanneer we de leden van het

nieuwe team onderling vergeleken waren de codeerverschillen niet langer significant.

Tabel 4:Vergelijking van provinciale codeurs met de vier leden van een centraal team m.b.t. de coderingsprecisie, uitgedrukt als verschil t.o.v. een referentiecode. Verschil Provinciaal VRGT A VRGT B VRGT C VRGT D Geen 432 (- 5,9) 598 (+1,0) 629 (+2,3) 595 (+0,9) 614 ( +1,7)4e digit 42 (+2,5) 28 (-2,1) 18 (-2,0) 28 (- 0,1) 28 (- 0,1)3e digit 81 (+9,4) 22 (-1,4) 11 (-3,4) 23 (- 1,2) 12 (- 3,3)Onderhoofdstuk 42 (+3,7) 22 (-0,4) 14 (-2,0) 23 (- 0,2) 19 (- 1,0)Hoofdstuk 107 (+8,6) 34 (-2,0) 32 (-2,3) 35 (- 1,9) 31 (- 2,4)Totaal 704 704 704 704 704 ( ) Vierkantswortel van de celbijdrage tot de chi-kwadraat toets: waarde = 279.983 voor 16 df., met prob. < 0.001

Evolutie van de codeerfouten in de tijd in functie van woonplaats, geslacht en

leeftijdsgroep

De voornaamste resultaten van de derde oefening500 kunnen als volgt samengevat worden.

Over de jaren heen verminderde het aantal codeerfouten significant (van ongeveer 100 ‰

tot 10‰) (Figuur 2).


Figuur 2: Evolutie van het globale foutencijfer en het foutencijfer in functie van hun ernstigheidsgraad in België, 1980-1997.

0

20

40

60

80

100

120

1980

1981

1982

1983

1984

1985

1986

1987

1988

1989

1990

1991

1992

1993

1994

1995

1996

Cijf

er(/0

00)

1997

Totaal Hoofdstuk Onderhoofdstuk Derde digit Vierde digit

Gegevensbron: Nationaal Instituut voor de Statistiek en Ministerie van de Vlaamse Gemeenschap.

Verder veranderden in de loop der jaren de omvang en het patroon van de codeerfouten in

functie van het Gewest van de woonplaats, van het geslacht en van de leeftijdsgroep

(hogere foutencijfers in de oudere leeftijdsgroep, lagere cijfers in Brussel) (Fig 3 en 4).

De belangrijke proportie certificaten waarin slechts één doodsoorzaak vermeld werd,

maakte een analyse in functie van het type pathologie onmogelijk.

Figuur 3: Evolutie van het globale foutencijfer in België, per Regio,1980-1997.

0

20

40

60

80

100

120

140

1980

1981

1982

1983

1984

1985

1986

1987

1988

1989

1990

1991

1992

1993

1994

1995

Cijf

er (/

1000

)

1996

1997

Brussel Vlaanderen Wallonië België



187

Figuur 4: Evolutie van het globale foutencijfer, per geslacht en per leeftijdsgroep. België,1980-1997.

0

20

40

60

80

100

120

1980

1981

1982

1983

1984

1985

1986

1987

1988

1989

1990

1991

1992

1993

1994

1995

Cijf

er (/

1000

)

1996

1997

01-24jaar 25-64jaar 65jaar+ Mannen Vrouwen


Zoals voormeld is het niet toepassen van de zogenaamde linkage-regel een belangrijke

oorzaak voor het ontstaan van de codeervertekeningen, die we illustreerden door figuren 5

en 6. Hierin werd voor de oorspronkelijke doodsoorzaken van ischemische hartzieken

(IHD), cerebrovasculair accident (CVA), atherosclerose (ART), en andere hartziekten

(OHD) aangegeven in welke mate de geregistreerde onmiddellijke doodsoorzaak door het

toepassen van de regel had hergecodeerd moeten worden als oorspronkelijke

doodsoorzaak.


Figuur 5: Effect van het hercoderen op de doodsoorzakenstatistieken. Ischemische hartziekten (IHD) en Cerebro-vasculaire accidenten (CVA). België1980-1997.

020406080

100120140160180

1980

1982

1984

1986

1988

1990

1992

1994

1996

Cijf

er (/

1000

)

IHD oorspronkelijk IHD hergecodeerdCVA oorspronkelijk CVA hergecodeerd

Gegevensbron: Nationaal Instituut voor de Statistiek en Ministerie van de Vlaamse Gemeenschap. Figuur 6: Effect van het hercoderen op de doodsoorzakenstatistieken. Andere hartziekten (OHD) en atherosclerose (ART). België1980-1997.

020406080

100120140160

1980

1982

1984

1986

1988

1990

1992

1994

1996

Cijf

er (/

1000

)

OHD oorspronkelijk OHD hergecodeerdART oorspronkelijk ART hergecodeerd



189

Performance van de geprogrammeerde foutendetectie

We pasten de geprogrammeerde foutendetectie toe op het bestand, dat gebruikt werd voor

de vergelijking tussen Vlaanderen en het WGO referentie centrum (oefening 2) en maakten

ook hier een subset aan van de certificaten waarin meer dan één doodsoorzaak gecodeerd

werd.

Tabel 5: Verdeling van de codeerfouten opgespoord via de geprogrammeerde foutendetectie (volledig bestand en “subset”) versus vastgesteld door het referentiecentrum. Vlaanderen 1988.

Fout Pgm (%) Referentie (%) PgmNU (%) RefNU (%)

0 504 (89.0) 315 (55.7) 167 (77.7) 95 (44.2) 1 1 (0.2) 36 (6.4) 1 (0.5) 14 (6.5) 2 14 (2.5) 74 (13.1) 2 (0.9) 27 (12.6) 3 28 (4.9) 66 (11.7) 28 (13) 45 (20.9) 4 19 (3.4) 75 (13.3) 17 (7.9) 34 (15.8)

Totaal 566 (100.0) 566 (100.2) 215(100.0) 215 (100.0) Pgm: geprogrammeerde foutendetectie toegepast op het volledige bestand; Referentie: fouten geïdentificeerd door het referentiecentrum in het volledige bestand; PgmNU: geprogrammeerde foutendetectie toegepast op de subset;RefNU: fouten geïdentificeerd door het referentiecentrum in de subset. Bron: Ministerie van de Vlaamse Gemeenschap Zoals blijkt uit tabel 5 is de performance van de geprogrammeerde foutendetectie

significant kleiner dan die van het Referentiecentrum en dit zowel voor het ganse bestand

(p <0.01) als voor de subset (p <0.01). Bij het ganse bestand stelde het referentiecentrum

ongeveer driemaal meer fouten van klasse drie en vier vast en bij de subset was dit

ongeveer tweemaal zoveel.

4.1.1.4 Discussie

Het coderen van overlijdenscertificaten verbeterde aanzienlijk tijdens de periode 1980-

1997. Verscheidene factoren hebben bijgedragen tot deze verbetering. Vergelijkingen met

het buitenland via deelname aan internationale studies235;238; contacten met het WGO

referentiecentrum; samenwerking met onderzoekers36;120; en, vergelijking met

gespecialiseerde registers zoals het kankerregister134 en MONICA165 speelden hierin een

belangrijke rol. Noteren we dat ook door het MONICA register er een duidelijke

ondercodering van IHD (36% in Vlaanderen en 32% in Wallonië) werd vastgesteld in de

overlijdensstatistieken en een nog belangrijkere ondercodering van het acuut


myocardinfarct (respectievelijk 41% en 59% in Vlaanderen en Wallonië).165 Verdere op

verbetering gerichte acties bestonden uit (1) supervisie van het coderen; (2) samenwerking

van de codeerverantwoordelijken van beide Gemeenschappen36; (3) “bevraging”518 van de

certificerende artsen wanneer er zich een codeerprobleem voordeed, en (4) initiële en

continue vorming van de codeurs in Vlaanderen in 1993 en soortgelijke initiatieven in

Wallonië.

Bij deze vaststellingen dient men er rekening mee te houden dat de provinciale codeurs

géén specifieke vooropleiding gekregen hadden en dat coderen slechts een onderdeel van

hun takenpakket vormde. De mindere codeerprestaties in het verleden waren dan ook

grotendeels onvermijdelijk. Ze kunnen zeker niet toegeschreven worden aan een gebrek

aan inzet van de provinciale codeurs.

De vastgestelde verbeteringen mogen echter niet tot een overdreven optimisme leiden. De

performance van de geprogrammeerde detectie is immers beperkt zodat een groot aantal

codeerfouten niet opgespoord wordt. Verschillende codeerregels en noten vereisen immers

een aanpassing van het overlijdenscertificaat aan het WGO-model, wat slechts in 1998

gebeurde. Op de grote proportie van certificaten met slechts één gecodeerde doodsoorzaak

(39,5%) kon derhalve de geprogrammeerde detectie niet toegepast worden.

De geleidelijke en ongelijke verbetering van de codeerkwaliteit heeft als gevolg dat er

voorzichtigheid geboden is bij de interpretatie van (1) tijdreeksen onder meer m.b.t. hart-

en bloedvatenaandoeningen, zoals hartinfarcten en cerebro-vasculaire accidenten, en (2)

geografische verschillen. Gelukkig lijkt vermijdbare sterfte, een belangrijke

gezondheidsindicator, die cruciaal is voor het ontwikkelen en evalueren van een

preventieve gezondheidspolitiek en op jongere leeftijdsgroepen (< 65 jaar) van toepassing

is, minder aangetast.

Een laatste belangrijke tekortkoming van de overlijdensstatistieken is dat zij veel te

laattijdig beschikbaar zijn: de laatste Belgische gegevens dateren van 1997.110Dit staat in

schrille tegenstelling tot de EU suggestie van een tijdsinterval van ongeveer twee jaar

tussen het jaar waarvan de gegevens verzameld worden en hun publicatie.519 Vergeten we


191

daarbij niet dat zulke oude gegevens weinig bruikbaar zijn voor de beleidsvoering en dat

zij de beleidsmakers slechts matig motiveren om voor de verbetering en de tijdige

oplevering van de overlijdensstatistieken de nodige middelen vrij te maken.

4.1.2 Certificatie

4.1.2.1 Inleiding Zoals voormeld in sectie 1.3.1 is de diagnosestelling geen eenvoudige taak en wordt zij

beïnvloed door situatiegebonden kenmerken zoals de ter beschikking staande

diagnostische middelen en voorkennis over de patiënt. Daarnaast werden er, zoals

voormeld, bij internationale vergelijkingen belangrijke verschillen in

certificeringpraktijken vastgesteld.211;238;239;242;516

Een belangrijke oversterfte in december 1989 na een griepepidemie (zie de pijl in Figuur

1) leek dan ook een uitgelezen gelegenheid om de validiteit van de certificering in

Vlaanderen te onderzoeken.

Figuur 1: Aantal sterfgevallen per maand. België, 1978-1991.

4.1.2.2 Methoden Naar aanleiding van deze oversterfte vroegen we aan 398 Vlaamse artsen het overlijden

van een patiënt te hercertificeren op basis van het medisch dossier. Daarvoor dienden ze

een vragenlijst in te vullen (zie Bijlage), die onder meer een definitie van de

oorspronkelijke, onmiddellijke en bijkomende doodsoorzaken bevatte.36 In overleg met de

Orde van de geneesheren en met de medewerking van de gemeentelijke diensten van de

burgerlijke stand werd een speciale procedure uitgewerkt om de anonimiteit van de


overledene kenbaar te maken aan de arts en toch de anonimiteit te bewaren voor de

onderzoekers.

Van de 398 aangeschreven artsen kregen we 334 antwoorden waarvan er 309 bruikbaar

waren voor verdere analyse. De antwoorden werden als niet-bruikbaar bestempeld

wanneer de arts meldde dat hij geen toegang had tot het medisch dossier.

Voor de vergelijking van de oorspronkelijke certificatie met de hercertificatie op basis van

het medisch dossier, klasseerden we de mate van overeenkomst als volgt:

1) zelfde oorspronkelijke doodsoorzaak

2) een omruiling van de originele oorspronkelijke doodsoorzaak met een toenmalige

onmiddellijke of bijkomende doodsoorzaak, of, een grotere precisie m.b.t. de

natuur of anatomische localisatie van de aandoening of letsel (bvb. Tumor van de

long versus longkanker)

3) duidelijk andere oorspronkelijke doodsoorzaak

Verder gingen we na of de hercertificatie leidde tot een grotere precisie. Hiervoor werden

de diagnoses tentatief gehergroepeerd in:

1) vaag: als het ging over (1) symptomen of hoge leeftijd (ICD-9: 780-799),

(2)kankers waarvan de primaire localisatie onbekend was (ICD-9:199), (3)

hartfalen (ICD-9: 428-9), en andere ademhalingsziekten (ICD-9: 518.8),

2) precies in de andere gevallen

4.1.2.3. Resultaten Bij de 309 bruikbare antwoorden vonden we een overeenkomst in 188 gevallen

(60,8 %), een omruiling of verschillen in precisie in 58 gevallen (18,8 %) en een totaal

andere oorspronkelijke doodsoorzaak in 63 gevallen (20,4 %) (Tabel 1). Het verschil in

overeenkomst tussen certificering en hercertificering was veel groter in de oudere

leeftijdsgroep (OR: 2,04 [ 95% BI: 1,50; 2,78]).


193

Tabel 1: Overeenstemming over de oorspronkelijke doodsoorzaak zoals ze oorspronkelijk vermeld was en na hercertificatie.

Leeftijdsgroep Overeenstemmend Omruiling/

Precisie

Niet

overeenstemmend

Totaal

< 80 jaar 155 (67,1 %) 43 (18,6 %) 33 (14,3 %) 231

≥ 80 jaar 33 (42,3 %) 15 (19,2 %) 30 (38,5 %) 78

Totaal 188 (60,8 %) 58 (18,8 %) 63 (20,4 %) 309

In tegenstelling tot de oudere leeftijdsgroep, waar we veeleer een verandering dan wel een

precisering (p: 0,53) leken te noteren, leidde de hercertificatie in de jongere leeftijdsgroep

blijkbaar wel tot een grotere precisie (p < 0,03). We konden geen significant verschil

aantonen tussen het hercertificeren door de arts, die het certificaat invulde, of het

hercertificeren door een andere arts.

Tabel 2: Graad van precisie van de oorspronkelijke doodsoorzaak zoals ze oorspronkelijk vermeld was en na hercertificatie.

< 80 jaar ≥ 80 jaar Hercertificatie Certificatie Hercertificatie Certificatie Vaag Precies Totaal Vaag Precies TotaalVaag 6 4 10 Vaag 5 4 9Precies 13 208 221 Precies 6 63 69Totaal 19 212 231 Totaal 11 67 78McNemar: 4,765,df=1,p: 0,0290 McNemar: 0,400,df=1,p: 0,5271

4.1.2.4. Discussie In de literatuur werden herhaalde malen onnauwkeurigheden bij het invullen van

overlijdenscertificaten gedocumenteerd.211;238;239;243;244;508;516 Deze onnauwkeurigheden

worden in de hand gewerkt door de moeilijkheid om een unieke, oorspronkelijke

doodsoorzaak te definiëren. Zoals voormeld dateert dit concept uit de tijd dat maternale

sterfte en infectieuze aandoeningen belangrijke doodsoorzaken waren, maar blijkt het niet

adequaat om het ganse proces dat tot de dood leidde weer te geven wanneer er zich

verschillende levensbedreigende aandoeningen voordeden.215;219;226;228;246 Een typisch

voorbeeld van deze problematiek treffen we aan bij het prostaatcarcinoom bij oudere


mannen waar het vaak moeilijk is een onderscheid te maken tussen een sterfgeval

tengevolge van een prostaatcarcinoom en een sterfgeval waarbij naast een andere

oorspronkelijke doodsoorzaak ook een prostaatcarcinoom vermeld wordt.520

Het zal dan ook geen verwondering wekken dat zowel het concept van één oorspronkelijke

doodsoorzaak als het WGO-formulier in de oudere leeftijdsgroepen dermate inadequaat

bevonden werden dat er in de VS aan een speciaal overlijdensbericht gedacht wordt246.

Men kan zich overigens de vraag stellen of een oorspronkelijke doodsoorzaak bij mensen

van 80 jaar en meer erg zinvol is in termen van preventie van deze doodsoorzaak. Het is

wellicht zinvoller de beperkingen, die optreden bij het ouder worden en de levenskwaliteit

negatief beïnvloeden, te registreren en als vertrekpunt te gebruiken voor preventie.

Verscheidene methodes werden voorgesteld om de validiteit van het certificeren te

bestuderen: een vergelijking tussen overlijdenscertificaat en (1) autopsie rapporten243,

(2) ziekenhuisontslaggegevens244, en (3) specifieke enquêtes ter validatie van

overlijdenscertificaten246.

Wij stelden hier een benadering voor waarbij aan een arts gevraagd werd een sterfgeval te

hercertificeren aan de hand van een vragenlijst. Deze vragenlijst bevatte een aantal

gesloten vragen en definities. Uit onze vergelijking van het oorspronkelijk certificaat en de

hercertificering blijkt duidelijk dat de validiteit van de overlijdensstatistieken, beperkt tot

oorspronkelijke doodsoorzaak, zwak is, zeker in de leeftijdsgroep van de tachtig plussers.

Het positieve aspect aan deze oefening is de vaststelling dat duidelijker instructies de

precisie van de statistiek kunnen verbeteren, zoals blijkt uit de grotere precisie na

hercertificatie in de jongere leeftijdsgroep. In de oudere leeftijdsgroep waren de aantallen

dermate klein dat we misschien power misten om een eventueel verschil aan te kunnen

tonen.


195

Bijlage: Vragenlijst



197

4.2 KWALITEIT VAN DE GEGEVENS IN EEN PROSPECTIEF FINANCIERINGSSYSTEEM

Wanneer ontslaggegevens in verband met ziekenhuisverblijven alleen gebruikt worden

voor de financiering van die ziekenhuizen, is het niet ondenkbeeldig dat de kwaliteit van

de registratie door deze finaliteit beïnvloed wordt. Vermits die gegevens naast hun

financieringsdoeleinden ook voor kwaliteitsinitiatieven gebruikt worden leek een

onderzoek naar hun kwaliteit wenselijk.

Gebaseerd op dit onderhoofdstuk, dat onderzoek uit 2004-6 weergeeft, werd aan de Revue

d’Epidémiologie et Santé Publique (RESP) volgend manuscript aangeboden: “Miscoding a

threat to the hospital care system: How to detect it?”met als auteurs Aelvoet W., Terryn N,

Windey F, Redivo M., Faes C, en de Cell Audit.

4.2.1 Inleiding. Vanuit een standpunt van ziekenhuismanagement bleek het wenselijk ziektebeelden met

gelijkaardige behandelingen en kosten te hergroeperen. Dit gaf aanleiding tot het ontstaan

van het concept Diagnosis Related Group (DRG).2;195 De idee om DRGs te gebruiken als

maat voor case mix1 in het kader van terugbetaling van ziekenhuiskosten, berustte op het

gegeven dat de verblijfsduur, de afhankelijke variabele bij de bepaling van DRGs,

behoorlijk goed correleerde met de totale ziekenhuiskosten.83

Het prospectief financieringssysteem, waarop ook het Belgische

ziekenhuisfinancieringssysteem berust, is gebaseerd op DRGs. Hieronder verstaat men dat

ziekenhuizen een vast bedrag ontvangen voor het behandelen van patiënten geklasseerd in

een bepaalde ziekte, ongeacht de verblijfsduur of het type zorg, met uitzondering van

sommige patiënten met uitzonderlijk hoge kosten, outliers genaamd.521;522Deze tarifering

wordt vastgesteld voorafgaandelijk aan de periode waarin de ziekenhuisopnamen zich

voordoen, die aan dit tarief zullen terugbetaald worden.

In ons land berust dit systeem op de “All Patient Refined Diagnosis Related Groups”

(APR-DRGs). In functie van de ernst van de aandoening kent het klassificatie algoritme

binnen de APR-DRGs een Severity of Illness (SOI) toe, die in functie van een stijgende

ernst van 1 tot 4 gescoord wordt. Het kan dan aanlokkelijk zijn de hoofddiagnose van een

verblijfsduur, die te lang is voor de APR-DRG waarin het verblijf geklasseerd werd,

zodanig te herformuleren dat zij leidt tot een meer lucratieve classificatie bijvoorbeeld tot


een classificatie in andere APR-DRG met een gemiddeld langere duur of in dezelfde APR-

DRG maar met een hogere SOI.

Het systematisch en intentioneel overwaarderen van de case mix om een hogere

terugbetaling te bekomen wordt “DRG creep” of “upcoding” genaamd.83 Men

onderscheidt optimalisatie, wat in overeenstemming is met de codeerregels en “creep”,

wat het niet is. Een voorbeeld van optimalisatie is het selecteren van een aanvaardbare,

alternatieve hoofddiagnose (“selection” of “gaming”) of het toevoegen van meer

secundaire diagnosen (“supplementation”).336 Een voorbeeld van “gaming” is het klasseren

van iemand met een systeem lupus en een “milde” chronische nierinsufficiëntie in DRG

316 (“Renal failure diagnoses without dialysis”) i.p.v. in DRG 240 (“Connective-tissue

disorders with complicating condition or age > 69”) wat leidt tot een met een derde

verhoogde terugbetaling.337 Stippen we hierbij echter aan dat volgens de huidige

codeerregels de voormelde systemische lupus verplicht geselecteerd moet worden.523

Bronnen van creep zijn: misspecificatie, fout coderen (“miscoding”) en herrangschikken

van diagnosen (“resequencing”). Een codeur, die een TIA codeert als een cerebro-vasculair

accident en een informaticus die de door de arts weerhouden hoofddiagnose van acute

bronchitis omruilt met de secundaire diagnose van chronische obstructieve longaandoening

zijn voorbeelden van respectievelijk fout coderen en herrangschikken.336 Misspecificatie is

het ten onrechte specificeren van een diagnose als hoofddiagnose en het optekenen van

diagnosen of ingrepen, die niet voorkomen in het medisch dossier.140 Bijvoorbeeld

wanneer een behandelende arts voor een opname van een pneumonie, een niet gerelateerd

myocardinfarct, dat zich na de opname voordeed, tegen de regels in selecteert als

hoofddiagnose spreekt men van misspecificatie.

In uitzonderlijke omstandigheden kan een arts verkeerdelijk een diagnose of ingreep

vermelden om bij een patiënt een naar zijn mening noodzakelijke behandeling uit te

voeren, waarvoor de patiënt bij de geldende regels niet in aanmerking komt, en die door

deze misspecificatie wel kan. Dergelijke handeling, hoewel ethisch niet correct,

beantwoordt aan het verwachtingspatroon, eigen aan de arts-patiënt relatie. Om dit soort

praktijken tegen te gaan is een gezamenlijke inspanning vereist zoals het opstellen of

aanpassen van richtlijnen.524-528


199

Naast “upcoding” werd ook het tegenovergestelde fenomeen, ondercodering genaamd of

“undercoding” in de Angelsaksische literatuur, vastgesteld. Dit bestaat vaak uit een

onzorgvuldige abstractie en codering die tot een DRG leiden met een gemiddeld kortere

verblijfsduur.1 Soms kan er echter sprake zijn van frauduleuze praktijken waarbij er, door

een bewuste ondercodering, naar gestreefd wordt “outlier” te worden in een DRG met een

kortere gemiddelde verblijfsduur en daaruit financiële winst te puren.

Een DRG studie, uitgevoerd op 7050 opnames onmiddellijk na het invoeren van het

prospectieve financieringsmechanisme , toonde een hoog percentage (20,8%) ernstige

codeerfouten met een verandering van terugbetaling tot gevolg. Hoewel vroeger ook

tussen ongeveer 20 en 75 percent ernstige codeerfouten werden opgetekend, bleken de

codeerfouten nu echter niet langer neutraal te zijn maar leidden ze in 61,7% van de

gevallen tot een overbetaling.140Misspecificatie door de artsen gaf aanleiding tot de helft

van de codeerfouten; in de andere gevallen ging het over het coderen van niet-

geattesteerde diagnoses, het toekennen van foutieve ICD-9-CM codes en het

herrangschikken van de diagnoses, die door de arts werden opgegeven.336

Als remedie tegen creep formuleerde de Amerikaanse overheid een aantal voorstellen. Een

eerste betrof het zich concentreren op een aantal DRGs en een aantal ziekenhuizen. Verder

stelde ze voor aselect een voldoende aantal ontslagen na te gaan om de globale integriteit

van het systeem te onderzoeken, wat terzelfder tijd een “ontradend” karakter heeft.336

Tenslotte werden artsen verplicht de opgegeven diagnoses te certificeren en werden er

peer review organisaties (PROs) opgezet voor de bewaking van de gegevenskwaliteit.

Deze maatregelen bleven niet zonder gevolg zoals uit een nieuwe nationale DRG validatie

studie bleek: het percentage van ernstige codeerfouten was dan teruggelopen 14,7%, en de

codeerfouten resulteerden niet langer systematisch in een hogere terugbetaling.140 De

Amerikaanse gezondheidszorgadministratie gaf echter toe niet te beschikken over

dergelijke preventieve mechanismen voor de problemen van het foutief coderen of van het

herrangschikken.140

Naast een directe vaststelling van creep, werd ook een indirecte maat voor fraude-detectie

ontwikkeld: de Medicare Case-mix Index (MCI), die het relatieve gewicht van de


pathologieën in de financiering weergeeft. Een econometrische analyse over de periode

1980-6 toonde een onterechte toename in “meer rendabele” DRGs, die ongeveer 10% van

de toename in de MCI verklaarde. Een ander verrassend en sterk resultaat van de studie

betrof de rol van de Peer Review Organisations (PROs): hoe inschikkelijker een PRO hoe

hoger de gemiddelde MCI van zijn ziekenhuizen.321

Een samenvatting van de Amerikaanse gegevens voor de fiscale jaren 1981-1987 waarbij

de MCI werd opgedeeld in reële en upcoding effecten, geeft aan dat na een aanvankelijke

sterke stijging van upcoding, tot 68% van de totale MCI-toename, een afzwakking ervan

werd vastgesteld tot 24% van de totale MCI-toename.338Deze systematische opwaardering

van de MCI in de hand gewerkt door de invoering van het prospectieve

financieringssysteem had het ontstaan van een breuk in de epidemiologische tijdreeksen

als gevolg.529

In België zijn er verschillende elementen aanwezig, die het ontstaan van “creep”

bevorderen. Vooreerst is er het toenemende belang van de, op het prospectieve

financieringsmechanisme gebaseerde, verantwoorde activiteit waarbij men een

overschakeling krijgt van de notie van “erkende” ziekenhuisbedden naar de notie van door

pathologie “verantwoorde” ziekenhuisbedden. Deze verantwoorde activiteit wordt

berekend op basis van oudere MKG-registratiejaren (prospectieve financiering). In het

nieuwe systeem hangt de financiering nog alleen af van het aantal gerechtvaardigde

verpleegdagen. Hierin spelen APR-DRG, SOI en leeftijd een fundamentele rol.

Vervolgens komen APR-DRG en SOI in belangrijke mate tussen in de berekening van het

Forfait Klinische Biologie, een andere nieuwe ontwikkeling. Ook de op ons afkomende

financieringsmechanismen zoals de referentiebedragen en de forfaitarisering van de

verzekeringstegemoetkoming voor de vergoedbare farmaceutische specialiteiten in het

ziekenhuis zijn eveneens functie van APR-DRG en SOI. Een juiste codering van deze

elementen is bijgevolg een basisvoorwaarde voor de financiering.

Naast het prospectieve financieringsmechanisme zijn de geringe frequentie waarmee

vooralsnog de controles op de codeerkwaliteit uitgevoerd worden en de beperkte aselecte

steekproef (een veertigtal ziekenhuisverblijven), waarop zij gebaseerd zijn, weinig “creep-

ontradend”. Ook wordt in geval van creep, wegens de bestaande gaten in de mazen van het


201

juridisch arsenaal, vooralsnog niet tot een concrete bestraffing overgegaan. Vermits er

daarenboven in een systeem van een gesloten enveloppe gewerkt wordt, zal een

systematische fraude van een ziekenhuis negatieve gevolgen hebben op de financiering van

de andere ziekenhuizen.

Om al deze redenen werd er besloten een onderzoek uit te voeren om na te gaan of er al

dan niet een algemene tendens bestaat van over-codering en frauderende ziekenhuizen op

te sporen.

4.2.2 Methodes Design van de studie Voortbouwend op de Amerikaanse ervaringen en op de methodologie ontwikkeld door

Kirkhove et al.530 wordt eerst op “macroscopisch” niveau nagegaan (1) of het

ziekenhuissysteem in zijn geheel al dan niet een tendens vertoont tot verzwaring van de

pathologie, die, indien ze kunstmatig is, de stabiliteit van het systeem in gevaar brengt, en

(2) of een eventuele verzwaring geheel of gedeeltelijk te wijten is aan veranderingen in de

registratiepraktijk.

Twee types van methoden worden hiervoor gebruikt:

1) Het volgen van het verschil in evolutie tussen de geobserveerde en de

gestandaardiseerde verblijfsduur, berekend volgens de methodologie van de

financiering der ziekenhuizen.

2) Het volgen van de evolutie over de jaren van de proportie verblijven met een

severity of illness (SOI), graad =1.

Het eerste type analyse moet toelaten de algemene efficiëntie van het systeem te

beoordelen: een kleiner wordend verschil - vergeleken met de gestandaardiseerde

verblijfsduur wordt de geobserveerde verblijfsduur korter - zou wijzen op een systeem dat

efficiënter wordt, een constant en een groter wordend verschil zouden respectievelijk op

stabiliteit en op een verlies aan efficiëntie wijzen. Bij gebrek aan een onderbouwde

referentie, is het echter moeilijk een onderscheid te maken tussen winst in efficiëntie en het

effect van een veranderende codeer- of ontslagpraktijk van de ziekenhuizen (bijvoorbeeld

d.m.v. een voortijdig ontslag tot een kortere verblijfsduur komen). Een veranderende

codeerpraktijk kan op zijn beurt het gevolg zijn zowel van een verbetering van een

voorafgaande ondercodering tot een correcte codering als van een overcodering338.


Met het tweede type analyse trachten we aan te tonen of er zich een algemene verzwaring

van de pathologie voordoet of niet. Ook hier dient een onderscheid gemaakt te worden

tussen reële en artificiële toename.

Naast het aspect verzwaring van de pathologie werden ook de “rest diagnosegroepen”

bestudeerd, die iets zeggen over de algemene kwaliteit van de gegevens. Type 1, geeft aan

dat er geen of geen aanvaardbare hoofddiagnose vermeld werd (APR-DRG 955 en 956).

Type 2 (APR-DRG 950, 951 en 952) gaat over verblijven waarvoor een belangrijke

chirurgische ingreep vermeld werd, die niet overeenstemt met de hoofddiagnose. In beide

gevallen wordt er in de financiering geen gemiddelde verblijfsduur berekend.531

Na een beoordeling van het systeem in zijn geheel wordt er overgegaan tot een globale

beoordeling van de individuele ziekenhuizen. Net zoals voor de studie van de stabiliteit

van het systeem, werd voor de individuele ziekenhuizen de evolutie van zowel het

(gewogen) verschil tussen de geobserveerde en gestandaardiseerde verblijfsduur

bestudeerd, als de proportie van verblijven met SOI gelijk aan 1 of van verblijven die in

een restdiagnose geklasseerd worden. Tenslotte kan een ziekenhuis handig inspelen om via

overcoderen en/of ondercoderen een outlier status te bekomen, die financiële baten

oplevert. Daarom worden “kleine” outliers bij SOI klassen 3 en 4 bij personen die levend

het ziekenhuis verlaten, en “grote” outliers bij SOI klassen 1 en 2 onderzocht.

Waar we niet beschikken over een op de pathologie gebaseerde typologie van de

ziekenhuizen, lijkt een vergelijking van SOI en APR-DRG over een globale periode

weinig pertinent. Voor individuele ziekenhuizen mag er echter aangenomen worden dat er

zich weinig veranderingen in het APR-DRG en SOI patroon “spontaan” zullen voordoen

in een tijdsspanne van enkele jaren en lijkt een longitudinale benadering derhalve

aangewezen. Dergelijke benadering laat overigens niet alleen het identificeren toe van

ziekenhuizen met een “afwijkend temporeel gedrag”, maar biedt tevens een gedeeltelijke

correctie voor het fenomeen van stochastische variaties, die maken dat sommige

ziekenhuizen – vooral de kleinere – ten onrechte als outlier beschouwd zouden worden.

Indien uit de globale beoordeling blijkt dat een ziekenhuis als “afwijkend” t.o.v. het

landsgemiddelde dient beschouwd te worden, wordt er, om tot een meer efficiënte

fraudeopsporing te komen, overgegaan tot een “gerichte” benadering. Hiervoor doet men


203

beroep op de zogenaamde “knipperlichten”. Zij gaan ervan uit dat men de

ernstigheidsgraad van een ziekenhuisopname artificieel kan opwaarderen door een

techniek (zoals mechanische ventilatie) of een pathologie (zoals chronisch obstructief

longlijden, septicemie of morbide obesitas) aan het verblijf toe te voegen. Het vergelijkend

tijdsverloop van dergelijke pathologie of techniek tussen een individueel ziekenhuis en het

geheel der ziekenhuizen laat toe systematisch afwijkende (“outlying”) ziekenhuizen te

identificeren en een gerichte keuze van te auditeren dossiers te maken. Het is tevens een

supplementaire screeningsmethode om ziekenhuizen met eventueel onjuiste

codeerpraktijken op te sporen. Stippen we hierbij aan dat de audit - het ter plaatse toetsen

aan het medisch dossier van de toegekende codes - bepaalt of de statistisch vastgestelde

evolutie al dan niet een artefact is.

Er werden, op basis van hun klinische waarschijnlijkheid, 21 knipperlichten gedefinieerd.

We geven ze hier, zoals in tabellen 2 en 3, onder vorm van hun ICD-9-CM code weer:

038.9: septicemie; 278.00: niet-gespecificeerde obesitas; 278.01: morbide obesitas; 285.1:

acute post-hemorragische anemie; 285.9: niet-gespecificeerde anemie; 287.5: niet

gespecificeerde thrombocytopenie; 413.9: ander en niet gespecificeerde angor pectoris;

425.4: primaire cardiomyopathie; 426.89: overige gespecificeerde

geleidingsstoornissen;429.79: overige sequelen van myocardinfarct

NEC;491.21:obstructieve chronische bronchitis met acute exacerbatie; 496: chronische

obstructieve longaandoening; 511.9: niet gespecificeerde pleurale uitstorting; 518.81 niet

gepreciseerde respiratoire decompensatie; 530.2: slokdarmulcus; 560.39: intestinale

impactie, andere; 584.9: niet gespecificeerde nierinsufficiëntie; 585: chronische

nierinsufficiëntie; 707.0: doorligwonde; 799.0: asfyxie; V46.1: mechanische ventilatie

(“ijzeren long”).

Aansluitend op de resultaten van de globale analyse en van de knipperlichten worden er

twee types van audit uitgevoerd: 1) een aselecte audit, en 2) een audit op knipperlicht of

“gerichte” audit. In geval van een niet-afwijkende globale analyse gaat men over tot een

aselecte audit op een gestratificeerde, aselecte steekproef van 48 dossiers, waarbij de

stratificatie gebeurt aan de hand van volgende criteria: All Patients Diagnosis Related

Groups (AP-DRG) met of zonder verwikkelingen en vier leeftijdsgroepen: < 35 jaar, 35-


54 jaar, 55-74 jaar en 75 jaar en meer. In geval van een afwijkende globale analyse wordt

een audit op knipperlichten uitgevoerd. Men speurt dan afwijkende proporties van

“lucratieve” aandoeningen op 1) over een globale periode, of 2) in de loop van de tijd (per

semester trend). Telkens wordt hierbij een ziekenhuis vergeleken met het geheel van de

andere ziekenhuizen. Vermits er belangrijke verschillen bestaan in case mix tussen de

ziekenhuizen gaat de aandacht vooral uit naar de evolutie per semester (trend) van het

cijfer van het knipperlicht. Een voorbeeld van een afwijkende trend voor septicemie wordt

in figuur 1 gegeven.

Figuur 1: Septicemie: nationale trend versus een afwijkende trend van een ziekenhuis.

De te selecteren aandoeningen worden gekozen op basis van een rooster met de periode-

en evolutiecijfers van de 21 knipperlichten, dat hiervoor werd aangemaakt voor de periode

2000-3. Voor de ziekenhuizen met een macroscopisch afwijkend patroon wordt er, indien

er voor een of meerdere knipperlichten een afwijkend verloop wordt vastgesteld, een

selectie gemaakt van een 80-tal dossiers op basis van de proportie van dossiers per

leeftijdscategorie.


205

De auditeurs gaan vervolgens na of er zich voldoende gegevens bevinden in de

geselecteerde dossiers om de knipperlichtcode te verrechtvaardigen of niet. Zij dienen uit

te maken of de afwijkende trend het gevolg is van een reële toename in de frequentie van

het bestudeerde knipperlicht of van veranderende codeerpraktijken (het evolueren van

ondercoderen naar correct coderen, of van ondercoderen of correct coderen naar

overcoderen).

Voor de MKG van 2003 werd vanuit een financieringsperspectief een audit gepland voor

6.154 verblijven in 102 ziekenhuizen. Voor 90 (1,5%) verblijven kon het dossier in het

ziekenhuis niet terug gevonden worden. 987 dossiers gingen over daghospitalisaties, die

niet tussenkomen in de berekening van de ligduur en derhalve niet bruikbaar voor deze

studie. Van de 5.077 resterende dossiers werden er 104 verblijven uitgesloten omdat ze

betrekking hadden op ziekenhuizen die niet via het toenmalige financieringssysteem

betoelaagd werden. We presenteren hier de resultaten van de audits op de bruikbare

dossiers (N=4973). Het gaat over 63 aselecte audits waarbij 2.158 verblijven onder de loep

werden genomen en over 40 gerichte audits (knipperlichten) over 2.815 verblijven.

De statistische methodologie hebben we uitvoerig beschreven in hoofdstuk 3.

4.2.3 Resultaten

4.2.3.1 Macroscopische analyse De variantie-analyse toont aan dat het verschil tussen de geobserveerde (O) en

gestandaardiseerde (E) gemiddelde verblijfsduur een significante daling vertoont. Zij kon

niet aantonen dat deze daling verschilde in functie van het type ziekenhuis (al dan niet een

universitaire functie of publiek versus privaat ziekenhuis). De daling van dit verschil

bedraagt ongeveer 0,87 dagen (Tabel 1).


Tabel 1: Geobserveerde en verwachte gemiddelde ligduur. België, 2000-2003.

2000 2001 2002 2003

Geobserveerde gemiddelde verblijfsduur 7,36 7,23 7,06 6,87

Verwachte gemiddelde verblijfsduur 6,94 7,05 7,20 7,32

Verschil gemiddelde verblijfsduur 0,42 0,18 -,14 -,45

In vergelijking met de geobserveerde gemiddelde ligduur voor 2000, dient deze daling als

belangrijk beschouwd te worden. Ook is de evolutie van dit verschil niet dezelfde voor het

geheel der ziekenhuizen (Figuur 2).

Figuur 2: Evolutie van het verschil tussen de geobserveerde en de verwachte gemiddelde ligduur nationaal en in een afwijkend ziekenhuis. België, 2000-2003.

-1,5

-1

-0,5

0

0,5

1

1,5

2000 2001 2002 2003

Jaar

Vers

chil

NationaalAfw. ZH

De analyse van de ratio (O-E)/√E leidt tot gelijkaardige vaststellingen.

De Mahalanobis-afstand (Figuur 3) toont het bestaan aan van drie afwijkende

ziekenhuizen met een probabiliteit ≤ de Bonferroni-gecorrigeerde significantie drempel

van 0,000442 (= 0,05/114).118;438;532 Voor 4 ziekenhuizen werd een probabiliteit ≤ 0,01 en

groter dan 0,001 genoteerd en voor 7 andere ziekenhuizen was ze ≤ 0,05 en > 0,01. In

figuur 3 stelt de y-as de “geobserveerde”probabilistische afstand ten opzichte van de


207

evolutie van de nationale gemiddelde verblijfsduur voor. De x-as is dan de “verwachte”

probabilistische afstand mocht een ziekenhuis dezelfde evolutie van de verblijfsduur

hebben als de nationale. De volle lijn, die de spreiding van de probabilistische afstanden

weergeeft indien al de ziekenhuizen een met de nationale vergelijkbare evolutie kennen, is

een visuele hulp bij de interpretatie van deze figuur.

Figuur 3: Mahalanobis-afstand voor de Belgische Ziekenhuizen, 2000- 2003.

De evolutie van de proportie ziekenhuisverblijven met een SOI gelijk aan één vertoont een

significante en aanzienlijk dalende trend (trend van de ORSOI=1 vs SOI >1= 0.90). Hij kan niet

toegeschreven worden aan een verschuiving van patiënten met SOI=1 van de klassieke

naar de daghospitalisatie, vermits dit fenomeen zich ook in die sector voordoet (Figuur 4).

Voor de periode 2000-2003 noteerden we, vergeleken met de nationale trend, een

significant lagere trend voor 35 en een significant hogere trend voor 47 ziekenhuizen.


Figuur 4: Evolutie van het percentage verblijven van de SOI klassen in de acute ziekenhuizen en daghospitalisatie.

Percentage verblijven met SOI = 1

0%10%20%30%40%50%60%70%80%90%

100%

2000 2001 2002 2003 2004

Daghospitalisatie Klassieke Hospitalisatie

Zoals hoger vermeld definieert de financiering van de ziekenhuizen kleine en grote

outliers. Voor de kleine outliers stellen we, vergeleken met het nationale gemiddelde, bij 6

ziekenhuizen significant minder outliers vast, bij 22 significant meer en voor 86 geen

significant verschil. Voor de grote outliers bedragen deze cijfers respectievelijk, 11, 25 en

78. De proportie ziekenhuizen “met significant meer outliers” is significant groter dan die

“met significant minder outliers” en dit zowel voor de kleine (p= 0,0025) als voor de grote

(p=0,018) outliers.

4.2.3.2 Gerichte analyse: de knipperlichten Zoals voormeld werden er voor de periode 2000-2003 twee roosters aangemaakt: één

rooster met trend-ORs en één met periode-ORs. Voorbeelden van beide roosters worden in

tabellen 2 en 3 gegeven.

In tabel 2 stemmen de waarden van de eerste rij (in het blauw en vet) overeen met de

nationale trend over de semesters van de knipperlichten. De waarden van de vier volgende

rijen stemmen overeen met de afwijking voor elk knipperlicht in de eerste vier

ziekenhuizen t.o.v. die nationale trend.


209

In tabel 3 worden de periode odds ratio’s voor dezlfde vier ziekenhuizen weergegeven.

Ook hier worden de niet significant afwijkende ORs voor de leesbaarheid als 1

weergegeven en geeft de kolom “Totaal” aan hoeveel knipperlichten als afwijkend moeten

geïnterpreteerd worden. Hier wordt geen nationale odds ratio berekend omdat die per

definitie gelijk is aan 1.

Voor 12 knipperlichten was de nationale trend stijgend, voor 7 was hij stationair en voor 2

daalde hij. De laatste kolom met als hoofding “Totaal” geeft aan hoeveel knipperlichten als

afwijkend moeten geïnterpreteerd worden. Voor de ziekenhuizen en voor de nationale

trend worden alle niet-significant stijgende odds ratio’s als 1 weergegeven.

Hierin worden het aantal en de proporties van juiste en foute coderingen weergegeven,

benevens hun globale weerslag op de ligduur (LOS).

De onenigheden tussen auditeur en geauditeerde worden in tabel 4 weergegeven.

4.2.3.3 Resultaten van de audit In het kader van fraude detectie stelt de politieke overheid dat men alleen tot fraude kan

besluiten indien een systematische foutieve codering ook daadwerkelijk leidt tot een

financiële winst voor het frauderend ziekenhuis.

Hoofdstuk 4: Kwaliteit van administratieve gegevens in België 210 Tabel 2: Overzichtstabel van de trend van odds ratio's, waarbij een ziekenhuis met het nationale gemiddelde vergeleken wordt, voor een selectie knipperlichten en ook de trend van het geheel der Belgische ziekenhuizen (in het vet). België, 2000-2003. 0389278002780128512859 2875 4139 4254 42689 42979 49121 496 5119 51881 5302 56039 5849 585 7070 7990 V461 Totaal

1 1,14 1,12 1,09 1,19 1 1,07 0,75 1 1 1 1,19 1,48 0,89 1 1,06 1,09 1 1,1 1,26 1,47 14 1 1 1.16 1.32 1 1.16 1 1 1 1.15 1.21 1.29 1 1 1 1.15 1 1.25 1 1.12 1 9 1 1 1 1 1.16 1.16 1.26 1.86 1 1.22 1 1.19 1 1 1.60 1 1 1 1 1 1 7 1 1 1 1.12 1.12 1 1 1.14 1 1 1.37 1.17 1 1 1 1 1 1.10 1.26 1 1 7 1 1.34 1.41 1 1.48 1.22 1 1 1 1 1 1 1 1.20 1 1 1 1 1 1.20 1 6

Nota’s: 1) de hoofding van de kolommen bevat de ICD-9-CM code van de verschillende knipperlichten. 2) de niet-significante odds ratio's worden in de tabel met een 1 weergegeven. 3) een rij wordt gevormd door de waarden voor een bepaald ziekenhuis van elk knipperlicht. Deze waarden geven telkens de afwijking van een ziekenhuis t.o.v.de nationale trend weer 4) de rij met vette cijfers geeft voor elk knipperlicht de waarde van de nationale trend aan.

Tabel 3: Overzichtstabel van de periode ORs voor een selectie knipperlichten. België, 2000-2003.

0389 27800 27801 2851 2859 2875 4139 4254 42689 42979 49121 496 5119 51881 5302 56039 5849 585 7070 7990 V461 Totaal 1.72 1 4.46 1.65 4.13 1 1 1 1 1 14.50 2.46 1 1 2.11 1 1.39 1.39 1 1 134.77 10 2.24 1 1 1 1 2.56 1 1 1 1 13.43 1 1 1 3.39 1 1 1 1 1 2.81 5 2.04 1 3.55 2.21 1 1.36 3.49 1 1 1 14.92 1 6.01 2.69 1 1 1 1 1 1.56 9.13 10

1 3.55 1 1 1 1 1 1 1 1 32.63 1 1.59 1 1 1 2.56 1 1 1.40 164.53 6 Nota’s: 1) de hoofding van de kolommen bevat de ICD-9-CM code van de verschillende knipperlichten. 2) de niet-significante odds ratio's worden in de tabel met een 1 weergegeven. 3) een rij wordt gevormd door de waarden voor een bepaald ziekenhuis van elk knipperlicht. Deze waarden geven telkens de afwijking van een ziekenhuis t.o.v. het nationale gemiddelde weer


Aangezien de audit ging over verschillende AP-DRGs/ knipperlichten en uitgevoerd werd

door verschillende auditeurs is het moeilijk besluiten te trekken op ziekenhuisniveau. Toch

menen we dat op nationaal niveau een aantal voorzichtige vaststellingen mogelijk zijn.

Er lijken nog steeds een groot aantal codeerfouten gemaakt te worden: respectievelijk 38,6

% voor de aselecte audit en 44,4% voor de gerichte audit. Dat er significant meer

onenigheden (RR:1,14; 95%BI [1,07-1,22]) aangetroffen worden in de gerichte steekproef

beantwoordt aan de verwachtingen. Evenmin lijkt het verwonderlijk dat, n.a.v. een

gerichte audit, er zich in belangrijke mate meer veranderingen in de toekenning van de

APR-DRG voordoen wanneer tijdens een aselecte audit het ganse dossier wordt

doorgenomen (RR:3,03; 95% BI [2,33-3,93]) en niet alleen de gewraakte nevendiagnose.

Het is verder opmerkelijk dat voor beide types audit ongeveer 7/10 van de onenigheden

geen weerslag hebben in termen van APR-DRG, SOI en LOS, al zijn ze proportioneel

significant talrijker bij de aselecte audit (RR: 1,06; 95% BI [1,00 - 1,12]). In geval er

alleen een verandering optreedt van SOI, blijken er bij de gerichte audit duidelijk meer en

significante veranderingen te bestaan (RR:1,72; 95% BI [1,39-2,12]), die significant vaker

in de richting gaan van een dalende SOI dan bij een aselecte audit (RR:1,59; 95% BI

[1,35-1,88]). Bij de aselecte audits is de proportie (0,56) van verblijven met dalende SOI

(65) over het totaal van verblijven niet significant verschillend van 0,5 (p = 0.2273). Voor

de gerichte audit bedraagt deze proportie 0,89 (95%BI [0,85;0,92]) en p <0,0001.

Al deze bevindingen schijnen erop te wijzen dat er nog een groot aantal codeerfouten

gemaakt worden, dat er nog steeds ondercodering bestaat (56,0% van de verblijven van de

gerichte audits, uitgevoerd wegens een afwijkende stijgende trend, bleken correct

gecodeerd), dat de gerichte audits bij foutieve codering een fraudedetecterend vermogen

lijken te hebben, en dat aselecte audits aantonen dat er in ziekenhuizen met een niet-

afwijkend codeergedrag er nog een belangrijk aantal codeerfouten gemaakt worden.


Tabel 4: Onenigheden tussen auditeur en geauditeerde. Per type audit: aantal, percentage, weerslag op APR-DRG-, SOI toekenning aan de verblijven, en verschil in ligduur. Aselect Gericht

Verblijven % Dagen Verblijven % Dagen

Geanalyseerde verblijven 2158 100 2815 100

Verblijven zonder

onenigheden 1326 61,5 1575 56,0

Verblijven met

onenigheden 832 38,6 -28.23 1240 44,0 - 642,68

Verblijven met foutieve

codes zonder weerslag op

gebied van APR-DRG /SOI 574 26,7 0 906 32,2 0

Verblijven met een

verandering van APR-

DRG en eventueel SOI 142 6,6 8,75 74 2,6 -224,61

Verblijven met een

toename van SOI zonder


DRG 51 2,4 148,28 28 1,0 0,59

Verblijven met een daling

van SOI zonder


DRG 65 3,0 -185,26 232 8,2 - 418,65

APR-DRG: all patient refined diagnosis related groups; SOI: severity of illness; Dagen: veranderingen in LOS uitgedrukt in dagen = dagen zoals geregistreerd vóór audit – dagen zoals herberekend na de audit.

Vermits de selectie van de knipperlichten gebaseerd is op hun fraudepotentieel, beoordeeld

op gronden van klinische waarschijnlijkheid, lijkt het zinvol hun waarde als

opsporingsmiddel van “up-coding” beter te omschrijven aan de hand van de opgedane

ervaring. Daarom keken we ook, in gevallen van onenigheid, naar de mate van onenigheid

tussen auditeur en geauditeerde per knipperlicht (Tabel 6).


213

Vooral chronische obstructieve longaandoening (496), morbide obesitas (278.01), niet

gepreciseerde respiratoire decompensatie (518.81), chronische nierinsufficiëntie (585) en

doorligwonden (707) schijnen efficiënte knipperlichten te zijn. Acute post-hemorragische

(285.1) en niet-gespecificeerde anemie (285.9) schijnen weinig efficiënte knipperlichten

op gebied van fraudedetectie en lijken meer een teken van onzorgvuldig coderen te zijn.

Tabel 6: Onenigheid tussen auditeur en geauditeerde voor een bepaalde aandoening: aantal, percentage en weerslag op de LOS.

ICD-9-CM code V D+ V D- V D0 V Totaal

038.9 13 108.53 28 -122.69 87 0 128 -14.16

278.01 4 34.94 22 -74.91 76 0 102 -39.97

285.1 5 39.22 3 -5.39 59 0 67 33.82

285.9 13 32.51 8 -75.23 70 0 91 -42.73

287.5 1 2.72 4 -8.65 59 0 64 -5.92

425.4 1 23.30 15 -79.65 25 0 41 -56.35

426.89 0 0 0 0 18 0 18 0

429.79 0 0 2 -8.10 33 0 35 -8.10

496 6 34.31 72 -171.93 322 0 400 -137.62

518.81 13 43.24 77 -400.17 56 0 146 -356.92

560.39 1 1.94 1 -2.88 33 0 35 -0.94

585 3 24.57 7 -21.49 92 0 102 3.09

707.0X 1 0.33 3 -17.20 7 0 11 -16.87

Totaal 61 345.62 242 -988.30 937 0 1240 -642.68

V: aantal verblijven; D+: toename van LOS uitgedrukt in dagen (dagen zoals geregistreerd vóór audit – dagen zoals herberekend na de audit ); D- : daling van LOS uitgedrukt in dagen (dagen zoals geregistreerd vóór audit – dagen zoals herberekend na de audit ); D0: geen verandering in LOS


Naast deze explorerende benadering wordt op dit ogenblik op basis van het algoritme dat

de SOI toekent195 systematisch gezocht naar nieuwe knipperlichten. Deze aanpak moet

toelaten het detectiearsenaal te optimaliseren.

Merken we tenslotte op dat er naast evidentie van een evolutie van onder-coderen naar

normo-coderen er een groot aantal abstractie- en codeerfouten gemaakt worden zonder

weerslag op de financiering maar die wel andere toepassingen van de MKG, zoals

indicatoren van performance/kwaliteit, in gevaar kunnen brengen.

4.2.4 Discussie Wij hebben een belangrijke evolutie kunnen aantonen van het verschil tussen de

waargenomen en verwachte gemiddelde ligduur in de Belgische ziekenhuizen. Ook stelden

we een aanzienlijk aantal codeerfouten vast zonder financiële implicaties en dit zowel

tijdens de aselecte als de gerichte audits. Bij gerichte audits, uitgevoerd wegens een

opwaartse trend van een knipperlicht, werd er in meer dan de helft der gevallen geen

codeerfout aangetroffen, wat, indien supplementatie uitgsloten werd, wijst op een

verbetering van de codeerpraktijk in die ziekenhuizen.

Verder bleken de codeerfouten vastgesteld tijdens een aselecte audit zeer bi-directioneel te

zijn, waar dit voor de gerichte audits helemaal niet het geval was. In het laatste geval werd

er een onterechte verlenging van de verblijfsduur vastgesteld van 642,68 dagen voor 334

verblijven wat ons vermoeden van fraude bevestigde. Deze bevindingen kunnen

bijgedragen hebben tot de veranderingen in de geobserveerde en verwachte verblijfsduur.

Ook op het niveau van de individuele ziekenhuizen stelden we sterk afwijkende tijdtrends

vast en dit zowel op het niveau van de macroanalyse als op dat van de knipperlichten.

Het fout coderen heeft meerdere ongewenste gevolgen. Naast de financiële en

epidemiologische implicaties op het gebied van respectievelijk kostenbeheersing en

tijdsreeksen529, bemoeilijken zij de analyse van kwaliteitsindicatoren op basis van

administratieve gegevens door hun vertekenend impact op de co-morbiditeit en bijgevolg

op de risicocorrectie. Ook benadeelt het frauduleus coderen door een ziekenhuis de

financiering van de andere ziekenhuizen omdat voor de ziekenhuisfinanciering een vast

bedrag voorzien is voor het geheel der ziekenhuizen. Verder kunnen codeerafwijkingen

leiden tot moeilijkheden bij de interpretatie van de evolutie van belangrijke kenmerken van


215

het zorgsysteem zoals de zwaarte van de pathologie. Tenslotte kunnen zij de evaluatie van

het functioneren van het zorgsysteem verstoren, met name wanneer de geobserveerde

verblijfsduur vergeleken wordt met de verwachte verblijfsduur kan een systematische

overcodering de berekening van de verwachte verblijfsduur verstoren.

Fraude is derhalve een praktijk die niet alleen de financiering van het gezondheidssysteem

maar ook de bruikbaarheid van de MKG voor het volksgezondheidsbeleid in gevaar

brengt. Nochtans toont de ervaring aan dat het fraudebevorderend effect van het PPS kan

tegengegaan worden. Maatregelen zoals het verplicht attesteren door de behandelende

geneesheer van de bij ontslag vermelde diagnoses en ingrepen, en de kordate audit van de

ontslaggegevens met financiële weerslag in geval van fraude hebben hun doeltreffendheid

bewezen.140;321;336

Onze studie vertoont een aantal beperkingen. Zo is de keuze van knipperlichten, gebaseerd

op hun klinisch potentieel, voor verbetering vatbaar. Een selectie gebaseerd op een

grondige analyse van het algoritme dat de SOI-klasse toekent is wellicht efficiënter.

Verder is het niet onmogelijk dat de lineaire trend, die we gebruikten, niet altijd in de best

mogelijk fit van het model resulteerde. We menen nochtans dat de bereikte fits een

efficiënte, routinematig uitgevoerde fraudedetectie toelieten. Tenslotte is het aannemelijk

dat ziekenhuizen, die reeds lang frauduleus coderen en een bepaald fraudeniveau

aanhouden, ontsnappen aan onze, op een trendanalyse toegespitste fraudeopsporing. Aan

dit euvel kan verholpen worden door imput van de aselecte audits te gebruiken en door een

classificatie van de ziekenhuizen in termen van case mix uit te werken, die de

periodeanalyse meer zinvol zou maken.

Een andere zwakte van onze studie bestaat uit een mogelijk maar moeilijk te meten gebrek

aan interbeoordelaar betrouwbaarheid tussen de auditeurs, wat tot verschillende

appreciaties zou kunnen geleid hebben bij een zelfde type van codeerprobleem.

Interbeoordelaar variabiliteit is een welbekend nadeel verbonden aan het peer-review 279;349, waaraan we trachten te verhelpen door intensieve casusbesprekingen door de

auditeurs, door het uitwerken van en verwijzen naar nationale codeerrichtlijnen en door in

de mogelijkheid te voorzien om beroep aan te tekenen voor een ziekenhuis dat zich

onrechtvaardig behandeld voelt.


Het was vooralsnog niet mogelijk, wegens het beperkt aantal auditeurs, op een correcte

manier aselecte en gerichte audits met elkaar te vergelijken op hun doeltreffendheid.

Dergelijke doelstelling veronderstelt immers het uitvoeren in dezelfde ziekenhuizen van

beide types van audit op hetzelfde ogenblik, een doelstelling die we in de toekomst hopen

te verwezenlijken.

Zoals voormeld vertoont het ‘systeem’ een neiging tot verzwaring van de pathologie en dit

zowel voor ziekenhuisopnamen als voor daghospitalisaties. Is dit een reëel verschijnsel en

betekent dit dat de gezondheid van de bevolking erop achteruit gaat, of dat zieken meer

laattijdig opgenomen worden (verminderde toegankelijkheid van het gezondheidssysteem),

of vertaalt dit een groeiend bewustzijn bij de artsen van een tot dan onderschat

gezondheidsprobleem, of heeft dit te maken met het aanbieden van meer gespecialiseerde

diensten, of is dit een gevolg van veranderende codeergewoonten?

We hebben het bestaan aangetoond zowel van verbetering van het coderen als van het

overcoderen. Het is niet onwaarschijnlijk dat nog andere van deze fenomenen bijdragen

tot de vastgestelde verzwaring van de pathologie.

De voorgestelde knipperlichtmethodologie is alleen een screening: namelijk het vaststellen

van een afwijkende evolutie van een knipperlicht. Het is de audit die uiteindelijk bepaalt of

en in welke mate de afwijkende evolutie te wijten is aan het ten onrechte toekennen van

«verzwarende» codes. De knipperlichtenmethode, vooralsnog een concept, heeft nood aan

feedback en input van de auditeurs om zijn nut aan te tonen en te verhogen. Het chronisch

gebrek aan dit type personeel is hierbij een te betreuren belemmering. Een sporadisch

uitgevoerde audit kan overigens niet dezelfde graad van ontrading genereren op de

ziekenhuizen om niet-correct te coderen als een regelmatige audit.

Tenslotte wensen wij de noodzaak te onderstrepen om de MKG te gebruiken vanuit

meerdere, complementaire invalshoeken. De kwaliteit van de gegevens is hier een

illustratie van. Het overcoderen bijvoorbeeld, berust vaak op een kunstmatige verzwaring

van de pathologie en verwikkelingen, zoals septicemie, zijn hiervoor een geschikt

instrument.


217

De ICD-9CM classificatie en de erop gebaseerde APR-DRG en SOI bepalingen, maken

geen onderscheid tussen bestaande en in het ziekenhuis opgelopen verwikkelingen.

Vermits de financiering op haar beurt gebaseerd is op APR-DRGs en SOIs, levert dit

bijgevolg ook winst op aan het ziekenhuis in termen van de “verantwoorde activiteit”.

Toch lijkt het niet onlogisch dat de meerkosten die voortvloeien uit de behandeling van

verwikkelingen vergoed worden, ook al zijn ze iatrogeen. Het is dan wel nodig dat de

kwaliteit van de zorgen bijgestuurd wordt. Dit zorgenaspect veronderstelt een goede

monitoring van de zorgenkwaliteit via de MKG, die op zijn beurt een adequate

risicocorrectie veronderstelt. De gerichte audit lijkt derhalve belangrijk om, gecombineerd

met de aselecte audit, de codeerkwaliteit van het geheel der ziekenhuizen op te volgen en

te evalueren, en op die manier de monitoring van de kwaliteit van zorgen gebaseerd op

onze administratieve gegevens op een zinvolle manier mogelijk te maken.

4.3 ALGEMEEN BESLUIT

Tijdens het ganse verzamelings- en verwerkingsproces, van af de diagnosestelling tot het

aanmaken van het gegevensbestand kunnen onvolmaaktheden, fouten en vergetelheid de

kwaliteit van de gegevens aantasten en doen ze dit ook werkelijk. Ook varieert de kwaliteit

van de gegevens over de tijd en is functie van de leeftijd, geslacht van de geregistreerde;

van het type aandoening; van het type medische handeling (diagnose, ingreep); van het

gebruik van de gegevens door de diensten, die registreren; en, van het registratiesysteem

en zijn bewakingsmechanismen.

Dit betekent niet dat deze gegevens onbruikbaar zijn – laten we de baby niet weggooien

met het badwater533 – wel (1) dat ze grondig op hun waarde getoetst moeten worden, en

(2) dat er voorzichtig omgesprongen wordt met de interpretatie van de resultaten van

uitgevoerde studies. De nodige methoden en na te volgen voorbeelden van “hoe het kan”

zijn voorhanden.

Verder zijn samenwerking met andere registraties, creativiteit bij de validatie, feedback en

intensieve audit noodzakelijk, zeker wanneer deze gegevens een belangrijke rol blijken te

spelen in het financieringsmechanisme van ziekenhuizen en het gebruik van

kwaliteitsindicatoren. Vorming van de artsen, stringente regelgeving op het aanmaken van


de gegevensbestanden met inbegrip van het verplicht attesteren van de diagnosen door de

arts en intensief peer review kunnen in belangrijke mate de verstoring van de

gegevenskwaliteit veroorzaakt door het financieringsmechanisme opvangen.

De kwaliteit van de gegevens van de overlijdensstatistieken deelt grotendeels in de

gebreken van de ziekenhuisontslaggegevens. Specifieke moeilijkheden worden gesteld

door de certificatie met zijn specifieke, oorzakelijke logica, waar artsen vaak geneigd zijn

te redeneren vanuit het principe van de ernst. Ook hier lijkt een adequate vorming van de

artsen een noodzakelijke voorwaarde voor verbetering. Hoewel over het ganse land een

duidelijke verbetering van de codeerkwaliteit wordt vastgesteld blijft de tijdigheid van de

statistiek problematisch in het zuidelijk landsgedeelte en derhalve ook van de nationale

statistiek. Vergeten we hierbij niet “dat er binnen het systeem van de

bevolkingsstatistieken geen enkele andere bron voor gezondheidsgegevens bestaat, die

even universeel is in dekkingsgraad, in uniformiteit, en tijdigheid als de

sterftegegevens.”250

219

Hoofdstuk 5: Kwaliteit van zorgen

In dit hoofdstuk trachten we aan de hand van twee casussen het gebruik te illustreren van

administratieve gegevens, in casu de MKG, ten behoeve van de volksgezondheid. Zij

geven de mogelijkheden en beperkingen van administratieve gegevens weer op gebied van

het beoordelen van de kwaliteit van zorgen in de Belgische ziekenhuizen. Dit gebeurt

enerzijds via de analyse van interziekenhuis verschillen m.b.t. het keizersnedencijfer, een

procesindicator, en anderzijds via een gelijkaardige analyse maar dit keer op gebied van

letaliteit na een opname voor acuut myocardinfarct, een uitkomstindicator. Deze twee

kwaliteitsindicatoren werden uitgewerkt volgens de in deel I voorgestelde concepten en

uitgewerkte methodologie

Kwaliteit is echter organisatiegebonden en kwaliteitsinitiatieven vinden plaats binnen

organisaties, die zelf deel uitmaken van het gezondheidssysteem. Veranderingen zullen

derhalve een “multifaceted” en organisatorische aanpak vragen.534-536

Het is hier onze bedoeling beide kwaliteitsinitiatieven te kaderen in een organisatorisch

perspectief, dat een aantal aanknopingspunten biedt voor hun welslagen.

5.1 INLEIDING: KWALITEIT VAN ZORGEN, ORGANISATORISCHE CULTUUR EN

ADEQUATE GEGEVENS.

Sinds oktober 1990 worden de Minimale Klinische Gegevens (MKG) door de

ziekenhuizen geregistreerd en vervolgens door de overheid verzameld en verwerkt. Deze

gegevensset werd ontwikkeld in overeenstemming met Europese aanbevelingen.537

Vooralsnog werden de MKG voornamelijk gebruikt voor de financiering van de

ziekenhuizen. Het is in dit proefschrift de bedoeling het toepassingsgebied van de MKG

uit te breiden naar kwaliteit257/performance264 van de zorgen en de resultaten van deze

eerste verkenning ter beschikking te stellen van clinici, ziekenhuisverantwoordelijken,

artsencolleges en de overheid, als “borger” van de publieke belangen.72 Dergelijke

informatie, hoe partieel ook, biedt niet alleen aan de zorgensector de mogelijkheid tot

kwaliteitstoetsing en verbetering waar nodig maar is ook fundamenteel voor het voeren

van een gezondheidsbeleid, zeker voor een “terugtredende” overheid, die de

Hoofdstuk 5: Kwaliteit van zorgen 220

dagdagelijkse verantwoordelijkheid voor de zorgen “uitbesteedt” maar wel de

“toezichthouder, marktmeester en de borger van publieke belangen” blijft.72

Zoals voormeld (Hoofdstuk 2, sectie 2.1.1) zijn kwaliteit en performance echter complexe

begrippen, die op verschillende manieren gedefinieerd worden en die mekaar vaak

overlappen.72;262 en waarvan doeltreffendheid13 (“effectiveness”), potentiële

doeltreffendheid265 (“efficacy”), doelmatigheid13 (“efficiency”), billijkheid (“equity”) 6;15;16;538;539 en verantwoording afleggen (“accountability”)70;71;540;541 door zorgverstrekkers

en overheid basisbegrippen vormen(Hoofdstuk 2, sectie 2.1.1). Donabedian voegt hieraan

de begrippen aanvaardbaarheid van de behandeling, legitimiteit en optimaliteit toe om tot

een overkoepelende visie van kwaliteit te komen.265

Aanvaardbaarheid van de behandeling houdt in dat artsen rekening houden met

patiëntenvoorkeuren, met zijn vragen en bekommernissen waaronder de kosten, en hem de

doeltreffendheid van de zorg zodanig uitlegt dat de patiënt een werkelijk geïnformeerde

keuze kan maken. Deze speciale focus op de patiënt, de zogenaamde patient-

centeredness265;268;542, en ook op het tijdig verstrekken van zorgen krijgen overigens heden

ten dage steeds meer aandacht bij de beoordeling van kwaliteit268;543. Legitimiteit betekent

dat de zorg aanvaardbaar moet zijn voor de maatschappij. Optimaliteit tenslotte wordt

bereikt wanneer de verstrekte zorg “optimaal” doeltreffend is of bij de beste verhouding

tussen kwaliteit en kosten.

Kwaliteitselementen kunnen elkaar versterken of integendeel met mekaar in conflict

komen. De meest storende conflicten ontstaan wanneer maatschappelijke en individuele

voorkeuren verschillen. Het is dan de faire verdeling over de ganse bevolking van zorgen

in functie van medische noden, risico en het nut van de zorgen, die het arbitrageproces

dient te leiden.265;270Kwaliteit, waarin het begrip aanvaardbaarheid voor de individuele

patiënt en voor de maatschappij vervat zijn, kan dus niet alleen in technische termen

beoordeeld worden door professionele zorgverleners.257;265;269 In deze visie, die onze

analyses inspireerde, wordt er bijgevolg rekening gehouden met zowel technische aspecten

als interpersonele relaties.257;265


221

Administratieve gegevens, zoals onze MKG, laten echter niet toe de kwaliteit van zorgen

in hun totaliteit te meten. Zij zijn immers alleen een neerslag van een selectie van

technische aspecten van zorg in verband met diagnose, behandeling en uitkomsten.

Uitkomsten van behandelingen kunnen uitgedrukt worden als de som van de

doeltreffendheid van de behandeling plus risicofactoren, die het antwoord op de

behandeling beïnvloeden, plus kwaliteit van de zorg plus toeval.188Vermits de

doeltreffendheid van een behandeling gekend is en de toevalsfactor door statistische

methodologie kan ondervangen worden, is het mogelijk de kwaliteit van de verstrekte

zorgen te beoordelen op voorwaarde dat men corrigeert voor de risicofactoren.178;188Door

de afwezigheid van een ideaal systeem van risicocorrectie en het feit dat de gebruikte

systemen tot verschillende resultaten leiden is deze correctie, zoals voormeld (Hoofdstuk

2, sectie 2.2.1.4), geen eenvoudige zaak189;325 en stelt men dat de grootste voorzichtigheid

geboden is bij de interpretatie van studies gebaseerd op administratieve

gegevens102;103;319;494.Verder is het zo dat risicocorrectie niet alleen problemen kan stellen

wanneer het over uitkomstindicatoren gaat maar ook bij de interpretatie van

procesindicatoren zoals het onder- of overgebruik van diensten.

Overigens hebben we te maken met nog andere beperkingen en onzekerheden: verschillen

in definities van diagnosen en ingrepen, en onvoldoende correctie voor vertekening

(“confounding”) door geen of onvoldoende rekening te houden met de sociaal-

economische status (SES) en met verwijzingspatronen en andere vormen van

patiëntenselectie544. Een laatste, dubbele onzekerheid houdt verband met de

onvolmaaktheid van de gegevens en dit enerzijds wegens problemen in verband met het

abstraheerproces en het toekennen van een diagnose en anderzijds wegens

codeerproblemen (overcodering en ondercodering), die maken dat de vergelijkingen tussen

ziekenhuizen vertekend kunnen zijn.1;60;79;101;135;138;163;169;189;312;319.

Administratieve gegevens laten derhalve geen definitieve uitspraken toe op gebied van

kwaliteit/performance. Hun gebruik als een screening545 naar onder- en bovenmaatse

kwaliteit van zorgen op basis van duidelijk omschreven en goed geregistreerde processen

(bijvoorbeeld het keizersnedencijfer) of uitkomsten [bijvoorbeeld perinatale uitkomsten na

keizersnede, en sterfte na een acuut myocardinfarct (AMI)] lijkt wel een bruikbare


werkhypothese. Laten we ervan uitgaan dat het adagium “Wat niet gemeten kan worden

kan ook niet veranderd worden” het begin is van de wijsheid ook bij het onderzoek over

gezondheidsdiensten546, en dat elke benadering voor het beoordelen van kwaliteit kan

bekritiseerd worden, of de meting nu berust op ontslaggegevens of op patiëntendossiers. 547

Daar we ons bewust zijn van de beperkingen bij de analyses, trachten we verder de nodige

caveats op een zichtbare manier aan te brengen en rekenen op de inbreng van de clinici en

de Colleges van geneesheren om deze indicatoren tot een voor hen bruikbaar instrument te

maken.409;548

Concluderend: de bij de indicatoren gewonnen informatie is een screening545, die alleen

via een verder onderzoek tot een vaststelling kan leiden. Zij tracht aan de ziekenhuizen

een aanknopingspunt aan te reiken voor zelfevaluatie en eventuele verbetering, helpt de

Colleges ziekenhuizen met vermoedelijke bovenmaatse en ondermaatse zorgen te

identificeren, en biedt hen en aan de overheid de mogelijkheid om bepaalde facetten en

oorzaken van mogelijke verscheidenheid364 binnen het gezondheidssysteem te

identificeren, aanknopingspunten voor verder te ondernemen acties.

Voor onbedoelde voorvallen (Hoofdstuk 2, sectie 2.3) lijkt, zoals voormeld, de rol van

administratieve gegevens echter beperkter en situeert zich vooralsnog veeleer in hun

monitoring zowel op een globaal nationaal vlak als op dat van individuele ziekenhuizen

dan wel in een vergelijking tussen ziekenhuizen.177;258Verder zijn sommige auteurs ervan

overtuigd dat, wegens de mogelijke gerechtelijke implicaties, het melden van een

ongewenste gebeurtenis een systeem veronderstelt dat bescherming biedt aan de melder

behalve in geval van patente nalatigheid.495;549;550 Vanuit een standpunt van

kwaliteitsverbetering en van gedeelde verantwoordelijkheid van alle partners in het

zorgsysteem, lijkt het daarentegen beter openheid na te streven. Een melding laat immers

toe verbeteringsacties op te zetten en biedt ook op gerechtelijk vlak het voordeel

kwaliteitsvolle praktijken te kunnen aantonen.496;551

Voor onze analyses deden wij beroep op de indicatoren van de Agency of Healthcare

Research and Quality (AHRQ), uitgewerkt door de AHRQ in samenwerking met het

Evidence-based Practice Center van de Stanford universiteit. Deze, naar we menen,

uitstekend onderbouwde indicatoren zijn net als de onze gebaseerd op


223

ziekenhuisontslaggegevens, ICD-9-CM codering, AP-DRGs en APR-DRGs. 77;552 Bij deze

oefening stellen we twee indicatoren voor: het keizersnedencijfer bij laagrisico

verlossingen en ziekenhuisletaliteit na opname voor acuut myocardinfarct. We menen

echter dat een aantal processen en structuurelementen gemeenschappelijk zijn binnen een

ziekenhuis en dat hiermee rekening dient gehouden te worden bij de verbeteringsacties die

men, naar aanleiding van de resultaten van de uitgevoerde screening, wil opzetten.

Het verzekeren van de verantwoordelijkheid en de verbetering van de kwaliteit zijn twee

van de meest betekenisvolle uitdagingen waarvoor de gezondheidssystemen geplaatst

worden553:

“Health systems fail to provide treatments that are know to work, persist in using

treatments that don’t work, enforce delays and tolerate high levels of error”.554Om hieraan

te verhelpen is er inzicht nodig in wat een organisatie is en hoe een verandering best

doorgevoerd wordt, maar ook welke rol de MKG hierin eventueel kunnen vervullen.

Een werkelijke verbetering vereist niet alleen een verandering van de individuele

praktijkvoering maar ook van het zorgsysteem als organisatie.555 Het is immers zo dat

organisatorische problemen - het “systeem” en niet de “individuen” - en organisatorische

cultuur bijna altijd de oorzaak zijn van “rampen” op gebied van mortaliteit en dat ze,

wanneer onderkend, een vertrekput zijn voor verbeteringsacties.426;495-498;556 “In aviation it

is not merely the pilot who is responsible for the outcome of a flight; it is the pilot, the air

traffic controllers, the maintenance crew, the stewards, and the ground staff – in other

words, the aviation system.”495

Als men wenst een organisatie te veranderen lijkt het aangewezen die strategieën voor

kwaliteitsverbetering te gebruiken die de grootste slaagkans bieden.557 Dit houdt onder

meer in (1) dat men beter interventies plant met meerdere facetten dan enkelvoudige zoals

het verspreiden van richtlijnen of opvoedkundig materiaal; (2) dat men grotere slaagkansen

heeft indien interventies gecombineerd zijn met audit en feedback, en met een

“onderscheiding” voor kwaliteitsvolle organisaties; en, (3) dat financiële stimulansen

verandering kunnen teweegbrengen, maar een bot instrument zijn en er gevaar bestaat voor

perverse reacties.557


Elke veranderingsstrategie van de organisatorische cultuur dient een evenwicht na te

streven tussen continuïteit en vernieuwing, waarbij een identificatie gebeurt van de te

behouden en versterken, en de te veranderen culturele aspecten.558Succesvolle strategieën

houden rekening met de noden, vrees en motivatie van het personeel en dit op alle

niveaus.558Het is daarbij belangrijk voor ogen te houden dat diepgewortelde meningen en

waarden zoals de autonomie van de clinicus bijvoorbeeld moeilijk te veranderen zijn.558

Verandering heeft overigens alleen een slaagkans wanneer degenen waarvan het werk

bestudeerd wordt ook in het veranderingsproces betrokken werden.555

Een aantal ervaringen kunnen behulpzaam zijn bij de concrete uitwerking van een

veranderingsinitiatief. Hoewel een uitgebreide artsenparticipatie in een kwaliteitsteam

wenselijk is, lijkt ook een intense deelname van ziekenhuisstaf en managers belangrijk en

stelt men dat samenwerking tussen beide groepen de sleutel tot verandering is.547;559 Het is

ook niet zeker dat clinici, die vrijwilligers zijn voor de rol van klinische leiders, de nodige

ervaring met organisatorische verandering hebben.557

Men acht het in het algemeen verkieslijk beroep te doen op multidisciplinaire teams om

veranderingen te verwezenlijken, maar dit vereist volgehouden aandacht en aanpassing.560

Hierbij dient men er rekening mee te houden dat een inzet van meerdere eenheden in een

ziekenhuis best gebeurt voor aan elkaar gerelateerde kwaliteitsprojecten. Immers, indien

men ze inzet voor een wijde waaier van ongerelateerde kwaliteitsprojecten is het gevaar

voor focusvervaging niet ondenkbeeldig.547

Een randvoorwaarde voor succes van een nationale, kwaliteitsverbeterende strategie is de

voortdurende investering in een passende infrastructuur en in beschermde tijd voor

kwaliteitsbevorderende activiteiten.557 Veranderingen veronderstellen namelijk tijd en

ruimte waarbinnen de nieuwe vaardigheden kunnen verworven worden zoals controle op

het werkproces, ontwikkelen en implementeren van klinische paden, en het veranderen van

de natuur van het professionele werk.561

Adequate informatie, die verschillen beschrijft tussen gezondheidszorgverleners in

kwaliteit, kosten en beschikbaarheid van diensten, wordt vaak als essentieel beschouwd

voor verbeteringsinitiatieven. Zij zou onder meer tot een bewuste en gefundeerde


225

consumentenkeuze kunnen leiden, die op haar beurt de zorgensector zou verplichten tot

kwaliteitsverbetering.562

In een studie, waarbij het effect van niet of nauwelijks risicogecorrigeerde “profielen” op

het consumentengedrag bestudeerd werd, bleken profielen dit gedrag echter niet te

beïnvloeden,562 zelfs indien dat publiek het verlangen naar dergelijke informatie kenbaar

gemaakt had.402;553 Zijn de consumenten ontevreden over wat zij beschouwen als de sluier

van geheimhouding en beroepsbescherming en/of verlangen zij niet steeds te handelen als

consument in alle aspecten van het moderne leven? 553

Profielen stimuleerden echter wel organisaties om hun eigen gegevenssystemen te

ontwikkelen en te verbeteren.553

Wegens het vaak misleidende karakter van profielen (zie hoofdstuk 3, sectie 3.3.1)

verkozen wij een anonieme feedback te verstrekken aan de clinici en de verschillende

beleidsinstanties. Wij maakten op de anonimiteitregel één uitzondering: in de feedback

naar de Colleges van geneesheren kan de anonimiteit van de Bonferroni-gecorrigeerde

“outlier” ziekenhuizen opgeheven worden, indien de betrokken ziekenhuizen hiermee

instemmen. Het leek ons overigens noodzakelijk dat de feedback naar de clinici gedragen

werd door gezaghebbende instanties zoals de Colleges van geneesheren, dat hij verbetering

als bedoeling had, dat hij duidelijk de graad van evidentie aangaf en dat hij voorzag in een

hulp bij de interpretatie.

Gegevens gebruikt voor verbeteringsinitiatieven moeten accuraat genoeg zijn om acties op

te zetten maar hoeven niet perfect zijn553;554omdat het bekomen van perfecte gegevens

uitermate kostelijk en tijdsverslindend190;553is. We gaan er derhalve van uit dat

pragmatisme de sleutel voor verandering is. Bijvoorbeeld bleek het gebruik maken van

kleine representatieve steekproeven met zowel kwantitatieve als kwalitatieve gegevens en

het inbouwen van gegevensverzameling in het dagelijkse werk gepaard te gaan met een

toename van het voorgeschreven oogonderzoek bij diabeteslijders van 65% tot 85%.554

Een stevige structuur voor adequate gezondheidsinformatie is bijgevolg een belangrijke

hulp voor het opzetten van verbeteringsinitiatieven in de gezondheidszorg.563Het is dan

zaak na te gaan of de MKG voldoende accuraat zijn om zinvolle kwaliteitsinitiatieven te

laten kiemen.


5.2 KAN HET SCREENEN VOOR INTERZIEKENHUIS VERSCHILLEN IN

KEIZERSNEDENCIJFER BIJ LAAGRISICO VERLOSSINGEN DOOR MIDDEL VAN

ADMINISTRATIEVE GEGEVENS BIJDRAGEN TOT KWALITEITSINITIATIEVEN IN DE

GEZONDHEIDSZORG?

Gebaseerd op dit onderhoofdstuk, dat onderzoek uit 2004-6 weergeeft, boden we een

manuscript aan: Aelvoet W, Windey F, Molenberghs G, Verstraelen H, Van Reempts P,

Foidart JM. Screening for inter-hospital differences in cesarean section rates in low-risk

deliveries using administrative data. An initiative to improve the quality of care.

BMC Health Services Research 2008;8(1)3.133

5.2.1 Inleiding Tijdens de laatste drie decennia namen de keizersnedencijfers (KSCs) voortdurend toe en

werden er ruime verschillen in KSCs vastgesteld tussen landen, streken en zelfs

ziekenhuizen, met een vergelijkbaar sociaal-economisch profiel.564-574. Dit leidde er toe dat

keizersneden (KS) gingen beschouwd worden als een te vaak gebruikte ingreep. Zowel

electieve herhalingssectio’s als primaire electieve KS droegen in belangrijke mate bij tot

de stijging van het KSC. In de VS bijvoorbeeld, steeg, tijdens de periode 1998 tot 2001,

het KSC met ongeveer 14%, en stegen de cijfers voor een primaire en een electieve,

primaire KS met respectievelijk 13% en 53%.575 terzelfder tijd daalde, tijdens de periode

1996 tot 2000, het cijfer van de vaginale bevallingen na sectio (VBS) met 27% wegens, de

zelden optredende maar potentieel catastrofale risico’s en medico-legale

beschouwingen.576-582

In afwezigheid van gerandomiseerde klinische studies is het moeilijk de balans op te

maken tussen een electieve KS en een vaginale bevalling.572 De bestaande evidentie

suggereert dat verschillen in korte en lange termijn uitkomsten voor moeder en kind tussen

een electieve KS en vaginale bevalling verminderen583 maar geeft nog steeds aan vaginale

bevalling het voordeel565;573;583-588, hoewel sommige auteurs stellen dat een electieve KS

even veilig is of zelfs veiliger dan een vaginale bevalling589-592.


227

De korte en lange termijn verwikkelingen na een vaginale bevalling bestaan onder meer uit

perineale pijn; urinaire en fecale incontinentie (vooral na een forceps 583;590;593-595) en

maternale transmissie van bepaalde infectieziekten. Een poging tot vaginale bevalling kan

resulteren in een spoedkeizersnede, die geassocieerd wordt met een verhoogde maternale

mortaliteit en morbiditeit. Tenslotte kunnen vaginale verlossingen gepaard gaan met intra-

partum sterfgevallen en geboorte traumata’s.583;589

Voor KS omvatten de korte en lange termijn verwikkelingen pijn; urinaire en

wondinfecties; maternale sterfte; thrombo-embolische verwikkelingen; abruptio placentae

(2-4%); placenta previa (1-4%) en accreta (toegenomen met een factor van 10 over de

laatste 50 jaar) tijdens de volgende zwangerschappen; hysterectomie van het post-partum

(0.25-4.6%); ectopische zwangerschap; belangrijke obstetrische bloedingen bij de

volgende bevallingen; beschadiging van de bekkenbodem; fecale en urinaire incontinentie,

zij het waarschijnlijk in mindere mate dan na een vaginale

bevalling.574;583;589;590;593;595;596;596-598 Daarenboven zijn keizersneden gekenmerkt door

hogere kosten voor moeder en maatschappij564;568;593 en ging de toename van het KSC niet

gepaard met een lagere perinatale sterfte of met lagere asfyxiecijfers.574 Financiële

motieven en relatieve gemakkelijkheid kunnen tussenkomen in de besluitvorming en het

kan moeilijk zijn een onderscheid te maken tussen patiënten- en artsenkeuze.565;572;583-

585;589;599-601 Geïnformeerde toestemming; voorkeur en autonomie van de moeder; en

artsenfactor spelen eveneens een rol.573;574;583;602-606 De afnemende pariteit (de meeste

vrouwen hebben minder dan twee zwangerschappen) en medico-legale beschouwingen

kunnen de beslissing over de wijze van bevalling beïnvloeden.583;589;590;594

Om in een context van een eventueel overgebruik een valide, interziekenhuis vergelijking

van KSCs te maken, dient men de verplichte keizersneden uit te sluiten, uitgevoerd

wegens medische indicaties. Na exclusie van vrouwen, die reeds een keizersnede

ondergingen, identificeerden Gregory et al., o.b.v administratieve gegevens over 463.196

bevallingen, een aantal klinische indicaties voor een electieve (vóór de arbeid), primaire

KS (een vrouw die nog geen KS onderging).577 Twaalf klinische entiteiten bleken in

92,9% van alle keizersneden terug gevonden te worden: malpresentatie met inbegrip van

stuit (57,6%), antepartum bloeding (10,1%), herpes (5,49%), ernstige hypertensie (4,01%),

ander uteruslitteken (1,12%), meerlingzwangerschap (2,33%), macrosomie (4,52%), niet-


ingedaald foetaal hoofd (1,57%), maternale collageenziekten (1,60%), andere hypertensie

(3,03%), preterme zwangerschap (1,49%), fetale congenitale aandoening (0,15%), andere

(7,13%). Deze auteurs bepaalden een normatief cijfer van 4% primaire, electieve KS, en

stelden dat bij lagere cijfers ondergebruik dient vermoed te worden. 577

Een andere studie, ditmaal over de ganse VS, bevestigde niet alleen deze bevindingen

maar stelde daarenboven tussen 1997 en 2001 een significante toename vast van primaire,

electieve keizersneden. Meer bepaald voor ICD-9-CM codes m.b.t. malpresentatie (van

26.1 naar 29.8 ‰), antepartum bloeding (van 4,3 naar 5,9 ‰), ernstige hypertensie (van

1,9 naar 2,8 ‰), niet-ingedaald hoofd (van 1,0 naar 2,2 ‰), preterme zwangerschap (van

0,8 naar 2,0 ‰), maternale collageenziekten (van 0,9 naar 1,8 ‰) werden deze toenamen

vastgesteld. Dit wijst ofwel op een toegenomen incidentie van ernstiger vormen van deze

aandoeningen ofwel op een verandering van praktijkvoering, waarbij de arts voor dezelfde

indicatie voor een andere wijze van verlossing opteert.575

Doeltreffendheid, doelmatigheid, billijkheid en verantwoording afleggen zijn

basisbegrippen die gebruikt worden door zorgverstrekkers, onderzoekers, internationale

organisaties en overheden om performance en kwaliteit te beschrijven.6;7;15;16;70-72;265;538;539

We steunden hierbij op de definitie van het Institute of Medicine (IOM): “Kwaliteit van

zorg is de mate waarin de gezondheidsdiensten voor individuen en bevolkingen de

waarschijnlijkheid van verhoopte uitkomsten verhogen en overeenstemmen met de huidige

professionele kennis” en erkennen we de noodzaak om zowel processen als uitkomsten te

betrekken bij het beoordelen van kwaliteit.272;607 Verder inspireren we ons op het National

Healthcare Quality Report, dat een kader uitwerkte voor kwaliteit in de gezondheidszorg

met elementen zoals effectiviteit, veiligheid, tijdigheid, patiëntengerichtheid, billijkheid en

patiëntennoden (bijvoorbeeld gezond blijven, beter worden, leven met ziekte en

onbekwaamheid, omgaan met het einde van het leven).608 Tenslotte ontlenen we aan

Donabedian het inzicht dat kwaliteit technische, interpersonele en maatschappelijke

aspecten bevat, en dat daarbij rekening dient gehouden te worden met de aanvaardbaarheid

van de zorg voor de maatschappij.257;265


229

Ondanks de complexiteit van de keuze tussen electieve KS en vaginale bevalling bij

laagrisico verlossingen, menen we, zoals voormeld, dat de bestaande evidentie in het

voordeel pleit van een vaginale bevalling. Overigens zijn er verschillende landen waar lage

KSCs gepaard gaan met lage perinatale sterftecijfers, wat suggereert dat goede perinatale

uitkomsten geen hogere KSCs vereisen en dat lagere gestandaardiseerde cijfers

overeenkomen met betere obstetrische zorgen, hoewel een optimaal KSC nog niet bepaald

werd en ondergebruik van KS beschreven werd. 573;607 Klinische en epidemiologische

beschouwingen en ook het feit dat verschillende landen de wijze van verlossing als

kwaliteitsindicator564;609 gebruiken of gaan gebruiken, en dat geïnformeerde toestemming

en maatschappelijke beschouwingen tussenkomen in de besluitvorming leidden er ons toe

het KSC te gebruiken als kwaliteitsindicator. We dienden dan wel aan te tonen dat

verschillen in KSC tot verschillen in uitkomst leidden. 257;276;294;607

In een perspectief van kwaliteitsverbetering toonden we in deze studie klinisch en

statistisch belangrijke interziekenhuis verschillen aan in KSCs en een opwaartse nationale

KSC trend bij laagrisico bevallingen. Verder stelden we ook vast dat ziekenhuizen met een

hoog KSC geen betere neonatale uitkomsten hebben en dat er ook sprake was van

ondergebruik.

5.2.2 Methoden

5.2.2.1 Gegevensbronnen De MKG bevat patiëntengegevens (waaronder geboortejaar, geslacht, verblijfplaats, een

anoniem ziekenhuisidentificatienummer), verblijfgegevens(waaronder het jaar en de

maand van opname en ontslag, transfer vanuit en naar een ander ziekenhuis met

specificatie van het type ziekenhuis) en een onbeperkt aantal nevendiagnosen en ingrepen.

De ziekenhuizen worden verder gekarakteriseerd volgens onderwijsopdracht (al dan niet),

type van eigenaar (publiek of privé) en het al dan niet beschikken over intensieve

maternale en neonatale zorgen. De MKG verzamelt gegevens over alle verblijven met

inbegrip van niet-residenten.

Omdat we niet beschikken over een uniek identificatienummer dat zou toelaten een

transfer van een kind van één ziekenhuis naar een ander op te volgen, zijn de maternale en


de geboortegegevens van een getransfereerd kind niet beschikbaar in het opnemend

ziekenhuis. Deze gegevens zijn echter wel beschikbaar in het ontslagend ziekenhuis.

Om de volledigheid en de accuratesse van de gegevens na te gaan, welbekende pijnpunten

van administratieve gegevens182, werden ze vergeleken met gegevens van (1) het Nationaal

Instituut voor de Statistiek (NIS), dat voornamelijk betrekking heeft op residenten, (2) het

Studiecentrum voor Perinatale Epidemiologie (SPE) 610 en (3) elders gepubliceerde611

gegevens, om vervolgens te bepalen welke gegevens zouden gebruikt worden voor de

analyse. In het SPE register worden de perinatale sterfgevallen en de geboorten

geregistreerd, die zich in de Vlaamse obstetrische eenheden (residenten en niet-residenten)

voordoen, en verder een proportie van thuisbevallingen, die ongeveer 1 % van alle

bevallingen uitmaken. De gegevens worden op continue wijze verzameld en onderworpen

aan een georganiseerd systeem van kwaliteitsbewaking.610

5.2.2.2 Definitie van de studiepopulatie

Een valide interziekenhuis vergelijking van KSCs vereist ofwel een correctie voor case

mix of de definitie van een homogene risicogroep. In deze studie, trachtten we een

deelgroep van parturiënten te identificeren met een laag risico op een KS.607;612;613

Daarvoor steunden we op het werk van de Agency for Healthcare Research and Quality

(AHRQ)564, op literatuur die de redenen voor een verplichte KS575;577;607 aangeeft, op input

van het “College van geneesheren voor de moeder en pasgeborene” en op de volledigheid

en accuratesse van de gegevens.

Uit het geheel der bevallingen werden de laagrisico bevalling afgezonderd door exclusie

van bevallingen gekarakteriseerd door een abnormale ligging (met inbegrip van stuit), een

prematuriteit (< 37 weken), een doodgeboorte, een meerlingzwangerschap, een ingreep

voor stuitligging, wat de exclusiecriteria van de AHRQ zijn. Op vraag van het College

werden daarenboven bevallingen van kinderen met intra-uteriene groeirestrictie (IUGR) (<

2500g) of macrosomie (> 4499g) uitgesloten. Alle maternale karakteristieken werden

geïdentificeerd aan de hand van DRGs, of ICD-9-CM diagnoses and ingrepencodes

(Precieze ICD-9-CM diagnose en ingrepencodes kunnen op de AHRQ website gevonden

worden : (p. A27 http://www.qualityindicators.ahrq.gov/iqi_download.htm)).

http://www.qualityindicators.ahrq.gov/iqi_download.htm


231

Vanuit de MKG identificeerden we, voor de periode 2001 tot 2004, 459.171 levend

geboren eenlingen, in hoofdligging. Voor 455.933 kinderen, de bronpopulatie, konden we

de obstetrische gegevens van hun moeder terugvinden. Hiervan werden er 86.310 kinderen

(18,96%) via een keizersnede geboren. Door toepassing van de voormelde criteria op de

bronpopulatie definieerden we een studie en een controle populatie met respectievelijk

381.989 en 73.944 kinderen waarvan er respectievelijk 49.578 (12,98%) en 36.732

(49,68%) via keizersnede geboren werden.

5.2.2.3 Analyse De analyse had als bedoeling kwaliteitsinitiatieven te onderbouwen en niet het blameren

van individuen.495;496 We streefden ernaar zowel ziekenhuizen te identificeren met

bovenmaatse als met ondermaatse kwaliteit. De eersten als benchmark en

voorbeeldfunctie, de laatsten om hen te helpen hun kwaliteit te verbeteren. Daarom werd

ieder Belgisch ziekenhuis vergeleken met het geheel der ziekenhuizen.

Twee types analyses werden uitgevoerd: een eerste gericht op de KSCs van de ganse

tijdsspanne van de studie (de periode) en een tweede waarbij de aandacht uitgaat naar de

semestriële evolutie (de trend) van de KSCs.

In de literatuur werd er gesuggereerd dat administratieve gegevens niet de nodige

informatie van voldoende kwaliteit bevatten om systematische verschillen in case mix te

corrigeren in geval van een eerder klein relatief risico (RR), zoals een RR van 0,75.100

Daarom bepaalden we een zone van niet-interpretatie waarin we het cijfer of trend van een

ziekenhuis, vergeleken met het nationale cijfer en trend, als niet interpreteerbaar in termen

van “hoger” of “lager” beschouwden. Om de grenzen van dit gebied vast te leggen

berekenden we eerst de afwijking van een ziekenhuis ten opzichte van het nationale cijfer

en trend als volgt: afwijking (in %) = (RR -1) x 100. Vervolgens werd voor het KSC de

ondergrens gedefinieerd als een afwijking van - 25 % - wat overeenstemt met de RR van

0,75 - en de bovengrens als een afwijking van + 35%. Voor de trend, waar we over geen

literatuurreferentie beschikten, bepaalden we de boven- en ondergrens respectievelijk als

+ 5% en - 5%. In de andere gevallen, met een belangrijke afwijking, werden de resultaten

van de “screening” in functie van de beschikbare evidentie geïnterpreteerd.


Deze getallen werden eerder als een maatstaf van statistische evidentie gezien. Wij

noemden ze 1) “sterk” indien de probabiliteit om een even grote of nog grotere afwijking

aan te treffen als die van het bestudeerde ziekenhuis, gelijk is aan of kleiner dan

0,05/aantal te vergelijken ziekenhuizen (de zogenaamde Bonferroni-correctie voor

meervoudig gelijktijdig toetsen); 2) “matig” indien die probabiliteit kleiner is dan 0.05

maar groter dan 0,05/aantal te vergelijken ziekenhuizen; en 3) in de andere gevallen

“zwak”.

5.2.2.4 Doelstellingen van de studie De feedback van deze analyses viseert drie doelen: een feedback naar de ziekenhuizen om

kwaliteitsverbetering te stimuleren, een feedback naar de Colleges van geneesheren om

hen toe te laten ziekenhuizen te identificeren met zowel bovenmaatse als ondermaatse

kwaliteit, en een feedback naar de overheid om haar beleid te onderbouwen. Hij bestaat

hoofdzakelijk uit een grafische weergave van de afwijkingen van alle ziekenhuizen van het

nationale cijfer/trend, en uit een tabel met deze afwijkingen met een aanduiding van hun

statistische evidentie. Een hulp bij de interpretatie, met informatie over zowel de periode

als trendanalyse wordt er tevens in verstrekt. De beslissingsboom ervan wordt in “Bijlage

1” gegeven.

In de grafieken presenteren we drie categorieën ziekenhuizen: een groep met een “hoog

KSC”, bestaande uit de ziekenhuizen waarvan het betrouwbaarheidsinterval van het

keizersnedencijfer (na Bonferroni correctie) boven de zone van niet-interpretatie ligt; een

“laag KSC” groep bestaande uit de ziekenhuizen waarvan het betrouwbaarheidsinterval

van het keizersnedencijfer (na Bonferroni correctie) onder de zone van niet-interpretatie

ligt; en, in de andere gevallen, een “gemiddeld KSC” groep.

5.2.2.5 Neonatale eindpunten Daar het optimale KSC onbekend is, vergeleken we de drie KSC groepen op gebied van

neonatale uitkomsten. Perinatale morbiditeit en mortaliteit zijn voornamelijk te wijten aan

ademhalingsstoornissen, waarvan hyaliene membraanziekte (RDS), meconium aspiratie

syndroom (MAS) en tachypnee van de neonaat (TTN) de meest frequente zijn.614;615 Wij

selecteerden 1-minuut Apgar scores616-618; RDS, MAS, TTN, respectievelijk ICD-9-CM


233

codes 769,770.1 en 770.6; nood aan ademhalingondersteunende behandeling, en transfer

naar een gespecialiseerde dienst als perinatale eindpunten. Merk op dat in onze ogen de 1-

minuut Apgar scores, die in essentie foetaal lijden weerspiegelen, eerder als

procesindicator dan als uitkomstindicator dient beschouwd te worden. De 5-minuut Apgar

scores dienden dan om gevallen te identificeren van borelingen die langs vaginale weg

geboren waren en die wellicht beter via een KS zouden geboren zijn.

Om variabiliteit tussen verschillende waarnemers tegen te gaan en in overeenstemming

met de literatuur categoriseerden we de Apgar scores in drie groepen: “zeer lage” (Apgar

0-3), “lage” (Apgar 4-6), en “goede” (Apgar > 6) scores. 618-620 De volledigheid van de

Apgar scores is wellicht beter dan die van de andere neonatale eindpunten vermits ze

opgevraagd worden door middel van expliciet in te vullen items in tegenstelling tot de

andere, die van het type “open vragen” zijn en door een ziekenhuis al dan niet

geregistreerd worden. Omdat sommige majeure congenitale afwijkingen gerelateerd

kunnen zijn met een lagere Apgar score (Bijlage 2)621, voerden we de analyses ook uit met

uitsluiting van die gevallen.

5.2.2.6 Statistische methodes Wij veronderstelden dat wij via onze selecties een "Studie populatie" van laagrisico

bevallingen geïdentificeerd hadden. Om dit na te gaan hebben we het relatief risico en zijn

95% betrouwbaarheidsinterval berekend van een bevalling via keizersnede in de "Studie

populatie" versus in de "Controle Populatie". Deze RRs en hun 95%

betrouwbaarheidsinterval werden berekend door middel van StatCalc, een statistische

module van Epi Info 2000, gecreëerd door de Centers for Disease Control, en het Global

Program on IADS van de WGO.

Vermits onze aandacht voornamelijk uitging naar het geheel van de Belgische

ziekenhuizen en naar het identificeren van “outlying” ziekenhuizen, maakten we gebruik

van de zogenaamd “fixed effects” modellen.622 Hiërarchische modellen, gewoonlijk een

zogenaamd “random-effects” model, zouden een alternatief kunnen geweest zijn. Deze

modellen werden echter niet ontwikkeld om outliers te identificeren. Verder dient de

theorie voor het bepalen van wat outliers zijn nog ontwikkeld te worden voor de “linear

mixed” modellen en is het onmogelijk om outliers te identificeren in “non-linear mixed”


modellen. Tenslotte worden ziekenhuizen in de random-effects modellen beschouwd als

een aselecte steekproef uit de populatie van alle ziekenhuizen, wat in deze studie, waarin

alle ziekenhuizen zijn opgenomen, niet het geval was.

We vergeleken elk individueel ziekenhuis met alle Belgische ziekenhuizen door middel

van een logistische regressie442;484;623 om zowel een praktisch relevante als statistisch

significante afwijking van het nationale cijfer of trend te bepalen. Door een interactie term

in te bouwen in de logistische regressie tussen een lineaire tijdstrend, uitgedrukt in

semesters, en de individuele ziekenhuizen, werden ziekenhuizen met een abnormale

tijdsevolutie geïdentificeerd. Meer precies, vergeleken we de “slope” van de trend van elk

ziekenhuis met de nationale trend door middel van lineaire contrasten.

In geval van een frequente uitkomst (> 10%), of wanneer de odds ratio (OR) groter is dan

2,5 of kleiner dan 0,5, kan de schatting van het RR door de odds ratio’s, die de logistische

regressie produceert, in belangrijke mate vertekend worden. Zoals vermeld in hoofdstuk 3

deden we, om deze vertekening te verminderen, beroep op de benadering van het RR door

Zhang486, die we in de tekst en tabellen zullen vermelden als RRZ, en die we gebruikten om

de bovenvermelde afwijking te berekenen. Het verband tussen RRZ en OR kan als volgt

gelegd worden:

RRZ= OR/ ((1-P0)+(P0*OR)),

waar P0 staat voor de incidentie van de bestudeerde uitkomst in de niet-blootgestelde

groep, namelijk het geheel van de Belgische ziekenhuizen.486 Zoals reeds vermeld hielden

we rekening met het probleem van het meervoudige, gelijktijdige toetsen door het

berekenen van Bonferroni-gecorrigeerde p-waarden.313;438;607

In de hoofdanalyse, maakten we een correctie voor leeftijd van de moeder en per-semester

evolutie van de KSCs. In een nevenanalyse werden het type van ziekenhuis (privé versus

publiek, met versus zonder onderwijsfunctie) en verblijfplaats van de moeder beschouwd

als determinanten, waarvan men kan veronderstellen dat ze zowel het KSC van een

ziekenhuis kunnen beïnvloeden als ze beïnvloedbaar zijn door kwaliteitsgerichte

initiatieven. Ook met de correlatie van de gegevens hielden we rekening door middel van

“rescaling” technieken. 443;444 Deze techniek bestaat erin de standaard fouten van de


235

parameters te vermenigvuldigen met de vierkantswortel van de ratio van de “goodness-of-

fit” chi-kwadraten over het aantal vrijheidsgraden. Om een eventuele nationale trend op te

sporen maakten we gebruik van de zogenaamde Generalised Estimating Equations (GEE),

een verfijning van de logistische regressie waarbij er rekening gehouden wordt met de

correlatie van de gegevens. 430;431;483;624

Voor de Apgar categorieën, een multinomiale uitkomst, planden we een zogenaamd

‘proportional odds’ logistisch model te fitten, op voorwaarde dat de veronderstelling van

een constante OR niet weerlegd werd.625

Al deze analyses werden uitgevoerd met SAS version 8.1, SAS Institute Inc., SAS Campus

Drive, Cary, North Carolina 27513,US.

5.2.3 Resultaten

5.2.3.1 Volledigheid en accuratesse van de gegevens

Vergeleken met de gegevens van het NIS bleken de MKG zeer vergelijkbaar wat betreft de

aantallen levendgeborenen en hun verdeling volgens de woonplaats van de moeder (Tabel

1). Voor de vergelijking met het SPE en met het Office de la Naissance et de l’Enfance

(ONE) selecteerden we in de MKG respectievelijk de ziekenhuizen, die meewerken aan de

SPE registratie, en de ziekenhuizen gelegen in Brussel (behalve het UZ-VUB) en

Wallonië.

Wat de perinatale aspecten betreft stelden we een aanvaardbare overeenkomst vast tussen

MKG en SPE i.v.m. meerlingzwangerschap, zwangerschapsduur, verlossing door

keizersnede, ligging van het kind, geboortegewicht, geslacht en Apgar score (Tabellen 2

en 3). Voor hypertensie, diabetes, inductie van de arbeid, epidurale anesthesie, en

voorgeschiedenis van een keizersnede, stelden we echter belangrijke verschillen vast. Een

vergelijking tussen MKG en het ONE is zeer bevredigend wat de geboortegewichten

tussen 2,500 en 4,500 kg betreft. De lage Apgar scores lijken daarentegen frequenter voor

te komen in de MKG (Tabel 2).

Voor andere perinatale eindpunten, vonden we vergelijkbare gegevens in de literatuur.

In de MKG bedroeg de incidentie van het meconium aspiratie syndroom (MAS) 0,69%,

waar er waarden tussen 0,12 % en 7,87 % geciteerd worden.615;626-628 De incidentie

(uitgedrukt in %) per week zwangerschapsduur bedroeg 0,54 voor week 36, 0,37 voor


week 37, 0,42 voor week 38, 0,61 voor week 39, 0,83 voor week 40, 1,27 voor week 41,

en 1,50 voor week 42, cijfers die vergelijkbaar zijn met deze van Yoder et al.615 De

associatie van MAS met 1-minuut en 5-minuut Apgar scores, uitgedrukt als odds ratio’s en

hun 95% betrouwbaarheidsinterval, waren kleiner in onze gegevens maar gingen wel in

dezelfde richting als deze vermeld door Wiswell et al.626: 6,21 (5,71;6,76) versus 10,03

(5,97;16,88) op één minuut en 8,71(7,62;9,97) versus 21,35 (8,65;53,04) op vijf minuten.

Wanneer we onze gegevens met die van Levin et al.629 vergeleken, stelden we een

gelijkaardig verband vast tussen hyaliene membranenziekte (RDS) en transiënte tachypnee

(TTN) met de wijze van verlossing. Uitgedrukt als odds ratio’s en hun 95%

betrouwbaarheidsinterval, bedroeg de associatie respectievelijk 3,0 (1,6;5,3) versus 3,1

(2,8;3,4) in geval van RDS, and 3,3 (2,6; 3,9) versus 3,2 (2,9;3,6) in geval van TTN.

5.2.3.2 Laagrisico verlossingen en interziekenhuis verschillen in KSC Wanneer we de studiebevolking (N=381.989 waarvan 12,98 % met een KS geboren

werden) vergeleken met de controle populatie (N=73.944 waarvan 49,68 % met een KS

geboren werden) , vonden we voor de controle populatie een RR om via keizersnede

geboren te worden van 3,83 ( 95% BI [3,79;3,87]). Deze bevinding suggereert dat we er

aan de hand van deze inclusie criteria tenminste gedeeltelijk in slaagden laag

risicoverlossingen te identificeren.

Hoewel onze studie over laagrisico verlossingen ging, stelden we belangrijke

interziekenhuis verschillen vast (Figuren 1 en 2).

Voor de periodeanalyse varieerden de afwijkingen tussen de – 65 % en de + 75 %. In

termen van outliers onderscheidden we 9 “hoog KSC” en 13 “laag KSC” outlying

ziekenhuizen.

De trendafwijkingen situeerden zich tussen de – 6 % en + 6% en er waren geen outlying

ziekenhuizen.

Wanneer de gevallen van congenitale anomalie uitgesloten werden bleef de variatiebreedte

nagenoeg dezelfde zowel voor de periode als de trend. De figuren waren merkwaardig

gelijkend (Figuren 1 en 2, sectie 2). Er waren overigens slechts minimale verschillen

betreffende outlying ziekenhuizen: ziekenhuis 30 werd significant en ziekenhuis 26 was


237

het niet langer. Noteer dat in beide gevallen de afwijking praktisch niet veranderde, wat

impliceert dat de verandering het gevolg was van het weglaten van enkele gevallen.

Naast de figuren bevatte de feedback naar de ziekenhuizen een tabel, waarin de periode- en

trendafwijkingen met hun Bonferroni-gecorrigeerd en hun 95 % BI intervallen gegeven

worden, verder een p-waarde waarbij de hypothese van een afwijking = 0 getoetst wordt,

en tenslotte een hulp bij de interpretatie.Een voorbeeld van deze feedback voor de eerste

tien ziekenhuizen vindt u in Tabel 4.


Tabel 1: Percentage levend geboren kinderen i.f.v. de verblijfplaats van de moeder.Vergelijking tussen MKG en NIS, 2001-4.

2001 2002 2003 2004 Verblijfplaats MKG NIS MKG NIS MKG NIS MKG NIS

België (N=113.600) (N=114.172) (N=111.609) (N=111.225) (N=112.704) (N=112.149)(N=116.142)(N=115.618) Vlaanderen 52,6 53,1 53,1 53,7 52,6 53,5 53,0 53,9 Wallonië 33,7 34,2 33,2 33,8 33,0 33,5 32,4 32,9 Brussel 13,2 12,7 13,1 12,5 13,7 13,1 13,8 13,1 Buitenland 0,5 - 0,6 - 0,7 - 0,8 -

NIS: Nationaal Instituut voor de statistiek Tabel 2: Verdeling (in %) van geboortegewicht en Apgar scores.Vergelijking tussen MKG (2001) en gepubliceerde cijfers voor SPE (2000) en ONE (2000).

MKG-2001 ONE-2000 MKG-2001 SPE-2000 Geboortegewicht < 500 g 0,02 0,06 0,02 n/b 500-1499 g 0,96 1,18 0,83 0,9 < 1500 g 0,98 1,24 0,85 0,9 1500-2499 7,02 6,25 5,76 5,66 < 2500 g 8,00 7,48 6,61 6,56 2500-4499 g 91,39 90,77 92,43 92,49 4500 g+ 0,61 1,75 0,96 0,95 Apgar scores < 4 4,2 2,8 3,7 2,5 <7 17,5 14,4 18,6 18,1

ONE: Office de la naissance et de l’enfance SPE: Studiecentrum voor Perinatale n/b:nietbeschikbaar


239

Tabel 3a: Perinatale karakteristieken, uitgedrukt als een percentage. Vergelijking tussen MKG en SPE, 2001-4. 2001 2002 2003 2004 VERLOSSINGEN MKG SPE MKG SPE MKG SPE MKG SPE (N=58.158) (N=59.750) (N=58.194) (N=58.841) (N=56.678) (N=59.253) (N=59.126) (N=61.647) Tweelingen 2,1 1,7 2,3 2,0 2,3 1,9 2,0 1,6 Meerlingen (>=3) 0,1 0,0 0,1 0,0 0,1 0,0 0,1 0,0 Hypertensie 5,4 4,9 5,5 4,9 5,7 4,8 5,8 4,8 Diabetes 1,5 ng 1,6 1,2 2,1 1,4 2,1 1,4 Zwangerschapsduuur: 20-31 weken 1,0 1,0 1,0 1,0 1,1 1,3 1,1 1,1 32-36 weken 5,9 6,1 6,1 6,3 6,4 6,1 6,4 6,5 >=37 weken 92,9 92,8 92,9 92,7 92,6 92,6 92,8 92,5 Inleiding van de arbeid 19,6 30,7 19,4 30,1 18,4 30,0 17,7 27,6 Epidurale anesthesie 47,8 62,7 48,3 63,2 47,1 64,4 51,3 61,6 Keizersnede 17,4 17,1 18,1 17,7 18,6 18,3 18,5 18,3 Vorige keizersnede 3,9 7,7 4,6 7,6 5,2 7,6 5,7 8,2


240

Tabel 3b: Perinatale karakteristieken, uitgedrukt als een percentage. Vergelijking tussen MKG en SPE, 2001-4. (vervolg) GEBOORTEN MKG SPE MKG SPE MKG SPE MKG SPE (N=58.302) (N=60.813) (N=58.529) (N=60.048) (N=56.848) (N=60.406) (N=59.110) (N=62.657) Type geboorte: spontaan 74,3 70,3 72,5 69,9 71,8 70,0 71,3 70,2 vacuum 8,5 10,5 8,5 10,3 8,7 9,7 9,1 9,7 forceps 0,6 1,2 0,6 1,1 0,6 1,0 0,5 0,9

keizersnede 16,9 17,6 17,9 18,3 18,4 18,9 18,2 18,9 vaginale stuit 0,6 0,4 0,5 0,4 0,5 0,3 0,4 0,3

Geboortegewicht: <1500 g 0,8 1,1 0,8 1,2 0,9 1,2 0,8 1,1 1500-2499 g 5,4 5,9 5,6 6,2 5,7 6,2 5,4 5,8 >=2500 g 93,4 92,9 93,3 92,7 93,5 92,7 93,7 93,1 Geslacht: man 51,4 51,3 51,4 51,4 51,2 51,1 51,4 51,4 vrouw 48,6 48,6 48,6 48,6 48,8 48,9 48,6 48,6 Congenitale afwijkingen 3,0 1,5 3,0 1,8 3,0 1,6 3,1 1,6 Transfer =>gespecialiseerde eenheid 18,8 17,1 17,9 17,9 18,9 18,2 17,9 17,8


241

Tabel 4: Afwijking van het KSC van een ziekenhuis (uitgedrukt in percent) t.o.v. het nationale KSC of trend, België, 2001- 4. ID1 Periode Trend IP10

OG_B2OG_953 A(%)4BG_955BG_B6BI_957BI_B8 P9 OG_B2 OG_953 A(%)4 BG_955 BG_B6 BI_957 BI_B8 P9

1 -18 -10 3 16 28 NS NS 0,68283 -11 -7 -2 4 8 NS NS 0,51065 AMG 2 24 33 44 56 66 + + 0,00000 -8 -5 -1 3 6 NS NS 0,57928 EAE A>0 3 -20 -10 5 23 38 NS NS 0,49978 -16 -11 -5 2 8 NS NS 0,18024 AMG 4 9 18 31 44 56 + + 0,00000 -8 -4 0 5 9 NS NS 0,90712 AMG 5 -20 -11 1 15 27 NS NS 0,88383 -10 -6 0 5 10 NS NS 0,93539 AMG 6 9 14 21 29 35 + + 0,00000 0 2 5 8 10 + + 0,00045 AMG 7 0 7 16 26 35 + + 0,00061 -9 -7 -3 1 4 NS NS 0,11081 AMG 8 -32 -26 -19 -11 -5 - - 0,00001 -10 -7 -3 1 4 NS NS 0,10727 AMG 9 -12 -7 1 10 17 NS NS 0,75745 -2 1 4 8 11 + NS 0,01709 AMG

10 -45 -40 -33 -26 -19 - - 0,00000 -7 -3 1 6 9 NS NS 0,67442 EAE A<0 1 ID: Anoniem ziekenhuisnummer; 2 OG_B: Ondergrens van het Bonferroni betrouwbaarheidsinterval; 3 OG_95: Ondergrens van het 95% betrouwbaarheidsinterval; 4 A: Afwijking van het ziekenhuis KS cijfer/trend vergeleken met het nationale KS cijfer/trend; 5 BG_95: Bovengrens of the 95% betrouwbaarheidsinterval; 6 BG_B: Bovengrens van het Bonferroni betrouwbaarheidsinterval; 7 BI_95: +: het 95% BI suggereert een significant hoger ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend,

-: het 95% BI suggereert een significant lager ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend, NS: het 95% BI suggereert geen significante afwijking van het ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend.

8BI_B: +: het Bonferroni−gecorrigeerd BI suggereert sterk een significant hoger ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend, -: het Bonferroni−gecorrigeerd BI suggereert sterk een significant lager ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend,

NS: het Bonferroni−gecorrigeerd BI suggereert geen significante afwijking van het ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend. 9 P: Probabiliteit dat een ziekenhuisafwijking t.o.v. het nationale KS cijfer/trend = 0. 10IP: Interpretatie: EAE: Externe audit en algemene maatregelen aanbevolen; AMG: algemene maatregelen aanbevolen.


Figuur 1: Interziekenhuis verschillen in keizersnedencijfers, congenitale afwijkingen

inbegrepen (bovenste deel van de figuur) en uitgesloten (onderste deel van de figuur).

Nationaal KSC: 13%


243

Figuur 2: Interziekenhuis verschillen in keizersnedentrend, congenitale afwijkingen

inbegrepen (bovenste deel van de figuur) en uitgesloten (onderste deel van de figuur).


5.2.3.3 Nationaal KSC en zijn determinanten We berekenden een KSC van 18,93% in de populatie van levend geboren eenlingen in

hoofdligging en een KSC van 12,98% voor de studiebevolking.

Vermits we ons vooral interesseerden voor de evolutie van de KSC en hoewel een model

waarin leeftijdsgroep en semester als categorische variabelen gefit werden tot een betere fit

leidde, verkozen we het model waarin evolutie over de tijd als een trend gefit werd en dat

de gegevens op een meer spaarzame en praktisch bruikbare manier samenvatte (Tabel 5,

sectie a).

Beginnend bij het eerste semester van 2001 vonden we een nationale trend, gecorrigeerd

voor leeftijdsgroep, van ongeveer 2% per semester.

De resultaten van een multivariabele GEE waarin de waarschijnlijkheid van een KS de

afhankelijke variabele was en waarin, benevens de trend en de leeftijdsgroep, de andere

determinanten de onafhankelijk variabelen vormen, worden in Tabel 5, sectie b getoond.

Zo werden bij toenemende leeftijd van de moeder ook toenemende KSCs waargenomen en

waren de verblijfplaats van de moeder en de dag van opname op een significante manier

geassocieerd met de wijze van verlossing. Verder vonden we in functie van de opnamedag

belangrijke en statistisch significante verschillen in aantallen borelingen en proporties van

keizersneden, die varieerden tussen 64.422 en 14,84% op maandag; en, 33.836 en 7,21%

op zaterdag, cijfers die wijzen op een intens medisch ingrijpen rond de geboorte (Tabel 6).

Verlossingen op 37 en 38 weken en op 41 en 42 weken waren geassocieerd met een

verhoogde KSC. We konden echter geen significante associatie aantonen tussen het

keizersnedencijfer en het type eigenaarschap of een opleidingsfunctie van een ziekenhuis

(Tabel 7). In een analyse met exclusie van congenitale afwijkingen kwamen we tot zeer

vergelijkbare resultaten.

Noteren we dat we in de “hoog KSC” groep op de 35.287 verlossingen 19,3%

keizersneden telden. Voor de “gemiddeld KSC” groep bedroegen die cijfers respectievelijk

298.204 en 12,9%, en voor de “laag KSC” groep 48.436 en 8,8%.


245

Tabel 5: Nationale keizersnedentrend, gecorrigeerd voor leeftijdsgroep, en determinanten. OR P a) Nationale keizersnedentrend gecorrigeerd voor leeftijdsgroep Semestriële trend basis 1ste semester 2001 1,02 (1,02;1,02) <,0001Leeftijdsgroep 20-24 jaar vs < 20 jaar 1,11 (1,11;1,11) <,0001 25-29 jaar vs < 20 jaar 1,30 (1,30;1,30) <,0001 30-34 jaar vs < 20 jaar 1,53 (1,53;1,53) <,0001 35-39 jaar vs < 20 jaar 1,86 (1,86;1,86) <,0001 40 jaar+ vs < 20 jaar 2,41 (2,41;2,41) <,0001 b) Nationale keizersnedentrend, gecorrigeerd voor leeftijdsgroep, en determinanten Semestriële trend basis 1ste semester 2001 1,02 (1,01;1,02) <,0001Leeftijdsgroep 20-24 jaar vs < 20 jaar 1,12 (1,02;1,22) 0,0188 25-29 jaar vs < 20 jaar 1,31 (1,20;1,43) <,0001 30-34 jaar vs < 20 jaar 1,55 (1,42;1,69) <,0001 35-39 jaar vs < 20 jaar 1,89 (1,73;2,07) <,0001 40 jaar+ vs < 20 jaar 2,45 (2,21;2,71) <,0001Zwangerschapsduur 37-38 weken vs 39-40 weken 1,95 (1,88;2,01) <,0001 41-42 weken vs 39-40 weken 1,29 (1,24;1,34) <,0001Verblijfplaats Antwerpen vs Elke woonplaats 0,99 (0,94;1,05) 0,7271 Brussel vs Elke woonplaats 0,89 (0,84;0,94) <,0001 Brabant (Vl) vs Elke woonplaats 0,97 (0,91;1,05) 0,2848 Brabant (Wa) vs Elke woonplaats 0,82 (0,75;0,89) <,0001 West Vlaanderen vs Elke woonplaats 1,10 (1,02;1,18) 0,0001 Oost Vlaanderen vs Elke woonplaats 1,06 (1,00;1,13) 0,0054 Henegouwen vs Elke woonplaats 0,94 (0,88;1,00) 0,0034 Luik vs Elke woonplaats 1,34 (1,25;1,44) <,0001 Limburg vs Elke woonplaats 1,24 (1,14;1,34) <,0001 Luxemburg vs Elke woonplaats 1,01 (0,86;1,18) 0,9151 Namen vs Elke woonplaats 0,83 (0,77;0,90) <,0001 Buitenland vs Elke woonplaats 0,93 (0,79;1,09) 0,2006Type eigenaarschap Publiek vs Privaat 0,98 (0,95;1,01) 0,1478Teaching status Geen wel specialisten in opleiding 0,98 (0,94;1,03) 0,4271Dag van opname Maandag vs Zondag 1,22 (1,15;1,29) <,0001 Dinsdag vs Zondag 1,13 (1,06;1,19) <,0001 Woensdag vs Zondag 1,17 (1,10;1,23) <,0001 Donderdag vs Zondag 1,17 (1,11;1,24) <,0001 Vrijdag vs Zondag 0,85 (0,80;0,90) <,0001 Zaterdag vs Zondag 0,55 (0,52;0,59) <,0001

OR: odds ratio; ( ) :95% betrouwbaarheidsinterval; P: probabiliteit van OR=1.


Tabel 6: Maternale karakteristieken van de studiepopulatie en wijze van verlossing. België 2001-2004.

KS % Aantal KS % AantalLeeftijdsklassen Semester

< 20 jaar 765 9,40 8.140 2001-1 5.672 11,99 47.287

20-24 jaar 5.910 10,37 57.010 2001-2 5.975 12,43 48.058

25-29 jaar 15.987 11,92 134.071 2002-1 5.757 12,51 46.023

30-34 jaar 17.342 13,75 126.098 2002-2 6.254 13,14 47.605

35-39 jaar 7.746 16,27 47.613 2003-1 6.161 13,27 46.421

40 jaar+ 1.828 20,18 9.057 2003-2 6.550 13,55 48.356

Dag van opname Woonplaats (provincie)

Maandag 9.560 14,84 64.422 Antwerpen 7.411 12,58 58.924

Dinsdag 8.827 13,80 63.948 Brabant (Vlaams) 4.492 12,80 35.098

Woensdag 8.780 14,22 61.762 Brabant (Waals) 1.476 11,35 13.009

Donderdag 8.961 14,29 62.729 Brussel 5.947 11,43 52.024

Vrijdag 5.212 10,73 48.555 West-Vlaanderen 4.867 13,42 36.262

Zaterdag 2.441 7,21 33.836 Oost-Vlaanderen 6.195 13,13 47.175

Zondag 5.797 12,40 46.737 Henegouwen 5.785 12,21 47.388

MAAND Luik 6.043 16,75 36.07

Januari 4.280 13,20 32.434 Limburg 3.766 14,83 25.399

Februari 3.821 12,98 29.428 Luxemburg 1.281 12,69 10.098

Maart 4.032 12,56 32.112 Namen 1.920 11,08 17.326

April 3.941 12,56 31.365 Buitenland 395 12,28 3.216

Mei 4.025 12,69 31.726

Juni 4.109 12,99 31.626

Juli 4.357 12,78 34.093

Augustus 4.206 12,76 32.968

September 4.319 13,28 32.519

Oktober 4.114 12,89 31.923

November 4.040 13,40 30.158

December 4.334 13,70 31.637 KS: keizersnede; %: proportie van keizersneden uitgedrukt als een percentage.


247

Tabel 7: Neonatale en ziekenhuis karakteristieken van de studiepopulatie en wijze van verlossing. België 2001-2004. KS % Neonati KS % Neonati 1) Neonatale 2) Ziekenhuis Geslacht Micu 290 23,82 1.251Jongens 26.862 13,69 196.191 Eigenaarschap Meisjes 22.713 12,23 185.755 Publiek 17.210 13,12 131.176 Onbepaald 3 23 Privaat 32.368 12,91 250.813 Geboortegewicht Specialisten 2500-2999 g 9.444 13,78 68.511 in opleiding 3000-3499 g 20.431 12,18 167.699 Ja 43.393 13.03 332.953 3500-3999 g 15.119 12.89 117.250 Neen 6.185 12,61 49.0364000-4499 g 4.584 16,07 28.529 Zwangerschapsduur 37-38 weken 18.531 18,77 98.712 39-40 weken 25.628 10,56 242.645 41-42 weken 5.419 13,34 40.632 1 min Apgar Ontbrekend 10 16,13 62 < 4 1.141 21,61 5.281 4 - 6 2.857 14,65 19.507 > 6 45.570 12,76 357.139 5 min Apgar Ontbrekend 10 15,38 65 < 4 163 21,73 750 4 - 6 703 18,03 3.898 > 6 48.702 12,91 377.276 Respiratoire Syndromen RDS 480 31,27 1.535 Wet lung 552 32,43 1.702 Meconium Aspiratie 510 19,23 2.652 Intubatie/Ventilatie 959 27,88 3.440 Congenitale Afw. 559 16.57 3.374

Transfer 9.850 15,31 64.326 KS: keizersnede; %: proportie van keizersneden uitgedrukt als een percentage.


5.2.3.4 Neonatale uitkomsten Zeer lage één-minuut Apgar scores (Tabel 8) schenen meer frequent te zijn in geval van

KS en vooral in de “laag KSC” groep. Noteren we nochtans dat de proportie van zeer lage

scores in de “hoog KSC” groep versus de “laag KSC” groep hoger leek in geval van een

vaginale verlossing dan na een keizersnede.

Een gelijkaardig fenomeen deed zich voor m.b.t. de vijf minuten Apgar scores (Tabel 8),

hoewel de incidentie van zeer lage vijf-minuten Apgar-scores veel kleiner was.

Voor RDS en MAS (Tabel 8) troffen we in de drie KSC groepen praktisch dezelfde

incidentie aan na een vaginale verlossing, maar bleken er belangrijke verschillen te bestaan

na een keizersnede. Inderdaad, de “gemiddeld KSC” groep leek na een keizersnede een

kleinere incidentie te hebben in geval van RDS, waar in geval van MAS er vooral een lage

incidentie werd vastgesteld in de “hoog KSC” groep.

TTN scheen minder een probleem te vormen in de “hoog KSC” groep, welke ook de wijze

van verlossing was (Tabel 9). Voor de “laag KSC” groep scheen de nood aan respiratoire

ondersteuning het grootst en dit zowel na een keizersnede als na een vaginale verlossing.

De verschillen in proporties van pasgeborenen, die in een gespecialiseerde afdeling

opgenomen werden waren uiterst verschillend: in de “hoog KSC” groep deed zulke

opname zich vijfmaal minder voor dan in de andere, en dit voor beide types van verlossing

(Tabel 9). Bij het doorvoeren van een analyse waarbij congenitale afwijkingen uitgesloten

waren kwamen we tot zeer vergelijkbare resultaten.


249

Tabel 8: 1 minuut en 5 minuut Apgar scores, RDS en MAS in functie van de wijze van verlossing en van KSC groep

KSC groep Hoog (%) Gemiddeld (%) Laag (%) Totaal 1 min Apgar

Vaginaal < 4 299 1,05 3.169 1,22 672 1,52 4.140 4 –6 1.512 5,31 12.857 4,95 2.281 5,16 16.650 >6 26.680 93,64 243.671 93,83 41.218 93,31 311.569 KS < 4 96 1,41 918 2,38 127 2,98 1.141 4 –6 349 5,14 2.223 5,77 285 6,68 2.857 >6 6.351 93,45 35.366 91,84 3.853 90,34 45.570 5 min Apgar

Vaginaal < 4 32 0,11 478 0,18 77 0,17 587 4 –6 180 0,63 2.533 0,98 482 1,09 3195 >6 28.279 99,26 256.686 98,84 43.609 98,73 328.574 KS < 4 11 0,16 135 0,35 17 0,40 163 4 –6 51 0,75 564 1,46 88 2,06 703 >6 6.734 99,09 37.808 98,18 4.160 97,54 48.702 RDS Vaginaal Afwezig 28.405 99,68 258.913 99,69 44.038 99,66 331.356 Aanwezig 90 0,32 816 0,31 149 0,34 1.055 KS Afwezig 6.718 98,84 38.174 99,12 4.206 98,57 49.098 Aanwezig 79 1,16 340 0,88 61 1,43 480 MAS Vaginaal Afwezig 28.331 99,42 257.974 99,32 43.964 99,50 330.269 Aanwezig 164 0,58 1.755 0,68 223 0,50 2.142 KS Afwezig 6.744 99,22 38.116 98,97 4.208 98,62 49.068 Aanwezig 53 0,78 398 1,03 59 1,38 510 Totaal Vaginaal 28.495 259.729 44.187 332.411 Keizersnede 6.797 38.514 4.267 49.578

(%): kolom percentage


Tabel 9: TTN, nood aan respiratoire ondersteuning en transfer naar een N*/NIC dienst, in functie van de wijze van verlossing en van KSC groep

KSC groep Hoog (%) Gemiddeld (%) Laag (%) Totaal TTN Vaginaal Afwezig 28.425 99,75 258.814 99,65 44.022 99,63 331.261 Aanwezig 70 0,25 915 0,35 165 0,37 1.150 KS Afwezig 6.740 99,16 38.082 98,88 4.204 98,52 49.026 Aanwezig 57 0,84 432 1,12 63 1,48 552 Intubatie/Ventilatie Vaginaal Afwezig 28.295 99,30 257.854 99,28 43.781 99,08 329.930 Aanwezig 200 0,70 1.875 0,72 406 0,92 2.481 KS Afwezig 6.670 98,13 37.804 98,16 4.145 97,14 48.619 Aanwezig 127 1,87 710 1,84 122 2,86 959 Transfer Vaginaal Afwezig 27.818 97,62 212.951 81,99 37.166 84,11 277.935 Aanwezig 677 2,38 46.778 18,01 7.021 15,89 54.476 KS Afwezig 6.459 95,03 29.950 77,76 3.319 77,78 39.728 Aanwezig 338 4,97 8.564 22,24 948 22,22 9.850 Totaal Vaginaal 28.495 259.729 44.187 332.411 Keizersnede 6.797 38.514 4.267 49.578

(%): kolom percentage

Vermits de “proportional odds” veronderstelling onjuist bleek, voerden we een general

logits analyse uit om de associatie tussen wijze van verlossing, KSC groep en 1 minuut

Apgar scores op een meer formele manier te analyseren. Hieruit bleek dat er duidelijk

minder gevallen van zeer lage Apgar scores waren in de “hoog KSC” groep dan in de

“gemiddeld KSC” groep, die op zijn beurt significant minder vaak geassocieerd bleek met

zeer lage Apgar scores dan de “laag KSC” groep (Tabel 10). Voor de lage Apgar scores

vonden we niet langer een significant verschil tussen de “gemiddeld KSC” groep en de

“hoog KSC” groep, maar wel tussen de “gemiddeld KSC” en de “laag KSC” groepen. Een

deel van dit verschijnsel was misschien te wijten aan sociaal-economische status

gerelateerde verstorende variabelen, die we, uit de natuur zelf van onze gegevens, niet uit

de analyse konden verwijderen. Opmerkelijk is het feit dat, wanneer we de “hoog KSC”


251

groep vergeleken met de andere groepen, we een relatief exces van zeer lage Apgar scores

vaststelden wanneer het een vaginale verlossing betrof, waar we dat eerder na een

keizersnede, uitgevoerd voor medische redenen, verwachtten. Deze bevinding suggereert

dat het exces aan KS in de“hoog KSC” groep voor een deel te wijten was aan niet-

medische redenen en schijnt te wijzen op een niet-adequate selectie van de wijze van

bevalling. Noteren we tenslotte dat mannelijk geslacht negatief geassocieerd was met de

Apgar scores. Ook wanneer gevallen van congenitale afwijking uitgesloten werden

kwamen we bij deze analyses tot zeer gelijkaardige vaststellingen.

We gingen ook het verband na tussen wijze van verlossing, KSC groep en respiratoire

syndromen, bepaalde types van ademhalingsondersteunende behandelingen en/of de

opname van een boreling in een gespecialiseerde pediatrische dienst of in een NICU

(Tabel 11).

In de volgende secties zijn de odds ratio’s voor KSC, leeftijdsgroep, wijze van verlossing,

zwangerschapsduur, geslacht, en tenslotte een interactie term tussen KSC en wijze van

verlossing voor elkaar gecorrigeerd. Voor al deze eindpunten bleek er een significant

verband te bestaan tussen keizersnede en minder goede uitkomst, wat consistent is met wat

reeds geweten was over het verband tussen een electieve herhalingssectio en RDS,

respiratoire problemen zoals TTN en persistente pulmonaire hypertensie, zelfs bij een

levend geboren, voldragen eenling.629 Voor mannelijk geslacht stelden we, op MAS na,

een gelijkaardig verband vast.

Wanneer we de “hoog KSC” en de “laag KSC” groepen vergeleken met de “gemiddeld

KSC” groep stelden we voor de eerst vermelde groepen een exces aantal RDS gevallen

vast. Deze excessen waren bijzonder belangrijk in geval van keizersnede. Voor MAS

stelden we, wanneer we de drie KSC groepen onderling vergeleken, een exces vast in de

“laag KSC” groep, vooral na een keizersnede. Voor een deel kan dit fenomeen te wijten

zijn aan de correctie voor de zwangerschapsduur, vermits er significant meer verlossingen

waren op 41 en 42 weken in de “laag KSC” groep (RR: 1.09; 95% CI [1.07;1.12]). In

tegenstelling hiermee vonden we significant meer gevallen van MAS in de “laag KSC”

groep na een keizersnede. Ademhalingsondersteunende behandelingen bleken vaker

noodzakelijk in de “laag KSC” groep. Verder stelden we een negatief verband vast tussen


neonatale opname in een gespecialiseerde dienst en “hoog KSC” en “laag KSC” groepen,

voornamelijk na een vaginale bevalling. Verlossingen op 37-38 weken en op 41-42 weken

bleken vaak gecorreleerd met minder gunstige eindpunten. Deze bevinding stemt overeen

met de literatuur die stelt dat een electieve KS beter uitgevoerd wordt op een leeftijd van

39 à 40 weken, eerder dan op 37-38 weken, wat het geval is in België (Tabel 5).574 Op dat

ogenblik echter, namelijk voor het begin van een spontane arbeid, doen zich vaker

ademhalingsproblemen voor. Wanneer we de KSC groepen vergeleken in termen van de

ratio van het aantal KS uitgevoerd op die zwangerschapsduur over het aantaal aantal

sectio’s vonden we 40,1% in de “hoog KSC” versus 24,2% en 37,2% in respectievelijk de

“laag KSC” en “gemiddeld KSC” groepen.

Tabel 10: Effect van KSC-groep en wijze van verlossing, gecorrigeerd voor geslacht, leeftijdsklas en semester, op 1-minuut Apgar scores.

Dependente Variabele OR P

Mannen vs Vrouwen Apgar 0-3 1,32 (1,25; 1,40) <0,0001 Apgar 4-6 1,22 (1,19; 1,26) <0,0001KS vs VB Apgar 0-3 1,76 (1,59; 1,95) <0,0001 Apgar 4-6 1,17 (1,10; 1,24) <0,0001KSC groep: Hoge vs Lage Apgar 0-3 0,56 (0,48; 0,65) <0,0001 Apgar 4-6 0,87 (0,80; 0,95) 0,0016KSC groep: Hoge vs Gemiddelde Apgar 0-3 0,71 (0,63; 0,80) <0,0001 Apgar 4-6 0,97 (0,91; 1,03) 0,333KSC groep: Lage vs Gemiddelde Apgar 0-3 1,27 (1,14; 1,40) <0,0001 Apgar 4-6 1,12 (1,04; 1,19) 0,0016Hoge KSC groep en KS vs Lage KSC groep en VB

Apgar 0-3 0,82 (0,70; 0,95) 0,0083

Apgar 4-6 0,85 (0,78; 0,93) 0,0003Hoge KSC groep en KS vs Gemiddelde en VB Apgar 0-3 0,82 (0,73; 0,93) 0,0017 Apgar 4-6 0,90 (0,85; 0,96) 0,0016Lage KSC groep en KS vs Gemiddelde en VB Apgar 0-3 1,01 (0,91; 1,12) 0,8843 Apgar 4-6 1,06 (0,99; 1,14) 0,0864KS: keizersnede; VB: vaginale bevalling; OR: odds ratio; ( ) :95% BI; P: prob. van OR=1. Het verband tussen zwangerschapsduur en MAS was bijzonder in die zin dat het negatief

was bij een zwangerschapsduur van 37-38 weken en positief voor een zwangerschapsduur

van 41-42 weken. Dit is nochtans niet in tegenspraak met de literatuur, die meldt dat de

hoogste cijfers voor MAS vastgesteld worden bij borelingen met een zwangerschapsduur

van 41-42 weken en dat onder meer veranderingen in het hartritme patroon, foetale


253

acidose, meconium in de trachea, KS, en lage Apgar scores de voornaamste risico factoren

zijn. 615;615;626;628 Wanneer we ons herinneren dat de gecorrigeerde odds ratio voor KS 1,63

bedroeg en dat, daarenboven, veel van de andere risico factoren kunnen vermeden worden

door een electieve KS op week 37-38, kan de lage incidentie van MAS bij borelingen met

die zwangerschapsduur niet beschouwd worden in tegenspraak te zijn met de literatuur.

5.2.4 Discussie

5.2.4.1 Voornaamste bevindingen Onze resultaten suggereerden voor laag risico verlossingen het bestaan van een belangrijke

interziekenhuis variabiliteit, die zich vertaalde in afwijkingen van het nationale cijfer

variërend tussen – 65 % en + 75 % en die tevens statistisch significant waren.

Ze berustten op een zeer conservatieve analyse en interpretatieve benadering, die erin

bestond een zone te definiëren waarin geen interpretaties gemaakt worden en in het

gebruik van aanzienlijke drempelwaarden vooraleer een afwijking van het nationale cijfer

of trend als belangrijk bestempeld werd. Meer in het bijzonder corrigeerden we voor

meervoudige, gelijktijdige vergelijkingen en voor de aanwezigheid van correlatie in de

gegevens. 313;444

Verder verstrekten we graden van evidentie m.b.t. de vastgestelde afwijking van een

ziekenhuis en ook een hulp bij de interpretatie. Wel dient er rekening gehouden te worden

met een eventuele “regression to the mean”. 462 Op die manier trachtten we vals alarm en

valse geruststelling te vermijden en tevens het onderscheid toe te laten tussen een reël

verschil en een statistisch artefact. Dit soort problemen duikt vaak op bij een kwantitatieve

analyse, zeker wanneer zij gebaseerd is op administratieve gegevens.180;319;396

Een ander belangrijk resultaat was de vaststelling van een KSC evolutie, die het best kan

geresumeerd worden als een trend van 2 % per semester. Een veranderende medische

praktijkvoering kan hierin een rol gespeeld hebben. Deze medische, groeiende

beïnvloeding van het geboortegebeuren uitte zich verder in de geografische en

ziekenhuisgerelateerde verdelingen 364;630 van het KSC, en de temporele verdeling van het

aantal verlossingen en de wijze van verlossing, hoewel de evidentie van doelmatigheid van

dergelijke tussenkomsten nog dient geleverd te worden.571


Tabel 11: Voorkomen van respiratoire syndromen, respiratoire ondersteuning, opname in een gespecialiseerde dienst geassocieerd met wijze van verlossing en KSC groep, gecorrigeerd voor geslacht, leeftijd van de moeder, zwangerschapsduur en semester van verlossing. RDS MAS TTN Resp.Ond. N*of NIC OR OR OR OR OR Wijze van verlossing Keizersnede vs vaginaal 2,47 (2,18;2,81) 1,64 (1,47; 1,82) 2,83 (2,52;3,18) 2,45 (2,23;2,68) 1,30 (1,26;1,34) KSC Hoog vs Gemiddeld 0,98 (0,79;1,22) 0,90 (0,77; 1,05) 0,68 (0,53;0,86) 0,97 (0,83;1,13) 0,11 (0,10;0,12) Laag vs Gemiddeld 1,08 (0,90;1,28) 0,74 (0,64; 0,85) 1,06 (0,90;1,25) 1,27 (1,14;1,43) 0,86 (0,84;0,89) Geslacht Jongens vs Meisjes 1,64 (1,48;1,82) 1,04 (0,97; 1,12) 1,46 (1,32;1,61) 1,36 (1,27;1,46) 1,05 (1,03;1,07) Leeftijd van de moeder < 20 jaar vs 40 jaar+ 1,02 (0,69;1,51) 0,76 (0,54; 1,08) 0,95 (0,63;1,43) 1,21 (0,90;1,62) 1,49 (1,37;1,62) 20-24 jaar vs 40 jaar+ 0,71 (0,53;0,94) 0,89 (0,70; 1,12) 0,87 (0,66;1,16) 0,91 (0,72;1,13) 1,25 (1,17;1,34) 25-29 jaar vs 40 jaar+ 0,67 (0,51;0,89) 0,80 (0,64; 1,00) 0,82 (0,62;1,07) 0,88 (0,71;1,09) 1,04 (0,98;1,11) 30-34 jaar vs 40 jaar+ 0,71 (0,54;0,93) 0,79 (0,63; 0,99) 0,77 (0,58;1,01) 0,84 (0,68;1,04) 0,92 (0,86;0,98) 35-39 jaar vs 40 jaar+ 0,82 (0,61;1,10) 0,89 (0,70; 1,13) 0,81 (0,60;1,08) 0,85 (0,67;1,06) 0,90 (0,84;0,96) Zwangerschapsduur 37-38 weken vs 39-40 weken 2,15 (1,93;2,39) 0,51 (0,46; 0,57) 2,16 (1,96;2,39) 1,43 (1,33;1,55) 1,20 (1,17;1,22) 41-42 weken vs 39-40 weken 1,29 (1,09;1,54) 1,75 (1,59 ; 1,93) 1,12 (0,94;1,33) 1,43 (1,28;1,59) 0,91 (0,88 ;0,94) Semester 2001-1 vs 2004-2 1,12 (0,93;1,35) 0,95 (0,83 ; 1,10) 0,61 (0,51;0,73) 1,08 (0,94;1,25) 1,30 (1,26 ;1,35) 2001-2 vs 2004-2 0,96 (0,79;1,16) 0,78 (0,67 ; 0,90) 0,53 (0,44;0,65) 1,06 (0,92;1,23) 1,15 (1,11 ;1,19) 2002-1 vs 2004-2 0,81 (0,66;0,99) 0,83 (0,72 ; 0,97) 0,65 (0,55;0,79) 1,28 (1,11;1,47) 1,03 (0,99 ;1,07) 2002-2 vs 2004-2 0,93 (0,76;1,13) 0,83 (0,72 ; 0,96) 0,57 (0,47;0,68) 1,27 (1,11;1,46) 1,06 (1,02 ;1,10) 2003-1 vs 2004-2 1,00 (0,82;1,21) 0,69 (0,60 ; 0,81) 0,75 (0,63;0,89) 1,37 (1,20;1,57) 1,09 (1,05 ;1,13) 2003-2 vs 2004-2 0,97 (0,80;1,18) 0,81 (0,70; 0,93) 0,79 (0,66;0,93) 1,08 (0,94;1,25) 1,08 (1,04;1,13) 2004-1 vs 2004-2 0,90 (0,74;1,09) 0,99 (0,86; 1,14) 0,87 (0,74;1,02) 0,95 (0,82;1,10) 1,03 (0,99;1,07) Interactie wijze van verlossing en KSC groep KS en Hoog vs VB en Gemiddeld 1,34 (0,97;1,86) 0,87 (0,63; 1,20) 1,08 (0,75;1,55) 1,04 (0,81;1,34) 1,66 (1,43;1,93) KS en Laag vs VB en Gemiddeld 1,53 (1,11;2,12) 1,74 (1,29; 2,36) 1,26 (0,92;1,72) 1,23 (0,98;1,55) 1,18 (1,08;1,29) KS: keizersnede; VB: vaginale bevalling; OR: odds ratio; ( ) :95% betrouwbaarheidsinterval.


Structurele problemen zoals verpleegkundige bestaffing, beschikbaarheid van artsen en

anesthesiologen, die niet in de MKG geregistreerd worden, kunnen ook een rol gespeeld

hebben bij de beslissing om een electieve keizersnede uit te voeren. 607

5.2.4.2 Beperkingen van de studie Sommige van de beperkingen van onze studie zijn intrinsiek aan gegevens afkomstig van

de statistieken van de burgerlijke stand631 en van ziekenhuisontslaggegevens100. Meer

specifiek, zijn ze beperkt in volledigheid en in accuratesse van het coderen van

obstetrische gegevens. 632 Bijvoorbeeld bleken onze gegevens i.v.m. inleiding van de

arbeid, epidurale anesthesie en KS voorgeschiedenis onvolledig en stelden we een

waarschijnlijke over-registratie vast van hypertensie en diabetes (Tabel 1). Het feit hiermee

geen rekening te kunnen houden kon tot foutieve conclusies leiden bij de interziekenhuis

vergelijking. Deze ingrepen en aandoeningen zijn immers allen gerelateerd aan een hoger

KSC en kunnen verschillen in ziekenhuispraktijk weerspiegelen. Wegens de omvang van

het voorkomen en het miscoderen van deze ingrepen en aandoeningen (1) lieten we ze

buiten beschouwing bij het samenstellen van onze studiebevolking, en (2) gebruiken we de

term van “screening” voor de interziekenhuis verschillen, die aangevuld dient te worden

door externe en interne audits.

Uit de aard zelf van onze gegevens was het ook onmogelijk het onderscheid te maken

tussen primaire electieve en herhalingssectio’s. Dit kan als een andere tekortkoming van

onze studie beschouwd worden. Al zijn analyses betreffende primaire electieve

keizersneden van vitaal belang - het beteugelen van dit type KS precies het uitgangspunt is

voor het verhinderen van het verder stijgen van het KSC - toch is de analyse van het totale

keizersnedencijfer bruikbaar voor het beantwoorden van de onderzoeksvraag van deze

studie.

Onze definitie van een laagrisico verlossing, die voortbouwde op het werk van de

AHRQ564, dat gebaseerd is op de basis triade van “ voldragen (37 weken en meer)

eenlingen in kruinligging”, en die recent gebruikt werd om maternale risicoprofielen te

beschrijven612, is wellicht onvolledig. Een meer uitgesponnen selectieprocedure, gebaseerd

op ICD-9-CM codes, en waarin diabetes, hypertensieve aandoeningen, placenta previa en

een aantal congenitale afwijkingen werden opgenomen, werd onlangs gebruikt door Kabir


et al..633 Hoewel de medische noodzaak voor het uitvoeren van een KS in geval van

diabetes zonder macrosomie601;634 en hypertensie (met uitzondering van enkele gevallen

van eclampsie met langdurig foetaal lijden635) nog niet aangetoond werd, is het zo dat zij in

de gewone praktijk geassocieerd zijn met hogere KSCs. Anderzijds kunnen placenta previa

en sommige congenitale afwijkingen terecht beschouwd worden als een indicatie voor KS.

Wegens de vaak zwakke identificatie in administratieve gegevens van gevallen d.m.v.

diagnose codes180;182, namen we een intermediaire positie aan. Hierbij sloten we gevallen

uit van abnormale ligging (met inbegrip van stuit en ingrepen voor stuit), prematuren,

doodgeboorte, meerlingzwangerschap, en geboortegewicht van minder dan 2500g of meer

dan 4499 g.

Onze gegevens bevatten ook geen informatie over sommige vormen van dystocie (zoals

disproportie en obstructie van de arbeid), en sociaal-economische status, die onze

bevindingen konden vertekend hebben.604;630;636Rekening houdend met de laagrisico aard

van de verlossingen en vermits in ons land bijna de ganse bevolking geniet van een

ziekteverzekering, die het grootste deel van de kosten voor medische zorgen draagt, lijkt

een SES vertekening echter klein. Ook de kleine odds ratio (1.034 met 95% B.I.[1.003;

1.066]), die we vaststelden wanneer we het KSC vergeleken tussen openbare en privé

ziekenhuizen (waarin, zeer approximatief gesteld, de meer bemiddelde moeders bevallen),

schraagde deze veronderstelling.

De afwezigheid van maternale eindpunten vormt een ander minpunt van onze studie.

Hoewel ernstige onder−registratie beschreven werd in verschillende Europese landen597,

kan maternale sterfte bruikbaar zijn voor vergelijkingen tussen landen, maar is ze

onbruikbaar voor interziekenhuizen vergelijkingen wegens haar lage incidentie (8 gevallen

in de studiebevolking in 4 jaar tijd en 12 gevallen in de bronpopulatie). Maternale

morbiditeit, het andere maternale eindpunt, is totnogtoe niet duidelijk omschreven.

Aandoeningen met blijvende beperkingen voor de moeder zoals infertiliteit en vaginale

fistels zijn uitzonderlijk in Europa.597 “Near misses” of “levensbedreigende voorvallen” en

zwangerschaps− of verlossinggerelateerde letsels, die leiden tot urinaire of fecale

incontinentie worden beschouwd als mogelijke indicatoren voor moederlijke morbiditeit


257

maar moeten nog vertaald worden in bruikbare indicatoren.597Hierbij dient men op te

merken dat deze indicatoren, wanneer ze berekend worden op basis van administratieve

gegevens verwant zijn aan indicatoren van patiëntveiligheid en dat men dan geredelijk kan

veronderstellen dat zij delen in hun beperkingen, meer bepaald de zeer beperkte validiteit

van hun gebruik voor interziekenhuis vergelijkingen.290

Tenslotte komen de beperkingen van administratieve gegevens gedeeltelijk voort uit het

spanningsveld dat erin bestaat dezelfde gegevens te gebruiken voor terugbetaling en voor

het meten van kwaliteit in ziekenhuizen. “When the use is reimbursement, there is a

tendency to perform coding quickly and to maximize the coding of complications and

comorbidities. When the use is to assess quality, however, it is important for coders to

have a complete record and to restrict diagnosis coding to conditions that affect patient

care.”637 Het is bijvoorbeeld dat hypertensie en diabetes tussenkomen in het algoritme, dat

gebruikt wordt voor het bepalen van de case mix van een verblijf en derhalve financieel

lucratief, waar dit niet het geval is voor inductie van de arbeid, epidurale anesthesie en een

voorgeschiedenis van een vroegere keizersnede.

5.2.4.3 Sterkten van de studie De vergelijking van de voor de studie geselecteerde variabelen en de beschikbare

informatie (Tabel 1), toont een goede overeenkomst aan in termen van volledigheid en

accuratesse. Verder toonde onderzoek aan dat keizersneden praktisch altijd correct

geclassificeerd worden82;95;632en werd er aangetoond dat een analyse d.m.v. een beperkt

aantal variabelen met gekende betrouwbaarheid tot een interziekenhuis vergelijking komt,

die behoorlijk overeenstemt met een interziekenhuis vergelijking gebaseerd op gegevens

uit een medisch dossier638. Stippen we tenslotte aan dat we door het toepassen van onze, bij

de klassieke triade bijkomende criteria op de bronbevolking zich vertaalde in een verdere

KSC reductie van 12%.


Hoewel leeftijd van de moeder vaak, maar niet altijd, erkend wordt als een onafhankelijke

risicofactor594;639-641, stemt de leeftijdscorrectie die we gebruikten overeen met de tijdens de

studieperiode geldende obstetrische praktijk630;640 en heeft ze wellicht de interziekenhuis

vergelijkbaarheid verbeterd.

5.2.4.4 Perinatale eindpunten Wij namen de neonatale sterfte niet op bij de te bestuderen perinatale eindpunten omdat ze

beïnvloed wordt door neonatale zorgen, wat buiten de scope ligt van deze studie, en

vervolgens omdat ze een zeldzaam verschijnsel is, dat zich niet leent tot een

interziekenhuis vergelijking. Tenslotte kan de neonatale sterfte, tengevolge van onze

registratiemodaliteiten, niet gekoppeld worden aan de wijze van verlossing in geval van

een transfer naar een ander ziekenhuis, wat dus, precies bij een risicogroep, de voor deze

studie nodige informatie ontoegankelijk maakt.

Daarentegen ontbreekt de informatie over Apgar scores slechts zeer zelden: in 0,39 % der

gevallen in een Zweedse studie642 en zelfs minder vaak in de onze. Zeer lage en lage één

minuut Apgar scores worden beschouwd als een uitdrukking van een niet−geruststellende

toestand643 of als een marker van een foetus in moeilijkheden615;628, die de toestand van de

foetus onmiddellijk voor de geboorte weerspiegelt. Bij correct gebruik, laten één minuut

Apgar scores toe de obstetrische praktijk616 over de ziekenhuizen te vergelijken en de

evolutie van de obstetrische zorgen te evalueren.617;618

De evidentie, die we verzamelden, over verschillen in neonatale uitkomsten in functie van

de KSC van de ziekenhuizen, kunnen als gemengd omschreven worden. Het verband

tussen een “hoog” KSC en minder “zeer lage” één minuut Apgar scores schenen in het

voordeel te pleiten van deze groep. Zoals hoger vermeld was het nochtans in deze groep

dat we een relatief exces aantroffen van zeer lage Apgar scores na een vaginale verlossing,

waar men eerder het omgekeerde had verwacht. Deze vaststelling impliceert dat minstens

een deel van de keizersneden niet verricht werd voor medische redenen. Dit wijst op een

minder goede indicatie stelling, een nochtans belangrijk onderdeel van deze

procesindicator, en derhalve een minder goede kwaliteit.


259

Meer algemeen gesteld, van de 45.104 borelingen, zonder congenitale afwijking en met

een goede één minuut Apgar score, is tenminste een groot deel verlost d.m.v. een

keizersnede voor niet−medische redenen. Evidentie vanuit Vlaanderen toont aan dat

ongeveer 8 % van de vrouwen, die bevielen tijdens onze studieperiode, al een keizersnede

ondergaan hadden644. Wanneer we deze informatie op het hele land toepassen en ervan

uitgaan dat vrouwen met een voorgeschiedenis van KS ook via een keizersnede verlost

worden, zou een meer precieze benadering een bovengrens van overgebruik aangeven van

ongeveer 40.000 keizersneden over vier jaar, aangenomen dat hogere leeftijd van de

moeder geen indicatie is voor een KS en dat de Apgar scores correct geregistreerd werden.

Anderzijds werd er in de groep van borelingen zonder congenitale afwijkingen geen

keizersnede uitgevoerd bij 574 met een “zeer lage” en 3.114 met een “lage” 5-minuten

Apgar score, waar zij er wellicht voordeel bij gehad zouden hebben via een keizersnede

geboren te zijn, wat ondergebruik van de ingreep suggereert. Vijf minuten Apgar scores

worden immers nog altijd beschouwd als een valide predictor van neonatale sterfte en

soms van neurologische letsels.619;620 Hun gebruik als predictor voor neurologische letsels

echter staat ter discussie.619;620;645-647 Noteren we dat onze bevinding van zowel over− als

ondergebruik van KS overeenstemmen met die van een andere, gelijkaardige studie.607

Het kan moeilijk of tegenaangewezen zijn Apgar waarden te interpreteren in geval van

vroeggeboorte, ernstige afwijkingen, meerlingzwangerschap, rookgedrag, drugs, trauma,

infecties, hypoxie, hypovolemie, laag geboortewicht, IUGR, stuit of van toenemende

maternale leeftijd. 621;642;645 Ook een spontane, tijdelijke verlaging van de neonatale

bloedsomloop en ademhalingsstelsel kan de interpretatie van de Apgar scores

bemoeilijken.642 Electieve KS, een zwangerschapsduur van < 38 en > 41weken, mannelijk

geslacht, foetale asfyxie, moederlijk astma en diabetes, en type van anesthesie648 (regionale

versus algemene) zijn risicofactoren voor respiratoir lijden bij borelingen. Vermits we

meerlingzwangerschappen, gevallen van prematuriteit, IUGR, congenitale afwijkingen, en

abnormale ligging met inbegrip van stuitligging 621;642;645uit onze studie sloten, vermeden

we tenminste een belangrijk deel van deze beperkingen en verder kunnen we de invloed

van anesthesie als minimaal beschouwen op voorwaarde van een oordeelkundige keuze

van type anesthesie en pijnstillende medicatie.649;650


Zoals het wel vaker voorkomt op diagnostisch gebied en in peer review, kan men terecht

stellen dat Apgar scores onderhevig zijn aan variabiliteit tussen

waarnemers.129;131;145;148;279;349;643;645;651-654 Hieraan menen we ten dele verholpen te hebben

door de categorisatie van de score in internationaal, gebruikelijke klassen.618-620;642;651

Verder menen we door de gehanteerde exclusiecriteria dit probleem nog verder verkleind

te hebben, vermits het zich vooral voordoet bij de lagere scores145. Spijtig genoeg hadden

we geen gegevens over andere bronnen van minder gunstige Apgar scores zoals

ongunstige sociaal−economische status655, roken en andere factoren die rechtstreeks of

onrechtstreeks Apgar scores kunnen beïnvloeden zoals geboren worden “buiten de

diensturen”, op een bepaalde dag in de week of op een feestdag. Met uitzondering van

SES kunnen die factoren aangepakt worden door organisatorische maatregelen en adviezen

aan de zwangeren, en zijn dus in zekere mate kwaliteitsgebonden.642;656;657 Verder

verschaffen Apgar scores informatie over een “gecompromitteerde” neonatus, die niet

altijd kan ingewonnen worden door biochemische metingen.642 Een ander, operationeel

argument ten voordele van de Apgar score bestaat in zijn praktisch volledige registratie in

de MKG, wat niet zondermeer kan aangenomen worden voor de andere neonatale

eindpunten. Tenslotte ontbreekt het ons vooralsnog aan algemeen aanvaarde en over het

ganse land beschikbare alternatieven.642;658

De resultaten voor de andere neonatale eindpunten waren ook niet éénduidig. We

twijfelden daarenboven aan de volledigheid van onze gegevens, wegens het “open vragen”

type van de registratie en het proportioneel zeer lage opnamecijfer in gespecialiseerde

diensten van borelingen met ongunstige neonatale eindpunten in de “hoog KSC” groep.

Verder scheen KS voor de meeste van deze eindpunten geassocieerd te zijn met minder

gunstige uitkomsten en schenen de ziekenhuizen met een laag KSC het minder goed te

doen, wat ook elders werd vastgesteld607. Deze bevindingen suggereren dat ziekenhuizen

met een gemiddeld KSC wellicht de betere benchmark zijn.

5.2.4.5 Organisationele aspecten Ondanks onze inspanningen om de typische beperkingen van administratieve gegevens

zoveel mogelijk te omzeilen, kunnen onze bevindingen best omschreven worden als een

“bruikbare screening”, die kan aanzetten tot het nemen van kwaliteitsbevorderende


261

initiatieven in de ziekenhuizen, veeleer dan als uitspraken over kwaliteit van de

zorgen.180;659 In onze benadering werden ziekenhuizen beschouwd als individuele

structuren van het gezondheidssysteem, waarvan de diensten een gemeenschappelijk

organisatorische cultuur en een aantal gemeenschappelijk processen deelden, en die

verantwoording dienden af te leggen.

Zoals voormeld werden niet het tot schande maken, noemen en blameren van individuen

of instituten maar het identificeren van organisatie− en cultuurgerelateerde problemen

beschouwd als het aanknopingspunt voor kwaliteitsbevorderende acties.269;426;495-498;556;660

Daarom was deze feedback anoniem en had als doel de clinici, diensten en ziekenhuizen

informatie te verschaffen, die hen toeliet zich met de anderen op een zinvolle manier te

vergelijken. Daarenboven is het mogelijk dat niet ziekenhuisspecifieke KS−gerelateerde

informatie zoals de nationale opwaartse trend, de toenemende incidentie van respiratoire

problemen na KS, en het KSC in functie van opnamedag hen kan gestimuleerd hebben

eventuele structurele problemen in het eigen ziekenhuis op te sporen. Vermelden we

hierbij het werken met shiften; het zich teveel verlaten op te weinig ervaren personeel ’s

nachts; het beschikbaar zijn en de kwaliteit van artsen, verpleegkundigen en ander

personeel; en, de mogelijkheid om diagnostische testen en ingrepen uit te voeren.656;657

5.2.4.6 College van geneesheren Hoewel er aangetoond werd dat feedback kwaliteitsinitiatieven kan stimuleren566, schijnt

het verkieselijker dat hij zou gedragen worden door iemand, gevormd in de interpretatie

van gegevens, die geldt als een autoriteit en over de nodige middelen beschikt.269 Daarom

werd aan het College van geneesheren dezelfde feedback voorgelegd als aan de

ziekenhuizen. Hij zou hen kunnen helpen ziekenhuizen te identificeren, met zowel

bovenmaatse als ondermaatse kwaliteit, om een benchmark vast te leggen en om

ziekenhuizen met kwaliteitsproblemen te helpen ze op te lossen. Daarenboven kan de

feedback en het betrokken zijn in verbeteringsprocessen hen wijzen op problemen die niet

onmiddellijk door de indicator bestudeerd worden zoals de relevantie van het “informed

consent”, electieve keizersneden met inbegrip van de KS op vraag van de moeder575;605,

stuitligging, en de afwezigheid van protocollen en richtlijnen.

Vermits medico-legale implicaties op indirecte manier de vooruitgang van

kwaliteitsbevorderende initiatieven kunnen vertragen, is het interessant te weten dat het


opvolgen van protocollen meer en meer in rechtszaken gebruikt wordt, en dat, in de meeste

staten van de VS, het toepassen van klinische paden beschouwd wordt als relevante maar

niet beslissende informatie om vast te stellen of een arts afweek van de

standaardbehandeling.661

In deze context, wordt het College geadviseerd zijn houding te definiëren betreffende drie

belangrijke ter discussie staande topics, te weten: stuitligging en vaginale verlossing,

vaginale verlossing na sectio, en keizersnede op vraag van de moeder.

1) Stuitligging en vaginale verlossing

Stuitligging bij een voldragen zwangerschap is een vrij vaak voorkomend (3 tot 4 % van

alle zwangerschappen) en fel gedebatteerd fenomeen.

De “Term Breech Trial” concludeerde dat een KS aanbieden in dit geval tot betere

resultaten leidde voor de foetus dan een vaginale verlossing, en tot even goede resultaten

voor de moeder.662;663 De resultaten van deze ene studie deden de medische praktijkvoering

in grote mate en universeel veranderen.580

Zowel methodologische gebreken als inherente beperkingen bij het toepassen van een

grootschalige, gerandomiseerde klinische studie op een complex fenomeen, waarbij

zorgverstrekkers integraal deel uitmaken van de behandeling, doen twijfelen aan de

conclusies van de studie.580;581;664 Het in acht nemen van de inclusie− en exclusiecriteria

vormen een majeur probleem bij het beoordelen van de conclusies: bijvoorbeeld bij meer

dan 30% van de moeders (in beide armen van de studie) waren er gevallen van

hyperextensie van het foetaal hoofd, die hadden moeten uitgesloten worden; tweelingen,

prematuren en doodgeboren kinderen waren ten onrechte opgenomen in de studie; en, er

waren significant meer borelingen met een gewicht van > 4.000 g in de arm van de

vaginale verlossing.580 Daarenboven hield de studie onvoldoende rekening met de het

complexe karakter van een verlossing bij stuitligging, die een correcte uitvoering van een

grootschalige, gerandomiseerde klinische studie uiterst moeilijk maakt581;665 en lijkt het

bovendien zeer moeilijk om terzelfder tijd kwaliteit te verzekeren in 121 centra.581 Verder

nodigde het protocol de deelnemende centra uit om hun cijfer van vaginale bevallingen op


263

te drijven en daarvoor de noodzakelijke veiligheidscriteria te versoepelen (het protocol

stond een dilatatie van 0,5 cm/uur toe en van 3,5 uur voor het tweede stadium).580;581

Tenslotte dienden de auteurs toe te geven dat een electieve KS, vergeleken met een

vaginale bevalling, na twee jaar geen voordeel meer bleek te bieden.666;667

Een grote Zweedse cohort studie gekoppeld met een gevallen−controle studie, kwam tot de

bevinding dat een geplande KS in geval van stuitligging leidde tot een significante

vermindering van perinatale en kindersterfte.668 Zij vermeldde nochtans dat een Noorse en

Finse studie concludeerden dat een vaginale bevalling voor een voldragen stuit in passende

gevallen, na zorgvuldige selectie, strikte foetale monitoring en in aanwezigheid van een

ervaren obstetrisch team, kan geadviseerd worden.668 Een Schotse bevolkingsstudie die

reikte tot de schoolleeftijd en waarbij gevallen van doodgeboorte en neonatale sterfte

uitgesloten waren, kwam tot de conclusie dat in geselecteerde gevallen van een voldragen

stuitligging een geplande vaginale bevalling met KS wanneer nodig, even veilig was als

een KS in termen van lange termijn handicap.669

Een recente observationele studie670 over een voldragen stuitligging, waaraan ons land

deelnam, stelde naast belangrijke interregionale praktijkverschillen in wijze van

verlossing, een laag cijfer (1.59%; 95%CI (1.33-1.89)) vast van de gecombineerde

neonatale uitkomst (foetale en neonatale mortaliteit of ernstige neonatale morbiditeit) en

geen significante verschillen (OR: 1.10; 95% BI [0.75-1.61]) tussen de geplande vaginale

verlossingsgroep (N = 2.502) en de geplande keizersnedengroep (N = 5.573).

In geval van een voldragen stuitligging, werd er in Nederland voorgesteld aan ouders het

advies te verstrekken dat een geplande KS niet zou resulteren in een verminderd

sterfterisico noch in een verbetering van de neurologische uitkomst na twee jaar.671

2) Vaginale verlossing na sectio.

Hoewel arbeidsmanagement en objectieve criteria voor het diagnosticeren van dystocie

hoekstenen zijn van een institutionele verbetering van de keizersnedenpraktijk577, blijft

vaginale bevalling na sectio een waardevol alternatief voor een herhalingssectio hoewel

hiertegen een probleem in termen van veiligheid aangevoerd wordt.564;577;672-675


Bij de vergelijking van een proefarbeid met een electieve KS, vonden McMahon et al.

tweemaal zoveel belangrijke maternale verwikkelingen (hysterectomie, uterusruptuur en

operatief letsel) in de arm van de proefarbeid. Apgar scores, opname in een NICU, en

perinatale mortaliteit, waren nochtans vergelijkbaar bij borelingen van moeders met een

proefarbeid en die waarvan de moeder een electieve herhalingssectio ondergingen.675

Het risico van een uterusruptuur werd bevestigd in andere studies.632;676 Toegenomen

perinatale mortaliteit en morbiditeit werden eveneens geassocieerd met een proefarbeid na

voorafgaande sectio.567;588;632;676 Vermelden we dat in de VS ongeveer één derde van de

sectio’s herhalingssectio’s zijn.564;677

Men vindt grote interziekenhuis praktijkverschillen, die niet verklaard kunnen worden

door verschillen in de klinische bevolkingen of in het type van ziekenhuis. Markers van

SES schijnen het meest uitgesproken effect te hebben op het cijfer van de pogingen tot

vaginale bevalling na een eerdere keizersnede.629;678 Recente rapporten verdedigen

nochtans een vaginale bevalling na een eerdere keizersnede, al dan niet op voorwaarde dat

het advies voor vaginale bevalling na een eerdere keizersnede gebaseerd zou zijn op een

scoresysteem.576;578;579;679-681

Bij gebrek aan gerandomiseerde klinische studies, besloot een peer−reviewed evidentie

rapport dat de uitkomsten vergeleek van een electieve herhalingssectio met een proefarbeid

voor een vaginale bevalling na een eerdere keizersnede (met inbegrip van de studie van

McMahon) dat maternale sterftecijfers niet verschilden; dat infectiecijfers hoger lagen bij

electieve herhalingssectio, maar dat in subgroepanalyses voor proefarbeid al dan niet

gevolgd door een KS deze cijfers hoger lagen in de groep vrouwen die uiteindelijk een

sectio ondergingen. Verder stelde men vast dat in geval van uterusruptuur het risico voor

een maternale hysterectomie 4,8/ 10.000 bedraagt en het risico voor perinatale sterfte

1,5/10.000; en, dat er onvoldoende materiaal beschikbaar is om het effect van de wijze van

verlossing op Apgar scores en respiratoire morbiditeit vast te stellen.576

In een review van 2005 concludeerden de auteurs dat studies op een consistente manier

hoge slaagcijfers ( 60 tot 80 %) rapporteerden bij vaginale bevalling na een eerdere

keizersnede bij vrouwen die eerder een lage segment incisie gehad hadden en dat : “De


265

huidige evidentie suggereert dat de meeste vrouwen, die insneden van het lage segment

hadden bij een vorige keizersnede, veilig een proefarbeid kunnen ondergaan.”680

Voortbouwend op het AHRQ Evidence Report Number 71, werden er klinische richtlijnen

uitgewerkt, met inbegrip van de beoordeling van de waarschijnlijkheid op succes van een

vaginale bevalling na een eerdere keizersnede.682

Van twee lopende gerandomiseerde klinische studies wordt uitsluitsel verwacht

betreffende de VABC problematiek.680 Onnodig te zeggen dat deze problematiek uitvoerig

met de patiënte dient besproken te worden vooraleer een beslissing rond de

bevallingswijze genomen wordt.588;682;683

3) Keizersnede op vraag van de moeder.

Het National Institute for Clinical Excellence adviseert dat zwangere vrouwen, die om een

KS vragen, er niet automatisch een krijgen indien er daarvoor geen medische redenen

bestaan.684 Ook ACOG waarschuwt voor een electieve herhalingssectio voor

niet−medische redenen, zeker bij vrouwen die meerdere kinderen verlangen, omdat het

risico op placenta previa en accreta stijgen bij iedere KS.685

Naast medische redenen toonde het National Collaborating Centre for Women's and

Children's Health aan dat significante kostenbesparingen kunnen gemaakt worden door een

beleid te voeren dat erop gericht is de maternale vraag naar KS te verminderen.593 Beide

aspecten zijn essentieel in Donabedian’s benadering van kwaliteit.265

5.2.4.7 Feedback naar beleidsverantwoordelijken Onze feedback kan, naast ziekenhuizen en het College, ook nuttig blijken voor

beleidsverantwoordelijken. Hij kan immers de groeiende medicalisering van het

geboortegebeuren onder hun aandacht brengen en meer bepaald een aantal van zijn

structurele oorzaken. Dit materiaal kan een beleid schragen dat erin bestaat een

operationele structuur te creëren die ermee belast wordt de toekomstige nationale

feedbacks te begeleiden, de ontwikkeling van hierop gebaseerde kwaliteitsbevorderende

acties en het initiëren van bijkomende indicatoren.Verder zullen lokale initiatieven, die

aansluiten op de feedback, aangemoedigd worden. Zowel een continue investering in een

infrastructuur voor kwaliteitsbevordering als het voorzien in een beschermde tijd voor deze

activiteiten zijn vereist om het project te laten slagen.557


Tenslotte blijkt uit deze feedback duidelijk dat de organisatie van de obstetrische zorgen

van fundamenteel belang is voor het beheersen van het keizersnedencijfer. Dit probleem

zal in overleg tussen de verschillende niveaus dienen aangepakt te worden. Elementen van

overweging bevatten (1) regionalisatie van diensten zodat er ook tijdens de weekends en

buiten de diensturen altijd over het nodige personeel kan beschikt worden, (2) herziening

van het financieringsmechanisme met onder meer een relatieve opwaardering van de

vaginale verlossing en een betaling voor een zwangerschapsepisode, (3) operationele

opsplitsing van het specialisme gynecologie-obstetrie, en herwaardering en

herpositionering van de vroedvrouw, (4) aanduiding door de bevoegde overheden van een

groep experten waarop de rechters dienen beroep te doen in geval van een gerechtelijk

proces, (5) een door de Colleges en beroepvereningingen uit te werken “informed

consent” waarin de indicaties voor een keizersnede objectief worden toegelicht, en (6)

objectieve informatie naar de toekomstige moeders waarbij het beeld van “de keizersnede

als de uiteindelijke manier van verlossing” objectief benadert wordt.

Bijlage 1: Feedback. Beslisboom.

Stap1: Periode analyse In overeenstemming met de aanwezige informatie wordt een periode score toegekend.

Afwijking Bonferroni bovengrens

95% bovengrens

95% ondergrens

Bonferroni onder grens

Periode score

> + 35 ≥ 0 1 > + 35 ≥ 0 < 0 2 < - 25 ≤ 0 3 < - 25 > 0 ≤ 0 4 < + 36 en > -26

5

> + 35 < 0 6 < - 25 > 0 7


267

Stap 2: Trend analysis In overeenstemming met de aanwezige informatie wordt een trend score toegekend.

Afwijking Bonferroni bovengrens

95% bovengrens

95% ondergrens

Bonferroni onder grens

Trend score

> + 5 ≥ 0 1 > + 5 ≥ 0 < 0 2 < - 5 > 0 ≤ 0 3 < - 5 ≤ 0 4 < 6 en > -6 5 Stap 3: Combinatie van periode en trend analyse

Periode score Trend score Cat Feedback 1 1 1 EAE A>01 2 1 EAE A>01 3 2 IAI A>0 1 4 2 IAI A>0 1 5 1 EAE A>02 1 2 IAI A>0 2 2 2 IAI A>0 2 3 3 iai A>0 2 4 3 iai A>0 2 5 2 IAI A>0 3 1 5 iai A<0 3 2 5 iai A<0 3 3 7 EAE A<03 4 7 EAE A<03 5 7 EAE A<04 1 6 IAI A<0 4 2 6 IAI A<0 4 3 5 iai A<0 4 4 5 iai A<0 4 5 5 iai A<0 5 1 2 IAI A>0 5 2 3 iai A>0 5 3 5 iai A<0 5 4 5 iai A<0 5 5 4 AMG 6 Eender welke 3 iai A>0 7 Eender welke 5 iai A<0

Cat: globale score; EAE: externe audit aanbevolen; IAI: interne audit aanbevolen; iai: interne audit valt te overwegen; AMG: neem algemene maatregelen. A < 0: afwijking < 0; A > 0: afwijking > 0.


Bijlage 2: Majeure congenitale afwijkingen mogelijkerwijs gerelateerd met geboorte asfyxie

Congenitale afwijking ICD−9−CM Neuraalbuis defecten 740.0−741.9 Hersenafwijkingen 742.0, 742.2−742.4, 745.9 Microcefalie 742.1 Majeure aangeboren hartafwijkingen

745.0−745.3, 745.6, 746.0−746.9, 747.1, 747.3, 747.41

Cerebrovasculaire anomalie 747.81 Anomalie van het ademhalingstelsel 748.3−748.6 Gastrointestinale anomalie 750.3, 751.0−751.5,751.8, 751.9 Renale/blaas anomalie 753.0−753.9 Cranosynostose 756.0 Defect van de abdominale wand 756.7 Down syndroom 758.0 Andere congenitale afwijkingen 758.1−758.9 Multipele anomalieën niet gespecificeerd

759.7

5.3 INTERZIEKENHUIS VERGELIJKING VAN LETALITEITCIJFERS NA EEN OPNAME VOOR

ACUUT MYOCARDINFARCT.

De tekst van dit hoofdstuk is gebaseerd op onderzoek van de jaren 2004 tot 2007.

Vertrekkend van een tekst van de AHRQ wordt de analyse van deze kwaliteitsindicator

met input van de Collegs van cardiologen, intensivisten en urgentisten, en van het

MONICA-register (Gent-Brugge) verfijnd en aangepast aan de Belgische context.

5.3.1 Inleiding

Het acuut myocardinfarct (AMI) is een belangrijk gezondheidsprobleem in termen van

frequentie, ernst, sociale en economische kosten, behandelbaarheid, en wordt beschouwd

als een prioriteit door beleidsmakers en gemeenschap.500;686;687

Het is gekenmerkt door een hoog letaliteitcijfer (AMI-LC), tot negen maal meer in de

oudere leeftijdsgroepen (> 65 jaar)688. Deze leeftijdsgroepen vertonen overigens minder

typische symptomen en vaker een cardiogene shock.688


269

Acute hartdecompensatie doet zich binnen de 24 uur na een AMI voor bij 30% van de

patiënten en leidt in 7-10 % der patiënten tot een cardiogene shock, de meest gevreesde

verwikkeling van AMI.689 Dergelijke shock is gekenmerkt door een sombere prognose en

doet zich ongeveer in 1/3 der gevallen vóór de ziekenhuisopname voor.690-696 Indien

systematisch en onmiddellijk een angioplastie, wat door de Europese richtlijn697

aanbevolen werd, toegepast wordt, situeert de intramurale letaliteit bij cardiogene shock

zich rond 25% versus ongeveer 1% indien het een AMI zonder shock is.693

Er bleek anno 2000 weinig of geen letaliteit- en therapieverschil tussen mannen en

vrouwen meer te bestaan, wel verschillen in symptomatologie.698-703 Daartegenover staat

dat er bij oudere patiënten een ondergebruik bestaat van thrombolytische therapie.688

In de midden-negentiger jaren stelde men dat het natuurlijk verloop van AMI moeilijk te

beschrijven was wegens het bestaan van asymptomatische infarcten, van fatale acute

coronaire sterfgevallen buiten het ziekenhuis en van verschillen in de gebruikte

diagnostische methodologie.697

De “community” 30-dagen AMI-sterfte werd op een consistente manier geëvalueerd op

50% waarvan de helft binnen de eerste twee uur.697 De intramurale AMI letaliteit

evolueerde van een 25-30% in de 60ger jaren tot een 18% in de midden-tachtiger jaren, de

extramurale sterfte daarentegen veranderde in Europa, in tegenstelling met Minnesota

(Verenigde Staten)704, in die tijdsspanne nagenoeg niet697.

Het type ziekenhuis (met of zonder een cardiologiedepartement) scheen een invloed te

hebben op behandeling en uitkomst na een AMI, gekenmerkt door een lagere mortaliteit en

minder hartfalen. Men slaagde in ziekenhuizen met een cardiologiedepartement er vaker

in de doorstroming te herstellen.705

Hoewel er aangetoond werd dat richtlijnen het AMI-LC doen dalen706-709, werden ze in

Europea710-712 en Noord-Amerika688;713-717 niet altijd en niet eenvormig toegepast, onder

meer wegens het niet doorstromen van richtlijnen uit “cardiologen” tijdschriften naar

huisartsen en internisten.706;714;718Verder schijnt het zo te zijn dat er een omgekeerd

verband bestaat tussen de ernst van een geval en het toepassen van richtlijnen, 710en zijn de

richtlijnen voor thrombolyse in oudere patiënten niet eenduidig688.

Het publiekelijk vrijgeven van AMI-LC schijnt in een Canadese context een positieve

invloed uit te oefenen op kwaliteitsinitiatieven.298


Om de zorg van AMI-patiënten te rationaliseren, werd in België een cardiaal

zorgprogramma ingevoerd.719 Een structuur bestaande uit drie niveaus werd opgezet:

basiszorg ziekenhuizen (met A als label) zonder catheterisatie mogelijkheden,

intermediaire ziekenhuizen (met B1 als label) waar coronaire angiografieën kunnen

uitgevoerd worden maar geen percutaneous coronary intervention (PCI), en tertiaire

ziekenhuizen (met B2-B3 als label), die de ganse gamma van cardiale therapieën

aanbieden met inbegrip van PCI en coronary artery bypass graft (CABG).

Nochtans bleek een recente studie niet bij machte een betere uitkomst aan te tonen voor

patiënten, behandeld in een dienst waar een PCI uitgevoerd kon worden.720

Een vergelijking van de intramurale AMI-LC tussen de ziekenhuizen is geen eenvoudige

opgave. Als voormeld doen een groot deel van de sterfgevallen zich voor in de eerste twee

uur na het infarct, wat tot het niet-stellen van een “vaste klinische” diagnose op basis van

de klassieke criteria (symptomen, EKG en enzymen) kan leiden, en bestaan er verschillen

in diagnosestelling met een eventuele weerslag op teller en noemer van het

letaliteitcijfer.697;721

Twee van de belangrijkste problemen in verband met cardiale zorg, te weten het volume-

uitkomst verband voor PCI en de superioriteit van primaire angioplastie ten aanzien van

thrombolytische therapie, beheersten anno 2000 - onze studieperiode liep van 2002 tot

2005 - het wetenschappelijke debat.716Hierbij dient men er rekening mee te houden dat in

het “reële leven” patiënten in eerste instantie beroep doen op lokale spoeddiensten en

lokale ziekenhuizen en dat daar de therapeutische beslissing over een eventuele

angioplastie versus thrombolyse genomen wordt.722In België bepaalde de toenmalig

geldende bepalingen trouwens dat patiënten door de spoeddiensten naar het

dichtstbijzijnde ziekenhuis moesten gebracht worden.720

Laten we om een faire interziekenhuis vergelijking te kunnen doorvoeren de toenmalige,

zich ontwikkelende en actuele stand van de wetenschap summier trachten weer te geven.

Wij baseerden ons hiervoor bij voorkeur op klinische studies of meta-analyses.

Men nam aan dat er een onderscheid diende gemaakt te worden tussen ST segment

elevatie myocardinfarct (STEMI) en nieuwe Linker Bundeltakblok (LBTB), en niet-ST


271

segment elevatie myocardinfarct (NSTEMI), wegens hun verschillende prognose en

behandeling.697;705;717;723;724

In geval van STEMI of een nieuwe LBTB gold het voorschrift zo snel mogelijk de

perfusie te herstellen.697;704;713;717;725-727Dit gebeurde dan liefst via PCI of CABG697;728-732,

zeker in de hoogrisico gevallen697, maar ook als een thrombolyse niet tijdig kon

doorgevoerd worden.733

Verder kwam men tot de bevinding dat het veilig was patiënten te vervoeren van

basiszorg naar tertiaire ziekenhuizen733, op voorwaarde dat verkeersopstoppingen geen

courant probleem vormden725. Men stelde vast dat hoogrisicopatiënten – er bestonden

bruikbare classificatiesystemen om hen te identificeren734 - en patiënten met extensieve

infarcten beter getransporteerd werden voor een angioplastie dan dat ze een thrombolyse

kregen735-737. Wel bestonden er opinieverschillen over transfer bij slechte hemodynamische

toestand (o.a. cardiogene shock)725;733;738-740.

Het was ook zo dat patiënten met contra-indicaties voor thrombolyse bijna steeds d.m.v.

een invasieve benadering konden behandeld worden in competente centra.739Het begon

eveneens duidelijk te worden dat stents en abciximab - een bloedplaatjesaggregatie

inhibitor - de uitkomsten van primaire angioplastie verbeteren.739

Het inzicht groeide dat primaire angioplastie meer kosten-effectief zou zijn dan

thrombolyse, en dat primaire angioplastie waarschijnlijk veilig uitgevoerd kon worden

zonder chirurgische back-up, mits het rigoureus toepassen van eligibiliteitscriteria.739 De

relatieve merites van pre-hospitaal (“on-site”) thrombolyse en Primary PCI (PPCI) stonden

ter discussie736;741en pre-hospitaal thrombolyse werd als efficiënter beschouwd dan

intramurale thrombolyse.742 Men stelde verder vast dat een opname buiten de diensturen

het starten van de therapie vertraagde, wat vooral in geval van thrombolyse tot slechtere

resultaten leidde743en dat het volume van uitgevoerde PTCAs omgekeerd evenredig was

met mortaliteit717;738;741;744.

De gehanteerde definitie en veranderingen in de definitie van AMI kunnen in grote mate

de incidentie en letaliteitcijfers van AMI beïnvloed hebben, net zoals de verscheidenheid

van de verschillende cardiale troponine assays.721;745-749 Er bleek overigens slechts een


matige overeenkomst te bestaan tussen diagnose bij opname en bij ontslag.712 Verder

maakte de Internationale Classificatie van Ziekten, Negende Herziening, Klinische

Modificatie194 (ICD-9-CM) voor 2006 – dus tijdens de studieperiode - geen onderscheid

tussen STEMI en NSTEMI, hoewel ze daarvoor nu richtlijnen verschaft.750 STEMI wordt

gecodeerd als 410.0-6, 410.8; NSTEMI als 410.7; en AMI “Not Otherwise Specified”

(AMI NOS) als 410.9. Het wordt dan, behalve het problematische AMI NOS, mogelijk de

codering te herinterpreteren in overeenstemming met deze update.

Een volgende moeilijkheid betreft het presenteren van de eventuele verschillen in AMI-

LCs tussen de ziekenhuizen. “League tables” (profielen zonder adequate risicocorrectie)

zijn hiervoor inadequate instrumenten.286 Administratieve gegevens en meer specifiek hun

correctie-maten (zoals ROM) dienen in deze context van risicocorrectie trouwens zeer

omzichtig gebruikt te worden.188;196Verschillende alternatieve benaderingen werden

ontwikkeld. Vaak gaat het dan over geselecteerde studiegroepen of leeftijden.715;751 Een

eenvoudig drievariabelen model, bestaande uit leeftijd, hartslag en systolische bloeddruk

bij opname (allen als continue variabelen gemodelleerd) bleek voor patiënten van alle

leeftijdsgroepen een goede predictor te zijn voor de 30-dagen mortaliteit zoals uit een

“area under the receiver operatings characteristic curve” (AROC) van ongeveer 0,75

bleek.751Geslacht leek geen invloed uit te oefenen, maar leeftijd alleen bleek een AROC

van 0,71 op te leveren.751 Ongeveer gelijktijdig werden in Canada twee modellen,

gebaseerd op elf secundaire oorzaken of op Charlson’s comorbidity index in

ziekenhuisontslaggegevens, ontwikkeld, die vergelijkbare resultaten opleverden (met iets

betere resultaten voor het elfvariabelen model), ook wanneer het toegepast werd op een

bevolking in de VS.752

Naast klinische en epidemiologische bevindingen, die een verband aantoonden tussen

betere zorg en betere uitkomst707;753, leidden de maatschappelijke implicaties bij de

programmering van cardiale zorgen en het feit dat meerdere landen AMI-LC reeds als

kwaliteitsindicator gebruikten286;301;752 of van plan waren te gaan gebruiken ons er toe

AMI-LC te gebruiken als kwaliteitsindicator.

Onder voorbehoud over voldoend volledige en accurate gegevens te beschikken, trachtten

we aan de hand van ontslaggegevens het bestaan aan te tonen van (1) klinisch belangrijke


273

en statistisch significante interziekenhuis verschillen in AMI-LC, en (2) een nationale

trend van het AMI-LC. Daarenboven trachtten we de letaliteit te vergelijken in functie van

het type ziekenhuis.

5.3.2 Methoden

5.3.2.1 Gegevensbronnen De Minimale Klinische Gegevens (MKG) bevatten patiëntengegevens (waaronder

geboortejaar, geslacht, verblijfplaats, een anoniem ziekenhuisidentificatienummer),

verblijfsgegevens (waaronder het jaar en de maand van opname en ontslag, transfer vanuit

en naar een ander ziekenhuis) en een onbeperkt aantal nevendiagnosen en ingrepen. De

MKG verzamelt gegevens over alle verblijven met inbegrip van verblijven van patiënten,

die in het buitenland verblijven. Een uniek identificatienummer, dat het opvolgen van een

getransfereerde patiënt moet toelaten, ontbreekt. Daarentegen is het mogelijk de

“Charlson’s comorbidity index” te berekenen, die bijzonder geschikt lijkt voor het

bestuderen van de ziekenhuisletaliteit bij patiënten met een ischemische hartziekte.326

Daar volledigheid en accuratesse van de gegevens welgekende beperkingen zijn van

administratieve gegevens182;718 vergeleken we onze gegevens met die van het MONICA

(Multinational Monitoring of Trends and Determinants in Cardiovascular Disease)

register, die verzameld worden volgens de WGO richtlijnen.745 Deze vergelijking dient met

de grootste omzichtigheid uitgevoerd te worden: de studiepopulatie is niet helemaal

identiek en de definitie van de gevallen gebeurt niet op dezelfde manier. Voor MONICA

wordt de studiepopulatie gedefinieerd als alle personen woonachtig in de studieregio i.e. in

Groot Gent en in het arrondissement Brugge, met uitzondering van Knokke-Heist. De niet-

fatale gevallen worden opgespoord via een gestandaardiseerde benadering van de

ziekenhuizen in de regio en via een bevraging van huisartsen van de studieregio met

inbegrip van gevallen elders in België en het buitenland. Voor de fatale gevallen wordt

daarenboven beroep gedaan op de overlijdensberichten van personen woonachtig in de

studieregio. Uit de MKG selecteerden wij alle personen met een woonplaats in de

studieregio. Waar de criteria voor het definiëren van een AMI-geval op eenvormige manier

gehanteerd wordt in de MONICA registratie (gebaseerd op kliniek, EKG en cardiale

enzymen), die dezelfde blijven over de jaren kunnen we dit niet zo maar veronderstellen


voor de MKG. In functie van de aanwezige evidentie onderscheidt MONICA onder meer

“bewezen”, “mogelijke” en “fatale gevallen met onvoldoende gegevens”. Zoals Kuch et

al. het stellen berust de klinische definitie van AMI op een aan de hand van symptomen,

EKG en enzymen gestelde diagnose van acuut myocardinfarct wat overeenkomt met een

“bewezen” geval van MONICA.721Merken we hierbij op dat MONICA om de tijdstrend

van AMI-gevallen en de resultaten van hun behandeling te volgen geen beroep doet op de

meer gevoelige nieuwere cardiale enzymen. Tenslotte dient men er rekening mee te

houden dat de AMI diagnose van de MKG gebaseerd is op de diagnose bij opname waar

dit voor MONICA de diagnose bij ontslag is.

5.3.2.2 Studiepopulatie Voortbouwend op het werk van de Agency for Healthcare Research and Quality

(AHRQ)753, selecteerden we voor de periode van 2002 tot 2005 uit de MKG alle verblijven

met een hoofddiagnose van AMI (ICD-9-CM code 410.*1). Gevallen zonder informatie

betreffende de vitale status bij ontslag of van minder dan 18 jaar werden uitgesloten.

Vermits ziekenhuizen met zeer weinig observaties ook extreme, niet significante waarden

vertonen, die de interpretatie van de figuren bemoeilijken, sloten wij daarenboven

ziekenhuizen met minder dan 20 gevallen per jaar uit.

Wegens problemen verbonden aan het transfereren van zieken, met name het dubbel tellen

van gevallen, en om de vergelijking tussen de ziekenhuizen zo eerlijk mogelijk door te

voeren, werd naar het voorbeeld van het AHRQ het AMI-LC op twee manieren berekend.

Een eerste, de zogenaamde IQI 15753 waarin de “uitgaande” transfers werden uitgesloten

(om geen nationale cijfers te berekenen met tweemaal getelde observaties) (N = 46287) en

een tweede, de zogenaamde IQI 32754, waarin zowel de “binnenkomende” als de

“uitgaande” transfers werden uitgesloten (om een vergelijking tussen ziekenhuizen

mogelijk te maken in de subset van gevallen die er van opname tot ontslag behandeld

werden) (N = 38121).

We hebben het probleem van de transfers meer uitvoerig bestudeerd op basis van de MKG

2001-2004.


275

5.3.2.3 Analyse Voor de bedoeling, de eenheid van analyse, de bepaling van een “zone van niet-

interpretatie”, de gegenereerde feedback en zijn interpretatie, en de statistische analyse

verwijzen we naar de gelijknamige secties in 5.2.2 van onze studie m.b.t. het

keizersnedencijfer.

Bij gebrek aan een uniek identificatienummer trachtten we getransfereerde patiënten te

identificeren met een samengestelde sleutel bestaande uit het geboortejaar van de patiënt;

geslacht; woonplaats; jaar en maand van opname en ontslag; en, in de veronderstelling van

zeer korte transfer tijden, weekdag van het ontslag (in het ziekenhuis van waaruit

getransfereerd werd) of opname (in het ziekenhuis waar naartoe getransfereerd werd).

Wegens het numerieke en therapeutisch belang van transfers na een AMI, trachtten we na

te gaan hoe belangrijk dit fenomeen in onze studie was. Verder zou uit de transfer

reconstructie ook belangrijke aanduidingen i.v.m. kwaliteit van de gegevens en van de

zorgen kunnen gewonnen worden. Het zou mogelijk zijn bij dergelijke patiënten na te gaan

(1) of de Charlson’s comorbidity index constant bleef en (2) hoelang de patiënt in het

ziekenhuis van de uitgaande transfer verbleef vooraleer hij getransfereerd werd. Een

constante Charlson’s co-morbidity index is belangrijk in termen van

codeervergelijkbaarheid en derhalve voor onze risicocorrectie. De verblijfsduur vóór

transfer is belangrijk om het onderscheid te kunnen maken tussen een onmiddellijke

doorverwijzing of een noodangioplastie na een mislukte thrombolyse en een latere transfer

voor een electieve PTCA in afwezigheid van spontane of provoceerbare ischemie, die noch

het functioneren van de linker ventrikel, noch de overlevingskansen verbetert.697

Tenslotte voerden we een sensitiviteitsanalyse uit door cardiogene shock aan het model toe

te voegen al dan niet in combinatie met angioplastie en STEMI, waarbij STEMI uit drie

categorieën bestond, afgeleid op basis van de voormelde ICD-9-CM codes en met name

STEMI, NSTEMI en AMI NOS. Het al dan niet toedienen van een thrombolytische

therapie kan op basis van de MKG alleen niet achterhaald worden, maar vereist een

koppeling met de RIZIV gegevens. Vermits deze koppeling een bijzondere toelating

vereist (waarvoor de procedure nog niet definitief vastligt) konden we thrombolyse in deze

studie niet opnemen en dient de bruikbaarheid van dit gegeven voor een routine analyse

nog uitgeklaard te worden.


5.3.3 Resultaten

5.3.3.1 Volledigheid en accuratesse van de gegevens. Vergelijking tussen MKG en MONICA Gent Brugge

Bij de vergelijking van de gegevens tussen beide registratiesystemen vallen de bijzonder

grote verschillen op zowel qua aantallen gevallen als qua aantallen fatale gevallen (Tabel

1). Het gaat hierbij over een veel groter aantal gevallen in de MKG registratie, op de

vrouwen in Gent na, en over een veel groter aantal fatale gevallen geregistreerd in de

MONICA registratie.

Noteren we dat in de MONICA registratie 32 van de 77 sterfgevallen zich in het eerste uur

na het ontstaan van de symptomen voordeden (Tabel 2), toen die patiënten zich

waarschijnlijk nog in de spoeddienst bevonden en derhalve niet als een AMI geregistreerd

werden in de MKG. Verder is het mogelijk dat een deel van de patiënten die na meer dan

24 uur overleden, thuis overleden zijn.

Tabel 1 Volledigheid en accuratesse van de gegevens Vergelijking tussen MKG en MONICA Gent Brugge BRUGGE Mannen Vrouwen MKG MONICA MKG MONICA Leeftijd Fatale

gevallen Totaal Fatale



gevallen Totaal

25-34 0 0 0 0 0 0 0 0 35-44 0 5 0 6 0 1 0 1 45-54 1 38 5 44 0 2 1 6 55-64 1 51 5 48 1 5 1 5 65-69 1 23 5 21 0 7 3 11 70-74 2 26 5 27 2 13 4 16 Totaal 5 143 20 146 3 28 9 39 GENT Mannen Vrouwen MKG MONICA MKG MONICA Leeftijd Fatale




gevallen Totaal

25-34 0 2 0 2 0 3 0 2 35-44 0 8 1 13 0 0 0 1 45-54 1 26 5 31 1 4 3 9 55-64 5 46 12 49 1 11 5 11 65-69 0 16 4 21 1 5 2 9 70-74 4 25 9 24 0 15 7 15 Totaal 10 123 31 140 3 46 17 47


277

Tabel 2: Aantal fatale gevallen per tijdsperiode van overlijden, geregistreerd in de MONICA registratie.

Tijdsperiode van overlijden Brugge Gent Totaal

Mannen Vrouwen Mannen Vrouwen

< 1 uur 6 2 17 7 32

1-24 uur 6 4 9 5 24

> 24 uur 8 3 5 5 21

Totaal 20 9 31 17 77

5.3.3.2 Transfers We bestudeerden het probleem van de transfers op basis van de MKG 2001-4.

Zoals blijkt uit figuur 1 werd er bij 23.556 (37%) van de 63.237 verblijven, met AMI

(410.*1) als hoofddiagnose, een transfer geregistreerd. De onvolledigheid van de

registratie m.b.t. transfers kwam aan het licht wanneer we de binnenkomende (IN) en

uitgaande transfers (OUT), respectievelijk 6.555 en 12.409 trachtten te koppelen. We

konden dan slechts 2.524 van de inkomende transfers terugvinden in de uitgaande

transfers. Van deze 2524 inkomende transfers waren er daarenboven 513 afkomstig uit

een B2-B3 ziekenhuis en getransfereerd naar een A of B1 ziekenhuis. Het ging hierbij

waarschijnlijk over patiënten afkomstig uit een A of B1 ziekenhuis, doorverwezen naar

een B2-B3 ziekenhuis voor een angioplastie, na behandeling terug opgenomen in het eerste

ziekenhuis en waarbij de transfers onvolledig geregistreerd waren.

De verblijven met transfers, waarbij we een koppeling hebben kunnen maken tussen

binnenkomende en uitgaande transfers, werden verder onderzocht met een dubbele

bedoeling. Een eerste ging over de accuratesse van de gegevens en met name in welke

mate de co-morbiditeit bij dezelfde patiënt in twee ziekenhuizen eenvormig geregistreerd

werd. Hiervoor vergeleken we de kwartielenwaarden van de Charlson scores in het

ziekenhuis van waaruit de patiënten getransfereerd werden met de kwartielenwaarden van

de Charlson scores voor dezelfde patiënten in het ziekenhuis waarheen zij getransfereerd

werden. Deze nogal summiere vergelijking leverde volgend resultaat op: vóór transfer


bedroegen de kwartielwaarden voor het eerste kwartiel 0, voor de mediaan 0 en voor het

derde kwartiel 2. Na transfer bedroegen die waarden respectievelijk 0, 1 en 2. Wanneer we

de Charlson’s comorbidity index vóór en na transfer bij de binnenkomende (IN) en

binnenkomende en uitgaande transfers (IN én OUT) bleken de drie kwartielen van de

scores dezelfde waarde te hebben. Dit wijst, menen we, op een aanvaardbare

codeervergelijkbaarheid in de meerderheid van de gevallen en met een beperkte weerslag

op de riscocorrectie.

Figuur 1: Interziekenhuizen transfer van patiënten in geval van een verblijf met AMI

(410.*1) als hoofddiagnose. MKG 2001-4

39711 verblijvenzonder transfer

(63%)

6555 verblijventransfer IN

(10%)

12409 verblijventransfer OUT

(20%)

4592 verblijventransfer IN èn OUT

(7%)

23556 verblijvenmet transfer (in en/of out)

(37%)

Hoofddiagnose = AMI63267 verblijven

Een tweede aandachtspunt betrof het ogenblik van de transfer. Dit gegeven laat immers toe

na te gaan of de transfer gebeurde voor een onmiddellijke (“rescue”) angioplastie, in

principe minder dan 24 uur. Bij deze groep patiënten was de verblijfsduur (LOS) vóór een

transfer naar een B2-B3 ziekenhuis groter dan 24 uur bij minstens 50% der patiënten

(Mediaan van LOS = 2). Dit suggereert dat het in een behoorlijk aantal gevallen niet om

een transfer voor een spoed angioplastie ging maar wel voor een electieve angioplastie.


279

5.3.3.3 Sensitiviteitsanalyse Vertrekkend van een basismodel met leeftijd, geslacht en Charlson’s comorbidity index als

verklarende variabelen, voegden we eerst het al dan niet aanwezig zijn van een cardiogene

shock en vervolgens het uitvoeren van een angioplastie als verklarende variabelen aan het

basismodel toe. We herhaalden deze opzet maar nu met een het al dan niet aanwezig zijn

van een STEMI in plaats van een shock. Zowel de periode als trendanalyses werden

telkens uitgevoerd. Deze oefening deden we zowel voor de gegevens zonder uitgaande

transfers (IQI 15) als voor de gegevens waarbij alle transfers werden uitgesloten (IQI 32).

Voor deze analyses maakten we gebruik van MKG 2002-5.

Om de invloed van het toevoegen van verklarende variabelen aan het model te resumeren,

hebben we de ziekenhuizen in zeven categorieën ondergebracht. Zij varieerden van sterke:

categorie 1, matige: categorie 2, zwakke: categorie 3 evidentie van een afwijking boven

het nationale gemiddelde cijfer en trend; over geen of geen interpreteerbaar verschil:

categorie 4; tot zwakke: categorie 5, matige: categorie 6 en sterke: categorie 7 evidentie

van een afwijking onder het nationale gemiddelde cijfer en trend. Hierbij gingen we na of

de verschillende modellen ook leidden tot een verandering van categorie voor de

ziekenhuizen.

We vonden geen invloed, onafhankelijk van de gebruikte correctie en van de selectie van

de verblijven in functie van een eventuele transfer, in 26 ziekenhuizen [20 maal categorie

4; 2 maal categorie 1 en 2 maal categorie 5; 1 maal categorie 2; 1 maal categorie 7]. De

ziekenhuizen met een constante categorie 1 en categorie 7 waren van het type A.

Bij 61 ziekenhuizen vonden we een geringe invloed van de gebruikte correctie. Hierbij

definieerden we gering als maximaal 2 categorieën verschil tussen hoogste en laagste

score. Voor 18 ziekenhuizen bestempelden we de invloed van de gebruikte correctie als

belangrijk. We deden dit wanneer er een verschil van drie categorieën werd vastgesteld

maar er consistent boven of onder categorie 4 gescoord werd. We besloten tot een

uitzonderlijke invloed voor de andere 4 ziekenhuizen (Tabel 3).


Tabel 3: Invloed van het al dan niet uitsluiten van binnenkomende transfers en van de gebruikte correcties op de afwijking van een ziekenhuis tov het nationale gemiddelde of de nationale trend.

Cardiaal zorgprogramma Invloed Totaal

geen gering belangrijk uitzonderlijk

A 17 (27,87) 40 (65,57) 2 ( 3,28) 2 (3,28) 61 B1 4 (21,05) 12 (63,16) 3 (15,79) 0 (0,00) 19 B2-B3 5 (17,24) 9 (31,03) 13 (44,83) 2 (6,90) 29 Totaal 26 61 18 4 109

( ): rij percentage

In de MKG 2002-5 stelden we bij vier ziekenhuizen, 2 A ziekenhuizen en 2 B2-B3

ziekenhuizen, een uitzonderlijke invloed van de gebruikte correctie vast. Op 29 B2-B3

ziekenhuizen bleken er 15 een belangrijke of uitzonderlijke invloed te ondergaan t.g.v. de

modellering. Het ging daarbij vaak om een verslechtering van de AMI-LC categorie

wanneer aan een model met een basiscorrectie (leeftijd, geslacht, Charlson score en trend)

en een correctie voor shock, nadien een model gefit werd waarbij ook gecorrigeerd werd

voor angioplastie en dit zowel wanneer de inkomende transfers in de analyse werden

opgenomen (IQI15) als wanneer dit niet gebeurde (IQI32).

We illustreren de invloed van de verschillende modellen op de categorisatie van de B2-B3

ziekenhuizen aan de hand van tabel 4.


281

Tabel 4: Voorbeeld van de invloed van het gebruikte statistisch model op de categorisatie van drie B2-B3 ziekenhuizen.

ID Model Periode

(%) Trend (%) Categorie Invloed 21 B 17 7 3 3

BS 30 4 4 BSA 52 4 1 BST 20 9 3 BSTA 34 10 3

56 B -34 -3 7 3 BS -31 -4 7 BSA 5 -1 4 BST -29 -4 7 BSTA -5 -2 4

65 B 5 -8 5 4 BS 3 -12 5 BSA 49 -11 2 BST 3 -8 5 BSTA 35 -8 5

ID: Anoniem ziekenhuisnummer; B: basiscorrectie (leeftijd, geslacht, Charlson score en trend) BS: basiscorrectie + correctie voor shock BSA: basiscorrectie + correctie voor shock + correctie voor angioplastie BST: basiscorrectie + correctie voor STEMI BSTA: basiscorrectie + correctie voor STEMI + correctie voor angioplastie

Periode (%): afwijking van het ziekenhuis bij de periodeanalyse Trend (%):afwijking van het ziekenhuis bij de trendeanalyse Een verdere analyse volgens het model “basiscorrectie + correctie voor shock + correctie

voor angioplastie” uitgevoerd op de groep van B2-B3 ziekenhuizen toonde aan dat het

AMI-LC een zeer belangrijke invloed onderging zowel van shock (OR: 28,8; 95% BI

[25,2; 32,8]) als van het uitvoeren van een angioplastie (OR: 0,24; 95% BI [0,20;0,29]).

Verder stelden we vast dat de B2-B3 ziekenhuizen met een “belangrijke” of

“uitzonderlijke” invloed significant meer angioplasties uitvoerden (OR: 1,26; 95% BI

[1,19;1,33]) dan de andere B2-B3 ziekenhuizen. Verder bleken ze daarenboven significant

meer angioplasties uit te voeren in geval van STEMI zoals de interactie term tussen

“belangrijke” of “uitzonderlijke” invloed versus “geen” of “matige” invloed en het al dan

niet corrigeren voor STEMI (OR: 1,11; 95% BI [1,02;1,21]) aantoonde.


282

5.3.3.4 Interziekenhuis verschillen in AMI-LC, MKG 2002-5 We stelden belangrijke en significante (Bonferroni-gecorrigeerd) interziekenhuis

verschillen vast (Figuren 2a, 2b, 3a en 3b). Voor de periodeanalyse (bovenste deel van de

figuren) varieerden de afwijkingen tussen de – 63 % en de + 182 %, indien alleen de

uitgaande transfers werden uitgesloten. Ze varieerden tussen de – 65 % en de + 196 %,

wanneer alle transfers werden uitgesloten. Voor de trend analyse bedroegen deze cijfers

respectievelijk –41% en + 30%, en – 47% en + 39%.

Een overzicht van de invloed van de verschillende modellen op de afwijking presenteren

we in volgende tabel.

Tabel 5: Sensitiviteitsanalyse van intramurale letaliteit na een opname voor AMI. Bereik van de puntschatters van de “afwijkingen” per model. MKG 2002-5.

B B+ Sh B + Sh + A B + St B + St +A

Max Min Max Min Max Min Max Min Max Min

Periode 140 -64 182 -63 152 -70 97 -59 91 -64 Geen

uitgaande

transfer

Trend 25 -38 30 -41 29 -42 27 -54 26 -31

Periode 153 -62 196 -65 163 -71 104 -64 84 -63 Geen transfer

Trend 29 -42 39 -47 42 -48 30 -32 31 -33

B: basismodel (leeftijd, geslacht en Charlson); B+Sh: basismodel + shock; B+ Sh +A: basismodel +shock + angioplastie; B + St: basismodel + STEMI; B + St +A: basismodel + STEMI + angioplastie; Max en Min: respectievelijk maximum en minimumwaarde van het bereik. Het al dan niet uitsluiten van de inkomende transfers bleek voor sommige ziekenhuizen

een belangrijke invloed te hebben op hun afwijking t.o.v. het nationale gemiddelde/trend.

Een voorbeeld van deze feedback voor de eerste tien ziekenhuizen vindt u in tabel 6.

Binnen de groep B2-B3 ziekenhuizen bleken er eveneens belangrijke verschillen in AMI-

LC te bestaan (Figuren 4 en 5).

Hoofdstuk 5: Kwaliteit van zorgen 283 Tabel 6: Afwijking van het AMI-LC van een ziekenhuis (uitgedrukt in percent) t.o.v. het nationale AMI-LC of trend, België, 2001-4.

ID1 Periode Trend IP10

OG_B2OG_953A(%)4BG_955 BG_B6 BI_957 BI_B8 P9 OG_B2 OG_953 A(%)4 BG_955 BG_B6 BI_957 BI_B8 P9

1 -52 -42 -25 -5 15 - NS 0.00000 -15 -8 2 12 21 NS NS 0.61403 AMG 2 -14 2 26 53 78 + NS 0.03696 -15 -9 0 9 16 NS NS 0.88558 AMG

3 -45 -33 -13 10 33 NS NS 0.03606 -29 -23 -15 -5 3 - NS 0.00000 iai A<0

4 26 56 101 152 195 + + 0.00013 -7 3 17 32 45 + NS 0.02095 EAE A>0

5 -63 -43 -1 62 127 NS NS 0.94745 -14 2 26 54 79 + NS 0.03412 iai A>0

6 -47 -20 29 98 165 NS NS 0.23656 -36 -23 -3 21 43 NS NS 0.73364 AMG

7 102 136 182 230 268 + + 0.00000 -18 -11 -1 10 19 NS NS 0.81802 EAE A>0

8 -60 -46 -21 13 48 NS NS 0.01782 -18 -8 6 22 35 NS NS 0.35683 AMG 9 -42 -17 28 88 146 NS NS 0.20483 -34 -22 -4 16 35 NS NS 0.50037 AMG

10 -51 -36 -12 20 51 NS NS 0.20888 -16 -6 7 23 36 NS NS 0.23705 AMG

1 ID: Anoniem ziekenhuisnummer; 2 OG_B: Ondergrens van het Bonferroni betrouwbaarheidsinterval; 3 OG_95: Ondergrens van het 95% betrouwbaarheidsinterval; 4 A: afwijking van het ziekenhuis AMI-LC vergeleken met het nationale AMI-LC cijfer/trend; 5 BG_95: Bovengrens of the 95% betrouwbaarheidsinterval; 6 BG_B: Bovengrens van het Bonferroni betrouwbaarheidsinterval; 7 BI_95:+: a 95% CI suggereert een significant hoger ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend,

-: a 95% CI suggereert een significant lager ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend, NS: a 95% CI suggereert geen significante afwijking van het ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend.

8BI_B: +: het Bonferroni−gecorrigeerd CI suggereert sterk een significant hoger ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend, -: het Bonferroni−gecorrigeerd CI suggereert sterk een significant lager ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend, NS: het Bonferroni−gecorrigeerd CI suggereert geen significante afwijking van het ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend.

9 P: Probabiliteit dat een ziekenhuisafwijking t.o.v. het nationale cijfer/trend = 0. 10IP: Interpretatie: EA: External audit en algemene maatregelen aanbevolen; AGM: algemene maatregelen aanbevolen.


Figuur 2a: Periode-analyse van interziekenhuis verschillen in AMI-LC met alleen inkomende transfers. MKG 2002-5.

Figuur 2b: Periode-analyse van interziekenhuis verschillen in AMI-LC, geen transfers. MKG 2002-5.


285

Figuur 3a: Trend-analyse van interziekenhuis verschillen in AMI-LC met alleen inkomende transfers. MKG 2002-5

Figuur 3b: Trend-analyse van interziekenhuis verschillen in AMI-LC, geen transfers. MKG 2002-5


Figuur 4: Periodeanalyse van verschillen tussen B2-B3 ziekenhuizen in AMI-LC. Geen transfers. MKG 2002- 5.

Figuur 5: Trendanalyse van verschillen tussen B2-B3 ziekenhuizen in AMI-LC. Geen transfers. MKG 2002- 5.


287

5.3.3.5 Het nationale AMI-LC, trend en determinanten Voor de periode 2002-2005 noteerden we in België 7.099 fatale gevallen voor

46.287opnamen of een bruto AMI-LC van 15,34% (95% BI:15,01%; 15,67%).

Van de modellen die gefit werden in de sensitiviteitsanalyse weerhielden we de modellen

met als verklarende variabelen leeftijd, geslacht, Charlson, trend, en shock. We deden dit

om de invloed van het type ziekenhuis niet te neutraliseren door angioplastie in het model

op te nemen. Omwille van de uitgesproken associatie tussen shock en STEMI verkozen we

shock te nemen als verklarende variabele en niet STEMI. Vooreerst is shock een betere

predictor van letaliteit, verder is er minder eenduidigheid rond STEMI - de verschillen in

EKG diagnose bij opname en ontslag zijn belangrijk712 - en tenslotte omdat de groep AMI

NOS een supplementaire categorie opleverde, die eigenlijk als missing te beschouwen valt

in termen van STEMI, en moeilijk te interpreteren valt. De AMI NOS als een derde

categorie behandelen is overigens niet correct.121

Wanneer we de basis modellen en de modellen met shock fitten stellen we vast dat het

sterfterisico (1) bij elke bijkomende leeftijdsgroep van 5 jaar met ongeveer 40% toeneemt;

(2) bij mannen ongeveer 10% lager is; (3) bij elke toename van Charlson’s comorbidity

index met één eenheid stijgt met 5 à 10 %; en, (4) bij shock in uiterst belangrijke mate

toeneemt. Verder noteerden we een licht dalende AMI-LC trend van ongeveer 1% per

semester. Verder vonden we een lager AMI-LC in de B2-B3 ziekenhuizen en dit zowel

t.o.v. de A als B1 ziekenhuizen (Tabel 7). Noteren we dat er tussen de ziekenhuizen B2-B3

grote verschillen bestaan (Figuren 4 en 5)..


Tabel 7: Odds ratio’s en 95% betrouwbaarheidsinterval ( ) van AMI-letaliteit in functie van leeftijd (toename per 5 jaar), geslacht, co-morbiditeit, per semester trend, met al dan niet cardiogene shock, cardiaal zorgprogramma en met uitsluiting of niet van binnenkomende transfers.

Basis 1 Basis 2 Shock 1 Shock 2

Leeftijd 1,37(1,35;1,40) 1,36(1,34;1,39) 1,36 (1,34;1,39) 1,35(1,32; 1,38)

Mannen 0,90(0,84;0,96) 0,92(0,86;0,99) 0,91 (0,84;0,98) 0,93(0,86; 1,01)

Charlson 1,09(1,08;1,10) 1,07(1,06;1,09) 1,06 (1,05;1,08) 1,05(1,04; 1,06)

Trend (semester)0,98(0,96;0,99) 0,98(0,97;1,00) 0,98 (0,96;0,99) 0,99(0,97; 1,00)

Shock . . . . . . 23,0 (20,9;25,2) 21,0(19,0; 23,2)

A vs B2-B3 1,21(1,12;1,30) 1.47(1,37;1,59) 1,39 (1,28;1,50) 1,61(1,48; 1,75)

B1 vs B2-B3 1,08(0,99;1,19) 1,38(1,25;1,52) 1,23 (1,11;1,36) 1,48(1,33; 1,65)

Basis 1: uitgaande transfers uitgesloten; Basis 2: alle transfers uitgesloten; Shock 1: uitgaande transfers uitgesloten; Shock 2: alle transfers uitgesloten In termen van de c-statistiek zijn de modellen met shock duidelijk beter dan de

basismodellen: 0.84 versus 0.74. Een overzicht van de waarden van de c-statistiek van alle

gefitte modellen vindt u in tabel 8.

Tabel 8: Waarden van de c-statistiek, bereikt bij de verschillende gefitte modellen en dit zowel voor de periode als de trend analyse.

Model Binnenkomende transfers Geen transfers Periode Trend Periode Trend Basis 0,736 0,741 0,733 0,739 Shock 0,840 0,844 0,832 0,837 Shock en angioplastie 0,853 0,856 0,848 0,852 Stemi 0,782 0,785 0,781 0,785 Stemi en angioplastie 0,791 0,794 0,793 0,797


289

5.3.4 Discussie

5.3.4.1 AMI een diagnostisch probleem In het kader van kwaliteitsverbetering, die vertrekt van een interziekenhuis vergelijking,

dient men over één enkele definitie te beschikken, die overal kan toegepast worden.559

Het in gebruik nemen van troponinen, beschouwd als de “definitive marker”747, en de

verschillende assays voor hun bepaling hebben echter voor een substantiële verwarring

gezorgd bij clinici en klinische biologen747. Deze troponinen waren gevoeliger en

specifieker dan de oudere en detecteren ook minimale hartletsels.747;755 Verder konden in

functie van de gebruikte definitie patiënten met één van de acute coronaire syndromen met

elk zijn eigen mortaliteitsrisico al dan niet als AMI beschouwd worden.745;748Op het

ogenblik van de registratie van onze gegevens (2001-5) diende het gebruik van de assays

nog gestandaardiseerd te worden. Onder meer diende informatie over de graad van precisie

van de assays, referentie intervallen en andere voor het laboratorium belangrijke

gebruiksvoorwaarden nog geleverd te worden.747

Deze onduidelijkheden en verschillen zijn niet zonder invloed op de risicocorrectie bij het

berekenen en het vergelijken van AMI-LCs, en zijn een hinderpaal voor het beoordelen

van lange termijn trends in myocardinfarct voorvallen.746;747;755

5.3.4.2 Accuratesse en volledigheid van de gegevens De volledigheid en accuratesse van de gegevens is een belangrijke beperking in onze

studie. De vergelijking met de MONICA gegevens toont immers duidelijk een

onderschatting aan van het letaliteitcijfer, een in epidemiologisch opzicht belangrijke

tekortkoming van de MKG. Het lager dodenaantal in de MKG kan wellicht voor een deel

verklaard worden door het overlijden van een belangrijk deel van de patiënten vóór er een

vaste klinische diagnose gesteld werd.721 De betere registratie van het aantal gevallen kan

wellicht toe te schrijven zijn aan verschillen in voormelde diagnostische criteria en meer

bepaald in het type en de interpretatie van het cardiale enzym.746;747

Kuch et al.721 vergeleken het AMI-LC zoals het bekomen werd wanneer AMI volgens

epidemiologische criteria (MONICA criteria) gedefinieerd werd en wanneer het via

een klinische diagnose gedefinieerd werd. In hun studie bedragen de cijfers

respectievelijk 28% en 13,5 %, wat duidelijk verschilt van de analoge cijfers voor het

MONICA-registratie gebied van Gent en Brugge waar ze respectievelijk 25,7% en


7,7% bedragen voor Gent en 15,7% en 4,7% voor Brugge. Merken we op dat AMI-

LC voor gans België (klinische definitie) 15,5% bedraagt, duidelijk beter

vergelijkbaar met de Duitse cijfers en met de Europese intramurale AMI

letaliteitcijfers van de 80ger jaren697. Dit schijnt te wijzen op een onderregistratie van

letale gevallen door de MKG in de arrondissementen Gent en Brugge. Een

gelijkaardige vergelijking uitgevoerd in samenwerking met MONICA-Luxemburg

kwam tot de bevinding dat de MKG een sensitiviteit van 87% en een specificiteit van

55% hadden.756

Bevolkingsstudies toonden overigens aan dat de 30-dagen STEMI mortaliteit tussen

de 30 en 50% ligt waarvan ongeveer de helft in de eerste twee uur.757 Het adagium

“Time is myocardium and time is outcomes” is hier de weerspiegeling van.

De MKG biedt vooralsnog – in afwachting van de nieuwe spoedregistratie - geen

enkele informatie over (1) de tijd die verloopt tussen het ontstaan van de symptomen

en het inroepen van hulp, (2) de tijd die verloopt tussen inroepen van hulp en de

aankomst met de ziekenwagen in het ziekenhuis, en (3) de tijd die verloopt tussen de

aankomst in het ziekenhuis en het instellen van de thrombolyse of de angioplastie. De

eerste is mogelijkerwijs beïnvloedbaar door gezondheidsopvoeding en voorlichting.

De tweede is organisatorisch beïnvloedbaar door de spoeddiensten, maar wordt verder

bepaald door de afstand en eventuele verkeersopstoppingen. De derde kan

organisatorisch verbeterd worden. Alle aspecten zijn in mindere of meerdere mate

kwaliteitsgebonden en alle verdienen aandacht.747

De onderregistratie van fatale gevallen was waarschijnlijk niet uniform over de

ziekenhuizen zoals de vergelijking met MONICA aantoonde. Verder weten we niet

welke criteria in de Belgische ziekenhuizen gehanteerd werden voor het stellen van

een diagnose van AMI. Het is niet onwaarschijnlijk dat die zoals elders niet uniform

waren, zeker als het over de keuze van het type, het uitvoeren en interpreteren van de

cardiale enzymen gaat. Ook shock als verklarende variabele stelde een interpretatie

probleem: was hij aanwezig bij opname, vóór het instellen van de behandeling of was

hij het gevolg van de behandeling?


291

Verder stelt de AHRQ: “Er bestaat een spanningsveld wanneer gegevens gebruikt worden

zowel voor terugbetaling als voor het meten van kwaliteit. Wanneer het over terugbetaling

gaat is men geneigd om snel te coderen en om het coderen van verwikkelingen en co-

morbiditeit te maximaliseren. Daarentegen wanneer het over kwaliteitsbeoordeling gaat is

het belangrijk voor de codeurs over het gehele medisch dossier te beschikken en het

coderen van diagnoses te beperken tot aandoeningen die de zorg voor de patiënt

beïnvloeden”.637

Toch bleek in een recente studie dat administratieve gegevens een redelijk surrogaat

zijn voor klinische gegevens uit het medisch dossier.758Het dient wel opgemerkt dat in

die studie belangrijke gegevens uit vorige opnamen en transfers van patiënten

routinematig konden gebruikt of opgevolgd worden. In de MKG was dat ten tijde van

de studie beperkt tot verblijven in hetzelfde ziekenhuis en hetzelfde kalenderjaar.

5.3.4.3 Nationale trend van het AMI-LC en interziekenhuis verschillen. Onze studie suggereerde dat het AMI-LC functie was van leeftijd, co-morbiditeit en vooral

shock. De evidentie van een betere uitkomst voor mannen was zwak: ze bevond zich in de

zone van niet interpretatie. Er was verder slechts een indicatie van een kleine verbetering

van de uitkomsten over de tijd. Wel stelden we betere uitkomsten vast in B2-B3

ziekenhuizen. Toch vonden we geen aanwijzing – geen significante interactie tussen

cardiaal zorgprogramma en trend - voor een verbetering van evolutie van de letaliteit in

functie van het zorgprogramma, waar dit elders wél werd vastgesteld.759

Deze studie kan niet zomaar met die van Van Brabandt et al720 vergeleken worden. Hun

studie gaat over de periode van 1999 tot 2001, de onze echter over de periode 2002 tot

2005 en er bestaat evidentie dat de behandeling van AMI over de jaren

verbetert.759;760Verder beschikten zij over de gekoppelde gegevens, die hun toegang gaf tot

alle therapeutische gegevens, en beschikten zij over een uniek identificatienummer dat hen

toeliet nauwkeurig de eventuele transfers van patiënten op te volgen. Het is nochtans zo

dat hun vaststellingen i.v.m. B2-B3 ziekenhuizen niet in tegenspraak zijn met de onze.


De nochtans vermoedelijk belangrijke interziekenhuizen verschillen, die we

vaststelden, zijn moeilijk interpreteerbaar en, wegens de klaarblijkelijke, onvoldoende

accuratesse en volledigheid van de gegevens, moeilijk becijferbaar.

Dit leidt onvermijdelijk tot de vraag of dit “good enough, easy to get data?”554 zijn om in

een context van kwaliteitsverbetering gebruikt te worden. Inderdaad, de volledigheid en

accuratesse van de ziekenhuisontslaggegevens zijn in de arrondissementen van Brugge en

Gent problematisch. Maar dit geldt misschien niet voor België in zijn geheel, zoals

gesuggereerd wordt door het voormelde nationale letaliteitcijfer.

Onze bevindingen gebaseerd op de MKG worden wellicht, ondanks onze inspanningen om

de typische beperkingen van administratieve gegevens zoveel mogelijk te omzeilen, best

omschreven als een “bruikbare screening”, die kan aanzetten tot het nemen van

kwaliteitsbevorderende initiatieven in de ziekenhuizen, veeleer dan als uitspraken over

kwaliteit van de zorgen.180;659

Vanuit een kwaliteitsstandpunt kon het nuttig zijn bijkomende informatie in te winnen

over de ziekenhuizen die op constante manier een bovenmaatse of ondermaatse outliers

schijnen te zijn.

Verder menen we aanwijzingen gevonden te hebben dat B2-B3 centra electieve PTCAs

uitvoerden bij laattijdig getransfereerde patiënten, waarvan de Europese richtlijnen stellen

dat ze geen enkel functioneel of overlevingsvoordeel opleveren.697Wij baseerden ons

hiervoor op de gegevens in verband met het ogenblik van de transfer waaruit bleek dat de

mediaan van de verblijfsduur voor transfer 2 “dagen” bedroeg.

De wisselende afwijking ten opzichte van het nationale cijfer en trend wanneer het

uitvoeren van een angioplastie in de modellering wordt opgenomen dient verder

bestudeerd te worden. Het schijnt hier meestal te gaan over B2-B3 ziekenhuizen, die meer

angioplasties uitvoeren op een meer oordeelkundige manier dan de andere B2-B3s. Daar

deze bevinding zichtbaar werd bij een verschillende modellering van dezelfde data kan

men geredelijk aannemen dat ze geen artefact is. Tenslotte vraagt de schijnbare

heterogeniteit van de B2-B3 ziekenhuizen op gebied van AMI-LC een verklaring.

5.3.4.4 Transfer Bij een vergelijking van AMI-LC was het belangrijk rekening te houden met transfer van

zieken. Soms gaat men ervan uit - een beetje zoals het “intention to treat” principe bij


293

klinische studies - dat de uitkomst van de AMI episode toegeschreven wordt aan het

ziekenhuis waar de patiënt opgenomen wordt.720;751;752;758In navolging van het AHRQ

model753 werden bij een eerste reeks analyses, waarbij de uitgaande transfers werden

uitgesloten, de uitkomsten toegeschreven aan het ontvangende ziekenhuis. Mochten de

transfers op systematische manier met inachtneming van de heersende richtlijnen697

gebeuren viel wellicht de eerste zienswijze te verkiezen. In de toenmalige Belgische

context, waarbij een ruim deel van de transfers niet als een onmiddellijke transfer voor PCI

of een “rescue angioplasty” na een niet-geslaagde thrombolyse kon beschouwd worden,

leek dit niet de meer aangewezen manier. Het is ook zo, menen we, dat deze niet-urgente

transfers voor een electieve PTCA niet als een teken van kwaliteitsvol klinisch handelen

kunnen gezien worden.

5.3.4.5 Risicocorrectie Een ideaal model dient een goede balans te maken tussen zuinigheid van het aantal

verklarende variabelen en het gemakkelijk verzamelen van gegevens enerzijds, en zijn

predictief vermogen anderzijds.”715 Onze modellen met leeftijd, geslacht, Charlson’s

comorbidity index en shock als verklarende variabelen, en met binnenkomende transfers al

dan niet opgenomen in de studiepopulatie hadden met een c-statistiek761;762 van ongeveer

0.84, een zeer goed discriminatievermogen. Deze modellen hadden duidelijk een beter

discriminatie vermogen dan de modellen zonder shock en dan de voormelde, uitgevoerde

studies715;751;752. Een recente Amerikaanse studie gebaseerd op administratieve gegevens

had een AROC van 0,71 in een finaal model met 27 variabelen.758 Het lijkt dan

voorzichtig aan te nemen dat het discriminatievermogen van onze modellen met shock,

wegens een niet gekende proportie van in het ziekenhuis opgelopen verwikkelingen,

vertekend zijn. Hoe dan ook beide soorten modellen (basis, of basis met shock) leidden tot

dezelfde conclusies betreffende de verklarende variabelen.

Het letaliteitcijfer van AMI is gekenmerkt door een grote variabiliteit over de

ziekenhuizen, die niet noodzakelijk een weerspiegeling is van werkelijke verschillen

inzake performance. Correctie voor het risico is derhalve belangrijk en in het bijzonder

voor de uiterste waarden, zoniet zouden bepaalde verzorgingsinstellingen incorrect als

“outliers” geklasseerd kunnen worden298;753. Onze keuze van Charlson’s comorbidity index


was gebaseerd op de excellente c-statistiek (0,83) in een studie over mortaliteit door

ischemische hartaandoeningen bij ziekenhuispatiënten.325;326 In tegenstelling met Severity

of Illness and Risk of Mortality, de risicocorrectie van de All Patient Refined Diagnosis

Related Groups (APR-DRGs)195houdt deze index geen rekening met verwikkelingen die na

de opname optreden196;197;758. Wel is co-morbiditeit, zoals voormeld,

codeergevoelig.637Hierdoor vermijdt men gedeeltelijk dat een ziekenhuis ten onrechte

“beloond” wordt voor verwikkelingen, die misschien te wijten waren aan slechtere

zorg.196;301;751;758

5.3.4.6 Andere beperkingen van de studie Hoewel er meestal een goede correlatie bestaat tussen de intra-ziekenhuis mortaliteit

en de dertig dagen mortaliteit 367is het mogelijk dat verschillen in ontslagpraktijken

de cijfers beïnvloeden. In geval van AMI kan de mortaliteit op 30 dagen beduidend

van de ziekenhuissterfte verschillen753. Hoewel letaliteit vergeleken met

procesindicatoren een minder gevoelige performance/kwaliteit indicator van AMI is

blijft ze waardevol voor het beoordelen van richtlijnen en

procesindicatoren,178;706;763want: “In tegenstelling tot structuur en proces, verschaffen

uitkomsten een meer globale beoordeling van de kwaliteit van de gezondheidszorg en

vertegenwoordigen ze wat voor de patiënten het belangrijkst is”. 758

Zoals voornoemd berust de AMI behandeling op een snel hulp zoeken van de patiënt, een

snelle en adequate opvang, diagnose en behandeling in functie van de diagnose en het type

ziekenhuis. Er is daarbij een potentiële rol weggelegd voor gezondheidsvoorlichting om

patiënten sneller medische hulp te laten zoeken in geval van symptomen van een (nakend)

AMI.704 Benevens de toegediende behandeling (zelf functie van de leeftijd van de

patiënt)688 is de prognose functie van de verstopte slagader(s), het aantal getroffen

bloedvaten, variabiliteit van het hartritme, en van de leeftijd van de patiënt.

Niet alleen strikt medische factoren maar ook het sociaal-economische niveau spelen een

belangrijke rol in de AMI-epidemiologie. Zo genereerde een zwakke sociaal-economische

toestand in de jaren ’80 hoge mortaliteitscijfers voor coronaire aandoeningen met hoge

letaliteitcijfers voor een eerste hartaanval en dat zowel voor als na de


295

ziekenhuisopname764;765. De letaliteit verklaarde bij de mannen voor de helft en bij

vrouwen voor meer dan een derde het verschil inzake mortaliteit tussen de groepen met

hoge en lage inkomens8. Er moet verder op gewezen worden dat geneesmiddelen voor

secundaire preventie, een belangrijk gegeven voor de verdere prognose en derhalve een

kwaliteitsaspect559;758, minder vaak aan patiënten van de lagere sociaal-economische

klassen764 voorgeschreven werden.

Jammer genoeg beschikken we in de MKG maar fragmentarisch over al die gegevens en

lijdt onze kwaliteitsbenadering onder hetzelfde euvel. Wij konden in deze studie alleen

corrigeren voor leeftijd, geslacht, co-morbiditeit (Charlson-d’Hoore index) en

shock.325;326;493 Andere kwaliteitsaspecten dan letaliteit konden wij niet analyseren. Het is

dus niet onmogelijk dat een ziekenhuis dat een goed AMI-LC heeft niet goed is voor

andere aspecten en omgekeerd.

Een laatste beperking van onze studie is het belangrijke tijdsinterval tussen de registratie

en de rapportering. Hoewel er hier door de verdere automatisering van de

gegevensverzameling en -verwerking winst zal geboekt worden, zal er wel altijd minstens

een jaar verlopen vooraleer deze processen afgesloten zijn. Daarenboven zijn er een

minimale analyse- en rapporteringtijd nodig. Toch lijkt dit tijdsinterval minder belangrijk

voor uitkomstindicatoren, die een ruimere interpretatie vergen met terugkoppeling naar

verschillende belanghebbenden en niet noodzakelijk een onmiddellijke terugkoppeling

naar de zorgverleners vereisen, dan voor procesindicatoren, waar een onmiddellijke

terugkoppeling door de clinici als een noodzaak aangevoeld wordt.

5.3.4.7 AMI-LC en kwaliteitsinitiatieven In onze benadering werden ziekenhuizen eerder gezien als individuele structuren van het

gezondheidssysteem, met een gemeenschappelijk organisatorische cultuur en een aantal

gemeenschappelijk processen, en die verantwoording dienden af te leggen. Niet het tot

schande maken, noemen en blameren van individuen of ziekenhuizen maar het

identificeren van organisatie− en cultuurgerelateerde problemen werden beschouwd als het

aanknopingspunt voor kwaliteitsbevorderende acties.269;426;495-498;556;660 Daarom was deze


feedback anoniem en had als doel de clinici, diensten en ziekenhuizen informatie te

verschaffen, die hen toeliet zich met de anderen op een zinvolle manier te vergelijken.

Het betrokken zijn van senior managers en ziekenhuisstaf bij kwaliteitsverbetering kan

succesvol zijn547, op voorwaarde dat het over een veranderingsproces gaat met meerdere

facetten ( protocollen, richtlijnen die ook de niet-cardiologen bereiken, lokale

kwaliteitsbevorderende groepen)557;766 in samenwerking met de personen waarvan het werk

onderzocht wordt555. Formele of informele beoordeling van de zorg door peers en feedback

kunnen de beoogde veranderingen vergemakkelijken.557

Hoewel er aangetoond werd dat feedback kwaliteitsinitiatieven kan stimuleren566,

schijnt het verkieslijker dat hij zou gedragen worden door iemand, gevormd in de

interpretatie van gegevens, die geldt als een autoriteit en over de nodige middelen

beschikt.269;718 Daarom werd aan het College van geneesheren dezelfde feedback

voorgelegd als aan de ziekenhuizen. Hij zou hen kunnen helpen ziekenhuizen te

identificeren, met zowel bovenmaatse als ondermaatse kwaliteit, om een benchmark

vast te leggen en om ziekenhuizen met kwaliteitsproblemen te helpen ze op te lossen.

Ervaring uit de UK suggereert dat mensen meer geneigd zijn op een adequate manier

te werken als ze weten dat er iemand is die observeert en registreert wat zij doen.559

Daarenboven kan de feedback en het betrokken zijn in verbeteringsprocessen hen

wijzen op problemen die niet onmiddellijk door de indicator bestudeerd worden zoals

het voorschrijven van adequate medicatie na een opname voor AMI. Verder menen

we dat de Colleges en andere beroepsverenigingen kwaliteitsverbetering kunnen

stimuleren door het opstellen en verspreiden van richtlijnen, het opstellen van

doelstellingen (zoals tegen 1 januari 2008 zal 90% van de AMI patiënten bij ontslag

een voorschrift hebben van geneesmiddelen voor secundaire preventie) en de artsen

helpen bij het overstijgen van wat zij aanvoelen als een verlies van professionele

autonomie.718

Voor de overheid is een rol weggelegd die erin bestaat een operationele structuur te

creëren die ermee belast wordt de toekomstige nationale feedbacks te begeleiden, de

ontwikkeling van hierop gebaseerde kwaliteitsbevorderende acties te ondersteunen - de


297

uitbouw van de secundaire preventie is een van de belangrijke uitdagingen - en

bijkomende indicatoren te initiëren. Verder zullen lokale initiatieven, die aansluiten op de

feedback, aangemoedigd worden. Een continue investering in een infrastructuur voor

kwaliteitsbevordering en ook het voorzien in een beschermde tijd voor deze activiteiten

zijn vereist om het project te laten slagen.557 Tenslotte menen we dat de overheid zich

dient te buigen over het probleem van de koppeling van relevante gegevens over dezelfde

personen in geval van transfer versus de bescherming van de privé-sfeer. Dergelijke

koppeling is noodzakelijk voor de evaluatie van de zorg en dus ook voor de toekomstige

behandeling van de nieuwe en de niet overleden AMI patiënten.

5.3.4.8 Besluit en perspectieven Hoewel de complexiteit van de case mix niet volledig door administratieve gegevens kan

ondervangen worden716, dient men er zich rekenschap van te geven dat alleen dit soort

gegevens toelaat landelijke, interziekenhuis vergelijkingen te corrigeren voor case mix.758

Willen we de MKG in het domein van AMI gebruiken voor kwaliteitsbewaking dan is er

dringend nood aan een harmonisatie van de registratie en een betere registratie bij opname.

Ook het registreren bij de pathologieën en symptomen of ze al dan niet aanwezig waren bij

opname lijkt een belangrijk aandachtspunt. Het opzetten van de nieuwe spoedregistratie en

de nieuwe minimale ziekenhuisgegevens (MZG), waarin MKG en Minimaal

Verpleegkundige Gegevens versmolten zijn, zal hier ongetwijfeld verbetering brengen.

Het meenemen van gegevens uit vroegere opnamen en het traceren van transfers, wat in de

MZG alleen binnen hetzelfde ziekenhuis zal mogelijk zijn, zou niet alleen betere

vergelijkingen en evaluaties toelaten maar ook ten goede komen van de patiënten.

Naast deze verbeteringen aan het registratiesysteem vallen er ook een aantal

analyseaspecten bij te schaven, die tot een meer bruikbare indicator kunnen leiden. Wij

denken hier onder meer aan (1) het uitsluiten van verblijven van ≤ 1 dag758, (2) weekend

opnamen767, (3) een geografische analyse en (4) een analyse van de verblijfsduur753.

Verder kan het gebruik van propensity scores484;716 en hiërarchische regressie modellen758

de analyses verrijken.

Tenslotte vallen er een aantal structurele en operationele maatregelen te treffen in verband

met het aantal centra waar PCI kan uitgevoerd worden. Volume-uitkomst beschouwingen


rond primaire PCI dienen echter ook rekening te houden met geografische en sociaal-

economische toegankelijkheid van de zorgen.716 Tenslotte bestaat er nood aan ”low tech”

strategieën om te verzekeren dat de PPCI uitgevoerd wordt binnen de 90 minuten, een

doelstelling die zou kunnen bereikt worden via continuous quality improvement.704

5.4 KWALITEIT VAN ZORGEN: ALGEMEEN BESLUIT

Wij hebben onze benadering voor verbeteringsinitiatieven van zorgenkwaliteit door middel

van administratieve gegevens geschetst. Een goede organisatie en organisatorische cultuur

zijn hiervoor de randvoorwaarden.

Kwaliteit van zorgen is een dagdagelijkse, gedeelde verantwoordelijkheid tussen patiënt,

zorgverleners, ziekenhuisdirecties, College van geneesheren en beroepsverenigingen. De

verantwoordelijkheid van de overheid als borger van de belangen voor de gemeenschap

bestaat erin kwaliteitsinitiatieven te ondersteunen en te laten ontkiemen.

Bij de analyse van kwaliteitsindicatoren kwamen we tot het besluit dat uit de aard zelf van

onze gegevens, we alleen van een screening konden gewagen. Zij bood wel perspectieven

voor kwaliteitsinitiatieven maar vereiste verder onderzoek vooraleer uitspraken konden

gedaan worden. Verder gaf deze screening bruikbare informatie voor

verbeteringsinitiatieven op het gebied van de kwaliteit van de gegevens. Vermits het om

een screening gaat wordt de feedback gericht tot clinici, ziekenhuisdirecties, College van

geneesheren, beroepsverenigingen en overheid. Om dezelfde reden is hij ook anoniem.

De voornaamste resultaten van de analyse van het keizersnedencijfer bij laagrisico

verlossingen kunnen als volgt samengevat worden. Er bestaan in België belangrijke

interziekenhuis verschillen in keizersnedencijfer, een nationale opwaartse trend van 2%

per semester, en een intens medisch ingrijpen rond het geboortegebeuren. Als men

verlangt het keizersnedencijfer om te buigen zal dit een georganiseerde aanpak vereisen en

dit zowel op het centraal als intermediair en lokaal niveau.


299

Voor de analyse van het letaliteitcijfer bij AMI wijzen de voornaamste resultaten eerder

naar de beperkingen van de gegevens. De nood aan een eenvormige definitie, de

volledigheid van de gegevens, de traceerbaarheid van patiënten en een goede

risicocorrectie zijn daarbij de voornaamste aandachtspunten. Het is daarbij belangrijk dat

men zich, vanuit het standpunt van de bescherming van de privé-sfeer, realiseert dat

traceerbaarheid noodzakelijk is voor de evaluatie van de behandeling en bijgevolg voor het

welzijn van de patiënten in de toekomst.

Op gebied van kwaliteit van de zorgen kunnen reeds een aantal behartigenswaardige

bevindingen verder uitgediept worden. De belangrijke interziekenhuis verschillen zijn

wellicht moeilijk interpreteerbaar maar lijken toch belangrijk genoeg om verder

onderzocht te worden. Ook de transfer van AMI-patiënten voor een electieve PCI verdient

de aandacht.

301

Hoofdstuk 6: Complementariteit van gegevensbanken. Gebruik van routinematig verzamelde gegevens om de reproductieve gezondheid te beoordelen in een gemeenschap gevestigd rond twee verbrandingsovens

Deze casus geeft weer hoe door het samenbrengen van gegevens uit verscheidene

bestaande administratieve en klinische gegevensbanken in een beperkte tijdsspanne de

beleidsvoering in verband met een dringend milieuprobleem in niet onbelangrijke mate

kan onderbouwd worden.

Het veldonderzoek waarop hij gebaseerd is werd uitgevoerd in 1997. De voorliggende

tekst is een vertaling van het hierover gepubliceerde manuscript: “Aelvoet W,

Vanoverloop J, Molenberghs G, Schoeters G, van Sprundel M. Adequacy of Routinely

Collected Data for the Assessment of the Reproductive Health of a Community Living in

the Neighbourhood of Two Household Refuse Incinerators: a Critical Case Study. Arch

Public Health 2005; 63:259-278.” 768

Abstract Background. Na herhaalde klachten over congenitale afwijkingen in de buurt van twee

verbrandingsovens, gesloten wegens het overschrijden van de emissienormen, besloot de

overheid de herneming van de activiteiten slechts toe te laten indien aan die normen

voldaan werd en indien de resultaten van een uit te voeren studie over de mogelijke

schadelijke gevolgen op de perinatale gezondheid van de buurt dit toelieten. Aangezien de

lokale bevolking weigerachtig stond t.a.v. een deelname aan dergelijke studie, konden we

alleen op routinegegevens beroep doen.

Methoden. Het betrof een observationele studie over de Neerland wijk in de Antwerpse

agglomeratie, met een ecologische en een retrospectieve cohort component, waarbij

gegevens uit verschillende medische en administratieve gegevensbanken gekoppeld

werden. In een gegevensbank van alle kinderen (N= 506.632), die in Vlaanderen geboren

waren tijdens de periode 1989-1996, werd een groep van 636 kinderen, waarvan de

moeder ooit in Neerland woonachtig was, geïdentificeerd en vergeleken met de doorsnee

Vlaamse bevolking.

Resultaten. De vergelijking met de doorsnee bevolking, afgezien van een meerlingenexces,

toonde geen significant teveel aan van congenitale afwijkingen (gecorrigeerde odds ratio

(OR) 1,20; 95% Betrouwbaarheidsinterval (BI) 0,69-2,08),

Hoofdstuk 6: Complementariteit van gegevensbanken 302

perinatale mortaliteit, laag geboortegewicht, korte zwangerschapsduur, verminderde

pariteit of omkering van de geslachtsratio. Binnen de groep van Neerland kinderen werd

wel een significant en negatief verband vastgesteld tussen blootstellingduur van de moeder

en het voorkomen van congenitale afwijkingen (OR 0,78; 95% BI 0,60-0,95).

Conclusies. Hoewel de studie duidelijk een aantal beperkingen vertoonde en hoewel een

overmaat van congenitale afwijkingen noch bevestigd noch uitgesloten kon worden, leken

de vaststellingen geen ernstige gezondheidsbedreigingen te suggereren.

6.1. INLEIDING

De publieke bezorgdheid over de gezondheidsrisico’s die verband houden met

milieuverontreiniging is groot, zeker als de bron van de verontreiniging zich in de

onmiddellijke buurt bevindt.769-776

In de jaren die aan deze studie voorafgingen, hebben de inwoners van Neerland, een wijk

van Wilrijk in de agglomeratie van Antwerpen, herhaaldelijk het voorkomen van gevallen

van congenitale afwijkingen zonder gevolg aan de overheid gemeld. Ze schreven deze

afwijkingen toe aan de dioxine uitwasemingen van twee huisvuilverbrandingsovens in de

buurt, die op minder dan twee kilometer van elkaar stonden.

Wegens het niet naleven van de geldende dioxine-uitstootnormen was op het ogenblik van

de studie de eerste van de verbrandingsovens (gelegen in het zuidoosten van Neerland)

definitief en de tweede voorlopig gesloten777.

Gebaseerd op de hoeveelheden verbrand afval en het filtratietype van de uitstootgassen,

werd de mass-flow van beide verbrandingsovens berekend vanaf hun opstarting. Hierop

gebaseerd werd de neerslag (depositie) van de dioxines in de omgeving berekend en

vergeleken met de dioxineconcentraties in bodemstalen, genomen in de buurt van de

ovens. Hieruit bleek niet alleen dat de berekende bodemvervuiling kleiner was dan de

gemeten, maar ook dat het depositiepatroon in functie van de twee methodes tamelijk

verschillend was, wat op de aanwezigheid van andere belangrijke bronnen van

dioxineblootstelling wees. Het gebied van maximale blootstelling aan de uitstoot van de

tijdelijk gesloten oven stemt overeen met de Neerlandwijk, die zich tussen 1 en 2 kilometer

ten noordoosten van de oven bevindt, de richting van de overheersende winden.

Hoofdstuk 6: Complementariteit van gegevensbanken.

303

Alarmerende rapporten over aangeboren afwijkingen, toenemende druk van de plaatselijke

bevolking en de media lokten bij de politieke overheden de beslissing uit om de herneming

van de activiteiten afhankelijk te maken van het naleven van de normen èn van een

onderzoek betreffende de reproductieve gezondheid van de buurtbewoners.

De studie diende rekening te houden met een hele waaier van mogelijke, voor de

gezondheid schadelijke effecten, die in verband stonden met de verontreinigende stoffen,

en hun vermoedelijke bron.

Dioxines en aanverwante stoffen werden in verband gebracht met congenitale afwijkingen,

immunologische stoornissen, omgekeerde geslachtsratio, kanker, vertraagde groei,

endocriene en neurale gedragstoornissen.778-794

Vroegere studies wezen uit dat gezondheidsrisico’s te wijten aan de uitstoot van

verbrandingsovens èn zeer klein èn onbetekenend waren t.o.v. ander achtergrondbronnen,

op voorwaarde dat de ovens volgens de regels van de kunst gebouwd en uitgebaat

werden.779;795;796 Eventuele gezondheidseffecten kunnen de vorm aannemen van

meerlingzwangerschap797;798, fertiliteitsstoornissen799 en misschien kanker tijdens de

kinderjaren800;801.

Ten gevolge van een politieke beslissing diende de studie uitgevoerd te worden in een

tijdsspanne van slechts drie maand. Omdat de plaatselijke bevolking weigerachtig stond

tegenover een deelname aan dergelijke studie, was het onmogelijk een klassieke

epidemiologische studie uit te voeren zoals een patiënt-controle onderzoek. 802;803 Daar we

ons uitsluitend dienden te verlaten op routinematig verzamelde gegevens uit verscheidene

medische en administratieve gegevensbanken met een wisselende graad van bruikbaarheid 202;631;804;805, dienden we relevante stukken informatie te identificeren en tot voldoend

overtuigende evidentie samen te bundelen om een onderbouwd antwoord op de gestelde

vraag te kunnen geven.

De voornaamste onderzoeksvraag bestond erin of er voldoende volksgezondheidskundige

redenen waren om de activiteiten van de tijdelijk gesloten verbrandingsoven te hernemen.

Wetenschappelijke argumenten kunnen afgeleid worden (1) uit de wetenschappelijke

literatuur, (2) een studie gebaseerd op bestaande informatiebronnen, en (3) een helemaal


opnieuw uitgetekende studie. Wij verkozen een combinatie van (1) en (2), omdat (3) een,

in deze omstandigheden, onaanvaardbaar lange tijdsduur voor de studie zou vergen. De

juiste definitie van de onderzoeksvragen en van de studieopzet worden in de volgende

sectie beschreven.

6.2 METHODEN

6.2.1 Eindpunten van de studie Omdat voor de gezondheid schadelijke effecten van verbrandingsovens het probleem van

congenitale afwijkingen overstijgen, hebben we ook meerdere andere eindpunten van

reproductieve gezondheid in de studie opgenomen: spontane en medisch geïnduceerde

abortussen, perinatale mortaliteit, laag geboortegewicht, korte zwangerschapsduur, minder

gunstige leeftijd van de moeder, verminderde pariteit, omgekeerde geslachtsratio, een

overmaat van meerlingzwangerschappen of van medisch begeleide totstandkomingen van

de zwangerschap.

6.2.2 Gegevensverzameling Wij maakten gebruik van medische en openbare gegevensbanken, ons ter beschikking

gesteld door officiële en private instanties.

Van het gemeentelijk register van Antwerpen ontvingen we twee bestanden met gegevens

van de periode van 1989 tot 1997. (1) Een bestand van alle kinderen geboren in de

Antwerpse agglomeratie en waarvan de moeder op enig ogenblik in Neerland verbleven

had. Deze gegevens bestonden uit volgende variabelen: geslacht, geboortedatum, de

geboortedatum van de moeder en haar nummer van het rijksregister. (2) Een bestand met

alle vrouwen die op enig ogenblik in Neerland verbleven met hun geboortedatum, nummer

van het Rijksregister, de datum waarop ze in een bepaalde woning gingen wonen met het

precies adres, en de datum van vertrek, wanneer dit van toepassing was.

Het Rijksregister verstrekte de lijst van hun nakomelingen, wat de identificatie mogelijk

maakte van kinderen geboren buiten Antwerpen.

Het Studiecentrum voor Perinatale epidemiologie (SPE) stelde een bestand ter beschikking

van 506.632 geboorten voor de periode van 1989 tot 1996. Sinds 1989 registreerde dit

centrum meer dan 90% van alle levend geborenen in Vlaanderen, en daarnaast, de


305

doodgeboren kinderen (van minstens 500g) en de gevallen van neonatale sterfte. De

gegevens bevatten onder meer de geboortedatum van moeder en kind, de

zwangerschapsduur, geboortegewicht, geslacht anoniem ziekenhuisnummer, verblijfplaats

van de moeder, en voorkomen en type van congenitale afwijking. Vanaf 1991 werden ook

de pariteit en de manier van de totstandkoming van de zwangerschap geregistreerd.

Geboortedatum van moeder en kind, verblijfplaats van de moeder en volgorde bij de

geboorte in geval van meerlingzwangerschap werden gebruikt als uniek

“identificatienummer” om de SPE gegevens te koppelen met de Neerlandbestanden.

Het gekoppelde gegevensbestand maakte het mogelijk een groep van 636 kinderen te

identificeren waarvan de moeder ooit in Neerland woonachtig was.

De volkstelling van 1991 en de statistieken van het fiscaal inkomen verschaften een ruwe

schatting van de sociaal-economische status (SES) van de wijk, die hoger was dan die van

Vlaanderen in zijn geheel. Tenslotte, om in onze analyse rekening te kunnen houden met

de SES van de individuele moeders van de wijk, koppelden we de subset van 636 kinderen

met de officiële geboortebestanden van 1989 tot 1996, wat toeliet hun gegevens aan te

vullen met de beroepsgroep van beide ouders, die we gebruikten als een proxy voor SES.

6.2.3 Opzet Daar we ons moesten verlaten op geregistreerde gegevens, zonder details over individuele

blootstelling, dienden we een “post-hoc small-area” studie op te zetten.

Verder waren we verplicht ons, uit de aard van de beschikbare gegevens, te beperken tot

de periode van 1 januari 1989 tot 31 december 1996.

Vermits we over het volledige adres en de juiste duur van iedere verblijfsperiode

beschikten, was het nochtans mogelijk een retrospectieve cohort studie uit te voeren over

de reproductieve gezondheid, door de verblijfsduur te nemen als een proxy voor

blootstelling.

Wij gebruikten hiervoor drie niveaus van vergelijkingen.

Op een eerste niveau werd de relatieve frequentie van zwangerschapsgerelateerde

problemen in Neerland vergeleken met Vlaanderen min Neerland, dat we verder in tekst en

tabellen als Vlaanderen zullen benoemen. In deze vergelijking waren de eindpunten


meestal eenduidig. Congenitale afwijkingen echter worden noch op uniforme manier

vastgesteld, noch geregistreerd, wat de vergelijkingsmogelijkheden beperkte tot de

frequentie van het voorkomen van congenitale afwijkingen in beide groepen, zonder

verdere specificatie.

Omdat er bij de vergelijking met Vlaanderen een behoorlijk aantal obstetrici betrokken

waren, wat tot een wisselende graad van overeenstemming tussen de verschillende

beoordelaars kon leiden, vergeleken we op een tweede niveau het voorkomen van

congenitale afwijkingen bij borelingen van moeders, die ooit woonachtig waren in

Neerland, met borelingen van moeders, die in dezelfde verloskundige eenheden bevielen

en nooit in Neerland gewoond hadden.

Op een derde niveau bestudeerden we binnen de groep van Neerland moeders het verband

tussen het voorkomen van congenitale afwijkingen en volgende verklarende variabelen:

leeftijd van de moeder (opgesplitst in minder dan 35 jaar of niet); beroepsgroep van de

ouders; meerlingzwangerschap; geslacht; totale verblijfsduur en verblijfsduur tijdens de

tien aan de geboorte voorafgaande jaren; kalenderjaar en, wanneer van toepassing,

tijdsspanne tussen vertrekdatum en geboorte.

We gebruikten verblijfsduur als een proxy voor blootstelling. Een positief dosis-antwoord

verband zou wijzen op een etiologische bijdrage van de ovens in het voorkomen van

congenitale afwijkingen.9;806-808Hierbij dient men er rekening mee te houden dat deze

blootstellingvariabele een surrogaat is voor de werkelijke blootstelling, die men bij de

analyses wenst te gebruiken maar waarover men niet beschikt. Dit impliceert bijgevolg een

grote voorzichtigheid bij de interpretatie van de vatstellingen.

Voor vrouwen die in Neerland kwamen wonen werd de datum van inschrijving in het

gemeenteregister genomen als beginpunt van de verblijfsduur. Voor vrouwen met

meerdere episodes van immigratie en emigratie berekenden we een globale verblijfsduur.

Vermits Neerland een gebied is waarin vaak verhuisd wordt, bleek het onmogelijk een

juiste afstand te bepalen tussen de woonplaats en de ovens.


307

6.2.4 Statistische aspecten. Leeftijd van de moeder, geboortegewicht en zwangerschapsduur, die gekarakteriseerd zijn

door een niet-lineaire associatie met de bestudeerde perinatale eindpunten, werden

gecategoriseerd.809

Voor nominale multinomiale variabelen gebruikten we voor het toetsen van verschillen

tussen proporties de “likelihood ratio” toets en, waar nodig de Fisher’s exact toets. In geval

van interval variabelen gebruikten we de Cochran-Armitage trend test.156

Voor binomiale variabelen berekenden we odds ratio’s en hun 95%

betrouwbaarheidsintervallen.460 We rapporteren ze als volgt: OR (OG,BG), waar OG staat

voor ondergrens en BG voor bovengrens. Voor de multivariabele analyses gebruikten we

de dichotome logistische regressie in geval van binomiale variabelen en de generalised

logit modelling (baseline category)156in geval van een multinomiale antwoordvariabele.

De modellen werden a priori geformuleerd, gebaseerd op wetenschappelijk inzicht. Daar

onze aandacht vooral uitging naar de mogelijke invloed van verblijfplaats op de

bestudeerde perinatale eindpunten, bleef de modellering beperkt tot het bereiken van een

goede fit en tot de vaststelling of verblijfplaats al dan niet significant was. In dat geval

zullen odds ratio’s en hun betrouwbaarheidsintervallen gepresenteerd worden.

6.3 RESULTATEN

6.3.1 Vergelijking tussen Neerland en Vlaanderen Hoewel gecorrigeerde odds ratio’s belangrijker zijn dan de niet-gecorrigeerde, geloven we

dat het aanbeveling verdient beide te rapporteren voor een studie die, althans gedeeltelijk,

uitgevoerd werd wegens de bezorgdheid van een gemeenschap. Puntschatters en 95%

betrouwbaarheidsintervallen, die de grootte van de evidentie aantonen, worden in Tabel 1

weergegeven. De odds ratio’s van perinatale sterfte (p=0,089) en van congenitale

afwijkingen (p=0,414) zijn niet significant. Mocht men al iets willen zeggen i.v.m.

perinatale mortaliteit, zou het zijn dat ze lager zou kunnen zijn in de Neerland groep.


Tabel 1: Verdeling van de binaire eindpunten van de reproductieve gezondheid volgens de verblijfplaats van de moeder. Vlaanderen, 1989-1996. Neerland Vlaanderen Odds Ratio ( 95% BI) Neerland versus Vlaanderen

Perinatale sterfte 1/636 4.344/505.996 0,18 (0,03;1,29)

Congenitale afwijking 13/636 8.259/505.996 1,26 (0,73;2,18)

Meerlingen 55/636 17.601/505.996 2,62 (1,99;3,47)

Jongens 340/636 259.629/505.996 1,09 (0,93;1,27)

Onze analyse i.v.m. congenitale afwijkingen had slechts een power van 0.20.453;810We

zouden immers 122 gevallen nodig gehad hebben uit 5847 geboorten om significantie te

bereiken met een power van 0,80. Wel vonden we een belangrijk en significant teveel van

meerlingen in Neerland (Tabel 1). Daarentegen schenen leeftijd van de moeder,

zwangerschapsduur, geboortegewicht, proportie jongens bij de geboorte (een equivalent

voor geslachtsratio), de pariteit van moeders bij eenlingzwangerschappen en de

leeftijdsopbouw van de moeders een gelijkaardige verdeling te vertonen (Tabellen 1 en 2).

De puntschatters 95% betrouwbaarheidsintervallen en de probabiliteiten van de

multivariabele analyse werden weergegeven in tabellen 3 en 4. Zij weerspiegelen in

essentie dezelfde informatie als de univariate analyse over perinatale sterfte, geslachtsratio,

congenitale afwijkingen of meerlingen. Medisch begeleide totstandkomingen van de

zwangerschap bij eenlingen waren vergelijkbaar in beide groepen (Tabel 3). Daarentegen

waren er significant meer medisch begeleide totstandkomingen van de zwangerschap bij

moeders van meerlingen in Neerland (Tabel 3). Zwangerschapsduur, geboortegewicht en

pariteit bij eenlingen waren echter zeer vergelijkbaar verdeeld (Tabel 4)


309

Tabel 2: Verdeling van multi-categorie eindpunten van reproductieve gezondheid volgens de verblijfplaats van de moeder, Vlaanderen, 1989-1996. NEERLAND VLAANDEREN

Leeftijd van de moeder (in verstreken jaren) N % N %

< 20 jaar 9 1,42 10.605 2,10

20 - 34 jaar 580 91,19 461.432 91,19

> 34 jaar 47 7,39 33.959 6,71

Totaal 636 100,00 505.996 100,00 Likelihood ratio chi-square: p=0.366

Geboortegewicht (eenlingen)

< 1500 g 3 0,52 3.506 0,72

1500 – 2499 g 19 3,27 19.527 4,00

>= 2500 g 559 96,21 465.362 95,28


Zwangerschapsduur (eenlingen)

< 32 weken 3 0,52 3.582 0,73

32 – 36 weken 28 4,82 20.707 4,24

>= 37 weken 550 94,66 464.106 95,03


Pariteit (Eenlingen)

1 226 45,29 179.989 45,84

2 173 34,67 136.272 34,71

3 72 14,43 51.078 13,01

4 17 3,41 15.639 3,98

5+ 11 2,20 9.658 2,46

Totaal 499 100,00 392.636 100,00 Likelihood ratio chi-square: p=0,926 ; Cochran-Armitage trend test (two-tailed): p=0,995


Tabel 3: Eindpunten van reproductieve gezondheid volgens de verblijfplaats van de moeder. Resultaten van de logistische regressie, Vlaanderen, 1989-1996. Eindpunt Gecorrigeerd

voor

Goodness-of-fit

(Deviance)

Verblijfplaats Odds Ratio (95% CI)

Neerland versus Vlaanderen

Vg Chi² Prob. Vg Chi² Prob.

Perinatale sterfte M, G, A, C, B 58 58,52 0,456 1 3,173 0,0750 0,16 (0,01; 1,77)

Geslacht M, A, C 14 13,07 0,521 1 1,167 0,2800 1,09 (0,91; 1,31)

Meerlingen A, G 5 5,511 0,357 1 26,04 0,0001 2,25 (1,65; 3,07)

Congenitale afwijking M, G, A, D 16 9,471 0,893 1 0,430 0,5120 1,20 (0,69, 2,08)

Medisch Begeleide

Totstandkoming van de

Zwangerschap

- Eenlingen

- Meerlingen

A

2

1

1,536

0,031

0,463

0,860

1

1

2,490

8,045

0,1150

0,0046

2,04 (0,71; 5,82)

2,50 (1,16; 5,38)

Gecorrigeerd voor: M: meerlingen, G: geslacht, A: leeftijd van de moeder, C: congenitale afwijking, D: zwangerschapsduur, B: geboorte gewicht; Vg: vrijheidsgraden.


Tabel 4: Eindpunten van reproductieve gezondheid volgens de verblijfplaats van de moeder. Resultaten van het modelleren van baseline-category logits, Neerland versus Vlaanderen, 1989-1996. Eindpunt Gecorrigeerd voor Goodness-of-fit

(Likelihood ratio)

Verblijfplaats Conclusie

Vg Chi² Prob. Vg Chi² Prob.

Zwangerschapsduur M, G, A, C 26 32,78 0,169 2 1,86 0,395 NS

Geboorte gewicht M, G, A, C 26 27,35 0,391 2 1,88 0,390 NS

Parity A 8 3,34 0,911 4 1,40 0,845 NS Gecorrigeerd voor: M: meerlingen, G: gender, A: leeftijd van de moeder, C: congenitale afwijking, D: zwangerschapsduur, B: geboorte gewicht; Vg: vrijheidsgraden.

Hoofdstuk 6: Complementariteit van gegevensbanken. 312

6.3.2 Voorkomen van congenitale afwijkingen bij moeders ooit woonachtig versus nooit woonachtig in Neerland, die in dezelfde obstetrische eenheden bevielen

578 van de 636 baby’s van de ooit in Neerland woonachtige moeders werden in 12

obstetrische eenheden geboren en worden vergeleken met 83.474 andere baby’s, die daar

geboren werden. 12 gevallen van congenitale afwijkingen werden vastgesteld bij de

Neerland kinderen versus 1297 bij de andere kinderen, wat overeenkomt met een niet-

significante odds ratio van 1,34 (0,72-2,44) en praktisch dezelfde als we observeerden bij

de vergelijking met Vlaanderen min Neerland.

Een multivariabele analyse, met correctie voor leeftijd van de moeder, geslacht en

meerlingzwangerschap resulteerde ook in een niet-significante odds ratio van 1,29 (0,73-

2,23).

6.3.3 Frequentie van congenitale afwijkingen en van meerlingzwangeschappen bij de moeders ooit woonachtig in Neerland. We bestudeerden het dosis-antwoord verband tussen een congenitale afwijking en de

verklarende variabelen,namelijk leeftijd van de moeder (gedichotomiseerd in al dan niet

minder dan 35 jaar); beroepsgroep van de ouders; meerlingzwangerschap; geslacht, totale

verblijfsduur en verblijfsduur gedurende de tien jaar voorafgaand aan de geboorte;

kalenderjaar en tijdsspanne tussen vertrekdatum en geboorte. Om mogelijke vertekeningen

te vermijden bij de keuze van de modellen, gebruikten we hier de automatische selectie

opties ter beschikking gesteld door de LOGISTIC Procedure van SAS.811Telkens

verkregen we een model bestaande uit één enkele verklarende variabele, namelijk de

prenatale verblijfsduur van de moeder met een odds ratio van 0,78 (0,60- 0,95).

Noteren we dat alle gevallen van congenitale afwijking zich voordeden bij moeders met

een verblijfsduur van 6 jaar of minder, ongeveer 2/3de van de totale cohort (Figuur 1).

Daarentegen was het voorkomen van meerlingzwangerschap niet significant gerelateerd

met de verblijfsduur.


313

Figuur 1: Aantal kinderen met of zonder een congenitale afwijking volgens verblijfsduur (in jaren) van de moeder in Neerland vóór de geboorte

0

10

20

30

40

50

60

70

80

90N

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Verblijfsduur in jaren

Congenitale afwijkingen

Afwezig

Aanwezig

6.4 BESPREKING

6.4.1 Opzet van de studie Het luik over congenitale afwijkingen in onze studie was duidelijk van het “post hoc” type.

In dergelijke gevallen kan het gebied waarover men zich zorgen maakt de administratieve

grenzen overschrijden en een verdunning van de reële effecten veroorzaken wegens de

grootte van deze eenheden, die vaak aanzienlijk groter zijn dan het blootgestelde gebied.

Een “natuurlijke” reactie hierop is het vernauwen van de grenzen door het kunstmatig

afbakenen van het blootgestelde gebied met een maximale concentratie van gevallen, zoals

in Neerland gebeurde.772 We hadden dus te kampen met problemen van occult meervoudig

toetsen en grensvernauwing, wat leidde tot een overschatting van de prevalentie van

ongenitale afwijkingen. 769;772;812;813 Zelfs al was de SES in Neerland hoger, kan, in deze

context, de niet-gecorrigeerde odds ratio van 1,20 (0,69- 2,08) als een geringe evidentie

voor een overmaat van congenitale afwijkingen beschouwd worden.


Vermits er regionale verschillen in het beoordelen van casussen kunnen bestaan

vergeleken we het voorkomen van congenitale afwijkingen bij moeders die ooit in

Neerland woonden met moeders die er nooit gewoond hadden en die in dezelfde

obstetrische eenheden bevielen. Die vergelijking leverde praktisch dezelfde resultaten op

als de vergelijking met Vlaanderen.

6.4.2 Statistische aspecten Zoal reeds vermeld zijn statistische toetsen vertekend in een “post hoc” situatie. Toch

moesten we, in een context van een wantrouwige gemeenschap802 en een delicate, te

onderbouwen politieke beslissing, de omvang van mogelijke gezondheidsbedreigingen

inschatten. De statistische methodes, die we gebruikten, zijn klassieke methodes, waarbij

problemen met de onderliggende geografische spreiding van de bestudeerde eindpunten uit

de weg gegaan worden. Vermits de geografische precisie van onze gegevens veel groter

was in de index populatie dan in Vlaanderen, onze referentie populatie, waren spatiale

methodes niet bruikbaar.772 Wegens de intense verhuisbewegingen in Neerland konden ze

ook niet gebruikt worden voor de analyse van de in Neerland woonachtige moeders.

Noteren we tenslotte dat 338 van de 636 kinderen in onze studie, waaronder 6 van de 13

gevallen van congenitale afwijkingen, niet in Neerland geboren werden en niet in

aanmerking zouden genomen zijn door methodes van geografische analyse. De gevolgde

methodologie bood hier enige bescherming tegen migratiebias.631

6.4.3 Waarde van routinematig verzamelde gegevens Geregistreerde gegevens laten een objectieve classificatie toe, voorafgaandelijk aan enige

kennis van een eindpunt, wat een ingebouwde bescherming biedt tegen informatie bias. De

kleine tijdsspanne tussen het voorkomen van een gezondheidsfenomeen en zijn registratie

vermindert ook het gevaar voor misclassificatie en voor een verlies aan statistische power

met een vertekening van de resultaten in de richting van geen associatie.814

In tegenstelling met de andere eindpunten van de studie, die eenduidig zijn, vormen

congenitale afwijkingen een complex probleem.805 Specifieke nadelen behelzen onder

meer laattijdige detectie, prenatale diagnose en codering.803;815 Verder zijn congenitale

afwijkingen eerder prevalenties dan incidenties, en kunnen in competitie treden met andere

eindpunten van reproductieve epidemiologie.816 Daarenboven registreert het SPE slechts


315

foetussen met een geboortegewicht van tenminste 500g en sluit op die manier vroege

miskramen en medisch geïnduceerde abortussen uit.610 Het nationale abortusregister, dat

alleen de provincie van de woonplaats registreert, was hierbij van weinig nut. Merken we

nochtans op dat al deze nadelen van toepassing zijn zowel op de index als de referentie

bevolking en dat het precies de vergelijking is tussen deze twee groepen, die het

belangrijkste aandachtspunt vormt, en niet het cijfer van congenitale afwijkingen.

Men mag aannemen dat de volledigheid van de SPE-gegevens groot is. In de deelnemende

Vlaamse moederhuizen worden immers alle perinatale sterfgevallen en levend geboren

kinderen geregistreerd, op een deel van de thuisbevallingen na, die slechts ongeveer 1%

van de verlossingen uitmaken. De gegevens worden op continue wijze verzameld en

worden onderworpen aan een georganiseerd systeem van kwaliteitsbewaking.610

Om onze cohort studie te corrigeren voor SES werd het SPE-bestand gekoppeld aan de

officiële geboortebestanden met een geslaagde koppeling in 96% der gevallen. Noteren we

dat we in ons eindbestand alle gevallen terugvonden, die gemeld waren door de Neerland

bewoners en zich tijdens de studieperiode voordeden.

De gegevens van het Antwerpse gemeenteregister en van het Rijksregister kunnen we als

praktisch volledig en kwaliteitsvol beschouwen, vermits zij vaak gebruikt worden voor

administratieve doeleinden.

6.4.4 Eindpunten van de studie Op de meerlingen na bleek geen enkel ander eindpunt statistisch significant te verschillen

in index en referentie populatie. Betreffende congenitale afwijkingen liet een power

analyse toe de grijze zone van niet-significante odds ratio’s te beperken tot odds ratio’s

van minder dan twee. Een mogelijk “oogst” effect, waarbij bij lage dosissen randgevallen

worden geëlimineerd, kan geresulteerd hebben in minder gevallen en een hogere sterfte.817

De cijfers van perinatale mortaliteit en congenitale afwijkingen in de index versus de

referentie populatie, de afwezigheid van een exces mortaliteit en van een omgekeerde

geslachtsratio onderbouwen deze hypothese niet.791

Het schijnbaar beschermende effect, aangegeven door een omgekeerde dosis-antwoord

relatie, kan te wijten zijn aan het gebruiken van de verblijfsduur als een niet adequaat

surrogaat voor een kwantitatieve blootstellingsmaat818 of aan de competitie met andere


reproductieve eindpunten zoals zeer vroegtijdige zwangerschapsonderbreking. 803 Geen

van deze twee hypotheses kunnen we uitsluiten. Ook de andere eindpunten, behalve

meerlingzwangerschap, en de bodemstudie, die de aanwezigheid van andere, belangrijke

bronnen van dioxine blootstelling aanduidt, schijnen een significante etiologische bijdrage

van de verbrandingsovens uit te sluiten.

De wetenschappelijke discussie over het verband tussen het voorkomen van

meerlingzwangerschap en milieuverontreiniging is nog steeds lopend. Mocht ze bestaan,

dan zou ze eerder klein en niet eenduidig zijn.798Het lijkt vermeldenswaard dat er zich, in

een straal van minder dan vijf kilometer rond Neerland, drie centra bevinden waar medisch

begeleide totstandkoming van de zwangerschap toegepast wordt. Hun aanwezigheid kan

meer vraag naar dit soort medische zorg gestimuleerd hebben en hebben bijgedragen tot

het meerlingzwangerschappenexces.255 Men kan verder aanvoeren dat vergeleken met

Vlaanderen de praktisch identieke pariteit van de Neerland moeders, de leeftijdsverdeling,

de vergelijkbare geslachtsratio en de afwezigheid van een dosis-antwoord verband tussen

blootstelling en het voorkomen van congenitale afwijkingen of van een overmaat van

meerlingzwangerschappen bij moeders, die ooit woonachtig waren in Neerland, weinig

evidentie opleveren voor een verminderde fertiliteit ten gevolge van een

milieuverontreiniging.

6.4.5 Risicoperceptie en -communicatie Gemeentelijke verbrandingsovens waren vroeger zware vervuilers, die hinder

veroorzaakten en misschien een bedreiging vormden voor de gezondheid. De

vreesverwekkende factoren aanwezig in Neerland kunnen in belangrijke mate bijgedragen

hebben tot de risicoperceptie. Zij bestonden onder meer uit een ongewilde blootstelling,

waaraan door persoonlijke voorzorgsmaatregelen niet kon ontsnapt worden, en een

nieuwe, door de mens gecreëerde bron van verontreiniging, die onomkeerbare schade

toebracht aan kleine kinderen.819 Daarenboven werden de klachten van de plaatselijke

bevolking al te lang genegeerd door de autoriteiten en verder bestond er geen systeem dat

bekwaam was om snel en effectief een antwoord te geven op milieuproblemen.818;820 Dit

alles, op zijn beurt, kan langdurige stress veroorzaakt hebben. 821


317

6.5 BESLUIT

Studie van clusters dragen slechts zelden bij tot de wetenschap en zouden moeten

vermeden worden.812In de gegeven omstandigheden echter werd een snel en onderbouwd

advies gevraagd. Geconfronteerd met een weinig meewerkende plaatselijke gemeenschap,

hadden we geen andere keuze dan een post hoc clusteranalyse uit te voeren betreffende

congenitale afwijkingen en de reproductieve gezondheid te beoordelen, gebruik makend

van beschikbare, routinematig verzamelde gegevens.

Onze studie gaat gebukt onder verschillende methodologische beperkingen. De analyse –

een suboptimale vergelijking tussen gemeenschappen818 i.p.v., bijvoorbeeld, een patiënt-

controle onderzoek – bleef beperkt tot alleen maar een vergelijking van gevallen in een

blootgesteld gebied met deze van de algemene bevolking, zonder een precieze beschrijving

van de letsels en zonder informatie over vroegtijdige miskramen en abortussen.

Daarenboven beschikten we niet over voldoende details i.v.m. SES, type en bron van

vervuiling, en intensiteit van de blootstelling, wat een formele uitsluiting van een cluster

van congenitale afwijkingen uitsloot. Nochtans vertrouwen we erop, wegens de

ingebouwde beveiliging tegen misclassificatie, dat deze gegevens ons toelieten een

eventueel exces van congenitale afwijkingen te beperken tot een odds ratio van minder dan

twee, en, vermits de baseline frequentie zeer laag is, voldoende evidentie verschaft te

hebben om een zorgwekkende situatie i.v.m. de reproductieve gezondheid in Neerland uit

te sluiten.

De Neerland studie onderstreept het belang van een efficiënte risicocommunicatie

vanwege de overheid naar een ongeruste gemeenschap in geval van een milieuprobleem.

Tenslotte maakt ze duidelijk dat de koppeling van gegevens van bestaande

gegevensbanken in een beperkte tijdspanne nuttige informatie kan verschaffen wanneer

zich dergelijke problemen stellen. Het is dan zaak het gemeenschappelijke belang af te

wegen tegen het individuele recht op bescherming van zijn privé-sfeer.


Bedankingen

We danken de professoren Bartsch, Van Larebeke en Van Oyen voor hun opbouwende

kritiek over de opzet en de resultaten van onze studie. We zijn grote dank verschuldigd aan

Mevr. E. Wallyn van het Antwerpse Register van de Burgerlijke Stand, het SPE en het

Rijksregister voor hun vriendelijke en behulpzame samenwerking.

319

ALGEMEEN BESLUIT EN AANBEVELINGEN

Een door evaluatie bijgestuurd beleid heeft nood aan bruikbare gegevens, die toelaten een

beleid te voeren gefundeerd op prioritaire gezondheidsproblemen. Op basis hiervan

formuleren lokale, intermediaire en landelijke beleidsmakers algemene en specifieke

doelstellingen, die op hun beurt vertaald worden in activiteiten, die uitmonden in prestaties

en vervolgens in uitkomsten. In deze benadering is het gebruik van administratieve

gegevensbanken - alleen of in combinatie - fundamenteel: zij leveren aanknopingspunten

voor de evaluatiecyclus (definitie van prioritaire gezondheidsproblemen, evaluatie van

prestaties en uitkomsten, evaluatie van de pertinentie van het gevoerde beleid) ten behoeve

van het beleid op alle niveaus.

Wegens een aantal beperkingen laten de administratieve gegevensbanken slechts tot op

zekere hoogte toe een onderbouwd beleid te voeren op alle niveaus van het

gezondheidssysteem.

Deze beperkingen vloeien deels voort uit de ongelijke kwaliteit van de gegevens, deels uit

het vooralsnog eenzijdig gebruik van de Minimaal Klinische Gegevens in een financiële

optiek en deels uit de versnippering, de geringe toegankelijkheid en de te beperkte scoop

van de bestaande gegevensbanken. Laten we daarbij niet uit het oog verliezen dat, hoewel

de complexiteit van de case mix niet volledig door administratieve gegevens kan

ondervangen worden, alleen dit soort gegevens toelaat landelijke, interziekenhuis

vergelijkingen te corrigeren voor case mix.

De kwaliteit van de gegevens van de overlijdensstatistieken deelt grotendeels in de

gebreken van de ziekenhuis ontslaggegevens. Specifieke moeilijkheden worden gesteld

door de certificatie met zijn specifieke, oorzakelijke logica, waar artsen vaak geneigd zijn

te redeneren vanuit het principe van de ernst. Ook hier lijkt een adequate vorming van de

artsen een noodzakelijke voorwaarde voor verbetering. Hoewel over het ganse land een

duidelijke verbetering van de codeerkwaliteit wordt vastgesteld blijft de tijdigheid van de

statistieken problematisch in het zuidelijk landsgedeelte en derhalve ook die van de

nationale statistieken. Vergeten we hierbij niet dat er geen enkele andere bron voor

Algemeen Besluit en Aanbevelingen 320

gezondheidsgegevens bestaat, die even universeel is in dekkingsgraad, in uniformiteit, en

tijdigheid als de sterftegegevens binnen het systeem van de bevolkingsstatistieken.

Toch wensen wij hier duidelijk te stellen dat de voormelde administratieve gegevens zeker

geen antwoord kunnen verstrekken op alle beleids- of onderzoeksvragen. Vaak kunnen zij

slechts een nuttige screening verschaffen en dient er op basis hiervan een gericht

wetenschappelijk onderzoek volgens de regels der kunst uitgevoerd te worden. Het kan

hierbij noodzakelijk blijken een specifieke registratie op te zetten. De internationaal

vastgestelde verschillen in mortaliteit ten gevolge van ischemische hartziekten, die leidden

tot het opzetten van het MONICA project, is hiervan een mooie illustratie. In andere

gevallen, zoals voor het uitvoeren van een kosten baten analyse van een vaccinatie voor

humaan pappilomavirus en baarmoederhalskanker, kunnen de administratieve gegevens

geen nuttige informatie leveren en zal wetenschappelijk onderzoek, gebaseerd op door de

onderzoekers verzameld feitenmateriaal nodig zijn, om dat soort vragen te beantwoorden.

Om de bruikbaarheid van deze administratieve gegevensbanken te verhogen lijkt een

strategie, gebaseerd op een progressieve verbetering een haalbaar project. Zij berust erop

dat de kwaliteit van de gegevens en dus hun beleidsonderbouwend potentieel zal

verbeteren indien ze ook voor volksgezondheidkundige doeleinden gebruikt worden. Zoals

de beperkte ervaring, die in dit proefschrift weergegeven wordt, leert is het mogelijk aan

de hand van kwaliteitsindicatoren niet alleen problemen in verband met kwaliteit van

zorgen te identificeren maar ook problemen in verband met de kwaliteit van de gegevens.

Deze laatste kunnen via de audits die de FOD Volksgezondheid uitvoert onderzocht en

waar nodig gecorrigeerd worden. Het kan hierbij zowel over overcoderen (bijvoorbeeld co-

morbiditeit) als ondercoderen (bijvoorbeeld het niet coderen van een vermelde vorige

keizersnede) gaan.

Problemen in verband met de kwaliteit van zorgen kunnen aangepakt worden in een brede

samenwerking binnen de sector tussen clinici en het management, tussen de sector en het

College van geneesheren en beroepsverenigingen, en in samenwerking met de overheid.

Dit veronderstelt een brede mentaliteits- en gedragsverandering, met een herdenking van

de organisatie op alle niveaus, een openheid naar en een implicatie van de patiënt en de

Algemeen Besluit en Aanbevelingen

321

gemeenschap, waarbij de overheid niet alleen gezien wordt en zich gedraagt als een

controlerende instantie maar als een heuse partner, die, naast zijn verantwoordelijkheid

voor het opzetten van administratieve gegevensbanken en het analyseren van de gegevens,

ook zijn verantwoordelijkheid als borger van de publieke belangen opneemt.

Een eerste belangrijk initiatief van een brede samenwerking op alle niveaus werd

genomen. Het bestaat in de creatie van een operationele structuur, die ermee belast wordt

(1) de toekomstige nationale feedbacks, bestaande uit klinische en niet-klinische

indicatoren, te begeleiden, (2) de ontwikkeling van hierop gebaseerde

kwaliteitsbevorderende acties te initiëren en (3) het identificeren van bijkomende

indicatoren.Verder zullen lokale initiatieven, die aansluiten op de feedback, aangemoedigd

worden. Zowel een continue investering in een infrastructuur voor kwaliteitsbevordering

als het voorzien in een beschermde tijd voor deze activiteiten zijn vereist om het project te

laten slagen.

Een goede samenwerking tussen de bestaande gegevensbanken, naar het Canadese

voorbeeld, moet een volgende doelstelling zijn. In onze Neerland studie menen we niet

alleen aangetoond te hebben dat een samenwerking mogelijk is, maar tevens dat de voor

het beleid noodzakelijke informatie op deze manier kon verzameld worden. Deze

doelstelling zal echter alleen verwezenlijkt kunnen worden indien de politieke overheden

zich hiervoor inzetten. De versnippering van de bevoegdheden over het federaal en het

gemeenschapsniveau, en de huidige wetgeving in verband met de bescherming van de

persoonlijke levenssfeer maken deze opzet niet eenvoudig. Toch moet het mogelijk zijn

via geijkte procedures een koppeling van gegevens mogelijk te maken en de voorwaarden

tot koppeling te versoepelen in functie van het minder of meer dringend karakter van de

aanvraag.

Tenslotte formuleren we volgende dubbele aanbeveling:

1) het opzetten van een operationeel landelijk gezondheidsinformatie systeem, dat de

noodzakelijke gegevens toegankelijk maakt, de kwaliteit ervan waarborgt, ze tijdig

verwerkt en ze op een correcte manier met de nodige garanties voor de

Algemeen Besluit en Aanbevelingen 322

persoonlijke levenssfeer ter beschikking stelt voor het beleid en de

wetenschappelijke wereld,

2) het structureel verankeren van een tijdige oplevering van de landelijke

mortaliteitsgegevens.

323

SAMENVATTING Een behoeftengestuurd en bevolkingsgericht gezondheidsbeleid vereist een betrouwbaar

gezondheidsinformatiesysteem. Hierbij lijkt er een belangrijke rol weggelegd voor

secundaire gegevensbanken. Hij bestaat in het in kaart brengen van de gezondheidsstatus

van de bevolking en het om het verantwoording afleggen over het gebruik van de

toegekende middelen en over de kwaliteit en de uitkomsten van de verstrekte zorgen

mogelijk te maken.

Op basis van literatuurgegevens werd een referentiekader voor het beoordelen van

gegevenskwaliteit uitgewerkt met een bijzondere nadruk op de potentieel negatieve

invloed van het financieringsmechanisme van ziekenhuizen hierop. Meer speciaal gaat

onze aandacht uit naar het “creep” fenomeen, het kunstmatig verzwaren van de case mix

van een ziekenhuis om een hogere terugbetaling te krijgen.

Tijdens het ganse verzamelings- en verwerkingsproces van de gegevens tasten

onvolmaaktheden, fouten en vergetelheid de kwaliteit van de gegevens aan. De

gegevenskwaliteit varieert over de tijd en in functie van leeftijd; geslacht van de

geregistreerde; het type aandoening; het type medische handeling (diagnose, ingreep); het

gebruik van de gegevens door de diensten die registreren; en, het registratiesysteem en zijn

bewakingsmechanismen. Dit betekent dat ze grondig op hun waarde getoetst moeten

worden en dat er voorzichtig omgesprongen wordt met de interpretatie van de resultaten

van uitgevoerde studies.

Een zorgvuldig design van de registratie is uiterst belangrijk. De bewaking van de

gegevenskwaliteit omvat de te gebruiken formulieren of beeldschermen; de selectie van te

registreren items (zoals klinische, radiologische en laboratoriumgegevens, EKG en

beeldvorming); eenduidige instructies; het toepassen van internationaal aanvaarde

classificatiesystemen en bijbehorende codeerregels; het op systematische wijze

verzamelen, verwerken en interpreteren van de gegevens en het monitoren ervan over de

tijd. Verder zijn gegevensvergelijking en samenwerking met andere registraties, creativiteit

bij de validatie, feedback en intensieve audit noodzakelijk, zeker wanneer deze gegevens

een belangrijke rol blijken te spelen in het financieringsmechanisme van ziekenhuizen.

Samenvatting 324

Er lijken twee, los van elkaar staande werelden te bestaan: een van volksgezondheid en een

andere van gezondheidsdiensten, met twee eigen informatiesystemen, respectievelijk

volksgezondheidsinformatie en managementinformatie. Wij trachten de conceptuele

eenheid te herstellen door te streven naar een kwaliteitsvolle volksgezondheid.

Na een omschrijving van wat kwaliteit is, wordt nagegaan welke van haar aspecten aan de

hand van administratieve gegevens kunnen beschreven worden. Een eerste benadering is

gebaseerd op kwaliteitsindicatoren. Achtereenvolgens worden de types en het gebruik van

kwaliteitsindicatoren besproken, en de mogelijkheden van administratieve gegevens om

ondermaatse of bovenmaatse kwaliteit aan te tonen onderzocht. Een tweede benadering is

gebaseerd op incidenten n.a.v. toegediende zorgen. Het begrip “onbedoelde uitkomst”

wordt omschreven, gegevensbronnen worden vermeld, de omvang van het fenomeen

geschetst en de beperkte bruikbaarheid van administratieve gegevensbanken aangegeven.

Wij wijdden een hoofdstuk aan methodologische aspecten in verband met de analyse van

administratieve gegevens voor het opsporen van afwijkend codeergedrag en het

identificeren van ziekenhuizen met een vermoedelijke, bovenmaatse of ondermaatse

kwaliteit. In beide gevallen gaat het over een “outlier” probleem. We gebruikten hiervoor

de logistische regressie en corrigeerden voor het multipel gelijktijdig toetsen d.m.v.de

Bonferroni correctie en voor de correlatie tussen de gegevens d.m.v.“rescaling”

technieken.

Kwaliteit van zorgen is een dagdagelijkse, gedeelde verantwoordelijkheid tussen patiënt,

zorgverleners, ziekenhuisdirecties, College van geneesheren en beroepsverenigingen. De

verantwoordelijkheid van de overheid als borger van de belangen voor de gemeenschap

bestaat erin kwaliteitsinitiatieven te ondersteunen en te stimuleren. In onze benadering

werden ziekenhuizen eerder gezien als individuele structuren van het gezondheidssysteem,

waarvan de diensten een gemeenschappelijk organisatorische cultuur en een aantal

gemeenschappelijk processen deelden, en die verantwoording dienden af te leggen. Niet

het tot schande maken, noemen en blameren van individuen of instituten maar het

identificeren van organisatie− en cultuurgerelateerde problemen werden beschouwd als het

aanknopingspunt voor kwaliteitsbevorderende acties.

Samenvatting

325

De voornaamste resultaten van de analyse van het keizersnedencijfer bij laagrisico

verlossingen kunnen als volgt samengevat worden. Er bestaan in België belangrijke en

onverklaarde interziekenhuis verschillen in keizersnedencijfer, een nationale opwaartse

trend van 2% per semester, en een intens medisch ingrijpen rond het geboortegebeuren.

Als men verlangt het keizersnedencijfer om te buigen zal dit een georganiseerde aanpak

vereisen en dit zowel op het centraal als intermediair en lokaal niveau.

Voor de analyse van het letaliteitcijfer bij AMI wijzen de voornaamste resultaten eerder

naar de beperkingen van de gegevens. De nood aan een eenvormige definitie, de

volledigheid van de gegevens, de traceerbaarheid van patiënten en een goede

risicocorrectie zijn daarbij de voornaamste aandachtspunten. Op gebied van kwaliteit van

de zorgen kunnen reeds een aantal behartigenswaardige bevindingen verder uitgediept

worden. De belangrijke interziekenhuis verschillen zijn wellicht moeilijk interpreteerbaar

maar lijken toch belangrijk genoeg om verder onderzocht te worden. Ook de transfer van

AMI-patiënten voor een electieve PCI verdient de aandacht. Hoewel de complexiteit van

de case mix niet volledig door administratieve gegevens kan ondervangen worden, dient

men er zich tenslotte rekenschap van te geven dat alleen dit soort gegevens toelaat

landelijke, interziekenhuis vergelijkingen te corrigeren voor case mix.

Bij de analyse van kwaliteitsindicatoren kwamen we tot het besluit dat, uit de aard zelf van

onze gegevens, die alleen informatie bevatten over een aantal technische aspecten maar

niet over interpersonele relaties, we alleen van een screening konden gewagen. Daarom

werd de feedback gericht tot clinici, ziekenhuisdirecties, College van geneesheren,

beroepsverenigingen en overheid. Om dezelfde reden was hij ook anoniem.

De Neerland studie gaf aan dat het eventueel exces aan congenitale aandoeningen beperkt

bleef tot een odds ratio van maximaal twee en dat er voldoende evidentie voorhanden was

om een bedreiging voor de reproductieve gezondheid uit te sluiten. Ze benadrukte het

belang voor de overheden om te luisteren naar een verontruste gemeenschap en om tot een

echte risicocommunicatie te komen. Ze maakte ook duidelijk dat koppeling van gegevens

van bestaande gegevensbanken nuttige informatie kan verschaffen.

Samenvatting 326

De moeilijkheid om het juiste evenwicht te vinden tussen de bescherming van het

individuele recht op privacy en het gemeenschappelijk belang komt tot zowel uiting in de

studie van het letaliteitcijfer na een opname voor een AMI als in de Neerland

problematiek. Het is in het eerste geval belangrijk zich te realiseren dat traceerbaarheid

een randvoorwaarde is voor de evaluatie van de behandeling van een AMI en bijgevolg

voor het toekomstige welzijn van dit type patiënten. In het tweede geval hadden we nooit

een verontrustende gezondheidssituatie kunnen uitsluiten zonder een koppeling van de

gegevens tussen registers.

Samenvattend kan men stellen dat administratieve gegevensbanken in beperkte mate

toelaten een onderbouwd beleid te voeren op alle niveaus van het gezondheidssysteem. De

beperkingen vloeien voort deels uit de gebrekkige kwaliteit van de gegevens, deels uit het

vooralsnog eenzijdig gebruik van de Minimaal Klinische Gegevens in een financiële

optiek en deels uit de versnippering, de geringe toegankelijkheid en de te beperkte scoop

van de bestaande gegevensbanken. De kwaliteit van de gegevens en dus hun

beleidsonderbouwend potentieel zal verbeteren indien ze ook voor

volksgezondheidkundige doeleinden gebruikt worden. De kwaliteit van de zorgen is

hiervan een belangrijk domein. Om deze doelstelling te bereiken is een opbouwende

samenwerking van alle beleidsniveaus noodzakelijk.

327

SUMMARY

A need-driven and population-directed health policy requires a reliable health information

system. Herein secondary databases may play an important part. Indeed they contribute to

the assessment of the health status of the population and allow health services to be

accountable for the use of the resources, placed at their disposal, and the quality and

outcomes of the care they offer.

Based on the literature, a frame of reference has been elaborated to assess the quality of

data laying an emphasis on the potential negative influence of the financing mechanism of

the hospitals hereupon. In particular we paid attention to the phenomenon of creep, which

consists in the artificially aggravating of a hospital’s case mix in order to obtain a higher

reimbursement.

During the whole process of data collection and processing the data may be fraught with

imperfections, errors and forgetfulness. Data quality varies over time and according to age

and gender of the patient; the type of the disorder; the type of medical act (diagnosis,

procedure); the use of their own data by the registering services; and, the registration

system and its control mechanisms. This means that administrative data are to be

scrutinized and to be handled with great care when interpreting the results of studies

carried out using them.

A careful design of the registration is of the utmost importance. The assurance of the

quality of the data includes the forms or screens to be used, the selection of items to be

registered (such as clinical, radiological and laboratory data, ECG and medical imaging);

univocal instructions; the implementation of international agreed to classification systems

and accompanying rules; the systematic collecting, processing and analyzing of the data

and its monitoring in time. Comparison of the data and collaboration with other registries;

creativity while validating; feedback and intensive audit; all are required, especially if the

data play an important role in the financing mechanism of hospitals.

Summary 328

Two separate worlds seem to exist: the world of public health and the world of health

services. Both have their own information system, respectively information of public

health and management information. We try to restore the conceptual unity by aiming at a

public health of superior health care quality.

Having defined the concept of quality, we examined to which extent it could be analyzed

using administrative data. A first approach relies on quality indicators. Successively the

differential types and uses of these indicators are discussed. We also examined the

potential of administrative data to identify both superior and inferior quality of care. A

second approach is that of the patient safety indicators, based on adverse events. The

concept of adverse event is described; sources of data are mentioned; the magnitude of the

phenomenon is outlined and the limitations in the use of administrative data in that respect

are reported.

We dedicated a chapter to the methodological aspects regarding the use of administrative

data both to detect deviant coding practices as to identify hospitals of superior or inferior

quality of care. In both cases it is about a problem of outliers. To handle these problems

we made use of logistic regression techniques and corrected for multiple, simultaneous

testing by the Bonferroni correction and for correlation within the data by rescaling

techniques.

Quality of care is a continuous, shared responsibility between patients, care providers,

hospital directions, College of physicians and professional bodies. The responsibility of the

authorities, the guarantor of the community’s interests, consists in supporting and eliciting

quality initiatives. In our approach hospitals are considered individual structures of the

health care system, consisting of services sharing a common organizational culture and

certain common processes and being accountable to the community. Not the “shame, name

and blame” of individuals or organizations but the identification of organizational

problems was considered a starting point for quality improvement.

The main results of our analysis regarding the cesarean section rate in low risk deliveries

may be summarized as follows. In Belgium important and unexplained differences in rates

exist between hospitals. We found a national upward trend of 2% per semester and a

Summary

329

pervading medicalization of childbirth. An organized approach on lokal, intermediate and

central level will be required to stop the rise of the cesarean section rate.

The main results of the analysis of the in hospital case fatality rate of AMI point to the

limitations of the data. The need of a univocal definition of an AMI, the completeness of

the data, the traceability of transferred patients and an adequate risk adjustment draw

particular attention. Some of our findings in the field of quality of care are worthy to be

further examined. Although it may show difficult to interpret the between hospital

differences, they seemed sufficiently important to be investigated. The transfer of patients

with AMI to undergo an elective PCI requires attention as well.

Finally, although it is impossible to completely reflect the complexity of the case mix by

means of administrative data, one has to realize that only this type of data allows to dajust

countrywide inter-hospital comparisons for case mix.

Analyzing quality indicators led us to the conclusion that, due to the very nature of our

data, which contain only information about technical aspects of care but not about

interpersonal relations, we provided only a screening of and not a firm statement about

quality. Therefore our feedback has been directed to the clinicians, hospital directions,

College of physicians, professional bodies and authorities. For that same reason our

feedback remained anonymous.

The Neerland study showed able to restrict the potential excess of cases of congenital

anomalies to an odds ratio of less than two and to have furnished sufficient evidence to

exclude a worrisome situation regarding the reproductive health in Neerland. The study

highlighted the need for the authorities of listening to and communicating with a

community about its health risks. It made it clear that linking of data between existing

registries may provide the needed information.

The difficulty of striking a balance between the common good and the right to the

protection of one’s privacy is common to both the case fatality rate of AMI and the

Neerland study. In the first case it seems important to realize that traceability constitutes a

prerequisite for the evaluation of the treatment of AMI and as a consequence for the well

Summary 330

being of this type of patients in the future. In the second case we would never have been

able to exclude a worrisome health situation without the linkage of data between registries.

Concluding, one may argue that administrative data allow to a certain extent the

underpinning of a policy on all the levels of the health care system. The limitations are due

to the perfectible quality of the data; to the until now almost exclusive, financial use of the

Minimal Clinical Data; and, to the poor accessibility and the too restricted scope of the

existing data banks.

The quality of data and hence their policy-sustaining potential will increase if the data are

used in a perspective of public health, wherein quality of care constitutes an important

domain. To realize this objective a constructive collaboration is required of all levels of

both the public health and the health services worlds.

331

Literatuur

(1) Doremus HD, Michenzi EM. Data quality. An illustration of its potential impact upon a diagnosis-related group's case mix index and reimbursement. Med Care 1983; 21(10):1001-1011.

(2) Scerbo M, Dickstein C, Wilson A. Health Care Data and the SAS System. Cary NC: SAS Institute Inc.; 2001.

(3) Belgisch Staatsblad, Moniteur Belge. Koninklijk besluit houdende oprichting van een Commissie voor toezicht op en evaluatie van statistische gegevens die verband houden met de medische aktiviteiten in de ziekenhuizen. 21-6-1990.

(4) Hill AB. The Aim of the Statistical Method. In: Hill AB, editor. A Short Textbook of Medical Statistics. London: Hodder and Stoughton; 1977. 1-21.

(5) Baker TD, Reinke WA. Epidemiologic Base for Health Planning. In: Reinke WA, editor. Health Planning for Effective Management. New York: Oxford University Press; 1988. 117-130.

(6) Reinke WA. Health Services Program Evaluation. In: Reinke WA, editor. Health Planning for Effective Management. New York: Oxford University Press; 1988. 42-53.

(7) Cochrane AL, St Leger AS, Moore F. Health service 'input' and mortality 'output' in developed countries. J Epidemiol Community Health 1978; 32(3):200-205.

(8) Reinke WA. Health Systems Reserch in Relation to Planning. In: Reinke WA, editor. Health Planning for Effective Management. New York: Oxford University Press; 1988. 31-41.

(9) Last JM, Spasoff RA, Harris SS, Thuriaux MC, Anderson JB. A Dictionary of Epidemiology. 4th ed. New York: Oxford University Press; 2001.

(10) Van Oyen H. Belang van gezondheidgegevens voor een gezondheidsbeleid. In: Nijs H, Denekens J, editors. Preventieve Gezondheidszorg.Verslagboek. Diegem Editorial: Kluwer; 1997. 74-82.

(11) Gonnella JS, Louis DZ, Zeleznik C, Turner BJ. The problem of late hospitalization: a quality and cost issue. Acad Med 1990; 65(5):314-319.

(12) Asch SM, Sloss EM, Hogan C, Brook RH, Kravitz RL. Measuring underuse of necessary care among elderly Medicare beneficiaries using inpatient and outpatient claims. JAMA 2000; 284(18):2325-2333.

Literatuur 332

(13) Cochrane AL. L'inflation médicale. Réflexions sur l'efficacité de la médicine. Paris: Galilée; 1977.

(14) Mercenier P. Santé Publique. Notes de cours. Antwerpen: CIPS, ITG; 1976.

(15) Roos NP, Black C, Roos LL, Frohlich N, DeCoster C, Mustard C et al. Managing health services: how the Population Health Information System (POPULIS) works for policymakers. Med Care 1999; 37(6 Suppl):JS27-JS41.

(16) WHO. Health for all targets: the health policy for Europe. 4, 199-215. 1991. Geneva, WHO. European Health for All Series.

(17) Anonymous. Estimation of the incidence of acute myocardial infarction using record linkage: a feasibility study in Nova Scotia and Saskatchewan. Nova Scotia-Saskatchewan Cardiovascular Disease Epidemiology Group. Can J Public Health 1989; 80(6):412-417.

(18) Cotter JJ, Smith WR, Rossiter LF, Pugh CB, Bramble JD. Combining state administrative databases and provider records to assess the quality of care for children enrolled in Medicaid. Am J Med Qual 1999; 14(2):98-104.

(19) Haas JS, Brandenburg JA, Udvarhelyi IS, Epstein AM. Creating a comprehensive database to evaluate health coverage for pregnant women: the completeness and validity of a computerized linkage algorithm. Med Care 1994; 32(10):1053-1057.

(20) Aelvoet W. Mortaliteitsstatistieken voor een gezondheidsbeleid. In: Nijs H, Denekens J, editors. Preventieve Gezondheidszorg. Diegem Editorial: Kluwer; 1997. 914-921.

(21) Aelvoet W, Mertens I, van Sprundel M. Uitwendige oorzaken in de Minimale Klinische Gegevens. 2002. Brussel, FOD Volksgezondheid, Veiligheid van de Voedselketen en Leefmilieu.

(22) Aelvoet W, Bogaert J, Gillet P, Molenberghs G. Bepaling van de invloed van sociale factoren en van het individueke ziekenhuis op de verblijfsduur in de sector van de acute ziekenhuizen, aan de hand van de gekoppelde MKG- en MFG-1996. 2001. Brussel, Ministerie van Sociale Zaken, Volksgezondheid en Leefmilieu.

(23) Chatfield C. Problem Solving. A Statistician's Guide. 2nd ed. London: Chapman&Hall; 1995.

(24) Van Oyen H, Moens G. Conceptueel kader van een gezondheidsinformatiesysteem. In: Nijs H, Denekens J, editors. Preventieve Gezondheidszorg. Diegem Editorial: Kluwer; 1997. 881-895.

Literatuur

333

(25) Baert E, Byttebier G, De Backer G, Van Oyen H, Aelvoet W, De Henauw S. Ontwikkeling van geïntegreerde gezondheidsindicatoren op basis van bestaande Vlaamse gegevens in zake ziekte en gezondheid. PBO/UG/43, 1-98. 2001. Gent, RUG.

(26) Vandenbroeck H, Van Loon H. Evaluatie van bestaande pathologieregistraties. Onderzoek Milieu & Gezondheid. 2000. Brussel, Ministerie van de Vlaamse Gemeenschap.

(27) WHO. International Classification of Diseases.1975 Revision. Ninth Revision. ed. Geneva.: World Health Organisation.; 1977.

(28) Roos NP, Black C, Roos LL, Frohlich N, DeCoster C, Mustard C et al. Managing health services: how administrative data and population- based analyses can focus the agenda. Health Serv Manage Res 1998; 11(1):49-67.

(29) MacMahon B, Pugh TF. Sources of Data. In: MacMahon B, Pugh TF, editors. Epidemiology: Principles and Methods. Boston: Little, Brown and Company; 1970. 73-102.

(30) MacMahon B, Trichopoulos D. Epidemiology. Principles and Methods. New York: Little, Brown and Company; 1996.

(31) Rothman KJ, Greenland S. Modern Epidemiology. Second ed. Philadelphia: Lippincott Williams & Wilkins; 1998.

(32) Van de Sande S, De Wachter D, Swartenbroeckx N, Peers J, Debruyne H, Moldenaers I et al. Inventaris van databanken gezondheidszorg. KCE reports vol.30A, 1-135. 2006.

(33) Aelvoet W, Bogaerts K, Capet F. Gezondheidsindicatoren 1994. Brussel: Ministerie van de Vlaamse Gemeenschap; 1996.

(34) Aelvoet W, Bogaerts K, Capet F, Quataert PK. Gezondheidsindicatoren 1995. Brussel: Ministerie van de Vlaamse Gemeenschap; 1997.

(35) Mackenbach JP. Mortality and medical care:studies of mortality by cause of death in the Netherlands and other European countries. Rotterdam, Erasmus Universiteit; 1988.

(36) Aelvoet W. Vital Statistics in Flanders. An Exploration of Possible Biases due to Coding and Certification Practices. Limburgs Universitair Centrum; 1994.

(37) AHRQ Quality Indicators - Guide to Inpatient Quality Indicators: Quality of Care in Hospitals - Volume, Mortality, and Utilization. Revision 4 ed. Rockvile, MD: Agency for Healthcare Research and Quality; 2004.

Literatuur 334

(38) Hosmer DW, Lemeshow S. Applied Logistic Regression. 2nd ed. New York: John Wiley & Sons, INC.; 2000.

(39) Grundy F, Reinke WA. Recherche en Organisation Sanitaire et Techniques de Managemenet. [No 51]. 1973. Genève, Organisation Mondiale de la Santé. Cahiers de Santé Publique.

(40) Charlton JR, Hartley RM, Silver R, Holland WW. Geographical variation in mortality from conditions amenable to medical intervention in England and Wales. Lancet 1983; 1(8326 Pt 1):691-696.

(41) Weissman J, Epstein AM. Case mix and resource utilization by uninsured hospital patients in the Boston metropolitan area. JAMA 1989; 261(24):3572-3576.

(42) Ayanian JZ, Weissman JS, Schneider EC, Ginsburg JA, Zaslavsky AM. Unmet health needs of uninsured adults in the United States. JAMA 2000; 284(16):2061-2069.

(43) Closon MC, Maes N, Duchaine A, Bellemans M, Gilbert P, Van Hee W. Impact des facteurs sociaux sur la durée de séjour et les coûts dans les hôpitaux. Bruxelles, CIES: 1998.

(44) Peeters RF, Van der Veen F. De perinatale en zuigelingensterfte van ethnische minderheden in België/Vlaanderen. 1989. Antwerpen, UA ESOC.

(45) Alexander S. Crosscultural aspects of risks in pregnancy. Ph D Thesis. ULB; 1995.

(46) Bollini P, Siem H. No real progress towards equity: health of migrants and ethnic minorities on the eve of the year 2000. Soc Sci Med 1995; 41(6):819-828.

(47) Aelvoet W, Vanoverloop J, Molenberghs G, Buekens P, Timmerman C, De Muynck A. Loop je in Vlaanderen, als je een baby van een Turkse moeder bent, een groter risico op kindersterfte? In: Aelvoet W, Capet F, Vanoverloop J, editors. Gezondheisindicatoren 1996. Brussel: Ministerie van de Vlaamse Gemeenschap; 1998. 105-107.

(48) Hadley J, Steinberg EP, Feder J. Comparison of uninsured and privately insured hospital patients. Condition on admission, resource use, and outcome. JAMA 1991; 265(3):374-379.

Literatuur

335

(49) Ancona C, Agabiti N, Forastiere F, Arca M, Fusco D, Ferro S et al. Coronary artery bypass graft surgery: socioeconomic inequalities in access and in 30 day mortality. A population-based study in Rome, Italy. J Epidemiol Community Health 2000; 54(12):930-935.

(50) Franks P, Clancy CM, Gold MR. Health insurance and mortality. Evidence from a national cohort. JAMA 1993; 270(6):737-741.

(51) Closon MC, Azoury E, Duchaine A, Caes T, Bellemans M. Impact des facteurs sociaux sur la durée de séjour dans les hôpitaux. 1997. Bruxelles, CIES.

(52) Epstein AM, Stern RS, Tognetti J, Begg CB, Hartley RM, Cumella E et al. The association of patients' socioeconomic characteristics with the length of hospital stay and hospital charges within diagnosis- related groups. N Engl J Med 1988; 318(24):1579-1585.

(53) Epstein AM, Stern RS, Weissman JS. Do the poor cost more? A multihospital study of patients' socioeconomic status and use of hospital resources. N Engl J Med 1990; 322(16):1122-1128.

(54) Miller MG, Miller LS, Fireman B, Black SB. Variation in practice for discretionary admissions. Impact on estimates of quality of hospital care. JAMA 1994; 271(19):1493-1498.

(55) Rose G. The Strategy of Preventive Medicine. New York: Oxford University Press; 1992.

(56) McMahon B, Pugh TF. Sources of Data. In: McMahon B, Pugh TF, editors. Epidemiology: Principles and Methods. Boston: Little, Brown and Company; 1970. 73-85.

(57) Billings J. Using Administrative Data To Monitor Access, Identify Disparities, and Assess Performance of the Safety Net. 2003. http://www.ahrq.gov/data/safetynet/billings.htm.

(58) Research Methods Server in the Division of Social Sciences. SoLaSSGCU. Sources & Uses of Secondary Data. http://oassis.gcal.ac.uk/rms/crml/ crml.html.

(59) Data and Information Services Center UoW-M. An Introduction to Using Data at DPLS. 2003. http://www.disc.wisc.edu/types/indextxt.html, acceeded 280107.

http://www.ahrq.gov/data/safetynet/billings.htm

http://www.disc.wisc.edu/types/indextxt.html,

Literatuur 336

(60) Colin C, Ecochard R, Delahaye F, Landrivon G, Messy P, Morgon E et al. Data quality in a DRG-based information system. Int J Qual Health Care 1994; 6(3):275-280.

(61) Garnick DW, Hendricks AM, Comstock CB. Measuring quality of care: fundamental information from administrative datasets. Int J Qual Health Care 1994; 6(2):163-177.

(62) Buehler JW. Surveillance. In: Rothman KJ, Greenland S, editors. Modern Epidemiology. Second ed. Philadelphia: Lippincott Williams & Wilkins; 1998. 435-457.

(63) Kantor J, Margolis DJ. The accuracy of using a wound care specialty clinic database to study diabetic neuropathic foot ulcers. Wound Repair Regen 2000; 8(3):169-173.

(64) Coady SA, Sorlie PD, Cooper LS, Folsom AR, Rosamond WD, Conwill DE. Validation of death certificate diagnosis for coronary heart disease: the Atherosclerosis Risk in Communities (ARIC) Study. J Clin Epidemiol 2001; 54(1):40-50.

(65) Inoue M, Tajima K, Tominaga S, Sugiura T, Inuzuka K. Evaluation of the death certificate follow-up method for the analysis of survival rate: data from Aichi Prefecture, Japan. Jpn J Clin Oncol 1998; 28(1):30-35.

(66) Messite J, Stellman SD. Accuracy of death certificate completion: the need for formalized physician training. JAMA 1996; 275(10):794-796.

(67) McMahon B, Pugh TF. Concepts of Cause. In: McMahon B, Pugh TF, editors. Epidemiology: Principles and Methods. Boston: Little, Brown and Company; 1970. 17-27.

(68) Hill AB. Standardised Death-rates and Indices. In: Hill AB, editor. A Short Textbook of Medical Statistics. London: Hodder and Stoughton; 1977. 181-198.

(69) Shapiro MF, Park RE, Keesey J, Brook RH. The effect of alternative case-mix adjustments on mortality differences between municipal and voluntary hospitals in New York City. Health Serv Res 1994; 29(1):95-112.

(70) WHO. World Health Report 2000. Health Systems: Improving Performance. 1-206. 2000. Geneva, WHO.

(71) OECD. Measuring Up. Immproving Health System Performance In OECD Countries. http://www1.oecd.org/publications/e-book/8102011E.PDF: OECD; 2002.

http://www1.oecd.org/publications/e-book/8102011E.PDF:

Literatuur

337

(72) Delnoij DMJ, ten Asbroek AHA, Arah OA, Custers T, Klazinga NS. Bakens zetten. Naar een Nederlands raamwerk voor de gezondheidszorg. 1-44. 2002. http://www.ggzbeleid.nl/pdfstelsel/vws_bakenszetten.pdf, Ministerie van Volksgezondheid, Welzijn en Sport.

(73) Perrin EB, Koshell JJ. Assessment of Performance Measures for Public Health, Substance Abuse, and Mental Health. 1-160. 1997. Washington,DC, National Academy Press.

(74) Ansari MZ, Ackland MJ, Jolley DJ, Carson N, McDonald IG. Inter-hospital comparison of mortality rates. Int J Qual Health Care 1999; 11(1):29-35.

(75) Thomas JW, Holloway JJ, Guire KE. Validating risk-adjusted mortality as an indicator for quality of care. Inquiry 1993; 30(1):6-22.

(76) Marshall EC, Spiegelhalter D. Institutional Performance. In: Leyland AH, Goldstein H, editors. Multilevel Modelling of Health Statistics. Chichester: John Wiley & Sons, LTD; 2001. 127-142.

(77) Davies SM, Geppert J, McClellan M. Refinement of the HCUP Quality Indicators. Technical Review Number 4 (Prepared by UCSF-Stanford Evidence-based Practice Center under Contract No. 209-97-0013). No.01-0035. 2001. Rockville,MD, Agency for Healthcare Research and Quality.

(78) Hobbs FD, Parle JV, Kenkre JE. Accuracy of routinely collected clinical data on acute medical admissions to one hospital. Br J Gen Pract 1997; 47(420):439-440.

(79) Every NR, Frederick PD, Robinson M, Sugarman J, Bowlby L, Barron HV. A comparison of the national registry of myocardial infarction 2 with the cooperative cardiovascular project. J Am Coll Cardiol 1999; 33(7):1886-1894.

(80) Malenka DJ, McLerran D, Roos N, Fisher ES, Wennberg JE. Using administrative data to describe casemix: a comparison with the medical record. J Clin Epidemiol 1994; 47(9):1027-1032.

(81) Gabriel SE, Amadio PC, Ilstrup D. The feasibility and validity of studies comparing orthopedists and non-orthopedists caring for musculoskeletal injuries: results of a pilot study. Arthritis Care Res 1997; 10(3):163-168.

(82) Meyer GS, Krakauer H. Validity of the Department of Defense Standard Inpatient Data Record for quality management and health services research. Mil Med 1998; 163(7):461-465.

http://www.ggzbeleid.nl/pdfstelsel/vws_bakenszetten.pdf,

Literatuur 338

(83) Simborg DW. DRG creep: a new hospital-acquired disease. N Engl J Med 1981; 304(26):1602-1604.

(84) Weissman JS, Gatsonis C, Epstein AM. Rates of avoidable hospitalization by insurance status in Massachusetts and Maryland. JAMA 1992; 268(17):2388-2394.

(85) Casanova C, Starfield B. Hospitalizations of children and access to primary care: a cross- national comparison. Int J Health Serv 1995; 25(2):283-294.

(86) Pappas G, Hadden WC, Kozak LJ, Fisher GF. Potentially avoidable hospitalizations: inequalities in rates between US socioeconomic groups. Am J Public Health 1997; 87(5):811-816.

(87) Jackson G, Tobias M. Potentially avoidable hospitalisations in New Zealand, 1989-98. Aust N Z J Public Health 2001; 25(3):212-221.

(88) Bindman AB, Grumbach K, Osmond D, Komaromy M, Vranizan K, Lurie N et al. Preventable hospitalizations and access to health care. JAMA 1995; 274(4):305-311.

(89) Begley CE, Slater CH, Engel MJ, Reynolds TF. Avoidable hospitalizations and socio-economic status in Galveston County, Texas. J Community Health 1994; 19(5):377-387.

(90) Djojonegoro BM, Aday LA, Williams AF, Ford CE. Area income as a predictor of preventable hospitalizations in the Harris County Hospital District, Houston. Tex Med 2000; 96(1):58-62.

(91) Parchman ML, Culler S. Primary care physicians and avoidable hospitalizations. J Fam Pract 1994; 39(2):123-128.

(92) Kozak LJ, Hall MJ, Owings MF. Trends in avoidable hospitalizations, 1980-1998. Health Aff (Millwood) 2001; 20(2):225-232.

(93) Glance LG, Dick AW, Osler TM, Mukamel DB. Accuracy of hospital report cards based on administrative data. Health Serv Res 2006; 41(4 Pt 1):1413-1437.

(94) Pilpel D, Fraser GM, Kosecoff J, Brook RH. Validation of a centrally maintained computerized hospital database: comparison with operating room logbooks. Isr J Med Sci 1993; 29(5):287-291.

(95) Fisher ES, Whaley FS, Krushat WM, Malenka DJ, Fleming C, Baron JA et al. The accuracy of Medicare's hospital claims data: progress has been made, but problems remain. Am J Public Health 1992; 82(2):243-248.

(96) Smith CJ, Scott SM, Wagner BM. The necessary role of the autopsy in cardiovascular epidemiology. Hum Pathol 1998; 29(12):1469-1479.

Literatuur

339

(97) Burnand B, Feinstein AR. The role of diagnostic inconsistency in changing rates of occurrence for coronary heart disease. J Clin Epidemiol 1992; 45(9):929-940.

(98) Stehbens WE. The quality of epidemiological data in coronary heart disease and atherosclerosis. J Clin Epidemiol 1993; 46(12):1337-1346.

(99) Kesteloot H, Joossens JV. The quality of epidemiological data on coronary heart disease. J Clin Epidemiol 1995; 48(2):293-295.

(100) Mark DH. Race and the limits of administrative data. JAMA 2001; 285(3):337-338.

(101) Dubois RW, Rogers WH, Moxley JH, Draper D, Brook RH. Hospital inpatient mortality. Is it a predictor of quality? N Engl J Med 1987; 317(26):1674-1680.

(102) Jencks SF, Daley J, Draper D, Thomas N, Lenhart G, Walker J. Interpreting hospital mortality data. The role of clinical risk adjustment. JAMA 1988; 260(24):3611-3616.

(103) Kahn KL, Brook RH, Draper D, Keeler EB, Rubenstein LV, Rogers WH et al. Interpreting hospital mortality data. How can we proceed? JAMA 1988; 260(24):3625-3628.

(104) Shahian DM, Normand SL. The volume-outcome relationship: from Luft to Leapfrog. Ann Thorac Surg 2003; 75(3):1048-1058.

(105) Green J, Wintfeld N, Sharkey P, Passman LJ. The importance of severity of illness in assessing hospital mortality. JAMA 1990; 263(2):241-246.

(106) Merriam-Webster. Medical Dictionary. http://www.intelihealth.com/IH/ihtIH/: Meriam-Webster.; 2002.

(107) U.S.Department of Labour. Occupational Outlook Handbook. 2002-03. ed. http://www.bls.gov/oco/print/ocos103.htm: U.S. Department of Labour. Bureau of Labor Statistics.; 2002.

(108) McGuire MR. Automation of thePatient Medical Record:Steps Toward a Universal Patient Record. 2000. http://www.uprforum.com/Promises.htm.

(109) Holt G, Feurer ID, Schwartz HS. An analysis of concordance among hospital databases and physician records. Ann Surg Oncol 1998; 5(6):553-556.

(110) Wyatt JC, Liu JL. Basic concepts in medical informatics. J Epidemiol Community Health 2002; 56(11):808-812.

http://www.intelihealth.com/IH/ihtIH/:

http://www.bls.gov/oco/print/ocos103.htm:

http://www.uprforum.com/Promises.htm

Literatuur 340

(111) Freedman AM, Gay GA, Brockert JE, Potrzebowski PW, Rothwell CJ. The 1989 revisions of the US Standard Certificates of Live Birth and Death and the US Standard Report of Fetal Death. Am J Public Health 1989; 78(2):168-172.

(112) Petersen LA, Wright S, Normand SL, Daley J. Positive predictive value of the diagnosis of acute myocardial infarction in an administrative database. J Gen Intern Med 1999; 14(9):555-558.

(113) Rosamond WD, Chambless LE, Sorlie PD, Bell EM, Weitzman S, Smith JC et al. Trends in the sensitivity, positive predictive value, false-positive rate, and comparability ratio of hospital discharge diagnosis codes for acute myocardial infarction in four US communities, 1987-2000. Am J Epidemiol 2004; 160(12):1137-1146.

(114) Kennedy GT, Stern MP, Crawford MH. Miscoding of hospital discharges as acute myocardial infarction: implications for surveillance programs aimed at elucidating trends in coronary artery disease. Am J Cardiol 1984; 53(8):1000-1002.

(115) Campbell SE, Campbell MK, Grimshaw JM, Walker AE. A systematic review of discharge coding accuracy. J Public Health Med 2001; 23(3):205-211.

(116) Fleege JC, van Diest PJ, Baak JP. Quality control methods for data entry in pathology using a computerized data management system based on an extended data dictionary. Hum Pathol 1992; 23(2):91-97.

(117) Armitage P, Berry G. Statistical Methods in Medical Research. Third ed. Oxford: Blackwell Science Ltd.; 1994.

(118) Everitt BS. The Cambridge Dictionary of Statistics in the Medical Sciences. Cambridge: University Press; 1995.

(119) Hoaglin DC, Mosteller F, Tukey JW. Exploring Data Tables, Trends and Shapes. New York: John Wiley & Sons; 1985.

(120) Aelvoet W, Humblet PC, Lagasse R. Het in routine gebruikmaken van een geïnformatiseerd controleprogramma als middel tot kwaliteitsbewaking van de statistieken van de burgerlijke stand in Vlaanderen. Arch Public Health 1991; 49:1-17.

(121) Greenland S, Rothman KJ. Fundamentals of Epidemiologic Data Analysis. In: Rothman KJ, Greenland S, editors. Modern Epidemiology. Second ed. Philadelphia: Lippincott Williams & Wilkins; 1998. 201-229.

(122) Pavillon G, Coleman M, Johansson LA, Jougla E, Kardaun J. Coding of Causes of Death in European Community. OS/E3/98/COD/3, 1-180. 1998. Luxembourg, Eurostat.

Literatuur

341

(123) Stellman SD. The case of the missing eights. An object lesson in data quality assurance. Am J Epidemiol 1989; 129(4):857-860.

(124) Molenberghs G, Burzykowski T, Michiels B, Kenward MG. Analysis of incomplete public health data. Rev Epidemiol Sante Publique 1999; 47(6):499-514.

(125) Capet F, Bogaerts K, Aelvoet W. Verwerking Registratiegegevens van het Medisch Schooltoezicht. Lengte en gewicht. 4-5. 1996. Brussel, Ministerie van de Vlaamse Gemeenschap.

(126) Bravo G, Potvin L. Estimating the reliability of continuous measures with Cronbach's alpha or the intraclass correlation coefficient: toward the integration of two traditions. J Clin Epidemiol 1991; 44(4-5):381-390.

(127) Booth JL, Collopy BT. A national clinical indicator database: issues of reliability and validity. Aust Health Rev 1997; 20(4):84-95.

(128) Kleinbaum DG, Kupper LL, Morgenstern H. Validity: General Considerations. In: Kleinbaum DG, Kupper LL, Morgenstern H, editors. Epidemiologic Research.Principles and Quantitative Methods. New York: Van Nostrand Reinhold; 1982. 183-193.

(129) Tennis P, Bombardier C, Malcolm E, Downey W. Validity of rheumatoid arthritis diagnoses listed in the Saskatchewan Hospital Separations Database. J Clin Epidemiol 1993; 46(7):675-683.

(130) WHO. International Classification of Diseases. Tenth Revision. Geneva: World Health Organisation.; 1992.

(131) McKee M. Routine data: a resource for clinical audit? Qual Health Care 1993; 2(2):104-111.

(132) Human, social and economic costs due to non-fatal motor vehicle traffic accidents. An approach based on routinely collected data. [ 2003.

(133) Aelvoet W, Windey F, Molenberghs G, Verstraelen H, Van Reempts P, Foidart JM. Screening for inter-hospital differences in cesarean section rates in low-risk deliveries using administrative data. An initiative to improve the quality of care. BMC Health Services Research 2008;8(1);3.

(134) Haelterman G, Capet F. Kankerregistratie in Vlaanderen. In: Aelvoet W, Bogaerts K, Capet F, Quataert PK, editors. Gezondheidsindicatoren 1995. Brussel: Ministerie van de Vlaamse Gemeenschap; 1997.

(135) Gollub EL, Trino R, Salmon M, Moore L, Dean JL, Davidson BL. Co-occurrence of AIDS and tuberculosis: results of a database "match" and investigation. J Acquir Immune Defic Syndr Hum Retrovirol 1997; 16(1):44-49.

Literatuur 342

(136) Berlowitz DR, Brand HK, Perkins C. Geriatric syndromes as outcome measures of hospital care: can administrative data be used? J Am Geriatr Soc 1999; 47(6):692-696.

(137) Berrino F, Gatta G, Chessa E, Valente F, Capocaccia R. Introduction: the EUROCARE II Study. Eur J Cancer 1998; 34(14 Spec No):2139-2153.

(138) Crabbe T, Donmall M, Millar T. Validation of the University of Manchester Drug Misuse Database. J Epidemiol Community Health 1999; 53(3):159-164.

(139) Hunt JP, Baker CC, Fakhry SM, Rutledge RR, Ransohoff D, Meyer AA. Accuracy of administrative data in trauma. Surgery 1999; 126(2):191-197.

(140) Hsia DC, Ahern CA, Ritchie BP, Moscoe LM, Krushat WM. Medicare reimbursement accuracy under the prospective payment system, 1985 to 1988. JAMA 1992; 268(7):896-899.

(141) Cattaruzzi C, Troncon MG, Agostinis L, Garcia Rodriguez LA. Positive predictive value of ICD-9th codes for upper gastrointestinal bleeding and perforation in the Sistema Informativo Sanitario Regionale database. J Clin Epidemiol 1999; 52(6):499-502.

(142) Cassidy LD, Marsh GM, Holleran MK, Ruhl LS. Methodology to improve data quality from chart review in the managed care setting. Am J Manag Care 2002; 8(9):787-793.

(143) Margo CE. A pilot study in ophthalmology of inter-rater reliability in classifying diagnostic errors: an underinvestigated area of medical error. Qual Saf Health Care 2003; 12(6):416-420.

(144) Korteweg FJ, Gordijn SJ, Timmer A, Erwich JJ, Bergman KA, Bouman K et al. The Tulip classification of perinatal mortality: introduction and multidisciplinary inter-rater agreement. BJOG 2006; 113(4):393-401.

(145) O'donnell CP, Kamlin CO, Davis PG, Carlin JB, Morley CJ. Interobserver variability of the 5-minute Apgar score. J Pediatr 2006; 149(4):486-489.

(146) Hofer TP, Asch SM, Hayward RA, Rubenstein LV, Hogan MM, Adams J et al. Profiling quality of care: Is there a role for peer review? BMC Health Serv Res 2004; 4(1):9.

(147) Lok CE, Morgan CD, Ranganathan N. The accuracy and interobserver agreement in detecting the 'gallop sounds' by cardiac auscultation. Chest 1998; 114(5):1283-1288.

Literatuur

343

(148) Scheel AK, Schmidt WA, Hermann KG, Bruyn GA, D'Agostino MA, Grassi W et al. Interobserver reliability of rheumatologists performing musculoskeletal ultrasonography: results from a EULAR "Train the trainers" course. Ann Rheum Dis 2005; 64(7):1043-1049.

(149) Shibata A, Longacre TA, Puligandla B, Parsonnet J, Habel LA. Histological classification of gastric adenocarcinoma for epidemiological research: concordance between pathologists. Cancer Epidemiol Biomarkers Prev 2001; 10(1):75-78.

(150) Cleary R, Beard RW, Coles J, Devlin HB, Hopkins A, Roberts S et al. The quality of routinely collected maternity data. BJOG 1994; 101(12):1042-1047.

(151) Kuhn K, Gaus W, Wechsler JG, Janowitz P, Tudyka J, Kratzer W et al. Structured reporting of medical findings: evaluation of a system in gastroenterology. Methods Inf Med 1992; 31(4):268-274.

(152) Audet AM, Scott HD. The Uniform Clinical Data Set: an evaluation of the proposed national database for Medicare's quality review program. Ann Intern Med 1993; 119(12):1209-1213.

(153) Gjorup T. The kappa coefficient and the prevalence of a diagnosis. Methods Inf Med 1988; 27(4):184-186.

(154) May SM. Modelling observer agreement--an alternative to kappa. J Clin Epidemiol 1994; 47(11):1315-1324.

(155) Fleiss JL. Statistical Methods for Rates and Proportions. 2nd ed. New York: John Wiley; 1981.

(156) Agresti A. Categorical Data Analysis. New York: John Wiley &Sons.; 1990.

(157) SAS Institute Inc. The FREQ Procedure. SAS/STAT User's Guide, Version 8. Cary NC: Sas Institue Inc.; 1999. 1247-1362.

(158) Weiss NS. Diagnostic and Screening Tests:Measuring Their Ability to Predict Adverse Outcomes of Illness. In: Weiss NS, editor. Clinical Epidemiology:the Study of the Outcome of Illness. New York: Oxford University Press; 1996. 9-46.

(159) Coggon D, Rose G, Barker DJP. Epidemiology for the Uninitiated. Forth ed. http://bmj.com/collections/epidem/epid.shtml: BMJ; 1997.

(160) Rose G, Barker DJP. Epidemiology for the Uninitiated. BMJ; 1986.

(161) Luck J, Peabody JW. Using standardised patients to measure physicians' practice: validation study using audio recordings. BMJ 2002; 325(7366):679.

http://bmj.com/collections/epidem/epid.shtml:

Literatuur 344

(162) Peabody JW, Luck J, Glassman P, Dresselhaus TR, Lee M. Comparison of vignettes, standardized patients, and chart abstraction: a prospective validation study of 3 methods for measuring quality. JAMA 2000; 283(13):1715-1722.

(163) Grover FL, Hammermeister KE, Shroyer AL. Quality initiatives and the power of the database: what they are and how they run. Ann Thorac Surg 1995; 60(5):1514-1521.

(164) Kahn KL, Rubenstein LV, Sherwood MJ, Brook RH. Structured implicit interview for physician implicit measurement of quality of care: development of the form and guidelines for its use. N-3016-HCFA. 1989. http://www.rand.org/publications/N/N3016/, The RAND Corporation.

(165) De Henauw S, de Smet P, Aelvoet W, Kornitzer M, De Backer G. Misclassification of coronary heart disease in mortality statistics. Evidence from the WHO-MONICA Ghent-Charleroi Study in Belgium. J Epidemiol Community Health 1998; 52(8):513-519.

(166) Nieto FJ. Cardiovascular disease and risk factor epidemiology: a look back at the epidemic of the 20th century. Am J Public Health 1999; 89(3):292-294.

(167) Tunstall-Pedoe H, Kuulasmaa K, Amouyel P, Arveiler D, Rajakangas AM, Pajak A. Myocardial infarction and coronary deaths in the World Health Organization MONICA Project. Registration procedures, event rates, and case-fatality rates in 38 populations from 21 countries in four continents. Circulation 1994; 90(1):583-612.

(168) Porta M, Marrugat J, Perez G. Trends in cardiovascular mortality and the quality of vital statistics. J Clin Epidemiol 1997; 50(2):221-222.

(169) Wolff N, Helminiak TW. Nonsampling measurement error in administrative data: implications for economic evaluations. Health Econ 1996; 5(6):501-512.

(170) Biller J, Feinberg WM, Castaldo JE, Whittemore AD, Harbaugh RE, Dempsey RJ et al. Guidelines for carotid endarterectomy: a statement for healthcare professionals from a Special Writing Group of the Stroke Council, American Heart Association. Circulation 1998; 97(5):501-509.

(171) Chaturvedi S, Halliday A. Concerns regarding carotid endarterectomy guidelines. Stroke 1998; 29(7):1475-1476.

(172) Rothwell PM, Eliasziw M, Gutnikov SA, Fox AJ, Taylor DW, Mayberg MR et al. Analysis of pooled data from the randomised controlled trials of endarterectomy for symptomatic carotid stenosis. Lancet 2003; 361(9352):107-116.

(173) Rothwell PM, Eliasziw M. Stenosis and carotid endarterectomy. Lancet 2003; 361(9369):1656.

http://www.rand.org/publications/N/N3016/,

Literatuur

345

(174) Russell DA, McPherson S, Gough MJ. Stenosis and carotid endarterectomy. Lancet 2003; 361(9369):1655.

(175) Robless P, Bicknell C, Chataway J, Cheshire N, Wolfe J. Stenosis and carotid endarterectomy. Lancet 2003; 361(9369):1655.

(176) Roberts SE, Goldacre MJ. Time trends and demography of mortality after fractured neck of femur in an English population, 1968-98: database study. BMJ 2003; 327(7418):771-775.

(177) Iezzoni LI, Davis RB, Palmer RH, Cahalane M, Hamel MB, Mukamal K et al. Does the Complications Screening Program flag cases with process of care problems? Using explicit criteria to judge processes. Int J Qual Health Care 1999; 11(2):107-118.

(178) Mant J, Hicks N. Detecting differences in quality of care: the sensitivity of measures of process and outcome in treating acute myocardial infarction. BMJ 1995; 311(7008):793-796.

(179) To err is human: building a safer health system. Kohn LT, Corrigan JM, Donaldson MS, editors. 1-312. 2000. Washington DC, National Academy Press.

(180) Powell AE, Davies HT, Thomson RG. Using routine comparative data to assess the quality of health care: understanding and avoiding common pitfalls. Qual Saf Health Care 2003; 12(2):122-128.

(181) Rubin HR, Pronovost P, Diette GB. From a process of care to a measure: the development and testing of a quality indicator. Int J Qual Health Care 2001; 13(6):489-496.

(182) Schwartz RM, Gagnon DE, Muri JH, Zhao QR, Kellogg R. Administrative data for quality improvement. Pediatrics 1999; 103(1 Suppl E):291-301.

(183) Goldacre MJ, Griffith M, Gill L, Mackintosh A. In-hospital deaths as fraction of all deaths within 30 days of hospital admission for surgery: analysis of routine statistics. BMJ 2002; 324(7345):1069-1070.

(184) Roberts SE, Goldacre MJ. Case fatality rates after admission to hospital with stroke: linked database study. BMJ 2003; 326(7382):193-194.

(185) Goldacre MJ. Cause-specific mortality: understanding uncertain tips of the disease iceberg. J Epidemiol Community Health 1993; 47(6):491-496.

(186) Shwartz M, Iezzoni LI, Ash AS, Mackiernan YD. Do severity measures explain differences in length of hospital stay? The case of hip fracture. Health Serv Res 1996; 31(4):365-385.

Literatuur 346

(187) Iezzoni LI, Ash AS, Shwartz M, Landon BE, Mackiernan YD. Predicting in-hospital deaths from coronary artery bypass graft surgery. Do different severity measures give different predictions? Med Care 1998; 36(1):28-39.

(188) Iezzoni LI. The risks of risk adjustment. JAMA 1997; 278(19):1600-1607.

(189) Iezzoni LI, Ash AS, Shwartz M, Daley J, Hughes JS, Mackiernan YD. Predicting who dies depends on how severity is measured: implications for evaluating patient outcomes. Ann Intern Med 1995; 123(10):763-770.

(190) Iezzoni LI. How much are we willing to pay for information about quality? Ann Intern Med 1997; 126(5):391-393.

(191) Green J, Wintfeld N. Report cards on cardiac surgeons. Assessing New York State's approach. N Engl J Med 1995; 332(18):1229-1232.

(192) Sowden AJ, Deeks JJ, Sheldon TA. Volume and outcome in coronary artery bypass graft surgery: true association or artefact? BMJ 1995; 311(6998):151-155.

(193) Spiegelhalter DJ. Mortality and volume of cases in paediatric cardiac surgery: retrospective study based on routinely collected data. BMJ 2002; 324(7332):261-263.

(194) ICD-9-CM International Classification of Diseases, 9th Revision, Clinical Modification. Sixth Edition 2005 ed. 2004.

(195) Averill RF, Goldfield N, Steinbeck BA, Grant T, Muldoon J, Brough AJ et al. All Patient Refined Diagnosis Related Groups (APR-DRGs). Version 15.0. 98-054 Rev. 00, 1-34. 1998. Wallingford, CT, 3M Health Information Systems.

(196) Romano PS, Chan BK. Risk-adjusting acute myocardial infarction mortality: are APR- DRGs the right tool? Health Serv Res 2000; 34(7):1469-1489.

(197) Aelvoet W. On the use of administrative databases to support planning activities: a comment. Eur J Public Health 2005; 15(2):215.

(198) Glance LG, Dick AW, Osler TM, Mukamel DB. Does date stamping ICD-9-CM codes increase the value of clinical information in administrative data? Health Serv Res 2006; 41(1):231-251.

(199) Froom P, Shimoni Z. Prediction of hospital mortality rates by admission laboratory tests. Clin Chem 2006; 52(2):325-328.

(200) Bindman AB, Bennett A. Date stamping: will it withstand the test of time? Health Serv Res 2006; 41(4 Pt 1):1438-1443.

Literatuur

347

(201) Legrand V, Wijns W, Vandenbranden F, Benit B, Boland J, Claeys M et al. Recommendations for Percutaneous Coronary Intervention in Belgium. 1-24. 2003. Belgian Working Group on Invasive Cardiology.

(202) Hertoghe L, De Wals P, Piron M, Bertrand F, Lechat MF. Quality of perinatal death registration. A study in Hainaut, Belgium. Eur J Pediatr 1987; 146(5):473-476.

(203) Keirse MJ. Perinatal mortality rates do not contain what they purport to contain. Lancet 1984; 1(8387):1166-1169.

(204) Derom R, Vlietinck R. Beschikbaarheid van perinatale gegvens met het oog op een preventief gezondheidsbeleid. In: Nijs H, Denekens J, editors. Preventieve Gezondheidszorg. Diegem Editorial: Kluwer; 1997. 930-941.

(205) Hansell AL, Walk JA, Soriano JB. What do chronic obstructive pulmonary disease patients die from? A multiple cause coding analysis. Eur Respir J 2003; 22(5):809-814.

(206) Westendorp RG. Dwalingen in de methodologie. VI. Doodsoorzaken in perspectief. [Roaming through methodology. VI. Medical perspective on the causes of death]. Ned Tijdschr Geneeskd 1998; 142(35):1950-1953.

(207) Friedman GD. Primer of Epidemiology. New York: McGraw-Hill Book Company; 1980.

(208) Moolgavkar SH, Lee JAH, Stevens RG. Analysis of Vital Statistics Data. In: Rothman KJ, Greenland S, editors. Modern Epidemiology. Second ed. Philadelphia: Lippincott Williams & Wilkins; 1998. 481-497.

(209) Anonymous. Death certification in asthma. Lancet 1984; 2(8404):676.

(210) Lenfant C, Friedman L, Thom T. Fifty years of death certificates: the Framingham Heart Study. Ann Intern Med 1998; 129(12):1066-1067.

(211) Farebrother MJ, Kelson MC, Heller RF. Death certification of farmer's lung and chronic airway diseases in different countries of the EEC. Br J Dis Chest 1985; 79(4):352-360.

(212) Lu TH, Shau WY, Shih TP, Lee MC, Chou MC, Lin CK. Factors associated with errors in death certificate completion. A national study in Taiwan. J Clin Epidemiol 2001; 54(3):232-238.

(213) Berrill WT. Trends in asthma mortality. Death certification in asthma is inaccurate. BMJ 1997; 315(7114):1013.

(214) Goldacre MJ, Roberts SE, Griffith M. Multiple-cause coding of death from myocardial infarction: population-based study of trends in death certificate data. J Public Health Med 2003; 25(1):69-71.

Literatuur 348

(215) Israel RA, Rosenberg HM, Curtin LR. Analytical potential for multiple cause-of-death data. Am J Epidemiol 1986; 124(2):161-179.

(216) Fries JF. Aging, natural death, and the compression of morbidity. N Engl J Med 1980; 303(3):130-135.

(217) Ayeni O, Banoub SN, Denton CF, Grimley-Evans J, Gore MS, Kalache A et al. Applications de l'épidémiologie à l'étude du vieilissement. Rapport d'un Groupe scientifique de l'OMS à l'étude du viellissement. 706, 1-93. 1984. Genève, OMS. Rapports techniques.

(218) Epstein AM. Volume and outcome--it is time to move ahead. N Engl J Med 2002; 346(15):1161-1164.

(219) Dorn HF, Moriyama IM. Uses and significance of multiple cause tabulations for mortality statistics. Am J Public Health 1964; 54:400-406.

(220) Steenland K, Nowlin S, Ryan B, Adams S. Use of multiple-cause mortality data in epidemiologic analyses: US rate and proportion files developed by the National Institute for Occupational Safety and Health and the National Cancer Institute. Am J Epidemiol 1992; 136(7):855-862.

(221) Mackenbach JP. Secundaire doodsoorzaken. Tijdschrift voor Sociale Gezondheidszorg 1987; 65:524-528.

(222) Mackenbach JP, Kunst AE, Lautenbach H, Bijlsma F, Oei YB. Competing causes of death: an analysis using multiple-cause-of- death data from The Netherlands. Am J Epidemiol 1995; 141(5):466-475.

(223) Mackenbach JP, Kunst AE, Lautenbach H, Oei YB, Bijlsma F. Competing causes of death: a death certificate study. J Clin Epidemiol 1997; 50(10):1069-1077.

(224) Dorn HF. Underlying and Contributory Causes of Death. Natl Cancer Inst Monogr 1966; 19:421-430.

(225) Guralnick L. Some Problems in the Use of Multiple Causes of Death. J Chronic Dis 1966; 19:979-990.

(226) An Alternative Procedure for Classifying and Analizing Mortality Data. LIEGE: International Union for the Scientific Study of Populations; 1973.

(227) Schadé E, Ijzermans CJ. Hoe informeert de huisarts het Centraal Bureau Statistiek over de doodsoorzaak? Tijdschrift voor Sociale Gezondheidszorg 1987; 65(3):74-78.

Literatuur

349

(228) Crews DE, Stamler J, Dyer A. Conditions other than underlying cause of death listed on death certificates provide additional useful information for epidemiologic research. Epidemiology 1991; 2(4):271-275.

(229) Anderson RN, Minino AM, Hoyert DL, Rosenberg HM. Comparability of cause of death between ICD-9 and ICD-10: preliminary estimates. Natl Cancer Inst Monogr 2001; 49(2):1-32.

(230) Llorca J, Delgado-Rodriguez M. Competing risks analysis using Markov chains: impact of cerebrovascular and ischaemic heart disease in cancer mortality. Int J Epidemiol 2001; 30(1):99-101.

(231) WHO. Definitions and Recommandations. In: WHO, editor. International Classification of Diseases. 1975 Revision. 9th Revision. ed. WHO; 1977. 763-768.

(232) WHO. Medical Certification and Rules for Classification. In: WHO, editor. International Classification of Diseases. 1975 Revision. 9th Revision. ed. WHO; 1977. 697-741.

(233) WHO. Rules and guidelines for mortality and morbidity coding. In: WHO, editor. International Statistical Classification of Diseases and Related Health Problems. Tenth Revision. 10th Revision. ed. Geneva: WHO; 1993. 30-123.

(234) Anderson RN, Rosenberg HM. Disease classification: measuring the effect of the Tenth Revision of the International Classification of Diseases on cause- of-death data in the United States. Stat Med 2003; 22(9):1551-1570.

(235) Jougla E, Papoz L, Balkau B, Maguin P, Hatton F. Death certificate coding practices related to diabetes in European countries--the 'EURODIAB Subarea C' Study. Int J Epidemiol 1992; 21(2):343-351.

(236) New approaches to Coding and Analyzing Mortality Data. American Statistical Association; 1972.

(237) Lu TH. Using ACME (Automatic Classification of Medical Entry) software to monitor and improve the quality of cause of death statistics. J Epidemiol Community Health 2003; 57(6):470-471.

(238) Kelson MC, Heller RF. The effect of death certification and coding practices on observed differences in respiratory disease mortality in 8 E.E.C. countries. Rev Epidemiol Sante Publique 1983; 31(4):423-432.

(239) Kelson M, Farebrother M. The effect of inaccuracies in death certification and coding practices in the European Economic Community (EEC) on international cancer mortality statistics. Int J Epidemiol 1987; 16(3):411-414.

Literatuur 350

(240) Heller RF, Kelson MC. Respiratory disease Mortality in Agricultural workers in eight member countries of the European community. Int J Epidemiol 1982; 11(2):170-174.

(241) Percy C, Dolman A. Comparison of the coding of death certificates related to cancer in seven countries. Public Health Rep 1978; 93(4):335-350.

(242) An assessment of the contribution of differences in coding and certification practices to reported levels of avoidable deaths in the European Community. EC Workshop on Health Services on Avoidable Mortality; 1988.

(243) Kircher T, Nelson J, Burdo H. The autopsy as a measure of accuracy of the death certificate. N Engl J Med 1985; 313(20):1263-1269.

(244) Gittelsohn A, Senning J. Studies on the reliability of vital and health records: I. Comparison of cause of death and hospital record diagnoses. Am J Public Health 1979; 69(7):680-689.

(245) Percy C, Stanek E, Gloeckler L. Accuracy of cancer death certificates and its effect on cancer mortality statistics. Am J Public Health 1981; 71(3):242-250.

(246) Feinleib M, editor. Causes of Death Among the Elderly.Information From the Death Certificate. Hyattsville,MD: NCHS; 1991.

(247) Chio A, Magnani C, Oddenino E, Tolardo G, Schiffer D. Accuracy of death certificate diagnosis of amyotrophic lateral sclerosis. J Epidemiol Community Health 1992; 46(5):517-518.

(248) Flanders WD. Inaccuracies of death certificate information. Epidemiology 1992; 3(1):3-5.

(249) Lloyd-Jones DM, Martin DO, Larson MG, Levy D. Accuracy of death certificates for coding coronary heart disease as the cause of death. Ann Intern Med 1998; 129(12):1020-1026.

(250) Lozano R, Murray CJL, Lopez AD, Satoh T. Miscoding and misclassification of ischaemic heart disease mortality. Working Paper No.12, 1-19. 2001. World Health Organisation. Global Programme on Evidence for Health Policy.

(251) Iribarren C, Crow RS, Hannan PJ, Jacobs DR, Luepker RV. Validation of death certificate diagnosis of out-of-hospital sudden cardiac death. Am J Cardiol 1998; 82(1):50-53.

(252) Ederer F, Geisser MS, Mongin SJ, Church TR, Mandel JS. Colorectal cancer deaths as determined by expert committee and from death certificate: a comparison. The Minnesota Study. J Clin Epidemiol 1999; 52(5):447-452.

Literatuur

351

(253) Goldacre MJ, Roberts SE, Yeates D. Mortality after admission to hospital with fractured neck of femur: database study. BMJ 2002; 325(7369):868-869.

(254) Klazinga NS, Stronks K, Delnoij DMJ, Verhoeff A. Indicators without a cause. Reflections on the development and use of indicators in health care from a public health perspective. Int J Qual Health Care 2001; 13(6):433-438.

(255) Gittelsohn A, Powe NR. Small area variations in health care delivery in Maryland. Health Serv Res 1995; 30(2):295-317.

(256) Lubetkin EI, Sofaer S, Gold MR, Berger ML, Murray JF, Teutsch SM. Aligning quality for populations and patients: do we know which way to go? Am J Public Health 2003; 93(3):406-411.

(257) Donabedian A. The quality of care. How can it be assessed? JAMA 1988; 260(12):1743-1748.

(258) Weingart SN, Iezzoni LI, Davis RB, Palmer RH, Cahalane M, Hamel MB et al. Use of administrative data to find substandard care: validation of the complications screening program. Med Care 2000; 38(8):796-806.

(259) Lohr KN, Schroeder SA. A strategy for quality assurance in Medicare. N Engl J Med 1990; 322(10):707-712.

(260) AHRQ. NHQR Preliminary Measure Set. Establish conceptual framework. 2003. http://www.ahcpr.gov/qual/measurix.htm.

(261) Quaethoven P. Over klinische performantie-indicatoren. Acta Hospitalia 2003;(1):87-106.

(262) Public Health Development Unit. Quality and performance in the NHS:Clinical Indicators. 1-90. 1999. http://www.doh.gov.uk/nhsci.pdf, NHS.

(263) Campbell SM, Braspenning J, Hutchinson A, Marshall MN. Research methods used in developing and applying quality indicators in primary care. BMJ 2003; 326(7393):816-819.

(264) Arah OA, Klazinga NS, Delnoij DM, ten Asbroek AH, Custers T. Conceptual frameworks for health systems performance: a quest for effectiveness, quality, and improvement. Int J Qual Health Care 2003; 15(5):377-398.

(265) Donabedian A. The seven Pillars of Quality. Arch Pathol Lab Med 1990; 114:1115-1118.

(266) Brook RH. Managed care is not the problem, quality is. JAMA 1997; 278(19):1612-1614.

http://www.ahcpr.gov/qual/measurix.htm

http://www.doh.gov.uk/nhsci.pdf,

Literatuur 352

(267) Veillard J, Champagne F, Klazinga N, Kazandjian V, Arah OA, Guisset AL. A performance assessment framework for hospitals: the WHO regional office for Europe PATH project. Int J Qual Health Care 2005; 17(6):487-496.

(268) AHRQ. 2005 National Healthcare Quality Report. 06-0018, 1-95. 2005. Rockville, MD.

(269) Pringle M, Wilson T, Grol R. Measuring "goodness" in individuals and healthcare systems. BMJ 2002; 325(7366):704-707.

(270) Fiscella K, Franks P, Gold MR, Clancy CM. Inequality in quality: addressing socioeconomic, racial, and ethnic disparities in health care. JAMA 2000; 283(19):2579-2584.

(271) Shine KI. Health care quality and how to achieve it. Acad Med 2002; 77(1):91-99.

(272) Chassin MR, Galvin RW, National Roundtable on Heath Care Quality. The Urgent Need to Improve Health Care Quality. JAMA 1998; 280(11):1000-1005.

(273) Weiss KB, Wagner R. Performance measurement through audit, feedback, and profiling as tools for improving clinical care. Chest 2000; 118(2 Suppl):53S-58S.

(274) Topol EJ, Califf RM. Scorecard and Cardiovascular Medicine Its Impact and Future Directions. Ann Intern Med 1994; 120(1):65-70.

(275) Localio AR, Hamory BH, Fisher AC, TenHave TR. The Public Release of Hospital and Physician Mortality Data in Pennsylvania A Case Study. Med Care 1997; 35(3):272-286.

(276) Quality of care. Council on Medical Service. JAMA 1986; 256(8):1032-1034.

(277) Jencks SF, Cuerdon T, Burwen DR, Fleming B, Houck PM, Kussmaul AE et al. Quality of medical care delivered to Medicare beneficiaries: A profile at state and national levels. JAMA 2000; 284(13):1670-1676.

(278) Health Care Systems in Transition. Belgium 2000. 1-85. 2000. Copenhagen, European Observatory on Health Car Systems.

(279) Hayward RA, Hofer TP. Estimating hospital deaths due to medical errors: preventability is in the eye of the reviewer. JAMA 2001; 286(4):415-420.

(280) McGlynn EA, Asch SM, Adams J, Keesey J, Hicks J, DeCristofaro A et al. The quality of health care delivered to adults in the United States. N Engl J Med 2003; 348(26):2635-2645.

Literatuur

353

(281) Meyer GS. Building the bridge across the quality chasm. Bulletin of th world Health Organization 2003; 81(5):313.

(282) McLoughlin V, Leatherman S, Fletcher M, Owen JW. Improving performance using indicators. Recent experiences in the United States, the United Kingdom, and Australia. Int J Qual Health Care 2001; 13(6):455-462.

(283) Wu AW. The measure and mismeasure of hospital quality: appropriate risk- adjustment methods in comparing hospitals. Ann Intern Med 1995; 122(2):149-150.

(284) Richardson WC, Berwick DM, Bisgard JC, Bristow LR, Buck CR, Cassel CK et al. The Institute of Medicine Report on Medical Errors: misunderstanding can do harm. Quality of Health Care in America Committee. MedGenMed 2000; 2(3):E42.

(285) Fihn SD. The quest to quantify quality. JAMA 2000; 283(13):1740-1742.

(286) Leyland AH, Boddy FA. League tables and acute myocardial infarction. Lancet 1998; 351(9102):555-558.

(287) Giuffrida A, Gravelle H, Roland M. Measuring quality of care with routine data: avoiding confusion between performance indicators and health outcomes. BMJ 1999; 319(7202):94-98.

(288) Cleary PD, Edgman-Levitan S. Health care quality. Incorporating consumer perspectives. JAMA 1997; 278(19):1608-1612.

(289) Califf RM, Jollis JG, Peterson ED. Operator-Specific Outcomes A Call to Professional Responsibility. Circulation 1996; 93:403-406.

(290) Zhan C, Miller MR. Administrative data based patient safety research: a critical review. Qual Saf Health Care 2003; 12 Suppl 2:ii58-ii63.

(291) Arah OA, Klazinga NS. How safe is the safety paradigm? Qual Saf Health Care 2004; 13(3):226-232.

(292) Bates DW, Evans RS, Murff H, Stetson PD, Pizziferri L, Hripcsak G. Detecting adverse events using information technology. J Am Med Inform Assoc 2003; 10(2):115-128.

(293) Begrippenkader Patientveiligheid. 2005. http://www.onderzoekpatientveiligheid.nl/begrippenkader.htm

(294) Hammermeister KE, Shroyer AL, Sethi GK, Grover FL. Why it is important to demonstrate linkages between outcomes of care and processes and structures of care. Med Care 1995; 33(10 Suppl):OS5-O16.

http://www.onderzoekpatientveiligheid.nl/begrippenkader.htm

Literatuur 354

(295) Mainz J. Defining and classifying clinical indicators for quality improvement. Int J Qual Health Care 2003; 15(6):523-530.

(296) Kuttner R. The risk-adjustment debate. N Engl J Med 1998; 339(26):1952-1956.

(297) Brook RH, McGlynn EA, Cleary PD. Quality of health care. Part 2: measuring quality of care. N Engl J Med 1996; 335(13):966-970.

(298) Tu JV, Cameron C. Impact of an acute myocardial infarction report card in Ontario, Canada. Int J Qual Health Care 2003; 15(2):131-137.

(299) Palmer RH. Using health outcomes data to compare plans, networks and providers. Int J Qual Health Care 1998; 10(6):477-483.

(300) Rubin HR, Pronovost P, Diette GB. The advantages and disadvantages of process-based measures of health care quality. Int J Qual Health Care 2001; 13(6):469-474.

(301) Jollis JG, Romano PS. Pennsylvania's Focus on Heart Attack--grading the scorecard. N Engl J Med 1998; 338(14):983-987.

(302) Begg CB, Cramer LD, Hoskins WJ, Brennan MF. Impact of hospital volume on operative mortality for major cancer surgery. JAMA 1998; 280(20):1747-1751.

(303) Hannan EL, Siu AL, Kumar D, Kilburn H, Chassin MR. The decline in coronary artery bypass graft surgery mortality in New York State. The role of surgeon volume. JAMA 1995; 273(3):209-213.

(304) Dudley RA, Johansen KL, Brand R, Rennie DJ, Milstein A. Selective referral to high-volume hospitals: estimating potentially avoidable deaths. JAMA 2000; 283(9):1159-1166.

(305) Wennberg DE, Lucas FL, Birkmeyer JD, Bredenberg CE, Fisher ES. Variation in carotid endarterectomy mortality in the Medicare population: trial hospitals, volume, and patient characteristics. JAMA 1998; 279(16):1278-1281.

(306) Luft HS, Hunt SS, Maerki SC. The volume-outcome relationship: practice-makes-perfect or selective-referral patterns? Health Serv Res 1987; 22(2):157-182.

(307) Hannan EL, Racz M, Ryan TJ, McCallister BD, Johnson LW, Arani DT et al. Coronary angioplasty volume-outcome relationships for hospitals and cardiologists. JAMA 1997; 277(11):892-898.

(308) Cebul RD, Snow RJ, Pine R, Hertzer NR, Norris DG. Indications, outcomes, and provider volumes for carotid endarterectomy. JAMA 1998; 279(16):1282-1287.

Literatuur

355

(309) Luft HS, Garnick DW, Mark DH, Peltzman DJ, Phibbs CS, Lichtenberg E et al. Does quality influence choice of hospital? JAMA 1990; 263(21):2899-2906.

(310) Birkmeyer JD, Siewers AE, Finlayson EV, Stukel TA, Lucas FL, Batista I et al. Hospital volume and surgical mortality in the United States. N Engl J Med 2002; 346(15):1128-1137.

(311) Begg CB, Riedel ER, Bach PB, Kattan MW, Schrag D, Warren JL et al. Variations in morbidity after radical prostatectomy. N Engl J Med 2002; 346(15):1138-1144.

(312) Halm EA, Chassin MR. Appendix C. How is volume related to quality in health care? A systematic review of the research literature. In: Hewitt M, editor. Interpreting the Volume-Outcome Relationship in the Context of Health care Quality: Workshop Summary. Washington,DC: National Academy Press; 2000. 27-102.

(313) Localio AR, Hamory BH, Sharp TJ, Weaver SL, TenHave TR, Landis JR. Comparing hospital mortality in adult patients with pneumonia. A case study of statistical methods in a managed care program. Ann Intern Med 1995; 122(2):125-132.

(314) Showstack JA, Rosenfeld KE, Garnick DW, Luft HS, Schaffarzick RW, Fowles J. Association of volume with outcome of coronary artery bypass graft surgery. Scheduled vs nonscheduled operations. JAMA 1987; 257(6):785-789.

(315) Pennsylvania Health Care Cost Containment Council. Focus on Heart Attack in Southeastern Pennsylvania. A 1993 Summary Report for Health Benefits Purchasers, Health Care Providers, Policy-makers and Consumers. 1-75. 1996. http://www.phc4.org/adobe/h_se.pdf.

(316) Orchard C. Comparing healthcare outcomes. BMJ 1994; 308(6942):1493-1496.

(317) Jarman B, Gault S, Alves B, Hider A, Dolan S, Cook A et al. Explaining differences in English hospital death rates using routinely collected data. BMJ 1999; 318(7197):1515-1520.

(318) Stark J, Gallivan S, Lovegrove J, Hamilton JR, Monro JL, Pollock JC et al. Mortality rates after surgery for congenital heart defects in children and surgeons' performance. Lancet 2000; 355(9208):1004-1007.

(319) Park RE, Brook RH, Kosecoff J, Keesey J, Rubenstein L, Keeler E et al. Explaining variations in hospital death rates. Randomness, severity of illness, quality of care. JAMA 1990; 264(4):484-490.

(320) Interpreting the Volume-Outcome Relationship in the Context of Health Care Quality: Workshop Summary. Washington,DC: National Academy Press; 2000.

http://www.phc4.org/adobe/h_se.pdf

Literatuur 356

(321) Goldfarb MG, Coffey RM. Change in the Medicare case-mix index in the 1980s and the effect of the prospective payment system. Health Serv Res 1992; 27(3):385-415.

(322) Majeed A, Bindman AB, Weiner JP. Use of risk adjustment in setting budgets and measuring performance in primary care II: advantages, disadvantages, and practicalities. BMJ 2001; 323(7313):607-610.

(323) Greenfield S, Aronow HU, Elashoff RM, Watanabe D. Flaws in mortality data. The hazards of ignoring comorbid disease. JAMA 1988; 260(15):2253-2255.

(324) Elixhauser A, Steiner C, Harris DR, Coffey RM. Comorbidity measures for use with administrative data. Med Care 1998; 36(1):8-27.

(325) D'Hoore W, Sicotte C, Tilquin C. Risk adjustment in outcome assessment: the Charlson comorbidity index. Methods Inf Med 1993; 32(5):382-387.

(326) D'Hoore W, Bouckaert A, Tilquin C. Practical considerations on the use of the Charlson comorbidity index with administrative data bases. J Clin Epidemiol 1996; 49(12):1429-1433.

(327) Stukenborg GJ, Wagner DP, Connors_ AF. Comparison of the performance of two comorbidity measures, with and without information from prior hospitalizations. Med Care 2001; 39(7):727-739.

(328) Cleary R, Beard R, Coles J, Devlin B, Hopkins A, Schumacher D et al. Comparative hospital databases: value for management and quality. Qual Health Care 1994; 3(1):3-10.

(329) Hofer TP, Hayward RA, Greenfield S, Wagner EH, Kaplan SH, Manning WG. The unreliability of individual physician "report cards" for assessing the costs and quality of care of a chronic disease. JAMA 1999; 281(22):2098-2105.

(330) Luft HS, Bunker JP, Enthoven AC. Should operations be regionalized? The empirical relation between surgical volume and mortality. N Engl J Med 1979; 301(25):1364-1369.

(331) Hartz AJ, Krakauer H, Kuhn EM, Young M, Jacobsen SJ, Gay G et al. Hospital characteristics and mortality rates. N Engl J Med 1989; 321(25):1720-1725.

(332) Mozes B, Easterling MJ, Sheiner LB, Melmon KL, Kline R, Goldman ES et al. Case-mix adjustment using objective measures of severity: the case for laboratory data. Health Serv Res 1994; 28(6):689-712.

(333) Pine M, Norusis M, Jones B, Rosenthal GE. Predictions of hospital mortality rates: a comparison of data sources. Ann Intern Med 1997; 126(5):347-354.

Literatuur

357

(334) Welton JM, Halloran EJ. A comparison of nursing and medical diagnoses in predicting hospital outcomes. Proc AMIA Symp 1999;171-175.

(335) Long LE, Mann R. Casemix: challenges for nursing care. Med J Aust 1998; 169 Suppl:S44-S45.

(336) Hsia DC, Krushat WM, Fagan AB, Tebbutt JA, Kusserow RP. Accuracy of diagnostic coding for Medicare patients under the prospective-payment system. N Engl J Med 1988; 318(6):352-355.

(337) Stern RS, Epstein AM. Institutional responses to prospective payment based on diagnosis-related groups. Implications for cost, quality, and access. N Engl J Med 1985; 312(10):621-627.

(338) Lungen M, Lauterbach KW. [Upcoding--a risk for the use of diagnosis-related groups]. Dtsch Med Wochenschr 2000; 125(28-29):852-856.

(339) Carr-Hill RA, Jamison JQ, O Reilly D, Stevenson MR, Reid J, Merriman B. Risk adjustment for hospital use using social security data: cross sectional small area analysis. BMJ 2002; 324(7334):390.

(340) Elliott MN, Swartz R, Adams J, Spritzer KL, Hays RD. Case-mix adjustment of the National CAHPS benchmarking data 1.0: a violation of model assumptions? Health Serv Res 2001; 36(3):555-573.

(341) Steyerberg EW, Harrell FEJr. Statistical Models for Prognostication. Development of Regression Models. In: Max MB, Lynn J, editors. Interactive Textbook of Symptom Research. Bethesda MD: National Institute of Dental Research, Department of Health and Human Services.http://symptomresearch.nih.gov; 2003. 1-12.

(342) DeLong ER, Peterson ED, DeLong DM, Muhlbaier LH, Hackett S, Mark DB. Comparing Risk-Adjustment Methods for Provider Profiling. Stat Med 1997; 16:2645-2664.

(343) Iezzoni LI, Ash AS, Shwartz M, Daley J, Hughes JS, Mackiernan YD. Judging hospitals by severity-adjusted mortality rates: the influence of the severity-adjustment method. Am J Public Health 1996; 86(10):1379-1387.

(344) Schneider EC, Epstein AM. Influence of cardiac-surgery performance reports on referral practices and access to care. A survey of cardiovascular specialists. N Engl J Med 1996; 335(4):251-256.

(345) Mainz J. Developing evidence-based clinical indicators: a state of the art methods primer. Int J Qual Health Care 2003; 15 Suppl 1:i5-11.

http://symptomresearch.nih.gov/

Literatuur 358

(346) Caminal J, Starfield B, Sanchez E, Casanova C, Morales M. The role of primary care in preventing ambulatory care sensitive conditions. Eur J Public Health 2004; 14(3):246-251.

(347) Smeets PM, Verheggen FW, Pop P, Panis LJ, Carpay JJ. Assessing the necessity of hospital stay by means of the appropriateness evaluation protocol: how strong is the evidence to proceed? Int J Qual Health Care 2000; 12(6):483-493.

(348) Hofer TP, Kerr EA, Hayward RA. What is an error? Eff Clin Pract 2000; 3(6):261-269.

(349) Hofer TP, Asch SM, Hayward RA, Rubenstein LV, Adams J, Kerr EA. Profiling quality of care: Is there a role for peer review? BMC Health Services Research 2004; 4(1):9.

(350) Brennan TA, Leape LL, Laird NM, Hebert L, Localio AR, Lawthers AG et al. Incidence of adverse events and negligence in hospitalized patients. Results of the Harvard Medical Practice Study I. N Engl J Med 1991; 324(6):370-376.

(351) Wilson RM, Harrison BT, Gibberd RW, Hamilton JD. An analysis of the causes of adverse events from the Quality in Australian Health Care Study. Med J Aust 1999; 170(9):411-415.

(352) Leape LL. Institute of Medicine medical error figures are not exaggerated. JAMA 2000; 284(1):95-97.

(353) Hannan EL, O'Donnell JF, Kilburn H, Bernard HR, Yazici A. Investigation of the relationship between volume and mortality for surgical procedures performed in New York State hospitals. JAMA 1989; 262(4):503-510.

(354) Chassin MR, Hannan EL, DeBuono BA. Benefits and hazards of reporting medical outcomes publicly. N Engl J Med 1996; 334(6):394-398.

(355) Halm EA, Lee C, Chassin MR. Is volume related to outcome in health care? A systematic review and methodologic critique of the literature. Ann Intern Med 2002; 137(6):511-520.

(356) Urbach DR, Bell CM, Austin PC. Differences in operative mortality between high- and low-volume hospitals in Ontario for 5 major surgical procedures: estimating the number of lives potentially saved through regionalization. CMAJ 2003; 168(11):1409-1414.

(357) Urbach DR, Baxter NN. Does it matter what a hospital is "high volume" for? Specificity of hospital volume-outcome associations for surgical procedures: analysis of administrative data. BMJ 2004; 328(7442):737-740.

(358) Sibbald B. Move to close low-volume surgical sites gaining speed. CMAJ 2002; 167(2):177.

Literatuur

359

(359) Shroyer AL, Marshall G, Warner BA, Johnson RR, Guo W, Grover FL et al. No continuous relationship between Veterans Affairs hospital coronary artery bypass grafting surgical volume and operative mortality. Ann Thorac Surg 1996; 61(1):17-20.

(360) Tucker J. Patient volume, staffing, and workload in relation to risk- adjusted outcomes in a random stratified sample of UK neonatal intensive care units: a prospective evaluation. Lancet 2002; 359(9301):99-107.

(361) Benavente O, Moher D, Pham B. Carotid endarterectomy for asymptomatic carotid stenosis: a meta- analysis. BMJ 1998; 317(7171):1477-1480.

(362) Warlow C. Carotid endarterectomy for asymptomatic carotid stenosis. Better data, but the case is still not convincing. BMJ 1998; 317(7171):1468.

(363) Barnett HJ, Meldrum HE, Eliasziw M. The appropriate use of carotid endarterectomy. CMAJ 2002; 166(9):1169-1179.

(364) Wennberg DE. Variation in the delivery of health care: the stakes are high. Ann Intern Med 1998; 128(10):866-868.

(365) Pekoz EA, Shwartz M, Iezzoni LI, Ash AS, Posner MA, Restuccia JD. Comparing the importance of disease rate versus practice style variations in explaining differences in small area hospitalization rates for two respiratory conditions. Stat Med 2003; 22(10):1775-1786.

(366) Jencks SF, Williams DK, Kay TL. Assessing hospital-associated deaths from discharge data. The role of length of stay and comorbidities. JAMA 1988; 260(15):2240-2246.

(367) Rosenthal GE, Baker DW, Norris DG, Way LE, Harper DL, Snow RJ. Relationships between in-hospital and 30-day standardized hospital mortality: implications for profiling hospitals. Health Serv Res 2000; 34(7):1449-1468.

(368) Taylor B. Common bile duct injury during laparoscopic cholecystectomy in Ontario: does ICD-9 coding indicate true incidence? CMAJ 1998; 158(4):481-485.

(369) Chang A, Schyve PM, Croteau RJ, O'Leary DS, Loeb JM. The JCAHO patient safety event taxonomy: a standardized terminology and classification schema for near misses and adverse events. Int J Qual Health Care 2005; 17(2):95-105.

(370) Walshe K. Adverse events in health care: issues in measurement. Qual Health Care 2000; 9:47-52.

(371) Michel P, Quenon JL, de_Sarasqueta AM, Scemama O. Comparison of three methods for estimating rates of adverse events and rates of preventable adverse events in acute care hospitals. BMJ 2004; 328(7433):199.

Literatuur 360

(372) Leape LL, Brennan TA, Laird N, Lawthers AG, Localio AR, Barnes BA et al. The nature of adverse events in hospitalized patients. Results of the Harvard Medical Practice Study II. N Engl J Med 1991; 324(6):377-384.

(373) Thomas EJ, Brennan TA. Incidence and types of preventable adverse events in elderly patients: population based review of medical records. BMJ 2000; 320(7237):741-744.

(374) Sox_Jr HC, Woloshin S. How many deaths are due to medical error? Getting the number right. Eff Clin Pract 2004; 3(6):277-283.

(375) McDonald CJ, Weiner M, Hui SL. Deaths due to medical errors are exaggerated in Institute of Medicine report. JAMA 2000; 284(1):93-95.

(376) Anderson RE. How many deaths are due to medical errors? JAMA 2000; 284(17):2188; author reply 2.

(377) Hayward RA. Counting deaths due to medical errors. JAMA 2002; 288(19):2404-5; author reply 2405.

(378) McDonald CJ, Weiner M, Siu AL. How many deaths are due to medical errors? JAMA 2000; 284(17):2188; author reply 2-2189; author reply 2.

(379) Leape LL. Counting deaths due to medical errors. JAMA 2002; 288(19):2405; author reply 2.

(380) Barach P, Mohr JJ. Preventable deaths from medical errors. JAMA 2001; 286(22):2813-2814.

(381) Hayward RA, Hofer TP. Preventable deaths from medical errors. In reply. JAMA 2001; 286(22):2814.

(382) Hughes CM. How many deaths are due to medical errors? JAMA 2000; 284(17):2187; author reply 2.

(383) Gabel RA. Counting deaths due to medical errors. JAMA 2002; 288(19):2404; author reply 2.

(384) Honig P, Phillips J, Woodcock J. How many deaths are due to medical errors? JAMA 2000; 284(17):2187-8; author reply 2188.

(385) Pierluissi E, Fischer MA, Campbell AR, Landefeld CS. Discussion of medical errors in morbidity and mortality conferences. JAMA 2003; 290(21):2838-2842.

(386) Brennan TA, Hebert LE, Laird NM, Lawthers A, Thorpe KE, Leape LL et al. Hospital characteristics associated with adverse events and substandard care. JAMA 1991; 265(24):3265-3269.

Literatuur

361

(387) Weingart SN, Wilson RM, Gibberd RW, Harrison B. Epidemiology of medical error. BMJ 2000; 320(7237):774-777.

(388) Spear SJ, Schmidhofer M. Ambiguity and workarounds as contributors to medical error. Ann Intern Med 2005; 142(8):627-630.

(389) Romano PS, Geppert JJ, Davies S, Miller MR, Elixhauser A, McDonald KM. A national profile of patient safety in U.S. hospitals. Health Aff (Millwood ) 2003; 22(2):154-166.

(390) Bates DW, Evans RS, Murff H, Stetson PD, Pizziferri L, Hripcsak G. Policy and the future of adverse event detection using information technology. J Am Med Inform Assoc 2003; 10(2):226-228.

(391) Pawlson LG, O'Kane ME. Malpractice prevention, patient safety, and quality of care: a critical linkage. Am J Manag Care 2004; 10(4):281-284.

(392) Shahian DM, Normand SL, Torchiana DF, Lewis SM, Pastore JO, Kuntz RE et al. Cardiac Surgery Report Cards: Comprehensive Review and Statistical Critique. Ann Thorac Surg 2001; 72:2155-2168.

(393) Berwick DM. Public Performance Reports and the Will for Change. JAMA 2002; 288(12):1523-1524.

(394) Adab P, Rouse AM, Mohammed MA, Marshall T. Performance league tables: the NHS deserves better. BMJ 2002; 324(7329):95-98.

(395) Sanderson C, McKee M. Commentary: How robust are rankings? The implications of confidence intervals. BMJ 1998; 316:1705.

(396) Marshall EC, Spiegelhalter DJ. Reliability of league tables of in vitro fertilisation clinics: retrospective analysis of live birth rates. BMJ 1998; 316(7146):1701-4; discussion 1705.

(397) Marshall MN, Shekelle PG, Leatherman S, Brook RH. The public release of performance data: what do we expect to gain? A review of the evidence. JAMA 2000; 283(14):1866-1874.

(398) Hibbard JH, Slovic P, Peters E, Finucane ML. Strategies for reporting health plan performance information to consumers: evidence from controlled studies. Health Serv Res 2002; 37(2):291-313.

(399) Wakefield JC, Best NG, Waller L. Bayesian approaches to disease mapping. In: Elliott P, Wakefield JC, Best NG, Briggs DJ, editors. Spatial Epidemiology: Methods and Applications. Oxford: Oxford University Press; 2000. 104-127.

(400) Marshall MN, Shekelle PG, Leatherman S, Brook RH. The public disclosure of performance data: learning from the US experience. Qual Health Care 2000; 9:53-57.

Literatuur 362

(401) Bronskill SE, Normand SL, Landrum MB, Rosenheck RA. Longitudinal profiles of health care providers. Stat Med 2002;(21):1067-1088.

(402) Schneider EC, Lieberman T. Publicly disclosed information about the quality of health care: response of the US public. Qual Health Care 2001; 10:96-103.

(403) Howley PP, Gibberd R. Using hierarchical models to analyse clinical indicators: a comparison of the gamma-Poisson and beta-binomial models. Int J Qual Health Care 2003; 15(4):319-329.

(404) McCormick D, Himmelstein DU, Woolhandler S, Bor DH, Wolfe SM. Relationship Between Low Quality-of-Care Scores and HMOs' Subsequent Public Disclosure of Quality-of-Care Scores. JAMA 2002; 288(12):1484-1490.

(405) Epstein A. Performance reports on quality--prototypes, problems, and prospects. N Engl J Med 1995; 333(1):57-61.

(406) McCormick D, Himmelstein DU, Woolhandler S, Bor DH, Wolfe SM. Public disclosure of health plan quality of care. JAMA 2003; 289(7):845-847.

(407) McKee M. Indicators of clinical performance. BMJ 1997; 315(7101):142.

(408) Ravaud P, Giraudeau B, Roux PM, Durieux P. [Are mortality indicators acceptable indicators for the quality of health care?]. Presse Med 1999; 28(29):1604-1609.

(409) Naylor CD. Public Profiling of Clinical Performance. JAMA 2002; 287(10):1323-1325.

(410) Peterson ED, DeLong ER, Jollis JG, Muhlbaier LH, Mark DB. The Effects of New York's Bypass Surgery Provider Profiling on Access to Care and Patient Outcomes in the Elderly. J Am Coll Cardiol 1998; 32:993-999.

(411) Kassirer JP. The use and abuse of practice profiles. N Engl J Med 1994; 330(9):634-636.

(412) Jones RH. In Search of the Optimal Surgical Mortality. Circulation 1989; 79(Suppl I):I-132-I-136.

(413) Schokkaert E, Van de Voorde C. Belgium: Risk adjustment and financial responsibility in a centralised system. Health Policy 2003; 65(1):5-19.

(414) Pennsylvania Health Care Cost Containment Council. Focus on Heart Attack in Pennsylvania. Research Methods and Results. 1-36. 1996. http://www.phc4.org/adobe/fhrrm.pdf.

http://www.phc4.org/adobe/fhrrm.pdf

Literatuur

363

(415) Hibbard JH, Jewett JJ, Engelmann S, Tusler M. Can Medicare Beneficiaries Make Informed Choices? Health Aff (Millwood) 1998; 17(6):181-193.

(416) Mannion R, Goddard M. Impact of published clinical outcomes data: case study in NHS hospital trusts. BMJ 2001; 323(7307):260-263.

(417) Ryan TP. Control Charts for Measurements with Subgrouping (for One Variable). In: Ryan TP, editor. Statistical Methods for Quality Improvement. New York: John Wiley & Sons; 2000. 77-132.

(418) Johnson RA, Wichern DW. Applied Multivariate Statistical Analysis. Upper Saddle River, NJ: Prentice Hall; 1998.

(419) Tekkis PP, McCulloch P, Steger AC, Benjamin IS, Poloniecki JD. Mortality control charts for comparing performance of surgical units: validation study using hospital mortality data. BMJ 2003; 326(7393):786-788.

(420) Mohammed MA, Cheng KK, Rouse A, Marshall T. Bristol, Shipman, and clinical governance: Shewhart's forgotten lessons. Lancet 2001; 357(9254):463-467.

(421) Ryan TP. Control Charts for Attributes. In: Ryan TP, editor. Statistical Methods for Quality Improvement. New York: John Wiley & Sons; 2000. 152-185.

(422) Hoey J, Todkill AM, Flegel K. What's in a name? Reporting data from public institutions. CMAJ 2002; 166(2):193-194.

(423) Christiansen CL, Morris CN. Improving the Statistical Approach to Health Care Provider Profiling. Ann Intern Med 1997;(127):764-768.

(424) Brook RH. Appropriateness: the next frontier. BMJ 1994; 308(6923):218-219.

(425) Aylin P, Alves B, Best N, Cook A, Elliott P, Evans SJ et al. Comparison of UK paediatric cardiac surgical performance by analysis of routinely collected data 1984-96: was Bristol an outlier? Lancet 2001; 358(9277):181-187.

(426) Walshe K. Understanding and learning from organisational failure. Qual Saf Health Care 2003; 12:81-82.

(427) Littell RC, Freund RJ, Spector PC. Repeated-Measures Analysis of Variance. SAS® System for Linear Models. Third ed. Cary,NC: SAS® Institute Inc.; 1991. 265-291.

(428) Verbeke G, Molenberghs G. Linear Mixed Models in Practice: A Sas-oriented Approach. New York: Springer-verlag.; 1997.

(429) Molenberghs G, Verbeke G. Generalized Estimating Equations. Longitudinal data analysis. Diepenbeek: Limburgs Universitair Centrum; 2002. 336-363.

Literatuur 364

(430) Burton P, Gurrin L, Sly P. Extending the simple linear regression model to account for correlated responses: an introduction to generalized estimating equations and multi-level mixed modelling. Stat Med 1998; 17(11):1261-1291.

(431) Stokes ME, Davis CS, Koch GG. Generalized Estimating Equations. Categorical Data Analysis Using the SAS System. Second ed. Cary, NC: SAS Institute Inc., 2000. 469-549.

(432) Armitage P, Berry G. Comparison of Several Groups. Statistical Methods in Medical Research. Oxford: 1994. 207-237.

(433) Neter J, Wasserman W, Kutner MH. Single-factor ANOVA Model and Tests. In: Neter J, Wasserman W, Kutner MH, editors. Applied Linear Statistical Models Regression, Analysis of Variance and Experimental Designs. Third ed. Homewood,IL: IRWIN; 1990. 519-567.

(434) Verbeke G, Molenberghs G. Linear Mixed Models for Longitudinal Data. New York: Springer-verlag.; 2000.

(435) Molenberghs G, Verbeke G. Models for Discrete Longitudinal Data. New York: Springer-verlag.; 2005.

(436) Rosenthal R, Rosnow RL. Contrast analysis: Focused comparisons in the analysis of variance. New York: Cambridge University Press; 1985.

(437) Johnson RA, Wichern DW. Inferences about a Mean Vector. Applied Multivariate Statistical Analysis. Upper Saddle River, NJ: Prentice Hall; 1998. 224-289.

(438) Armitage P, Berry G. Multiple Measurements. Statistical Methods in Medical Research. Third ed. Oxford: Blackwell Science Ltd.; 1994. 312-385.

(439) Soudan M. Détection de Valeurs Aberrantes dans les Données Administratives à Variables Multiples Obtenues par Extrapolation, dans le Cadre de la Comptabilité Nationale Belge. CES/AC.68/2002/10, 1-10. 18-2-2002. Genève, Réunion commune CEE/Eurostat/OCDE sur la comptabilité nationale. 18-2-2002.

(440) Friendly M. Multivariate Statistical Methods. SAS System for Statistical Graphics. First ed. SAS Institute Inc., Cary,NC,USA; 1991. 447-498.

(441) Hosmer DW, Lemeshow S. Introduction to the Logistic Regression Model. In: Hosmer DW, Lemeshow S, editors. Applied Logistic Regression. 2nd ed. New York: John Wiley & Sons, INC.; 2000. 1-30.

Literatuur

365

(442) Hosmer DW, Lemeshow S. Interpretation of the Fitted Logistic Regression Model. In: Hosmer DW, Lemeshow S, editors. Applied Logistic Regression. 2nd ed. New York: John Wiley & Sons, INC.; 2000. 47-90.

(443) Collett D. Overdispersion. In: Collett D, editor. Modelling binary data. Boca Raton: Chapman & Hall/CRC; 1991. 188-222.

(444) Allison PD. Logit Analysis of Contingency Tables. In: Allison PD, editor. Logistic Regression Using the SAS System: Theory and Application. Cary, NC: SAS Institute Inc., 1999. 81-110.

(445) SAS Institute Inc. The GLM Procedure. SAS/STAT User's Guide, Version 8. Cary NC: Sas Institue Inc.; 1999. 1465-1636.

(446) SAS Institute Inc. The LOGISITC Procedure. SAS/STAT User's Guide, Version 8. Cary NC: Sas Institue Inc.; 1999. 1901-2042.

(447) SAS Institute Inc. The GENMOD Procedure. SAS/STAT User's Guide, Version 8. Cary NC: Sas Institue Inc.; 1999. 1363-1464.

(448) Breslow NE, Day NE. Unconditional Logistic Regression for Large Strata. Lyon: IARC; 1980. 191-246.

(449) Bland JM, Altman DG. Statistics notes. The odds ratio. BMJ 2000; 320(7247):1468.

(450) Armitage P, Berry G. Sampling. Statistical Methods in Medical Research. Third ed. Oxford: Blackwell Science Ltd.; 1994. 78-92.

(451) Fleiss JL. Inferences about a Single Proportion. Statistical Methods for Rates and Proportions. 2nd ed. New York: John Wiley; 1981. 13-17.

(452) Zaslavsky AM. Statistical issues in reporting quality data: small samples and casemix variation. Int J Qual Health Care 2001; 13(6):481-488.

(453) Clayton D, Hills M. The size of investigations. In: Clayton D, Hills M, editors. Statistical Models in Epidemiology. Oxford: Oxford University Press; 1993. 205-213.

(454) Breslow NE, Day NE. Statistical Methods in Cancer Research. Volume II - The Design and Analysis of Cohort Studies. 1-406. 1987. Lyon, IARC. IARC Scientific Publications No. 82.

(455) Marshall G, Shroyer AL, Grover FL, Hammermeister KE. Time series monitors of outcomes. A new dimension for measuring quality of care. Med Care 1998; 36(3):348-356.

Literatuur 366

(456) Wears RL. Performance charts and multiple comparisons. BMJ 2002; bmj.com/cgi/eletters.

(457) Clement S. Scorecard Medicine -- Measuring Process and Outcome. Ann Intern Med 1994; 120(11):971-972.

(458) Diggle PJ. Overview of statistical methods for disease mapping and its relationship to cluster detection. In: Elliott P, Wakefield JC, Best NG, Briggs DJ, editors. Spatial Epidemiology: Methods and Applications. Oxford: Oxford University Press; 2000. 87-103.

(459) Burgess JF, Christiansen CL, Michalak SE, Morris CN. Medical profiling: improving standards and risk adjustments using hierarchical models. J Health Econ 2000;(19):291-309.

(460) Altman DG, Machin D, Bryant TN, Gardner MJ. Statistics with Confidence. Bristol: BMJ Books; 2000.

(461) Luft HS, Brown BWJr. Calculating the Probability of Rare Events: Why Settle for an Approximation? Health Serv Res 1993; 28(4):419-439.

(462) Bland JM, Altman DG. Statistics Notes: Regression towards the mean. BMJ 1994; 308(6942):1499.

(463) Barnett AG, van der Pols JC, Dobson AJ. Regression to the mean: what it is and how to deal with it. Int J Epidemiol 2005; 34(1):215-220.

(464) Bland JM. Regression towards the mean or Why was Terminator III such a disappointment?1-1-2004.

(465) Morton V, Torgerson DJ. Effect of regression to the mean on decision making in health care. BMJ 2003; 326(7398):1083-1084.

(466) Bland JM, Altman DG. Some examples of regression towards the mean. BMJ 1994; 309(6957):780.

(467) Rice N. Binomial Regression. In: Leyland AH, Goldstein H, editors. Multilevel Modelling of Health Statistics. Chichester: John Wiley & Sons, LTD; 2001. 27-43.

(468) Normand SL, Zou KH. Sample size considerations in observational health care quality studies. Stat Med 2002; 21:331-345.

(469) Drijver M, Melse JM. Ziekteclusters en milieuverontreiniging II Inventarisatie van statistische methoden en achtergronden van clusteronderzoek. T Soc Gezondheidsz 1992; 70:624-630.

Literatuur

367

(470) Savitz DA, Olshan AF. Multiple comparisons and related issues in the interpretation of epidemiologic data. Am J Epidemiol 1995; 142(9):904-908.

(471) Goodman SN. Multiple comparisons, explained. Am J Epidemiol 1998; 147(9):807-12; discussion 815.

(472) Thompson JR. Invited commentary: Re: "Multiple comparisons and related issues in the interpretation of epidemiologic data". Am J Epidemiol 1998; 147(9):801-806.

(473) Rothman KJ. Fundamentals of Epidemiologic Data Analysis. In: Rothman KJ, editor. Modern Epidemiology. Boston: Little, Brown and Company; 1986. 131-151.

(474) Bland JM, Altman DG. Multiple significance tests: the Bonferroni method. BMJ 1995; 310(6973):170.

(475) Perneger TV. What's wrong with Bonferroni adjustments. BMJ 1998; 316(7139):1236-1238.

(476) Bender R, Lange S. Multiple test procedures other than Bonferroni's deserve wider use. BMJ 1999; 318(7183):600-601.

(477) Neter J, Wasserman W, Kutner MH. Applied Linear Statistical Models: Regression, Analysis of Variance, and Experimental Design. Third ed. Homewood, IL: Irwin; 1990.

(478) Anonymous. Address Multiple Comparisons before Starting a Study. June 2002. http://vanbelle.org/rom%5CROM_2002_06.pdf

(479) Levin B. On the Holm, Simes, and Hochberg multiple test procedures. Am J Public Health 1996; 86(5):628-629.

(480) Aickin M, Gensler H. Adjusting for multiple testing when reporting research results: the Bonferroni vs Holm methods. Am J Public Health 1996; 86(5):726-728.

(481) SAS Institute Inc. The MULTTEST Procedure. SAS/STAT User's Guide, Version 8. Cary NC: Sas Institue Inc.; 1999. 2313-2356.

(482) Diggle PJ, Liang K-Y, Zeger SL. Analysis of Longitudinal Data. Oxford: Oxford University Press; 1994.

(483) Hanley JA, Negassa A, Edwardes MD, Forrester JE. Statistical analysis of correlated data using generalized estimating equations: an orientation. Am J Epidemiol 2003; 157(4):364-375.

http://vanbelle.org/rom%5CROM_2002_06.pdf

Literatuur 368

(484) Allison PD. Logit Analysis of Longitudinal and Other Clustered Data. In: Allison PD, editor. Logistic Regression Using the SAS System: Theory and Application. Cary, NC: SAS Institute Inc., 1999. 179-216.

(485) Kiefe CI, Weissman NW, Allison JJ, Farmer R, Weaver M, Williams OD. Identifying achievable benchmarks of care: concepts and methodology. Int J Qual Health Care 1998; 10(5):443-447.

(486) Zhang J, Yu KF. What's the relative risk? A method of correcting the odds ratio in cohort studies of common outcomes. JAMA 1998; 280(19):1690-1691.

(487) Altman DG. Why We Need Confidence Intervals. World J Surg 2005.

(488) Altman D, Bland JM. Confidence intervals illuminate absence of evidence. BMJ 2004; 328(7446):1016-1017.

(489) Greenhalgh T. How to read a paper. Statistics for the non-statistician. II: "Significant" relations and their pitfalls. BMJ 1997; 315(7105):422-425.

(490) Orav EJ. Statistical presentation. Int J Qual Health Care 2001; 13(2):151-153.

(491) Armitage P, Berry G. Further Analysis of Categorical Data. Statistical Methods in Medical Research. Third ed. Oxford: Blackwell Science Ltd.; 1994. 402-447.

(492) Hosmer DW, Lemeshow S. Multiple Logistic Regression. In: Hosmer DW, Lemeshow S, editors. Applied Logistic Regression. 2nd ed. New York: John Wiley & Sons, INC.; 2000. 31-46.

(493) D'Hoore W. Mise en oeuvre de l'évaluation de la qualité des soins par l'approche des résultats - Application à une banque de résumés d'hospitalisations - [ UCL ESP Département des Sciences Hospitalières et Médicales; 1993.

(494) Krumholz HM, Rathore SS, Chen J, Wang Y, Radford MJ. Evaluation of a consumer-oriented internet health care report card: the risk of quality ratings based on mortality data. JAMA 2002; 287(10):1277-1287.

(495) Liang BA. A system of medical error disclosure. Qual Saf Health Care 2002; 11(1):64-68.

(496) Reason J. Human error: models and management. BMJ 2000; 320(7237):768-770.

(497) Hart E, Hazelgrove J. Understanding the organisational context for adverse events in the health services: the role of cultural censorship. Qual Health Care 2001; 10(4):257-262.

Literatuur

369

(498) Walshe K, Offen N. A very public failure: lessons for quality improvement in healthcare organisations from the Bristol Royal Infirmary. Qual Health Care 2001; 10(4):250-256.

(499) Aelvoet W, Cloots H, Fortuin M, Hooft P, Vanoverloop J. Gezondheidsindicatoren 1998. Brussel: Ministerie van de Vlaamse Gemeenschap; 2000.

(500) Aelvoet W, Molenberghs G, van Sprundel M. Mortality Statistics in Belgium 1980-1997: Quality of coding. Arch Public Health 2005; 63(2):127-148.

(501) Aelvoet W. Gezondheidsindicatoren 1993. Brussel: Ministerie van de Vlaamse Gemeenschap; 1995.

(502) Aelvoet W, Capet F, Vanoverloop J. Gezondheidsindicatoren 1996. Brussel: Ministerie van de Vlaamse Gemeenschap; 1998.

(503) Aelvoet W, Fortuin M, Hooft P, Vanoverloop J. Gezondheidsindicatoren 1997. Brussel: Ministerie van de Vlaamse Gemeenschap; 1999.

(504) Aelvoet W. Mortinataliteit en zuigelingensterfte. In: Van Der Haeghe H, editor. Over sterfte. Brussel: CBGS; 1991. 69-80.

(505) Aelvoet W, Capet F, Vanoverloop J. Verhoogde sterfte in het arrondissement Dendermonde. Kunnen overlijdensstatistieken hierover uitsluitsel brengen? Tijdschr voor Geneeskunde 1998; 54(22):1548-1557.

(506) Van Oyen H, Aelvoet W, Tafforeau J. Overlijdenspatroon in het Vlaamse Gewest. Tijdschr voor Geneeskunde 1993; 49:821-828.

(507) MacFarlane A. Perinatal mortality surveys. Br Med J (Clin Res Ed) 1984; 289(6457):1473-1474.

(508) Carter JR. The problematic death certificate. N Engl J Med 1985; 313(20):1285-1286.

(509) Holland WW. European Community Atlas of Avoidable Death. Oxford: Oxford University Press; 1988.

(510) Humblet P, Lagasse R, Moens G, Van de Voorde H, Wollast E. Atlas de la mortalité évitable en Belgique - Atlas van de vermijdbare sterfte in België (1974-1978). 1-94. 1986. Bruxelles, Ecole de Santé Publique.

(511) Humblet PC, Lagasse R, Moens GF, Wollast E, Van de Voorde H. [Avoidable mortality in Belgium]. Soc Sci Med 1987; 25(5):485-493.

(512) Lagasse R, Humblet P, Hooft P, Van de Voorde H, Wollast E. Atlas of avoidable mortality in Belgium 1980-1984. Arch Public Health 1992; 50:1-97.

Literatuur 370

(513) Leveque A, Humblet PC, Lagasse R. Atlas of avoidable mortality in Belgium 1985-1989. Arch Public Health 1999; 57:1-87.

(514) Moens GF, Haenen W, Van de Voorde H. Epidemiological aspects of suicide among the young in selected European countries. J Epidemiol Community Health 1988; 42(3):279-285.

(515) Moens GFG, Lagasse R, Humblet P, Van de Voorde H, Wollast E. "Vermijdbare sterfte": een evaluatie-instrument van de Gezondheidszorg in België? Tijdschr voor Geneeskunde 1986; 42(13):921-931.

(516) Mackenbach JP, Van Duyne WM, Kelson MC. Certification and coding of two underlying causes of death in The Netherlands and other countries of the European Community. J Epidemiol Community Health 1987; 41(2):156-160.

(517) Hosmer DW, Lemeshow S. Special Topics: The Multinomial Logistic Regression Model. In: Hosmer DW, Lemeshow S, editors. Applied Logistic Regression. 2nd ed. New York: John Wiley & Sons, INC.; 2000. 260-287.

(518) Rosenberg HM. The Impact of Cause-of-death Querying. 45, 1-7. 1991. Bethesda,Maryland, International Institute for Vital Registration and Statistics. Technical Papers.

(519) Hooft P. Verslag van de bijeenkomst van de Eurostat "Technical Group on Causes of Death Statistics". 2004.

(520) Newschaffer CJ, Otani K, McDonald MK, Penberthy LT. Causes of death in elderly prostate cancer patients and in a comparison nonprostate cancer cohort. J Natl Cancer Inst 2000; 92(8):613-621.

(521) RAND. Effects of Medicare's Prospective Payment System on the Quality of Hospital Care. RB-4519, 1-3. 1998. http://www.rand.org/publications/RB/RB4519/.

(522) American Hospital Directory. Medicare Prospective Payment System. 2006. http://www.ahd.com/pps.html acceeded 13/06/2007, American Hospital Directory.

(523) ICD-9-CM Coding Fundamentals, Multiple Coding. ICD-9-CM International Classification of Diseases 9th Revision Clinical Modification Sixth Edition 2005. 2004. 19-78.

(524) Kinghorn W. Should doctors ever lie on behalf of patients? JAMA 1999; 282(17):1674.

http://www.rand.org/publications/RB/RB4519/

http://www.ahd.com/pps.html

Literatuur

371

(525) Webster G. Serving two masters: medical practice vs administrative ethics. JAMA 1999; 282(17):1678-1679.

(526) Rifkin DE. Community considerations: the many effects of miscoding. JAMA 1999; 282(17):1676-7, 1679.

(527) Ubel PA. Physicians' duties in an era of cost containment: advocacy or betrayal? JAMA 1999; 282(17):1675.

(528) Weinstein MC. Should physicians be gatekeepers of medical resources? J Med Ethics 2001; 27(4):268-274.

(529) Roger VL. Invited commentary: Will heart attacks be "gone with the century"? Am J Epidemiol 2004; 160(12):1147-1149.

(530) Kirkhove P, Gillet P, Terryn N, Aelvoet W. Des Audits Aléatoires à des Audits Ciblés. Le Bulletin 2002; http:/www.health.fgov.be/vesalius/devnew/FR/prof/news/bulletin/ (acceeded 15/06/2005):1-9.

(531) Bijlage 3 aan het koninklijk besluit van 25 april 2002. Annexe N° 3 à l'arrêté royal du 25 avril 2002. Vaststelling van een gemiddelde ligduur per diagnosegroep en berekening van een aantal verantwoorde bedden. Fixation d'une durée de séjour moyenne par groupe de diagnostics et calcul d'un nombre de lits justifiés. 25-4-2002.

(532) Campbell MJ, Daly LE, Machin D. Special Topics. In: Altman DG, Machin D, Bryant TN, Gardner MJ, editors. Statistics with Confidence. Bristol: BMJ Books; 2000. 153-167.

(533) Black C, Roos NP. Administrative data. Baby or bathwater? Med Care 1998; 36(1):3-5.

(534) Chaillet N, Dumont A. Evidence-based strategies for reducing cesarean section rates: a meta-analysis. Birth 2007; 34(1):53-64.

(535) Curry SJ. Organizational interventions to encourage guideline implementation. Chest 2000; 118(2 Suppl):40S-46S.

(536) Kostis WJ, Demissie K, Marcella SW, Shao YH, Wilson AC, Moreyra AE. Weekend versus weekday admission and mortality from myocardial infarction. N Engl J Med 2007; 356(11):1099-1109.

(537) Roger-France FH, Mertens I. Case Mix in Belgium: A Rapid Coverage and a Progressive AP-DRG Use. In: Roger-France FH, Mertens I, Closon MC, Hofdijk J, editors. Case Mix: Global Views, Local Actions. 2001. 31-39.

Literatuur 372

(538) Lorant V, Boland B, Humblet P, Deliege D. Equity in prevention and health care. J Epidemiol Community Health 2002; 56(7):510-516.

(539) Starfield B. Equity in health. J Epidemiol Community Health 2002; 56(7):483-484.

(540) Lee TH, Meyer GS, Brennan TA. A middle ground on public accountability. N Engl J Med 2004; 350(23):2409-2412.





(545) Iezzoni LI. Assessing quality using administrative data. Ann Intern Med 1997; 127(8 Pt 2):666-674.

(546) Clancy CM. AHRQs National Healthcare Quality and Disparities Reports: resources for health services researchers. Health Serv Res 2006; 41(2):xiii-xxix.

(547) Weiner BJ, Alexander JA, Shortell SM, Baker LC, Becker M, Geppert JJ. Quality improvement implementation and hospital performance on quality indicators. Health Serv Res 2006; 41(2):307-334.


(549) Sheldon T. Netherlands plans system for reporting errors 8. BMJ 2004; 329(7457):68.

(550) Beresford NW, Evans TW. Legal safeguards for the audit process. Are essential for effective clinical governance. BMJ 1999; 319(7211):654-655.

(551) Walshe K. Legal safeguards for audit process are a bad idea. BMJ 1999; 319(7223):1499.

Literatuur

373

(552) AHRQ Quality Indicators. Guide to Inpatient Quality Indicators: Quality of Care in Hospitals - Volume, Mortality and Utilization. Version2.1, Revision 4. 02-R0204, 1-179. 22-12-0004. Rockville, MD, Agency for Healthcare Research and Quality.

(553) Marshall MN. Accountability and quality improvement: the role of report cards. Qual Health Care 2001; 10(2):67-68.

(554) Smith J. Redesigning health care. BMJ 2001; 322(7297):1257-1258.

(555) Moss F, Garside P, Dawson S. Organisational change: the key to quality improvement. Qual Health Care 1998; 7 Suppl:S1-S2.

(556) Buetow SA, Roland M. Clinical governance: bridging the gap between managerial and clinical approaches to quality of care. Qual Health Care 1999; 8(3):184-190.

(557) Roland M. Choosing effective strategies for quality improvement. Qual Health Care 2001; 10(2):66-67.

(558) Davies HT, Nutley SM, Mannion R. Organisational culture and quality of health care. Qual Health Care 2000; 9(2):111-119.

(559) Pearson M. Lessons from the management of acute myocardial infarction. Heart 2005; 91 Suppl 2:ii28-ii30.

(560) Firth-Cozens J. Multidisciplinary teamwork: the good, bad, and everything in between. Qual Health Care 2001; 10(2):65-66.

(561) Smith J, Walshe K, Hunter DJ. The "redisorganisation" of the NHS. BMJ 2001; 323(7324):1262-1263.

(562) Vladeck BC, Goodwin EJ, Myers LP, Sinisi M. Consumers and hospital use: the HCFA "death list". Health Aff (Millwood ) 1988; 7(1):122-125.

(563) Detmer DE. Erring is human: will we cross the quality chasm? Qual Health Care 2001; 10(2):68-69.

(564) Cesarean Delivery Rate. In: Agency for Healthcare Research and Quality, editor. AHRQ Quality Indicators - Guide to Inpatient Quality Indicators: Quality of Care in Hospitals - Volume, Mortality, and Utilization. Revision 4 ed. Rockvile, MD: Agency for Healthcare Research and Quality; 2004. 67-69.

(565) Belizan JM, Althabe F, Barros FC, Alexander S. Rates and implications of caesarean sections in Latin America: ecological study. BMJ 1999; 319(7222):1397-1400.

Literatuur 374

(566) Main EK. Reducing cesarean birth rates with data-driven quality improvement activities. Pediatrics 1999; 103(1 Suppl E):374-383.

(567) Smith GC, Pell JP, Cameron AD, Dobbie R. Risk of perinatal death associated with labor after previous cesarean delivery in uncomplicated term pregnancies. JAMA 2002; 287(20):2684-2690.

(568) Lucet C, Di Zinno T, De Gauquier K, Remacle A. Recours à la césarienne en Belgique: évolution générale et disparités Gebruik van keizersneden in België: algemene evolutie en discrepanties. Intermutualistisch Agentschap, editor. 1-23. 2006. Brussel.

(569) Villar J, Valladares E, Wojdyla D, Zavaleta N, Carroli G, Velazco A et al. Caesarean delivery rates and pregnancy outcomes: the 2005 WHO global survey on maternal and perinatal health in Latin America. Lancet 2006; 367(9525):1819-1829.

(570) Ronsmans C, Campbell OM, McDermott J, Koblinsky M. Questioning the indicators of need for obstetric care. Bull World Health Organ 2002; 80(4):317-324.

(571) Johanson R, Newburn M, MacFarlane A. Has the medicalisation of childbirth gone too far? BMJ 2002; 324(7342):892-895.

(572) Anderson GM. Making sense of rising caesarean section rates. BMJ 2004; 329(7468):696-697.

(573) Guihard P, Blondel B. Trends in risk factors for caesarean sections in France between 1981 and 1995: lessons for reducing the rates in the future. BJOG 2001; 108(1):48-55.

(574) Kolas T, Saugstad OD, Daltveit AK, Nilsen ST, Oian P. Planned cesarean versus planned vaginal delivery at term: Comparison of newborn infant outcomes. Am J Obstet Gynecol 2006.

(575) Meikle SF, Steiner CA, Zhang J, Lawrence WL. A national estimate of the elective primary cesarean delivery rate. Obstet Gynecol 2005; 105(4):751-756.

(576) Guise JM, McDonagh MS, Hashima J, Kraemer DF, Berlin M, Nygren P et al. Vaginal Birth After Cesarean (VBAC). AHRQ Publication No. 03-E018, 1-526. 2003. Rockville,MD, AHRQ.

(577) Gregory KD, Korst LM, Gornbein JA, Platt LD. Using administrative data to identify indications for elective primary cesarean delivery. Health Serv Res 2002; 37(5):1387-1401.

Literatuur

375

(578) Gonen R, Tamir A, Degani S, Ohel G. Variables associated with successful vaginal birth after one cesarean section: a proposed vaginal birth after cesarean section score. Am J Perinatol 2004; 21(8):447-453.

(579) Zweifler J, Garza A, Hughes S, Stanich MA, Hierholzer A, Lau M. Vaginal birth after cesarean in California: before and after a change in guidelines. Ann Fam Med 2006; 4(3):228-234.

(580) Glezerman M. Five years to the term breech trial: the rise and fall of a randomized controlled trial. Am J Obstet Gynecol 2006; 194(1):20-25.

(581) Kotaska A. Inappropriate use of randomised trials to evaluate complex phenomena: case study of vaginal breech delivery. BMJ 2004; 329(7473):1039-1042.

(582) Wareham V, Bain C, Cruickshank D. Caesarean section audit by peer review. Eur J Obstet Gynecol Reprod Biol 1993; 48(1):9-14.

(583) Minkoff H, Chervenak FA. Elective primary cesarean delivery. N Engl J Med 2003; 348(10):946-950.

(584) Stirrat GM, Dunn PM. Elective caesarean section on request. Obstetricians are more than technicians. BMJ 1999; 318(7176):120-121.

(585) Castro A. Commentary:increase in cesarean sections may reflect medical control not woma's choice. BMJ 2006; 319:1401-1402.

(586) van Roosmalen J. Elective caesarean section on request. Unnecessary caesarean sections should be avoided. BMJ 1999; 318(7176):121.

(587) Idama TO, Lindow SW. Elective caesarean section on request. Safest option is still to aim for vaginal delivery. BMJ 1999; 318(7176):121.

(588) Greene MF. Vaginal delivery after cesarean section--is the risk acceptable? N Engl J Med 2001; 345(1):54-55.

(589) Paterson-Brown S, Fisk NM. Caesarean section: every woman's right to choose? Curr Opin Obstet Gynecol 1997; 9(6):351-355.

(590) Paterson-Brown S. Should doctors perform an elective caesarean section on request? Yes, as long as the woman is fully informed. BMJ 1998; 317(7156):462-463.

(591) Norman B, Crowhurst JA, Plaat F. Elective caesarean section on request. All types of anaesthesia carry risks. BMJ 1999; 318(7176):120.

(592) Rozenberg P. [Evaluation of cesarean rate: a necessary progress in modern obstetrics]. J Gynecol Obstet Biol Reprod (Paris) 2004; 33(4):279-289.

Literatuur 376

(593) National Collaborating Centre for Women's and Children's Health. Caesarean Section. Moody J, editor. 1-143. 2004. London NW1 4RG, RCOG Press.

(594) Amu O, Rajendran S, Bolaji II. Should doctors perform an elective caesarean section on request? Maternal choice alone should not determine method of delivery. BMJ 1998; 317(7156):463-465.

(595) Rortveit G, Daltveit AK, Hannestad YS, Hunskaar S. Urinary incontinence after vaginal delivery or cesarean section. N Engl J Med 2003; 348(10):900-907.

(596) Usta IM, Hobeika EM, Musa AA, Gabriel GE, Nassar AH. Placenta previa-accreta: risk factors and complications. Am J Obstet Gynecol 2005; 193(3 Pt 2):1045-1049.

(597) Alexander S, Wildman K, Zhang W, Langer M, Vutuc C, Lindmark G. Maternal health outcomes in Europe. Eur J Obstet Gynecol Reprod Biol 2003; 111 Suppl 1:S78-S87.

(598) Kritchevsky SB, Braun BI, Gross PA, Newcomb CS, Kelleher CA, Simmons BP. Definition and adjustment of Cesarean section rates and assessments of hospital performance. Int J Qual Health Care 1999; 11(4):283-291.

(599) Gonen R, Tamir A, Degani S. Obstetricians' opinions regarding patient choice in cesarean delivery. Obstet Gynecol 2002; 99(4):577-580.

(600) Langer A, Villar J. Promoting evidence based practice in maternal care. BMJ 2002; 324(7343):928-929.

(601) Naylor CD, Sermer M, Chen E, Sykora K. Cesarean delivery in relation to birth weight and gestational glucose tolerance: pathophysiology or practice style? Toronto Trihospital Gestational Diabetes Investigators. JAMA 1996; 275(15):1165-1170.

(602) Bastia H. Commentary:"health has become secondary to a sexually attractive body". BMJ 2006; 319:1402.

(603) Showalter E, Griffin A. Commentary: all women should have a choice. BMJ 1999; 319:1401.

(604) Penn Z, Ghaem-Maghami S. Indications for caesarean section. Best Pract Res Clin Obstet Gynaecol 2001; 15(1):1-15.

(605) Jacquemyn Y, Ahankour F, Martens G. Flemish obstetricians' personal preference regarding mode of delivery and attitude towards caesarean section on demand. Eur J Obstet Gynecol Reprod Biol 2003; 111(2):164-166.

Literatuur

377

(606) Lavender T, Kingdon C, Hart A, Gyte G, Gabbay M, Neilson JP. Could a randomised trial answer the controversy relating to elective caesarean section? National survey of consultant obstetricians and heads of midwifery. BMJ 2005; 331(7515):490-491.

(607) Gould JB, Danielsen B, Korst LM, Phibbs R, Chance K, Main E et al. Cesarean delivery rates and neonatal morbidity in a low-risk population. Obstet Gynecol 2004; 104(1):11-19.

(608) Agency for Healthcare Research and Quality. 2003 National Healthcare Quality Report. 1-208. 2003. Rockville,MD, U.S. Department of Health and Human Services, Agency for Healthcare Research and Quality.

(609) Zeitlin J, Wildman K, Breart G, Alexander S, Barros H, Blondel B et al. Selecting an indicator set for monitoring and evaluating perinatal health in Europe: criteria, methods and results from the PERISTAT project. Eur J Obstet Gynecol Reprod Biol 2003; 111 Suppl 1:S5-S14.

(610) Bekaert A, Martens G, Devlieger H, Amy JJ. Perinatal Activities in Flanders,1996. 1-62. 1997. Brussels, SPE.

(611) Buitendijk S, Zeitlin J, Cuttini M, Langhoff-Roos J, Bottu J. Indicators of fetal and infant health outcomes. Eur J Obstet Gynecol Reprod Biol 2003; 111 Suppl 1:S66-S77.

(612) Declercq E, Menacker F, MacDorman M. Maternal risk profiles and the primary cesarean rate in the United States, 1991-2002. Am J Public Health 2006; 96(5):867-872.

(613) Elliott JP, Russell MM, Dickason LA. The labor-adjusted cesarean section rate--a more informative method than the cesarean section "rate" for assessing a practitioner's labor and delivery skills. Am J Obstet Gynecol 1997; 177(1):139-143.

(614) Dani C, Reali MF, Bertini G, Wiechmann L, Spagnolo A, Tangucci M et al. Risk factors for the development of respiratory distress syndrome and transient tachypnoea in newborn infants. Italian Group of Neonatal Pneumology. Eur Respir J 1999; 14(1):155-159.

(615) Yoder BA, Kirsch EA, Barth WH, Gordon MC. Changing obstetric practices associated with decreasing incidence of meconium aspiration syndrome. Obstet Gynecol 2002; 99(5 Pt 1):731-739.

(616) Papile LA. The Apgar score in the 21st century. N Engl J Med 2001; 344(7):519-520.

Literatuur 378

(617) Baumer JH, Wright D, Mill T. Illness severity measured by CRIB score: a product of changes in perinatal care? Arch Dis Child Fetal Neonatal Ed 1997; 77(3):F211-F215.

(618) Patel D, Piotrowski ZH, Nelson MR, Sabich R. Effect of a statewide neonatal resuscitation training program on Apgar scores among high-risk neonates in Illinois. Pediatrics 2001; 107(4):648-655.

(619) Moster D, Lie RT, Irgens LM, Bjerkedal T, Markestad T. The association of Apgar score with subsequent death and cerebral palsy: A population-based study in term infants. J Pediatr 2001; 138(6):798-803.

(620) Casey BM, McIntire DD, Leveno KJ. The continuing value of the Apgar score for the assessment of newborn infants. N Engl J Med 2001; 344(7):467-471.

(621) Wu YW, Backstrand KH, Zhao S, Fullerton HJ, Johnston SC. Declining diagnosis of birth asphyxia in California: 1991-2000. Pediatrics 2004; 114(6):1584-1590.

(622) Neter J, Wasserman W, Kutner MH. Two-Factor Analysis of Variance - Equal Sample Sizes. In: Neter J, Wasserman W, Kutner MH, editors. Applied Linear Statistical Models Regression, Analysis of Variance and Experimental Designs. Third ed. Homewood,IL: IRWIN; 1990. 673-729.

(623) Collett D. Modelling data from epidemiological studies. In: Collett D, editor. Modelling binary data. Boca Raton: Chapman & Hall/CRC; 1991. 223-276.

(624) Molenberghs G, Verbeke G. Generalized Estimating Equations. Models for Discrete Longitudinal Data. New York: Springer; 2005. 151-187.

(625) Agresti A. Multinomial Response Models. Categorical Data Analysis. New York: John Wiley &Sons.; 1990. 306-346.

(626) Wiswell TE, Gannon CM, Jacob J, Goldsmith L, Szyld E, Weiss K et al. Delivery room management of the apparently vigorous meconium-stained neonate: results of the multicenter, international collaborative trial. Pediatrics 2000; 105(1 Pt 1):1-7.

(627) Fraser WD, Hofmeyr J, Lede R, Faron G, Alexander S, Goffinet F et al. Amnioinfusion for the prevention of the meconium aspiration syndrome. N Engl J Med 2005; 353(9):909-917.

(628) Dargaville PA, Copnell B. The epidemiology of meconium aspiration syndrome: incidence, risk factors, therapies, and outcome. Pediatrics 2006; 117(5):1712-1721.

(629) Levine EM, Ghai V, Barton JJ, Strom CM. Mode of delivery and risk of respiratory diseases in newborns. Obstet Gynecol 2001; 97(3):439-442.

Literatuur

379

(630) Freeman RK, Cohen AW, Depp III R, Frigoletto Jr FD, Hankins GDV, Lieberman E et al. Evaluation of Cesarean Delivery. American College of Obstetricians and Gynecologists Task Force on Cesarean Delivery Rates, editor. i-5. 2000. Washington,DC, The American College of Obstetricians and Gynecologists.

(631) Arnold RA, Diamond ID, Wakefield JC. The use of population data in spatial epidemiology. In: Elliott P, Wakefield JC, Best NG, Briggs DJ, editors. Spatial Epidemiology: Methods and Applications. Oxford: Oxford University Press; 2000. 30-50.

(632) Lydon-Rochelle M, Holt VL, Easterling TR, Martin DP. Risk of uterine rupture during labor among women with a prior cesarean delivery. N Engl J Med 2001; 345(1):3-8.

(633) Kabir AA, Pridjian G, Steinmann WC, Herrera EA, Khan MM. Racial differences in cesareans: an analysis of U.S. 2001 National Inpatient Sample Data. Obstet Gynecol 2005; 105(4):710-718.

(634) Jovanovic L, Pettitt DJ. Gestational diabetes mellitus. JAMA 2001; 286(20):2516-2518.

(635) Sibai BM. Diagnosis, prevention, and management of eclampsia. Obstet Gynecol 2005; 105(2):402-410.

(636) Krieger N. Overcoming the absence of socioeconomic data in medical records: validation and application of a census-based methodology. Am J Public Health 1992; 82(5):703-710.

(637) AHRQ. AHRQuality Indicators e-Newsletter: AHRQ QI TIPS: ICD-9-CM Coding Issues. 2005. http://qualityindicators.ahrq.gov/newsletter/2005-September-AHRQ-QI-Newsletter.htm

(638) DiGiuseppe DL, Aron DC, Payne SM, Snow RJ, Dierker L, Rosenthal GE. Risk adjusting cesarean delivery rates: a comparison of hospital profiles based on medical record and birth certificate data. Health Serv Res 2001; 36(5):959-977.

(639) Rosenthal AR. Elective caesarean section on request. Maternal age is important. BMJ 1999; 318(7176):121-122.

(640) Cleary-Goldman J, Malone FD, Vidaver J, Ball RH, Nyberg DA, Comstock CH et al. Impact of maternal age on obstetric outcome. Obstet Gynecol 2005; 105(5 Pt 1):983-990.

(641) Heffner LJ, Elkin E, Fretts RC. Impact of labor induction, gestational age, and maternal age on cesarean delivery rates. Obstet Gynecol 2003; 102(2):287-293.

http://qualityindicators.ahrq.gov/newsletter/2005-September-AHRQ-QI-Newsletter.htm

http://qualityindicators.ahrq.gov/newsletter/2005-September-AHRQ-QI-Newsletter.htm

Literatuur 380

(642) Thorngren-Jerneck K, Herbst A. Low 5-minute Apgar score: a population-based register study of 1 million term births. Obstet Gynecol 2001; 98(1):65-70.

(643) MacLennan A. A template for defining a causal relation between acute intrapartum events and cerebral palsy: international consensus statement. BMJ 1999; 319(7216):1054-1059.

(644) Perinatale Activiteiten in Vlaanderen 2005. Cammu H, Martens G, De Coen K, Van Mol C., Defoort P, editors. Perinatale Activiteiten in Vlaanderen 2005. 1-71. 2006. Brussel, Studiecentrum Perinatale Epidemiologie.

(645) ACOG Committee Opinion. Number 333, May 2006 (replaces No. 174, July 1996): The Apgar score. Obstet Gynecol 2006; 107(5):1209-1212.

(646) Fan AP, Eaton WW. Longitudinal study assessing the joint effects of socio-economic status and birth risks on adult emotional and nervous conditions. Br J Psychiatry Suppl 2001; 40:s78-s83.

(647) Young P, Hamilton R, Hodgett S, Moss M, Rigby C, Jones P et al. Reducing risk by improving standards of intrapartum fetal care. J R Soc Med 2001; 94(5):226-231.

(648) Stutchfield P, Whitaker R, Russell I. Antenatal betamethasone and incidence of neonatal respiratory distress after elective caesarean section: pragmatic randomised trial. BMJ 2005; 331(7518):662.

(649) Littleford J. Effects on the fetus and newborn of maternal analgesia and anesthesia: a review. Can J Anaesth 2004; 51(6):586-609.

(650) Pottecher J, Benhamou D. [Labor pain and obstetric analgesia]. J Gynecol Obstet Biol Reprod (Paris) 2004; 33(3):179-191.

(651) Lopriore E, van Burk GF, Walther FJ, de Beaufort AJ. Correct use of the Apgar score for resuscitated and intubated newborn babies: questionnaire study. BMJ 2004; 329(7458):143-144.

(652) Boog G. La souffrance foetale aiguë [Acute fetal distress]. J Gynecol Obstet Biol Reprod (Paris) 2001; 30(5):393-432.

(653) Stoler MH, Schiffman M. Interobserver reproducibility of cervical cytologic and histologic interpretations: realistic estimates from the ASCUS-LSIL Triage Study. JAMA 2001; 285(11):1500-1505.

(654) Grotta JC, Chiu D, Lu M, Patel S, Levine SR, Tilley BC et al. Agreement and variability in the interpretation of early CT changes in stroke patients qualifying for intravenous rtPA therapy. Stroke 1999; 30(8):1528-1533.

Literatuur

381

(655) Hemminki E, Malin M, Rahkonen O. Mother's social class and perinatal problems in a low-problem area. Int J Epidemiol 1990; 19(4):983-990.

(656) Stewart JH, Andrews J, Cartlidge PH. Numbers of deaths related to intrapartum asphyxia and timing of birth in all Wales perinatal survey, 1993-5. BMJ 1998; 316(7132):657-660.

(657) Gould JB, Qin C, Chavez G. Time of birth and the risk of neonatal death. Obstet Gynecol 2005; 106(2):352-358.

(658) McNutt RA, Abrams R, Arons DC. Patient safety efforts should focus on medical errors. JAMA 2002; 287(15):1997-2001.

(659) Lanier DC, Roland M, Burstin H, Knottnerus JA. Doctor performance and public accountability. Lancet 2003; 362(9393):1404-1408.

(660) Lilford R, Mohammed MA, Spiegelhalter D, Thomson R. Use and misuse of process and outcome data in managing performance of acute medical care: avoiding institutional stigma. Lancet 2004; 363(9415):1147-1154.

(661) Ransom SB, Studdert DM, Dombrowski MP, Mello MM, Brennan TA. Reduced medicolegal risk by compliance with obstetric clinical pathways: a case--control study. Obstet Gynecol 2003; 101(4):751-755.

(662) Hannah ME, Hannah WJ, Hewson SA, Hodnett ED, Saigal S, Willan AR. Planned caesarean section versus planned vaginal birth for breech presentation at term: a randomised multicentre trial. Term Breech Trial Collaborative Group. Lancet 2000; 356(9239):1375-1383.

(663) Lumley J. Any room left for disagreement about assisting breech births at term? Lancet 2000; 356(9239):1369-1370.

(664) Boutron I, Tubach F, Giraudeau B, Ravaud P. Methodological differences in clinical trials evaluating nonpharmacological and pharmacological treatments of hip and knee osteoarthritis. JAMA 2003; 290(8):1062-1070.

(665) Boutron I, Ravaud P, Giraudeau B. Inappropriateness of randomised trials for complex phenomena: single trial is never enough evidence to base decisions on. BMJ 2005; 330(7482):94.

(666) Hannah M. Inappropriateness of randomised trials for complex phenomena: are the results of the term breech trial generalisable? BMJ 2005; 330(7482):95.

(667) Whyte H, Hannah ME, Saigal S, Hannah WJ, Hewson S, Amankwah K et al. Outcomes of children at 2 years after planned cesarean birth versus planned vaginal birth for breech presentation at term: the International Randomized Term Breech Trial. Am J Obstet Gynecol 2004; 191(3):864-871.

Literatuur 382

(668) Term breech delivery in Sweden: mortality relative to fetal presentation and planned mode of delivery. Acta Obstet Gynecol Scand 2005; 84(6):593-601.

(669) Danielian PJ, Wang J, Hall MH. Long-term outcome by method of delivery of fetuses in breech presentation at term: population based follow up. BMJ 1996; 312(7044):1451-1453.

(670) Carayol M, Alexander S, Goffinet F. [Mode of delivery and term breech presentation in the PREMODA cohort]. J Gynecol Obstet Biol Reprod (Paris) 2004; 33(1 Suppl):S37-S44.

(671) Scherjon SA, van RJ. [Breech presentation at term: the caesarean section that is routinely advised is ultimately not safe for the child]. Ned Tijdschr Geneeskd 2005; 149(40):2204-2206.

(672) Varma R, Gupta JK. Internationally agreed strategy is needed on vaginal birth after caesarean. BMJ 2004; 329(7462):403.

(673) Janssen PA, Lee SK, Ryan EM, Etches DJ, Farquharson DF, Peacock D et al. Outcomes of planned home births versus planned hospital births after regulation of midwifery in British Columbia. CMAJ 2002; 166(3):315-323.

(674) Verschoore S, Martens G, Delbaere I, Temmerman M. Vaginale bevalling na sectio in vergelijking met een herhalingssectio gevolgen voor moeder en kind. In: Cammu H, Martens G, De Coen K, Van Mol C., Defoort P, editors. Perinatale Activiteiten in Vlaanderen 2005. Brussel: Studiecentrum Perinatale Epidemiologie; 2006. 59-66.

(675) McMahon MJ, Luther ER, Bowes WA, Jr., Olshan AF. Comparison of a trial of labor with an elective second cesarean section. N Engl J Med 1996; 335(10):689-695.

(676) Smith GC, Pell JP, Pasupathy D, Dobbie R. Factors predisposing to perinatal death related to uterine rupture during attempted vaginal birth after caesarean section: retrospective cohort study. BMJ 2004; 329(7462):375.

(677) Vaginal birth after cesarean birth--California, 1996-2000. MMWR Morb Mortal Wkly Rep 2002; 51(44):996-998.

(678) Dunsmoor-Su R, Sammel M, Stevens E, Peipert JL, Macones G. Impact of sociodemographic and hospital factors on attempts at vaginal birth after cesarean delivery. Obstet Gynecol 2003; 102(6):1358-1365.

(679) Brill Y, Windrim R. Vaginal birth after Caesarean section: review of antenatal predictors of success. J Obstet Gynaecol Can 2003; 25(4):275-286.

(680) Guise JM, Hashima J, Osterweil P. Evidence-based vaginal birth after Caesarean section. Best Pract Res Clin Obstet Gynaecol 2005; 19(1):117-130.

Literatuur

383

(681) Durnwald C, Mercer B. Vaginal birth after Cesarean delivery: predicting success, risks of failure. J Matern Fetal Neonatal Med 2004; 15(6):388-393.

(682) Wall E, Roberts R, Deutchman M, Hueston W, Atwood LA, Ireland B. Trial of Labor After Caesarean (TOLAC), Formerly Trial of Labor Versus Elective Repeat Cesarean Section for the Woman With a Previous Cesarean Section A Review of the Evidence and Recommendations by the American Academy of Family Physicians. 1-18. 2005. AAFP.

(683) Rozenberg P. [The counselling of patient with prior C-section]. Gynecol Obstet Fertil 2005; 33(12):1003-1008.

(684) Kmietowicz Z. NICE advises against caesarean section on demand. BMJ 2004; 328(7447):1031.

(685) ACOG. Patient-Requested Cesarean Update. 5-9-2006. http://ftp.acog.org/from_home/publications/press_releases/nr05-09-06-1.cfm

(686) Danchin N, De Benedetti E, Urban P. Acute myocardial infarction. Am Fam Physician 2003; 68(3):519-521.

(687) OECD Health Data 2005: Statistics and Indicators for 30 Countries. 2005.

(688) Boucher JM, Racine N, Thanh TH, Rahme E, Brophy J, LeLorier J et al. Age-related differences in in-hospital mortality and the use of thrombolytic therapy for acute myocardial infarction. CMAJ 2001; 164(9):1285-1290.

(689) Bednar F, Widimsky P, Groch L, Aschermann M, Zelizko M, Krupicka J. Acute myocardial infarction complicated by early onset of heart failure: safety and feasibility of interhospital transfer for coronary angioplasty. Subanalysis of Killip II-IV patients from the PRAGUE-1 study. J Interv Cardiol 2003; 16(3):201-208.

(690) Dauerman HL, Ryan TJ, Jr., Piper WD, Kellett MA, Shubrooks SJ, Robb JF et al. Outcomes of percutaneous coronary intervention among elderly patients in cardiogenic shock: a multicenter, decade-long experience. J Invasive Cardiol 2003; 15(7):380-384.

(691) Zeymer U, Vogt A, Zahn R, Weber MA, Tebbe U, Gottwik M et al. Predictors of in-hospital mortality in 1333 patients with acute myocardial infarction complicated by cardiogenic shock treated with primary percutaneous coronary intervention (PCI); Results of the primary PCI registry of the Arbeitsgemeinschaft Leitende Kardiologische Krankenhausarzte (ALKK). Eur Heart J 2004; 25(4):322-328.

http://ftp.acog.org/from_home/publications/press_releases/nr05-09-06-1.cfm

http://ftp.acog.org/from_home/publications/press_releases/nr05-09-06-1.cfm

Literatuur 384

(692) Hochman JS, Sleeper LA, Webb JG, Sanborn TA, White HD, Talley JD et al. Early revascularization in acute myocardial infarction complicated by cardiogenic shock. SHOCK Investigators. Should We Emergently Revascularize Occluded Coronaries for Cardiogenic Shock. N Engl J Med 1999; 341(9):625-634.

(693) Antoniucci D, Valenti R, Santoro GM, Bolognese L, Trapani M, Moschi G et al. Systematic direct angioplasty and stent-supported direct angioplasty therapy for cardiogenic shock complicating acute myocardial infarction: in-hospital and long-term survival. J Am Coll Cardiol 1998; 31(2):294-300.

(694) Goldberg RJ, Samad NA, Yarzebski J, Gurwitz J, Bigelow C, Gore JM. Temporal trends in cardiogenic shock complicating acute myocardial infarction. N Engl J Med 1999; 340(15):1162-1168.

(695) White HD, Assmann SF, Sanborn TA, Jacobs AK, Webb JG, Sleeper LA et al. Comparison of percutaneous coronary intervention and coronary artery bypass grafting after acute myocardial infarction complicated by cardiogenic shock: results from the Should We Emergently Revascularize Occluded Coronaries for Cardiogenic Shock (SHOCK) trial. Circulation 2005; 112(13):1992-2001.

(696) Babaev A, Frederick PD, Pasta DJ, Every N, Sichrovsky T, Hochman JS. Trends in management and outcomes of patients with acute myocardial infarction complicated by cardiogenic shock. JAMA 2005; 294(4):448-454.

(697) Acute myocardial infarction: pre-hospital and in-hospital management. The Task Force on the Management of Acute Myocardial Infarction of the European Society of Cardiology. Eur Heart J 1996; 17(1):43-63.

(698) Rathore SS, Foody JM, Radford MJ, Krumholz HM. Sex differences in use of coronary revascularization in elderly patients after acute myocardial infarction: a tale of two therapies. Chest 2003; 124(6):2079-2086.

(699) Leape LL, Hilborne LH, Bell R, Kamberg C, Brook RH. Underuse of cardiac procedures: do women, ethnic minorities, and the uninsured fail to receive needed revascularization? Ann Intern Med 1999; 130(3):183-192.

(700) Roeters Van Lennep JE, Zwinderman AH, Roeters Van Lennep HW, Westerveld HE, Plokker HW, Voors AA et al. Gender differences in diagnosis and treatment of coronary artery disease from 1981 to 1997. No evidence for the Yentl syndrome. Eur Heart J 2000; 21(11):911-918.

(701) Gottlieb S, Harpaz D, Shotan A, Boyko V, Leor J, Cohen M et al. Sex differences in management and outcome after acute myocardial infarction in the 1990s: A prospective observational community-based study. Israeli Thrombolytic Survey Group. Circulation 2000; 102(20):2484-2490.

Literatuur

385

(702) Watson RE, Stein AD, Dwamena FC, Kroll J, Mitra R, McIntosh BA et al. Do race and gender influence the use of invasive procedures? J Gen Intern Med 2001; 16(4):227-234.

(703) Harrold LR, Esteban J, Lessard D, Yarzebski J, Gurwitz JH, Gore JM et al. Narrowing gender differences in procedure use for acute myocardial infarction: insights from the Worcester heart attack study. J Gen Intern Med 2003; 18(6):423-431.

(704) Gibson CM. Time is myocardium and time is outcomes. Circulation 2001; 104(22):2632-2634.

(705) Gottwik M, Zahn R, Schiele R, Schneider S, Gitt AK, Fraunberger L et al. Differences in treatment and outcome of patients with acute myocardial infarction admitted to hospitals with compared to without departments of cardiology; results from the pooled data of the Maximal Individual Therapy in Acute Myocardial Infarction (MITRA 1+2) Registries and the Myocardial Infarction Registry (MIR). Eur Heart J 2001; 22(19):1794-1801.

(706) Schiele F, Meneveau N, Seronde MF, Caulfield F, Fouche R, Lassabe G et al. Compliance with guidelines and 1-year mortality in patients with acute myocardial infarction: a prospective study. Eur Heart J 2005; 26(9):873-880.

(707) Marciniak TA, Ellerbeck EF, Radford MJ, Kresowik TF, Gold JA, Krumholz HM et al. Improving the quality of care for Medicare patients with acute myocardial infarction: results from the Cooperative Cardiovascular Project. JAMA 1998; 279(17):1351-1357.

(708) Mehta RH, Montoye CK, Gallogly M, Baker P, Blount A, Faul J et al. Improving quality of care for acute myocardial infarction: The Guidelines Applied in Practice (GAP) Initiative. JAMA 2002; 287(10):1269-1276.

(709) Eagle KA, Montoye CK, Riba AL, DeFranco AC, Parrish R, Skorcz S et al. Guideline-based standardized care is associated with substantially lower mortality in medicare patients with acute myocardial infarction: the American College of Cardiology's Guidelines Applied in Practice (GAP) Projects in Michigan. J Am Coll Cardiol 2005; 46(7):1242-1248.

(710) Bassand JP, Priori S, Tendera M. Evidence-based vs. 'impressionist' medicine: how best to implement guidelines. Eur Heart J 2005; 26(12):1155-1158.

(711) Van de WF, Ardissino D, Betriu A, Cokkinos DV, Falk E, Fox KA et al. Management of acute myocardial infarction in patients presenting with ST-segment elevation. The Task Force on the Management of Acute Myocardial Infarction of the European Society of Cardiology. Eur Heart J 2003; 24(1):28-66.

Literatuur 386

(712) Hasdai D, Behar S, Wallentin L, Danchin N, Gitt AK, Boersma E et al. A prospective survey of the characteristics, treatments and outcomes of patients with acute coronary syndromes in Europe and the Mediterranean basin; the Euro Heart Survey of Acute Coronary Syndromes (Euro Heart Survey ACS). Eur Heart J 2002; 23(15):1190-1201.

(713) White CW. Simplicity's virtue scorned. Precision comes to TIMI flow grading and the results are ...surprising. Circulation 1996; 93(5):853-856.

(714) Bestul MB, McCollum M, Stringer KA, Burchenal J. Impact of a critical pathway on acute myocardial infarction quality indicators. Pharmacotherapy 2004; 24(2):173-178.

(715) Krumholz HM, Chen J, Wang Y, Radford MJ, Chen YT, Marciniak TA. Comparing AMI mortality among hospitals in patients 65 years of age and older: evaluating methods of risk adjustment. Circulation 1999; 99(23):2986-2992.

(716) Jollis JG, Romano PS. Volume-outcome relationship in acute myocardial infarction: the balloon and the needle. JAMA 2000; 284(24):3169-3171.

(717) Ryan TJ, Antman EM, Brooks NH, Califf RM, Hillis LD, Hiratzka LF et al. 1999 update: ACC/AHA Guidelines for the Management of Patients With Acute Myocardial Infarction: Executive Summary and Recommendations: A report of the American College of Cardiology/American Heart Association Task Force on Practice Guidelines (Committee on Management of Acute Myocardial Infarction). Circulation 1999; 100(9):1016-1030.

(718) O'Connor GT, Quinton HB, Traven ND, Ramunno LD, Dodds TA, Marciniak TA et al. Geographic Variation in the Treatment of Acute Myocardial Infarction. JAMA 1999; 281(7):627-633.

(719) Moniteur Belge, Belgisch Staatsblad. Arrêté royal fixant les normes auxquelles les programmes de soins "pathologie cardiaque" doivent répondre pour être agréés. 15 Juillet 2004. 2004.

(720) Van Brabandt H, Camberlin C, Vrijens F, Parmentier Y, Ramaekers D, Bonneux L. More is not better in the early care of acute myocardial infarction: a prospective cohort analysis on administrative databases. Eur Heart J 2006; 27(22):2649-2654.

(721) Kuch B, Bolte HD, Hoermann A, Meisinger C, Loewel H. What is the real hospital mortality from acute myocardial infarction? Epidemiological vs clinical view. Eur Heart J 2002; 23(9):714-720.

(722) Dalby M, Bouzamondo A, Lechat P, Montalescot G. Transfer for primary angioplasty versus immediate thrombolysis in acute myocardial infarction: a meta-analysis. Circulation 2003; 108(15):1809-1814.

Literatuur

387

(723) Antman EM, Fox KM. History of guidelines for unstable angina/non-ST-elevation MI. Eur Heart J Supplements 2001;J1-J5.

(724) Bertrand ME, Simoons ML, Fox KA, Wallentin LC, Hamm CW, McFadden E et al. Management of acute coronary syndromes: acute coronary syndromes without persistent ST segment elevation; recommendations of the Task Force of the European Society of Cardiology. Eur Heart J 2000; 21(17):1406-1432.

(725) Zijlstra F, van't Hof AW, Liem AL, Hoorntje JC, Suryapranata H, de Boer MJ. Transferring patients for primary angioplasty: a retrospective analysis of 104 selected high risk patients with acute myocardial infarction. Heart 1997; 78(4):333-336.

(726) Ross AM, Coyne KS, Moreyra E, Reiner JS, Greenhouse SW, Walker PL et al. Extended mortality benefit of early postinfarction reperfusion. GUSTO-I Angiographic Investigators. Global Utilization of Streptokinase and Tissue Plasminogen Activator for Occluded Coronary Arteries Trial. Circulation 1998; 97(16):1549-1556.

(727) Brodie BR, Stuckey TD, Wall TC, Kissling G, Hansen CJ, Muncy DB et al. Importance of time to reperfusion for 30-day and late survival and recovery of left ventricular function after primary angioplasty for acute myocardial infarction. J Am Coll Cardiol 1998; 32(5):1312-1319.

(728) Boersma E. Does time matter? A pooled analysis of randomized clinical trials comparing primary percutaneous coronary intervention and in-hospital fibrinolysis in acute myocardial infarction patients. Eur Heart J 2006; 27(7):779-788.

(729) Zijlstra F, Hoorntje JC, de Boer MJ, Reiffers S, Miedema K, Ottervanger JP et al. Long-term benefit of primary angioplasty as compared with thrombolytic therapy for acute myocardial infarction. N Engl J Med 1999; 341(19):1413-1419.

(730) Morrow DA, Antman EM, Charlesworth A, Cairns R, Murphy SA, de Lemos JA et al. TIMI risk score for ST-elevation myocardial infarction: A convenient, bedside, clinical score for risk assessment at presentation: An intravenous nPA for treatment of infarcting myocardium early II trial substudy. Circulation 2000; 102(17):2031-2037.

(731) Grines CL, Browne KF, Marco J, Rothbaum D, Stone GW, O'Keefe J et al. A comparison of immediate angioplasty with thrombolytic therapy for acute myocardial infarction. The Primary Angioplasty in Myocardial Infarction Study Group. N Engl J Med 1993; 328(10):673-679.

Literatuur 388

(732) Weaver WD, Simes RJ, Betriu A, Grines CL, Zijlstra F, Garcia E et al. Comparison of primary coronary angioplasty and intravenous thrombolytic therapy for acute myocardial infarction: a quantitative review. JAMA 1997; 278(23):2093-2098.

(733) Widimsky P, Budesinsky T, Vorac D, Groch L, Zelizko M, Aschermann M et al. Long distance transport for primary angioplasty vs immediate thrombolysis in acute myocardial infarction. Final results of the randomized national multicentre trial--PRAGUE-2. Eur Heart J 2003; 24(1):94-104.

(734) Madias JE. Killip and Forrester classifications: should they be abandoned, kept, reevaluated, or modified? Chest 2000; 117(5):1223-1226.

(735) Lim R, Walters MI, Norell MS. Transferring patients for primary infarct angioplasty. Heart 1997; 78(4):325-326.

(736) Widimsky P, Groch L, Zelizko M, Aschermann M, Bednar F, Suryapranata H. Multicentre randomized trial comparing transport to primary angioplasty vs immediate thrombolysis vs combined strategy for patients with acute myocardial infarction presenting to a community hospital without a catheterization laboratory. The PRAGUE study. Eur Heart J 2000; 21(10):823-831.

(737) Zijlstra F. Angioplasty vs thrombolysis for acute myocardial infarction: a quantitative overview of the effects of interhospital transportation. Eur Heart J 2003; 24(1):21-23.

(738) Andersen HR, Nielsen TT, Rasmussen K, Thuesen L, Kelbaek H, Thayssen P et al. A comparison of coronary angioplasty with fibrinolytic therapy in acute myocardial infarction. N Engl J Med 2003; 349(8):733-742.

(739) Wharton TP, Jr., McNamara NS, Fedele FA, Jacobs MI, Gladstone AR, Funk EJ. Primary angioplasty for the treatment of acute myocardial infarction: experience at two community hospitals without cardiac surgery. J Am Coll Cardiol 1999; 33(5):1257-1265.

(740) Vermeer F, Oude Ophuis AJ, vd Berg EJ, Brunninkhuis LG, Werter CJ, Boehmer AG et al. Prospective randomised comparison between thrombolysis, rescue PTCA, and primary PTCA in patients with extensive myocardial infarction admitted to a hospital without PTCA facilities: a safety and feasibility study. Heart 1999; 82(4):426-431.

(741) Bonnefoy E, Lapostolle F, Leizorovicz A, Steg G, McFadden EP, Dubien PY et al. Primary angioplasty versus prehospital fibrinolysis in acute myocardial infarction: a randomised study. Lancet 2002; 360(9336):825-829.

Literatuur

389

(742) Morrison LJ, Verbeek PR, McDonald AC, Sawadsky BV, Cook DJ. Mortality and prehospital thrombolysis for acute myocardial infarction: A meta-analysis. JAMA 2000; 283(20):2686-2692.

(743) de Jaegere PP, Serruys PW, Simoons ML. Should all patients with an acute myocardial infarction be referred for direct PTCA? Heart 2004; 90(11):1352-1357.

(744) Magid DJ, Calonge BN, Rumsfeld JS, Canto JG, Frederick PD, Every NR et al. Relation between hospital primary angioplasty volume and mortality for patients with acute MI treated with primary angioplasty vs thrombolytic therapy. JAMA 2000; 284(24):3131-3138.

(745) Tunstall-Pedoe H, Kuulasmaa K, Amouyel P, Arveiler D, Rajakangas AM, Pajak A. Myocardial infarction and coronary deaths in the World Health Organization MONICA Project. Registration procedures, event rates, and case-fatality rates in 38 populations from 21 countries in four continents. Circulation 1994; 90(1):583-612.

(746) Salomaa V, Koukkunen H, Ketonen M, Immonen-Raiha P, Karja-Koskenkari P, Mustonen J et al. A new definition for myocardial infarction: what difference does it make? Eur Heart J 2005; 26(17):1719-1725.

(747) Apple FS, Wu AH. Myocardial infarction redefined: role of cardiac troponin testing. Clin Chem 2001; 47(3):377-379.

(748) Fox KA, Birkhead J, Wilcox R, Knight C, Barth J. British Cardiac Society Working Group on the definition of myocardial infarction. Heart 2004; 90(6):603-609.

(749) Abildstrom SZ, Rasmussen S, Madsen M. Changes in hospitalization rate and mortality after acute myocardial infarction in Denmark after diagnostic criteria and methods changed. Eur Heart J 2005; 26(10):990-995.

(750) Official ICD-9-CM Alerts Archives. Acute myocardial infarction. 2005.

(751) Dorsch MF, Lawrance RA, Sapsford RJ, Oldham J, Greenwood DC, Jackson BM et al. A simple benchmark for evaluating quality of care of patients following acute myocardial infarction. Heart 2001; 86(2):150-154.

(752) Tu JV, Austin PC, Walld R, Roos L, Agras J, McDonald KM. Development and validation of the Ontario acute myocardial infarction mortality prediction rules. J Am Coll Cardiol 2001; 37(4):992-997.

Literatuur 390

(753) Acute Myocardial Infarction Mortality Rate (IQI 15). In: Agency for Healthcare Research and Quality, editor. AHRQ Quality Indicators - Guide to Inpatient Quality Indicators: Quality of Care in Hospitals - Volume, Mortality, and Utilization. Revision 4 ed. Rockvile, MD: Agency for Healthcare Research and Quality; 2004. 54-56.

(754) Acute Myocardial Infarction Mortality Rate, Without Transfer Cases (IQI 32). In: Agency for Healthcare Research and Quality, editor. AHRQ Quality Indicators - Guide to Inpatient Quality Indicators: Quality of Care in Hospitals - Volume, Mortality, and Utilization. Rockvile, MD: Agency for Healthcare Research and Quality; 2004. 54-56.

(755) Luepker RV, Apple FS, Christenson RH, Crow RS, Fortmann SP, Goff D et al. Case definitions for acute coronary heart disease in epidemiology and clinical research studies: a statement from the AHA Council on Epidemiology and Prevention; AHA Statistics Committee; World Heart Federation Council on Epidemiology and Prevention; the European Society of Cardiology Working Group on Epidemiology and Prevention; Centers for Disease Control and Prevention; and the National Heart, Lung, and Blood Institute. Circulation 2003; 108(20):2543-2549.

(756) Gilbert M, Thimus A, Roger-France FH, Jeanjean M, Camberlain C, Mertens I et al. L'infarctus du myocarde/Myocardinfarct. In: Gilbert M, Thimus A, Roger-France FH, Camberlain C, Mertens I, Figeys A et al., editors. Validité des données hospitalières pour leur exploitation en épidémiologie/ De validiteit van ziekenhuisgegevens voor gebruik in de epidemiologie. SSTC/AG/10/031 ed. Bruxelles/Brussel: Agora; 2004. 10-13.

(757) Van de WF, Ardissino D, Betriu A, Cokkinos DV, Falk E, Fox KA et al. Management of acute myocardial infarction in patients presenting with ST-segment elevation. The Task Force on the Management of Acute Myocardial Infarction of the European Society of Cardiology. Eur Heart J 2003; 24(1):28-66.

(758) Krumholz HM, Wang Y, Mattera JA, Wang Y, Han LF, Ingber MJ et al. An administrative claims model suitable for profiling hospital performance based on 30-day mortality rates among patients with an acute myocardial infarction. Circulation 2006; 113(13):1683-1692.

(759) Stenestrand U, Lindback J, Wallentin L. Long-term outcome of primary percutaneous coronary intervention vs prehospital and in-hospital thrombolysis for patients with ST-elevation myocardial infarction. JAMA 2006; 296(14):1749-1756.

(760) Gandjour A, Kleinschmit F, Lauterbach KW. European comparison of costs and quality in the treatment of acute myocardial infarction (2000-2001). Eur Heart J 2002; 23(11):858-868.

Literatuur

391

(761) Harrell FE, Jr., Lee KL, Califf RM, Pryor DB, Rosati RA. Regression modelling strategies for improved prognostic prediction. Stat Med 1984; 3(2):143-152.

(762) Shwartz M, Ash AS. Evaluating Risk-Adjustment Models Empirically. In: Iezzoni LI, editor. Risk Adjustment for Measuring Health Care Outcomes. Third ed. Chicago, IL: 2003. 231-273.

(763) Eagle KA, Lim MJ, Dabbous OH, Pieper KS, Goldberg RJ, Van de WF et al. A validated prediction model for all forms of acute coronary syndrome: estimating the risk of 6-month postdischarge death in an international registry. JAMA 2004; 291(22):2727-2733.

(764) Salomaa V, Miettinen H, Niemela M, Ketonen M, Mahonen M, Immonen-Raiha P et al. Relation of socioeconomic position to the case fatality, prognosis and treatment of myocardial infarction events; the FINMONICA MI Register Study. J Epidemiol Community Health 2001; 55(7):475-482.

(765) Kunst AE, Groenhof F, Mackenbach JP, Health EW. Occupational class and cause specific mortality in middle aged men in 11 European countries: comparison of population based studies. EU Working Group on Socioeconomic Inequalities in Health. BMJ 1998; 316(7145):1636-1642.

(766) Zijlstra F. Does it matter where you go with an acute myocardial infarction? Eur Heart J 2001; 22(19):1764-1766.

(767) Kostis WJ, Demissie K, Marcella SW, Shao YH, Wilson AC, Moreyra AE. Weekend versus weekday admission and mortality from myocardial infarction. N Engl J Med 2007; 356(11):1099-1109.

(768) Aelvoet W, Vanoverloop J, Molenberghs G, Schoeters G, van Sprundel M. Adequacy of Routinely Collected Data for the Assessment of the Reproductive Health of a Community Living in the Neighbourhood of Two Household Refuse Incinerators: a Critical Case Study. Arch Public Health 2005; 63:259-278.

(769) Thomas DC. The problem of multiple inference in identifying point-source environmental hazards. Environ Health Perspect 1985; 62:407-414.

(770) Wartenberg D, Greenberg M. Detecting disease clusters: the importance of statistical power. Am J Epidemiol 1990; 132(1 Suppl):S156-S166.

(771) Neutra RR. Counterpoint from a cluster buster. Am J Epidemiol 1990; 132(1):1-8.

(772) Olsen SF, Martuzzi M, Elliott P. Cluster analysis and disease mapping--why, when, and how? A step by step guide. BMJ 1996; 313(7061):863-866.

(773) Kulldorff M, Athas WF, Feurer EJ, Miller BA, Key CR. Evaluating cluster alarms: a space-time scan statistic and brain cancer in Los Alamos, New Mexico. Am J Public Health 1998; 88(9):1377-1380.

Literatuur 392

(774) Geschwind SA, Stolwijk JA, Bracken M, Fitzgerald E, Stark A, Olsen C et al. Risk of congenital malformations associated with proximity to hazardous waste sites. Am J Epidemiol 1992; 135(11):1197-1207.

(775) Dolk H, Vrijheid M, Armstrong B, Abramsky L, Bianchi F, Garne E et al. Risk of congenital anomalies near hazardous-waste landfill sites in Europe: the EUROHAZCON study. Lancet 1998; 352(9126):423-427.

(776) Fielder HMP, Poon-King CM, Palmer SR, Moss N, Coleman G. Assessment of impact on health of residents living near the Nant- y-Gwyddon landfill site: retrospective analysis. BMJ 2000; 320(7226):19-22.

(777) Schoeters G, Cornelis C, De Fré R, Hooghe R, Collier M, Maes C et al. Studie van gezondheidsaspecten en gezondheidsrisico's ten gevolge van de milieuverontreiniging in de Neerlandwijk te Wilrijk. 1998/TOX/R/009., 1-139. 1998. Mol, VITO.

(778) Birnbaum LS. Workshop on perinatal exposure to dioxin-like compounds. V. Immunologic effects. Environ Health Perspect 1995; 103 Suppl 2:157-160.

(779) Fries GF, Paustenbach DJ. Evaluation of potential transmission of 2,3,7,8- tetrachlorodibenzo-p-dioxin-contaminated incinerator emissions to humans via foods. J Toxicol Environ Health 1990; 29(1):1-43.

(780) Neubert R, Maskow L, Webb J, Jacob-Muller U, Nogueira AC, Delgado I et al. Chlorinated dibenzo-p-dioxins and dibenzofurans and the human immune system. 1. Blood cell receptors in volunteers with moderately increased body burdens. Life Sci 1993; 53(26):1995-2006.

(781) Koopman-Esseboom C, Weisglas-Kuperus N, de Ridder MA, Van der Paauw CG, Tuinstra LG, Sauer PJ. Effects of polychlorinated biphenyl/dioxin exposure and feeding type on infants' mental and psychomotor development. Pediatrics 1996; 97(5):700-706.

(782) Kogevinas M, Becher H, Benn T, Bertazzi PA, Boffetta P, Bueno-de-Mesquita HB et al. Cancer mortality in workers exposed to phenoxy herbicides, chlorophenols, and dioxins. An expanded and updated international cohort study. Am J Epidemiol 1997; 145(12):1061-1075.

(783) Feeley MM. Workshop on perinatal exposure to dioxin-like compounds. III. Endocrine effects. Environ Health Perspect 1995; 103 Suppl 2:147-150.

(784) Egeland GM, Sweeney MH, Fingerhut MA, Wille KK, Schnorr TM, Halperin WE. Total serum testosterone and gonadotropins in workers exposed to dioxin. Am J Epidemiol 1994; 139(3):272-281.

Literatuur

393

(785) Weisglas-Kuperus N. Neurodevelopmental, immunological and endocrinological indices of perinatal human exposure to PCBs and dioxins. Chemosphere 1998; 37(9-12):1845-1853.

(786) Peper M, Klett M, Frentzel-Beyme R, Heller WD. Neuropsychological effects of chronic exposure to environmental dioxins and furans. Environ Res 1993; 60(1):124-135.

(787) Mukerjee D. Health impact of polychlorinated dibenzo-p-dioxins: a critical review. J Air Waste Manag Assoc 1998; 48(2):157-165.

(788) James WH. Re: "Male pesticide exposure and pregnancy outcome". Am J Epidemiol 1999; 149(3):290-291.

(789) Williams FL, Lawson AB, Lloyd OL. Low sex ratios of births in areas at risk from air pollution from incinerators, as shown by geographical analysis and 3- dimensional mapping. Int J Epidemiol 1992; 21(2):311-319.

(790) Mocarelli P, Brambilla P, Gerthoux PM, Patterson DG, Needham LL. Change in sex ratio with exposure to dioxin. Lancet 1996; 348(9024):409.

(791) Hansen D, Moller H, Olsen J. Severe periconceptional life events and the sex ratio in offspring: follow up study based on five national registers. BMJ 1999; 319(7209):548-549.

(792) Clapp R, Ozonoff D. Where the boys aren't: dioxin and the sex ratio. Lancet 2000; 355(9218):1838-1839.

(793) Mocarelli P, Gerthoux PM, Ferrari E, Patterson DG, Kieszak SM, Brambilla P et al. Paternal concentrations of dioxin and sex ratio of offspring. Lancet 2000; 355(9218):1858-1863.

(794) James WH. Re: "Total serum testosterone and gonadotropins in workers exposed to dioxin". Am J Epidemiol 1995; 141(5):476-7; discussion 477-8.

(795) Nessel CS, Butler JP, Post GB, Held JL, Gochfeld M, Gallo MA. Evaluation of the relative contribution of exposure routes in a health risk assessment of dioxin emissions from a municipal waste incinerator. J Expo Anal Environ Epidemiol 1991; 1(3):283-307.

(796) Pleus RC, Kelly KE. Health effects from hazardous waste incineration facilities: five case studies. Toxicol Ind Health 1996; 12(2):277-287.

(797) Lloyd OL, Lloyd MM, Williams FL, Lawson A. Twinning in human populations and in cattle exposed to air pollution from incinerators. Br J Ind Med 1988; 45(8):556-560.

Literatuur 394

(798) Rydhstroem H. No obvious spatial clustering of twin births in Sweden between 1973 and 1990. Environ Res 1998; 76(1):27-31.

(799) James WH. Secular trends in monitors of reproductive hazard. Hum Reprod 1997; 12(3):417-421.

(800) Knox E. Childhood cancers, birthplaces, incinerators and landfill sites. Int J Epidemiol 2000; 29(3):391-397.

(801) Savitz DA. Environmental exposures and childhood cancer: our best may not be good enough. Am J Public Health 2001; 91(4):562-563.

(802) Neutra RR. Epidemiology for and with a distrustful community. Environ Health Perspect 1985; 62:393-397.

(803) Weinberg CR, Wilcox AJ. Reproductive Epidemiology. In: Rothman KJ, Greenland S, editors. Modern Epidemiology. Second ed. Philadelphia: Lippincott Williams & Wilkins; 1998. 585-608.

(804) Staines A, Järup L. Health event data. In: Elliott P, Wakefield JC, Best NG, Briggs DJ, editors. Spatial Epidemiology: Methods and Applications. Oxford: Oxford University Press; 2000. 15-29.

(805) De Wals P, Vincotte-Mols M, Lys F, Borlee I, Lechat MF. [Evaluation of the registration of congenital abnormalities in Belgian civilian vital statistics]. Arch Belg 1987; 45(11-12):441-451.

(806) Sedman RM, Esparza JR. Evaluation of the public health risks associated with semivolatile metal and dioxin emissions from hazardous waste incinerators. Environ Health Perspect 1991; 94:181-187.

(807) Hill AB. Statistical Evidence and Inference. In: Hill AB, editor. A Short Textbook of Medical Statistics. London: Hodder and Stoughton; 1977. 285-296.

(808) Rothman KJ, Greenland S. Causation and Causal Inference. In: Rothman KJ, Greenland S, editors. Modern Epidemiology. Second ed. Philadelphia: Lippincott Williams & Wilkins; 1998. 7-28.

(809) Buekens P, Derom R, De Wals P. Perinatal health in Belgium: an introduction. Biol Neonate 1989; 55(1):6-9.

(810) Oakes MW. Statistical Inference. One Newton Executive Park,Newton Lower Falls: One Newton Epidemiology Resources Inc.; 1990.

(811) SAS Institute Inc. The LOGISTIC Procedure. In: SAS Institute Inc., editor. SAS/STAT User's Guide, Version 6. Fourth ed. Cary, NC: SAS Institue Inc.; 1989. 1071-1126.

Literatuur

395

(812) Rothman KJ. A sobering start for the cluster busters' conference. Am J Epidemiol 1990; 132(1 Suppl):S6-13.

(813) Quataert PK, Armstrong B, Berghold A, Bianchi F, Kelly A, Marchi M et al. Methodological problems and the role of statistics in cluster response studies: a framework. Eur J Epidemiol 1999; 15(9):821-831.

(814) McMahon B, Trichopoulos D. Epidemiology: Principles and Methods. 2 ed. Boston: Little, Brown and Company; 1996.

(815) Dolk H, De Wals P. Congenital Anomalies. In: Elliott P, Cuzick J, English D, Stern R, editors. Geographical and Environmental Epidemiology: Methods for Small- Area Studies. Oxford: Oxford University Press.; 1992. 72-88.

(816) Rothman KJ, Greenland S. Measures of Disease Frequency. In: Rothman KJ, Greenland S, editors. Modern Epidemiology. Second ed. Philadelphia: Lippincott Williams & Wilkins; 1998. 29-46.

(817) Schwartz J. Harvesting and long term exposure effects in the relation between air pollution and mortality. Am J Epidemiol 2000; 151(5):440-448.

(818) Hertz-Picciotto I. Environmental Epidemiology. In: Rothman KJ, Greenland S, editors. Modern Epidemiology. Second ed. Philadelphia: Lippincott Williams & Wilkins; 1998. 555-583.

(819) Bennett P. Understanding responses to risk: some basic findings. In: Bennett P, Calman K, editors. Risk communication and public health. Oxford University Press; 2001. 3-19.

(820) Rothenberg RB, Thacker SB. Guidelines for the investigation of clusters of adverse health events. In: Elliott P, Cuzick J, English D, Stern R, editors. Geographical and Environmental Epidemiology: Methods for Small- Area Studies. Oxford: Oxford University Press.; 1992. 264-277.

(821) Dolk H. Commentary: impact on health needs assessing from different angles. BMJ 2000; 320(7226):23.

397

Curriculum vitae Willem H. G. Aelvoet MD, MPH, MSc(Biost.), geboren:14/02/1947.

Ervaring:

I Sinds 1/11/2000 tot op heden.

Geneesheer-statisticus op de F.O.D. Volksgezondheid, Veiligheid van de Voedselketen en

Leefmilieu - DG1 - Datamanagement - Cel Studies, verantwoordelijke voor de cel studies

en belast met analyses en rapportage van de Minimale Klinische Gegevens (MKG).

Voornaamste opdrachten : uitwerken en begeleiden van klinische performance indicatoren

en methodologische ondersteuning bij de kwaliteitsbewaking van de MKG.

Vanaf het academisch jaar 2002-2003 tot op heden: verstrekken van een cursus over

Gezondheidsindicatoren voor de “Interuniversitaire opleiding Geneesheer specialist in het

beheer van gezondheidsgegevens.”

II 1987 tot oktober 2000 Verantwoordelijk voor de Geboorte en Sterftestatistiek van

Vlaanderen

Verantwoordelijk voor de kwaliteitsbewaking van het coderen, het verzamelen, verwerken

en rapporteren van de geboorte- en overlijdensstatistieken ten behoeve van het

gezondheidsbeleid.

Voornaamste verwezenlijkingen: centralisatie en evaluatie van het codeergebeuren; tijdige

rapportage van de geboorte- en overlijdensstatistieken onder vorm van

gezondheidsindicatoren met inbegrip van risicogedrag (bijvoorbeeld Tabaksgerelateerde

mortaliteit);

III Projectleider: Projet Centre d'Instruction Médicale de Maroua, Kameroen, 1980-6.

Werkte mee aan het ontwikkelen van en was verantwoordelijk voor het uitvoeren van een

geïntegreerd eerstelijns en tweedelijns gezondheidzorg pilootproject in het Diamaré

district.

IV Geneesheer-directeur van het rurale ziekenhuis Miabi en zijn attractie-zone, Zaire

1972-1979.

Curriculum vitae 398

Opleiding:

Diploma Instelling Jaar

Master of Science in Biostatistics Limburgs Universitair

Centrum

1994

Statistical, Epidemiological and Operational

Methods Applied in Medicine and Public

Health

Université Libre de Bruxelles 1987

Maîtrise en Santé Publique IMT, Antwerpen 1977

Diploma Tropische Geneeskunde ITG, Antwerpen 1971

Doctor in de Genees-, Heel- en Verloskunde Katholieke Universiteit

Leuven

1971

Cursussen & Workshops

1) Longitudinal Data Analysis januari-maart 2005 Censtat, UHasselt

2) Workshop on Statistical Inference. LUC Diepenbeek: April 10-12,2000.

3) Bayes and Empirical Bayes methods for data analysis. KUL, TA Louis: Dec. 9/11/1998

4) Spatial Statistical Methods in Epidemiology. A. Lawson: March 24-26/1998 at BCT-

KUL.

5) Exact Methods for Contingency Tables and Logistic Regression. C. Mehta: 9/06/1995.

Hasselt.

6) Fourth International Course on Ageing. A. Kalache, London School of Hygiene &

Tropical Medecine: 30 August-23 September 1988

399

Literatuurlijst Willem AELVOET

ARTIKELS

Lauwers P, Aelvoet W, Sneppe R, Remion M. Effect of car driving on the

electrocardiogram of patients with myocardial infarction and an E.C.G. at rest devoid of

dysrhythmia and repolarisation abnormalities: comparison with the E.C.G. changes

obtained during exercise. Acta Cardiol. 1973;28(1):27-43.

Aelvoet W, Humblet PC, Lagasse R. Het in routine gebruik maken van een

geïnformatiseerd controleprogramma als middel tot kwaliteitsbewaking van de statistieken

van de burgerlijke stand in Vlaanderen. Arch Public Health 1991;49:1-8.

Snacken R, Lion J, Van Casteren V, Cornelis R, Yane F, Mombaerts M, Aelvoet W,

Stroobant A. Five years of sentinel surveillance of acute respiratory infections (1985-

1990): the benefits of an influenza early warning system. Eur J Epidemiol. 1992

Jul;8(4):485-90.

Van Oyen H, Aelvoet W, Tafforeau J. Overlijdenspatroon in het Vlaamse Gewest.

Tijdschrift voor Geneeskunde 1993; 49:821-828

Beutels M, Van Damme P, Aelvoet W, Desmyter J, Dondeyne F, Goilav C, Mak R,

Muylle L, Pierard D, Stroobant A, Van Loock F, Waumans P, Vranckx R.

Prevalence of hepatitis A, B and C in the Flemish population. Eur J Epidemiol. 1997

Apr;13(3):275-80.

De Henauw S, de Smet P, Aelvoet W, Kornitzer M, De Backer G. Misclassification of

coronary heart disease in mortality statistics. Evidence from the WHO-MONICA Ghent-

Charleroi Study in Belgium. J Epidemiol Community Health 1998;52:513-9.

Literatuurlijst Willem Aelvoet 400

Aelvoet W, Capet F, Vanoverloop J. Verhoogde sterfte in het arrondissement

Dendermonde. Kunnen overlijdensstatistieken hierover uitsluitsel brengen? Tijdschrift

voor Geneeskunde 1998;54:1548-57.

Moens G, Capet F, Aelvoet W, Van Oyen H, Drieskens S, Van Casteren V. De recente

evolutie van suïcidaal gedrag in Vlaanderen. Tijdschrift voor Geneeskunde 1999; 55(2):96-

104.

Aelvoet W, Wildemeersch D. De peilpraktijken en het gezondheidsbeleid: een

toekomstperspectief voor de Vlaamse overheid. Huisarts Nu 1, 46-47. 2000.

Aelvoet W. On the use of administrative databases to support planning activities: a

comment. Eur.J.Public Health 2005;15:215 (letter).

Aelvoet W, Molenberghs G, van Sprundel M. Mortality Statistics in Belgium 1980-1997:

Quality of coding. Arch Public Health 2005;63:127-48.

Aelvoet W, Vanoverloop J, Molenberghs G, Schoeters G, van Sprundel M. Adequacy of

Routinely Collected Data for the Assessment of the Reproductive Health of a Community

Living in the Neighbourhood of Two Household Refuse Incinerators: a Critical Case

Study. Arch Public Health 2005;63:259-78.

Aelvoet W, Terryn N, Windey F, Redivo M, Faes C. Miscoding a threat to the hospital care

system: how detect it ? Submitted RESP,2007.

Aelvoet W, Windey F, Molenberghs G, Verstraelen H, Van Reempts P, Foidart JM.

Screening for inter-hospital differences in cesarean section rates in low-risk deliveries

using administrative data. An initiative to improve the quality of care. BMC Health

Services Research 2008;8(1);3.

Literatuurlijst Willem Aelvoet

401

HOOFDSTUKKEN IN BOEK

Aelvoet W. Mortaliteitsstatistieken voor een gezondheidsbeleid. In Nijs H, Denekens J,

eds.Preventieve Gezondheidszorg, pp 914-21. Diegem Editorial: Kluwer, 1997.

Depoorter AM, Aelvoet W, Bogaerts K, Capet F, De Greef M, Dewolf D et al.

Gezondheidgegevens m.b.t. de jeugd in Vlaanderen. In: Nijs H, Denekens J, editors.

Preventieve Gezondheidszorg. Diegem Editorial: Kluwer; 1997. 942-968.

Aelvoet W. Mortinataliteit en zuigeligensterfte. In Van Der Haeghe H, ed. Over sterfte, pp

69-80. Brussel: CBGS, 1991.

RAPPORTEN

Aelvoet W. Essai de rationalisation d’un service médical de zone rurale au Zaire

MPH Thesis. IMT/ITG Antwerpen 1977

Aelvoet, W. Vital Statistics in Flanders. An Exploration of Possible Biases due to Coding

and Certification Practices. 1-46. 1994. MSc Thesis. Limburgs Universitair Centrum.

Van Oyen H., Tafforeau J., Aelvoet W., Felten G.: Overlijden en oorzaakspecifiek

overlijden in de Vlaamse Gemeenschap 1987. Brussel: COOV, IHE, 1992.

Tafforeau J, Van Oyen H, Drieskens S, Demoulin P, Pirenne Y, Aelvoet W et al.

Statistiques de décès en communauté francaise: 1987. 1992. Bruxelles, CROSP, IHE.

Van Oyen H., Tafforeau J., Aelvoet W., Felten G.: Overlijden en oorzaakspecifiek

overlijden in de Vlaamse Gemeenschap 1988. Brussel: COOV, IHE, 1994.

Van Oyen H., Drieskens S., Tafforeau J., Aelvoet W., Felten G.: Geboorten, perinatale

sterfte en kindersterfte, 1987. Brussel. COOV, IHE, 1994.


Tafforeau J, Van Oyen H, Drieskens S, Squilbin G, Demoulin P, Aelvoet W. Naissancces,

mortalité périnatale et infantile: statistiques 1988 et 1989. 1996. Bruxelles, CROSP, IHE.

Capet F, Bogaerts K, Aelvoet W. Verwerking Registratiegegevens van het Medisch

Schooltoezicht. Lengte en gewicht. 1996. Brussel, Ministerie van de Vlaamse

Gemeenschap.

Tafforeau J, Van Oyen H, Drieskens S, Demoulin P, Pirenne Y, Aelvoet W et al.

Statistiques de décès en communauté francaise: 1989-1991. 1997. Bruxelles, CROSP,

IHE.

Aelvoet W, Nelen V, Schoeters G, Vanoverloop J, Wallijn E, Vlietinck R:

Risico op gezondheidsschade bij kinderen van de Neerlandwijk te Wilrijk.

Rapport 1998/TOX/R/030, 1998.

Aelvoet, W., Bogaert, J., Gillet, P., and Molenberghs, G. Bepaling van de invloed van

sociale factoren en van het individuele ziekenhuis op de verblijfsduur in de sector van de

acute ziekenhuizen, aan de hand van de gekoppelde MKG- en MFG-1996. 2001. Brussel,

Ministerie van Sociale Zaken, Volksgezondheid en Leefmilieu.

Baert, E., Byttebier, G., De Backer, G., Van Oyen, H., Aelvoet, W., and De Henauw, S.

Ontwikkeling van geïntegreerde gezondheidsindicatoren op basis van bestaande Vlaamse

gegevens in zake ziekte en gezondheid. PBO/UG/43, 1-98. 2001. Gent, RUG.

Aelvoet, W., Mertens, I., and van Sprundel, M. Uitwendige oorzaken in de Minimale

Klinische Gegevens. 2002. Brussel, FOD Volksgezondheid, Veiligheid van de

Voedselketen en Leefmilieu.

Kirkhove P, Gillet P, Terryn N, Aelvoet W. Des Audits Aléatoires à des Audits Ciblés. Le

Bulletin 2002; http:/www.health.fgov.be/vesalius/devnew/FR/prof/news/bulletin/

(acceeded 15/06/2005):1-9.

http://www.health.fgov.be/vesalius/devnew/FR/prof/news/bulletin/

Literatuurlijst Willem Aelvoet

403

Aelvoet, W., Dargent, G., Delvaux, A., Iweins, F., Terryn, N, Mertens, I, and van Sprundel,

M. Human, social and economic costs due to non-fatal motor vehicle traffic accidents. An

approach based on routinely collected data. 2003. FOD Volksgezondheid, Veiligheid van

de Voedselketen en Leefmilieu.

Aelvoet W, Terryn N, Windey F, Loosen F, Faes C, Molenberghs G et al. Audit MKG en

fraudeopsporing - ontwikkeling van een methodologie. 1-45. 2006. Brussel, FOD

Volksgezondheid, Veiligheid van de Voedselketen, Leefmilieu.

Aelvoet W, Terryn N, Windey F, Loosen F. MKG en screening van problemen i.v.m.

performance/kwaliteit van zorgen. 1-24. 2006. Brussel, FOD Volksgezondheid,

Veiligheid van de Voedselketen, Leefmilieu

Aelvoet W, Terryn N, Windey F, Loosen F. Keizersnedencijfer (IQI 21). 1-28. 2006.

Brussel, FOD Volksgezondheid, Veiligheid van de Voedselketen, Leefmilieu.

Aelvoet W, Terryn N, Windey F, Loosen F. Laparoscopische Cholecystectomie (IQI 23).

1-24. 2006. Brussel, FOD Volksgezondheid, Veiligheid van de Voedselketen, Leefmilieu

Aelvoet W, Terryn N, Windey F, Loosen F. Intraziekenhuis letaliteit na opname voor

Acuut Myocardinfarct (AMI) (IQI 15 en IQI 15 en IQI 32). 1-27. 2006. Brussel, FOD


Aelvoet W, Terryn N, Windey F, Loosen F. Ziekenhuisletaliteit na een opname voor

Pneumonie (Community-Acquired Pneumonia) (CAP) (IQI 20). 1-26. 2006. Brussel, FOD


Aelvoet W, Terryn N, Windey F, Loosen F. Ziekenhuisletaliteit na opname voor

Heupfractuur (IQI 19). 1-25. 2006. Brussel, FOD Volksgezondheid, Veiligheid van de

Voedselketen, Leefmilieu.


GEZONDHEIDSINDICATOREN VLAAMSE GEMEENSCHAP

Aelvoet W. Gezondheidsindicatoren 1993. Brussel: Ministerie van de Vlaamse

Gemeenschap., 1995.

Aelvoet W. Bogaerts K, Capet F. Gezondheidsindicatoren 1994. Brussel: Ministerie van de

Vlaamse Gemeenschap., 1996.

Aelvoet W, Bogaerts K, Capet F, Quataert PK. Gezondheidsindicatoren 1995. Brussel:

Ministerie van de Vlaamse Gemeenschap., 1997.

Aelvoet W, Capet F, Vanoverloop J. Gezondheidsindicatoren 1996. Brussel: Ministerie van

de Vlaamse Gemeenschap., 1998.

Aelvoet W, Fortuin M, Hooft P, Vanoverloop J. Gezondheidsindicatoren 1997. Brussel:

Ministerie van de Vlaamse Gemeenschap., 1999.

Aelvoet W, Cloots H, Fortuin M, Hooft P, Vanoverloop J. Gezondheidsindicatoren 1998.

Brussel: Ministerie van de Vlaamse Gemeenschap., 2000.