FACULTEIT GENEESKUNDE
AMBTELIJKE REGISTRATIES VOOR EEN EVALUATIEF
GEZONDHEIDSBELEID.
ASPECTEN VAN BELEIDSONDERBOUWING OP LANDELIJK,
INTERMEDIAIR EN LOKAAL NIVEAU
Proefschrift voorgelegd tot het behalen van de graad van doctor in de medische wetenschappen aan de Universiteit Antwerpen te verdedigen door
WILLEM AELVOET
Promotor: Prof.dr.Marc van Sprundel (Universiteit Antwerpen)
Co-promotor: Prof.dr.Geert Molenberghs (Universiteit Hasselt)
Antwerpen, 2008
2
Samenstelling van de PhD jury
Promotoren:
prof. dr. M. van Sprundel Universiteit Antwerpen
prof. dr. G. Molenberghs Universiteit Hasselt
Doctoraatscommissie:
prof. dr. L. Bossaert Voorzitter Universiteit Antwerpen
prof. dr. M. Elseviers Universiteit Antwerpen
prof. dr. H. Meulemans Universiteit Antwerpen
Externe leden:
prof. dr. G. De Backer Universiteit Gent
prof. dr. J. Kips Katholieke Universiteit Leuven
Ambtelijke registraties voor een evaluatief gezondheidsbeleid. Aspecten van
Beleidsonderbouwing op landelijk, intermediair en lokaal niveau
Willem Aelvoet
ISBN 978-90-5728-087-0 Vakgroep Epidemiologie en Sociale Geneeskunde Faculteit Geneeskunde Universiteit Antwerpen Universiteitsplein 1 B-2610 Antwerp Belgium E-mail [email protected]
3
INHOUDSOPGAVE
Samenstelling van de PhD jury ...............................................................................2 Inhoudsopgave ......................................................................................................3
Dankwoord.........................................................................................................................5
Lijst van afkortingen.........................................................................................................8
Glossarium .......................................................................................................................10
Inleiding: Een door evaluatie bijgestuurd gezondheidsbeleid.....................................12
DEEL I: KRITISCHE LITERATUURSTUDIE ..........................................................17
Hoofdstuk 1: Administratieve gegevensbanken: kwaliteit van de gegevens ..............19 1.1 Het beoordelen van de kwaliteit van gegevens..................................................21 1.2 Doodsoorzakenstatistiek. Kwaliteit en volledigheid van de gegevens. ................59 1.3 Besluit ..........................................................................................................71
Hoofdstuk 2: Gebruik van administratieve gegevensbanken in een perspectief van een kwaliteitsvol volksgezondheidsbeleid......................................................................73
2.1 Kwaliteit........................................................................................................76 2.2 Benadering gebaseerd op kwaliteitsindicatoren.................................................89 2.3 Benadering gebaseerd op incidenten. .............................................................115 2.4 Het ontsluiten van kwaliteitsindicatoren. .......................................................125 2.5 Besluit .........................................................................................................139
Hoofdstuk 3: Methodologische aspecten .....................................................................141 3.1 Audit: Statistische Methodologie...................................................................141 3.2 Statistische aandachtspunten bij het omgaan met en rapporteren van kwaliteitsgegevens: kleine aantallen, correlatie, case mix variatie en meervoudig gelijktijdig toetsen. ............................................................................................156 3.3 Methoden voor het beoordelen van kwaliteit/performance...............................160 3.4 Besluit .........................................................................................................173
DEEL II: CASUSSEN...................................................................................................175
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België: overlijdensstatistieken en MKG...................................................................................177
4.1 Kwaliteit van codering en certificatie in Vlaanderen en België, 1980-1997.......177 4.2 Kwaliteit van de gegevens in een prospectief financieringssysteem..................197 4.3 Algemeen besluit..........................................................................................217
4
Hoofdstuk 5: Kwaliteit van zorgen ...................................................................219 5.1 Inleiding: Kwaliteit van zorgen, organisatorische cultuur en adequate gegevens.219 5.2 Kan het screenen voor interziekenhuis verschillen in keizersnedencijfer bij laagrisico verlossingen door middel van administratieve gegevens bijdragen tot kwaliteitsinitiatieven in de gezondheidszorg? ......................................................226 5.3 Interziekenhuis vergelijking van letaliteitcijfers na een opname voor acuut myocardinfarct. .................................................................................................268 5.4 Kwaliteit van zorgen: Algemeen Besluit ........................................................298
Hoofdstuk 6: Complementariteit van gegevensbanken. Gebruik van routinematig verzamelde gegevens om de reproductieve gezondheid te beoordelen in een gemeenschap gevestigd rond twee verbrandingsovens ..............................................301
6.1. Inleiding .....................................................................................................302 6.2 Methoden ....................................................................................................304 6.3 Resultaten....................................................................................................307 6.4 Bespreking...................................................................................................313 6.5 Besluit .........................................................................................................317
ALGEMEEN BESLUIT EN AANBEVELINGEN.....................................................319
SAMENVATTING........................................................................................................323
SUMMARY....................................................................................................................327
Literatuur.......................................................................................................................331
Curriculum vitae Willem H. G. Aelvoet ......................................................................397
Literatuurlijst Willem AELVOET ..............................................................................399
5
Dankwoord
Pas op het einde van je proefschrift realiseer je hoeveel mensen, elk op hun manier,
bijgedragen hebben tot het ontstaan en welslagen ervan. Dan pas ga je beseffen dat het
dankwoord niet alleen een academische geplogenheid is maar een te summiere weergave
van een groeiproces dat je nooit alleen zou voltooid hebben.
Van harte wil ik mijn promotoren Prof.dr. M. van Sprundel en Prof. dr. G. Molenberghs
bedanken. Zij hebben mij aangemoedigd om dit avontuur te beginnen, door te zetten in
ogenblikken van ontmoediging en te voltooien. Tijdens deze zesjarige tocht hebben ze mij
begeleid in mijn zoektocht naar oplossingen voor de problemen die zich stellen wanneer je
met administratieve gegevens werkt, en me geholpen wanneer ik in de knoei geraakte. Van
Prof. dr. van Sprundel leerde ik aandacht te schenken aan het detail en toch de grote lijn
niet uit het oog te verliezen. Hij uitte zijn bedenkingen en suggesties op een altijd
vriendelijke en rustgevende manier. Prof. dr. G. Molenberghs was de statistische behoeder
van dit proefschrift, een klankbord en hulp voor het proefschrift in zijn geheel. Met beide
promotoren heb ik aan een aantal projecten gewerkt onder meer de Neerland studie, de
codeerstudie, het keizersnedencijfer en het letaliteitcijfer na een opname voor een acuut
myocardinfarct. Maar bovenal waren beide promotoren altijd “bereikbaar”, waarvoor ik
hen zeer dankbaar ben.
Veel andere mensen hebben op een of ander ogenblik een rol gespeeld in mijn
ontwikkeling naar toegepast wetenschappelijk onderzoek. De professoren P. Mercenier en
H. Van Balen leerden mij wat volksgezondheid is. Professor Lagasse begeleidde mijn
eerste stappen in het schrijven van een wetenschappelijke tekst. De professoren H.
Callaert, N. Veraverbeke en P. Jansen, verwelkomden en gaven raad aan een overjaarse
ambtenaar met Grieks-Latijnse roots om niet helemaal verloren te lopen in de wereld van
de statistiek.
Professor A. Meheus en de vakgroep ESOC hebben mij over mijn laatste aarzeling
geholpen om eraan te beginnen. Aan allen mijn dank.
6
Zonder Frieda, Josie, Rita, Luc, Peter, Francis, Karel en Johan, mijn collega’s van de
Vlaamse Gemeenschap, zou het codeerverhaal nooit het licht gezien hebben. Ook Nathalie
T, Nathalie V, Francis L. en Francis W., Greet H., mijn collega’s van de FOD
Volksgezondheid, dank ik voor de steun, het geduld met een soms zenuwachtig celhoofd,
het nalezen en aanvullen van teksten en de samenwerking aan de eerste multidimensionele
feedback aan de ziekenhuizen. Mijn dank ook aan Dr. I. Mertens, mijn diensthoofd, die mij
inwijdde in de complexe wereld van de Minimale Klinische Gegevens.
Graag wil ik ook de mensen bedanken die met mij de Neerlandstudie tot een goed einde
brachten: Dhr J. Vanoverloop, Dr. G. Schoeters en de Professoren M. van Sprundel en G.
Molenberghs.
Voor de studie over het keizersnedencijfer kon ik rekenen op de hulp van mijn collega
Francis Windey (hij maakte onder meer de database aan, een hele opdracht) en van de
Professoren P. Van Reempts, H. Verstraelen, G.Molenberghs en J.M.Foidart; voor het
AMI-gerelateerde letaliteitcijfer op collega Nathalie Terryn (zij stelde de database samen,
deed de meeste analyses en realiseerde de oefening over de transfer van AMI patiënten) en
de input van de Professoren J.L.Van Overschelde, C.Vrints, G.De Backer en M.van
Sprundel. Voor de studie over miscoding dank ik mijn collega’s auditeurs en in het
bijzonder Myriam, mijn collega’s van de cel Studies en Dr C. Faes.
Verder een blijde gedachte aan de collega’s van de dienst Datamanagement. Zij waren
steeds bereid om te helpen en het ambtelijk leven te doen leven.
Ook dank aan mij hiërarchische oversten, die mij de gelegenheid gaven mij te verdiepen in
de noodzakelijke literatuur om de voormelde studies te onderbouwen.
Een warme gedachte aan mijn overleden ouders, die mij een warm nest bezorgden en de
mogelijkheid gaven om te studeren, aan mijn schoonvader, mijn schoonzoon, mijn
(schoon)zussen en (schoon)broers, (schoon)tantes en schoonoom.
7
Tenslotte ben ik aan Martine, Evelyne en Christian, Thomas en Kathy, en Stéphane veel
verschuldigd voor de warmte die ze me gaven tijdens het langdurige proces dat tot dit
proefschrift leidde en waarbij zij al te vaak verwaarloosd werden.
Martine gaf mij sterkte, ook wanneer zij meer nodig had dan de hulp die ik haar gaf. Ik
hoop het goed te kunnen maken.
8
Lijst van afkortingen ACOG American College of Obstetricians and Gynecologists AHRQ Agency for Healthcare Research and Quality AIM Acuity Index Method AMI Acuut MyocardInfarct AMI-LC Letaliteitcijfer tgv AMI APACHE Acute Physiology And Chronic Health Evaluation AP-DRG All Patients Diagnosis Related Groups APR-DRG All Patients Refined Diagnosis Related Groups AROC Area under the Receiver Operating Characteristic curve BI (OG;BG) Betrouwbaarheidsinterval (Ondergrens; Bovengrens) CABG Coronary Artery Bypass Graft CAD Coronary Artery Disease CEA Carotisendarterectomie CHD Coronary Heart Diseases (Coronaire hartaandoeningen) CHF Congestive Heart Failure COLD Chronic Obstructive Lung Disease CQI Continuous Quality Improvement CR Comparability ratio CSI Computerized Severity Index CVA CerebroVasculair Accident DRG Diagnosis Related Groups GEE Generalized Estimating Equations HCFA Health Care Financing Administration HMO Health Maintenance Organization ICC Intraclass Correlation Coefficient ICD-9(-CM) International Classification of Diseases, Ninth Revision, (Clinical
Modification) IHD Ischemic Heart Diseases (Ischemische hartziekten) IQI Inpatient Quality Indicators KS Keizersneden KSC Keizersnedencijfer LBTB Linker Bundel Tak Blok MAS Meconium Aspiratie Syndroom MKG Minimale Klinische Gegevens MMPS Medicare Mortality Predictor System MONICA Multinational Monitoring of Trends and Determinants in Cardiovascular
Disease NEC Not Elsewhere Classified NHQR National Healthcare Quality Report NICU Neonatal Intensif Care Unit NIS Nationaal Instituut voor de Statistiek NOS Not Otherwise Specified NPV Negative Predictive Value (negatieve voorspellende waarde) NSTEMI Niet- ST segment Elevatie MyocardInfarct OR (OG;BG) Odds Ratio (Ondergrens; Bovengrens)
9
PCI Percutaneous Coronary Intervention PMC Patient Management Categories PPCI Primary Percutaneous Coronary Intervention PPS Prospective Payment System, Prospectief financieringssysteem PPV Positive Predictive Value (positieve voorspellende waarde) PSI Patient Safety Indicators PTCA Percutaneous Transluminal Coronary Angioplasty (balloon) QI Quality Indicator (Kwaliteitsindicator) RDS Respiratory Distress Syndrome (Hyaliene membraanziekte) ROC Receiver Operating Characteristic curve ROM Risk of mortality RR Relatief Risico SOI Severity of illness SCD Sudden Cardiac Death SES Sociaal-economische Status SMR Standardised Mortality Ratio SPE Studiecentrum Perinatale Epidemiologie STEMI ST segment Elevatie MyocardInfarct TTN Tachypnee van de neonaat VBAC/VBS Vaginal Birth After Cesarean (Section)/Vaginale Bevalling na Sectio VRGT Vlaamse Vereniging voor Respiratoire Gezondheidszorg en
Tuberculosebestrijding ZH Ziekenhuis
10
Glossarium
TERM Definitie/Omschrijving
Administratieve gegevens
alle types en bronnen van gegevens bedoeld voor de administratie (van de gezondheidszorg)
Benchmark een benchmark is een methode om de prestatie van verschillende systemen, apparaten of organisaties met elkaar te kunnen vergelijken.
Capitation vast periodiek bedrag per patiënt
Case mix is een manier om het product of de output van een ziekenhuis te definiëren door klinisch homogene groepen van patiënten te identificeren, die een zelfde “pakket” behandelingen, testen en diensten gebruiken.1
Diagnosis Related Group (DRG)
Case mix maat die in het prospectieve financieringssysteem (PPS) van Medicare gebruikt wordt voor de omschrijving van ziekenhuisdiensten en gebaseerd is op de hoofddiagnose, nevendiagnoses, chirurgische ingrepen, leeftijd, geslacht en de aanwezigheid van complicaties.”2
Fee for service terugbetaling per prestatie
Health Maintenance Organization
voor een vast periodisch bedrag per patiënt worden gezondheidszorgen verstrekt aan de leden ongeacht de diensten die werkelijk verstrekt werden
Major Diagnostic Category (MDC)
Mutueel exclusieve categorieën van hoofddiagnoses, gegroepeerd per lichaamsstelsel, die de basis vromen voor de DRGs
Managed care Zorgmanagement
Doeltreffendheid Beantwoordt de vraag in welke mate een behandeling het beoogde resultaat bereikt. Men onderscheidt de "potentiële doeltreffendheid" ("efficacy") van een behandeling/programma van zijn "reële doeltreffendheid" ("effectiveness") op basis van het feit dat ze vastgesteld wordt in een experimentele gecontroleerde context (klinische studie), die in ideale omstandigheden uitgevoerd werd, en niet gemeten werd na een werkelijke toepassing van de behandeling/ programma op bevolkingsniveau.
Doelmatigheid "Rendement" van een collectief uitgeoefende medische activiteit; verband tussen de kosten (financiële, menselijke en materiële hulpbronnen) van die activiteit en de voordelen voor de betrokken bevolking (afname van de morbiditeit of sterfte, individueel lijden en ongelijkheid t.o.v. de ziekte)
11
Epidemiologie Geneeskundige discipline waar de factoren bestudeerd worden die een rol spelen bij het optreden van ziekten en de verschillende ziekteverschijnselen alsmede de frequentie ervan, de geografische en sociaal-economische spreiding en de evolutie
Letaliteit Verhouding dodelijke gevallen van een aandoening op het aantal gediagnosticeerde gevallen
Mortaliteit Aantal sterfgevallen ten gevolge van een bepaalde ziekte binnen de bevolking, in het algemeen gedurende een jaar,
Statistische significantie
Verschil vastgesteld tussen twee groepen patiënten of ingrepen enz., is statistisch relevant op niveau 5% (of 1%) als er minstens 5% (of 1%) kans is dat dit aan toeval te wijten is
Vertekening Term in de statistiek en de epidemiologie voor de verborgen oorzaak van een fout of een onduidelijke factor leidend tot een verkeerde logische conclusie, een onvrijwillige vooringenomenheid bij de waarnemer (“confounding”)
Inleiding
12
Inleiding: een door evaluatie bijgestuurd gezondheidsbeleid
Na een jarenlange activiteit als analist van de doodsoorzakenstatistieken en de Minimaal
Klinische Gegevens (MKG) leek het ogenblik gekomen om stimulerende concepten,
bevindingen en voorbeelden op het terrein en uit de literatuur, en ook de ervaring en
inzichten, die progressief gegroeid zijn, te bundelen. Vermits de gegevens uit deze
registraties noodzakelijk geacht worden voor de onderbouwing van de beleidsvoering3-7
en mijn beroepsactiviteit zich voornamelijk op dat terrein situeert, leek een onderzoek naar
het beleidsonderbouwend potentieel van administratieve gegevensbanken hiervoor de
geschikte vorm. De bruikbaarheid van administratieve gegevensbanken ten behoeve van
het beleid en niet het beleid zelf vormen bijgevolg het centrale onderwerp van dit
proefschrift. Naarmate het proefschrift vorderde werd het duidelijk dat het beleid in een
brede betekenis diende verstaan te worden en met name dat het zich op meerdere niveaus
situeert te weten het centrale, het intermediaire (zoals de “Begeleidingscommissie voor
ziekenhuisperformantie” en de “Colleges van geneesheren”) en het lokale (zoals
ziekenhuisdirecties).
Een gezondheidsbeleid kan op verschillende wijzen geconcipieerd worden. Als mogelijke
uitgangspunten kunnen bijvoorbeeld de optimalisering van het bestaande zorgensysteem8,
evidence-based medecine9;10 of kostenbeheersing11;12 geciteerd worden. Welk ook het
vertrekpunt is, steeds dienen er keuzes gemaakt en alternatieven afgewogen te worden.
Hiervoor zijn betrouwbare gegevens van fundamenteel belang.
Niet alleen dient men over gegevens te beschikken, zij moeten ook ingebed worden in een
toepassingskader. Evaluatie lijkt hiervoor aangewezen.6;13 Zij laat immers het voeren van
een coherent gezondheidsbeleid toe, dat op ieder ogenblik aangepast kan worden in functie
van de evoluerende gezondheidsproblemen en van de beschikbare middelen.
Een door evaluatie bijgestuurd gezondheidsbeleid is een cybernetisch concept.14 Het
wordt, in zijn meest elementaire vorm, schematisch weergegeven in figuur 1.
Prioritaire gezondheidsproblemen worden geïdentificeerd, grote streefdoelen gedefinieerd
en vertaald in concrete doelstellingen. Activiteiten worden gepland en de nodige middelen
voorzien. Resultaten worden vergeleken met de doelstellingen (doeltreffendheid) en met
de gebruikte middelen (doelmatigheid). Naast doeltreffendheid en doelmatigheid wordt
Inleiding
13
ook de impact nagegaan, die door Reinke gedefinieerd wordt als de ratio van de totale
uitkomsten over de output of het effect per eenheid van dienstverlening.6 De pertinentie
van de geplande activiteiten wordt beoordeeld ten opzichte van de concrete doelstellingen,
de concrete
Figuur 1: Schematische voorstelling van een door evaluatie bijgestuurd gezondheidsbeleid. 3 ⇓ 3 ⇓ 3 ⇓ ⇘ ⇓ 2 1
Prioritaire gezondheidsproblemen
Streefdoelen
Concrete doelstellingen
Activiteiten
Middelen
Resultaten
1) doeltreffendheid
2) doelmatigheid
3) relevantie, pertinentie, geëigendheid
doelstellingen ten opzichte van de grote streefdoelen, die op hun beurt getoetst worden aan
de prioritaire gezondheidsproblemen. Deze relevantietoetsing wordt van bij de eerste stap
in het planningsproces doorgevoerd en een positief toetsingsresultaat is telkens de
Inleiding
14
noodzakelijke voorwaarde voor het zetten van de volgende stap in dit proces. Zo zijn
bijvoorbeeld relevante streefdoelen de noodzakelijke voorwaarde om doelstellingen te
kunnen formuleren. Tenslotte wordt het billijkheidsbeginsel6;15;16 (“equity”) gehanteerd, dat
in iedere fase van het cybernetisch proces en bij elke afweging een belangrijke rol speelt.
De prioritaire gezondheidsproblemen vormen het vertrekpunt van deze evaluatiecyclus en
kunnen als volgt op bondige wijze omschreven worden. Gezondheidsproblemen worden
prioritair genoemd indien ze frequent en ernstig zijn, wanneer er een operationeel
uitvoerbare en aanvaardbare oplossing voor bestaat, als ze door het beleid en door de
bevolking als ernstig gepercipieerd worden en wanneer de evolutie ervan in stijgende lijn
gaat. De ernst wordt niet alleen uitgedrukt in termen van morbiditeit, tijdelijke of blijvende
beperkingen, en mortaliteit maar ook in economische en sociale kosten.14
De rol van ambtelijke registraties in de evaluatiecyclus bestaat voornamelijk in het
verstrekken van gegevens over de frequentie en ernst van prioritaire
gezondheidsproblemen benevens output en uitkomstgegevens voor de doelmatigheid- en
doeltreffendheidanalyses en voor de toetsing van het billijkheidsbeginsel6;7;17-20 Dit gebeurt
op een routinematige manier zodat ook de evolutie over de tijd kan gevolgd worden.
Het is duidelijk dat de doodsoorzakenstatistieken en MKG een noodzakelijke maar te
smalle basis vormen voor een onderbouwd gezondheidsbeleid. Dit heeft niet alleen nood
aan een breder spectrum van gezondheidsgegevens maar onder meer ook aan
sociaaldemografische en economische gegevens, aan gegevens over personeelsbezetting en
personeelsvooruitzichten, over de verwachtingen en het zich betrokken weten van de
gemeenschap, over sociale en beroepsorganisaties en over de politieke context.15
Kwaliteit van de gegevens was een eerste aandachtspunt. We meenden echter dat de
kwaliteitsbewaking van gegevens geen alleenstaande activiteit was maar diende gezien te
worden in een wisselwerking met hun gebruik. Rapporten in verband met uitwendige
oorzaken van morbiditeit en mortaliteit21, de invloed van sociale factoren op de
verblijfsduur22, de klinische indicatoren (zie hoofdstuk 5) en de invloed van de uitstoot van
verbrandingsovens op de reproductieve gezondheid van de buurtbewoners (zie hoofdstuk
6) hebben niet alleen lacunes van de MKG en doodsoorzakenstatistiek aangetoond maar
gaven tevens een aanzet tot hun verbetering. De aandacht ging hierbij zowel naar
Inleiding
15
verbetering van de gegevensverzameling en van de gegevensanalyse als naar de
gegevensdoorstroming en -uitwisseling tussen registraties.23;24 Het effectief gebruik van
administratieve gegevens voor evaluatieve of volksgezondheidskundige doeleinden laat
bijgevolg niet alleen een bijsturing toe van de te verstrekken promotionele, preventieve en
curatieve zorgen maar maakt tevens gegevensbeperkingen zichtbaar zodat ook de
gegevenskwaliteit gecorrigeerd kan worden.
Vervolgens laat deze verbetering op haar beurt een fijnere evaluatie van de kwaliteit van
zorgen op individueel en populatieniveau toe. Deze wisselwerking tussen het evaluatieve
gebruik van administratieve gegevens en bewaking van hun kwaliteit kan een opwaartse
spiraal van het gezondheidssysteem helpen schragen.
Waar gezondheidsgegevens in België wel voorhanden zijn, is hun toegankelijkheid vaak
een probleem. De probleemstelling in verband met de verbrandingsoven in Wilrijk, die
verder in dit werk aan bod komt, de zoektocht naar de nodige gegevens voor de berekening
van Disability Adjusted Life Years25 en het project Milieu en Gezondheid26zijn er
voorbeelden van.
Maar in afwachting dat alle nodige gegevens beschikbaar zijn en hun betrouwbaarheid
getoetst is, moet er beleid gevoerd worden.27 Het is dan zaak het beschikbare materiaal
voor het beleid te operationaliseren, er de volledigheid en accuratesse van aan te geven en
tevens de gegevensbanken maximaal inpasbaar te maken in een volwaardig
gezondheidsinformatiesysteem15;24;28.
Meer concreet trachten we een antwoord te geven op volgende onderzoeksvragen:
1) In welke mate zijn de registratiegegevens kwaliteitsvol?
2) Gegeven hun beperkingen, zijn deze gegevens bruikbaar voor de beleidsondersteuning?
3) Hoe kan deze bruikbaarheid verbeterd worden?
Dit proefschrift heeft de bedoeling een bijdrage te leveren bij het onderzoek naar een
wetenschappelijk verantwoord gebruik van administratieve gegevens. Daarnaast heeft het
ook de bedoeling aan de verantwoordelijken voor het gezondheidsbeleid en hun
medewerkers bruikbare informatie en voorbeelden te verschaffen over het omgaan met en
verbeteren van administratieve gegevens.
Inleiding
16
Vandaar ook de bewuste keuze het proefschrift in het Nederlands te schrijven.
Ons operationeel onderzoek situeert zich op lokaal, intermediair en centraal niveau en
dient geplaatst te worden in de cybernetische, evaluatieve benadering die we hierboven
geschetst hebben.
Het is duidelijk dat we in deze bundeling van elementen uit de literatuur en uit eigen
onderzoek slechts een zeer beperkt aantal elementen van de globale opzet hebben kunnen
ontwikkelen. We hopen verder op deze manier enkele aanzetten te geven voor verder te
ondernemen acties en voor verdere, meer diepgaande reflecties.
Het proefschrift werd dan als volgt opgebouwd. In een eerste deel, een literatuurstudie,
wordt onderzocht hoe de kwaliteit van de gegevens in administratieve gegevensbanken
onderzocht en verbeterd kan worden en in welke mate dit soort gegevens bruikbaar zijn
voor de beoordeling van ziekenhuiszorgen. Een hoofdstuk wordt gewijd aan
methodologische aspecten en voornamelijk het identificeren van “outlying” ziekenhuizen.
In het tweede deel worden de besproken concepten en methoden gebruikt om een inzicht
trachten te geven in de beperkingen en de mogelijkheden van twee Belgische
gegevensbanken op gebied van beleidsonderbouwing, en geeft aan dat het samenbrengen
van gegevens uit verschillende registraties soms noodzakelijk is voor het beantwoorden
van een beleidsvraag.
DEEL I: KRITISCHE LITERATUURSTUDIE
18
De uitgevoerde literatuurstudie werd niet systematisch van in het begin uitgevoerd, maar
was een stapsgewijze verkenning waarin de kwaliteit van de gegevens bestudeerd werd in
een operationele benadering vertrekkend van de diagnosestelling tot de opslag van de
gegevens.
De ruggengraat hiervoor werd geleverd door het boek “Problem Solving. A Statistician's
Guide. ” van C. Chatfield.23Andere boeken29-31, rapporten21;32-34, proefschriften35;36 en
gerichte opzoekingen via Pubmed onderbouwden het hoofdstuk over kwaliteit van de
gegevens. Er werd daarbij telkens aandacht geschonken aan voordelen en beperkingen van
administratieve gegevens, en aan alternatieve gegevensbronnen. Ook zochten we steeds
naar methoden voor de verbetering van gegevenskwaliteit.
Ook voor de kwaliteit van de zorgen was de gevolgde benadering operationeel.
Vertrekpunt hierbij was het project “Inpatient Quality Indicators”37 van de Agency for
Healthcare Research and Quality (AHRQ) in samenwerking met de Stanford University,
dat voorzien is van een omvangrijke literatuurlijst. Dit werd aangevuld met gerichte
opzoekingen in Pubmed voornamelijk over types en ontwikkeling van
kwaliteitsindicatoren, kwaliteit van zorgen, interziekenhuis vergelijkingen,
ziekenhuismortaliteit. Voor de besproken indicatoren werd de onderbouwing van de
indicator uit het Amerikaanse model aangevuld door verder te bouwen op de AHRQ
indicator en het actualiseren van de vermelde literatuur. Speciale aandacht werd telkens
besteed aan de beperkingen van de gegevens, het bestaan van en de toepassing van
richtlijnen en de vertaling van het Amerikaans model naar de Belgische situatie.
De literatuur in verband met interziekenhuisvergelijkingen en kwaliteitsindicatoren, en het
boek “Applied Logistic Regression” van Hosmer en Lemeshow38 hebben het
methodologisch hoofdstuk onderbouwd.
Wegens de niet onbeperkte toegang tot de literatuur van sommige
beleidsverantwoordelijken werd er naar getracht voor sommige methodologische en
conceptuele begrippen meerdere bronnen te vermelden die via Pubmed of Google vrij ter
beschikking worden gesteld.
19
Hoofdstuk 1: Administratieve gegevensbanken: kwaliteit van de gegevens
Een door evaluatie bijgestuurd gezondheidsbeleid rendeert optimaal in een systemische
benadering van de volksgezondheid, die steunt op de complementariteit van
gezondheidsbevordering, ziektepreventie en curatie, en die voor het aanpakken van
prioritaire gezondheidsproblemen, waar nodig, beroep doet op samenwerking buiten het
gezondheidssysteem.39 Zo zijn sterfte en invaliditeit ten gevolge van verkeersongevallen
een vanzelfsprekend voorbeeld van prioritaire gezondheidsproblemen, die een
intersectorale aanpak vereisen.
Beleid werd in het verleden echter vaak strikt sectoraal gevoerd. In de ziekenhuissector
bijvoorbeeld werden de toe te kennen toelagen voor ziekenhuisdiensten berekend in
functie van de bevolkingstoename, van verhoogd gebruik van diensten, van technologische
imperatieven en politieke druk.15 De evaluatie van de gezondheidszorg bestond
voornamelijk uit de kritische beoordeling van uitkomstgegevens van bepaalde
behandelingen en van de kwaliteit van zorgen in de instellingen, maar niet van de
gezondheid van bevolkingen.15 Dergelijke benadering gaat ervan uit dat de noden op
gebied van gezondheidszorgen op een gelijkmatige manier verdeeld zijn over de bevolking
en dat gezondheidszorg de kritische determinant van gezondheid is. Dat dit een onjuiste
veronderstelling is, blijkt uit de zwakke relatie, die er bestaat, tussen enerzijds de sterk
stijgende gezondheidsuitgaven, onder meer voor kankerbestrijding en voor kostelijke
hoogtechnologische onderzoeken en geneesmiddelen, en anderzijds de gezondheid van de
bevolking.15;40 Deze medisch-technische benadering gaat immers voorbij aan sociaal-
economische factoren en hun complexe relatie met dienstengebruik.41-54 Hoe beter we
echter de complexe determinanten van gezondheid begrijpen, hoe meer
aanknopingspunten we hebben om onze inspanningen te richten op de verbetering van de
gezondheid van de ganse bevolking of van specifieke doelgroepen.55
Om over te gaan van een klassieke, vraaggestuurde en ziekenhuisgecentreerde benadering,
naar een meer behoeftegestuurd en bevolkingsgericht gezondheidsbeleid is een degelijk
gezondheidsinformatiesysteem (Health Information System of HIS) nodig. In afwezigheid
ervan dient de aanwezige gezondheidsinformatie optimaal gebruikt te worden en kan een
Hoofdstuk 1: Administratieve gegevensbanken
20
HIS progressief opgebouwd worden uit de bestaande registraties en vervolledigd waar
nodig. Idealiter dient een HIS informatie te verschaffen over de gezondheid van de
bevolking, over de sociaal-economische risicofactoren, over het gebruik van
gezondheidsdiensten en uitgaven van de gezondheidszorg, en over de middelen die voor de
gezondheidszorg ter beschikking worden gesteld.10;15;24;28
Hierin krijgen secundaire gegevensbanken een belangrijke rol toebedeeld. Secundaire
gegevens zijn, niet door de onderzoekers zelf, maar door andere personen/instanties
verzamelde gegevens, waarvan de oorspronkelijke bedoeling niet het beschrijven van de
gezondheidsstatus van de betrokken persoon was maar die wel relevante
gezondheidsinformatie kan bevatten.56-59 Voorbeelden hiervan en tevens onderwerpen van
dit proefschrift zijn de ontslaggegevens van ziekenhuizen en overlijdenscertificaten.57 Zo is
naast facturatie het beschrijven van de ziekenhuisactiviteiten een vaak voorkomend
doeleinde van een ziekenhuisregistratie en zijn daarentegen kwaliteitsbewaking en
informatie rond morbiditeit, diagnosen en behandelingen vaak geen oorspronkelijke maar
wel afgeleide doeleinden van ziekenhuisregistratie.57;60-62Onze registratie van de Minimaal
Klinische Gegevens (MKG) bijvoorbeeld heeft zowel een financieel als een
kwaliteitsbevorderend doeleinde.3 Geboorte- en overlijdensberichten, waarvan de
oorspronkelijke bedoeling het melden van een geboorte of het bekomen van de toelating
tot begraving was, leveren daarenboven informatie die gebruikt wordt voor het monitoren
van de gezondheid.35;56;62-68
In het kader van dit proefschrift zullen we voor ziekenhuisontslaggegevens, geboorte- en
overlijdenscertificaten de vaak gebruikte term administratieve gegevens gebruiken.61;69 De
combinatie van deze administratieve gegevens met demografische en sociaal-economische
gegevens, en gegevens over milieuverontreiniging maakt het mogelijk sterfte- en
ziektecijfers te berekenen en rekening te houden met verstorende variabelen en
covariaten.15 Zo kunnen er rond de toegankelijkheid van diensten vragen gesteld worden,
kan er aan de hand van verschillen in behandelingspatronen over streken, waarvan de
bewoners nochtans een gelijkaardige gezondheidsstatus hebben, een antwoord gegeven
worden op vragen naar geëigende cijfers voor ingrepen, behandelingswijzen of
ziekenhuisopnamen.13;15;47;70-77Op basis van de Statistieken van de Burgerlijke Stand (1996)
Hoofdstuk 1: Administratieve gegevensbanken
21
konden we bijvoorbeeld vaststellen dat kinderen van Turkse moeders een groter risico op
kindersterfte vertoonden. 35
Deze transitie van louter administratieve gegevensbanken naar beleidsonderbouwende
gegevensbronnen is reeds begonnen. Ziekenhuisgegevens worden in toenemende mate
gebruikt voor het vervaardigen van rapporten over morbiditeit, mortaliteit en
activiteitencijfers.78 Ook moeten zij het mogelijk maken uitspraken te doen over de
kwaliteit en de uitkomsten van de verstrekte zorgen, en dienen het
financieringsmechanisme van het zorgensysteem, vaak in een optiek van kostenbeheersing,
te onderbouwen.15;79-83 Een laatste veld van toepassingen van administratieve
ziekenhuisgegevens betreft de evaluatiemogelijkheden, die ze bieden, voor andere sectoren
van de volksgezondheid zoals het functioneren van de eerste lijn en de impact van de
getroffen preventieve maatregelen.77;84-92
Maar zijn de administratieve gegevensbanken inderdaad bruikbaar voor deze doeleinden?
Aan de hand van literatuurgegevens trachten wij zowel de kwaliteit van administratieve
gegevens te omschrijven als hun bruikbaarheid in een perspectief van volksgezondheid aan
te tonen.
1.1 HET BEOORDELEN VAN DE KWALITEIT VAN GEGEVENS.
Er bestaat een groeiende consensus dat een gegevensbank, bestaande uit elektronische
patiënten dossiers, het ideale instrument is voor het verzamelen van kwaliteitsvolle
gegevens ten behoeve van een efficiënt zorgmanagement (“managed care”). De concrete
uitwerking van dit model echter, heeft te kampen met een aantal vooralsnog onvoldoend
opgeloste problemen onder meer in verband met privacy en beroepsgeheim; de beveiliging
van de gegevens; de noodzakelijkheid om een gestandaardiseerde inhoud te definiëren en
de kosten waarmee een dergelijk systeem gepaard gaat.82 In afwachting wordt er beroep
gedaan op administratieve gegevensbanken om kosten en performance te monitoren en de
zorgverleners terug te betalen. Waar zij in de eerste plaats bedoeld zijn voor de facturatie
van ziekenhuizen en hoewel zij ook nuttige patiëntengegevens registreren 26, worden in
Hoofdstuk 1: Administratieve gegevensbanken
22
deze benadering administratieve gegevensbanken gebruikt als proxy voor klinische
gegevensverzameling over kwaliteit en uitkomst van zorgen.82;93
De kwaliteit van de methoden die gebruikt worden voor het verzamelen van deze gegevens
en hun verdere verwerking wordt derhalve belangrijker.79 Voor de onderzoeker, die van
dergelijke gegevensbanken gebruik wil maken, bestaat de grootste uitdaging erin te
bepalen of die secundaire gegevensbronnen voldoende accurate en valide informatie
bevatten.94 Studies van de zeventiger jaren toonden immers aan dat gegevens zoals leeftijd,
geslacht, datum van opname en van ontslag zeer accuraat geregistreerd werden maar dat
het coderen van ingrepen en vooral van diagnosen minder betrouwbaar was. Ook in meer
recente studies blijven de auteurs zich verder vragen stellen omtrent de accuratesse van het
coderen van diagnosen 95 en over de validiteit van de diagnosen.96-99 Een andere reden van
bekommernis betreft de validiteit van de besluiten van studies in aanwezigheid van
verstorende variabelen. Zo stelt men zich de vraag of de vastgestelde verschillen tussen
artsen, ziekenhuizen en behandelingen reëel zijn of artefacten te wijten aan vertekening
door verschillen in case mix of risicofactoren, die niet meetbaar zijn via administratieve
gegevens.80;100-105
Hoewel er in de wetenschappelijke literatuur zeer groot belang gehecht wordt aan de
kwaliteit van de gegevens, bestaat er minder eenduidigheid over de inhoud van
verschillende aspecten van kwaliteit. Termen zoals accuratesse en precisie worden als
synoniemen gebruikt, validiteit wordt op verschillende manieren gedefinieerd en
betrouwbaarheid, herhaalbaarheid en reproduceerbaarheid worden vaak door elkaar
gebruikt.9 Ook de in deze context belangrijke term codering kan in de literatuur rond de
ziekenhuisfinanciering het ganse proces van de diagnosestelling, als de abstrahering en het
omzetten van de geabstraheerde medische termen in codevorm (codering stricto sensu)
omvatten.
Om zoveel mogelijk alle dubbelzinnigheid te vermijden aangaande termen en concepten
wordt in de voorliggende tekst de terminologie overgenomen van “A Dictionary of
Epidemiology”, een boek gesponsord door de International Epidemiological Association.9
Voor niet in het woordenboek voorkomende termen en begrippen, of bij gebruik van een
Hoofdstuk 1: Administratieve gegevensbanken
23
van het woordenboek afwijkende terminologie, wordt telkens de bron van de gebruikte
betekenis aangegeven.
Verder menen wij dat een korte omschrijving van enkele begrippen aangaande medische
gegevens op zijn plaats is. Ook hier heerst er soms onduidelijkheid wegens een niet
eenduidige terminologie. Een vaak gebruikte term, maar met een wisselende inhoud, is die
van het “medical record”. Soms gaat het hierbij over een elektronische gegevensopslag,
die door getraind personeel geabstraheerd werd uit het medisch dossier van een patiënt, de
“chart”, en dit gewoonlijk zonder input van de geneesheer.9 Elders wordt de term ook
gebruikt voor het medisch dossier in artsenkantoren of ziekenhuizen waarop zorgverleners
diagnoses, klinische details en het ziekteverloop noteren.61 Tenslotte wordt de term ook
gebruikt zonder te vermelden of het gaat over een elektronisch medisch dossier of niet60;63,
kent men er beide betekenissen aan toe 106;107 of wordt er ook gesproken over papieren
medical records.108 De physician billing databases, zijn een elektronische gegevensopslag
van facturatiegegevens meestal afgeleid van het operatieverslag. Naast de chart houden
artsen er soms nog een “daily log”, een persoonlijk dagboek, op na.109
Administratieve gegevens worden door Garnick et al61 gedefinieerd als “vorderingen
geregistreerd door private of publieke betalers, opgeslagen verslagen bewaard door
organisaties van zorgmanagement of rapporten van ziekenhuisopnamen aan
staatsagentschappen.” Dezelfde auteurs stellen dat het onderscheid tussen administratieve
en klinische gegevensbanken minder scherp wordt wegens twee ontwikkelingen. Enerzijds
maken technologische ontwikkelingen het mogelijk dat klinische resultaten gemakkelijk
kunnen geregistreerd worden en anderzijds worden in de publieke en privaatsector
gegevensbestanden met zowel administratieve als klinische gegevens ontwikkeld om
gemakkelijk de vragen van de overheid over het ziekenhuisgebeuren te kunnen
beantwoorden. Scerbo et al.2 definiëren administratieve gegevens als “alle gegevenstypes
en –bronnen, die bedoeld zijn voor de administratie van gezondheidsgegevens”.
In de volgende paragrafen zullen we trachten op basis van literatuurgegevens een
referentiekader voor het beoordelen van kwaliteit van administratieve en
mortaliteitsgegevens uit te werken en methoden van onderzoek en ervaringen op dit gebied
weer te geven.
Hoofdstuk 1: Administratieve gegevensbanken
24
1.1.1 Uitwerking van een referentiekader voor de beoordeling van administratieve gegevens.
Kwaliteit van gegevens is een relatief begrip, dat geoperationaliseerd kan worden door
middel van volgende vraag: “Laten deze gegevens toe een antwoord te geven op de
gestelde vragen?”.23 Het is duidelijk dat een vraag over de voornaamste
gezondheidsproblemen in een land niet dezelfde kwalitatieve eisen stelt aan een
gegevensbank als een vraag over de evolutie van die gezondheidsproblemen of over het
relatief belang van het subendocardiaal infarct in de groep van ischemische
hartaandoeningen. Het identificeren van de voornaamste gezondheidsproblemen vraagt
slechts een benaderende grootteorde, waar er voor het schetsen van een evolutie een meer
precieze omschrijving nodig is, zij het in tamelijk grove categorieën, en er voor het derde
type probleem een grote accuratesse van de gegevens vereist is. Verder is het zo dat aan
een gegevensbestand van een duizendtal records in de context van een gerandomiseerde
klinische studie hogere kwaliteitseisen gesteld worden dan aan een MKG-bestand van
meer dan een miljoen observaties. In het eerste geval is het immers vrijwel steeds
mogelijk tot het medisch dossier terug te gaan voor verificatie en eventuele verbetering,
waar dit in het tweede geval slechts in beperkte mate zo is.
De kwaliteit van de gegevens wordt beïnvloed door de manier waarop deze gegevens
verzameld worden: de weergave van het diagnose-behandelingsproces in het medisch
dossier, de extractie van de opgeslagen informatie en omzetting ervan in codevorm aan de
hand van de codeerregels van het gebruikte classificatiesysteem. We komen hier verder
uitvoerig op terug. Verder is het vanzelfsprekend dat de kwaliteit ook sterk beïnvloed
wordt door de context waarbinnen de registratie zich voordoet (kwaliteitsbewakend,
epidemiologisch of financieel), de manier waarop de gegevens verzameld worden en de
werklast, die de gegevensverzameling met zich meebrengt. Zo beschrijft Chatfield de
gegevensverzameling van de ambtelijke statistieken als volgt: “At the time of writing
there has been an explosion in the amount of data that hospital managers are trying to
collect in the UK so that nurses and doctors spend a high proportion of their time in
completing poorly designed forms rather than treating patients. Much of the information is
Hoofdstuk 1: Administratieve gegevensbanken
25
of dubious quality and some is never actually used. Insufficient attention has been given to
specifying objectives and to questionnaire design”.23
Wyatt omschrijft gegevenskwaliteit als volgt: “De mate waarin de items van de gegevens
accuraat zijn, volledig, relevant (beantwoorden de gegevens aan de doelen waarvoor ze
verzameld werden?), tijdig, voldoende gedetailleerd, op de juiste manier weergegeven
(bijvoorbeeld gecodeerd door middel van een klinisch codeersysteem), en met voldoende
contextuele informatie om het nemen van beslissingen toe te laten.” 110Het Federaal
Kenniscentrum voor de gezondheidszorg beoordeelde de kwaliteit van de Belgische
gegevensbanken in termen van toegankelijkheid en duidelijkheid (actuele informatie over
de gegevensbank in de vorm van metadata); relevantie en accuraatheid. Verdere
aandachtspunten waren de volledigheid; consistentie (relaties tussen de entiteiten van de
bank zijn constant zoniet verenigbaar); coherentie (de gegevens zijn gebaseerd op
gemeenschappelijke concepten, definities, classificaties); en, tijdigheid en punctualiteit
(naleven van de gemaakte afspraken i.v.m. oplevering van gegevens).32
Aan de hand van literatuurbevindingen zal derhalve getracht worden een evenwichtig
geheel van aandachtspunten en analysemethoden samen te stellen en tevens voldoende
vergelijkingsmateriaal te verzamelen om de kwaliteit van de gegevens van de in deze
studie gebruikte Belgische administratieve gegevensbanken en de resultaten van de erop
uitgevoerde analyses te toetsen.
1.1.1.1 Doeleinden van een registratie, verzamelwijze, diagnose, abstrahering en codering van de gegevens.
Om op een gefundeerde manier uitspraken te kunnen doen over de gegevenskwaliteit dient
men rekening te houden met de context waarbinnen en de doeleinden waarvoor ze
verzameld werden. Er bestaan verschillende methoden om gegevens te verzamelen:
steekproefsgewijs of exhaustief, via een questionnaire of via instructies (MKG of
bevolkingsstatistieken, in de Amerikaanse literatuur “vital statistics” genaamd). Het design
van de studie of van de bevraging is belangrijk in termen van interne en externe validiteit:
“Gaat het over een gerandomiseerd experiment of niet, of gaat het over een observationeel
onderzoek?” (cf. 1.1.8)
Hoofdstuk 1: Administratieve gegevensbanken
26
De manier van bevragen is belangrijk voor het bekomen van kwaliteitsvolle gegevens. Zo
zijn onder meer de formulering van de vragen en het type van vragen (open of gesloten)
belangrijk.62;111 Verder is de kwaliteit van de instructies voor het registreren van kapitaal
belang voor de analyse, die later uitgevoerd wordt: geen enkel veld van een gegevensbank
mag ingenomen worden door informatie, die op voorhand niet precies gedefinieerd werd.77
Het gebrek aan definities is een vaak opduikend probleem bij ziekenhuisregistraties, zeker
wanneer het gaat over essentiële begrippen zoals de (hoofd)diagnose.60 Toch is de
(hoofd)diagnose een essentieel en kritisch deel van het medisch dossier. Dit geldt zowel
voor het klinisch beleid (bvb. bij heropname, het uitwerken van richtlijnen), voor het
financieel beleid van het ziekenhuis en voor de volksgezondheid, meer bepaald voor het
evalueren van de zorgenbehoeften en van incidentie-evoluties in de bevolking.112-115
Na de diagnosestelling is het abstraheerproces van de administratieve gegevens uit het
patiëntendossier dikwijls een delicaat ogenblik bij de gegevensverzameling.116 Dit proces
wordt meestal uitgevoerd door gespecialiseerd personeel, dat echter zelf geen arts is, en
dit, wegens het vaak ontbreken van een abstraheervorm, meestal op een niet-
gestandaardiseerde manier. Overigens is het moeilijk om een abstraheervorm te ontwerpen
omdat patiëntendossiers complex zijn en op zeer individuele manier bijgehouden
worden.62
Verder is de kwaliteit van de gegevens functie van het gemak waarmee gegevens
geregistreerd kunnen worden en ook van het feit of de gegevens al dan niet uit
verschillende bronnen werden samengesmolten. In het laatste geval is het belangrijk na te
gaan of er bij de samensmelting inconsistenties werden vastgesteld en hoe ervoor
gecorrigeerd werd.23
Uiteindelijk dienen de medische gegevens voor hun verwerking in codevorm omgezet te
worden.114Dit is geen gemakkelijke taak en vereist een specifieke vorming, een
aanspreekpunt voor het beantwoorden van vragen i.v.m.codeerproblemen en een
regelmatige updating van de codeerinstructies.114;115
Hoofdstuk 1: Administratieve gegevensbanken
27
Daarnaast moeten regelmatige, grootschalige audits ervoor zorgen dat de codeerkwaliteit
bewaakt wordt.115We komen later in het vierde hoofdstuk, gewijd aan aan de
mortaliteitstatistieken (sectie 4.1) en de kwaliteit van de gegevens in een prospectief
financieringssysteem (sectie 4.2), meer in detail terug op de audit en de
codeerproblematiek.
1.1.1.2 Gegevensopslag (“Data Entry”).
“Since data entry precedes data utilization, the reliability of the information stored strongly
depends on the quality of data input. ”.116 Het is derhalve aangewezen om gebruik te
maken van technieken en routines, die erop gericht zijn het invoeren van foute gegevens of
het verloren gaan van gegevens te vermijden. Het lijkt bijvoorbeeld aanbeveling te
verdienen de invoer te herhalen van sleutelvariabelen, die de unieke omschrijving van een
record bepalen.116 Een interessanter alternatief is het automatiseren van de
gegevensopslag.116
De kwaliteit van de gegevens kan verbeterd worden door het gebruik maken van template
(automatisch overschrijven) en picture clausules (bvb. het omzetten van kleine letters in
hoofdletters) in formaatspecificaties, zodat bepaalde digits per definitie vastliggen (bvb M
voor een morfologiecode voor kankers) of dat bepaalde digits automatisch als hoofdletters
geregistreerd worden.116 Een verdere methode bestaat erin te controleren of het “domein”
van het “alfanumerisch” of “discreet” item gerespecteerd werd, of het “bereik” (de
“range”) van een continu item.77 De hoogste graad van gegevenszekerheid wordt bereikt
wanneer gegevens gegenereerd worden van reeds bestaande en gevalideerde gegevens
door een “procesroutine”: bijvoorbeeld het berekenen van een Body Mass Index op basis
van een gevalideerde lengte en gewicht.116
Een supplementaire manier om over kwalitatief goede gegevens te beschikken is de
optimalisatie van de gegevensopslag. Zij omvat onder meer: (1) een aangepast formaat
(indien mogelijk geen vrije tekst), (2) een onmiddellijk registreren op de formulieren, die
zullen dienen voor de gegevensinvoer om zoveel mogelijk transcriptiefouten van de
gegevens te verhinderen, (3) de scherm lay-out zoveel mogelijk laten gelijken op het
Hoofdstuk 1: Administratieve gegevensbanken
28
formulier, (4) het optisch inlezen, en (5) goede ergonomische voorwaarden.116 Met de
moderne technologie werden geautomatiseerde routines uitgewerkt die het mogelijk maken
een snelle en uitgebreide controle uit te voeren terzelfder tijd met de gegevensinvoer. Dit is
verkieselijk boven een controle in een latere fase van gegevensverwerking.116
1.1.1.3. Opsporen en omspringen met fouten en outliers.
“A result which looks interesting is probably wrong!”.23 Een outlier is een extreme
observatie, die niet consistent lijkt te zijn met andere gegevens: bijvoorbeeld iemand van
129 jaar of van 246 cm. Outliers kunnen bijvoorbeeld omschreven worden als de waarden
die buiten een gebied van waarden vallen, met als ondergrens: het eerste kwartiel –
(1.5*Interkwartiel bereik), en als bovengrens: het derde kwartiel + (1.5*Interkwartiel
bereik).117-119 Een outlier kan veroorzaakt zijn door een fout maar er bestaan ook echte
outliers. Deze komen voornamelijk voor wanneer een verdeling sterk asymmetrisch is en
de outlier uit de “lange” staart van de verdeling komt (bijvoorbeeld de verblijfsduur in
functie van een bepaalde Diagnosis Related Groups (DRG)).23
Er bestaan verschillende foutentypes: waarnemingsfout (bijvoorbeeld het slecht aflezen
van een instrument); tik- of schrijffout; transcriptiefout, een niet correcte kopij van een
observatie; inversiefout, wat bij codes belangrijk kan zijn bvb. 401 (hypertensie) versus
410 (AMI); herhaling van een observatie, die vaak gecombineerd is met de verwijdering
van een andere observatie; en tenslotte de falsificatie van een resultaat 23;60
Het insluipen van fouten kan ondanks maximale inspanningen niet vermeden worden.
Fouten dienen derhalve opgespoord te worden. Het lijkt aangewezen hiervoor optimaal
gebruik te maken van de gegevenseigenschappen om een aantal kwaliteitscontroles uit te
voeren, die gebaseerd zijn op het type (numeriek, alfabetisch of alfanumeriek) en de aard
(continu of discreet) van de meetbare gegevens. Een gegevenswoordenboek kan hierbij een
zeer nuttige rol spelen. Het gaat daarbij over een metagegevensbank waarin alle items
omschreven worden en hun eigenschappen bepaald.
Hoofdstuk 1: Administratieve gegevensbanken
29
Foute gegevens veroorzaken incoherenties en komen in conflict met een formele definitie,
of “fitten” niet met andere feiten: bvb. type van kanker is “onbekend” en het type van
differentiatie is “wel gedifferentieerd”.116 Dergelijke relationele controles zijn in geval van
nominale of ordinale variabelen meestal deterministisch: de relationele controle geeft aan
dat de geregistreerde waarde onverenigbaar is met de als “mogelijk” gedefinieerde
waarde(n). Zo kan een adenocanthoma alleen “welgedifferentieerd” zijn. In geval van
interval of ratio meetniveau of continue variabelen zal de controle meestal probabilistisch
zijn: bij een welgedifferentieerd adenocanthoma heeft de kortste kernas een lengte van 2
tot 12 μm. Een lengte korter dan 2 is onmogelijk (deterministisch) en een lengte van boven
de 12 is onwaarschijnlijk (probabilistisch).116
Voor de kwaliteitsbewaking van routinematig verzamelde gegevens wordt vaak beroep
gedaan op een probabilistische benadering door het opsporen en verbeteren van
“onwaarschijnlijke” waarden, de foutpositieven. De probabilistische benadering echter is
duidelijk gericht op de detectie van fout positieve gegevens. Nu dient de “verbetering” van
fout positieve gegevens afgewogen te worden tegen het bestaan van fout negatieve
gegevens.120 Het is dan belangrijk om te beoordelen of de voorgenomen verbetering ook
inderdaad een verbetering is.
Wij hebben dit probleem behandeld in een studie over de voorspellende waarde van het
geïnformatiseerde controleprogramma van de statistieken van de Burgerlijke Stand aan de
hand van gegevens van 1988 en dat als volgt gepubliceerd werd: “Aelvoet W, Humblet
PC, Lagasse R. Het in routine gebruikmaken van een geïnformatiseerd controleprogramma
als middel tot kwaliteitsbewaking van de statistieken van de burgerlijke stand in
Vlaanderen. Arch Public Health 1991;49:1-8. 120”
Nemen we als voorbeeld een record waarin bij een 20 jarige man een acuut myocard
infarct geregistreerd (AMI) werd. Op dergelijke leeftijd is een AMI een zeldzaamheid en
bestaat er het risico dat het over een fout positief geval gaat: er werd een code van AMI
geregistreerd voor een aandoening, die geen AMI was. Wat is dan de probabiliteit dat het
om een fout positief gegeven gaat?
Hoofdstuk 1: Administratieve gegevensbanken
30
Detectie en verbetering van foutpositieve waarden, de B van tabel 1 (vóór correctie), zijn
alleen nuttig indien de waarde A, beter de gezochte waarde A+C benadert dan de oude
waarde A+B, waarvan men vertrokken is.
Tabel 1: Vergelijking van de verdeling van een acuut myocardinfarct bij 20-jarige mannen zoals ze geregistreerd en gediagnosticeerd werd, vóór en na correctie. Theoretische benadering. Vóór “correctie” Na “correctie” Diagnose Diagnose
Aanwezig Afwezig Totaal Aanwezig Afwezig TotaalAanwezig A B A+B A - A
Ami in de Registratie Afwezig C D C+D C D* C+D* Totaal A+C B+D N A+C D* N
Indien de waarde van A+B = A+C is het duidelijk dat de nieuwe schatter A verder
verwijderd is van de gezochte waarde A+C, dan de oude schatter.
Een eventuele correctie is dus maar zinvol als A+B > A+C. Het nut van een eventuele
correctie houdt dan onmiddellijk verband met de relatieve waarde van B, de
foutpositieven, ten opzichte van C, de foutnegatieven. Vóór correctie wordt A+C, het
aantal personen met de aandoening, geschat door A+B, het aantal personen geregistreerd
met de aandoening. Door het controleren van alle personen met een registratie van AMI,
worden de fout positieve gevallen, de groep B, opgespoord en gereclasseerd in D. De D*,
in de tabel na correctie, is dus gelijk aan B+D van vóór de correctie. Wat verandert, is de
schatting van A+C, die na correctie nog uitsluitend geschat wordt door A. De
nuttigheidsdrempel van de verbetering wordt bereikt wanneer B, de groep van fout
positieven, gelijk is aan 2 maal C, de groep van fout negatieven:
(A+B)- (A+C) = (A+C)-A B = 2 x C,
waarin (A+B)-(A+C) het verschil is tussen de oude schatter, (A+B), en de gezochte
waarde, (A+C), en (A+C)-A, het verschil is tussen de gezochte waarde en de nieuwe
schatter.
Hoofdstuk 1: Administratieve gegevensbanken
31
Tabel 2: Vergelijking van de verdeling van een acuut myocardinfarct bij 20-jarige mannen zoals ze geregistreerd en gediagnosticeerd werd, vóór en na correctie. Voorbeeld van een correctie, die tot een “slechtere” schatter leidt. Vóór “correctie” Na “correctie” Diagnose Diagnose
Aanwezig Afwezig Totaal Aanwezig Afwezig TotaalAanwezig 1000 50 1050 1000 - 1000
Ami in de Registratie Afwezig 50 3900 3930 50 3950 4000 Totaal 1050 3950 5000 1050 3950 5000
In tabellen 2 en 4 worden cijfermatige voorbeelden gegeven van nieuwe schatters, die
respectievelijk slechtere en betere schatters zijn, dan de oorspronkelijke. In tabel 2 is het
verschil tussen respectievelijk 1050 en1050 inderdaad kleiner dan dat tussen 1000 en
1050 en is de nieuwe schatter verder verwijderd van de geschatte waarde, waar dit in tabel
4 net het omgekeerde is. In tabel 2 is 2*C immers gelijk aan 100 waar B gelijk is aan 50
en in tabel 4 belopen deze waarden respectievelijk 100 voor 2*C en 120 voor B.
Tabel 3 illustreert de nuttigheidsdrempel. Dit is de waarde, waarbij een correctie geen
verbetering maar ook geen verslechtering van de schatter tot gevolg heeft en die de
overgang vormt tussen een “nadelige” en een “voordelige” verbetering.
Tabel 3: Vergelijking van de verdeling van een acuut myocardinfarct bij 20-jarige mannen zoals ze geregistreerd en gediagnosticeerd werd, vóór en na correctie. Voorbeeld van de nuttigheidsdrempel: correctie leidt noch tot een “betere” noch tot een “slechtere” schatter. Vóór “correctie” Na “correctie” Diagnose Diagnose
Aanwezig Afwezig Totaal Aanwezig Afwezig TotaalAanwezig 1000 100 1100 1000 - 1000
Ami in de Registratie Afwezig 50 3850 3900 50 3950 4000 Totaal 1050 3950 5000 1050 3950 5000
Hoofdstuk 1: Administratieve gegevensbanken
32
Tabel 4: Vergelijking van de verdeling van een acuut myocardinfarct bij 20-jarige mannen zoals ze geregistreerd en gediagnosticeerd werd, vóór en na correctie. Voorbeeld van een correctie, die tot een “betere” schatter leidt. Vóór “correctie” Na “correctie” Diagnose Diagnose
Aanwezig Afwezig Totaal Aanwezig Afwezig TotaalAanwezig 1000 170 1170 1000 - 1000
Ami in de Registratie Afwezig 50 3780 3830 50 3950 4000 Totaal 1050 3950 5000 1050 3950 5000
Het probleem blijft het inschatten van de relatieve waarden van B en C. Dit probleem is
situatiegevoelig. In een context van mortaliteit bijvoorbeeld, is het voorkomen van een
goedaardige tumor als doodsoorzaak dermate weinig waarschijnlijk dat het probleem van
foutnegatieve tumoren als nagenoeg onbestaande kan beschouwd worden. Wanneer het
gaat over variabelen zoals lengte, gewicht en andere meetbare grootheden zullen andere,
distributionele overwegingen duidelijk moeten maken of de extremen van de verdeling
dermate oververtegenwoordigd zijn dat men inderdaad kan aannemen dat B > 2*C. In
sommige gevallen, zoals voor de AMI casus, kan er beroep gedaan worden op bestaande
en gevalideerde leeftijds- en geslachtsverdelingen van de bestudeerde aandoening om de
probabiliteiten in te schatten. Dit gegeven zijnde, lijkt een benadering, uitsluitend
gebaseerd op foutpositieven een betwistbare aanpak.
Het opsporen van fouten en outliers vormt een belangrijk onderdeel van de
gegevensverwerking en –analyse. “Editing”, het controleren van de gegevens op fouten, en
“Cleaning” zijn de daarvoor gebruikte procedures. Editing kan omschreven worden als het
proces waarbij de accuratesse, de consistentie en de volledigheid nagegaan wordt.121 Op
het gebied van codering bestaat editing uit het testen van de validiteit - bestaat de code? -
of de consistentie van de toegekende code.122 Onder data cleaning verstaat men het
iteratieve voortdurende proces, waar door gebruik van logische en statistische controles,
fouten opgespoord, verbeterd of verwijderd worden23;117 Andere auteurs spreken over
cleaning als het proces van het verwijderen van incomplete records of records met
inconsistente informatie.9 Het is duidelijk dat “cleaning”, zeker in de zin van het
verwijderen van foute gegevens, dient gerapporteerd te worden 9 en indien mogelijk door
een op probabiliteiten gesteunde benadering vervangen te worden.23
Hoofdstuk 1: Administratieve gegevensbanken
33
Fouten kunnen opgespoord worden via controles i.v.m. geloofwaardigheid (“range test”:
valt een waarde buiten het op voorhand gespecificeerde bereik van plausibele waarden),
consistentie (vergelijking van leeftijd met geboortedatum en overlijdensdatum, van
geslacht met bepaalde aandoeningen) en volledigheid. Ook de frequentiedistributie van de
variabelen aan de hand van histogrammen, kruistabellen, boxplots en scatterplots van
paren variabelen laten toe outliers of systematische fouten op te sporen.23;121,123
Wanneer een gegeven als outlier wordt geïdentificeerd dient het verbeterd te worden waar
mogelijk of verwijderd waar het moet. Voor extreme observaties kan het wijs zijn het
advies te vragen van een expert ad-hoc. Robuuste methodes zoals trimming, i.e. het
weglaten van enkele van de meest extreme observaties (bijvoorbeeld een vaste proportie in
de uiteinden van een verdeling), kunnen aangewezen zijn117 of het nagaan van de
invloedrijkheid van een outlier door het vergelijken van de resultaten met en zonder de
outlier. Tenslotte dient er een duidelijke en liefst simpele volgorde te bestaan van te
ondernemen stappen voor het aanbrengen van de vereiste verbeteringen.
1.1.1.4 Ontbrekende waarden en volledigheid van de registratie. Het is belangrijk te weten of en waarom er een waarde ontbreekt. Gaat het over een
“missing completely at random” ( MCAR), onafhankelijk van zowel de afhankelijke als de
onafhankelijke variabelen, of niet.23 Dit is de meest gunstige situatie. Het verwijderen van
onvolledige records, de “complete-subject approach”, kan hier toegepast worden,
tenminste als er niet teveel records ontbrekende waarden vertonen.121 Soms echter is een
ontbrekende waarde gerelateerd met de independente of met de dependente variabele. In
dergelijke gevallen kunnen multipele imputatie of specifieke, onvolledige-gegevens
analysemethoden noodzakelijk zijn en is de benadering voldoende accuraat wanneer er een
aantal covariaten aanwezig zijn. 23 De software waarover men vandaag beschikt laat een op
een modellering gebaseerde imputatie toe.124 Het creëren van een speciale categorie voor
ontbrekende waarden of het creëren van een indicator variabele voor elke variabele met
ontbrekende waarden zijn foutieve oplossingen voor het omspringen met ontbrekende
waarden. Deze methoden kunnen immers tot vertekende schatters leiden, zeker als de
ontbrekende waarde een confounder van de studie is.121
Hoofdstuk 1: Administratieve gegevensbanken
34
Een ander aspect van ontbrekende waarden is de volledigheid van de registratie. Hierbij
wordt bijvoorbeeld nagegaan of elk ziekenhuisverblijf al dan niet geregistreerd werd en of
de verdeling van de niet-geregistreerde verblijven dezelfde is over de verschillende
diensten van het ziekenhuis en over verschillende perioden van het jaar.60
Verder is het belangrijk ook de volledigheid van de deelaspecten van een verblijf, zoals
ingrepen, diagnoses en voorschriften, na te gaan. Het verwachte volume kan bepaald
worden aan de hand van op een zelfde manier berekende cijfers voor vergelijkbare
periodes of voor een vergelijkbare bevolking. Men dient hierbij rekening te houden met
eventuele seizoensgebonden fluctuaties, veranderingen in beschikbaarheid van diensten
(toegankelijkheid en dekkingsgraad), verschillen over subgroepen (onder meer
leeftijdsgroepen en geslacht), en geografische verschillen. Dergelijke oefeningen maken
het mogelijk om de gegevens te toetsen en hun geloofwaardigheid in te schatten.2;21
1.1.1.5 Accuratesse en validiteit De accuratesse en validiteit van de gegevens zijn van uitzonderlijk belang voor de
evaluatie van diensten, het monitoren van de evolutie van gezondheidsproblemen in de
bevolking en het bepalen van beleidsprioriteiten.113-115Accuratesse is de mate waarin een
meting of een schatting gebaseerd op metingen de werkelijke waarde weergeeft van het
attribuut dat gemeten wordt.9 In geval van uniform verdeelde variabelen kan een
onderzoek naar “last-digit-preference” problemen in verband met accuratesse aan het licht
brengen. Zo stelden we een duidelijke “last-digit-preference” bij het medisch
schooltoezicht (MSTgegevens 1994) vast voor lengte en gewicht, die volgens de
richtlijnen dienen gemeten te worden op respectievelijk 100g en 1 mm na, en die
belangrijke variabelen zijn voor het opvolgen van de groei.125 Omgekeerd biedt het nagaan
van een ontbrekende laatste digit een mogelijkheid voor kwaliteitsbewaking.123
In de context van ontslaggegevens wordt accuratesse gedefinieerd als de proportie van
ziekenhuisontslaggegevens, die dezelfde code (voor de hoofddiagnose) hebben als
dewelke die toegekend werd door een onafhankelijk review van het ontslagformulier en/of
van het medisch dossier.115
Een klassieke methode van peiling naar accuratesse en vaak de finale stap in het
controleren van de gegevenskwaliteit is de “Chart review ”, de vergelijking van de
Hoofdstuk 1: Administratieve gegevensbanken
35
geregistreerde gegevens met de gegevens van het originele medisch dossier. De bedoeling
van deze vergelijking is het vaststellen of de opgeslagen medische gegevens op een
accurate manier de diagnoses, de diensten en ingrepen, die uitgevoerd of gepresteerd
werden, weergeven.2;60 Het hoeft geen betoog dat deze voortreffelijke methode erg
omslachtig en arbeidsintensief is.
Bij de beoordeling van de kwaliteit van gegevens speelt het concept “validiteit” een
hoofdrol. In functie van de context kan het gaan over de validiteit van een meting of
meetmethode, van een onderzoek of van een gegevensbank.
Validiteit van een meetmethode (validity, measurement) kan gedefinieerd worden als de
mate waarin een meetmethode meet wat ze bedoelt te meten.9;126
Een eerste facet van validiteit is de begripsvaliditeit (“construct validity”), of de mate
waarin de meetresultaten overeenkomen met de theoretische concepten (het
begrippenkader) betreffende het bestudeerde gezondheidsfenomeen: bvb. indien de
bloeddruk verandert in functie van de leeftijd dienen de meetresultaten dit te
weerspiegelen.
Een tweede facet is de inhoudsvaliditeit (“content validity”), of de mate waarin de meting
overeenkomt met het domein van het bestudeerde verschijnsel: bvb. een meting van de
functionele gezondheidsstatus dient onder meer de Activities of Daily Living (ADL,
Activiteiten van het Dagelijkse Leven) te bevatten, en verder het beroeps, familiaal en
sociaal functioneren.9 In geval van een klinische indicator spreekt men van content
validiteit als de mate waarin de indicator ook werkelijk het probleem, dat men wenst te
benaderen, weergeeft. Een voorbeeld: het voorkomen van een postoperatief longembool
(de indicator) suggereert een inadequate preoperatieve profylaxe (het probleem) bij
patiënten waarbij een belangrijke operatieve ingreep gepland was.127 De content validiteit
kan verbeterd worden door het ontwikkelen en het gebruiken van duidelijk gedefinieerde
registratie-items en door hun extensieve (over het ganse land) uittesten met feedback naar
en beoordeling door de participanten.127
Een derde facet is de criterium validiteit, of de mate waarin de meting overeenstemt met
een criterium, onafhankelijk van het bestudeerde verschijnsel. Hierin onderscheidt men de
gelijktijdige en de voorspellende validiteit. Bij de gelijktijdige validiteit wordt nagegaan of
de meting overeenkomt met een onafhankelijke toets, die op hetzelfde tijdstip uitgevoerd
Hoofdstuk 1: Administratieve gegevensbanken
36
wordt. Een voorbeeld ervan is de visuele inspectie van een wonde en het bacteriologisch
onderzoek van een specimen genomen op het ogenblik van de inspectie. De voorspellende
validiteit van een meting wordt uitgedrukt als zijn bekwaamheid om het toetsingsresultaat
te voorspellen. Zo wordt een test i.v.m. de academische geschiktheid van studenten
getoetst aan de hand van de daaropvolgende academische performance.127 Een vierde en
laatste facet van validiteit is de indruksvaliditeit (“face validity”), of de mate waarin een
meting, na oppervlakkige inspectie, als aanvaardbaar bestempeld wordt. In een context van
klinische indicatoren spreekt men van klinische experts, benoemd door hun peers, die de
medische deugdelijkheid en het geëigend zijn van de indicatoren waarborgen, door middel
van een proces van uitgebreide gedachtewisseling en review.77;127
Validiteit van een onderzoek (validity, study), is de mate waarin de conclusies, die uit
de studie afgeleid werden, gerechtvaardigd zijn. Hierbij wordt er rekening gehouden met
de gebruikte studiemethoden, de representativiteit van de studiesteekproef en de natuur
van de bevolking waaruit de steekproef getrokken werd.
Men onderscheidt de interne en de externe validiteit.9;128 Om de interne validiteit te
bepalen werden de index- en de vergelijkingsgroep(en) dusdanig geselecteerd en
vergeleken dat de tussen hen geobserveerde verschillen wat de bestudeerde afhankelijke
variabelen aangaat, behoudens een steekproeffout, alleen kunnen toegeschreven worden
aan het bestudeerde veronderstelde effect. De externe validiteit of “generalizability” gaat
de veralgemeenbaarheid van een studie na of m.a.w. stelt de vraag of de studie al dan niet
tot vertekende conclusies leidt in een doelpopulatie. Bijvoorbeeld wanneer een studie
alleen werd uitgevoerd op mannen en de ganse bevolking is de doelpopulatie, vraagt men
zich af of de bevindingen ook geldig zijn voor vrouwen. De evaluatie van de
veralgemeenbaarheid vereist veel meer een inhoudelijke beoordeling dan bij een evaluatie
van de interne validiteit.9
De validiteit van een gegevensbank, of de mate waarin de gegevensbank de werkelijke
biologische toestand van de geregistreerde weergeeft, geeft aan in welke mate de gestelde
diagnoses correct zijn en de in het medisch dossier vermelde diensten of ingrepen ook
werkelijk gepresteerd of uitgevoerd werden.129 Hierbij stelt de validiteit van een
geregistreerde diagnose een speciaal probleem. De International Classification of Diseases
(ICD), zowel ICD-9 als ICD-10, bevat immers, op enkele uitzonderingen zoals
psychiatrische aandoeningen na, geen expliciete definities van ziekten.27;130 Het is dus een
Hoofdstuk 1: Administratieve gegevensbanken
37
zaak van klinisch oordeel of een ziekte aanwezig is of niet, en, wanneer bijkomende
criteria voor de diagnose van sommige ziekten werden ontwikkeld door de WHO of door
andere instanties, werden ze meestal niet op eenvormige manier toegepast.131
1.1.1.6 Betrouwbaarheid, herhaalbaarheid en reproduceerbaarheid Betrouwbaarheid (“Reliability”) is de mate van stabiliteit, die bereikt wordt bij herhaling
van een meting onder dezelfde voorwaarden.9;126 Een gebrek aan betrouwbaarheid kan
ontstaan wegens onenigheid onder waarnemers of meetinstrumenten, of onstabiliteit van
het te meten kenmerk. De betrouwbaarheid van de gegevens van een gegevensbank kan in
vergelijking met de medische dossiers uitgedrukt worden als de accuratesse waarmee het
medisch dossier in de gegevensbank weergegeven wordt.129 De betrouwbaarheid van een
indicator hangt sterk af van een zelfde manier van rapporteren door de participanten van
een studie of een project.127
Herhaalbaarheid (“repeatability”) of reproduceerbaarheid (“reproducibility”) geven aan of
een test of een meting herhaalbaar zijn. Deze begrippen refereren aan de actie van het
herhaald uitvoeren van iets en niet naar de kwaliteit van de meting.
1.1.2 Kwaliteit van de gegevens van administratieve gegevensbanken.
Aan de hand van concrete voorbeelden uit de literatuur en uit eigen onderzoek,
uitgevoerd21;132 in 2001-2, wordt getracht een beeld te schetsen van de manier waarop
gegevensbanken op hun kwaliteit beoordeeld worden en van de factoren, die de kwaliteit
beïnvloeden.
1.1.2.1 Epidemiologische en statistische methoden voor het beoordelen van de gegevenskwaliteit.
1.1.2.1.1 Vergelijking van gegevens binnen en tussen bestanden of gegevensbanken. Een manier om de kwaliteit van de gegevens van een register te onderzoeken bestaat erin
ze te vergelijken met de gegevens uit een andere, onafhankelijke bron. Een voorbeeld
hiervan is de vergelijking van het aantal incidente kankers uit een kankerregister met het
aantal sterfgevallen door kankers van hetzelfde type in de overlijdensstatistieken, of door
Hoofdstuk 1: Administratieve gegevensbanken
38
een vergelijking van gelijkaardige gegevensbanken, zoals het aantal AIDS- en
tuberculosepatiënten in een AIDS en een Tuberculose register, of het aantal
ziekenhuisopnamen met een verblijfsduur van minstens een dag in geval van
verkeersongevallen in de MKG en het Belgisch Instituut voor Verkeersveiligheid (BIVV)
(Figuur 1), of de overeenkomst tussen MKG en het Nationaal Instituut voor de Statistiek of
het Studiecentrum voor Perinatale Epidemiologie i.v.m. een aantal gegevens rond
bevallingen (zie hoofdstuk 5: het Keizersnedencijfer).21;132-136
Figuur 1: Evolutie van het aantal niet-fatale verkeersongevallen zoals geregistreerd in het BIVV en de MKG, 1996-2001.
Evolutie van niet-fatale verkeersongevallen in het BIVV en de MKG
0
2500
5000
7500
10000
12500
1996 1997 1998 1999 2000 2001
BIVV MKG
Een volgende methode bestaat erin twee types van gegevens in een zelfde register met
mekaar te vergelijken, zoals bijvoorbeeld overlevingsgegevens met incidente
kankergevallen, wat een idee geeft over de volledigheid van de overlevingsgegevens137, of
bijvoorbeeld, zoals we elders meer uitvoerig rapporteerden21, door het nagaan of er bij
registratie van een letsel ook de bijbehorende manier van ontstaan (de zogenaamde E-
code) geregistreerd werd of omgekeerd (Tabellen 5 en 6).
Hoofdstuk 1: Administratieve gegevensbanken
39
Om de volledigheid van het totale bestand na te gaan kan men verder, in afwezigheid van
een andere, onafhankelijke bron, gebruik maken van “indirecte indicatoren”. Zo is het
mogelijk gestandaardiseerde overlevingsgegevens voor een aantal kankers in een aantal
landen te berekenen. Wanneer dan voor een bepaald type kanker de overleving in een land
sterk verschilt vergeleken met die van de andere, is dit een aanduiding voor een
onvolledigheid van de gegevens.137 Een andere methode is de vergelijking tussen de
geregistreerde gegevens en het medisch dossier of het logboek van het
operatiekwartier.94;138;139 De audit van de MKG is hier een andere illustratie van (zie sectie
4.2).
Hoofdstuk 1: Administratieve gegevensbanken
40
Tabel 5: Percentage van ontbrekende letselcodes wanneer de E-code aanwezig is. MKG 1996-8.
Gewest Geslacht 1996 1997 1998
Brussel M 34,68 31,31 30,55
V 34,68 32,96 30,95
Vlaanderen M 20,63 20,95 22,62
V 24,20 25,91 26,75
Wallonië M 26,98 27,41 28,46
V 30,54 31,86 32.19
Tabel 6: Percentage van ontbrekende E-codes wanneer de letselcode aanwezig is. MKG 1996-8.
Gewest Geslacht 1996 1997 1998
Brussel M 82,00 77,18 74,79
V 79,85 74,65 72,76
Vlaanderen M 82,74 81,55 80,71
V 80,90 80,08 78,91
Wallonië M 75,76 73,36 71,53
V 75,01 72,88 70,65
In het kader van een gezondheidssysteem met een structurele uitbouw van de verwijzing
van eerste lijn naar tweede lijn en omgekeerd, is de informatie in het ziekenhuisdossier
over patiënt (naam en adres), de verwijsmodaliteit en de huisarts (naam en adres)
essentieel. Dit systeem houdt tevens mogelijkheden van validatie in van diagnostische
gegevens, waarvan de kwaliteit kan nagegaan worden door een vergelijking van bepaalde
gegevens uit het ziekenhuisdossier met dezelfde informatie ingewonnen bij huisartsen via
interviews en dossiers.78 Dit is een vooralsnog onontgonnen validatie mogelijkheid voor de
MKG.
Hoofdstuk 1: Administratieve gegevensbanken
41
Bij dergelijke vergelijkingen is de nagestreefde precisiegraad belangrijk, bijvoorbeeld tot
op de 3de of de 4de digit van de gecodeerde diagnose in functie van het kankertype,
diagnose of ingreep.82;137
Voor de formulering van correcte besluiten en ook in een optiek van toetsing van de
gegevenskwaliteit van administratieve gegevensbanken is het aangewezen bij dergelijke
oefeningen zowel de geslaagde als de mislukte koppeling aan te geven, benevens de
redenen van een mislukte koppeling.22;139
1.1.2.1.2 Steekproefsgewijze versus exhaustieve validatie. Het valideren van alle records in een volledige (ziekenhuis)registratie is praktisch
onmogelijk. Vaak is werken op een steekproef hiervoor het enig werkbare alternatief.
Verschillende methoden werden hiervoor gebruikt: werken op een aselecte
steekproef138;140, op een gestratificeerde steekproef139, eventueel met een oversampling van
patiënten die behoren tot een categorie met een lagere positieve voorspellende waarde141,
liefst met een op voorhand bepaalde steekproefgrootte.60
Een alternatief voor een steekproefsgewijze benadering is een vergelijking van de
gegevenskwaliteit uit te voeren op subpopulaties van patiënten met een zeer beperkt
spectrum van diagnoses of ingrepen in een administratieve gegevensbank en een
gegevensbank, die kan beschouwd worden als de gouden standaard. De bevindingen uit
deze vergelijking worden in een tweede tijd veralgemeend over de ganse administratieve
gegevensbank. Zo werden uit een administratieve gegevensbank een groep patiënten met
een myocardinfarct en een groep van vrouwen, die een obstetrische ingreep ondergingen,
vergeleken met deze uit een peer review programma en werden de bevindingen uit deze
vergelijking veralgemeend over het ganse administratieve bestand.82
1.1.2.1.3 Maten van overeenkomst. Bij de bestudering van de kwaliteit van bepaalde gegevens, zoals een diagnosestelling,
wordt, in afwezigheid van een gouden standaard, vaak beroep gedaan op maten van inter-
beoordelaarsovereenstemming (“interrater agreement”), waarbij twee of meerdere
onderzoekers hetzelfde studieobject beoordelen en de onderlinge overeenkomst gemeten
wordt. Het nagaan van de overeenkomst tussen twee of meerdere waarnemers is immers
een vaak aanwezig onderdeel van kwaliteitsbewaking van de gegevens in de
Hoofdstuk 1: Administratieve gegevensbanken
42
geneeskunde.142-149Andere voorbeelden zijn: vergelijking van een aantal items in een
gegevensbestand en in de overeenstemmende medische dossiers, de abstractie van dezelfde
gegevens door twee personen, het vergelijken van patiëntenkarakteristieken van dezelfde
patiënten, die zich in twee gegevensbestanden bevinden.
De hierbij gebruikte maten zijn de al dan niet gewogen kappa63;79;82;109;138;150-154, het
percentage van overeenkomst of van afwijking23,26,44,73,105,106, intraclass correlation
coefficient 45,89,109, Cronbach’s alfa 118;126 en χ2 analyses van waargenomen versus te
verwachten waarden op basis van een bepaald percentage van overeenkomst109. Bij een
kappatoets, zeker indien hij een tamelijke tot goede overeenkomst aangeeft, zoals een
kappa tussen 0.4 en 0.75155, is het aangewezen de niet-diagonale elementen te analyseren
om een systematische afwijking door een van de beoordelaars na te gaan.156 Standaard
software zoals SAS® stelt hiervoor bepaalde symmetrietoetsen ter beschikking zoals de
Mc Nemar en Bowker toetsen.157
Een andere reeks toetsen wordt gebruikt, wanneer bij een vergelijking één waarnemer als
referentie fungeert, de zogeheten “Gouden standaard”, waaraan de andere waarnemer
wordt getoetst. Sensitiviteit, specificiteit, positieve voorspellende waarde (PPV) en
negatieve voorspellende waarde (NPV) en de “comparability ratio” (CR) worden hierbij
nagegaan.113;158-160Wanneer men ontslagdiagnoses vergelijkt met gevalideerde gevallen
weerspiegelt de CR het algemeen effect van misclassificatie.113
Kennedy et al.114 geven een belangwekkend voorbeeld van het belang van een juiste
codering voor de registratie van een acuut myocardinfarct. Zij vergeleken de resultaten van
de ziekenhuisregistratie met die van het cardiologisch surveillanceteam dat volgens strikte
richtlijnen werkte (Tabel 7). Indien men dan de ziekenhuisregistratie wil gaan gebruiken
als een indirecte indicator voor de incidentie van AMI , wordt het belang van een accurate
en volledige gegevensabstractie en codering evident. Op basis van de ziekenhuisregistratie
bekomen we een schatter van 110/20.386 of 0,54%, waar deze voor het cardiologische
surveillanceteam 71/20.386 of 0,35% bedraagt, m.a.w. ⅓ lager.
Hoofdstuk 1: Administratieve gegevensbanken
43
Tabel 7: Sensitiviteit, specificiteit, PPV, NPV en CR van een ziekenhuis vergeleken met een cardiologisch surveillance team
Cardiologisch surveillance team
ICD-9: 410 Andere Totaal
ICD-9: 410 67 43 110 Ziekenhuis-
registratie Andere 4 20.272 20.276
Totaal 71 20.315 20.386 Sensitiviteit: 94% (67/71); Specificiteit = 99% (20.272/20.315); PPV = 61% (67/110); NPV = 99% (20.272/20.276);CR= 65 % (71/110)
Een klassiek voorbeeld is de vergelijking van de resultaten, die behaald worden met een
nieuwe test, met de resultaten van een referentie test.159 Dergelijke vergelijking wordt ook
toegepast om bvb. de overeenkomst na te gaan tussen de code, zoals hij werd opgeslagen
in de gegevensbank en de code zoals hij zich in het medisch dossier
bevond.63;82;94;95;135;138;141;152 Ook in de ambulante praktijk werd een gelijkaardige
vergelijking gemaakt tussen drie methoden voor het beoordelen van de bekwaamheid van
een arts en de kwaliteit van zijn praktijkvoering: de gestandaardiseerde patiënt (de gouden
standaard), dossierabstractie en vignetten ( uitgeschreven ziektegevallen). Waar de
vignetten als ongeveer gelijkwaardig kunnen beschouwd worden aan gestandaardiseerde
patiënten, gaf de dossierabstractie over de meeste criteria minder goede resultaten.161;162
Waar wij het tot zover hadden over de vergelijking van de overeenkomst op het
individuele niveau, gebeurt het vaak dat vergelijkingen gebeuren op geaggregeerd niveau
tussen meer dan één gegevensbank. Bij het vergelijken van twee gegevensbanken, waarin
gegevens verzameld worden over hetzelfde onderwerp bij ongeveer dezelfde bevolking,
wordt voor categorische variabelen beroep gedaan op χ2-analyses, exacte Wilcoxon
toetsen, odds ratio's en op de t-test voor continue variabelen.81 Indien men de vergelijking
wil corrigeren voor een aantal covariaten, bvb. in een analyse van ziekenhuismortaliteit,
kan een multipele logistische regressie gebruikt worden (zie sectie 5.2 Intramurale letaliteit
na een acuut myocardinfarct).79;135;163
Hoofdstuk 1: Administratieve gegevensbanken
44
Meer en meer worden administratieve gegevens ook gebruikt voor predictieve doeleinden
en doet men beroep op technieken zoals logistische regressie, Cox proportional hazard
model, artificiële intelligentie en neurale netwerken.80;163 Het hoeft geen betoog dat voor
dergelijke oefeningen de kwaliteit van de administratieve gegevens een vereiste is. Zo
werd op basis van administratieve gegevens een gewogen comorbidity-index berekend en
nadien ook uitgetest door de door het model voorspelde mortaliteit, bekomen via
logistische regressie, te vergelijken met die van de herabstrahering.80
1.1.2.1.4 Accuratesse. Zoals voormeld is abstrahering het proces waarbij aan de hand van het medisch dossier
van de patiënt de hoofddiagnose of hoofdingreep bepaald worden en tevens de eventuele
nevendiagnosen en –ingrepen. Deze diagnosen en ingrepen worden vervolgens gecodeerd
en opgeslagen. Het is evident dat tijdens deze fasen van de gegevensverwerking
accuratesse van vitaal belang is.
In de literatuur worden verschillende methoden vermeld, die gebruikt worden om de
kwaliteit van het abstraheringsproces te onderzoeken. Een eerste manier bestaat in een
herabstrahering door één gekwalificeerde abstractor, die gebruikt maakt van expliciete
criteria.129 Een volgende is een dubbele herabstrahering door twee gekwalificeerde
abstractors (waar de originele abstraheringen verricht werden door een niet
gekwalificeerde klerk).1 Nog een andere is een dubbelblinde herabstrahering van het
medisch dossier, uitgevoerd door twee onafhankelijke geneesheren uit dezelfde dienst. De
gekozen observatieperiode is intentioneel van korte duur, dit om seizoensgebonden en
leereffecten van de originele abstrahering zoveel mogelijk te vermijden. Alleen wanneer de
twee “nieuwe” abstraheringen van de originele abstrahering verschillen werd de originele
als fout bestempeld. Deze werkwijze laat toe het probleem van de gouden standaard te
vermijden, die zeer moeilijk te bepalen kan vallen wegens het gebrek aan precisie bij de
definitie van de hoofddiagnose60
Soms wordt in één onderzoek zowel de kwaliteit van de abstractie van gegevens uit het
medisch dossier onderzocht als de toegekende code. In een dergelijke studie werden de
opnieuw geabstraheerde en opnieuw gecodeerde hoofddiagnose of hoofdingreep, de
standaard, vergeleken met de geregistreerde diagnoses of ingrepen in alle posities en
Hoofdstuk 1: Administratieve gegevensbanken
45
vervolgens met de hoofddiagnose of ingreep.95 De accuratesse van diagnosecodering
varieerde sterk: wanneer alle posities in aanmerking genomen werden, varieerde de
sensitiviteit van 0.58 voor perifere vaataandoeningen tot 0.97 voor borstkanker. Een
gelijkaardig bereik werd aangetroffen voor de PPV. Voor de ingrepen was de accuratesse
substantieel hoger: de sensitiviteit, alle posities, had een range van 0.88 voor
hartkatheterisatie tot meer dan 0.95 voor 10 van 15 chirurgische ingrepen. Ook de PPV,
voor alleen de hoofdingreep, had een tamelijk breed bereik: van een 0.89 voor
hartkatheterisatie tot een 0.99 voor 7 chirurgische ingrepen.95
Bij dit soort oefeningen dient men er rekening mee te houden dat er een duidelijk verschil
in precisie van definitie bestaat tussen klinische toestanden, vaak weinig precies of zelfs
helemaal onbestaande, en de meer expliciet gedefinieerde codeerregels. Een verbetering
van de codeerregels, zonder een verbetering van de omschrijving van de klinische toestand
leidt derhalve niet steeds tot een verbetering van de kwaliteit van de gegevens. Zo werden
er bijvoorbeeld nieuwe regels voor het coderen van AMI ontwikkeld, maar blijft de
epidemiologische interpretatie van toegekende codes onzeker omdat er geen eenduidige
klinische criteria vastgesteld en toegepast worden. Dit is veel minder een probleem voor
chirurgische ingrepen omdat zij zeer precies gedefinieerd zijn en meer accuraat gecodeerd
worden.95
In een gelijkaardige studie werd in een dienst van oncologische chirurgie in een
universitair ziekenhuis gepeild naar de overeenkomst tussen de financieringsgegevensbank
(“physician billing”), de medical record database en het persoonlijk handgeschreven
logboek van de chirurg. Zeven fundamentele variabelen werden hierbij onder de loep
genomen: het toevoegen of verwijderen van ziekenhuisopnamen, het identificatienummer
van de patiënten, geboortedatum van de patiënt, datum van de ingreep, datum van opname
en ontslag, code van de ingreep en code van de diagnose.
Voor de beoordeling van de diagnosecode werd een uitgeschreven omschrijving van de
code gebruikt en werd er nadien beoordeeld of de gedachte of de eruit voortvloeiende
implicatie de gestelde diagnose voldoende benaderde. Bvb. indien er “malignant soft tissue
tumor” i.p.v. “soft tissue sarcoma” genoteerd was, werd dit als correct aanvaard.109 De
studie concludeert dat er slechts een gebrekkige overeenkomst bestaat tussen de
Hoofdstuk 1: Administratieve gegevensbanken
46
verschillende databases. De auteurs formuleren dan ook de aanbeveling dat, indien
mogelijk, de informatie van een gegevensbank dient gevalideerd te worden vooraleer de
resultaten van een daarop gebaseerde studie te interpreteren.
Bij de audit wordt de accuratesse van onze MKG getoetst. In sectie 4.2 komen we hier
uitvoerig op terug.
1.1.2.1.5 Betrouwbaarheid. Hierbij wordt nagegaan in welke mate dezelfde abstractor of codeur het abstraheren of het
coderen bij herhaling op dezelfde manier doen.152
Een eenvoudige manier om de betrouwbaarheid van een gegevensbank na te gaan, is de
vergelijking van (praktisch) onveranderlijke gegevens zoals geslacht, geboortedatum of
sociaal-economische status (tijdens een zelfde kalenderjaar) bij patiënten met herhaalde
opnamen.22;60
Uit eigen onderzoek22, uitgevoerd in 2002 in verband met de minimale klinische gegevens
(MKG) en de minimale financiële gegevens (MFG), namen we dit voorbeeld over deze
registraties m.b.t. 1996. Om de invloed van sociale factoren op de verblijfsduur in de
acute ziekenhuizen22 te bestuderen werden de financiële aan de klinische gegevens
gekoppeld om aan de patiënten een sociaal-economische status, berekend op basis van de
financiële gegevens, toe te kennen (Figuur 2). Als koppelingsvariabelen werden het
ziekenhuis- en het patiëntnummer gebruikt, die door dezelfde administratieve diensten
voor MKG en MFG geregistreerd worden.
Hoofdstuk 1: Administratieve gegevensbanken
47
Figuur 2: Schematische weergave van de koppeling van de MKG- en MFG-bestanden.
MKG MFG
Verblijven Ziekenhuizen Verblijven Ziekenhuizen
1.645.151 174 1.588.664 174
Gekoppeld bestand
MKFG
Verblijven Ziekenhuizen
1.515.885 159
Wij verwijderden uit het MKG-bestand 67 verblijven van personen met een onbekend
geslacht en 33 verblijven niet bruikbaar voor de berekening van een z-score wegens een te
klein aantal (< 30) in een bepaalde DRG en leeftijdsgroep. Verder werden ook 105.252
verblijven van de 15 ziekenhuizen, die geen MFG-bestand afleverden, verwijderd en
23.914 verblijven in 108 ziekenhuizen, waarvoor geen koppeling met het MFG-bestand
kon gemaakt worden. De oorzaken voor het niet realiseren van de koppeling waren de
volgende: registratiefouten met betrekking tot de koppelingsvariabelen (Ziekenhuiscode en
Patiëntnummer) of het toeleveren van een bestand waarin alleen mutualiteitpatiënten
opgenomen werden.
1.1.2.1.6 Validiteit. Voor een beoordeling van de validiteit van gegevens is het gebruik van expliciete criteria
of, minstens, van gestructureerde impliciete criteria vereist.152;164 Om de validiteit van een
ziekenhuisgegevensbank op basis van ontslaggegevens na te gaan werd in een studie een
gefaseerde methodologie gevolgd: eerst werd de accuratesse nagegaan door een
vergelijking van de geregistreerde diagnoses met de ontslagdiagnoses in het medisch
dossier. Ontslag diagnoses kunnen op een vage manier opgeschreven worden (bvb. reuma
i.p.v. reumatoïde artritis) en gecodeerd (bvb. polyartritis i.p.v. reumatoïde artritis) of
Hoofdstuk 1: Administratieve gegevensbanken
48
gewoon fout ingetikt (“ lack of reliability”). Voor het toetsen van de validiteit werd
vervolgens op een steekproef van ontslagdiagnoses met een vermelding van reumatoïde
artritis een vergelijking gemaakt met een herabstrahering, uitgevoerd door een getrainde
abstractor aan de hand van de criteria voor reumatoïde artritis van de Amerikaanse
Vereniging ter bestrijding van gewrichtsreuma (ARA).129
De koppeling van twee ziektespecifieke gegevensbanken met aan elkaar gerelateerde
aandoeningen (AIDS en TBC) bleek niet alleen de validiteit maar ook de volledigheid van
de registers te verbeteren.135
In België werd het aantal gevallen en het aantal sterfgevallen door een acuut
myocardinfarct (AMI) vergeleken tussen het MONICA register (Multinational monitoring
of trends and determinants in cardiovascular diseases) en de MKG voor de regio’s Gent en
Brugge (zie hoofdstuk 5) en het aantal sterfgevallen door AMI in de regio’s Gent en
Charleroi tussen het MONICA register en de overlijdensstatistieken. In deze laatste studie,
uitgevoerd in 1997-8 en waaraan we meewerkten, werd een belangrijke onderschatting van
de AMI-sterfte aangetoond: slechts 65% der goed gedocumenteerde AMI gevallen werden
in de overlijdensstatistieken als ischemische hartaandoeningen teruggevonden.165 Deze
studie resulteerde in de publicatie: “De Henauw S, de Smet P, Aelvoet W, Kornitzer M, De
Backer G. Misclassification of coronary heart disease in mortality statistics. Evidence from
the WHO-MONICA Ghent-Charleroi Study in Belgium. J Epidemiol Community Health
1998;52:513-9.”
Een andere methode voor het onderzoek van validiteit is de autopsie. Meer speciaal op het
gebied van mortaliteit door cardiovasculaire epidemiologie is dit een noodzaak gebleken.96-
98;166 Laten we hierbij aanstippen dat de rol van de obductie als “Gouden Standaard” niet
perfect is. Zo zal bij een gewone obductie in geval van een zeer snel optredende dood na
een acuut hartinfarct, waarvan de letsels op dat ogenblik slechts zichtbaar zijn mits gebruik
van speciale technieken, geen myocardinfarct vastgesteld worden en omgekeerd kan
obductie tot een fout positieve vaststelling leiden, wegens een eventuele grotere
gedrevenheid van de obductor wanneer hij weet dat de overledene leed aan een coronaire
aandoening.97 Op het gebied van acuut myocard infarct is men derhalve de mening
Hoofdstuk 1: Administratieve gegevensbanken
49
toegedaan dat er een belangrijk aantal zowel foutpositieve als foutnegatieve gevallen zijn,
waarvan de verhoudingen niet constant zijn over de tijd.96;97
Een volgende methode om naar validiteit te peilen bestaat in de vergelijking van gegevens
uit twee gegevensbanken waarin (grotendeels) dezelfde patiënten geregistreerd werden
maar via een andere gegevensverzameling en met een andere vaststellingsmethode van de
gevallen (case ascertainment).79 Voor acuut myocardinfarct werd de interne validiteit van
twee gegevensbanken beoordeeld door een globale vergelijking op ziekenhuisniveau en
een individuele vergelijking op patiëntenniveau en dit op het gemeenschappelijk patiënteel
van beide gegevensbanken. Op ziekenhuisniveau werden basiskarakteristieken, klinische
manifestaties en het gebruik van cardiologische ingrepen en uitkomsten vergeleken. Op
patiënten niveau werden naast baselinekarakteristieken ook gegevens over behandeling,
ziekteverloop, medicatie en ziekenhuismortaliteit vergeleken. De externe validiteit werd
onderzocht aan de hand van vergelijkingen tussen patiënten met een bepaald sociaal
profiel (Medicare), maar die niet in beide databases opgenomen waren.79
1.1.2.2 Ervaringen en moeilijkheden i.v.m. gegevenskwaliteit en aangereikte oplossingen.
1.1.2.2.1 Validiteit en volledigheid De validiteit van de gegevens en in het bijzonder die van de diagnose, is van fundamenteel
belang voor de kwaliteit van administratieve gegevens. Deze bekommernis uitte zich onder
meer in de controverse over het al dan niet bestaan van een epidemie van ischemische
hartziekten in de twintigste eeuw.67;98;99;166-168 Het gebrek aan eenduidige, aanvaarde
definities (zie sectie 1.1.5) heeft het ontstaan van dergelijke controverse zeker in de hand
gewerkt en men kan, meer algemeen, stellen dat totaal ontbrekende of suboptimale
definities een bron van problemen zijn.
Een gebrekkige definitie van wat precies de hoofddiagnose is maakt het soms moeilijk de
kwaliteit van de gegevens te beoordelen60, kan tot abstractiemoeilijkheden leiden1 en zo
de vergelijkbaarheid van gegevensbanken bemoeilijken 163. Dezelfde aandoening kan op
verschillende wijzen gedefinieerd worden wat bij een onderzoek naar de volledigheid van
een register door een vergelijking met een ander register tot moeilijkheden kan leiden.135
Ook in de studie van Every et al. bleek het gebruik van verschillende definities voor
Hoofdstuk 1: Administratieve gegevensbanken
50
eenzelfde begrip zoals een recurrent myocardinfarct de vergelijking tussen
gegevensbanken te bemoeilijken.79
Een ander meldenswaardig aspect van deze studie betrof het koppelingsmechanisme. Dit
bestond erin om door middel van samengestelde sleutels, gebaseerd op
gemeenschappelijke variabelen, de gegevensbestanden te linken via een iteratief proces
waarbij in een dalend aantal sleutelvariabelen en met bij elke iteratie relaxerende vereisten
een koppeling bereikt werd.79
Uit de literatuur blijkt ook dat artsen van verschillende disciplines het oneens zijn over de
diagnose bij een zelfde patiënt. Osteoarthritis van de heup en benigne prostaathypertrofie
zijn hier voorbeelden van.131Verder werd de validiteit bestudeerd in functie van het type
personeel, dat verantwoordelijk was voor de ontslagdiagnoses.129 Validiteit van de
gegevens is tenslotte ook functie van het type eigenaarschap: publiek of privaat. Dit heeft
te maken met het afleggen van verantwoording, het voldoen aan de performance- en
rapporteervereisten van de zorgverzekeraars (“purchaser”), en de “reimbursement
benefits” van deze organisaties. Dit zijn de directe geldelijke compensaties, ontvangen
door een instelling, wanneer zij kan bewijzen dat ze diensten aan een bepaalde cliënt heeft
bewezen. In functie van de vereisten van de zorgverzekeraar en van de baten voor de eigen
instelling zal de gegevensverzameling met grotere accuratesse verlopen en zal de
rapportage gemakkelijker waarheidsgetrouw gebeuren. “ … we found that measurement
errors within administrative data systems were not small, random, or uncorrelated
errors”.169
Vergelijkingen tussen gegevensbanken zijn een veelgebruikt middel voor validatie van de
gegevens. Degelijke vergelijkingen kunnen nochtans bemoeilijkt worden door verschillen
in volledigheid136 en/of van definities aangaande de gebruikte termen163. Ook
internationale vergelijkingen tussen registers kunnen bemoeilijkt worden door de
incomplete dekkingsgraad van de registers maar ook door de samenstelling van de
“standaardbevolking”.137
Hoofdstuk 1: Administratieve gegevensbanken
51
1.1.2.2.2 Het abstraheerproces. De kwaliteit van de medische informatie is niet alleen problematisch vanuit een standpunt
van validiteit, maar ze is vervolgens de meest kritische factor tijdens het
abstraheerproces.1;60 In een review werd opgemerkt dat de hoofddiagnose in de
samenvatting van het medisch dossier vaak niet in dezelfde bewoordingen geschreven was
als deze op het ontslagformulier, dat nochtans door dezelfde arts was ingevuld.1 Het
vermogen van de arts om de medische informatie volgens vaste regels te abstraheren blijft
het sleutelelement voor datakwaliteit en dit probleem werd anno 1994 niet opgelost door
beslissingsbomen noch door gecomputeriseerde expertsystemen.60 Als aanknopingspunten
voor verbetering werden de vorming van de artsen over het invullen en het belang van de
formulieren1 en de rigoureuze kwaliteitsbewaking van de gegevens in samenwerking
tussen elke participant in het registratiegebeuren 60 vooropgesteld.
1.1.2.2.3 Ontbrekende en foutieve waarden. Ontbrekende en foutieve waarden zijn een meermaals optredend probleem. Vaak gaat het
eerder over het niet voorhanden zijn van de informatie dan over een rapportagefout en deze
lijken zich eerder voor te doen in de minder belangrijke gegevenscategorieën.138
De proportie ontbrekende records kan verschillen over de diensten en over de maanden
van opname. Verder werd vastgesteld dat meer langdurige verblijven gepaard gaan met
ontbrekende records.60
Fouten bij de gegevensopslag zijn eerder zeldzaam. In een studie werd een globaal cijfer
van 1,5% dergelijke fouten vastgesteld.138 In een andere werden voor de codes 2% data
entry fouten gevonden, met in 0,2% der gevallen een weerslag op het toekennen van
DRGs.60 Dit type fouten deed zich minder vaak voor in de belangrijkste
gegevenscategorieën, waar een cijfer van 0,6% werd vastgesteld.138Het niet terugvinden
van het originele medisch dossier bij een vergelijking tussen gegevensbank en medisch
dossier lijkt vrij beperkt: in twee studies werden volgende percentages opgegeven: 0,5% en
van 0,7 % tot 3,4%.129;141
Codeerfouten zijn een vaak optredend euvel, verschillen in frequentie in functie van het
type ziekenhuis, maar hebben slechts een kleine invloed op het toekennen van een DRG.60
Zij treden vaker op bij diagnosen dan bij ingrepen, die dikwijls belangrijk zijn voor de
Hoofdstuk 1: Administratieve gegevensbanken
52
terugbetaling.82;115;141In sectie 1.2.7 presenteren we de resultaten van de audit van de MKG
2003.
Studies uit de negentiger jaren in het UK gaven als codeeraccuratesse voor diagnosen 84%
aan en 97% voor ingrepen.115 Sommige ingrepen zoals bloedtransfusie worden echter vaak
niet gecodeerd.82 Het aantal codeerfouten met betrekking tot diagnosen of ingrepen
verhoogt bij toenemend aantal vergeleken digits: er worden meer fouten gemaakt op het
niveau van de 4de digit dan op dat van de 3de digit.82;95 Hoewel deze vaststelling enigszins
vanzelfsprekend is, kan ze in belangrijke mate een invloed hebben op de eindbeoordeling
van een administratieve gegevensbank en geeft ze een eerste indicatie in verband met hun
bruikbaarheid op gebied van volksgezondheid en epidemiologie. Zoals reeds gezegd is de
codering van diagnosen minder accuraat dan die van de ingrepen, en kan men voor vele
klinische aandoeningen van een beperkte accuratesse gewagen, al worden belangrijke
medische aandoeningen zoals, heupfractuur, AMI en de meeste kankers correct
gecodeerd.95
Verder worden de ernstiger letsels beter geregistreerd dan de relatief minder ernstige 139 en
worden middelenverbruikende ingrepen zoals een CABG of een keizersnede met de
grootste accuratesse geregistreerd.82;95Het gebruik van een exclusie algoritme kan de
bruikbaarheid van administratieve gegevens voor de studie van een bepaalde aandoening
verhogen. Zo bleek de PPV van een acuut myocard infarct in administratieve
gegevensbanken door het gebruik maken van een exclusie algoritme, waarin onder meer
een verblijfsduur van minder dan drie dagen en het ziekenhuis levend verlaten hebben,
duidelijk hoger in dergelijke studie dan in andere studies, die niet zo een algoritme
hanteerden.112
In de VS werden daarom een aantal richtlijnen gedefinieerd voor het gebruik van de
gegevens van administratieve gegevensbanken. Hierin wordt aangeraden eerder te
focussen op de codering van ingrepen dan op die van diagnosen. Hieronder wordt ook de
techniek begrepen die erin bestaat om het uitvoeren van ingrepen te gebruiken als
surrogaat voor bepaalde diagnosen. Verder wordt er aangeraden de interpretatie van de
diagnose- of procedurecode te beperken tot de derde digit waar mogelijk, en te erkennen
dat de meer objectief gedefinieerde en middelenverbruikende diagnosen en ingrepen meer
accuraat gecodeerd worden.82 Het verweven zijn van diagnose en ingreep maakt dat deze
Hoofdstuk 1: Administratieve gegevensbanken
53
benadering niet altijd opgaat. Voor carotis-endarterectomie bijvoorbeeld wordt bij de
indicatiestelling de graad van stenose, een diagnostisch begrip, als expliciet richtsnoer
gebruikt en is er een hele discussie gaande over hoe die stenose dient gemeten te worden.
In het raam van kwaliteitsbewaking is het duidelijk dat een vergelijking van het
sterftecijfer naar aanleiding van een carotis-endarterectomie slechts zinvol is indien er ook
rekening gehouden wordt met de indicatiestelling.170-175
Voor administratieve gegevensbanken is het cijfer van fout positieven (het registreren van
een diagnose of een ingreep die niet aanwezig was of niet uitgevoerd werd) laag waar het
cijfer van de fout negatieven (het niet registreren van een gestelde diagnose of een
uitgevoerde ingreep) meer variabel is.82
1.1.2.2.4 Relatieve waarde van enkele gegevenstypes bij toegepast wetenschappelijk onderzoek. Het leek wenselijk de relatieve waarde van, bij toegepast wetenschappelijk onderzoek,
vaak gebruikte gegevenstypes te omschrijven. Verschillende auteurs61;76;78;176-193 hebben de
vóór- en nadelen van de verschillende gegevensbronnen nagegaan vanuit het standpunt van
de kwaliteit van de zorgen (Tabellen 8 en 9). Het betreft hier overigens een zeer belangrijk
aspect van het gebruik van administratieve gegevensbanken ten behoeve van de
volksgezondheid dat verder meer uitvoerig behandeld zal worden
1.1.2.2.5 Codeerregels, registratiebeperkingen en het verlies van belangrijke informatie. Symptomen of tekens kunnen belangrijke uitkomsten zijn, die meestal niet gecodeerd
worden tenzij de etiologie ervan onbekend is. Een voorbeeld hiervan is incontinentie bij
bejaarden.136 Een mogelijke oplossing voor dergelijke problemen zou erin bestaan dat
symptomen en tekens met een impact op de zorgenverstrekking op de ontslagformulieren
vermeld zouden worden en vervolgens geregistreerd in de gegevensbank.136
Een speciaal probleem, inherent aan ziekenhuisontslaggegevens, bestaat in de moeilijkheid
het onderscheid te kunnen maken tussen bij de opname bestaande aandoeningen (co-
morbiditeit) en verwikkelingen bij behandelingen. De ICD-9-CM codes en de All Patient
Refined Diagnosis Related Groups zijn hiervoor ontoereikend.188;194-196 Dit fenomeen
Hoofdstuk 1: Administratieve gegevensbanken
54
belemmert het gebruik van administratieve gegevensbanken als instrument voor
kwaliteitsbewaking: een verwikkeling tijdens een verblijf kan immers niet onderscheiden
worden van een bestaande co-morbiditeit bij opname.136;188;196;197Bijvoorbeeld kan een
ziekenhuis met een hoge mortaliteit door myocardinfarct na een bypass operatie, wegens
de gebrekkige informatie onterecht beschouwd worden een laag, risicogecorrigeerde
CABG letaliteitcijfer te hebben, indien verondersteld wordt dat die myocardinfarcten zich
voorgedaan hebben vóór de ziekenhuisopname.198 Een voorgestelde oplossing voor dit
probleem bestaat erin te noteren of een aandoening aanwezig was bij opname of niet en het
registreren van labgegevens bij opname.93;198-200
Hoofdstuk 1: Administratieve gegevensbanken 55
N
Tabel 8: Voor- en nadelen van secundaire gegevens bij het meten van de kwaliteit van zorgen.
VOORDEEL ADEEL
Gemakkelijk te verkrijgen. Gebrek aan specificiteit en detail
Goedkoop. Slechts een beperkt aantal uitkomsten kan bestudeerd worden:
ziekenhuismortaliteit of mortaliteit binnen een gespecificeerde
tijdsspanne, ziekenhuis verwikkelingen en heropnamen.
Mensen kunnen longitudinaal opgevolgd worden. Studies op ziekenhuispatiënten lijden aan verwijzingvertekening: het is
moeilijk op een adequate manier te corrigeren voor het feit dat iemand
opgenomen wordt in een bepaald ziekenhuis.
Specifieke zorgverstrekkers kunnen opgevolgd worden. Zorgen en diagnosen in een setting van ambulante zorgen kunnen een
belangrijke invloed hebben op het ziekenhuisgebeuren.
Geen introductie van vertekening door de inclusie van alleen
maar kwaliteitsvolle centra.
Laat slechts in geringe mate het opsporen van onbedoelde uitkomsten
(“adverse events”) en “near misses” toe.
Onderzoekers beïnvloeden de praktijkvoering niet (geen
Hawthorne effect).
Verschillen in registratiepraktijken en verandering van praktijken in de
tijd.
Uniforme registratie over de ziekenhuizen wat toelaat
ziekenhuizen te vergelijken
Beperkte correctie voor case mix en het ontwikkelen van een
scoringssysteem is zeer technisch en complex. Overschatting van het
volume-uitkomst verband.
Ook zeldzame ziekten kunnen bestudeerd worden.
Minder ethische beperkingen dan andere studies
Hoofdstuk 1: Administratieve gegevensbanken
56
N
Tabel 9: Voor- en nadelen van primaire medische gegevens bij het meten van de kwaliteit van zorgen
VOORDEEL ADEEL
1) Gegevens uit het medisch dossier
Verkrijgbaar. Kostelijk om te bekomen.
Rijkere details dan administratieve gegevens. Kunnen te weinig gedetailleerd zijn.
Indien ze gestandaardiseerd zijn en opgeslagen in een
elektronisch medisch dossier, reduceert dit de
gegevensverzameling.
Rekening houden met beroepsgeheim en privé-sfeer
2) Prospectief verzamelde klinische gegevens.
Het meest specifiek; men kan exact definiëren welke gegevens
vereist zijn.
Niet gemakkelijk te bekomen.
Er bestaat een kwaliteitscontrole van de gegevensverzameling. Kostelijk om te verkrijgen tenzij ze reeds vervat zijn in een elektronisch
dossier.
Strengere (dan voor administratieve gegevens) eisen op ethisch gebied
3) Enquête gegevens.
Men kan verzamelen wat belangrijk is voor de patiënt. Niet gemakkelijk verkrijgbaar.
Men verzamelt gegevens die anders niet beschikbaar zijn. Kostelijk om te verzamelen.
Een valide instrument is vereist.
Hoofdstuk 1: Administratieve gegevensbanken 57
Hoewel administratieve gegevensbanken proces- en uitkomstgegevens verschaffen,
bemoeilijken de onderrapportering van letsels en het niet registreren van belangrijke
prognostische variabelen de evaluatie van het ziekenhuisgebeuren in die mate, dat het
waarschijnlijk beter is over een “screening” van mogelijke problemen te spreken veeleer
dan over een echte evaluatie.77;139 In administratieve gegevensbanken wordt vaak ook geen
onderscheid gemaakt tussen een opname van een patiënt met een nieuw letsel en een
heropname van een patiënt met een chronisch letsel, wat implicaties heeft voor
performance-evaluatie. Indien daarenboven de antecedenten van het letsel niet of
onvoldoende geregistreerd worden kan een vergelijking van kosten-baten i.f.v. het type
personeel vertekend zijn.81
Daarentegen verstrekken klinische gegevensbanken, gecreëerd op basis van abstraheringen
van medische dossiers, gemaakt door artsen in het kader van een extern peer review
programma, belangrijke uitkomstevaluaties, maar zijn vaak toegespitst op enkele
ziekteaandoeningen wat hun veralgemeend gebruik beperkt.82;201
1.1.2.2.6 Het beheer van, of het opzetten van gegevensbanken en de gegevenskwaliteit. In een Engelse studie werd er gepeild naar de bruikbaarheid van ontslagabstraheringen
voor het opzetten van een gegevensbank, die een vergelijking tussen diensten zou toelaten
ten behoeve van zowel de clinici als de managers.150 Dit bleek voor de diensten inwendige
ziekten en chirurgie niet mogelijk, maar wel voor de dienst verloskunde. Indien er in die
dienst problemen werden opgemerkt i.v.m. de registratie, bleken die fouten systematisch te
zijn en waren zij rechtstreeks te herleiden tot problemen i.v.m. definities.
Een belangwekkende vaststelling was dat in die dienst de geregistreerde gegevens
operationeel gebruikt worden door de vroedvrouwen, die ook voor een groot deel
verantwoordelijk waren voor de gegevensinvoer. Verder werd de gegevensbank ook
gebruikt voor routine audit, voor ad hoc vragen, voor meer gedetailleerde klinische studies
en voor het definiëren van contracten met zorgverzekeraars. Het succes van het systeem
kan gedeeltelijk toegeschreven worden aan het feit dat de dataset oorspronkelijk
ontworpen was voor de behoeften van de dienst.
De auteurs stellen deze ervaring tegenover de algemene bevinding dat routine gegevens
van een onaanvaardbare kwaliteit zijn, een veelvoorkomend verschijnsel bij
Hoofdstuk 1: Administratieve gegevensbanken
58
gecentraliseerde ziekenhuiscomputersystemen. Zij schrijven dit fenomeen toe aan een
vicieuze cirkel waarbij van de gegevens geen gebruik gemaakt wordt wegens hun
onvolledigheid en onnauwkeurigheid, en dat eens de potentiële gebruikers hun vertrouwen
verloren hebben er nog weinig ondernomen wordt om het peil van de registratie te
verbeteren.150
Het ontwerpen van protocollen, met een gedefinieerde manier voor het opstellen van een
problemenlijst op basis van overeengekomen diagnostische criteria, werd voorgesteld om
tot een betere registratie te komen.78 Ook het gebruik van aangepaste formulieren
bevordert de gegevenskwaliteit138 en gestructureerde rapportering is een leefbaar
alternatief voor gedicteerde vrije tekst, zeker wanneer het alleen gaat over de beschrijving
en interpretatie van een technisch onderzoek, waar het superieur is151.
Buiten de specifieke bevindingen van de studie van Every et al. op gebied van validiteit,
bevatte ze ook implicaties voor het beheer en het opzetten van gegevensbanken. In de
gecentraliseerde gegevensbank met centrale diagnosestelling op basis van
gestandaardiseerde abstraheerprocedures en validatie door steekproefsgewijze
herabstrahering was er een twee jaar interval tussen gegevensopslag en feedback. In het
meer gedecentraliseerd systeem, met eenvoudiger registratieformulieren en zonder
validatie door steekproefsgewijze herabstrahering, werd er een driemaandelijkse feedback
gerealiseerd. Deze snelle, continue feedback en het betrokken zijn van de lokale
dienstenverstrekkers in het verzamelen en verwerken van de gegevens zijn erkende
karakteristieken van kwaliteitsbevorderende activiteiten. Verder was het “gecentraliseerd”
systeem beduidend duurder dan het “meer eenvoudige” maar kende het “meer eenvoudige”
systeem ook een aantal tekortkomingen: mineure onderregistratie van in aanmerking
komende patiënten, een geringe niet-overeenkomst voor CVA en recurrent myocardinfarct.
De onderrapportering van deze “sentinel events” kan misschien een probleem vormen voor
kwaliteitsverzekering.79
1.1.2.2.7 De algehele doelmatigheid van het registratie-instrument. Naast accuratesse en betrouwbaarheid dient ook met de algehele doelmatigheid van het
instrument van de gegevensverzameling rekening gehouden te worden.152 De vooruitgang
Hoofdstuk 1: Administratieve gegevensbanken
59
van de IT-mogelijkheden zoals het automatiseren van de gegevensabstractie kunnen tot
hooggestemde verwachtingen leiden over een winst in tijd en uitgaven. Dit bleek echter in
een pilootstudie niet te kloppen en leidde tot het besluit dat de methodes van
gegevensabstractie dienden verbeterd te worden of dat het aantal te registreren items
diende verminderd te worden zodat de gegevensverzameling tijdig zou gebeuren en op een
kosteffectieve manier.152
1.2 DOODSOORZAKENSTATISTIEK. KWALITEIT EN VOLLEDIGHEID VAN DE GEGEVENS.
Bij hun invoering hadden overlijdenscertificaten in de eerste plaats wettelijke bedoelingen
en met name het verlenen van de toelating tot begraven4;56;64-66 Daarom mag men aanne-
men dat, op de perinatale periode33;202-204na, praktisch alle sterfgevallen geregistreerd
worden en we dus van complete bevolkingsstatistieken kunnen gewagen.56;205 Deze
wettelijke bepaling, die een quasi-exhaustiviteit waarborgt, heeft ook een minder
begerenswaardig facet: elke arts, die een overlijden vaststelt, is gemachtigd een
overlijdensbericht in te vullen en zal dit om begrijpelijke redenen vaak ook doen.
De criteria, methodes en bevindingen die we presenteerden in verband met de kwaliteit
van administratieve gegevens zijn vanzelfsprekend ook van toepassing op de
doodsoorzakenstatistieken.
Wij belichten hierna enkele, voor deze statistieken specifieke problemen i.v.m. de
gegevenskwaliteit.
1.2.1 Invloed van het genererings- en het verwerkingproces, en van de epidemiologische transitie op de kwaliteit van de gegevens.
“Vele werkers in de gezondheidszorg menen dat deze registratie een grote
onbetrouwbaarheid combineert met een geringe toegevoegde waarde.”206Gegeven hun
finaliteit en hun ontstaanswijze, lijkt enige argwaan aangaande de kwaliteit van de
gegevens overigens gewettigd. Het gaat hier immers over gegevens, die niet uit een
degelijk opgezette studie voortkomen, maar wel uit de ambtelijke registratie van geboorten
en sterfgevallen.4 Vervolgens zijn er verschillende personen en diensten betrokken bij het
Hoofdstuk 1: Administratieve gegevensbanken
60
aanmaken van deze statistieken: de gegevenstoeleveraars, namelijk artsen en gemeentelijke
diensten, en de ambtelijke registrators, namelijk encodeurs en codeurs.
Toch stelde Friedman in 1980: “Er worden belangrijke problemen en onnauwkeurigheid
toegeschreven aan overlijdensberichten. Nochtans vormen zij een wijd toegepaste
gegevensverzameling over fatale aandoeningen, die gebruikt kunnen worden om het
voorkomen van ziekten te bestuderen op het lokale, nationale en internationale niveau.”207
Een gelijkaardig geluid horen we ook op het einde van de negentiger jaren bij Moolgavkar:
“Ondanks de beperkingen van de gegevens en de methodologie, zijn de analyses van
incidentie en mortaliteitsgegevens in staat ons bruikbare inzichten te verschaffen in de
temporele evolutie van een ziekte in een bevolking. Deze analyses laten ons soms toe
kwesties te behandelen die niet gemakkelijk op een andere manier behandeld kunnen
worden, voornamelijk wanneer trends zich uitstrekken over periodes die ruim de
tijdsspanne van follow-up en case-control studies overschrijden.”208
In de volgende paragrafen trachten we elementen aan te reiken over de waarde van deze
gegevens. Hierbij wordt aandacht geschonken aan aspecten van reproduceerbaarheid /
precisie en validiteit / vertekening.128;160;207 Vervolgens komen ook kwantitatieve aspecten
aan bod.
Een diagnose stellen is uiteraard geen eenvoudige taak. Daarenboven veranderen de dia-
gnostische hulpmiddelen en dus de precisie niet alleen over de tijd maar ook volgens de
plaats en de situatie: behandelende arts, reanimerende arts of arts die de dood komt
vaststellen, ervaren arts of arts in opleiding.4;209 Ook in functie van het type van
aandoening worden er verschillen in accuratesse van de overlijdensstatistieken vastgesteld.
Ze is groter wanneer het gaat over langdurige, goed gekarakteriseerde aandoeningen dan
over relatief plots en niet geobserveerde sterfgevallen.210 Verder kunnen ook verschillen in
opleiding van de artsen een rol spelen bij de diagnosestelling211; maken huisartsen minder
certificatiefouten dan ziekenhuis artsen212; nemen die fouten toe bij toenemende leeftijd
van de overledene, bij toenemende leeftijd van de arts en verminderen zij bij toenemend
kwalificatieniveau van het ziekenhuis212; en, zijn de kennis en vorming op het gebied van
het invullen van een overlijdensbericht onvoldoende met onder meer een verwarring tussen
het principe van ernst en het toe te passen principe van causaliteit.206;212;213 Tenslotte is de
Hoofdstuk 1: Administratieve gegevensbanken
61
kwaliteit van de diagnose ook een functie van de bekendheid van de certificerende arts met
de overledene: een reanimerende arts kan een stervende aantreffen op een ogenblik dat het
al te laat is om de doodsoorzaak vast te stellen.
Naast het hierboven beschreven diagnoseprobleem stellen er zich vaak nog een aantal
specifieke certificatieproblemen. De sterfgevallen worden gecertificeerd door een groot
aantal artsen, die dit uiteraard op een gedecentraliseerde manier doen wat duidelijk de
eenvormigheid van certificeren niet in de hand werkt.32 Ook andere factoren spelen een rol
in de variabiliteit tussen de certificerende artsen. Met name het correct weergeven van de
causale keten, die leidt tot een overlijden, is niet eenvoudig. Het beginpunt van deze
causale keten is de oorspronkelijke doodsoorzaak of “underlying cause of death”, die via
één of meerdere intermediaire doodsoorzaken verder verloopt en eindigt met een
onmiddellijke doodsoorzaak.27 Nu is de eerste bedoeling van de overlijdensstatistieken
preventief: men tracht namelijk het leven te verlengen door te verhinderen dat de
oorspronkelijke doodsoorzaak optreedt. Het is dus bij uitstek deze doodsoorzaak die
gepubliceerd wordt en vaak is het de enig beschikbare214.
De steeds toenemende vergrijzing van de bevolking heeft echter het overlijdenspatroon
gewijzigd van een meer eenvoudig, door infectieziekten206;215;216 en maternale sterfte217
gedomineerd beeld, tot een meer complex geheel waarin chronische aandoeningen een
steeds meer prominente rol zijn gaan spelen en waarin bij één individu meerdere
chronische aandoeningen kunnen aanwezig zijn. Wegens deze epidemiologische transitie
is het dan ook veel moeilijker geworden een unieke oorspronkelijke doodsoorzaak aan te
duiden.210;215;218 Voor een groot aantal van de sterfgevallen zal deze unieke doodsoorzaak,
hoe goed ze ook geselecteerd werd, de aan de dood voorafgaande morbide condities niet
langer op adequate manier beschrijven.
Vandaar de nood aan een multipele doodsoorzaken statistiek die naast de oorspronkelijke
doodsoorzaak ook andere op het certificaat vermelde doodsoorzaken opneemt. 214;215;219-226
Zo rapporteerden we bijvoorbeeld in de doodsoorzakenstatistiek 1994 dat de
oorspronkelijke doodsoorzaak van zelfmoord door de certificerende arts soms spontaan
verder werd verduidelijkt door een andere doodsoorzaak zoals het aanwezig zijn van een
kanker. Deze andere of “secundaire doodsoorzaken” verschaffen bijkomende medische
informatie en leveren inzichten in de onderlinge samenhang van doodsoorzaken.33;220-
Hoofdstuk 1: Administratieve gegevensbanken
62
222;227;228 Het registreren van meerdere doodsoorzaken biedt daarenboven de mogelijkheid
om de invloed op de overlijdensstatistieken na te gaan van een verandering in de
selectiemethode van de oorspronkelijke doodsoorzaak zoals bij het invoeren van een
nieuwe classificatie, bij een verandering van interpretatie van een codeerregel van de
Internationale Classificatie van Ziekten of bij het overschakelen op geautomatiseerd
coderen.27;214;229
In het perspectief van beleidsvoorbereiding is het begrip van onderlinge samenhang
belangrijk - men spreekt dan van “competing risks” - wanneer men tracht na te gaan wat
de impact van het elimineren van één bepaalde doodsoorzaak op de totale sterfte is.223;230
Conventioneel worden doodsoorzaken als onafhankelijk van elkaar beschouwd in die zin
dat wanneer men een oorzaak van een voortijdig overlijden wegneemt de winst gelijk
gesteld wordt aan het aantal levensjaren dat door de geëlimineerde doodsoorzaak zou
ontnomen zijn. Nu is het zo dat een mens voortdurend blootgesteld wordt aan
verschillende gelijktijdig optredende risico’s zoals kanker of hartziekte en dat deze risico’s
met elkaar in competitie treden om als oorspronkelijke doodsoorzaak te fungeren. Verder
bestaat er onder concurrerende risico’s een grote verscheidenheid in termen van
afhankelijkheid, inclusief totale onafhankelijkheid. Ook kunnen personen die overlijden
t.g.v. een aandoening een groter of kleiner risico hebben te sterven aan een concurrerende
oorzaak dan deze die weerspiegeld wordt door het overlijdenspatroon van de algemene
bevolking.223Nochtans zou onafhankelijkheid van doodsoorzaken geredelijkerwijze
aangenomen kunnen worden indien er bij de geanalyseerde doodsoorzaken geen
gemeenschappelijke risicofactoren aanwezig zijn.223;230 In het algemeen kan men stellen
dat, vermits er goede redenen bestaan om te geloven dat er een onderregistratie bestaat van
concurrerende doodsoorzaken, het wijs lijkt de op conventionele manier berekende
winsten op gebied van levensverwachting ten gevolge van de uitschakeling van een
doodsoorzaak als een overschatting te beschouwen van de werkelijk te verwachten
winst.223
Om de vergelijkbaarheid van de overlijdensstatistieken te bevorderen heeft de Wereld
Gezondheidsorganisatie (WGO) een aantal initiatieven genomen.
Hoofdstuk 1: Administratieve gegevensbanken
63
Om het eenvormig certificeren te bevorderen stelt ze een formulier ter beschikking voor
het certificeren van een overlijden met tevens een aantal begripsomschrijvingen.27 Wegens
zijn fundamenteel belang voor de statistiek geven we hier de definitie weer van de
oorspronkelijke doodsoorzaak: “De oorspronkelijke doodsoorzaak is (a) de ziekte of de
verwonding die de aaneenschakeling van gebeurtenissen, die uiteindelijk tot de dood
leidden, teweegbracht, of (b) de omstandigheden van het ongeval of geweld die de fatale
verwonding veroorzaakten.”231;232 Het “Internationaal Formulier van Medisch Certificaat
van Doodsoorzaak” is onderverdeeld in een deel I, bedoeld voor de weergave van de
causale keten waarvan de oorspronkelijke doodsoorzaak de basis vormt, en een deel II
waarin ander significante aandoeningen - de zogenaamde bijkomende doodsoorzaken -
opgenomen kunnen worden, die bijgedragen hebben tot het overlijden zonder nochtans
verband te houden met de ziekte, de verwonding of de aandoening die de dood
veroorzaakte. Een approximatief tijdsinterval biedt een ruggensteun voor het correct
invullen van het certificaat.232Waar België er voordien een eigen(gereid) model op nahield,
is het Belgisch certificaat sinds 1998 conform gemaakt aan het WGO-model (Figuur 1).
Hoofdstuk 1: Administratieve gegevensbanken
64
Figuur 1: Het Belgische Certificaat en het WGO-model
Naast certificeringrichtlijnen heeft de WGO ten behoeve van de codering een aantal regels
en nota’s uitgevaardigd met als bedoeling de meest bruikbare of informatieve
oorspronkelijke doodsoorzaak te identificeren.232 Al zijn een aantal regels en richtlijnen
Hoofdstuk 1: Administratieve gegevensbanken
65
aanvechtbaar – zo wordt bijvoorbeeld wel aangenomen dat HIV een Kaposi-sarcoom maar
niet dat Schistosoma Haematobium een uretercarcinoom kan veroorzaken of een
hepatitisvirus een levercarcinoom233 - toch menen wij dat door dit geheel van richtlijnen,
definities en regels de vergelijkbaarheid van de overlijdensstatistieken over de
verschillende landen gemaximaliseerd wordt.
Een herziening van de ICD-classificatie, noodzakelijk om de classificatie aan te passen aan
het veranderend relatief belang van aandoeningen, de veranderende medische terminologie
of het opnemen van nieuwe aandoeningen, brengt een ander type probleem met zich mee,
namelijk een artificiële breuk in tijdsreeksen, zeker indien de herziening gepaard gaat met
een wijziging in de codeerregels, zoals dit gebeurde bij de overgang van de negende naar
de tiende herziening.229 Zoals bij elke herziening werd ook nu het aantal ziektecategorieën
gevoelig verhoogd van een 5.000-tal naar een 8.000-tal met bijvoorbeeld een opsplitsing
van de unieke code voor acuut myocardinfarct in ICD-9 tot zes codes in ICD-10, die de
plaats van het infarct preciseren.
Hoofdstukken van de classificatie werden herbenoemd, herschikt of nieuwe hoofdstukken
werden aan de classificatie toegevoegd. Zo werd bijvoorbeeld het hoofdstuk gewijd aan
het Zenuwstelsel en de Zintuigen opgesplitst in drie hoofdstukken namelijk dat van het
zenuwstelsel, dat van het oog en zijn adnexa, en dat van het oor en van de processus
mastoideus. Regel 3, die stipuleert dat wanneer een door de algemene regel, of door regels
1 of 2 geselecteerde oorzaak duidelijk het rechtstreeks gevolg is van een andere op het
certificaat vermelde oorzaak deze oorzaak dient geselecteerd te worden, werd uitvoerig
uitgewerkt met als meest in het oog springend gevolg dat het aantal sterfgevallen ten
gevolge van pneumonie of bronchopneumonie gevoelig daalden.229;233 Ook ziekten of
symptomen werden herbenoemd en/of geherklasseerd. Zo werden septische shock en
respiratoir falen van het hoofdstuk symptomen in ICD-9 overgebracht respectievelijk naar
het hoofdstuk infecties en ziekten van ademhalingsstelsel, en verhuisde de groep van
myelodysplastische syndromen van het hoofdstuk “Bloed en bloedvormende organen”
naar dat van ”Nieuwvormingen”.229
Hoofdstuk 1: Administratieve gegevensbanken
66
Al deze veranderingen maken dat vergelijkingen over de tijd, ook op
hoofdstukniveau, niet onmiddellijk uitgevoerd kunnen worden maar het uitwerken
vereisen van een vergelijkbaarheidsratio, met als formule Ci = Di,ICD-10/Di,ICD-9.In
deze formule staat Ci voor de vergelijkbaarheidratio voor ziekte i, Di,ICD-10 voor het
aantal sterfgevallen ten gevolge van ziekte i bij toepassing van de ICD-10-
classificatie en Di,ICD-9 voor het aantal sterfgevallen ten gevolge van ziekte i bij
toepassing van ICD-9. In de Verenigde Staten leidden deze veranderingen voor
hartziekten tot een Ci van 0,9858 of een artificiële vermindering van ongeveer
1,5%. Voor kwaadaardige neoplasmata bedroeg de Ci 1,0068 maar bleken er
belangrijke verschuivingen te bestaan van pneumonie naar kanker, van kanker naar
HIV, en van respiratoire kanker naar andere types van kanker. Voor influenza en
pneumonie bedroeg de Ci 0.6982, voor HIV 1,0637, voor virale hepatitis 0,8343,
voor verkeersongevallen door motorvoertuigen 0,8527 en voor accidentele val
0,8409. Voor een uitvoerige bespreking van het onderzoek naar de invloed van de
ICD-10 herziening op de overlijdensstatistieken van de Verenigde Staten verwijzen
we naar het werk van Anderson et al.229;234
Teneinde een grotere eenvormigheid te bereiken op gebied van het coderen – de
regelgeving van de WGO laat immers ruimte voor interpretatie235 - werden in de
Verenigde Staten een aantal softwareprogramma’s ontwikkeld.236;237
Het eerste programma was het Automated Classification of Medical Entities (ACME) en
had als bedoeling uit de op het certificaat vermelde doodsoorzaken de oorspronkelijke
doodsoorzaak te selecteren aan de hand van een geheel van beslissingstabellen waarin de
ICD-9 regels en nota’s verwerkt zijn. Deze beslissingstabellen vormen de kern van het
systeem waarop de hele automatisering gebaseerd is.
Nadien werden hieraan de Mortality Medical Indexing, Classification, and Retrieval
(MICAR) en SuperMICAR systemen toegevoegd, die een verdere automatisering van het
coderen mogelijk maakten. SuperMICAR laat het invoeren toe van een totaal vrije,
literaire tekst, zoals hij door een arts op het overlijdensbericht wordt ingevuld, en
converteert deze literaire tekst tot Entity Reference Numbers (ERN’s), die via MICAR, die
Hoofdstuk 1: Administratieve gegevensbanken
67
de ENRs tot ICD-codes omzet, en vervolgens via ACME gecodeerd worden. Van de
certificaten, die niet automatisch verwerkt kunnen worden via MICAR en SuperMICAR,
worden de doodsoorzaken manueel tot codes omgezet en vervolgens verder verwerkt via
ACME.
Ondanks enkele mineure problemen onder meer het overcoderen van het
overlijdensmechanisme zoals verschillende aritmieën, nierfalen, in plaats van een
etiologische, specifieke doodsoorzaak.237, zijn deze systemen de facto de internationale
standaard geworden voor het automatisch coderen van sterftegegevens.229;237 Noteren we
ook dat deze software het voor de Verenigde Staten mogelijk maakte de
vergelijkbaarheidstudie uit te voeren voor de overgang van ICD-9 naar ICD-10 aan de
hand van de bestaande 1996 sterftegegevensbestanden.229
1.2.2 Internationale studies in verband met kwaliteit van certificatie en codering. Een aantal studies hadden als opzet na te gaan of, en in welke mate, de internationaal
verschillende overlijdenspatronen ook werkelijke verschillen waren dan wel artefacten te
wijten aan certificatie- en/of coderingspraktijken.211;235;238-242Voor dergelijke studies werd
vaak gebruik gemaakt van papieren patiënten. Een medische geschiedenis werd in de
deelnemende landen aan een aantal artsen ter certificatie voorgelegd. Deze certificaten
werden vervolgens door de nationale centra gecodeerd en door een referentie-eenheid
opnieuw gecodeerd.211;238-240 Soms bleef de opzet beperkt tot het vaststellen van eventuele
verschillen in codeerpraktijken en werden bestaande certificaten door een referentie-
eenheid opnieuw gecodeerd.235;241Deze studies toonden aan dat internationale verschillen
gedeeltelijk reëel waren, maar dat er toch belangrijke vertekeningen waren wegens
uiteenlopende certificatie- en codeerpraktijken en dat de vertekeningen in functie van het
bestudeerde onderwerp in belangrijkheid verschilden.
In andere studies werden certificaten vergeleken met autopsie rapporten243, met
hospitaaldossiers244;245, met registers134;165 en soms werd een specifieke enquête georgani-
seerd246 waarbij aan de informant gevraagd wordt een aantal vragen te beantwoorden over
de gezondheidsgeschiedenis van de overledene. Ook een vergelijking van
overlijdensberichten met meerdere andere gegevensbronnen werd uitgevoerd.247
Hoofdstuk 1: Administratieve gegevensbanken
68
De resultaten van dergelijke vergelijkingen tonen aan dat de juistheid van de gegevens niet
feilloos is.247;248 In het algemeen varieert de overeenkomst tussen overlijdenscertificaten en
diagnose afkomstig uit andere bronnen (autopsie, hospitaal dossiers) sterk in functie van de
beschouwde doodsoorzaak en vermindert bij stijgende leeftijd.36;246
Voor coronaire hartaandoeningen (CHD), een van de belangrijkste doodsoorzaken, bestaat
er in de VS een aanzienlijke overschatting249 en in andere landen onder meer België een
aanzienlijke onderschatting (meer dan 40%).165;250 In de VS bleken overigens de
sensitiviteit en de positieve voorspellende waarde van een beroerte kleiner dan die van
CHD, die op haar beurt kleiner was dan die van kankers. De specificiteit en de negatieve
predictieve waarde bleken groot te zijn voor deze aandoeningen, waren lager bij vrouwen
dan bij mannen en daalden bij toenemende leeftijd. Verder bleek er geen trend te bestaan
van deze waarden over drie decades.249
Een moeilijkheid bij CHD bestaat erin dat een aantal sterfgevallen zich buiten het
ziekenhuis voordoen en dat die vaak onterecht gecertificeerd worden als CHD.64 Een
studie, waarbij het overlijdensbericht vergeleken werd met alle beschikbare medische
informatie, leverde een vergelijkbaarheidratio op van 1,44 voor “de out-of-hospital” CHD-
gevallen en 0,90 voor de “in-hospital” gevallen; verder een PPV van 0,83 vs 0,60, een
sensitiviteit van 0,75 versus 0,87 en een fout positieve fractie van 0,08 versus 0,63 voor
respectievelijk in-hospital versus out-of-hospital CHD.64Uit een andere, op een
gelijkaardige manier opgezette studie bleek dat het gelijkstellen van hartstilstand (ICD-9
code: 427.5) met een “sudden cardiac death” (SCD) een sensitiviteit had van 24% en een
specificiteit van 85%.251 Het interpreteren van een hartstilstand als een SCD en vervolgens
in afwezigheid van ander belangrijke pathologie als een CHD geeft aanleiding tot een
overschatting van de CHDs.
Voor colo-rectale kanker als oorspronkelijke doodsoorzaak bleek in de VS de ratio van het
aantal kankers bekomen op basis van de doodsoorzakenstatistiek over dit aantal bekomen
via experten-review praktisch gelijk aan 1 en dit zowel in 1937 als in 1947, 1970-1, en in
1975-1987. Voor colo-rectale kanker, als bijkomende doodsoorzaak, bleek dit veel minder
het geval.252
Hoofdstuk 1: Administratieve gegevensbanken
69
Voor een eerder zeldzame aandoening zoals Amyotrofische Lateraalsclerose (ALS) bleek
de overlijdensstatistieken een voldoende betrouwbaar instrument voor epidemiologische
doeleinden, al is er ook voor deze aandoening sprake van een verminderende
betrouwbaarheid in functie van de leeftijd maar niet in functie van het jaar van
overlijden.247
Om het belang van chronisch obstructief longlijden behoorlijk in te schatten bleek het
noodzakelijk een analyse op alle doodsoorzaken uit te voeren omdat chronisch obstructief
longlijden in aanwezigheid van ischemische hartaandoeningen vaak als bijkomende
doodsoorzaak vermeld wordt. Waar chronisch obstructief longlijden op 8,0% van alle
overlijdenscertificaten vermeld werd, was het slechts in 59,8% ervan als oorspronkelijke
doodsoorzaak vermeld. Verder bleek het onderscheid tussen astma en chronisch obstructief
longlijden vaak niet correct gemaakt te worden met een voorkeur van astma voor vrouwen
en jongere leeftijdsgroepen; bleken bronchitis en niet nader gespecificeerd chronisch
obstructief longlijden meer frequent gebruikt te worden in de oudste leeftijdsgroepen dan
de specifieke vormen van chronisch obstructief longlijden.205;209
Een in het Verenigd Koninkrijk toegepaste techniek bestaat erin het overlijdensbestand te
linken met ziekenhuisontslag gegevensbestand om de “uitkomst” van levensbedreigende
aandoeningen, zoals femurhalsfractuur en beroerte (ICD-9 codes: 431-4,436), na te
gaan.176;184;185;253
Dit soort studies werd opgezet naar aanleiding van de vaststelling in autopsiestudies dat
een ziekte wel aanwezig kan zijn bij het overlijden, maar niet noodzakelijk op het
overlijdensbericht vermeld wordt.185
Zo werden er in functie van het type aandoening grote verschillen vastgesteld in de
overeenkomst tussen de hoofddiagnose in het ontslagbericht van het ziekenhuis en het
certificaat, bij personen die binnen de vier weken na de ziekenhuisopname overleden.185
Voor verschillende kankertypes, beroerte, ischemische hartaandoeningen, spina bifida,
ziekten van de voorhoorncellen en multipele sclerose bleek de hoofddiagnose voor
ongeveer 90% van de gevallen terug te vinden op het overlijdenscertificaat.
Hoofdstuk 1: Administratieve gegevensbanken
70
Voor intracraniaal letsel, diabetes, en niet-medicinale intoxicaties was dit tussen de 60 en
70%, en voor femurhalsfractuur, anemie, astma en medicamenteuze en drugsintoxicaties
bedroeg dit 40% of minder.
Ook de mate waarin deze aandoeningen gecertificeerd waren als oorspronkelijke of
bijkomende doodsoorzaak verschilde in functie van het type aandoening.185
Uit een gelijkaardige studie maar nu bij personen, die binnen een tijdsspanne van een jaar
na de ziekenhuisopname overleden, bleek dat een femurhalsfractuur vaak niet vermeld
wordt op een overlijdensbericht zelfs wanneer het overlijden zich vlug na de fractuur
voordeed en dat de Standardised Mortalty Ratio (SMR) voor femurhalsfractuur niet alleen
veel hoger is dan in de algemene bevolking van vergelijkbare leeftijdsgroepen maar dat de
SMR gedurende verscheidene maanden verhoogd bleef.253
Verder bleek er in de periode 1994-8 over de ziekenhuizen heen geen significante
verschillen in ziekenhuissterfte ten gevolge van femurhalsfractuur te bestaan, bestond er
een duidelijke sociaal-economische trend en bleek er voor de periode 1968-98 na een
aanvankelijke vermindering van de letaliteit sinds het begin van de tachtiger jaren geen
verdere vermindering op te treden in de letaliteit van de aandoening.
Ook werd een toename van leeftijdsspecifieke incidenties vastgesteld met derhalve een
duidelijke implicatie in termen van preventie van osteoporose.176;253 Voor beroerte gingen
de bevindingen eerder in de tegenovergestelde richting: het beroerte sterftecijfer daalde
over de laatste decennia en letaliteitcijfers bleken goede predictoren te zijn voor
ziekenhuisrangen, indien de cijfers berekend werden berekend op basis van de gekoppelde
bestanden.184
Naast deze oorzaakspecifieke studies werd voor de periode 1963-1998 ook de
chirurgiegerelateerde mortaliteit via deze koppelingsstrategie onderzocht. Dit onderzoek
wees uit dat de 30-dagen ziekenhuissterfte voor de periode 1963-74 79,3% van de totale
sterfte bedroeg, voor de periode 1975-86 bedroeg haar aandeel 71,2% en voor 1987-98
61,2%. Hieruit leiden de auteurs van de studie af dat ziekenhuissterfte alleen een
onvoldoende maat is voor de chirurgie gerelateerde mortaliteit wegens de toegenomen
Hoofdstuk 1: Administratieve gegevensbanken
71
transfer van kritisch zieke patiënten en wegens de afgenomen
ziekenhuisverblijfsduur.183Dergelijke studies zijn belangrijk bij de interpretatie van
interziekenhuis verschillen in letaliteit en verblijfsduur.
1.3 BESLUIT
Om over te gaan van een klassieke vraaggestuurde en ziekenhuisgecentreerde benadering,
naar een meer behoeftengestuurd en bevolkingsgericht gezondheidsbeleid is een degelijk
gezondheidsinformatiesysteem nodig. Hierin krijgen secundaire gegevensbanken een
belangrijke rol toebedeeld, met name het in kaart brengen van de gezondheidsstatus van de
bevolking en het mogelijk maken om verantwoording af te leggen over het gebruik van de
toegekende middelen en over de kwaliteit en de uitkomsten van de verstrekte zorgen.
Vraag is dan in welke mate administratieve gegevensbanken die rol ook kunnen vervullen.
Om hierop een antwoord te kunnen geven werd op basis van literatuurgegevens een
referentiekader voor het beoordelen van kwaliteit uitgewerkt en werden statistische en
epidemiologische onderzoeksmethoden voor het bestuderen van gegevenskwaliteit
verkend.
Een zorgvuldig design van de registratie met inbegrip van de te gebruiken formulieren of
beeldschermen; de selectie van te registreren items (zoals klinische, radiologische en
labgegevens, EKG en beeldvorming); eenduidige instructies; het toepassen van
internationaal aanvaarde classificatiesystemen en bijbehorende codeerregels; het op
systematische wijze verzamelen, verwerken en interpreteren van de gegevens en het
monitoren ervan over de tijd zijn basisvereisten voor kwaliteitsverzekering.
73
Hoofdstuk 2: Gebruik van administratieve gegevensbanken in een perspectief van een kwaliteitsvol volksgezondheidsbeleid.
Volksgezondheid, epidemiologie en gezondheidsdiensten zijn brede terreinen waarbinnen
intensief gebruik gemaakt wordt van administratieve gegevensbanken. Hoewel deze drie
domeinen een eigen specificiteit hebben, is het duidelijk dat ze niet los van elkaar staan en
dat er overlapping optreedt. Deze concepten werden immers als volgt omschreven9:
“Volksgezondheid is één van de inspanningen georganiseerd door de gemeenschap om de
gezondheid van de bevolking te beschermen, te bevorderen en te herstellen. Het is een
combinatie van wetenschappen, vaardigheden en overtuigingen, die erop gericht is de
gezondheid van de ganse bevolking te bewaren en te verbeteren door collectieve of sociale
acties. De erbij betrokken programma’s, dienstverlening en instellingen benadrukken de
ziektepreventie en de gezondheidsnoden van de bevolking in zijn geheel. De activiteiten
op het gebied van volksgezondheid veranderen samen met de veranderende technologie en
sociale waarden, maar de doeleinden blijven dezelfde: het verminderen van de ziektelast,
van voortijdig overlijden, van door ziekte geïnduceerde ongemakken en van tijdelijke of
definitieve beperkingen in de bevolking. Volksgezondheid is dus een sociale institutie, een
tak van de wetenschap, en een praktijk”.
“Gezondheidsdiensten leveren diensten, die uitgevoerd worden door professionele
beoefenaars van de gezondheidszorg, of door anderen onder hun leiding, met de bedoeling
de gezondheid te bevorderen, te bewaren of te herstellen. Naast individuele
gezondheidszorg, treffen gezondheidsdiensten maatregelen ter bescherming en ter
bevordering van de gezondheid, en van ziektepreventie”.
“Epidemiologie is de studie van de verspreiding en de determinanten van
gezondheidsgerelateerde toestanden of gebeurtenissen in bevolkingen, en de toepassing
van deze studie om gezondheidsproblemen onder controle te houden.”
Niettegenstaande hun conceptuele overlapping zijn volksgezondheid en
gezondheidsdiensten vaak twee verschillende werelden, zowel in de geest van de
betrokken sectoren als van het beleid.15;254 Nochtans bestaat er conceptueel geen verschil
tussen de volksgezondheidsindicator van vermijdbare sterfte en het gebruik van
Hoofdstuk 2: Gebruik van administratieve gegevensbanken 74
onbedoelde uitkomsten - “adverse events” in de Engelstalige literatuur – als indicatoren
voor gezondheidsdiensten.254 Er bestaan overigens voorbeelden van het gebruikmaken van
ziekenhuisgegevens als evaluatie-instrument voor de volksgezondheid.15;77;85-90;92;255
Meer en meer groeit het bewustzijn dat effectieve gezondheidstussenkomsten een op
elkaar afstemmen vereisen van het zorgsysteem, dat voornamelijk op individuen gericht is
en op het gezond maken van zieken, en het volksgezondheidssysteem, dat op de bevolking
gericht is en het verhinderen dat gezonde mensen ziek worden.256
Er bestaan nochtans tal van voorbeelden van potentiële synergie tussen beide werelden,
zoals bijvoorbeeld het versterken van gezondheidsbevorderende activiteiten via de
massamedia wanneer een gerenommeerd clinicus in die activiteit betrokken wordt.256
Het ontwikkelen van gemeenschappelijke prestatie indicatoren in een context van
gezamenlijke verantwoordelijkheid en verantwoording afleggen kan een vertrekpunt zijn
voor een integratie van beide benaderingen in een biopsychosociaal interventiemodel.256
Toepassingsvoorbeelden hiervan zijn seksuele gezondheid (bvb. ongewenste
zwangerschappen) en geweld (bvb. kindermisbruik) die zowel bevolkingsgebaseerde
(zoals een gezonde, sociale omgeving) als klinische (zoals behandeling, identificeren van
risico-individuen) benaderingen vereisen.256
De essentiële, initiële stappen om tot de gewenste integratie te komen bestaan uit (1) een
nationaal forum waar experts uit beide werelden elkaar ontmoeten; en, (2) de afbakening
van de rol en verantwoordelijkheid van de verschillende belanghebbenden
(“stakeholders”).
Het verwezenlijken van de eerste stap veronderstelt naast politieke wil, ook technische en
politieke vaardigheden. De realisatie van de tweede stap is nog problematischer, want hij
veronderstelt het overstijgen van de bestaande breuk tussen twee culturen, tussen
organisaties, en verder de definitie van verantwoordelijkheid en het toekennen van de
nodige middelen.256
In een recent rapport, waarin in opdracht van de Nederlandse overheid een raamwerk voor
het ontwikkelen van prestatie-indicatoren werd ontwikkeld, werd in figuur 1 een synthese
voorgesteld van de benadering vanuit de wereld van de volksgezondheid en
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
75
vanuit de wereld van de kwaliteitssystemen. Daarbij worden respectievelijk indicatoren
van gezondheid en informatie over de kwaliteit van de geleverde zorg verzameld.72
Figuur 1: Determinanten en indicatoren van gezondheid (volksgezondheidsinformatie) en domeinen van managementinformatie over het zorgsysteem in één raamwerk.
Bron: Delnoij et al.13
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
76
Dit proefschrift beoogt dan ook bij te dragen tot een vervaging van deze kunstmatige
scheiding tussen volksgezondheid en gezondheidsdiensten om een efficiënt
volksgezondheidsbeleid te bevorderen. Het omschrijven van de mogelijkheden die
administratieve gegevensbanken bieden i.v.m. de beoordeling van kwaliteit van
gezondheidsdiensten lijkt ons een uitgelezen toepassing van dit streven. De beoordeling
van dit fundamenteel aspect en de eruit voortvloeiende bijsturing van het
gezondheidsbeleid is immers alleen maar mogelijk door het samenbrengen van gegevens
uit de verschillende ondersystemen van het gezondheidssysteem (onder meer eerste lijn en
ziekenhuizen). Het is tevens een peilen naar de bruikbaarheid van dergelijke
gegevensbanken voor het beleid, waarbij ook de complementariteit met alternatieve
benaderingen van kwaliteitsbeoordeling aan bod komt.
2.1 KWALITEIT
“The quality of care. How can it be assessed? There was a time, not too long ago, when
this question could not have been asked. The quality of care was considered to be
something of a mystery: real, capable of being perceived and appreciated, but not subject
to measurement. The very attempt to define and measure quality seemed, then, to denature
and belittle it. Now, we may have moved too far in the opposite direction. Those who have
not experienced the intricacies of clinical practice demand measures that are easy,
precise, and complete – as if a sack of potatoes was being weighted”.257
“Although adverse events and iatrogenic injury are relatively common among hospitalized
patients, identifying substandard care is elusive”. 258
2.1.1 Kwaliteit, prestatie en een beleid gebaseerd op kostenbeheersing.
Kwaliteit kan op meerdere manieren gedefinieerd worden, afhankelijk van de plaats
waarop men zich binnen het zorgsysteem bevindt en van de natuur en de omvang van zijn
verantwoordelijkheid.257 Het Insitute of Medecine (IOM) definieert kwaliteit als volgt:
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
77
“De mate waarin gezondheidsdiensten voor individuen en bevolkingen de
waarschijnlijkheid van verlangde gezondheidsuitkomsten verhogen en in overeenstemming
zijn met de huidige beroepskennis”. 259
In het conceptueel kader voor het Amerikaanse National Healthcare Quality Report
worden twee te meten dimensies vermeld, namelijk kwaliteit van zorg (met aspecten zoals
veiligheid, effectiviteit, patiëntgerichtheid en tijdigheid) en consumentenperspectief (met
aspecten zoals gezond blijven, beter worden, leven met ziekte of beperkingen, omgaan met
sterven) met een voortdurende toetsing aan het principe van billijkheid (“equity”).
Efficiëntiemeting is in dit opzet vooralsnog in beperkte mate aanwezig.260 Een gelijkaardig
kader voor kwaliteitsverbetering werd ook voor België aanbevolen.261
Het begrip prestatie - performance in de Angelsaksische literatuur - overlapt in grote mate
het begrip kwaliteit.72;262 Soms wordt het, zoals in het European Community Health
Indicators project van de Europese Commissie, min of meer als een synoniem ervoor
gebruikt.72 Prestatie omvat onder meer aspecten van aansprakelijkheid/verantwoording
afleggen (“accountability”), rendement (”return”), maar ook kwaliteit van
gezondheidsdiensten70-72;263;264, hoewel een prestatie-indicator, strikt genomen, niet
noodzakelijk inferenties over kwaliteit maakt.263 Delnoij omschrijft prestatie-indicatoren
als volgt: ”Dit zijn indicatoren die iets zeggen over het functioneren van het
gezondheidssysteem: doet het systeem wat het geacht wordt te doen (mensen beter maken,
onnodige sterfte vermijden) en gebeurt dit op een veilige en patiëntvriendelijke manier?”72
Prestatie-indicatoren zijn derhalve meestal gericht op het meten van de mate waarin
doelstellingen bereikt werden.72;73 De volgende definitie, die ten behoeve van het U.S.
Department of Health and Human Services door een panel experts werd gegeven,
illustreert deze zienswijze: “Performance Measure: a quantitative indicator that can be
used to track progress toward an objective, i.e., to detect change over time and difference
in change across programs”.73
Degelijke informatie is fundamenteel voor het voeren van een gezondheidsbeleid.
Prestatie- en kwaliteitsindicatoren vormen hiervan een essentieel onderdeel, zeker voor een
“terugtredende” overheid, die de dagdagelijkse verantwoordelijkheid voor de zorgen
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
78
“uitbesteedt” maar wel de “toezichthouder, marktmeester en de borger van publieke
belangen”72 blijft.
Om tot het concept kwaliteitsvolle volksgezondheid te komen en zo de synthese tussen
volksgezondheidsbenadering en kwaliteitssystemen te concretiseren, volgen we hier de
overkoepelende kwaliteitsbenadering van Donabedian, waarin zowel technische als
interpersonele aspecten (Figuur 1) aan bod komen en kwaliteit in een ruime,
maatschappelijke context geplaatst wordt, waarin ook de aspecten opgenomen zijn, die
onder performance verstaan worden.257;265
Het voortreffelijk zijn van technische zorgen wordt beoordeeld door de verwachte
verbetering van de gezondheidstoestand te vergelijken met de gerealiseerde, rekening
houdend met wat de huidige wetenschap en technologie van gezondheidszorg hebben
mogelijk gemaakt. Wanneer we “doeltreffendheid” (“effectiveness”) omschrijven als de
gerealiseerde fractie van wat mogelijk(“efficacy”) is, dan wordt de kwaliteit van de
technische zorg proportioneel tot zijn doeltreffendheid en wordt er een verband gelegd
tussen kwaliteit en prestatie.257
Hoofdstuk 2: Gebruik van administratieve gegevensbanken 79
Figuur 1: Kwaliteit in zijn maatschappelijke context.
Hoofdstuk 2: Gebruik van administratieve gegevensbanken 80
Een volgende stap is het uitzetten van de teweeggebrachte verbetering van de gezondheid
tegen de kost waarmee ze gepaard gaat of doelmatigheid (“efficiency”). Hoewel zij niet
hoeven te interfereren met een optimale uitkomst zijn onnodige zorg en onnodig kostelijke
zorg dermate verbonden met zorgeloosheid en sociale onverantwoordelijkheid dat men het
doelmatigheidsaspect bezwaarlijk kan loskoppelen van kwaliteit.265 Ook voor de Wereld
Gezondheidsorganisatie heeft doelmatigheid een hoge prioriteitswaarde wanneer ze
prestatie omschrijft als het beste resultaat dat kan bereikt worden gegeven de beschikbare
middelen.70;72;265
Kost en kwaliteit zijn in mekaar verstrengeld: tot op zekere hoogte zal de winst in
gezondheid toenemen bij toenemende uitgaven. Nochtans gaat de toename in kosten
onverminderd door waar dit voor de gezondheidswinst niet zo is (wet van het degressief
rendement14). Dit leidt tot twee punten op de curve van de nuttige toevoegingen aan zorg:
enerzijds een punt van “optimaal” doeltreffende zorg (beste verhouding kwaliteit en
kosten), door Donabedian “optimaliteit” (Figuur 2) genoemd, en anderzijds een punt van
“maximaal” doeltreffende zorg (best mogelijke kwaliteit maar met proportioneel hogere
kosten dan op het optimaliteitspunt, respectievelijk punten B en A in figuur 2.1.2).257;265
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
81
Figuur 2: Definiëren van doelmatigheid en doeltreffendheid bij het beoordelen van
kwaliteit
Bron: Donabedian257
Een andere, minder optimistische visie stelt dat de relatie tussen kost en kwaliteit niet
monotoon is. Wanneer de investeringen in het gezondheidssysteem zich op een laag niveau
bevinden, zullen grotere investeringen waarschijnlijk resulteren in meer gezondheid en
betere kwaliteit. Maar op een bepaald ogenblik zullen bijkomende investeringen en
veranderingen in financiële stimulansen waarschijnlijk uitmonden in het verstrekken van
niet geëigende zorg.266 Heel wat mensen uit de sector van de volksgezondheid zijn
overigens de mening toegedaan dat het verhogen van budgetten of enkel het behouden van
dezelfde budgetten niet kan zonder een betere verantwoording van het rendement t.o.v. de
gedane investeringen in programma’s.73
Donabedian voegt de begrippen aanvaardbaarheid van de behandeling, legitimiteit en
billijkheid (“equity”) toe aan potentiële doeltreffendheid (“efficacy”), doeltreffendheid 13
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
82
(“effectiveness”), doelmatigheid en optimaliteit – samen de “zeven pijlers” die de kwaliteit
schragen – om tot een overkoepelende visie van kwaliteit te komen.265 Aanvaardbaarheid
van de behandeling houdt in dat artsen rekening houden met patiëntenvoorkeuren, met zijn
vragen en bekommernissen waaronder de kosten, en hem de doeltreffendheid van de zorg
zodanig uitlegt dat de patiënt een geïnformeerde keuze kan maken. Deze speciale focus op
de patiënt, de zogenaamde patient-centeredness en ook op het tijdig verstrekken van
zorgen krijgen overigens heden ten dage steeds meer aandacht bij de beoordeling van
kwaliteit.265;267;268 Legitimiteit betekent dat de zorg aanvaardbaar moet zijn voor de
maatschappij.
Kwaliteitselementen kunnen elkaar versterken of integendeel met mekaar in conflict
komen. De meest storende conflicten ontstaan wanneer maatschappelijke en individuele
voorkeuren verschillen. Het is dan de billijkheid, de faire verdeling over de ganse
bevolking van zorgen en het nut ervan, die het arbitrageproces dient te leiden.265 Kwaliteit,
waarin de begrippen van aanvaardbaarheid voor de individuele patiënten en voor de
maatschappij vervat zijn, kan dus niet alleen in technische termen beoordeeld worden
door gezondheidszorgprofessionelen.257;265;269 De notie van kwaliteitszorg impliceert dat
middelen toegekend worden in functie van medische noden, risico en nut.270
Het interpersonele element is het vehikel waarmee de technische zorg wordt uitgevoerd en
waarvan zijn succes afhangt. Respect voor privacy, confidentialiteit, het mogelijk maken
van een onderbouwde keuze, bezorgdheid, empathie, eerlijkheid, takt, gevoeligheid zijn
kenmerken van een goede interpersonele relatie.257;265 Donabedian
vraagt zich af: “Als dit aspect van zorg zo belangrijk is, waarom wordt er dan zo vaak aan
voorbij gegaan bij de beoordeling van de kwaliteit van zorgen257?” Vooreerst is dit soort
informatie vaak niet beschikbaar, bestaan er vooralsnog weinig goed ontwikkelde criteria
en standaarden waaraan de interpersonele relatie kunnen getoetst worden, en zijn ze
moeilijk te ontwikkelen omwille van de zeer uiteenlopende verwachtingen en voorkeuren
van individuele patiënten.257
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
83
Het IOM echter stelt dat kwaliteit kan gemeten worden, dat er een substantieel verschil
bestaat tussen de gemiddelde kwaliteit en de beste die bereikt kan worden, en dat dit zowel
geldt in de setting van de prestatiegeneeskunde als in het zorgmanagement (“managed
care”).266;271;272Met een uitdrukkelijke referentie naar de IOM definitie van kwaliteit en
aansluitend bij het kiemkrachtig werk rond belangrijke verschillen in kwaliteit, besprak de
nationale rondetafel over kwaliteit van de gezondheidszorg in de US drie manieren waarop
kwaliteit van zorgen en diensten in het gedrang kunnen komen:
- overgebruik zoals het toedienen van antibiotica als ze niet effectief zijn,
- ondergebruik zoals het niet voorschrijven van β-blockers in geval van AMI
- en, misbruik namelijk de te voorkomen verwikkelingen van behandelingen.271-273
“De convergentie van de bezorgdheid over de kost van medische zorg, het beschikbaar zijn
van grote hoeveelheden van klinische uitkomstgegevens in gecomputeriseerde
gegevensbestanden, en de opzienbarende vooruitgang in de beoordelingsmethodes van
factoren gerelateerd aan uitkomsten hebben een nieuw tijdperk ingeluid van het afleggen
van verantwoording door artsen, ziekenhuizen en gezondheidssystemen.”274 Zorgverleners,
ziekteverzekeraars, ziekenfondsen, beleidsmakers en patiënten maken meer en meer
gebruik van kwaliteits- en prestatie-indicatoren en dit voor kwaliteitsverbetering, voor het
nemen van beslissingen en voor beleidsvoering. 13;70;72;77;254;262;269;275
Er wordt sinds een twintigtal jaren in de gezondheidssector van de meeste Westerse
landen, waaronder België, een beleid van kostenbeheersing gevoerd. 72;73;266;275-278 Men
vreest dat dit ten nadele van de kwaliteit van de zorgen zal uitvallen,266;277kwaliteit die zelf
al verontrustend is271;279. In de VS worden tienduizenden ziekenhuissterfgevallen per jaar
toegeschreven aan medische fouten279 en krijgen slechts 54,9% van de patiënten de
aanbevolen zorgen.280 Men spreekt over een wijder wordende kloof tussen optimale en
verstrekte kwaliteit.271;281Er wordt gesteld dat kwaliteit ongelijk verdeeld is over de
bevolking277 en dat er praktisch geen gegevenssets van klinische kwaliteitsmaten in
veralgemeend gebruik zijn277.
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
84
Tezelfdertijd groeit het besef dat verantwoording dient afgelegd te worden zowel door de
gezondheidssector zelf als door de overheid.72;73;266;276;282-284 Waar iedereen het erover eens
is dat de kwaliteit van de verstrekte zorgen beoordeeld moet worden, blijft de operationele
vertaling ervan, vooral in ambulante setting, een probleem.269;285In deze context is de
ontwikkeling van kwaliteitsindicatoren een noodzaak.70;72;262Dit is echter een complexe
aangelegenheid en veronderstelt een waaier aan competenties.72;77;181;254;262;263
Het invoeren van performance metingen in openbare diensten had als bedoeling het
afleggen van verantwoording te bevorderen. Dit soort metingen zou toelaten outliers te
identificeren, gevolgd door een meer diepgaand onderzoek bij minder goed of beter
presterende zorgverleners. Hierbij is een afzetten tegen een gemiddelde een belangrijk
kenmerk van deze metingen.286 Het opkrikken van de performance van ondermaatse
zorgverleners of hun verwijdering uit het systeem, én het identificeren van aspecten die
leiden tot beter dan gemiddelde uitkomsten zou leiden tot een algemene verbetering.272;286
Vaak worden gezondheidsuitkomsten zoals niet-gecorrigeerde opnamecijfers voor astma,
epilepsie en diabetes gebruikt als prestatie-indicatoren. Dit is een oneigenlijk gebruik van
uitkomsten omdat bij prestatiemeting alleen die aspecten van zorg in aanmerking genomen
dienen te worden, die hadden kunnen beïnvloed worden door het gezondheidspersoneel,
dat beoordeeld wordt, en er hier ook patiëntgebonden factoren een rol spelen.287 Als er
vergelijkingen gemaakt worden dient dit immers op een correcte manier te gebeuren en
dient de eventuele kritiek geuit te worden aan het adres van hen die ervoor
verantwoordelijk zijn. Of dit toepasbaar is op de performance maten die nu gebruikt
worden is vooralsnog onzeker.286 “... De suggestie dat een uitkomst van een substantiële
publieke investering opgevolgd en beoordeeld dient te worden is niet onredelijk. Een
bijkomend argument stelt dat, indien klinische richtlijnen en de audit ervan betekenisvol
willen zijn, hun doeltreffendheid ook gemeten dient te worden in termen van de bevolking
die ziekenhuizen bedienen. De kwestie is daarom niet “al dan niet” maar wel “hoe?”.286
Deze visie wordt door andere auteurs bijgetreden.269;285
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
85
2.1.2 Beoordeling van kwaliteit: de visie van de consument en van de zorgverlener.
Ondanks het bestaan van een arsenaal kwaliteitsindicatoren weten we onvoldoende wat de
waarden en voorkeuren zijn van de consumenten aangaande de kwaliteit van zorgen.
Recent onderzoek dat erop gericht was hoe consumenten kwaliteit definiëren leverde een
aantal belangrijke bevindingen op. Vooreerst worden gemaksvoorzieningen zoals voeding,
parking en netheid als zeer verschillend beschouwd van kwaliteitszorg. Vervolgens dient
het begrip van tevredenheid onderscheiden te worden van kwaliteit. Een consument kan
tevreden zijn met zorgen, die niet een hoge kwaliteitswaarde hebben en ontevreden zijn
met kwaliteitszorg. Tenslotte bleken kwesties zoals met respect behandeld te worden en
betrokken te worden in beslissingen over behandelingen, aspecten van gezondheidszorg
die niet vaak in satisfactie-enquêtes opgenomen worden, van zeer groot belang voor de
patiënten.288
Toch blijven er nog een aantal vragen open over welke informatie betreffende kwaliteit
consumenten wensen te beschikken en hoe zij kwaliteit definiëren. Een aantal uitgeteste
vragen (valide en betrouwbaar) aan consumenten laten een beoordeling van de
zorgkwaliteit toe. Die vragen gaan over zowel proces (ervaringen van de consument
gedurende een bepaalde klinische episode) als uitkomst (gezondheidsgerelateerde
levenskwaliteit [“health-related quality of life” (HRQL)] voor en na een behandeling).
Dergelijke, gerichte vragen geven beter de kwaliteit van zorgen weer, zijn beter
interpreteerbaar en meer bruikbaar voor actie dan bevraging over satisfactie en excellentie
van zorgen.
Ondanks de vele dwingende argumenten voor het verzamelen en het onder het publiek
verspreiden van informatie over HRQL, bestaan er praktische en theoretische bezwaren om
dit te doen. Vooreerst zijn veel van die HRQL uitkomsten niet nauw verbonden met
kwaliteit. Dit veronderstelt immers een wel gedefinieerde patiëntengroep (medisch en
demografisch) en een welbepaald etiologisch mechanisme, dat de medische tussenkomst
relateert met de uitkomst, en verder dienen de uitkomsten specifiek te zijn voor de
medische aandoening. Aan deze voorwaarden wordt zelden voldaan. Tenslotte is de
noodzakelijke risicocorrectie voor HQRL uitkomsten meestal zeer moeilijk.60;288;289 Meer
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
86
algemeen dient men bij studies, waarbij de gezondheidszorg door consumenten beoordeeld
wordt, aandacht te schenken aan de manier waarop correctie voor case mix (voornamelijk
de inschatting van de eigen gezondheidstoestand) werd doorgevoerd en hoe er omgegaan
werd met het probleem van response vertekening ( hogere opleidingsgraad wordt soms
geassocieerd met minder positieve evaluaties).60
Het meten van het “goed zijn” vereist accurate gegevens, die op een gepaste manier
gebruikt worden zonder het gezondheidspersoneel te demoraliseren of te demotiveren.269
Vermits er niet zoiets bestaat als de perfecte of juiste maatstaf, kunnen niet-geëigende
maatstaven uitmonden in perverse stimulansen en de rechtvaardiging zijn van
gegevensmanipulatie of leiden tot demotivatie, disfunctie of crisis.
Momenteel wordt de selectie van kwaliteitsmaatstaven vaak eerder gestuurd door wat kan
gemeten worden, dan door een definitie van wat goed is gevolgd door een daarvan
afgeleide maatstaf.269
Kenmerken van kwaliteitsmaatstaven zijn: het valide, mededeelbaar, doeltreffend,
betrouwbaar, objectief, beschikbaar, contextueel, toeschrijfbaar, interpreteerbaar,
vergelijkbaar, remedieerbaar, aanvaardbaar en herhaalbaar zijn.263;269
Bij de keuze van een maatstaf moet de bedoeling duidelijk zijn, de alternatieven besproken
worden en de beperkingen openlijk erkend worden. Verder moet het duidelijk zijn dat de
bedoeling verbetering is, niet veroordeling. Tenslotte is geduide feedback belangrijk. Hij
moet gedragen worden door leiderschap en dient over de nodige middelen te
beschikken.269 Laten we eraan herinneren dat naast de toetsing aan professionele
maatstaven kwaliteit eveneens functie is van de appreciatie van gezondheidszorgen door
de patiënten en door het publiek.257;265;269 Nu berust de keuze van een wel bepaalde
zorgverlener - de uitdrukking van hoe de patiënt de graad van “goed zijn” bepaalt - niet
alleen op vergelijkingen van de zorguitkomst, maar ook van wachttijden en van de
vroegere individuele ervaringen.269
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
87
2.1.3 Beoordeling van kwaliteit en administratieve gegevens.
Na het omschrijven van een algemeen kader voor het voeren van een kwaliteitsvol
volksgezondheidsbeleid, met de ruime betekenis van het concept kwaliteit zoals
Donabedian het formuleerde, verkennen we vervolgens de mogelijkheden, die
administratieve gegevensbanken bieden, om de onderdelen zorgen- en
consumentenperspectief en de eraan grenzende onderdelen van de volksgezondheid- en
managementinformatie gestalte te geven en hun verwevenheid aan te tonen.
Het is vanzelfsprekend dat administratieve gegevens onmogelijk over alle aspecten van
kwaliteit informatie kunnen verschaffen. Ziekenhuisontslaggegevens bevatten immers
slechts diagnostische en therapeutische informatie, die uit het medisch dossier werden
geabstraheerd. De diagnostische informatie is in België beperkt tot diagnoses, waarvoor er
meestal geen dwingende definitie bestaat, en bevat geen informatie over de resultaten van
laboratorium en andere technische onderzoeken. Hierbij dient opgemerkt dat het aantal
registreerbare diagnoses en ingrepen in ons land onbeperkt is, met derhalve de
mogelijkheid om co-morbiditeit en (iatrogene) verwikkelingen te vermelden.
Administratieve gegevens kunnen behulpzaam zijn om problemen in verband met
klinische performance te signaleren, kwaliteitsverbeterende activiteiten te onderbouwen,
het nadenken over de klinische praktijk uit te lokken, en belangrijke problemen te
identificeren ten behoeve van verder onderzoek.290Ook is het gebruik van dit soort
gegevens aantrekkelijk: de gegevens zijn gemakkelijk beschikbaar en stellen minder
ethische problemen dan het plannen, werven van fondsen en uitvoeren van langdurige
experimentele studies.180;182 De keerzijde van de medaille is echter niet onbeduidend en
wanneer men onderzoek wenst te doen met dit soort gegevens dient men rekening te
houden met de beperkingen eigen aan administratieve gegevens.182Onderzoek
veronderstelt immers (1) een precieze omschrijving van welke patiënten in de studie
worden opgenomen of niet, (2) een adequate risicocorrectie, (3) een correcte weergave van
de werkelijkheid door de geregistreerde behandelingen of zorgprocessen, en (4) een
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
88
correcte weergave van de uitkomst met inbegrip van eventuele verwikkelingen.182
Onderzoek vergt derhalve een toetsing van al deze veronderstellingen.
Een eerste reeks tekortkomingen heeft te maken met de validiteit, accuratesse, volledigheid
en betrouwbaarheid van de gegevens180;182 en gaat over opzettelijk fout coderen, het niet bij
machte zijn gevallen van ondermaatse zorg op te pikken177, slechts het intramuraal facet
van de sterfte te bevatten176;182-185, het veranderen van codeerpraktijken in de tijd180 (zie
ook 1.1.2 en 4.2), en conflicterende bevindingen met bijvoorbeeld een gering verband
tussen onbedoelde uitkomsten (“adverse events”) en sterfte180. In vergelijking met
ingreepgegevens zijn vooral diagnoses problematisch.82;182 Dit onderscheid is misschien
overschat omdat de reden waarvoor een ingreep verricht wordt op de diagnose berust en
dat ze belangrijk is zowel bij de evaluatie van processen als van uitkomsten. Verder zijn
administratieve gegevens gekenmerkt door een lage sensitiviteit en een niet-adequate
betrouwbaarheid.290
Een tweede reeks tekortkomingen gaat over de gebrekkige risicocorrectie en andere
belanrijke factoren178;180 De verschillende, bestaande manieren om de ziekte-ernst te
bepalen kunnen tot verschillende resultaten leiden188;196Geen risicocorrectie uitvoeren is
overigens geen optie.192 Het verband tussen volume en kwaliteit wordt in observationele
studies op basis van administratieve gegevens soms overschat.193De beschikbaarheid van
diensten is een andere vertekenende, contextuele factor.287Verder heeft een aantal
beperkingen te maken met de ICD-9-CM codering.290;291 Het gaat hierbij vooral over het
beperkte aantal standaard en E-codes om medische fouten te identificeren, het ontbreken
van precieze klinische definities, aan PPS gerelateerde discoding en, zoals voormeld, het
moeilijk onderscheid tussen bestaande co-morbiditeit en in het ziekenhuis verworven
verwikkelingen, wanneer niet aangegeven is welk pathologieën aanwezig waren bij
opname of niet.93;180;186;187;189;196;198;200;290;292 In tegenstelling met gegevensbanken van
ziekenfondsen, die “levenslange” informatie heeft over haar leden, heeft de MKG alleen
longitudinale informatie over zieken, die in een bepaald ziekenhuis gedurende een bepaald
jaar werden opgenomen.182
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
89
Het is de bedoeling van dit proefschrift te onderzoeken of, ondanks deze tekortkomingen,
administratieve gegevens bruikbaar zijn voor kwaliteitsscreening. Dit onderzoek lijkt ons
aangewezen omdat administratieve gegevens het enige middel is dat ter beschikking staat
van de overheid om haar verantwoordelijkheid als borger van de publieke belangen op te
nemen.
We zullen hierbij twee benaderingen volgen: een eerste, gebaseerd op
kwaliteitsindicatoren, en een tweede, gebaseerd op een analyse van onbedoelde
uitkomsten293 (“adverse events”). Kwaliteitsindicatoren gaan uit van structuur, proces en
uitkomst van de gezondheidszorg - de triade van Donabedian - met aandacht voor
overgebuik (“overuse”), ondergebruik (“underuse”) en een foutief gebruik (“misuse”) van
een zorg. Zij gaan over specifieke aandoeningen en ingrepen en worden uitgedrukt onder
vorm van een cijfer (“rate”).
De benadering via onbedoelde uitkomsten vertrekt van een foutief gebruik van zorg, van
een ongustig voorval of een incident, is generisch van natuur en wordt op individueel of
geaggregeerd niveau behandeld.
2.2 BENADERING GEBASEERD OP KWALITEITSINDICATOREN.
2.2.1 Types en gebruik van kwaliteitsindicatoren.
2.2.1.1 Domeinen waarbinnen kwaliteitsindicatoren gebruikt worden.
Kwaliteitsindicatoren worden in drie domeinen toegepast: structuur, proces en
uitkomst.72;77;257;261;276;294;295
Structuur wordt door de American Medical Association (AMA) omschreven als “ ...
voorzieningen, uitrusting, diensten , en de mankracht beschikbaar voor zorg, benevens de
credentialen en kwalificaties van de professionele beoefenaars van de
gezondheidszorg”.276 Zij verwoordt proces als “ ... de inhoud van de zorg, d.w.z. hoe de
patiënt zich beweegt in, doorheen, en uit het gezondheidszorgsysteem en de diensten die
verstrekt werden tijdens de zorgepisode”.276
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
90
Uitkomst wordt geformuleerd als “... de resultaten van de zorg, en omvat onder meer
biologische veranderingen in ziekte, komfort, het vermogen tot zelfzorg, fysiek
functioneren en mobiliteit, emotionele en intellectuele prestaties, patiëntensatisfactie en de
perceptie van de eigen gezondheid, gezondheidskennis en therapietrouw, en leefbaarheid
van de familie, baan, en het sociaal functioneren”.276
Uitkomsten zijn derhalve multidimensioneel, vaak kwalitatief en wisselend over
subgroepen.296
De veronderstelde schakel tussen deze domeinen en kwaliteit bestaat erin dat goede
structuren, waarschijnlijk goede zorg bevorderen en dat dit waarschijnlijk tot betere
uitkomsten leidt. Het is noodzakelijk dat deze relatie ook werkelijk aangetoond
wordt257;276;294 vooraleer enige afzonderlijke component van een structuur, proces of
uitkomst kan gebruikt worden voor het beoordelen van kwaliteit257. Indien criteria op
gebied van zorgenkwaliteit, gebaseerd op structuur- of procesgegevens, geloofwaardig
willen overkomen, dan moet aangetoond kunnen worden dat verschillen in de kenmerken,
die zij meten, leiden tot verschillen in uitkomst. Voor uitkomst criteria zal er aangetoond
moeten worden dat veranderingen in zorgprocessen ook leiden tot veranderingen in
uitkomsten.297
Over structuren weten we relatief weinig en structuren zijn vooralsnog een eerder stomp
instrument voor kwaliteitsbewaking. Ook de beoordeling van interpersonele relaties
bevindt zich nog in de kinderschoenen. De relatie tussen technische zorg en uitkomst is op
sommige gebieden vaststaand, op andere helemaal niet, en hetzelfde type beperkingen
geldt ook voor procesbeoordelingen. Het kan daarbij niet sterk genoeg benadrukt worden
dat ons vermogen om kwaliteit te beoordelen gebonden is aan de sterkten en zwakten van
de klinische wetenschap. Dit geldt zeker wanneer men uitkomsten bestudeert, gegeven de
veelvuldigheid van factoren die een uitkomst beïnvloeden. Bevestiging is nodig door
beoordeling van het proces zelf.257
Wat ook de sterkte en beperkingen zijn van patiëntensatisfactie, er dient terdege rekening
mee gehouden te worden.257;276;288;294Zij kan gezien worden als een uitdrukking van (1) de
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
91
interpersonele relatie, (2) de kwaliteit van specifieke componenten van technische zorg en
de uitkomst. Hierbij dienen ook gedragingen gerekend te worden, die onrechtstreeks
ontevredenheid suggereren zoals gebrekkige therapietrouw, voortijdig stopzetten van
behandeling, veranderen van arts of van gezondheidsplan of hulp zoeken buiten het
zorgsysteem.257;276
2.2.1.2 Processen of uitkomsten? Er bestaat nog steeds onenigheid of proces- dan wel uitkomstmetingen een betere
weergave van kwaliteit van zorgen zijn.288 Hoewel de uiteindelijke beoordeling van de
kwaliteit van gezondheidszorg gebeurt aan de hand van patiëntenuitkomsten, waarin
patiënten en zorgverzekeraars bij uitstek geïnteresseerd zijn, zijn er een aantal voordelen
verbonden om procesmetingen te gebruiken voor de evaluatie van zorgkwaliteit boven
uitkomsten.257;273;277
Mortaliteit, de meest gebruikte uitkomstindicator levert immers minder aanknopingspunten
voor kwaliteitsverbetering258 dan procesindicatoren, waarvoor artsen veel gemakkelijker
hun verantwoordelijkheid aanvaarden en die bruikbaarder zijn in veel voorkomende
chronische aandoeningen dan uitkomsten, die zich vaak jaren later voordoen, zoals
hypertensie en een beroerte.273;298Verder zijn in de praktijk procesgegevens in het medisch
dossier aanwezig, als het ware op het ogenblik dat ze zich voordoen zodat onmiddellijke
actie kan ondernomen worden en bestaat er een grotere consensus over geëigende
processen en over streefcijfers (ongeveer 100%).257;294 Ook vereist het meten van
zorgprocessen vaak geen risicocorrectie, die zo vaak omstreden is bij vergelijkingen van
uitkomsten. Tenslotte is het gemakkelijker kritische zorgprocessen die niet uitgevoerd
werden te identificeren, onder meer door ze te vergelijken met bestaande richtlijnen, en te
corrigeren dan te bepalen waarom uitkomsten niet optimaal zijn.263;277;280
Uitkomsten hebben dan het voordeel dat ze alle bijdragen tot zorg weerspiegelen met
inbegrip van de bijdrage van de patiënt.257;294 Maar het kan meerdere jaren duren voor een
aantal belangrijke uitkomsten zich manifesteren, en, vermits significante en
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
92
verwezenlijkbare verbeteringen in uitkomsten meestal veel kleiner zijn in relatieve termen
dan verbeteringen in processen, zijn er onrealistische grote steekproeven nodig voor het
meten van significante verbeteringen in uitkomsten. In tegenstelling hiermee is de
steekproefgrootte voor processen veel realistischer en zijn ze gemakkelijker
interpreteerbaar.277 Daarenboven dient men er bij uitkomstmetingen, hoe goed de correctie
voor ziekte-ernst ook was, rekening mee te houden dat er steeds plausibele verklaringen
kunnen gegeven worden, die niets van doen hebben met kwaliteit, en dat, in geval van
werkelijke verschillen in sterfte, er steeds onderzocht dient te worden waaraan ze te wijten
zijn.178
Verder kan de keuze tussen uitkomst en procesmaten bepaald worden aan de hand van een
aantal operationele elementen zoals het verkiezen van een procesindicator, indien de
beschikbare tijd kort is.299 Ook voor- en nadelen in termen van middelen spelen een rol bij
de keuze: men kan een uitkomstmaat verkiezen omdat die minder vaak moet aangepast
worden dan een procesmaat.300 Tenslotte zijn validiteit en gebruiksvriendelijkheid factoren
waarmee bij de keuze van het type indicator rekening gehouden wordt.300 Zo zijn
procesindicatoren vaak onbegrijpelijk voor de leek, maar zijn overleving en
levenskwaliteit zeer vatbare begrippen.294;300 Ook de overheid, die verantwoordelijk is voor
het borgen van de publieke belangen en met name het garanderen van kwaliteitsvolle en
betaalbare zorgen, hecht groot belang aan resultaatindicatoren.70;72;262;301
In het algemeen is het best in een beoordelingssysteem elementen van structuur, proces en
uitkomst op te nemen.257;294 Dit laat de aanvulling toe van de zwakte van één benadering
door de sterkte van een andere, het helpt de bevindingen te interpreteren en, indien die
bevindingen zinloos lijken, kan dit leiden tot een herbeoordeling van de studieopzet en een
in vraag stellen van de accuratesse van de gegevens.257 Tenslotte kan men stellen dat de
meest doeltreffende manier van kwaliteitsverbetering erin bestaat processen en
zorgstructuren te identificeren, die de grootste impact hebben op patiëntenuitkomsten en
daaraan middelen toe te kennen.294
Nochtans bestaan er grenzen aan deze op uitkomsten gebaseerde benadering van
kwaliteitsverbetering. Sterfte, de meest gebruikte uitkomstmaat, is gewoonlijk een
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
93
zeldzaam voorval wat resulteert in onvoldoend statistisch vermogen of, in tegendeel, is
voor ziekten zoals longkanker een verwachte uitkomst. Verder is risicocorrectie een
belangrijk aspect bij de interpretatie van een op sterfte gebaseerde indicator.
Niet-fatale uitkomsten zijn veel moeilijker te meten en uitkomsten doen zich vaak slechts
geruime tijd na een zorgepisode voor, wat een terugkoppeling naar kwaliteitsverbetering
inefficiënt maakt. Tenslotte is er een toenemende deelname in de besluitvorming vanwege
de patiënten.
Ondanks haar beperkingen bestaat er een sterke, heroplevende belangstelling voor dit type
van indicatoren: men erkent dat het gebruik van structuur- of procesvariabelen alleen niet
valide kunnen zijn en dat uitkomstmaten meer valide zijn omdat ze direct gericht zijn op
gezondheidsstatus.294
2.2.1.3 Verband tussen structuur of proces en uitkomst. Structuur beschrijft het kader waarin zorg verstrekt wordt en het vermogen van de setting
om kwaliteit te produceren.72;77;257;276Slechts een beperkt aantal verbanden tussen structuur
en uitkomst werden bestudeerd: het patiënten- en ingrepenvolume van ziekenhuizen, het
feit een academisch ziekenhuis te zijn of niet, de erkende kwalificatie van de artsen, het
percentage geregistreerde verpleegkundigen, het percentage van de artsenpraktijk binnen
het ziekenhuis en de deelname van de zorgverleners in de besluitvorming van het
ziekenhuis.15;77;294;297;302-309
Voor vele van deze structuurgebonden variabelen werden tegenstrijdige resultaten i.v.m.
patiëntenuitkomst geobserveerd en voor anderen bleek de omzetting ervan in beleid- of
praktijkverandering moeilijk, indien niet onmogelijk.294 Overigens is van deze
structuurelementen eigenlijk alleen het volume een goed vehikel voor
kwaliteitsverbetering, vermits de andere niet gemakkelijk te veranderen zijn.77;104
De volume-uitkomst verbanden schijnen een surrogaat marker te zijn voor een aantal met
structuur en proces verbonden variabelen, die beter rechtstreeks gemeten zouden
worden.294 Toch worden volume-indicatoren ook nu nog gebruikt en tonen studies met een
hoge graad van risicocorrectie het verband tussen volume en uitkomst aan en dit op
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
94
ziekenhuisniveau.218;310;311 In een review over het verband tussen volume en kwaliteit
geven Halm et al.312 de volume-uitkomst weer in een conceptueel raamwerk (Figuur 1).
Figuur 1: Conceptueel raamwerk: Hoe zou volume kwaliteit kunnen beïnvloeden?
Bron: Halm et al. 312
Bij dit kader formuleren de auteurs volgende bedenkingen. Patiëntenselectie gebeurt op
verschillende manieren. Soms hebben patiënten weinig tijd of keuze (bvb. patiënten met
een geruptureerd aorta abdominalis aneurysma) maar in minder dringende situaties en
zeker voor electieve chirurgie is het omgekeerde waar. We weten ook weinig over het
verband tussen patiëntenselectie en -volume. Is het aannemelijk dat patiënten in groot-
volume ziekenhuizen meer of minder aangewezen kandidaten zijn voor chirurgie dan
patiënten in kleinvolume ziekenhuizen? Een enkele studie toont aan dat grootvolume
chirurgen meer geneigd waren een niet-aangewezen carotisendarterectomie uit te voeren
dan kleinvolume chirurgen.312
Bij vergelijkingen tussen ziekenhuizen is een terdege risicocorrectie (ziekte-ernst en co-
morbiditeit) een fundamentele vereiste, zeker als grootvolume chirurgen de ziekere of
minder zieke patiënten behandelen. Zoniet zouden zij tot niet-valide besluiten leiden.
Volumes kunnen niet rechtstreeks betere resultaten teweeg brengen, maar wel via
verschillen in de zorgcomponenten: vaardigheden van de arts en andere zorgverleners of
organisatorische vaardigheden.312
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
95
Er werden een aantal significante verbanden gelegd tussen processen en uitkomst wanneer
de patiënt als eenheid van analyse genomen werd. Dit was bijvoorbeeld het geval voor
hartfalen, acuut hartinfarct en pneumonie.294
Maar de meeste pogingen om zulk een verband te leggen met het ziekenhuis als eenheid
van analyse, waren niet overtuigend omwille van beperkingen van de studieopzet, niet-
adequate risicocorrectie, of het gebruik van ondertussen achterhaalde procescriteria.294
2.2.1.4 Risicocorrectie en maten van ziekte-ernst (“severity of illness”).
2.2.1.4.1 Waarom dient men voor risico te corrigeren? Ziekenhuissterfte is een veel gebruikte kwaliteitsindicator waarmee ziekenhuizen of artsen
vergeleken worden.69;313 Dergelijke vergelijkingen dienen voorzichtig doorgevoerd te
worden want ook nu nog is het zo dat verschillen in sterfte naast verschillen in kwaliteit
van zorgen ook te wijten kunnen zijn aan verschillen in case mix76;101;302;314-316, leeftijd
en/of geslacht101;314;317. Verschillen in volledigheid, betrouwbaarheid en validiteit van de
gegevens (onder meer in codeerpraktijken)101;191;275;282;318;318-322, en in nomenclatuur of
definities van diagnoses en ingrepen163;318spelen hierbij eveneens een rol. Verder
beïnvloeden verschillen in ziekte-ernst en co-morbiditeit,74;105;313;314;317;319;323-326 en het in
rekening nemen of niet van de co-morbiditeit geregistreerd tijdens (een) vorige
opname(s)327de uitkomst. Ook kunnen verschillen in uitkomst te wijten zijn aan
onvoldoende risicocorrectie101-105;328, aan het feit of een ingreep gepland was of niet314;317,
en aan patiëntenselectie312;319. Tenslotte kunnen het ontbreken van het tijdsinterval tussen
diagnose en overlijden302;317 en de beperkingen van de gebruikte risicomaten, die
voornamelijk op de eerste drie dagen van de opname gericht zijn319artificiële verschillen in
ziekenhuisletaliteit veroorzaken.
Uit een review over het volume-uitkomst verband bij CABG stelden Sowden et al. vast
dat, naarmate men bij dit type studies sterfte beter gaat corrigeren, de “klaarblijkelijke”
winst van grootvolume t.o.v. kleinvolume ziekenhuizen verdwijnt.192 Dergelijke
“shrinkage” van volume-uitkomst verbanden en/of van een betere risicocorrectie werd
overigens door meerdere auteurs vermeld en wijst op haar belang.74;101;102;105;192;320;329-331
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
96
Uitkomsten van behandelingen, waaronder sterfte, kunnen uitgedrukt worden als de som
van de doeltreffendheid van de behandeling plus risicofactoren, die het antwoord op de
behandeling beïnvloeden, plus kwaliteit van de zorg plus toeval.188
Vermits de doeltreffendheid van een behandeling gekend is en de toevalsfactor door
statistische methodologie kan ondervangen worden, is het mogelijk de kwaliteit van de
verstrekte zorgen te beoordelen op voorwaarde dat men corrigeert voor de
risicofactoren.178;188 Nu beïnvloeden verscheidene patiëntenkenmerken het risico,
waaronder leeftijd, geslacht, acute fysiologische stabiliteit, hoofddiagnose en haar ernst,
co-morbiditeit, functionele status, psychosociale en culturele factoren, sociaal-
economische karakteristieken. Het meten van sommige kenmerken is echter niet
eenvoudig en kan duur zijn. Verder kunnen patiënten en artsen een totaal andere mening
hebben over het functioneren van de patiënt. Met wiens zienswijze moet men dan rekening
houden? Ook is het mogelijk dat niet-verzekerde patiënten minder kwaliteitsvolle
ziekenhuiszorgen krijgen dan andere. Correctie voor type betaler kan deze belangrijke
verschillen verdoezelen.188
“Gecorrigeerde” uitkomstcijfers zijn aantrekkelijk 1) voor clinici, die ze zouden kunnen
gebruiken voor audits, 2) voor verzekeraars, ziekenhuisverantwoordelijken en huisartsen,
die ze zouden kunnen gebruiken voor het opstellen van zinvolle en meetbare standaarden
en om hun patiënten/cliënten te informeren over hun keuze van zorgverlener, en 3) voor de
patiënten, die hierop hun keuze van een zorgverlener kunnen baseren.178
Er werd echter te weinig aandacht besteed aan het vermogen van uitkomstmaten om
werkelijke verschillen in performance aan te tonen.178 Zo werden twee ziekenhuizen
vergeleken, elk met een verzorgingsgebied van ongeveer 300.000 inwoners en een
gelijkaardige demografische samenstelling (leeftijd, sociale klas, etnische mix). Voor
beide ziekenhuizen waren sterftegegevens over drie jaar beschikbaar, die perfect
gecorrigeerd waren voor ernst en waarbij eenzelfde methode gebruikt werd voor het
definiëren en het vaststellen van gevallen. Ondanks haar omvang bleek de studie
onvoldoende gevoelig om sterfte door hartinfarct te gebruiken als een maat voor
kwaliteit.178 Daartegenover staat dat relatief korte audits over het zorgproces in staat zijn
relevante verschillen tussen ziekenhuizen vast te stellen.178
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
97
Wenst men met factoren zoals leeftijd, geslacht, co-morbiditeit en ziekte-ernst rekening te
houden dan doet men hiervoor in principe beroep op statistische technieken zoals onder
meer stratificatie, multipele lineaire of logistische regressiemethoden, en hiërarchische
modellen. Nochtans maakt geen enkele van de gangbare risicocorrigerende systemen
gebruik van deze technieken.77
Al is iedereen het er over eens dat een of andere vorm van risicocorrectie noodzakelijk is,
toch bestaat er onenigheid over welke risicofactoren en hoe ze te meten.163;188 Orchard
formuleert het als volgt: “Bruto ziekenhuiscijfers kunnen gevaarlijk misleidend zijn en
dienen voor case mix gecorrigeerd te worden, maar het identificeren van en wegen voor
prognostisch belangrijke patiëntenkarakteristieken is problematisch omwille van
conceptuele, methodologische en praktische redenen.”316 Hoewel onderzoekers
gedetailleerde risicocorrectoren hebben ontworpen, bleken deze methoden vaak te duur om
op brede schaal te worden toegepast voor ziekenhuisrapportering.188;190
Waarmee beginnen? Vaak wordt er een compromis gesloten tussen gedetailleerde
klinische risicobepaling, logistieke uitvoerbaarheid en redelijke kosten. Daarenboven is het
opzetten van een totaal nieuwe methode zeer duur. Dus is de keuze van een reeds
bestaande methode zeer aantrekkelijk.77;188
Heden ten dage bestaan er heel wat methoden, de “severity measures” genaamd, voor het
voorspellen van de ziekenhuismortaliteit als middel voor ziekenhuisvergelijking. De meest
belangrijke praktische aangelegenheid is dan het kiezen van een gegevensbron: klinische
gegevens of ontslagabstracties. In de eerste groep horen onder meer APACHE III (Acute
Physiology And Chronic Health Evaluation), CSI (Computerized Severity Index), MMPS
(Medicare Mortality Predictor System), in de tweede AIM (Acuity Index Method), APR-
DRGs (All Patient Refined Diagnosis Related Groups) en PMC (Patient Management
Categories).188
Om tot een grotere vergelijkbaarheid te komen werd er naar gestreefd naast klinische
gegevens ook laboratoriumgegevens te verzamelen en bevindt er zich bijvoorbeeld in
APACHE III een module “acid-base subscore”.332 Verder bleek dat het toevoegen van
laboratoriumgegevens de voorspelling van het middelengebruik verbeterde, de nood aan
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
98
diagnostische gegevens verminderde en, wanneer gekoppeld aan beperkte administratieve
gegevens, accurate predicties toelaten in termen van ziekenhuismortaliteit voor
aandoeningen zoals AMI, CVA,CHF of pneumonie.332;333 Ook het opnemen van
verpleegkundige gegevens draagt bij tot een betere uitkomstvoorspelling en is
complementair aan DRGs en APR-DRGs.334;335
Met het invoeren van het prospectieve financieringssysteem (PPS) in 1983, dat gebaseerd
is op DRGs, werd de bekommernis voor maten van ernst een uiterst belangrijke
aangelegenheid. Zoals voormeld maken de DRGs gebruik van geabstraheerde
ontslaggegevens. Dit zijn in feite demografische gegevens, betalerinformatie,
hoofddiagnose en nevendiagnosen en ingrepen, gecodeerd volgens de ICD-9-CM, en wijze
van ontslag. Nadelen van een op DRGs gebaseerde aanpak zijn enerzijds het gevaar voor
“creep” en anderzijds het ondercoderen van belangrijke risicofactoren zoals chronische
aandoeningen.1;83;140;336-338 Voordelen zijn de uniformiteit, de algemene verspreidheid en de
leesbaarheid voor de computer.
PPS deed de bekommernis toenemen over de kwaliteit van zorgen en meer bepaald
over het gevaar dat ziekenhuizen zouden beknibbelen op de uit de pan rijzende
kosten en (ziekere) patiënten sneller zouden ontslaan.188 De eerste gegevens over
ziekenhuismortaliteit in het Medicare systeem bleken problematisch en
verschillende methodologische gebreken, onder meer niet-adequate correctie voor
ernst, werden vastgesteld.
Op basis van klinische gegevensbanken werden op het einde van de tachtiger jaren
ernstmaten ontworpen, die zowel wetenschappelijk geldig als klinisch
geloofwaardig waren. Maar de kosten voor het verzamelen van deze klinische
gegevens bleken een hinderpaal. In een studie in Pennsylvania bijvoorbeeld
bedroegen ze 17.43$ /patiënt.188 Daarom gingen in de negentiger jaren
verschillende staten over tot het gebruik van APR-DRGs, maar terechte
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
99
bekommernis over de geloofwaardigheid en de accuratesse van ontslaggegevens
bleef bestaan.101;103;188;333
In een studie in Californië bleek dat de verschillen in sterftecijfers tussen ziekenhuizen
voor een belangrijk deel te verklaren waren door verschillen in codeerpraktijken: zo bleek
in de ziekenhuizen met een veronderstelde hoge mortaliteit er voor 10 % “upcoding” plaats
te vinden waar dit in ziekenhuizen met een veronderstelde lage mortaliteit 74% was.
Derhalve bevinden zich de huidige initiatiefnemers van een vergelijking van
risicogecorrigeerde mortaliteitscijfers in twee kampen: zij die bereid zijn en zij die het niet
zijn om te betalen voor de abstractie van de klinische gegevens uit de medische dossiers.188
Niet alleen bij het bestuderen van ziekenhuissterfte is het noodzakelijk te corrigeren voor
risico, dit geldt ook voor de financiering van het gezondheidszorgsysteem, de tweede
invalshoek.339 Waar het DRG-systeem aanvankelijk uitsluitend gericht was op “resource
intensity” werd de nood aan een uitgebreider systeem gaandeweg duidelijker.195 Dit
systeem diende volgende toe te laten: (1) de vergelijking van ziekenhuizen in een wijde
waaier van middelen en uitkomstmaten; (2) de evaluatie van verschillen in “inpatient ”
mortaliteitscijfers; (3) het uitvoeren en ondersteunen van klinische paden; 4) het
identificeren van “continue kwaliteitsverbeterende” projecten; (5) de basis te vormen voor
intern management en planning systemen; en (6) het management van “capitated payment
arrangements”.114 Dit leidde tot de ontwikkeling van de APR-DRGs195, het algoritme dat
ook in onze MKG wordt gebruikt.
Reeds in de negentiger jaren stelde men in de US en West-Europa een toename vast van
zorgmanagement, een antwoord op het groeiende bewustzijn van de onomkeerbare
schaarste van de middelen die ter beschikking van de gezondheidszorg gesteld worden en
werd het meer en meer duidelijk dat de gezondheidssector verantwoording diende af te
leggen voor de toegekende middelen.71;72;263;339;340 Terzelfder tijd streefde men naar een
financiering die een gelijke toegang tot de zorgen zou verzekeren aan de ganse bevolking.
Bij dit soort oefeningen dient men rekening te houden met de zorgbehoeften, die ongelijk
verdeeld zijn over de bevolking, of anders uitgedrukt, men dient een risicocorrectie toe te
passen.339
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
100
2.2.1.4.2 Onderlinge vergelijking van de maten van ernst. Om te kiezen uit de verschillende voorgestelde maten van ernst lijkt het aangewezen na te
gaan in welke mate de verschillende systemen tot hetzelfde beoordelingsresultaat komen.
Totnogtoe is er echter weinig “extern” onderzoek geweest van de diverse maatstaven.
Vergelijkingen zijn trouwens zeer moeilijk bij gebrek aan één gegevensbank, die over alle
gegevenselementen in de juiste vorm beschikt zoals dit voor de verschillende maten van
ernst vereist is.188
Iezzoni et al. waren tot in 1997 de enige groep, die een uitgebreid extern onderzoek
verrichtten over de predictieve waarde van commerciële “maten van ernst” voor
sterftecijfers.188;189 In termen van de c statistiek56;333;341 ook c index342 genaamd, die
aangeeft hoe goed de maat van ernst patiënten die bleven leven onderscheidde van
degenen die overleden, en van de R² 56;341 bleken de “klinisch gebaseerde maten van ernst”
het beter te doen dan de “op ontslagabstractie gebaseerde maten van ernst” voor
pneumonie en beroerte maar was het omgekeerde waar voor AMI en CABG.188;189 Hierbij
dient echter opgemerkt dat in de “ontslagabstractie gebaseerde maten van ernst” in
tegenstelling tot de “klinisch gebaseerde maten van ernst” ook laattijdige diagnosen,
bijvoorbeeld verwikkelingen na een ingreep, in de ernstbepaling meegenomen wordt. Dit
verhoogt weliswaar het discriminatievermogen maar ondergraaft terzelfder tijd de
validiteit van het kwaliteitsonderzoek.188;189;333
Een aantal studies gingen verder in op de waarde van APR-DRGs als instrument voor
risicocorrectie. Hieruit bleek dat, indien men alleen rekening hield met de ziekte-ernst
(Severity of Illness (SOI)) toegekend door het algoritme, de SOI beter de
ziekenhuisletaliteit van AMI en CABG voorspelde, dan systemen, die een uitgebreide
abstractie van klinische variabelen vergden. De Risk Of Mortality (ROM) module van
APR-DRG, bezat een minder goede voorspellende waarde dan de SOI, indien de
diagnosen beperkt bleven tot de aandoeningen, aanwezig bij de opname en men niet met
de nadien ontstane verwikkelingen rekening hield.196 Het gebruik van de verblijfsduur als
studieobject lijkt wat minder problematisch, indien het middelengebruik het voorwerp van
studie is. Mozes et al. menen overigens dat in geval van tijdens het verblijf optredende
verwikkelingen het vaker om niet-vermijdbare verwikkelingen gaat dan om iatrogene en
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
101
dat de laatste categorie dient opgespoord te worden via maatregelen op het gebied van
kwaliteitsverzekering.332
Een volgend aspect betreft het voorspellen van de ziekenhuismortaliteit niet in functie van
een pathologie maar van een patiënt. In dit soort oefeningen wordt nagegaan in welke mate
het stervensrisico voor een zelfde patiënt door de verschillende maten van ernst op
dezelfde manier wordt ingeschat. Dit verschil bleek substantieel te zijn niet alleen tussen
de “klinische maten van ernst” en de “op ontslagabstractie gebaseerde maten van ernst”
maar ook tussen de “op ontslagabstractie gebaseerde maten van ernst” onderling, bvb. in
60.7% van de CABG patiënten waren PMC en APR-DRG het oneens.188;189De vaststelling
van verschillen tussen maten van ernst op patiëntenniveau leidde tot een vergelijking van
globale mortaliteitscijfers op ziekenhuisniveau, en ook hier bleken er verschillen tussen
maten van ernst te bestaan. Het viel in deze studie overigens op dat de overeenkomst
tussen bruto-sterftecijfers en gecorrigeerde sterftecijfers volgens een bepaalde maat van
ernst soms beter was dan tussen gecorrigeerde sterftecijfers gemeten met een andere maat
van ernst.188
Implicaties
1) Globaal genomen suggereren deze analyses dat individuele ziekenhuizen zich zorgen
kunnen maken over op basis van welke sterftecijfers (al dan niet gecorrigeerde) en van
welke maat van ernst ze beoordeeld worden.188 Het punitieve gebruik van sterftecijfers,
gecorrigeerd voor ernst, is niet aangewezen vermits de beoordeling afhankelijk is van het
gebruikte type correctie.343 Ondanks hun statistische performance, pleiten de
codeervolledigheid en de financiële motivatie voor het coderen tegen de op
“ontslagabstractie gebaseerde maten van ernst”. Hierbij is het zo dat het coderen van de
ziekte-ernst niet beperkt blijft tot de vooraf bestaande aandoeningen, maar ontaardt in
“death code creep”, het overcoderen van catastrofale gebeurtenissen bij stervende
patiënten als ziekenhuisantwoord op ziekenhuisprofielen, gebaseerd op ontslaggegevens.188
2) Wat betekenen risicogecorrigeerde ziekenhuis sterftecijfers dan?
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
102
Ziekenhuizen verschillen in hun niet-gecorrigeerde sterftecijfers maar ook de maten van
ernst falen om deze verschillen volledig uit te leggen en een deel van de verschillen
kunnen toegeschreven worden aan de nauwkeurigheid van de gegevens. De centrale en
vooralsnog onopgeloste vraag van “Is de risicocorrectie zo goed dat de verschillen in
uitkomsten tussen ziekenhuizen alleen aan verschillen in kwaliteit toe te schrijven zijn?”
blijft open en uitsluitsel is onwaarschijnlijk op korte termijn. De vereiste research is duur,
tijdsverslindend, logistiek moeilijk en methodologisch complex. Slechts een handvol
dergelijke studies werden uitgevoerd en kwamen tot tweeslachtige bevindingen.188
Vergelijkingen van mortaliteitscijfers over ziekenhuizen, die alleen gebaseerd zijn op
administratieve gegevens, kunnen vertekend zijn en misleidend, zelfs indien de c-statistiek
excellente resultaten oplevert. Administratieve gegevens kunnen derhalve alleen gebruikt
worden als een initiële screening of als een aanzet tot verdere studies.333
3) Waarom dan corrigeren voor risico?
De voornaamste reden is dat hoe onvolmaakt ook er geen andere manier bestaat om een
productieve dialoog te beginnen met de artsen en andere zorgverleners over het
gebruikmaken van informatie van uitkomsten om kwaliteitsverbetering te motiveren.188
Een tweede dwingende reden voor het uitvoeren van risicocorrectie is te vermijden dat
zorgverleners die hoogrisico patiënten behandelen gestraft zouden worden.188;344
2.2.1.5 Evaluatiekader voor het ontwikkelen van kwaliteitsindicatoren (QI). Het ontwikkelen van kwaliteitsindicatoren is erg complex en vraagt de inzet van een aantal
onderzoekers met een waaier van deskundigheden72;181;262;345, wat duidelijk buiten het
bestek van dit proefschrift ligt en overigens voor België nog niet uitgevoerd werd. Een
alternatief is dan het gebruiken van in het buitenland ontwikkelde indicatoren,
waarbij er aandacht besteed wordt aan de gegevens die gebruikt werden voor het
ontwikkelen van de indicatoren, aan de manier waarop en de redenen waarvoor die
indicatoren geselecteerd worden, en aan de interpretatie van de bekomen resultaten.346 In
een Amerikaans project: “Refinement of the Healthcare Cost and Utilization Project
Quality Indicators”77 , ontwikkeld door het Stanford Evidence-based Practice Center ten
behoeve van de Agency for Healthcare Research and Quality, wordt volgend
evaluatiekader gebruikt voor de ontwikkeling van kwaliteitsindicatoren (QI):
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
103
1) “Face validity” of indruksvaliditeit: ook wel “logische validiteit” genoemd (bvb. het
op één voet kunnen staan als indicator voor evenwicht), gezonde klinische en/of
empirische basis voor het gebruik van een QI. Vat de indicator een kwaliteitsaspect dat
algemeen als belangrijk beschouwd wordt en dat voldoende beïnvloedbaar is voor de
dienstverstrekker of het systeem van volksgezondheid?
2) Precisie: grote variabiliteit van de QI over de zorgverleners of areas, en die niet te
wijten is aan toevalsvariabiliteit (niet waargenomen omgevings- of
patiëntenkarakteristieken);
3) Minimale vertekening: de QI is weinig of niet gevoelig voor systematische
verschillen in patiënten case mix of voor verschillen in opnamepolitiek. Mocht er
vertekening aanwezig zijn, dan is het mogelijk risicocorrectie of statistische methoden
(Bayesiaans) toe te passen om het grootste deel van of gans de vertekening weg te
nemen. Risicocorrectie wordt echter bemoeilijkt door codeerproblemen (codeerfouten,
upcoding en undercoding), beperkingen op het aantal toegelaten nevendiagnosen en
het ontbreken van een onderscheid tussen ziekenhuiscomplicaties en reeds bij de
opname bestaande ziektetoestanden.
4) “Construct validity” of begripsvaliditeit: sensitiviteit, specificiteit en voorspellende
waarde van een indicator zijn belangrijke eigenschappen voor het opsporen van een
echt kwaliteitsprobleem t.h.v. een ziekenhuis of eerste lijn. Daarom wordt de
begripsvaliditeit uitgetest waarbij men nagaat in welke mate de QI onderbouwd wordt
door resultaten die in dezelfde richting gaan als deze van andere indicatoren, die
dezelfde of gelijkaardige kwaliteitsaspecten meten, of door de bewezen performance in
het identificeren van zorgverleners met kwaliteitsproblemen.
5) De QI bevordert een reële kwaliteitsverbetering. Er wordt nagegaan of de indicator
ongevoelig is voor perverse stimulansen waarbij de zorgverleners “aangemoedigd”
worden hun gerapporteerde performance te verbeteren door het vermijden van
moeilijke of complexe gevallen, of tegen andere “antwoorden”, die niet met een
kwaliteitsbevordering gepaard gaan bvb. voortijdig ontslag om tot een lager cijfer van
ziekenhuismortaliteit te komen.
6) De QI werd reeds toegepast in het verleden en/of heeft een groot potentieel voor
complementariteit met andere indicatoren, die momenteel in gebruik zijn.
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
104
Ook in Nederland,waar men een kader geschetst heeft voor de ontwikkeling van prestatie-
indicatoren, formuleerde men een zeer vergelijkbare lijst van vereisten, waaraan prestatie-
indicatoren moeten voldoen: gebaseerd zijn op heldere en consistente definities; valide zijn
(werkelijk meten wat zij pretenderen te meten); niet vatbaar zijn voor manipulatie; beknopt
zijn en beperkt zijn in aantal; gebaseerd zijn op geloofwaardige, betrouwbare informatie;
acceptabel zijn voor de organisatie; betekenisvol zijn.72
2.2.1.6 Een alternatief voor kwaliteitsindicatoren: het peer review. Methoden voor het beoordelen van kwaliteit kunnen gaan van het gebruikmaken van totaal
expliciete tot totaal impliciete criteria/standaarden. Waar impliciete criteria kunnen
aangepast worden aan de precieze karakteristieken van ieder geval, wat individuele
beoordelingen mogelijk maakt die beantwoorden aan het multidimensionele concept van
kwaliteit, zijn ze echter zeer kostelijk en minder precies dan expliciete criteria.257
Voornamelijk de reproduceerbaarheid en accuratesse van impliciete criteria stellen
problemen.181;347 Expliciete criteria zijn duur om te ontwikkelen, maar laten, eenmaal zij
ontwikkeld zijn, meer precieze metingen tegen een lagere kost toe. Een sequentiële
combinatie van beiden kan aangewezen lijken: beginnen met een korte expliciete om
verdachte gevallen te identificeren en voortgaan met een impliciete benadering voor de
verdachte gevallen.257
Tussen beide in bevinden zich wat men gestructureerde, impliciete reviews noemt en die,
indien mogelijk, op een blinde manier uitgevoerd worden, zodat de onderzoeker niet weet
welke de uitkomst van het bestudeerde geval is. Het formulier geeft geen expliciete
instructies aan de arts hoe hij de kwaliteit moet rangschikken, wel is het eerder bedoeld om
de arts te helpen een aantal topics in de beoordeling te betrekken. Bij een gestuctureerd
impliciet review worden vragen gesteld zoals “tijdigheid van de diagnostische evaluatie
van zich presenterende problemen”.164;181;279
Er bestaan een aantal algemene bezwaren i.v.m. (gestructureerde, impliciete) reviews.
Voorzichtigheid is geboden bij de interpretatie van causale verklaringen op basis van
retrospectieve reviews. Medische fouten kunnen onderschat zijn (men kan weigerachtig
staan tegenover het inschatten van de zorg van een collega en veel fouten kunnen niet in
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
105
het dossier opgenomen zijn). Maar medische fouten kunnen ook overschat worden precies
omdat men weet dat het over sterfgevallen of ongunstige gebeurtenissen gaat. Verder zijn
artsen geneigd om de overlevingskansen van zieke patiënten te hoog in te schatten en om
gecorrigeerde fouten zonder onbedoelde uitkomsten of minimaal onbedoelde uitkomsten
niet als een fout te bestempelen. Beoordelaar overeenstemming is overigens steeds een
pijnpunt ook al gaat het over fundamentele dingen zoals het vaststellen of een ongunstige
gebeurtenis zich al dan niet heeft voorgedaan.258;279;348;349Bijvoorbeeld de overeenstemming
tussen verschillende beoordelaars was slechts matig in de Harvard Medical Practice
Study en in de Quality in Australian Health Care Study350;351met kappas van ongeveer 0,6.
Het zijn onder meer deze studies waarop het IOM zich baseert om van tienduizenden,
vermijdbare sterfgevallen te gewagen284;352.
Een studie, waarbij overeenstemming tussen verschillende beoordelaars centraal stond,
toonde aan dat de meningen van beoordelaars in verband met de voorkoombaarheid van
onbedoelde uitkomsten sterk verschilden; dat ze een schuine verdeling hadden; en, dat de
notie van vermijdbaarheid ook sterk verschilde in functie van de klinische toestand en dus
de te verwachten uitkomst. Bijvoorbeeld meningen van beoordelaars kunnen verschillen
wanneer men de vermijdbaarheid van eenzelfde sterfgeval achtereenvolgens gaat
beschouwen als een vermijdbaar sterfgeval; of, als een vermijdbaar sterfgeval gecorrigeerd
voor de probabiliteit van het ziekenhuis levend te verlaten; of, als een
vermijdbaar sterfgeval gecorrigeerd voor de probabiliteit van het ziekenhuis levend te
verlaten en in goede cognitieve gezondheid.279
Toch wordt het impliciet interview om een aantal redenen nog steeds gebruikt. Het is
gemakkelijk te ontwerpen en toe te passen, en heeft een goede indruksvaliditeit (“face
validity”). Het is verder vrij eenvoudig om het interview te actualiseren door beroep te
doen op up-to-date experts. Het weerspiegelt overigens de volledige waaier van klinische
beslissingen die op een bepaalde patiënt van toepassing zijn en heeft het vermogen om, in
tegenstelling tot kwaliteitsindicatoren, de interpersonele relaties bij de beoordeling te
betrekken.257;349 Tenslotte is men erin geslaagd de bruikbaarheid van het gestructureerd
impliciet interview te verbeteren door zich te beperken tot aandoeningen, waarbij men
beschikt over goede evidentie over wat kwaliteitszorg is.349
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
106
2.2.2 Kwaliteitsindicatoren op basis van administratieve gegevens.
2.2.2.1 Aan structuur gerelateerde maten: volume. Kwaliteitsbevorderende strategieën gebaseerd op volume werden aanbevolen 104;218;297;302-
308;310-312;314;353 niet alleen wegens de onomstotelijke evidentie over het verband tussen
volume en uitkomst maar ook omdat andere opties voor kwaliteitsverbetering als
onpraktisch of ineffectief beschouwd werden.104 Procesmaten werden niet goed verstaan,
regulerende benaderingen werden met weinig enthousiasme begroet, continue
kwaliteitsverbetering werd buiten het gebied van de hartchirurgie nauwelijks
toegepast104;320 en het publiekelijk vrijgeven van sterftecijfers bleek niet in staat het
consumentengedrag significant te doen veranderen.104;354
In tegenstelling hiermee bleken op volume gebaseerde verwijzingsstrategieën in het
algemeen te leiden tot betere uitkomsten.104 Verder kunnen op volume gebaseerde
drempels gebruikt worden om consumenten aan te sporen om naar bepaalde ziekenhuizen
te gaan, om vereisten van erkenning voor referentiecentra te rechtvaardigen, om het
opzetten van nieuwe diensten onder controle te houden en om als leidraad voor de
professionele vormingsvereisten te dienen.104;320
Laten we nagaan in welke mate volume als proxy bruikbaar is voor kwaliteitsvolle,
risicogecorrigeerde ziekenhuissterfte, de meest gebruikte uitkomstmaat.104 Modern
onderzoek naar het verband tussen volume en uitkomst begon met het baanbrekend werk
van Luft en collega’s.330. Voor een aantal ingrepen, waaronder CABG, werd vastgesteld
dat ziekenhuizen met meer dan 200 ingrepen per jaar een 25 tot 41 % lagere voor case mix
gecorrigeerd sterftecijfer hadden dan in ziekenhuizen met minder dan 200 dergelijke
ingrepen.Voor een tweede groep aandoeningen, waaronder colectomie, was er nog steeds
een dergelijk verband maar lagen de volumedrempels een behoorlijk stuk lager, namelijk
10 tot 50 ingrepen. Voor een laatste groep ingrepen, waaronder cholecystectomie bleek er
geen dergelijke verband te bestaan.
Deze auteurs identificeerden een aantal principes en vragen, die de basis vormden voor
verder onderzoek. Hierbij werd het duidelijk dat de toepasbaarheid van het volume-
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
107
uitkomst verband zich beperkte tot complexe ingrepen en het uitwerken van
ingreepspecifieke functionele verbanden en drempels. Verder diende de respectievelijke
rol van chirurgen- en ziekenhuisvolume nagegaan te worden. Het werd belangrijk geacht
de onzekere causaliteit van het volume-uitkomst verband verder uit te klaren. Ook aan het
onderzoeken van de potentiële risico’s en voordelen van regionalisatie diende aandacht
besteed te worden. Tenslotte bleef men de nood aan uitgebreide, risicogecorrigeerde
gegevens als een belangrijke, op te vullen leemte beschouwen.
Latere studies hebben dit volume-uitkomst verband bevestigd.104 In een recent artikel
bijvoorbeeld werd de invloed van ziekenhuisvolume op postoperatieve mortaliteit
bestudeerd voor 14 complexe ingrepen. Hierbij werden vergelijkingen gemaakt, gebaseerd
op zo homogeen mogelijke patiëntengroepen in termen van leeftijd, indicaties voor
ingrepen (bvb geen thoraco-abdominaal aneurysma bij ingrepen voor abdominaal
aneurysma), en zekerheid van diagnose. Mortaliteit verminderde bij toenemend volume
voor de 14 bestudeerde ingrepen, maar het relatief belang van het volume varieerde sterk
in functie van de ingreep: bvb voor pancreasectomie bedroeg het absoluut verschil 12,5 %
tussen laag (16.3%) en hoog volume (3,8%) ziekenhuizen.310 De auteurs menen dat de
vastgestelde resultaten het verschil in chirurgische kwaliteit weerspiegelen tussen “hoog
volume” en “laag volume” ziekenhuizen. Zij geven ook een aantal beperkingen aan zoals
het niet in de studie opnemen van mensen van minder dan 65 jaar, de niet perfecte meting
van volume, een gebrekkige benadering van de sociaal-economische status van de
patiënten, een aantal factoren, die eventueel de uitkomst beïnvloeden (grootte van het
ziekenhuis, teaching status, het volume per individuele chirurg en personeelspatronen van
de intensieve zorgen) en, vermits er gebruik gemaakt werd van administratieve gegevens,
een eventueel onvoldoende rekening houden met case mix verschillen.310
Kankerstudies hebben overigens de impact aangetoond van volume op andere uitkomsten
dan ingrepenmortaliteit. Dit weerspiegelt het belang niet alleen van chirurgische
vaardigheid maar ook van procesaangelegenheden zoals keuze van behandeling, adjuvante
therapie en follow-up op lange termijn.104;311
Verder is het verband tussen volume en uitkomst merkwaardig consistent over de tijd en
over de studies. Dit verband is ook klinisch plausibel: waarschijnlijk meer gespecialiseerde
chirurgen, meer consistente processen voor postoperatieve zorg, beter van personeel
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
108
voorziene eenheden voor intensieve zorg, en in het algemeen grotere middelen om met
postoperatieve verwikkelingen om te gaan.
Een recent review kwam tot gelijkaardige bevindingen over het verband tussen hoog
volume en betere uitkomst, de variabele graad van sterkte van het verband over de
ingrepen maar ook de vermindering van de sterkte van het verband bij gebruik van
klinische i.p.v. administratieve gegevensbanken.355 Andere auteurs zijn de mening
toegedaan dat de omgekeerde relatie tussen volume en uitkomst voor een ingreep niet
specifiek is voor die ingreep maar dat het veeleer gaat over het algemeen functioneren van
een ziekenhuis en met name de gemeenschappelijke structurele en proceskarakteristieken
en stellen dat het vermijden van een aantal ingrepen gerelateerde sterfgevallen niet het
meest overtuigende argument voor regionalisatie is.356;357Verder blijkt er een aanzienlijke
overlap te bestaan qua resultaten tussen hoogvolume en laagvolume zorgverleners.104
Het volume-uitkomst verband werd beschreven voor ziekenhuizen en voor artsen.
Sommige onderzoekers menen dat dit verband sterker is voor ziekenhuizen dan voor
artsen; het aandeel van de proportie zieken behandeld door laagvolume artsen is hierbij
echter belangrijk en in hoogvolume ziekenhuizen kunnen de prestaties van laagvolume
artsen verdoezeld zijn.104;307;308 Er blijven nog veel onbeantwoorde vragen over het belang
van de algemene operatieve ervaring van chirurgen, het uitvoeren van nauw aanverwante
ingrepen, het gelijktijdig uitoefenen in meerdere ziekenhuizen, aanvankelijke verwerving
van versus onderhouden van vaardigheden, over voorbijgaand of permanent laagvolume
chirurgen.104;218
Ondanks het overwicht aan studies die het volume-uitkomst verband schragen en het
toenemend gebruik358 van deze hypothese om belangrijke beslissingen op gebied van
gezondheidspolitiek te verrechtvaardigen, blijven er vele vragen onbeantwoord.320
Er zijn gevallen bekend van klein/matig volume en hoge kwaliteit en omgekeerd.
Hoewel enkele studies gebaseerd zijn op klinische gegevens, steunde het merendeel op
ontslaggegevens, wat hun waarde beperkt: over het algemeen is de risicocorrectie minder
goed dan bij klinische gegevens en bestaan er belangrijke rapporteringproblemen met
onder meer up- en undercoding van morbiditeiten.320 Overigens zijn vele van de studies
achterhaald t.o.v. de gemaakte vorderingen in medische en chirurgische zorg. Verder
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
109
stelde men vast dat naarmate de risicocorrectie verbeterde de odds ratio (laag versus hoog
volume) van sterfte daalde, hoewel het onwaarschijnlijk is dat dit de algemene natuur van
het waargenomen verband zou omkeren.104;320;359
Een andere methodologische bekommernis gaat over de cross-sectionele natuur van de
meeste studies. In een recente longitudinale studie, die gebruik maakt van hiërarchische
modellen, werd daarentegen geen verband vastgesteld tussen chirurgvolume en
ziekenhuissterfte bij CABG.104Daarenboven is de prestatie van enkele extreem laagvolume
zorgverleners grotendeels verantwoordelijk voor de significante resultaten van vele
studies. In de meeste studies heeft het eindpunt, gewoonlijk de mortaliteit, immers een lage
incidentie. Uit de aard van de studieopzet verschilt de steekproefgrootte substantieel tussen
de ziekenhuizen en is hij soms zeer klein, wat om speciale statistische methodes vraagt
(“shrinkage”, hiërarchische modellen). Daarom beschouwen onderzoekers kleine
steekproeven als een van de meest verontrustende methodologische zwakheden van de
volume-uitkomst research, net zoals het een limiterende factor is in het produceren van
geloofwaardige uitkomst rapporten.104
Het gebrek aan een formele statistische benadering voor het identificeren en schatten van
het volume veranderingspunt is een ander controversieel punt in het volume-uitkomst
debat. Vooraf moet bepaald worden of het selectief verwijzen naar de zorgverleners met de
beste prestaties de bedoeling is, wat een drempel probleem is, of dat het erover gaat te
voorspellen welk volumeniveau zal toelaten een vooraf bepaalde standaard te bereiken,
wat een omgekeerd voorspellingsprobleem is.
Ook andere aspecten van volume-uitkomst studies stellen problemen bij een klassieke
statistische analyse omwille van de sterke correlatie van zorgverleners karakteristieken die
de relatie volume-uitkomst beïnvloeden: bvb. hoog volume en universitair ziekenhuis. Het
is moeilijk hier het effect van het volume te isoleren, zelfs met gesofisticeerde statistische
technieken.104
De juiste aard van de relatie tussen volume en uitkomst is nog steeds niet uitgeklaard. De
literatuur suggereert twee basismodellen voor de verhouding tussen volume en
uitkomst77;104;304;306;307;309. Een eerste model is dat van “oefening baart kunst” (“practice
makes perfect”), waarbij de nadruk gelegd wordt op de noodzakelijkheid om een
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
110
technische vaardigheid te onderhouden (“maintenance”). Een tweede model is dat van de
“selectieve verwijzing”, waar kwaliteit niet het gevolg is van het grote volume, maar waar
het grote volume het gevolg is van de hoge kwaliteit. Het eerste model domineert in
spoedsituaties zoals een acuut myocardinfarct of een niet geplande CABG. Selectieve
verwijzing treedt op in situaties zoals geplande CABG en heupprothese. In geval van
selectieve verwijzing is een op volume gebaseerde indicator een “signaal” van een lage of
hoge kwaliteit van de verstrekker, die alleen de toestand kan verbeteren door de algemene
kwaliteit van de zorgen te verbeteren, dit aan de potentiële patiënten mee te delen en op
bijkomende patiënten te wachten. In geval van “oefening baart kunst” is de situatie vanuit
een standpunt van kwaliteit soms minder gunstig: een beleid dat erop gericht is
bijkomende patiënten naar dergelijke centra te verwijzen is immers niet altijd optimaal.
Het kan immers dat een surplus aan zieken teveel de mogelijkheden van een zorgverlener
onder druk zet en de zorguitkomsten verslechtert.77;360
Wij menen op basis van voorgaande een aantal besluiten te kunnen formuleren.
Volumegebaseerde verwijzingsstrategieën zijn aangewezen voor complexe ingrepen met
grote uitkomstverschillen i.f.v. het volume zoals oesofagectomie en pancreatectomie en
voor bepaalde hoogrisico subgroepen. Voor andere complexe ingrepen met een kleiner
uitkomstverschil kunnen volumestandaarden gebruikt worden als een rode vlag om de
aandacht te vestigen op de kleinste volume ziekenhuizen, niet omdat zij eenvormig minder
kwaliteit zouden bieden, maar omdat hun kleine aantallen het moeilijk maken om
nauwkeurig hun prestaties te beoordelen. Indien mogelijk dienen risicogecorrigeerde
uitkomstgegevens deze volumestandaarden aan te vullen of te vervangen.104
2.2.2.2 Aan proces gerelateerde maten: gebruik van ingrepen in ziekenhuizen. Tegenover het begrip van volume staat dat van “gebruik” (“utilization”). Dit berust erop
dat er een grote variatie bestaat over ziekenhuizen of gebieden en dat er zowel over- als
ondergebruik bestaat. Daarbij kan het dat een hoog volume vereist is voor het bewaren van
de nodige technische vaardigheid voor het uitvoeren van ingreep, die alles samen genomen
schadelijk is voor de patiënten en zich gemakkelijk leent tot overgebruik. Small-area
onderzoek laat toe het onderscheid te kunnen maken tussen de uitkomst effecten van hoog
volume en overgebruik. Het suggereert soms dat de gezondheidsgevolgen van variaties in
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
111
de geneigdheid van zorgverleners om patiënten aan een bepaalde therapie te onderwerpen
(het gebruikseffect) de effecten verkleint van de variaties in technische vaardigheid, die
vereist is voor het uitvoeren van deze therapieën (het volume effect). Dit suggereert dat het
gebruik van en niet het volume een meer belangrijke determinant is van kwaliteit.77
Carotisendarterectomie (CEA) is hiervan een illustratie. De publicatie van gunstige
klinische studies leidde tot een dramatische verhoging van het aantal uitvoeringen van
CEA. Hierbij ontstond er bezorgdheid over de ontstane discrepantie tussen de potentiële
doeltreffendheid in de klinische studies en de veel lagere doeltreffendheid in de dagelijkse
praktijk, vooral in geval van asymptomatische carotisstenose.77;170;171;308;361-363 Een deel van
de uitleg is waarschijnlijk toe te schrijven aan een “verruiming” van de indicatie van de
ingreep tot patiënten, die uit de klinische studie waren uitgesloten.77;171;308 Concluderend
gesteld, hoog volume kan een indicator zijn voor goede kwaliteit in een specifieke
populatie, en hoge gebruikscijfers voor een bredere bevolking kan in feite een indicator
zijn van ondermaatse kwaliteit.77
Gebruiksmaten van ingrepen worden gebruikt voor het vaststellen van zowel overgebruik
als ondergebruik. Overgebruik kan leiden tot 1) nadelige uitkomsten (ziekte, handicap,
dood) door patiënten bloot te stellen aan het risico van nevenwerkingen of van
verwikkelingen en 2) onnodige kosten voor gezondheidszorg. Ondergebruik kan leiden tot
vermijdbare nadelige uitkomsten.77
Variatie in ingrepencijfers over geografische gebieden en over zorgverleners kunnen heel
wat redenen hebben. Geografische variatie kan te wijten zijn aan verschillen in case mix,
toegang tot zorgen of verschillen in praktijkvoering, die een weerspiegeling zijn van een
combinatie van onzekerheid over de effecten van ingrepen in bepaalde patiënten en van de
vertrouwdheid van de zorgverlener met bepaalde behandelingsmethoden.255;364 Daarom
kan men stellen dat geografische variatie een indicatie is van eventueel overgebruik of
ondergebruik van een ingreep, maar ook kan veroorzaakt zijn door andere belangrijke
verklaringen die verder onderzocht moeten worden.77;255;365 Om verschillen in
praktijkvoering te kunnen isoleren van geografische verschillen in gediagnosticeerde
ziekte, dient men zowel over ziekenhuisontslaggegevens als over gegevens uit de
eerstelijns geneeskunde te beschikken.365
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
112
De ingrepen, die het meest bestudeerd werden, zijn veel gebruikte ingrepen (bvb. het
keizersnedencijfer waar we in hoofdstuk 5 uitvoerig op terugkomen), die op gebiedsniveau
waarschijnlijk geen noemenswaardige variatie kennen ten gevolge van kleine aantallen.
Elk van die potentieel te veel gebruikte ingrepen heeft een geëigend gebruik bij sommige
patiënten. Vandaar de nood aan risicocorrectie bij een vergelijking van gebruikscijfers.
Verder is het zo dat patiëntenvoorkeur in ruime mate de gebruikscijfers beïnvloeden.
Daarom kan men stellen dat het ideale cijfer voor vele ingrepen niet gekend is en wordt er
in de US nog steeds gedebatteerd over het “correcte” streefcijfer voor keizersnede en
vaginale verlossing na keizersnede, twee gebruiksmaten, die opgenomen waren in de
doelstellingen van “Healthy people 2010”.77
Tenslotte dient erop gewezen te worden dat de klinische gegevens, nodig voor
risicocorrectie, vaak niet in de ontslaggegevens, zoals onze MKG, opgenomen zijn. Het is
derhalve aangewezen voorzichtig om te springen met kwaliteitsindicatoren, gebaseerd op
gebruikscijfers berekend op basis van ontslaggegevens. Dit kan immers leiden tot
ongewenste effecten zoals het toepassen van ingrepen, die ondergebruikt worden, bij
mensen, die geen geëigende kandidaten zijn, of het niet toepassen van een ingreep op
mensen, die hem nodig hebben, omwille van een bestaand overdadig gebruik.77
2.2.2.3 Uitkomstmaten. Sterfte, morbiditeit, functionele status, levenskwaliteit, zorgenkosten, verblijfsduur, terug
gaan werken en patiëntensatisfactie zijn de belangrijke uitkomsten.163 In grote
gegevensbestanden is sterfte echter de meest geanalyseerde uitkomstmaat en als dusdanig
is sterfte ook het onderwerp geweest van de meeste debatten.77;163
Er werden overigens sterke variaties in sterftecijfers genoteerd, vooral voor niet-
chirurgische aandoeningen.77;343 Ook suggereren een aantal recente overzichtsartikelen dat
duizenden te voorkomen chirurgische sterfgevallen zich elk jaar in de US voordoen omdat
electieve maar hoogrisico chirurgie uitgevoerd wordt in ziekenhuizen, waar er
onvoldoende ervaring is met die chirurgische ingrepen.255;310;312 Er wordt patiënten
aangeraden voor een aantal ingrepen naar hoog volume ziekenhuizen te gaan en een aantal
consumentgerichte websites beginnen informatie te verstrekken over bereikte volumes in
ziekenhuizen in hun buurt.310
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
113
Toch stellen velen de toepasbaarheid heden ten dage van oudere studies in vraag, vermits
deze mortaliteit sindsdien aanzienlijk gedaald is en het relatief belang van het volume
misschien aan het dalen is.310 Vervolgens hebben de meeste van die studies gebruik
gemaakt van gegevensbanken op staatsniveau of van regionale bevolkingen, die bediend
werden door een klein aantal centra met hoge volumes. Verder zijn die studies meestal
beperkt gebleven tot hartchirurgie of uitgevoerd op te kleine steekproeven.310
“Het zou handig zijn mochten ziekenhuizen met hogere sterftecijfers, geïdentificeerd op
basis van gemakkelijk verzamelde administratieve gegevens (leeftijd, geslacht, vorige
ziekenhuisopname, diagnose), inderdaad ook blijken zorgen te verstrekken van lagere
kwaliteit”.319 Maar is een hoog sterftecijfer inderdaad een marker van slechte kwaliteit?
Waar we weten dat sterftecijfers verschillen in functie van specifieke
ziekenhuiskarakteristieken en van ervaring ( i.e. volume), weten we weinig over hoeveel
van de variabiliteit te wijten is aan verschillen in ziekte-ernst en co-morbiditeit, hoeveel
aan verschillen in kwaliteit en hoeveel aan toeval of selectie-effecten, zoals onder meer
verschillen in opnamepraktijken.54;319 Een ander probleem wordt gevormd door de
gelukkig kleine aantallen, die vaak leiden tot niet significante resultaten, en, zelfs als dan
significantie kan worden aangetoond, door de moeilijkheid om het falende proces aan te
tonen.77
In een studie waarin het verband bestudeerd werd tussen kwaliteit van zorgen, sterftecijfers
en ziekte-ernst voor congestief hartfalen (CHF) en acuut myocardinfarct (AMI) bleken de
verschillen in sterftecijfers tussen ziekenhuizen niet verklaard te kunnen worden door
verschillen in de kwaliteit van zorgen. Een deel van de niet-uitgelegde variabiliteit kan
voortvloeien uit de manier waarop de kwaliteit gemeten wordt, die voornamelijk de
processen van de eerste drie dagen onderzoekt. Op het niveau van de individuele patiënt
bleek hogere ziekte-ernst op een merkbare manier het stervensrisico te verhogen en bleek
betere kwaliteit, zij het in minder uitgesproken mate dan de ernst, een vermindering van
het stervensrisico te veroorzaken. Het is echter onwaarschijnlijk dat ziekenhuizen, die
zorgen van lagere kwaliteit verstrekken, kunnen geïdentificeerd worden door middel van
administratieve gegevens en 1-jaars sterftecijfers.319
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
114
Al lijden beoordelingen van vermijdbare sterfte door experts onder een gebrekkige
overeenkomst tussen beoordelaars, toch schijnt er enige correlatie te bestaan tussen
risicogecorrigeerde sterftecijfers en kwaliteitsproblemen, geïdentificeerd door peer review
organisaties.77 Significant hogere sterftecijfers kunnen gedeeltelijk toegeschreven worden
aan moeilijk te meten verschillen in ziekte-ernst, al werd er in een aantal studies
vastgesteld dat potentieel te voorkomen onbedoelde uitkomsten tenminste zwak
geassocieerd zijn met de gemeten sterftecijfers.77
Ziekenhuismortaliteit wordt verder beïnvloed door de verblijfsduur en men weet overigens
dat factoren die korte termijnsterfte beïnvloeden, verschillen van lange termijnsterfte.191
Oplossingen zoals de “dertig dagen ziekenhuissterfte” zijn niet vrij van vertekening366: de
verandering van de uitkomstdefinitie: “eender welke ziekenhuissterfte” tot de “dertig
dagen ziekenhuissterfte” veranderde in een studie over hartchirurgen hun
rangorde op ingrijpende manier: op 78 chirurgen veranderde de rangorde bij 30 van hen
met meer dan tien plaatsen191 al moet men voorzichtig omspringen met rangorden, zeker
wanneer het gaat over sterfte76. Nochtans bleek uit een meer recente studie over
hartinsufficiëntie dat ziekenhuizen met lagere ziekenhuissterfte SMRs geen hogere na-
ontslag sterftecijfers hadden en besluiten de auteurs dat ziekenhuissterfte een redelijk
valide marker mag genoemd worden voor 30-dagen mortaliteit367. Birkmeyer et al.310
kwamen in hun studie over een aantal belangrijke ingrepen tot een gelijkaardige conclusie
evenals studies in het UK183;184. In een enkele recente studie over femurhals fracturen bleek
de dertig dagen mortaliteit tot vertekende conclusies te leiden.253
Wanneer andere ongunstige uitkomsten dan sterfte het onderwerp van studie uitmaken
zoals bijvoorbeeld postoperatieve verwikkelingen, wordt een analyse op basis van
ontslaggegevens bemoeilijkt door de beperkingen van de ICD-9-CM, die alleen het zich al
dan niet voordoen van verwikkelingen aangeeft en niet de ernst van de verwikkeling. Een
voorbeeld van verwikkelingen bij laparoscopische cholecystectomie wordt door Taylor
gegeven.368
Tenslotte kan men stellen dat het gebruiken van uitkomstgegevens voor vergelijkingen het
nuttigst is wanneer men wenst de zorg op te volgen bij hoogvolume verstrekkers en dit
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
115
over lange tijdsperiodes. Andere waardevolle toepassingen zijn het opsporen van gebieden
voor kwaliteitsverbetering of van problemen bij het implementeren van zorgprocessen.
Een laatste nuttig gebruik van uitkomstgegevens is het bestuderen van het ganse
zorgsysteem.299
Wanneer een studie afgesloten is stelt zich onvermijdelijk het probleem van het kenbaar
maken van de resultaten. Het publiekelijk vrijgeven van de resultaten van uitkomst- en
procesvergelijkingen tussen ziekenhuizen of individuele zorgverleners neemt meer en
meer toe. Hierbij moet een evenwicht gezocht worden tussen de mogelijke schade die men
kan aanrichten door onjuiste informatie te verstrekken, omwille van methodolgische
tekortkomingen, en het recht van de consument om een voor hem zo goed mogelijke
keuze te maken voor de zorgverlening die hij nodig heeft. Wij komen hier later uitgebreid
op terug.
2.3 BENADERING GEBASEERD OP INCIDENTEN.
2.3.1 Patiëntveiligheid Patiëntveiligheid beantwoordt ongetwijfeld aan de definitie van een prioritair
gezondheidsprobleem in termen van ernst, frequentie, sociale en economische kosten, en
perceptie door het beleid en de gemeenschap. Dit vertaalde zich onder meer in rapporten
en het opzetten van agentschappen om dit probleem aan te pakken.291
Verschillende initiatieven werden genomen zoals veiligheidsorganisaties, rapportage
systemen voor onbedoelde uitkomsten (“adverse events”) en oproepen tot het hertekenen
van het gezondheidszorgsysteem.291 Vraag is dan welke zijn de sleutelelementen van deze
inspanningen, waar zijn ze werkelijk op gericht, en zijn ze voldoende rijp voor een
toepassing in andere landen?
Arah en Klazinga291 geven enkele behartigenswaardige beschouwingen. Zij stellen onder
meer dat er te veel organisaties actief zijn die zich met deze problematiek bezig houden.
Verder observeren ze dat er te veel onenigheid bestaat rond basisbegrippen, dat de
gevolgde benadering te beperkt is, met name praktisch exclusief op de patiënt gericht, en
te weinig oog heeft voor het gezondheidssysteem en zijn bredere omgeving. Ook stellen ze
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
116
vast dat de medische praktijkomgeving “prohibitief procesziek” blijft. Verder menen ze
dat de verwachtingen van zero tolerantie te hoog gespannen zijn en dat “safety”
indicatoren gebaseerd op administratieve gegevens nog problematischer zijn dan andere
kwaliteitsindicatoren voor eindgebruikers.
Ook Chang et al. betreuren het fragmentarisch karakter van de verschillende benaderingen,
die in de zorgsector gebruikt worden om “near misses”, onbedoelde uitkomsten (“adverse
events”) en andere concepten i.v.m. patiëntveiligheid te definiëren.369Deze auteurs
ontwierpen een overkoepelend concept over patiëntveiligheid, dat berust op een
systeembenadering, en benadrukken het belang van a priori
beslissingen over de sleutelveranderingen in structuur en proces die in verband gebracht
worden met elk voorval i.v.m. patiëntveiligheid.369 De moeilijkheid om tot dit concept te
komen bestond uit het ontrafelen van het ingewikkelde netwerk van informatie
gekarakteriseerd door gebeurtenissen, setting, individuen, teams, protocollen, procedures,
beleid, en communicatie in een onzekere omgeving.369
Het vertrekpunt voor een benadering van patiëntveiligheid is vaak de onbedoelde uitkomst,
die als volgt kan omschreven worden: “Onbedoelde of ongewenste voorvallen in het
gezondheidszorgproces, die een negatieve impact hebben of kunnen hebben op een patiënt
of patiënten, en resulteren of kunnen resulteren uit een onderdeel van een
gezondheidszorgproces”.370 Een andere omschrijving luidt als volgt: “... schade, die
veroorzaakt werd door het medisch beleid eerder dan door de onderliggende ziekte en die
tot de dood leidde, een levensbedreigende ziekte veroorzaakte, een ziekenhuisverblijf
verlengde of veroorzaakte, een lichamelijke ongeschiktheid veroorzaakte op het ogenblik
van het ontslag, of beide.”293;350;371
Bij een onbedoelde uitkomst treft men volgende drie karakteristieken370 in mindere of
meerder mate aan:
- negativiteit: het gaat over een nadelig voorval dat uit de aard van zijn natuur
onwenselijk of schadelijk is voor het gezondheidszorgproces of voor de patiënt,
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
117
- (potentieel) impact op de patiënt. Bredere definities beschouwen een potentiële impact
als een ongunstige gebeurtenis waar meer strikte definities een definieerbaar en
identificeerbaar schadelijk gevolg voor de patiënt vereisen,
- oorzakelijk verband: er moet een aanduiding bestaan dat het voorval het resultaat is
van een onderdeel van het zorgproces zelf (ofwel door het begaan van een fout ofwel
door verzuim) eerder dan door een voorval van buiten het proces zoals handelingen
van de patiënt of het natuurlijk verloop van de ziekte.
De voormelde omschrijvingen van onbedoelde uitkomst hebben slechts een beperkte
bruikbaarheid omdat zij de omstandigheden of voorvallen, die een onbedoelde uitkomst
uitmaken, in onvoldoend concrete termen definiëren om zulke voorvallen op
betrouwbare wijze te identificen.370 Daarom maken metingen van onbedoelde uitkomsten
meestal gebruik van een reeks uitdrukkingen of criteria zoals niet-geplande terugkeer naar
de operatiezaal, transfer naar een andere instelling voor acute zorgen, lage Apgar score.370
Verdere analyses (1) beschrijven de weerslag op de patiënt in termen van ernst en
persistentie; (2) gaan de oorzakelijke genese na van het voorval om het te kunnen
toeschrijven aan bepaalde onderdelen van de gezondheidszorgorganisatie; en, (3)
beoordelen de vermijdbaarheid om een expliciet professionele beoordeling van de
zorgkwaliteit te maken.370
Nalatigheid (“negligence”) werd gedefinieerd als: “.. zorg die onder de standaard viel, die
van artsen in hun gemeenschap verwacht werd.”350 De oorzaken van onbedoelde
gebeurtenissen (incident of “event”) en uitkomsten werden omschreven als het niet
uitvoeren van een geplande actie (fout in de uitvoering); het toepassen van een verkeerd
plan om het doel te bereiken (fout in de planning); onzorgvuldigheid, slordigheid (door
vaardigheden bepaalde fout); manier waarop processen zijn ingericht in de organisatie
(organisatiegebonden factoren); fouten ontstaan door een technisch falen en
patiëntgerelateerde factoren zoals co-morbiditeit en gebrek aan therapietrouw.293
De scheidingslijn tussen fout en nalatigheid is niet altijd even gemakkelijk: bijvoorbeeld
een verkeerde radiografie-interpretatie van een hartfalen als een pneumonie, een
pleurapunctie bij het plaatsen van een centraal veneuze katheter of een perforatie van de
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
118
darm bij een ingreep voor een adhaesieve darmobstructie. Ook zijn de beoordelingscriteria
vaak niet gedefinieerd wat kan leiden tot uiteenlopende beoordelingen. Daarom dienen
praktijkstandaarden altijd een zekere mate van fouten te aanvaarden.372 Een moeilijkheid
bij de op fouten gebaseerde benadering zijn haar methodologische beperkingen: de studies
hebben het over “verbanden” maar meten de sterkte van de relatie tussen fout en slechte
uitkomst niet. Verder stelt zich het probleem van de typische post hoc situatie: men
vertrekt van een slechte uitkomst en gaat dan zoeken wat er fout gelopen is met vaak een
door die wetenschap bijgekleurde conclusie348;352 Ook zijn de concepten “fouten” en
“onbedoelde uitkomsten” begrippen die mekaar gedeeltelijk en in onbekende mate
overlappen348 zoals blijkt uit figuur 1.
Dikwijls wordt overigens de aandacht gevestigd op uitzonderlijke en zeer ernstige fouten
en gaan meer frequente en niet onbelangrijke fouten vaak onopgemerkt voorbij zoals het
niet toe dienen van ß-blockers na een AMI.348 In de figuur 2 worden fouten voorgesteld in
functie van hun enormiteit en van hun causaliteit. Hofer et al. stellen dat medische fouten
gedefinieerd moeten worden in termen van gefaalde processen, waarvan op een rigoureuze
manier werd aangetoond dat zij nadelige gevolgen veroorzaakten.348
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
119
Figuur 1: Conceptuele definities van te voorkomen, nalatige, onbedoelde en ongewenste
uitkomsten en fouten.348
Bron: Hofer348
Figuur 2: Classificatie van fouten in functie van hun enormiteit (“egregiousness”) en van hun bijdrage tot de uitkomst (“contribution to outcome”).
Bron: Hofer.348
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
120
Een dergelijke classificatie van onbedoelde uitkomsten wordt meestal uitgevoerd via een
professioneel peer review.370 De wetenschappelijke rigor waarmee reviews doorgevoerd
worden is erg wisselend en gaat van één beroepsbeoefenaar, die een op impliciete criteria
gebaseerde beoordeling uitvoert, tot een multidisciplinair team dat expliciete en
gedefinieerde criteria gebruikt.370Ook de ervaringen over intra-rater en inter-rater
betrouwbaarheid lopen uiteen en leren dat het bereiken van een betrouwbaar oordeel meer
meervoudige beoordelingen vergt dan praktisch doenbaar.370
2.3.2 Gegevensbronnen over onbedoelde uitkomsten Een eerste bron is het screenen van het klinisch dossier van patiënten, gedurende of na het
zorgproces, door personeel dat beslist of er al dan niet een ongunstige gebeurtenis geweest
was en hoe dit dient geklasseerd te worden. Hieraan zijn twee belangrijke nadelen
gekoppeld. De klinische informatie kan ontoereikend zijn om tot een besluit te komen en
het is mogelijk dat onbedoelde uitkomsten niet geregistreerd worden. Medische dossiers
zijn daarenboven een samenvatting van de verstrekte zorgen en behandelingen eerder dan
een weergave van elke handeling en incident.370
Een andere bron van informatie over onbedoelde uitkomsten is de zelfrapportering van
incidenten door klinische beroepsbeoefenaars. Omwille van het weinig voor de hand
liggende karakter van deze handelswijze en omwille van de verschillen in definities van
onbedoelde uitkomsten, die de verschillende beroepsbeoefenaars kunnen hanteren, kan de
betrouwbaarheid van dit soort gegeven nog meer in vraag gesteld worden.370
Een laatste bron van gegevens zijn ziekenhuisontslaggegevens. De meeste onbedoelde
uitkomsten kunnen op deze manier echter niet geïdentificeerd worden tenzij het volledig
medisch dossier geïnformatiseerd en beschikbaar is.370
Wanneer onbedoelde uitkomsten gebruikt worden in kwaliteitsmeting worden twee wegen
bewandeld. Sommigen identificeren eenvoudig de onbedoelde uitkomsten en onderzoeken
ze, in navolging van het “kritische incident”-techniek, op een kwalitatieve manier.370
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
121
Velen maken gebruik van een kwantitatieve analyse waarbij de onbedoelde uitkomsten
geteld worden, geaggregeerd, en omgezet tot cijfers (“rates”), gecorrigeerd voor een aantal
factoren.370
De “face” en “content” validiteit van “onbedoelde uitkomsten”-maten kunnen als goed
beschouwd worden.370 De criterion validiteit is niet afdoend onderzocht. De enkele studies
hieromtrent gebeurden op basis van een impliciete beoordeling door een
beroepsbeoefenaar, waarvan de beperkte validiteit (hoog fout positief cijfer) en
betrouwbaarheid bekend zijn.370 Voor de “construct” validiteit liggen, omwille van de
schaarsheid van onderliggende theorie en constructs, de zaken nog moeilijker. Nochtans
kon onder meer worden aangetoond dat onbedoelde uitkomsten verband houden met een
toename van de verblijfsduur en verhoogd middelengebruik, dat de cijfers verschillen over
specialiteiten, type van ziekenhuizen, en type patiënten (urgente gevallen, ernstiger zieken
hebben meer onbedoelde uitkomsten).370
2.3.3 Omvang van en acties rond onbedoelde uitkomsten Hoewel de overgrote meerderheid van de medische fouten zonder nadelen gepaard gaat of
slechts met minimale, tijdelijke effecten, toch is de schade door medische fouten
belangrijk en schat het IOM dat er in de US jaarlijks tussen de 44.000 en 98.000 mensen
sterven tengevolge van een fout in het medische management.284;350;372;373
Over de precieze omvang van deze cijfers werd uitvoerig gedebatteerd en een groot deel
van de discussie kan teruggevoerd worden op beperkingen van de Harvard Medical
Practice Study(MPS)350;372: het gaat over een retrospectieve studie gebaseerd op het
medisch dossier waarin 1) veel belangrijke voorvallen niet opgetekend werden, 2) fouten
geïdentificeerd werden door een impliciet oordeel door een arts, en 3) waar, omwille van
zijn retrospectief karakter, een “hindsight”-vertekening, de neiging om een causaliteit toe
te kennen aan een handeling wanneer de (slechte) uitkomst gekend is.
Ad 1) kan men zich aan een belangrijke onderschatting verwachten, ad 2) vallen zowel
onderschatting als overschatting te verwachten, die mekaar waarschijnlijk opheffen, en ad
3) is een overschatting de te verwachten vertekening 352.
Er bestaan redenen om aan te nemen dat het IOM niet overdreef. Het lijkt onwaarschijnlijk
dat beoordelaars onbedoelde uitkomsten zouden vinden die niet bestonden en dat het hier
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
122
eerder om een benedengrens zou gaan dan om een overschatting. Ook werd alleen
ziekenhuismortaliteit in rekening genomen en niet de ambulante chirurgie. Tenslotte liggen
in prospectieve studies de fouten- en schadecijfers meestal veel hoger.352
Tegenstanders stellen dat het IOM noch de auteurs van de MPS uitleggen hoe zij precies
aan die cijfers komen374; dat veel van die vermijdbare sterfgevallen zich voordoen bij
mensen die anders sowieso op korte termijn gestorven zouden zijn – wat de auteurs van de
MPS ook vermeldden350 –, en, dat een cijfer zoals 100.000 ziekenhuissterfgevallen toe te
schrijven is aan outlieropinie en de geringe betrouwbaarheid van een impliciet review door
een arts.279;375-378
Laten we hierbij opmerken dat de auteurs van de MPS zelf ook aangeven dat het aantal
opgegeven sterfgevallen in economisch opzicht niet vergelijkbaar is met hetzelfde aantal
sterfgevallen bij verkeersongevallen waar de slachtoffers over het algemeen jonger en
gezonder zijn.350 Uit een andere studie bleek dat een beoordelaarovereenkomst met een
intraclass correlation coefficient (ICC) van 0,34 – in de MPS studie bedroeg de ICC
slechts 0,24 - een beperkende factor is. Dergelijk ICC geeft aan dat wanneer de eerste
beoordelaar een overlijden bestempelt als “zeker, of waarschijnlijk het gevolg van een
medische fout”, de tweede beoordelaar dit overlijden zou bestempelen als “zeker niet” met
een waarschijnlijkheid van 16% voor de eerste versus 18% voor de tweede beoordelaar.
Zoals voormeld bleken er zich duidelijk minder “waarschijnlijk of zeker” te
voorkomen sterfgevallen voor te doen indien er rekening werd gehouden met de
probabiliteit het ziekenhuis levend te verlaten, met de betrouwbaarheid van de
beoordelaars en met de probabiliteit van drie maanden later in leven te zijn en in goede
cognitieve toestand.279 Hoewel ook de opzet van deze studie zijn beperkingen heeft en dat
ook terminale patiënten recht hebben op een zo kwaliteitsvol mogelijke zorg350;379;380, toch
menen wij dat zij terecht de aandacht vestigt op het heikele probleem van het
overeenstemming tussen verschillende beoordelaars381 en op een goede omschrijving van
wat men onder “vermijdbaar” en “dood ten gevolge van een medische fout”378;382 verstaat.
Verder is het duidelijk dat een juiste risicocorrectie vereist is om tot betrouwbare
schattingen van het aantal sterfgevallen ten gevolge van medische fouten te komen.283;383
Tenslotte kan men aanvoeren dat mocht het gaan over 10.000 sterfgevallen per jaar in
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
123
plaats van 100.000, het nog steeds een belangrijk probleem blijft voor de
volksgezondheid.384 Dit argument samen met de uitspraak van het IOM, dat een vork
aangeeft van 44.000 tot 98.000 vermijdbare sterfgevallen, maken duidelijk dat de omvang
van dit belangrijk probleem vooralsnog slechts zeer ruw kan geschat worden.
Reeds uitgevoerde studies leggen de nadruk op een aantal behartigenswaardige feiten.
Hoewel medische tijdschriften uitvoerig rapporteren en debatteren over onbedoelde
uitkomsten en medische fouten284;376-385 schijnt er een kloof te bestaan tussen het kennis
hebben van dergelijke feiten en de opleiding van artsen - seminaries van artsen in
opleiding zijn hier nochtans een uitgelezen plek voor – waar aan dit soort problemen te
weinig aandacht wordt besteed.385
Het type eigenaarschap van ziekenhuizen bleek in een studie uit de US geen verband te
houden met ongelukkige voorvallen, maar wel met nalatigheid, die veel kleiner was in
private en universitaire ziekenhuizen en groter in ziekenhuizen met een groot percentage
minderheidspatiënten.386
Ook de invloed van leeftijd op onbedoelde uitkomsten werd meermaals bestudeerd. Bij
oudere patiënten ( 65 jaar+) worden meer onbedoelde uitkomsten genoteerd.350;372;373;387 Dit
zou te wijten zijn aan de grotere complexiteit van de ziektegevallen of behandelingen en
aan de langere risicoblootstelling en niet aan een leeftijdsdiscriminatie.372;373;387
Tenslotte zijn fouten door verzuim meer frequent dan bedreven fouten.351
Agressieve casusopsporing via observationele en autopsie studies identificeerden schade
en fouten, die zich niet in het medisch dossier bevinden.387
Een prospectieve gegevensverzameling lijkt derhalve te verkiezen boven een cross-
sectionele (met duidelijk minder gevallenopsporing) of een retrospectieve (met een
gelijkaardige gevallenopsporing) omdat ze beter past in het raam van
kwaliteitsverbetering. Ze is meer geschikt (1) om artsen ervan te overtuigen dat hun fouten
bijdragen tot het ontstaan van onbedoelde uitkomsten; (2) voor het bestuderen van
organisatorische en menselijke factoren; en, (3) voor het meten van programma’s die een
risicoreductie nastreven.371
Een laatste invalshoek betreffende acties i.v.m. “medische fouten” bestaat uit het trekken
van lessen uit de pogingen om kwaliteit te verbeteren in organisaties buiten de
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
124
gezondheidszorg. Ambiguïteit en het veronachtzamen van problematische handelswijzen
om toch maar de “job uitgevoerd te krijgen” zijn belangrijke en verbeterbare factoren die
bijdragen tot het ontstaan van medische fouten. In deze context wordt ambiguïteit verstaan
als een gebrek aan perfecte klaarheid rond (1) de doelstellingen van wat men tracht te
bereiken, (2) wie verantwoordelijk is voor welke taak, (3) hoe informatie, diensten of
materiaal uitgewisseld dienen te worden, en (4) hoe precies een taak moet uitgevoerd
worden.
Verbeteringsacties worden best “klein en simpel” opgezet. Niet het ganse systeem ineens
maar wel enkele specifieke acties zoals patiënten dienen hun geneesmiddelen tijdig te
krijgen, op de vereiste manier en in de vereiste dosis.388
2.3.4 Indicatoren van patiëntveiligheid De eerste aanzetten op het gebied van patiëntveiligheid, die in de US gegeven werden,
waren niet erg hoopgevend. In een belangrijke studie werd het Complications Screening
Program (CSP) toegepast op administratieve gegevens met als bedoeling op een
geautomatiseerde manier ondermaatse zorg op te sporen.177;258In tegenstelling tot andere
gelijkaardige programma’s, beperkt het zich niet tot de complicatiecodes (ICD-9-CM:
996-999), wat een aansporing kan betekenen voor niet-invulling, maar bevat 28 “screens”
over heel de classificatie. De door het programma geflagde gevallen werden op twee
manieren onderzocht: een review van de gevallen door verpleegkundigen aan de hand van
expliciete criteria177en een review door artsen op een aselecte steekproef van geflagde
gevallen258. Uit de eerste studie kon niet besloten worden dat het CSP enig
screeningsvermogen had waar uit de tweede bleek dat de geflagde gevallen een duidelijk
hogere proportie kwaliteitsproblemen vertoonde dan de niet-geflagde. De predictieve
waarde van de geflagde gevallen was duidelijke hoger voor chirurgische dan voor
medische gevallen. De auteurs, waaronder er een aantal ook auteurs waren van het eerste
artikel waarnaar verwezen wordt, besluiten dat voor sommige types van verwikkelingen
het CSP op nuttige wijze gevallen kan identificeren ten behoeve van een artsen review.258
Ondanks deze eerste ervaringen, de codeerproblemen en de beperkte klinische details,
stellen ander auteurs dat indicatoren van patiëntveiligheid (PSI) gegenereerd op basis van
administratieve gegevens gebruikt kunnen worden als een “screen” voor potentiële
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
125
problemen, die verder onderzoek verrechtvaardigen.290 Het is dan, gegeven hun
beperkingen, wel belangrijk hun toepassingsgebied duidelijk te omschrijven. Naast hun
screeningsfunctie komen ze verder in aanmerking voor epidemiologisch onderzoek naar de
incidentie, de gevolgen van en factoren die verband houden met medische
schadegevallen.290;389PSIs kunnen ook gebruikt worden als instrumenten voor screening op
lokaal en nationaal vlak.290Verder onderzoek is nochtans vereist om te bepalen of en onder
welke omstandigheden ze op een valide manier kunnen gebruikt worden voor een
vergelijking tussen ziekenhuizen.290 Wellicht zal informatie technologie toelaten om via
elektronische screens, toegepast op elektronische patiëntengegevens, een betere
voorspellende waarde te bekomen dan die we nu kennen.292
Toch kunnen administratieve gegevens reeds nu nuttig zijn voor het opsporen van
onbedoelde uitkomsten. Het bestaan van conflicterende gegevens in hetzelfde record
kunnen een aanwijzing vormen, zoals bijvoorbeeld een acuut myocardinfarct bij een
patiënt met een urineweg infectie als opnamediagnose.292 Dergelijke benaderingen zijn
een efficiënt en relatief goedkoop alternatief voor de huidige, spontane rapportering van
onbedoelde uitkomsten, die slechts een klein aantal van die uitkomsten identificeert.390
Zij bieden ook het voordeel dat ze op reeds bestaande gegevens kunnen toegepast worden
en zo een minder vertekende indruk kunnen geven van een eventuele evolutie.390Dit zou
echter een groter risico voor rechtszaken met zich kunnen meebrengen al hoeft dit niet zo
te zijn indien wetgeving en regelgeving een betere bescherming zouden bieden aan
gezondheidszorgdiensten.390;391
2.4 HET ONTSLUITEN VAN KWALITEITSINDICATOREN.
Na door middel van kwaliteitsindicatoren eventuele kwaliteitsproblemen gescreend
gescreend te hebben en het daaropvolgende onderzoek te hebben uitgevoerd stelt zich de
vraag wat met de resultaten van het onderzoek moet gebeuren. Kwaliteitsprogramma’s
gebaseerd op indicatoren omspannen een breed methodologisch gamma van manieren
waarop deze vraag beantwoord kan worden, gaande van “Profielen” tot “Collaborative
peer education”, gebaseerd op de filosofie van de voortdurende kwaliteitsverbetering
(Continuous Quality Improvement) .392
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
126
Het gebruik van administratieve gegevens is de invalshoek waarop in de volgende
paragrafen op deze vraag nader wordt ingegaan
2.4.1 De publiekelijke ontsluiting van kwaliteitsindicatoren: reacties van zorgverleners, consumenten, verzekeraars en ziekenhuisdirecties.
“The people and communities who depend on health care have a right to know how good
that care is. The organizations that arrange and provide that care have a duty to tell
them”.393
De publiekelijke ontsluiting van kwaliteitsgegevens door een overheid of instelling is een
belangrijk concept. Een beproefde vorm hiervan zijn de “profielen”. De methode bestaat
erin ziekenhuizen in volgorde te rangschikken volgens de resultaten van een meting,
bijvoorbeeld het postoperatieve sterftecijfer bij CABG, en de rangen vervolgens onder
vorm van een profiel weer te geven. Het is duidelijk dat dergelijke profielen op een zeer
begrijpelijke manier een keuzemogelijkheid aanreiken aan onder meer consumenten,
verzekeraars, peer review, verzekeringsinstellingen en overheid om in één oogopslag de
prestaties te beoordelen en uit te maken wie “beter” of “slechter” scoort dan het
“gemiddelde”.394-396
“Informatie over ziekenhuisperformance, professionele beoefenaars van gezondheidszorg,
en gezondheidszorgorganisaties zijn in de US al meer dan een decennium publiekelijk
vrijgegeven. De te verwachten winst van deze onthullingen werd nooit duidelijk gemaakt,
en zowel de voordelen als de potentiële risico’s kregen slechts minimale empirische
aandacht. Het blijkt dan ook moeilijk te oordelen of de voordelen van publiekelijke
ontsluiting opwegen tegen de nadelen”.397
De meest gangbare verwachting is dat de publicatie van uitkomsten de zorgverleners wel
degelijk motiveert en verder, in een context van markteconomie, een geïnformeerde
consumentenkeuze toelaat, waarbij voor betere kwaliteit gekozen wordt. Als gevolg
hiervan zouden minder kwaliteitsvolle zorgverleners verdwijnen of hun kwaliteit
verbeteren.397-403
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
127
Dit uitgangspunt berust op een dubbele veronderstelling: zorgprocessen en -uitkomsten
kunnen gemeten worden én de variaties in deze metingen zijn een teken van variatie in
kwaliteitszorg.401
Andere elementen voor de motivering van het gebruik van profielen zijn: het bevorderen
van het verantwoording afleggen door de zorgverstrekkers en de systeembewakers aan de
gemeenschap; kwaliteitsverbetering te bevorderen, onder meer door het identificeren van
“benchmarks” voor zorg; het bevorderen van een regelgeving, gebaseerd op valide
informatie; en, te helpen bij het afsluiten van doeltreffende verzekeringsovereenkomsten
tussen verzekeraars en zorgverstrekkers.286;400;401;403;404
Weinigen zullen het met deze doelstellingen oneens zijn, maar gegeven de kwaliteit van de
gegevens die gepubliceerd worden en de belangen die op het spel staan voor zowel de
consument (kwaliteitsvolle zorgen) als de zorgverlener (goede naam, financiële belangen,
werkvoorwaarden en werkgelegenheid), is het belangrijk het openbaar maken van
zorggegevens op een correcte en begrijpbare manier te organiseren.72;301;394;398;405-408
Het sterkste argument ten voordele van de profielen is dat het een van de weinige middelen
is waarover de systeemregulatoren beschikken voor het monitoren van en het bekomen van
aansprakelijkheid van de zorgverleners. Vastgestelde belangrijke afwijkingen zouden dan
gebruikt kunnen worden als vertrekpunt voor verder onderzoek. Maar dit werd vooralsnog
te zelden doorgevoerd.394 Verder leerde ervaring dat het gebruik van performancegegevens
bij interne audit niet leidde tot de verhoopte kwaliteitsverbetering, al hoopte men dat het
publiceren van dergelijke informatie door een verhoogde gevoeligheid voor de eigen
performance dit wel zou verwezenlijken.400
De klaarblijkelijke successen, die door zijn voorstanders aan het profileringsysteem
worden toegeschreven, zoals een terugdringen van sterftecijfers bij CABG over het geheel
der ziekenhuizen en nog meer in het terciel met de hoogste sterftecijfers, zijn niet
noodzakelijk het gevolg van het openbaar maken van ziekenhuiscijfers.392 Alleen het feit
van gegevens te verzamelen kan immers ziekenhuizen stimuleren om zich toe te leggen op
het verbeteren van uitkomsten en kwaliteit, lang voor dergelijke gegevens naar het publiek
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
128
toe worden vrijgegeven.392 De grote verlooptijd tussen gegevensverzameling en publicatie,
zeker als het over individuele chirurgen gaat, maken het moeilijk een direct, causaal
verband te leggen tussen publicatie en daaropvolgende verbeteringen in
ziekenhuissterfte.392;409 Ondertussen doen er zich wijzigingen voor in het
ziekenhuispersoneel; treden er veranderingen op in interne processen en worden er
structurele veranderingen doorgevoerd; worden er nieuwe patiëntengroepen behandeld; en
evolueert de techniek op gebied van diagnose en behandeling.392 Zo kunnen de verbeterde
CABG mortaliteitcijfers grotendeels toegeschreven worden aan de veralgemeende
ontwikkeling van interne kwaliteitsprogramma’s van ziekenhuizen met onder meer het
onderkennen en corrigeren van suboptimale processen zoals het preoperatief stabiliseren
van niet-stabiele angina en standaardisatie van operatieve technieken.392 Verder dient er
rekening gehouden te worden met een verbetering van deze sterftecijfers over het ganse
land ook in staten waar geen profielen gebruikt worden. Zo was bijvoorbeeld de
verbetering in Massachussets (geen profielen, noch enig specifiek
kwaliteitsbevorderend programma) identiek met die van New York (wel profielen). De
proportionele, risicogecorrigeerde verbetering van de CABG sterftecijfers van de staat
New York werden alleen geëvenaard door die van New England, waar er een agressieve
maar volledig confidentiële CQI benadering plaatsvond.392;410 Shahian et al. besluiten:
“Deze vaststelling suggereert dat het opzetten van een formeel kwaliteitsbevorderend
proces de sleutel is, ongeacht of het over een publieke of een confidentiële inspanning
gaat.”392
Andere auteurs menen dat er toch enige verbeteringen in gezondheidszorg gestimuleerd
werden door het openbaar maken van kwaliteitsindicatoren397;400;402 en dit waarschijnlijk
door het onthullen van ondermaatse praktijken aan organisatiemanagers.402 Zo stelde men
voor de periode 1996-1999 bijvoorbeeld vast dat de inentingsgraad voor varicella en voor
mazelen, dikoor en rubella respectievelijk van 40% tot 64%, en van 52% tot 59% opliepen
en dat bij patiënten met een acuut myocardinfarct het toedienen van β-blockers van 62%
naar 85% steeg.402 Maar de afwezigheid van een controlegroep, met name een groep niet
blootgesteld aan openbare rapportering, blijft een zwakte voor deze stelling.402 Nochtans
toonde een meta-analyse van gerandomiseeerde klinische studies van profielen een
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
129
significant positief effect aan op het gebruik van zorgen maar met een minimaal klinisch
belang.273
Toch is dit instrument gevaarlijk en dit om verscheidene redenen. Het houdt geen rekening
met de stochastische variabiliteit, die zeer uitgesproken kan zijn wanneer het gaat over zeer
kleine aantallen zoals bij postoperatieve mortaliteit, wat niet alleen hoge of lage
puntschatters oplevert voor “normale” ziekenhuizen maar anderzijds vaak te weinig
statistische power heeft om slecht presterende ziekenhuizen te identificeren.407 Verder –
ook al worden er betrouwbaarheidsintervallen rond de puntschatters gebouwd – impliceren
profielen een rangorde, die zeer misleidend kan zijn (zie hoofdstuk 3).396 Vermits er bij
het opstellen van profielen er steeds een “eerste” en een “laatste” zijn, ook al is het verschil
klinisch en of statistisch niet significant, kan dit, zeker indien er geen rekening gehouden
wordt met case mix, een ziekenhuis of een arts ten onrechte
stigmatiseren.77;191;296;394;395;405;407;411
Daar profielen gebaseerd zijn op gecomputerizeerde gegevens dient men een onderscheid
te maken tussen reële kwaliteitsproblemen en artefacten ten gevolge van de gebrekkige
kwaliteit van de gegevens, wat er bijvoorbeeld de Health Care Financing Administration
toe leidde de in 1988 aangekondigde plannen voor het publiceren van de rangordening van
artsenspecifieke uitkomstgegevens al in 1993 stop te zetten wegens de beperkte
gegevenskwaliteit.275 We verwijzen hier verder naar het onderhoofdstuk over
risicocorrectie waar de kwaliteit van de gegevens als belemmerende factor voor een goede
risicocorrectie uitvoerig besproken werd. Ook bevat dit soort gegevens geen informatie
over eventuele voorkeur van artsen en patiënten voor een chirurgische behandeling boven
een alternatieve medische behandeling, wat eveneens een weerslag heeft op een
chirurgische mortaliteit.275;412
Het vermijden van hoogrisicopatiënten – de mensen die de behandeling het meest nodig
hebben en er het meest baat bij ondervinden – te behandelen, ook “cherry picking”296 of
“skimming”413 genaamd, is een potentieel ongewenste nevenwerking van
profielen.274;392;403 Waar de empirische evidentie suggereert dat afdoende risicocorrectie
voldoende waarborg biedt aan de chirurg om dit type patiënt te behandelen, bestaat er
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
130
tegenstrijdige evidentie over het al dan niet meespelen van het “cherry picking” fenomeen
in de vermindering van het CABG-sterftecijfer van de staat New York191;392;410 percipiëren
chirurgen het behandelen van hoogrisico patiënten als een gevaar voor hun carrière; en,
rapporteren cardiologen dat het moeilijk is een chirurg te vinden voor dergelijke
patiënten.344 Verder werd vastgesteld dat hoogrisico CABG-kandidaten minder vaak de
geëigende behandeling krijgen dan gelijkaardige hoogrisicopatiënten met aorta dissectie.392
Ook voor diabetes werd het potentieel voor “cherry picking” aangetoond en werd de
onbetrouwbaarheid van profielen van individuele artsen zowel voor het beoordelen van de
kwaliteit als de kosten van een diabetesbehandeling aangetoond.329 Om “cherry picking” te
ontmoedigen werden een aantal oplossingen voorgesteld: het maken van specifieke
rapporten voor hoogrisico patiënten, wat echter het probleem van de kleine aantallen
verergert; het uitsluiten van dit type patiënten uit de profielen – maar dit soort patiënten
zijn vaak het meest leerrijk in het kader van kwaliteitsverbetering –, en, naast sterftecijfers,
ook andere eindpunten voor kwaliteitsbeoordeling te gebruiken.392
“Gaming”, een andere nevenwerking van profielen, tracht op kunstmatige wijze de
performance te verbeteren. Hieronder worden onder meer volgende technieken verstaan:
het opwaarderen van preoperatieve co-morbiditeit; het veranderen van de ingreepklasse;
en, het transfereren van postoperatieve patiënten in kritieke toestand naar een andere
verzorgingsinstelling.77;83;191;274;296;301;338;354;392;394;402;403 Zo werden er om de vermindering
van de CABG sterfte in New York te beschrijven twee componenten onderscheiden:
enerzijds een vermindering van de waargenomen sterfte en anderzijds een verhoging van
de verwachte sterfte. Deze laatste bleek vooral het gevolg van een stijging in het coderen
van risicofactoren zoals preoperatief nierfalen, hartinsufficiëntie, COLD, niet-stabiele
angina en kleine ejectiefractie.191 Ook in andere staten werden gelijkaardige fenomenen
vastgesteld.392
Het veranderen van een ingreepklasse naar een andere, die eventueel niet in het profielen
systeem voorzien is, zoals bijvoorbeeld die van een CABG in een geval van een
ischemische mitralis regurgitatie, met een “grijze zone” regurgitatie die niet imperatief een
ingreep vereist, naar een CABG-mitralisklep herstelling door het aanbrengen van enkele
commissuurhechtingen, is vrij eenvoudig. Zij realiseert daarenboven een optimalisatie van
zowel de CABG-cijfers als de CABG-mitralisklep herstellingcijfers door het herklasseren
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
131
van een geval met een mindere gunstige prognose uit de CABG-klasse in de CABG-
mitralis herstelling klasse waar ditzelfde geval een relatief gunstigere prognose heeft.392;412
Om deze “grijze zone” transacties tegen te gaan wordt voorgesteld de mortaliteit voor het
ganse spectrum van de ziekte te rapporteren ook al verschillen de ingrepen uitgevoerd voor
de subgroepen ervan.412 Meer algemeen gesteld heeft een lage chirurgische mortaliteit
slechts betekenis wanneer zij gerapporteerd wordt voor de ganse bevolking met inbegrip
van hen die geen ingreep ondergingen.412 De laatste vorm van gaming, namelijk het
transfereren naar een andere verzorgingsinstelling van patiënten in een kritieke toestand
wordt in de hand gewerkt doordat vaak sterftegevallen in andere verzorgingsinstellingen
niet in verband gebracht (kunnen) worden met de indexingreep. Het verzamelen van
uitkomstgegevens voor alle patiënten op een vastgesteld ogenblik,
zoals een dertig dagen mortaliteit, en dit ongeacht een eventuele transfer, kan hiervoor een
oplossing betekenen.392
Toch bestaan er naast upcoding andere deelverklaringen voor de stijging van gecodeerde
risicofactoren en met name een verfijning van definities en initiële onderraportering354, wat
niet wegneemt dat een zekere graad van upcoding ten gevolge van publiekelijke vrijgave
van profielen waarschijnlijk is392. Het opstellen van zo eenduidig mogelijke definities, het
trainen van gegevensabstraheerders en het aselect uitvoeren van externe audits om de
accuratesse van de gegevens te bewaken worden aanbevolen om upcoding tegen te gaan.392
Uit de opgedane ervaring in de US blijkt dat consumenten en zorgverzekeraars erg
uiteenlopende vragen stellen in verband met kwaliteitsinformatie, vaak de rapporten niet
begrijpen en er relatief weinig gebruik van maken.397;398;400;402
Consumentenenquêtes leren dat minder dan 50% van de Amerikanen gelooft dat er grote
kwaliteitsverschillen bestaan tussen ziekenhuizen, huisartsen en gezondheidsplannen; dat
minder dan 1/3 gelooft dat er grote verschillen bestaan tussen specialisten; en dat minder
dan 1/3 rapporteert enige kwaliteitsinformatie rond gezondheidszorg gezien te hebben.402In
Pennsylvania, de staat die een voortrekkersrol gespeeld heeft op gebied van openbare
ontsluiting van performance-indicatoren met sterftegegevens op individueel ziekenhuis- en
artsenniveau315;414 en waar de overheid voor een extensieve verspreiding van die gegevens
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
132
zorgde, leverde een patiëntenenquête volgende resultaten op: < 20% waren op de hoogte
van het bestaan van sterftegegevens, < 12% bekeek ze voor een ingreep, en < 1% meldde
dat die informatie hen van arts of ziekenhuis deed veranderen.402
Verder verwijten de consumenten aan de profielen 1) dat ze teveel informatie bevatten, die
niet genoeg aangeeft hoe ermee moet omgesprongen worden, 2) dat ze geen
prijsinformatie bevatten, 3) dat het moeilijk is deze informatie te verzamelen en
zorgverleners te vergelijken, en 4) dat de informatie te weinig in het oog
springt.402Gelijkaardige bevindingen werden bij consumenten vastgesteld wanneer het
ging over verschillen tussen een systeem gebaseerd op terugbetaling per prestatie (fee for
service) versus een vast periodisch bedrag per patiënt (“capitation”) en die konden kiezen
tussen beide systemen: ongeveer 30% van de ondervraagden wisten bijna niets over Health
Maintenance Organisations322, die werken met een vast periodisch bedrag, en 41% van de
overigen wist er duidelijk veel te weinig over.415
Tenslotte lijken bij consumenten quantitatieve gegevens minder zwaar te wegen dan
persoonlijke ervaring, zoals de aanbevelingen van vertrouwde zorgverleners, informele
netwerken en aanbevelingen van familieleden en vrienden.309;397;400;402 Het lijkt derhalve
weinig waarschijnlijk dat de “slapende reus” van de consumentenkeuze zal ontwaken.402
Vaak gebruiken zorgverzekeraars dit soort informatie niet op een zinvolle manier. In
tegenspraak met de conventionele markteconomische theorie, domineerden enkele plannen
met de slechtste resultaten op gebied van consumentensatisfactie de markt. Andere dan
kwaliteitsbeschouwingen spelen hierbij een rol: snelle uitbetaling in geval van claims,
netwerken, lage prijzen, en het niet verplicht karakter van de performance van de
gezondheidsplannen (21 op de 54 van die plannen gaven geen gegevens vrij en scoorden
significant slechter dan de andere).402
Kleine werkgevers ( < 50 werknemers) vertegenwoordigen 96% van de US arbeidsmarkt.
Bij hen komen kwaliteitszorg en accreditatie op de vijfde en zesde plaats op de zes
factoren, die beschouwd werden voor de aankoop van een verzekering voor hun
werknemers, na prijs, voordelenpakket en beschikbaarheid van de artsen.402
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
133
De rol van de media lijkt vrij beperkt: de mensen schijnen weinig rekening te houden met
de ziekenhuisrangen en media krijgen meer reacties vanwege ziekenhuizen en
gezondheidssystemen dan vanwege consumenten.402
Artsen staan sceptisch ten opzichte van profielen en maken er weinig gebruik van
bijvoorbeeld bij verwijzing van patiënten, hoewel een studie vaststelde dat huisartsen
rekening houden met de geboden kwaliteit bij een verwijzing.283;309;344;397;400;402;407 In een
studie in Schotland bleek dat de redenen voor de geringe impact van publiekelijke
ontsluiting op artsen de volgende waren: de geloofwaardigheid van de indicator omwille
van de kwaliteit van de gebruikte gegevens, de grote tijdsspanne tussen de feiten en de
publicatie ervan, de geringe doorstroming van de indicatoren naar alle leden van de
ziekenhuisstaf, gebrek aan vorming over het gebruik van en interpretatie van
kwaliteitsindicatoren en het afwezig zijn van een verantwoordelijke voor het begeleiden
van het gebruikmaken van de indicatoren, het ontbreken van een formeel systeem van
performance beoordeling waaraan een stimulans verbonden is, het belang van bijkomende
informele informatie via professionele netwerken die belangrijker leken dan “laattijdige”
indicatoren, procesindicatoren worden verkozen boven uitkomstindicatoren, de geringe
externe aansprakelijkheid vanwege patiënten, vertegenwoordigers van patiënten en
gezondheidsdiensten.416
In tegenstelling met deze relatieve inertie bij artsen bleken kwaliteitsrapporten in Ontario
wel tot kwaliteitsverbeterende initiatieven aanleiding te geven in veel ziekenhuizen.298
Ziekenhuizendirecties reageren immers wel op dit soort informatie, zij het op
uiteenlopende wijze: ofwel op een negatieve en defensieve manier door het rapport te
bekritiseren, ofwel door een concrete kwaliteitsverbetering en men stelt vast dat de
weerstand van zorgverleners t.o.v. profielen in de VS toeneemt.397;400;402In Canada schijnt
de afkeer voor profielen veel minder uitgesproken te zijn, maar worden ze vooral als nuttig
beschouwd wanneer het over procesindicatoren gaat.298
Er werden pogingen ondernomen om aan de nadelen van profielen te verhelpen. Een betere
en tevens meer gebruiksvriendelijke benadering komt uit de industriële wereld, namelijk
de “control chart”.394;417-420 Bij deze benadering, die afgeleid is van de statistische
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
134
procescontrole, beschouwt men de performance van ziekenhuizen als één industrieel
proces waarvan men aanneemt dat het homogeen is, wat niet uitsluit dat er zelfs in het
meest perfect opererend systeem onvermijdelijk enige variabiliteit optreedt in het
eindproduct.394;420 In tegenstelling tot de “league tables”, die een 95%
betrouwbaarheidsinterval gebruiken voor de individuele zorgverstrekker en wat leidt tot
het beschouwen als outlier van 1 op 20 zorgverleners, wordt hier een gemiddelde berekend
en twee controle limieten, die er 3 σ van verwijderd zijn, wat leidt tot een
interval dat 99.7% der observaties bevat in geval van een normaal verdeling.421 Verder
suggereert deze manier van voorstellen geen rangen, al worden outliers wel in beeld
gebracht en is de methode die voor het bepalen van outliers gebruikt wordt (zij houdt geen
rekening met correlaties) niet helemaal correct. Hoewel conceptueel erg aanlokkelijk, toch
lijkt ons deze benadering enigszins gewaagd. In de industriële setting gaat het immers over
een proces dat zich afspeelt in een tijdsperspectief, wat hier duidelijk niet het geval is
vermits het ziekenhuisuitkomsten op een bepaald ogenblik vergelijkt. Wij werkten zelf een
alternatieve aanpak uit (Zie hoofdstuk 3).
We wensen hier enkele woorden te wijden aan het probleem van het profileren van
individuele artsen omdat hier de nadelen van profielen maximaal uitvergroot worden.
Hofer et al.329trokken uit een profielenstudie m.b.t. bloedwaarden (HbA1c-spiegel) bij
diabetici in een huisartsensetting een aantal belangrijke conclusies. Vooreerst dienen de
makers van profielen een realistischer beoordeling te maken van de betrouwbaarheid van
hun methoden, die vooralsnog niet in staat bleken echte verschillen in praktijkvoering op
een betrouwbare manier aan te tonen. Vervolgens dient de case mix geoptimaliseerd te
worden - correctie voor leeftijd en geslacht is amper beter dan helemaal geen correctie – en
dienen er genoeg observaties per zorgverlener en genoeg zorgverleners te zijn om de echte
betrouwbaarheid van hun meting te schatten. Tenslotte moet men er zich van bewust te
zijn dat de toepassing van profielen gaming kan uitlokken (het “verwijderen” van 1 tot 3
van de zwaarste gevallen is voldoende om een outlier status om te buigen naar een inlier
status) en dat dit fenomeen de meest zieke en meest kwetsbare patiënten treft.329
Of de bestaande evidentie voor of tegen publiekelijke ontsluiting pleit, is open voor debat.
Voorstanders focussen op de kleine maar significante winst, die geboekt werd, stellen dat
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
135
traditionele methoden onvoldoende subtiele veranderingen meten en dat de voornaamste
impact zich pas over jaren zal laten voelen. Tegenstanders concentreren zich op de
negatieve bevindingen en op de kleine winst in verhouding tot de belangrijke investering
in tijd en middelen.397
Concluderend kan men stellen dat een toenemende graad van publiekelijke ontsluiting van
gezondheidszorg performance gegevens onvermijdbaar is en de grotere vraag naar
informatie en aansprakelijkheid in alle levensdomeinen weerspiegelt.397;422 Men mag
aannemen dat het gebruik van dergelijke gegevens door de consumenten en zorgenkopers
of voor reguleringsdoeleinden relatief minder belangrijk zal zijn dan als een katalysator
om interne kwaliteit te stimuleren en te bevorderen bij zorgverleners.397
2.4.2 Continuous Quality Improvement (CQI). In tegenstelling met profielen legt CQI de klemtoon op proces en systeemverbetering
veeleer dan op de opsporing en rapportering van outliers, waarvan het de onbedoelde
negatieve consequenties, voornamelijk het niet uitvoeren van ingrepen bij de hoogrisico
patiënten en “gaming” zoekt te vermijden.392 Verder is het onrealistisch eerlijk
zelfonderzoek te verwachten onder de bedreiging van publiekelijke ontsluiting.392 De CQI-
benadering wordt dan ook als volgt omschreven “... CQI maakt gebruik van
samenwerking, uitwisselingsbezoeken in een niet-bedreigende sfeer, en vaststelling van de
beste praktijken om de kwaliteit te verhogen en de variabiliteit onder de samenwerkende
instellingen te verbeteren”.392
In New England heeft CQI een werkelijke kwaliteitsverbetering teweeg gebracht. Vraag is
echter in welke mate deze specifieke setting, gekenmerkt door vrijwillige deelname en
geringe competitie onder de deelnemers, veralgemeenbaar is naar een nationale setting met
competitie onder de deelnemers.392
2.4.3 Hybriede vormen CQI, hoe aantrekkelijk ook als systeem, voldoet echter niet aan het
aansprakelijkheidsprincipe. Vandaar dat er gezocht wordt naar vormen van
kwaliteitsborging, die wel aan deze basisvereiste beantwoorden zonder de voordelen van
CQI te verliezen noch in de nadelen van profielen te delen.392
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
136
Hybriede vormen, die een CQI benadering combineren met een basis report card, kunnen
misschien het beste compromis zijn.392 Zo stellen Topol en Califf274, en Califf et al.289 een
benadering voor, die wellicht minder tot misinterpretatie zou leiden dan bij profielen. Zij
zou erin bestaan een aanvaardbare spreidingsbreedte van de uitkomst te definiëren en
alleen tot publiceren van specifieke puntschatters over te gaan indien de waargenomen
waarde voor een arts of een instelling buiten deze spreidingsbreedte ligt of wanneer de
geobserveerde verschillen statistisch significant zijn en na bevestiging van de outlier status
door een adequaat peer review. Dezelfde auteurs bepleiten verder dat cardiologen en
hartchirurgen ook een vermelding maken op het formulier van de geïnformeerde
toestemming van het risicoprofiel en de uitkomstcijfers in hun patiëntenpraktijk, met 95%
betrouwbaarheidsintervallen, én gecertificeerd door een onafhankelijke peer review
groep.274;289 Naast een adequate risicocorrectie zou de uitkomstenbeoordeling ook baat
vinden bij een meer volledige registratie namelijk vanaf de verwijzing voor hartchirurgie
en voor een langere follow-up. Dit zou het mogelijk maken “skimming” op te sporen en de
langere termijn uitkomsten in rekening te brengen.289 Aangepaste statistische modellen
kunnen hierbij nuttig zijn. Bayesiaanse hiërarchische modellen laten toe bij profielen een
grenswaarde te kiezen, die niet op probabiliteiten of op een vergelijking met de
gemiddelde performance van de zorgverleners berust maar op een standaard gebaseerd op
een aanvaardbare medische praktijkvoering en op kost en nut voor het publiek.423 Een
alternatief voor de “aanvaardbare” praktijkvoering kan de “beste” praktijkvoering zijn wat
overeenkomt met de twintigste percentiel.403
2.4.4 Slotbeschouwingen rond het ontsluiten van kwaliteitsgegevens De ervaring uit de US leert dat een of andere vorm van publiekelijke ontsluiting van
perfomancegegevens in de zorgensector waarschijnlijk onvermijdbaar is.397;400 Ze is
overigens wenselijk in een context van kostenbeheersing, waar alléén de kosten zouden
bepalen welke artsen bepaalde ingrepen zouden uitvoeren zonder enige
kwaliteitsoverweging als inbreng bij de beslissing.424
Deze ervaring suggereert verder dat gesofisticeerde kwaliteitsmetingen en
rapporteringsystemen niet geleid hebben tot de consumentenkeuzes zoals ze te verwachten
waren in een context van markteconomie, waarbij voor betere kwaliteit gekozen wordt
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
137
met het verdwijnen van minder kwaliteitsvolle zorgverstrekkers als gevolg of het
verbeteren van hun kwaliteit.402
Verder dienen we er ons bewust van te zijn “dat het gezondheidszorgsysteem zich
gewoonweg de kosten niet kan veroorloven van een voldoende encyclopedische set van
kwaliteitsmaten te maken, die beantwoordt aan de noden van iedere patiënt en dat voor alle
aandoeningen.”402 Waarschijnlijk hebben we het einde bereikt van de inspanningen om de
presentatieformaten van kwaliteitsinformatie te verbeteren en is het verspreiden de te
nemen horde.402 Zorgverleners kunnen immers gemakkelijk informatie die hen ‘bijt’
ondermijnen, consumenten hebben waarschijnlijk tijd noch zin om de nodige inzichtingen
te verwerven en internet is hiervoor geen oplossing want consumenten interesseren zich
voor ziekten en behandelingen niet voor kwaliteit.402 We dienen echter beter te weten
welk type van informatie consumenten en verzekeraars nodig hebben en kunnen
gebruiken. 397;400;402Het meten van kwaliteit dient verder te gaan maar de resultaten moeten
bij voorkeur naar organisaties gaan, zoals de National Committee for Quality Assurance
(NCQA).402
Op een aantal fundamentele vragen moet een antwoord verschaft worden zoals op de te
gebruiken types van indicatoren (proces en/of uitkomst), de vereiste graad van
risicocorrectie nodig om faire en betekenisvolle vergelijkingen te maken, hoe de
informatie verspreiden en hoe de nevenwerkingen best op te vangen.400 Dit veronderstelt
enerzijds een evenwichtige afweging van wetenschappelijke rigorisme, dogma en gezond
verstand, maar ook een aanvaarding door de professionele beoefenaar van
gezondheidszorgen en de gezondheidssector.400
Het gebruik van hiërarchische modellen, inclusief een afdoende correctie voor multipele
toetsing, ondervangt de meeste van de statistische en rapporteringproblemen waarmee de
klassieke profileringmethoden gepaard gaan. Hun waarde is functie van de kwaliteit van
het gegevensbestand, van de correcte specificatie en fit van het model.423
Naylor stelt voor vormen van op maat gesneden partnership te ontwikkelen tussen clinici,
medische centra en regulatoren en geloofwaardige agentschappen voor
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
138
kwaliteitsbevordering, die niet alleen de inspanningen tot kwaliteitsverbetering
ondersteunen maar ook de resultaten zullen genereren, die openlijk met patiënten gedeeld
worden.409 “But public disclosure of information about the quality of healthcare is a weak
strategy for ensuring quality”.402
Ongunstige gevolgen zijn duidelijk belangrijk voor gezondheidszorgorganisaties, niet
alleen omwille van hun impact op patiënten maar ook omdat ze inlichtingen kunnen
verschaffen over de kwaliteit van de gezondheidszorg en tevens aan de clinici de kans
bieden voor kwaliteitsverbetering.370 Anderzijds kan kwaliteitsverbetering niet uitsluitend
gebaseerd zijn op negatieve ervaringen want dat werkt demotiverend voor de clinici en
geeft een vertekend beeld van kwaliteit dat gebaseerd is op outliers, technische kwaliteit en
problemen van patiëntenveiligheid.370 Verder dient men rekening te houden met een aantal
belangrijke praktische problemen, zeker indien een kwantitatieve benadering gevolgd
wordt: 1) het ontwikkelen van definities van onbedoelde uitkomsten die betekenisvol,
betrouwbaar en valide zijn is moeilijk, 2) meestal wordt gebruik gemaakt van impliciet
professioneel review dat vaak onbetrouwbaar is, en 3) de meeste van de gebruikte
maatstaven werden onvoldoende uitgetest in termen van validiteit, betrouwbaarheid en
veralgemeenbaarheid.370
In een optiek van kwaliteitsverbetering is het noodzakelijk dat men zich, in geval van een
“ramp” zoals bij de pediatrische hartchirurgie in Bristol318;425, niet beperkt tot het
individueel falen van artsen maar er zich rekenschap van geeft dat het meestal over een
“organisatorische pathologie” gaat en dat de ervaring leert dat het niet gemakkelijk is
systemen te veranderen.426 Dit soort problemen doet zich namelijk veelal voor in een
organisatie met een zwak leiderschap, met geografische isolatie en zonder zelfevaluatie,
met een gebrek aan basis management systemen en processen, met ondermaatse interne en
externe communicatie, en waar de staf noch de patiënten hun bekommernis kunnen
uiten.426 Ook het IOM beklemtoont dat medische fouten meestal resulteren uit fouten van
het systeem niet uit die van onzorgvuldige zorgverleners. Het voorkomen van fouten en
schade vereist een hertekening van het systeem niet het straffen van individuën284 of zoals
Leape het stelt: “Errors result from faulty systems not from faulty people, so it is systems
that must be fixed. Errors are excusable; ignoring them is not.”352
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
139
Het IOM beveelt twee types van rapportage aan: 1) een vrijwillige in geval van minimale
of geen schade, en 2) een verplichte, wanneer het gaat over een sterfgeval of over een
ernstige blijvende schade.284 Dergelijke aanbevelingen omzetten tot realiteit vergt een
nationale inspanning.284
2.5 BESLUIT
De concepten volksgezondheid, gezondheidsdiensten en epidemiologie overlappen elkaar
grotendeels waar zij erop gericht zijn de gezondheid van de ganse bevolking te bewaren, te
bevorderen en te herstellen. Toch lijken er twee, los van elkaar staande werelden te
bestaan: een van volksgezondheid en een andere van gezondheidsdiensten, met twee eigen
informatiesystemen, respectievelijk volksgezondheidsinformatie en
managementinformatie.
Het is dan zaak om naar Nederlands voorbeeld de conceptuele eenheid te herstellen door te
streven naar een kwaliteitsvolle volksgezondheid. Hiervoor wordt de benadering gevolgd
van Donabedian, een op zeven pijlers gebaseerde globale zorgenkwaliteit bestaande uit:
de maximale doeltreffendheid, de gerealiseerde doeltreffendheid, de doelmatigheid, de
optimaliteit, de aanvaardbaarheid voor de patiënt, de legitimiteit ten overstaan van de
maatschappij en de billijkheid. In deze visie wordt er rekening gehouden met zowel met
technische aspecten als met interpersonele relaties.
Na een omschrijving van wat kwaliteit is, wordt nagegaan welke van haar aspecten aan de
hand van administratieve gegevens kunnen beschreven worden. Hierbij worden twee
benaderingswijzen gevolgd.
Een eerste benadering is gebaseerd op kwaliteitsindicatoren. Achtereenvolgens worden de
types en het gebruik van kwaliteitsindicatoren besproken, en de mogelijkheden van
administratieve gegevens om ondermaatse of bovenmaatse kwaliteit aan te tonen
onderzocht.
Een tweede benadering is deze gebaseerd op incidenten n.a.v. toegediende zorgen. Het
begrip “onbedoelde uitkomst” wordt omschreven, gegevensbronnen worden vermeld, de
Hoofdstuk 2: Gebruik van administratieve gegevensbanken
140
omvang van het fenomeen geschetst en de bruikbaarheid van administratieve
gegevensbanken aangegeven.
Administratieve gegevensbanken laten niet toe de kwaliteit van zorgen te meten omwille
van hun inherente beperkingen, zij zijn immers alleen een neerslag van technische
aspecten van zorg en zijn verder gekenmerkt door onvolledigheid en onvolmaaktheid van
de gegevens. Een screening van onder- en bovenmaatse kwaliteit van zorgen lijkt wel een
bruikbare werkhypothese. Op gebied van incidenten lijkt de rol van administratieve
gegevens nog beperkter.
In een laatste deel van het hoofdstuk wordt nagegaan hoe, in het licht van buitenlandse
ervaringen, met de resultaten van de uitgevoerde screening kan omgegaan worden
rekening houdend met de fundamentele plicht van aansprakelijkheid van de gescreende en
van de overheid, en het fundamentele recht op persoonlijke integriteit van de gescreende.
Hierbij is het duidelijk dat de aandacht uitgaat naar organisaties, naar het verbeteren van
hun functioneren, en niet naar individuele artsen. Het identificeren van de inhoud en vorm
van de informatie ten behoeve van de consument, ziekenhuismanagers en
verzekeringsinstellingen, is een nog lopend proces benevens de wijze van
bevestiging/ontkenning van screeningsresultaten.
141
Hoofdstuk 3: Methodologische aspecten
Zowel het opsporen van ziekenhuizen met een afwijkend codeergedrag als het
identificeren van ziekenhuizen met een ondermaatse of bovenmaatse zorgenkwaliteit, zijn
twee belangrijke onderdelen van dit proefschrift, die we verder (Hoofdstukken 4 en 5)
uitvoerig zullen behandelen. Zij doen een beroep op dezelfde statistische methodologie, zij
het in een totaal andere setting. Het gaat hierbij immers over het opsporen van outliers.
Het leek dan ook de moeite aan deze technieken een hoofdstuk te wijden en hierin tevens
de beperkingen van deze methoden en de daarop gebaseerde analyses op te nemen.
Wij trachtten hierbij het aspect van de omvang van het bestudeerde fenomeen aan bod te
laten komen naast het statistisch concept van significantie, vermits we hier immers vaak te
maken hadden met zeer grote aantallen en derhalve gemakkelijk significant.
Bij de analyse diende verder de nodige aandacht geschonken te worden aan de
beperkingen eigen aan administratieve gegevens.
3.1 AUDIT: STATISTISCHE METHODOLOGIE
3.1.1 Globale beoordeling van de evolutie van het ziekenhuissysteem op gebied van ligduur en ziekte-ernst, en opsporing van afwijkende ziekenhuizen
De beoordeling van de doeltreffendheid en doelmatigheid van het zorgsysteem is
fundamenteel voor de beleidsonderbouwing. Het is daarbij belangrijk ziekenhuizen op te
sporen, die door hun systematisch afwijkend codeergedrag deze beoordeling bemoeilijken
(zie Hoofdstuk 4, Sectie 4.2). Het is verder de bedoeling deze systematisch afwijkende
ziekenhuizen in geval van bewust over- of ondercoderen te bestraffen en zo de financiële
motivatie voor frauduleus codeergedrag weg te nemen. Het lijkt dan ook belangrijk de
statistische methodologie van de beoordeling van het ziekenhuissysteem en de opsporing
van de afwijkende ziekenhuizen meer in detail te bespreken.
Hoofdstuk 3: Methodologische aspecten
142
Onze analyses bestaan uit drie verschillende onderdelen.
1) In een eerste onderdeel wordt de evolutie van het ziekenhuisgebeuren op nationaal
niveau, de stabiliteit van het systeem, onder de loep genomen. Dit gebeurt door middel van
een klassieke variantie-analyse (van het type herhaalde metingen, “repeated
measurements”)427 en linear mixed models428 voor continue antwoordvariabelen, en door
middel van marginale modellen (Generalized Estimating Equations of GEE) 429-431 voor
categorische antwoordvariabelen. Deze modellen laten toe rekening te houden met
correlatie van de gegevens.
2) In een tweede onderdeel bestuderen we de ziekenhuizen op een globale manier. Hierbij
is het de bedoeling ziekenhuizen met een globaal afwijkend codeergedrag, de “outliers”,
op te sporen. Vermits onze aandacht uitgaat naar het geheel der Belgische ziekenhuizen en
we geïnteresseerd zijn in het identificeren van outliers, maken we gebruik van zogenaamde
“fixed- effects” modellen.432;433 Hiërarchische modellen, vaak de zogenaamde “random-
effects” modellen, hadden een alternatief kunnen zijn.434 Het is echter zo dat deze
modellen niet bedoeld zijn om outliers te identificeren. Verder moet de theoretische
grondslag voor het vaststellen van outliers nog ontwikkeld worden voor “linear mixed”
modellen en is het voor “non-linear mixed” modellen onmogelijk outliers te
identificeren.434;435Herinneren we er tenslotte aan dat bij “random-effects” modellen de
ziekenhuizen beschouwd worden als een aselecte steekproef uit een ruimere populatie van
ziekenhuizen, wat in tegenspraak is met ons studieobject, namelijk het geheel der
Belgische ziekenhuizen.
Om de evolutie van het systeem te beoordelen doen we, in geval van een continue
antwoordvariabele, beroep op een multivariate variantie analyse (van het type herhaalde
metingen).427 Ook fitten we in een “linear mixed” model, dat rekening houdt met de
correlatie van de gegevens, het verschil tussen geobserveerde en de gestandaardiseerde
verblijfsduur om de stabiliteit van het systeem op te volgen. Deze benadering laat toe (1)
de tijdsevolutie in zijn geheel te beoordelen en dus niet door middel van een paarsgewijze
vergelijking van de jaargemiddelden, (2) rekening te houden met de correlatie die tussen
de herhaalde metingen bestaat, en (3) afwijkende ziekenhuizen te identificeren. We
modelleren het (gewogen) verschil tussen de geobserveerde en gestandaardiseerde
40BHoofdstuk 3: Methodologische aspecten
143
gemiddelde verblijfsduur omdat ze gemakkelijk kunnen vertaald worden in een statistisch
model en verder omdat ze op een gemakkelijker interpreteerbare manier grafisch kunnen
weergegeven worden dan een gelijktijdige vergelijking van twee curven per ziekenhuis
voor een geheel van 114 ziekenhuizen.
Een zelfde multivariate variantie analyse (van het type herhaalde metingen), ditmaal
uitgebreid met een interactie term tussen een lineaire tijdstrend en de individuele
ziekenhuizen, wordt uitgevoerd om ziekenhuizen met een abnormaal codeergedrag te
identificeren. Meer precies vergelijken we de “slope” van de tijdstrend van elk ziekenhuis
met die van alle ziekenhuizen (de “nationale trend”) door middel van lineaire
contrasten.117;427;436 Ook deden we beroep op de Mahalanobis437-440 afstand [een
probabilistische afstand tussen twee punten (t.t.z. rekening houdend met verschillen in
variantie en correlatie tussen twee variabelen) in een multivariate context], om “outlying”
ziekenhuizen op te sporen. De Mahalanobis-afstand is verwant met een z score [z = (x-
μ)/σ] in het kwadraat, waarbij x de waarde voor het bestudeerde ziekenhuis is, μ de
gemiddelde ziekenhuiswaarde en σ de standaardafwijking van de ziekenhuiswaarden.
In geval van een categorische antwoordvariabele maken we gebruik van de logistische
regressie waarbij de ratio van het aantal gevallen / aantal verblijven, de antwoordvariabele
vormt en waarbij de tijdsevolutie wordt weergegeven door een variabele die het jaar of het
semester van de waarneming weergeeft. Ook hier wordt de tijdsevolutie in zijn geheel
geanalyseerd. Deze benadering laat verder de opsporing toe van eventueel afwijkende
ziekenhuizen door de interactie tussen tijdsevolutie en individueel ziekenhuis versus het
nationale gemiddelde na te gaan. De analyse gebeurt op “globale” indicatoren zoals
ligduur (LOS), Severity of Illness (SOI), Comorbiditeit, en outliers op gebied van
financiering (zie hoofdstuk 4).
De eerste twee onderdelen vormen samen de analyse op macroniveau.
3) In een derde onderdeel, het microniveau, gaan we gericht te werk. Indien een ziekenhuis
op macroniveau een outlier is, wordt zijn codeergedrag bestudeerd op een aantal
pathologieën, ingrepen of behandelingen, de zogenaamde “knipperlichten” waarvan
Hoofdstuk 3: Methodologische aspecten
144
aangenomen wordt dat zij zich gemakkelijk lenen tot lucratief overcoderen. Ook hiervoor
maken we gebruik van de logistische regressie met als bedoeling na te gaan of de globaal
afwijkende ziekenhuizen voor een bepaald knipperlicht een duidelijk afwijkend patroon
vertonen. In statistische termen wordt dit uitgedrukt door het nagaan van een significante
interactieterm tussen de tijdstrend en de individuele ziekenhuizen (via het gebruik van
contrasten). Bij de analyse dient er een correctie te gebeuren voor de tijdscorrelatie en
voor het meervoudig gelijktijdig toetsen (zie 3.3.3).313;438
3.1.2 Trend en interactie Elke modellering tracht een goede fit te bereiken en zo eenvoudig mogelijk de relatie
tussen de antwoordvariabele en het geheel van verklarende variabelen te beschrijven. Het
meest gewone voorbeeld van modellering is de lineaire regressie, waarvan de uitkomst
variabele verondersteld wordt continu te zijn.
Laten we trachten het begrip trend in deze regressiecontext te verduidelijken. Voor ieder
probleem, dat men aan de hand van regressietechnieken tracht op te lossen, vormt de
gemiddelde waarde van de uitkomstvariabele de “sleutelwaarde”. Deze waarde wordt het
“conditioneel gemiddelde” genoemd of de verwachte waarde van Y gegeven de waarde
van X. Ze wordt uitgedrukt als: E(Y|x)441. De lineariteit van een verklarende variabele laat
een eenvoudige interpretatie van het regressieprobleem toe: de toename met 1 eenheid van
X heeft een lineaire toename in Y als gevolg.
Indien Y dichotoom is, dan is E(Y|x) niet lineair maar S-vormig (Figuur 2, bovenste deel).
Onder dichotoom verstaan we hier de aanwezigheid van een uitkomst of niet: bvb.
overleden of niet, gezond of ziek. In het probleem dat ons nu bezig houdt gaan we na of
het aantal keren dat een fenomeen zich voordoet op dezelfde wijze in de tijd evolueert in
het geheel der ziekenhuizen. Bijvoorbeeld de per semester evolutie (de verklarende
variabele) van het aantal verblijven met als nevendiagnose septicemie (de
antwoordvariabele). Indien met een transformatie van de antwoordvariabele de linearisatie
van de tijdsvariabele kan bereikt worden, spreekt men van een lineaire tijdstrend en kan
deze tijdstrend tussen ziekenhuizen vergeleken worden door middel van de interactie
tussen tijdstrend en ziekenhuizen.442
40BHoofdstuk 3: Methodologische aspecten
145
De eventuele correlatie tussen zieken in een ziekenhuis en van ziekenhuizen over de tijd
uit zich in het fenomeen van de “overdispersion”443, waarbij de variabiliteit van de
gegevens groter is dan degene die voortvloeit uit de veronderstelde binomiale, Poisson of
normale verdeling. We corrigeren voor “overdispersion” door middel van de “rescaling”-
techniek (de standaardfouten gebruikt voor de testen worden vermenigvuldigd met een
factor die gelijk is aan de vierkantswortel van de ratio van de goodness-of-fit chi-kwadraat
en het aantal vrijheidsgraden)444.
Om een correcte beoordeling te maken van de tijdsevolutie in een bepaald ziekenhuis
vergeleken met die van het nationale gemiddelde gebruiken we contrasten.427;428;436;445-447
We trachten dit begrip aan de hand van een voorbeeld duidelijk te maken. Stel dat we vier
ziekenhuizen willen vergelijken. Het is mogelijk hieraan aangepaste hypothesetoetsen uit
te voeren door een L vector te specificeren voor het toetsen van de hypothese Lβ = 0, die
aangeeft dat de trends van de bestudeerde ziekenhuizen niet verschillen. In een eerste stap
vergelijken we de trend van ziekenhuis 1 (ZH1 in figuur 1) met de gemiddelde trend van de
vier ziekenhuizen (H1, H2, H3, H4). De nul hypothese wordt dan:
1β1 + 1β2 + 1β3 + 1β4 H0: 1β1 = ---------------------------
4
waarbij βi de trend is voor ziekenhuis i.
We herhalen dit procédé voor alle ziekenhuizen en uiteindelijk wordt de matrix van
contrasten gefit in de logistische regressie.
Om te kunnen besluiten of een ziekenhuis een significant afwijkende trend heeft, gaan we
na of de interactie term tussen trend en ziekenhuis significant is. Hiervoor “contrasteren”
we op de hierboven beschreven manier de trend van een ziekenhuis versus de nationale
trend. Interactie betekent in deze context een niet parallel verloop van de trend van een of
meerdere ziekenhuizen met die van het nationale gemiddelde. In figuur 1 vertonen
ziekenhuizen drie (ZH3) en vier (ZH4) onderling een significante interactie en ook met de
Hoofdstuk 3: Methodologische aspecten
146
ziekenhuizen 1 (ZH1) en 2 (ZH2). De trends van de ziekenhuizen één en twee verlopen
daarentegen parallel, wat interactie uitsluit.
Bij opsporing van mogelijke fraude via de knipperlichten gaat de aandacht naar de
“stijgers” of “dalers”, zoals ziekenhuis 3 op de grafiek. Een “stijger” of “daler” kan zowel
een ziekenhuis zijn dat van onder-codering evolueert naar correcte codering als een
ziekenhuis dat evolueert naar up-coding of creep, of dat meer en meer zwaardere
pathologieën aantrekt. Alleen de audit kan bepalen of het een geval van up-coding is of
niet.
Figuur 1: Interziekenhuis verschillen in evolutie van een cijfer in de tijd: interactie
Interactie
0
10
20
30
40
50
60
70
80
Jaar 1 Jaar 2 Jaar 3 Jaar 4
Evolutie in de tijd
Rat
e (%
)
ZH1 ZH2 ZH3 ZH4
3.1.3 Interpretatie van een odds ratio bij interactie van een trend en een categorische variabele Zoals hoger vermeld is de antwoordvariabele in de logistische regressie binair, ligt E(Y|x),
het conditionele gemiddelde, tussen 0 en 1 en heeft een S-vorm (Figuur 2, bovenste deel).
Dit betekent dat de verandering in E(Y|x) per eenheid verandering in x progressief kleiner
40BHoofdstuk 3: Methodologische aspecten
147
wordt naarmate het conditioneel gemiddelde de waarden 0 of 1 benadert.441 Dit laat, in
tegenstelling met de lineaire regressie, geen eenvoudige interpretatie toe van een toename
met een eenheid in X van een continue verklarende variabele, die een toename met een
vaste grootte in Y ten gevolge heeft.
Om aan dit euvel te verhelpen en deze eenvoudige interpretatie mogelijk te maken, wordt
een logit transformatie toegepast. De verklarende variabelen worden omgevormd tot logits.
Laten we om de notatie te vereenvoudigen de gezochte E(Y|x) in de logistische distributie
voorstellen als π(x), met
exp(ß0 + ß1x) π(x) = -------------------------
1+exp( ß0 + ß1x)
De logit transformatie van π(x), weergegeven als
π(x) g(x) = ln ---------- = ß0 + ß1x, 1- π(x]
maakt de S vorm lineair (Figuur 2, onderste deel).
Noteren we dat de logit,
π(x) logit = ln ---------- , 1- π(x]
π(x) waarvan ---------- 1- π(x]
de ziekte odds aangeeft, ook de log odds genoemd wordt.448
Hoofdstuk 3: Methodologische aspecten
148
In zijn eenvoudigste vorm, waar de verklarende variabele, x, gecodeerd wordt als nul of
een, is
π(x) π (1) / [1- π (1)] ---------- = --------------------- 1- π(x] π (0) / [1- π (0)]
waar π (1) / [1- π (1)], de “odds”, de kans is van een ziekte te hebben over de kans ze niet
te hebben in aanwezigheid van een bepaalde karakteristiek en π (0) / [1- π (0)] dezelfde
odds is, maar dan in afwezigheid van die karakteristiek. De logit transformatie wordt
doorgevoerd in de logistische regressie.
Laten we nogmaals veronderstellen dat de verklarende variabele, x, gecodeerd wordt als
nul of een. Het verschil in de logit van een bepaald ziekenhuis (met x = 1) en de logit van
het geheel der ziekenhuizen (met x = 0) is
g(1)-g(0) = (ß0 + ß1) - (ß0) = ß1.
Dit verschil in logits is, na het nemen van het antilogaritme, gelijk aan de “odds ratio”
(OR), een gekende associatiemaat:
OR = exp ln [π 1/(1- π 1)] – ln [ π 0/(1- π 0)] = exp[(β0+β1) -β0] = exp(β1).
De odds ratio (OR) wordt vaak gebruikt in de epidemiologie (Tabel 1) omdat ze
benaderend aangeeft hoe veel meer (on)waarschijnlijk het is dat een uitkomst aanwezig is
bij iemand waar X = 1 (blootstelling aanwezig) dan waar X = 0 (blootstelling niet
aanwezig). Zij is gelijk aan A x D / C x B. Een eenvoudige schatter van de standaardfout
van de log-odds ratio is de vierkantswortel van 1/A +1/B +1/C +1/D, die, na het nemen
van het antilogaritme, kan gebruikt worden als standaardfout voor de odds ratio.449Deze
standaardfout laat toe een betrouwbaarheidsinterval te berekenen en tevens de probabiliteit
bij een Wald toets voor het toetsen van de hypotheses dat de odds ratio al dan niet gelijk is
aan één. Noteren we dat een OR=1 aangeeft dat blootstelling geen effect heeft.
Passen wij de odds ratio meer specifiek toe in een audit context (Tabel 1, sectie b) dan
wordt het voorkomen van een verblijf, met als nevendiagnose knipperlicht Y, in een
40BHoofdstuk 3: Methodologische aspecten
149
bepaald ziekenhuis Z vergeleken met het voorkomen van een gelijkaardig verblijf in het
geheel van de Belgische ziekenhuizen tijdens het jaar A.
Tabel 1: De odds ratio in zijn epidemiologische en audit context.
A) EPIDEMIOLOGISCHE CONTEXT B) AUDIT CONTEXT
Blootstelling Totaal Ziekenhuizen Totaal
X=1 X=0 ZH Alle ZH
Y=1 A B A+B + A B A+B Uitkomst
Y=0 C D C+D
Knipperlicht
- C D C+D
Totaal A+C B+D N Totaal A+C B+D N
Hoe wordt dan een odds ratio geïnterpreteerd in geval van een interactie van een trend (X),
een continue variabele, en een categorische variabele(F)?
De logistische regressie drukt de twee categorieën van de verklarende variabele (het
bestudeerde ziekenhuis versus alle ziekenhuizen) als een log-odds ratio uit. Deze log- odds
ratio is niet constant in het verloop van de tijd maar moet met een factor vermenigvuldigd
worden om de gezochte log-odds te bekomen voor jaar A+1. Deze factor echter is wel
constant - vandaar de naam (lineaire) trend – tenminste zolang we met de log-odds ratio
werken, maar is niet langer constant wanneer we de antilog nemen om de odds ratio te
bekomen. De geïnteresseerde lezer wordt naar het boek van Hosmer en Lemeshow
verwezen voor de volledige details van deze modellering.442
Hoofdstuk 3: Methodologische aspecten
150
Figuur 2: CHD prevalentie per leeftijdsgroep uitgedrukt als een proportie en als een log-
odds ratio
Bron: Hosmer en Lemmshow441
40BHoofdstuk 3: Methodologische aspecten
151
In essentie stellen deze auteurs volgende drie-stappen procedure voor om tot de gewenste
odds ratio te komen:
1) g(f1,x) = ß0 + ß1f1+ß2x+ß3f1*x , en
g(f0,x) = ß0 + ß1f0+ß2x+ß3f0*x
bepaal de log-odds ratio door hun verschil te berekenen
2) log OR = ß1(f1-f0) + ß3x (f1-f0)
exponentieer de log-odds ratio
3) OR= exp[ß1(f1-f0) + ß3x (f1-f0)]
Als de risicofactor F dichotoom is en we nemen aan dat f1=1 en f0=0, dan herleidt de
formule zich tot:
ln[OR(F=1,F=0,X=x)] = ß1+ß3x.
Dit is het geval in onze studie, vermits we een ziekenhuis (F=1) vergelijken met het geheel
der Belgische ziekenhuizen (F=0). Omdat we de case mix van de ziekenhuizen
onvoldoende kennen, zijn we voornamelijk geïnteresseerd in de evolutie van de odds ratio
en minder in zijn werkelijke waarde. Wij spitsen dan ook onze aandacht toe op ß3x, de
evolutie in de tijd van de log-odds ratio (de trend) van een specifiek ziekenhuis en
identificeren outliers in functie van hun trend.
De interpretatie van een odds ratio (OR) bij interactie van een trend en een categorische
variabele illustreren we aan de hand van volgend voorbeeld, overgenomen uit het
gerefereerde boek (Figuur 3).442 In deze studie wordt het verband bestudeerd tussen het
gewicht (< 50 kg of ≥ 50kg), de categorische variabele (F), en de leeftijd van de moeder,
de continue variabele, op het geboortegewicht van haar kind, de dichotome
uitkomstvariabele [aanwezigheid van een laag geboortegewicht (LBW) of niet]. Het
model LBW= F + X + F*x wordt gefit met als resultaat: intercept (β0 = 0,744), gewicht
van de moeder minder dan 50 kg (β1 = -1,9444), leeftijd van de moeder (β2 = -0,080), en
interactie laag gewicht van de moeder en leeftijd van de moeder (β3x = 0,132). Wanneer
we ln [OR(F=1,F=0, X=x)] = β1 + β3x exponentiëren komen we tot een OR van1,04 op de
leeftijd van 15 jaar, van 2,01 op de leeftijd van 20 jaar, van 3,90 op de leeftijd van 25 jaar,
Hoofdstuk 3: Methodologische aspecten
152
en van 7,55 op de leeftijd van 30 jaar. Uit figuur 3, waarin de neperiaanse logaritme van de
odds ratio (lnOR) en de OR worden weergegeven, blijkt duidelijk dat de log-odds ratio van
de interactie gewicht en leeftijd van de moeder op het geboortewicht van het kind lineair is
maar niet de OR.
Vertaald naar onze setting van detectie van over-codering of onder-codering is het
ziekenhuis de categorische variabele (F) en de semestriële trend de continue variabele.
Figuur 3: Effect van gewicht (< 50kg) en leeftijd van de moeder op laag geboortegewicht
0
1
2
3
4
5
6
7
8
15 jaar 20 jaar 25 jaar 30 jaar
Ln(OR) OR
3.1.4. Steekproefgrootte voor de knipperlichten
3.1.4.1 Principe van de berekening De overheid neemt aan dat het verschil tussen auditeur en geauditeerde tenminste 5% moet
bedragen (het “toegelaten verschil”) vooraleer men frauduleus coderen kan
veronderstellen. Het minimum aantal onenigheden, nodig om fraude te laten vermoeden,
kan dan als volgt bepaald worden. Men berekent het 95% betrouwbaarheidsinterval van de
proportie van verblijven waarvan de ondergrens groter is dan, maar tevens zo kort
mogelijk de grens van de toegelaten verschilmarge benadert155. Indien men in het kader
van een audit op knipperlichten bijvoorbeeld 60 verblijven nakijkt moeten er tenminste 7
onenigheden vastgesteld worden vooraleer men fraude kan veronderstellen. Indien men 70
verblijven nakijkt bedraagt dit aantal 8 (zie tabel 2).
40BHoofdstuk 3: Methodologische aspecten
153
Voor zover de theorie wanneer het aantal beschikbare verblijven waaruit de steekproef
getrokken wordt als oneindig (bvb. 500 of meer) beschouwd kan worden. Wanneer de
steekproef getrokken wordt uit een eindig aantal verblijven dan gaat deze benadering niet
meer op en dient in de formule van het betrouwbaarheidsinterval een correctie aan de
standaardfout aangebracht te worden. Immers, hoe meer de steekproef het totaal aantal
beschikbare verblijven benadert, hoe minder variabiliteit er bestaat bij het schatten van de
te verwachten proportie. In dergelijke gevallen gebruikt men een ‘finite population
correction’, met name door de standaardfout te vermenigvuldigen met √ ((N- n)/N), de
‘sampling fraction’, waarbij n de steekproefgrootte is en N het aantal verblijven met het
knipperlicht waaruit de steekproef getrokken wordt.450 Stel n=N dan wordt de
correctiefactor gelijk aan 0 en is er geen variabiliteit meer. Indien we bvb. een ‘steekproef’
van 80 verblijven hebben uit 80 verblijven met de knipperlichtcode, dan wordt de
toegelaten marge van 5% of 4 verblijven overschreden wanneer er bij 5 verblijven geen
elementen gevonden worden om deze diagnose te verrechtvaardigen.
3.1.4.2 Berekening van het aantal onvoldoend gemotiveerde verblijven nodig om tot een waarschijnlijke fraude te kunnen besluiten
Stel n = het aantal te controleren verblijven (de steekproefgrootte); N = het aantal
verblijven met het knipperlicht waaruit de steekproef getrokken wordt; y = het aantal
onvoldoend gemotiveerde verblijven nodig om tot een waarschijnlijke fraude te kunnen
besluiten; P= de proportie van onvoldoend gemotiveerde verblijven; PL = de ondergrens
van het 95% betrouwbaarheidsinterval van P, die groter is dan de toegelaten proportie
(5%) en tevens de toegelaten proportie zo kort mogelijk benadert.
- Indien ((N-n)/N) groter dan of gelijk is aan 0.9, dan verloopt de berekening451 van PL,
als volgt:
(2*n*P)+ ((CI²)-1)-A)
PL= ----------------------------------
2*(n+(CI²))
Hoofdstuk 3: Methodologische aspecten
154
Waar: CI=1.96 (95% betrouwbaarheidsinterval); P=y/n; q=1-P; A=CI*(√((CI²)-
(2+(1/n))+(4*P*((n*q)+1))))
Aan de hand van deze formule werd tabel 1 opgesteld.
- Indien het aantal beschikbare verblijven klein is en met name indien ((N-n)/N) kleiner is
dan 0.9 wordt de formule voor het bepalen van de PL als volgt aangepast:
(2*n*P)+(CI²)*((N-n)/N)-1)-A PL = ---------------------------------------
2*(n+(CI²)*(N-n)/N)
Waar CI=1.96 (95% BI); P=y/n; q=1-P; A=CI*√((N-n)/N)*(√((CI²)*((N-n)/N)-2
+(1/n))+(4*P*((n*q)+1)))) ;
Indien men in het kader van een audit op knipperlichten bijvoorbeeld 60 verblijven nakijkt
uit 1000 beschikbare verblijven met dat knipperlicht, dan is ((N-n)/N) groter dan 0.9 en
moeten er tenminste 7 onenigheden vastgesteld worden vooraleer men fraude kan
veronderstellen. Indien men 70 verblijven nakijkt bedraagt dit aantal 8. Indien men uit 80
beschikbare verblijven 70 verblijven nakijkt dan is ((N-n)/N) kleiner dan 0.9 en bedraagt
dit aantal 6.
40BHoofdstuk 3: Methodologische aspecten
155
Tabel 2: Minimum aantal verblijven nodig om een waarschijnlijke fraude op te sporen.
n Y P PL
30 5 .1667 .0630
35 5 .1429 .0538
40 6 .1500 .0625
45 6 .1333 .0554
50 7 .1400 .0628
55 7 .1273 .0569
60 7 .1167 .0521
65 8 .1231 .0584
70 8 .1143 .0541
75 8 .1067 .0505
80 9 .1125 .0559
85 9 .1059 .0526
90 10 .1111 .0575
95 10 .1053 .0544
100 10 .1000 .0516
n = aantal te controleren verblijven; y = aantal onvoldoende gemotiveerde verblijven nodig om tot een waarschijnlijke fraude te kunnen besluiten; P= proportie van onvoldoend gemotiveerde verblijven; PL = ondergrens van het 95% betrouwbaarheidsinterval van P, die groter is dan de toegelaten proportie en de toegelaten proportie zo kort mogelijk benadert.
Hoofdstuk 3: Methodologische aspecten
156
3.2 STATISTISCHE AANDACHTSPUNTEN BIJ HET OMGAAN MET EN RAPPORTEREN VAN
KWALITEITSGEGEVENS: KLEINE AANTALLEN, CORRELATIE, CASE MIX VARIATIE EN
MEERVOUDIG GELIJKTIJDIG TOETSEN.
De analyse en de rapportering van kwaliteitsmetingen blijven een belangrijke
uitdaging.104;452 De consument verwacht van kwaliteitsmeting onder meer een antwoord op
de vraag of de “uitkomst” er anders zou uitzien mocht hij in een andere eenheid behandeld
geweest zijn.452 Derhalve zouden verschillen tussen zorgeenheden te wijten aan verschillen
in patiëntenkarakteristieken en niet aan reële verschillen tussen zorgeenheden uit de
vergelijking moeten “verwijderd” worden.452 Directe en indirecte standaardisatie komen
hiervoor niet in aanmerking omwille van het zeer beperkt aantal variabelen waarvoor zij
kunnen corrigeren en omwille van de moeilijk te vervullen voorwaarden voor een niet-
vertekende toepassing: een gelijkaardige bevolkingsverdeling bij de te vergelijken
zorgeenheden en constante risicoverhouding.155;452-454
Aanvankelijk werden niet-adequaat risicogecorrigeerde sterfteresultaten vrijgegeven wat
tot verhitte discussies aanleiding gaf. Derhalve werden er talrijke statistische modellen
ontwikkeld om aan dit euvel te verhelpen.104;163;188;359;392;452;455 Het gaat hierbij typisch over
een schatting van de waarschijnlijkheid van een postoperatief sterfgeval op individueel
patiëntenniveau, gevolgd door aggregatie op ziekenhuis- of artsenniveau, waarbij het
aantal vastgestelde sterfgevallen vergeleken wordt met het te verwachten, gevolgd door
een outlier-status bepaling.392 De resultaten van deze oefening worden dan gepubliceerd392
onder vorm van “report cards” in de US of “league tables” in het UK, die we in een
Belgische context het best benaderen met het woord “profielen” (Zie hoofdstuk 2.4.1).
De gesofisticeerde statistische modellen (logistische regressie) waarop deze bepalingen in
de US steunden, benevens de precisiegraad waarmee zij publiekelijk gerapporteerd werden
zoals bijvoorbeeld in Pennsylvanië315;414, verleenden aan deze profielen een overdreven
aura van wetenschappelijke nauwkeurigheid.392 In werkelijkheid zijn de beschikbare
gegevens en methodes niet volmaakt, zijn ze onderhevig aan uiteenlopende interpretaties
en zijn ze vaak te technisch om voor de gewone leek volledig vatbaar te zijn.392
40BHoofdstuk 3: Methodologische aspecten
157
Belangrijke redenen voor bekommernis zijn: 1) de inherente beperkingen van risico-
predictie modellen op patiëntenniveau, 2) het onvermogen van profielen om de statistische
onzekerheid van hun resultaten voldoende en adequaat weer te geven, 3) het gelijktijdig
meervoudig toetsen, 4) het geen rekening houden met correlatie binnen zorgeenheden en
over de tijd, en 5) het gebruik van niet-adequate maatstaven en
risicocorrectie.275;283;313;392;423;456
Logistische regressie modellen op patiëntenniveau – maar ook Bayesiaanse of neurale
netwerken - berusten op een niet-exacte benadering van de complexiteit van biologische
processen.392;423 Niet-verklaarde variatie is in belangrijke mate aanwezig omwille van
risicofactoren die niet werden opgenomen in het risicoalgoritme of omwille van het
herleiden van complexe ziektetoestanden tot dichotome of discrete variabelen met een
verlies aan predictief vermogen.191;289;392;423;457
Ook de performance van deze modellen is niet maximaal. Hun discriminatoir vermogen
kan bijvoorbeeld als goed bestempeld worden maar niet als perfect: typisch ligt de C-index
voor CABG-sterfte in een spreidingsbreedte van 0,76 tot 0,82 wat kan leiden tot een niet-
correcte risicobepaling voor vele patiënten. Ongekende predictoren zijn hiervoor de
waarschijnlijke verklaring.392 Gegeven de argwaan van artsen ten aanzien van de gebruikte
risicocorrecties274 leek het geraadzaam hen eraan te herinneren dat statistische modellen
even goed of zelfs beter zijn in het voorspellen van uitkomsten dan klinische experts.289
Vermits het aantonen van variabiliteit tussen zorgverleners en het bepalen van outliers de
hoofdbedoelingen zijn van profielen, dient met de verschillende componenten van de
variabiliteit rekening gehouden te worden. Variabiliteit tussen zorgverleners kan
voortspruiten uit 1) systematische patiëntenverschillen ten gevolge van gemeten of
ongemeten co-morbiditeit, 2) stochastische variabiliteit, of 3) werkelijke verschillen in
zorgenkwaliteit. Meestal echter werd, voor het opstellen van profielen, een logistische
regressie, die geen rekening houdt met correlatie, gebruikt met als gevolg een
overschatting van systematische verschillen en een onderschatting van stochastische
variatie (extra-binomiale of extra-Poisson variatie399;443;444;458).275;392;423;459
Alleen wanneer de steekproeven groot genoeg zijn om de standaard fouten van de intra-
unit variabiliteit verwaarloosbaar te maken t.o.v. de inter-unit variabiliteit is deze
Hoofdstuk 3: Methodologische aspecten
158
vertekening verwaarloosbaar. Maar dit is niet vaak het geval bij profielen, zeker wanneer
het over mortaliteit gaat.459
Een longitudinale benadering kan de intra-unit variabiliteit grotendeels opvangen én de
temporele evolutie weergeven.287;319;401;455 Ook bij deze benadering blijft een hiërarchische
modellering verkieselijk omdat op die manier rekening wordt gehouden met de
hiërarchische structuur, wat leidt tot meer precieze schatters.401;430
Derhalve vergen deze twee problemen: kleine aantallen en variabiliteit een speciale
aandacht. Kleine aantallen (ie met een verwachte frequentie van minder dan 10)423, een
vaak voorkomend gegeven bij sterfte318;459, vormen een probleem i.v.m. de bepaling van
betrouwbaarheidsintervallen. Hierbij gaat de vaak gebruikte benadering van de Poisson
verdelingen door de normaal verdeling niet op - met voornamelijk vals positieve outliers
bij de hoge mortaliteitscijfers – maar is de exacte bepaling van de
betrouwbaarheidsintervallen noodzakelijk.156;275;392;423;460;461 Verder is het gemiddeld
sterftecijfer niet de beste schatter van het “echt” onderliggend sterftecijfer maar wel de
“gekrompen” (“shrunken”) schatter bekomen via een hiërarchisch model.392;423
Daarenboven is de patiënt de eenheid van analyse in de gebruikte modellen en is de
eenheid van inferentie de zorgenverstrekker. Hoe geëigend zijn deze geaggregeerde
kengetallen? Als we wensen een onderscheid te maken tussen intrazorgverlener en
interzorgverlener variabiliteit, die zowel stochastische als systematische componenten
bevat, is dit onmogelijk door middel van de vaak gebruikte logistische regressie, die
hiermee geen rekening houdt. Hiërarchische of multilevel modellen daarentegen corrigeren
voor verschillen in steekproefgrootte door middel van shrinkage schatters, houden
rekening met clustering van de gegevens, maken op een adequate manier het onderscheid
tussen intra- en interzorgverlener variabiliteit, verhinderen het optreden van een
regression-to-the-mean462-466 vertekening, laten toe performance te toetsen aan medisch,
sociaal en economisch relevante standaarden (met waarden van het
betrouwbaarheidsinterval die substandaard en voorbeeldige zorg weerspiegelen) en kunnen
– in tegenstelling met de logistische regressie - in staat blijken in grote mate het probleem
te corrigeren van het meervoudig gelijktijdig toetsen, inherent aan
profileringen.76;104;275;286;392;423;425;428;430;452;459;467;468
40BHoofdstuk 3: Methodologische aspecten
159
Het probleem van het meervoudig gelijktijdig toetsen doet zich voor wanneer men
verschillende zorgverleners gaat vergelijken met een standaard. Past men voor één
vergelijking het klassieke 95%-betrouwbaarheidsinterval toe dan bedraagt de probabiliteit
van één vals alarm 5 op 100. Maar wanneer men twintig vergelijkingen maakt bedraagt de
kans op minstens één vals alarm 1- (1-.05)N of .642.469
Om de inflatie van fout positieven tegen te gaan bestaan er verschillende methodes die
gebaseerd zijn op de Bonferroni-procedure117;417;470-473, die er benaderend in bestaat de alfa
van het significantieniveau (gewoonlijk 0,05) te delen door het aantal toetsen dat men
wenst uit te voeren, wat echter een zeer conservatieve techniek is. Deze benadering is erop
gericht te behoeden voor een type I fout of het onterecht verwerpen van de nul hypothese,
maar de prijs die hiervoor betaald wordt is de type II fout, het onterecht niet verwerpen van
de nul hypothese, of zoals Rothman het formuleert: “Loont het de moeite de fout
positieven te doen dalen ten koste van een stijging van de fout negatieven?”473
Verder is het zo dat een Bonferroni-correctie de gelijktijdige vergelijkingen als
onafhankelijk van elkaar beschouwt wat tot een veel te conservatieve test leidt indien de
set vergelijkingen met elkaar gecorreleerd zijn.474-476 Het is daarom raadzaam beroep te
doen op minder conservatieve verfijningen op de Bonferroni zoals die van Holm en
Hochberg.477-480 Het is echter mogelijk door middel van bootstrap- en
permutatietechnieken, toegankelijk gemaakt voor een breder publiek via de MULTTEST
procedure van SAS481, rekening te houden met correlaties. Deze technieken zijn
alternatieven voor de Bonferroni-correctie en de erop geïnspireerde technieken.
Hoofdstuk 3: Methodologische aspecten
160
3.3 METHODEN VOOR HET BEOORDELEN VAN KWALITEIT/PERFORMANCE
“The desire of health care payers for simple measures of hospital performance, conflicts
with the skepticism of health care providers about the validity and fairness of the
assessment process” 313
3.3.1 Rangorde, een aantrekkelijke maar vaak misleidende methode Op het eerste zicht lijkt het toekennen van een rang of “ranking” een aantrekkelijke
vergelijkingsmethode.394 Toch hebben we ze niet weerhouden. Rangen van instellingen
zijn uiterst onbetrouwbare statistische samenvattingen van performance en het is mogelijk
dat instellingen met kleinere aantallen gevallen ten onrechte “gestraft” of “beloond”
worden bij vergelijkingsoefeningen, waar aan de hand van bijkomende statistische analyse
het mogelijk kan zijn om de enkele instellingen te identificeren waarvoor verder onderzoek
de moeite loont. Verder zou elke puntschatter van een performance indicator altijd
vergezeld moeten zijn van een geassocieerde statistische maat van onzekerheid
(betrouwbaarheidsinterval) te wijten aan de steekproefvariabiliteit (“sampling
variability”).396
Het gerefereerde artikel396 gebruikt hiervoor de analyse van het succescijfer van klinieken,
die in vitro fertilisatie aanbieden, als een mooi voorbeeld (Figuur 1).
Figuur 1: Geschat cijfer van levende geboorten : mediaan en 95% BI van de rang van elk
ziekenhuis.
Bron: Marshall EC396
40BHoofdstuk 3: Methodologische aspecten
161
“Why use league tables at all? The main advantage is that they are easy to read. One can
see at a glance who is at the top and who is at the bottom. But if the information is both
high impact and misleading, poor decisions are made and the source loses credibility.”395
Vermits er bij het opstellen van profielen er steeds een “eerste” en een “laatste” is, ook al
is het verschil klinisch en of statistisch niet significant, kan dit, zeker indien er geen
rekening gehouden wordt met de case mix, een ziekenhuis of een arts ten onrechte
stigmatiseren.77;191;296;394;395;405;407;411
3.3.2. Schatting van het relatieve risico (RR) door middel van een logistische regressie In plaats van rangen toe te kennen, trachten we een methode uit te werken waarbij
kwaliteit centraal staat en die met standaard statistische software, routinematig uitgevoerd
kan worden. We trachten daarbij in eerste instantie een benchmark voor goede kwaliteit te
bepalen en ziekenhuizen met belangrijke kwaliteitsproblemen op te sporen, om hen, indien
de kwaliteit inderdaad ondermaats blijkt te zijn, te stimuleren de kwaliteit te verbeteren.
Onze aandacht gaat derhalve voornamelijk uit naar het identificeren van zowel
bovenmaatse als ondermaatse kwaliteit, m.a.w. naar outliers.
Vermits we alle Belgische ziekenhuizen daarop onderzoeken, doen we beroep op
zogenaamde fixed effects modellen en, omwille van de categorische antwoordvariabele, op
de logistische regressie. Zoals in sectie 3.1.1 vermeld, staat de theorie voor het bepalen van
outliers in linear mixed models overigens nog niet vast en is GEE hiervoor niet bedoeld.
Non-linear mixed models komen zeker niet in aanmerking omdat hier geen outliers kunnen
bepaald worden.
De logistische regressie is een elegante methode maar houdt geen rekening met correlatie
van de gegevens - hiervoor corrigeren we echter door “rescaling” (zie 3.1.2) - en kent ook
gemakkelijker een outlier status toe aan de hoogste waarden van de verdeling.275;392;461
Voor de resultaten op nationaal niveau voeren we naast de logistische regressie ook
analyses uit van het type Generalized Estimating Equations (GEE) 431;482-484 , die wel
rekening houden met correlatie van de gegevens.
Hoofdstuk 3: Methodologische aspecten
162
Verder wordt er met de andere in 3.2 vermelde aandachtspunten zoveel mogelijk rekening
gehouden: we kozen eerst prioritaire problemen (belangrijke incidentie) als indicatoren en
doen omwille van de onvolmaakte risicocorrectie (zie voorbeeld hieronder) geen
uitspraken maar spreken van “screening”. Verder corrigeren we voor meervoudig
gelijktijdig toetsen door middel van de Bonferroni-correctie en verstrekken een anonieme
feedback aan de ziekenhuizen, Artsencolleges en het centrale beleid. Ook geven we de
graad van de bestaande evidentie aan en bieden hulp aan voor de interpretatie (sectie
3.3.6). Rekening houdend met de problemen van accuratesse en volledigheid van
administratieve gegevens, bepalen we daarenboven een zone van niet-interpretatie.100
In een optiek van het bepalen van een eerste benchmark (de bovenmaatse kwaliteit) en
vermits dit de eerste analyses zijn, trachten we verder zoveel mogelijk het voorkomen van
vals positieven te vermijden en gebruiken daarvoor de meest conservatieve techniek, de
Bonferroni-correctie.
Het is verder zo dat deze eerste, “data-driven” benchmark dient gezien te worden als een
eventueel beter vergelijkingspunt dan het nationale periodecijfer of trend in termen van
identificatie van ondermaatse kwaliteit en zelfevaluatie voor de ziekenhuizen.485 De keuze
van de uiteindelijk te gebruiken benchmark zal in overleg met de sector moeten gebeuren
in functie van wat haalbaar en wenselijk lijkt.485Benchmarks zoals het gemiddelde van de
beste performance voor tenminste 10 %van de bevolking werden voorgesteld.485
Door middel van de logistische regressie gaan we na of er in ziekenhuis ‘A’ een groter
risico bestaat op een mindere behandeling dan in het geheel der ziekenhuizen ‘A-Z’. We
illustreren dit aan de hand van het sterftecijfer van een hersenbloeding (Tabel 1). In
ziekenhuis ‘A’ sterven er 10 van de 100 patiënten met een hersenbloeding. Voor het geheel
der ziekenhuizen ‘A-Z’ is dit 100 op 2000.
40BHoofdstuk 3: Methodologische aspecten
163
Tabel 1: Relatief risico en odds ratio voor een overlijden t.g.v. een hersenbloeding in ziekenhuis A vergeleken met het geheel der ziekenhuizen Uitkomst Ziekenhuizen Totaal Uitkomst Ziekenhuizen Totaal
ZH ‘A’ ZH ‘A-Z’ ZH ‘A’ ZH ‘A-Z’
Dood A B A+B Dood 10 100 110
Levend C D C+D Levend 90 1900 1990
Totaal A+C B+D N Totaal 100 2000 2100
Hier kan het relatief risico (RR) gemakkelijk als volgt berekend worden:
1) berekenen van het sterftecijfer: 10/100 = 10% voor ZH ‘A’ en 100/2000 = 5%
voor het geheel der ziekenhuizen ‘A-Z’,
2) de ratio berekenen van deze cijfers = RR = 2.
In deze tabel wordt het relatief risico (RR) als volgt berekend: RR= (A/A+C)/(B/B+D) en
de odds ratio (OR) als: OR= (A/C)/(B/D).
Indien men nu rekening wenst te houden met ernst en co-morbiditeit is deze eenvoudige
methode niet langer mogelijk en maakt men gebruik van de logistische regressie, die het
RR schat via de OR. Deze is gelijk aan (A/C)/(B/D), - in ons voorbeeld OR = 2.11 - een
overschatting van het werkelijke relatief risico. Zolang het gezondheidsverschijnsel dat we
bestuderen relatief klein is (t.t.z. < 10%, bijvoorbeeld mortaliteit) en de 0.5 <OR< 2.5, is
de odds ratio een goede tot behoorlijke schatter van het gezochte relatief risico.
In de andere gevallen schatten we het RR, vertrekkend van de resultaten van de logistische
regressie via de formule RRZ= OR/(1-P0)+(P0*OR)), waarbij P0 staat voor de bestudeerde
uitkomst in de niet-blootgestelde groep, in ons voorbeeld respectievelijk mortaliteit en ZH
‘A-Z’.486 95% betrouwbaarheidsintervallen kunnen berekend worden en bedragen
respectievelijk 1.08, de ondergrens, en 3.21, de bovengrens, voor het RRZ en 1.00 en 4.33
voor de OR.486
Hoofdstuk 3: Methodologische aspecten
164
Deze betrouwbaarheidsintervallen geven de mate van onzekerheid aan in de schatting van
de RRZ of OR.487 en laten toe vast te stellen hoe groot het effect, de RRZ of OR, is - het
belangrijkste aandachtspunt - en of het al dan niet statistisch significant is.
Een ondergrens ≥ 1 geeft aan dat de RRZ/OR groter is in ZH ‘A’ dan in de andere
ziekenhuizen, en een bovengrens ≤ 1 geeft het omgekeerde aan.
Een betrouwbaarheidsinterval biedt overigens bescherming tegen de misinterpretatie van
niet-significante resultaten in kleine studies, waar door onvoldoende statistische power een
werkelijk effect niet aangetoond kan worden.488;489 Daarentegen geeft een p-waarde alleen
aan of een bevinding statistisch significant is of niet, en geeft geen indicatie betreffende de
grootte van het bestudeerde effect, maar biedt anderzijds hulp om niet al te vlug een grote
puntschatter in kleine studies als belangrijk te gaan interpreteren. Vooraanstaande
tijdschriften zoals het “British Medical Journal”, “The Lancet”, het “American Journal of
Public Health”, en het “International Journal for Quality in Health Care” vragen dat de
voornaamste resultaten van een studie meegedeeld worden met
betrouwbaarheidsintervallen, en wordt deze zienswijze gedeeld door het “Committee of
Medical Journal Editors.”460;490 Een p-waarde kan vervolgens aan het
betrouwbaarheidsinterval toegevoegd worden. Wij berekenden hiervoor een Wald toets,
gebaseerd op RRZ en zijn standaard fout.441;491;492
Een Bayesiaanse aanpak is een interessant alternatief voor de hier voorgestelde methode.
3.3.3. Meervoudig gelijktijdig toetsen Wanneer we in een groep ziekenhuizen de performance van elk ziekenhuis vergelijken met
het gemiddelde van die ziekenhuizen, stelt zich het probleem van het meervoudig
gelijktijdig toetsen met als gevolg een sterke stijging van het aantal vals positieven (VP).
Om dit effect tegen te gaan passen we de Bonferroni-correctie313;474-476;480 toe, waarbij de
alfa van de gebruikte toets gedeeld wordt door het aantal gelijktijdige vergelijkingen, hier
het aantal ziekenhuizen. Het nadeel hiervan is het optreden van vals negatieven (VN) of
het ten onrechte niet vaststellen van een werkelijk verschil.
We verstrekken daarom twee types betrouwbaarheidsintervallen waarbinnen de
vermoedelijke performance van het ziekenhuis zich bevindt: een zeer ruim interval met
40BHoofdstuk 3: Methodologische aspecten
165
Bonferroni-correctie (weinig VP maar meer VN) dat moet toelaten ziekenhuizen met zeer
vermoedelijk bovenmaatse of ondermaatse kwaliteit te identificeren en een nauwer interval
zonder Bonferroni-correctie (minder VN maar meer VP) dat aangeeft dat er een kans
bestaat dat het ziekenhuis eerder ondermaats of bovenmaats presteert. Het ruime interval
(Bonferroni) dient tot een meer diepgaand onderzoek te leiden indien de puntschatter van
het betrouwbaarheidsinterval zich buiten de zone van niet-interpretatie bevindt (zie sectie
3.3.7). Het nauwere interval (95 % BI) tracht aan het ziekenhuis een gevoeliger
aanknopingspunt te verschaffen voor zelfanalyse en eventuele actie.
3.3.4 Risicocorrectie Bij het uitvoeren van de logistische regressie trachten we rekening te houden met de ernst
van de aandoening en co-morbiditeit (risicocorrectie).105 Volgende figuren illustreren dat
statistische significantie m.b.t. over- of ondermortaliteit ook functie is van de gebruikte
risicocorrectie. Wij presenteren hier de positieve of negatieve “afwijking” ( afwijking =
RRZ –1, uitgedrukt onder vorm van een percentage) van de ziekenhuizen t.o.v. het
nationale gemiddelde. In deze figuren worden significant afwijkende ziekenhuizen
gevisualiseerd door de weergave van hun anoniem ziekenhuisnummer. Volgende
risicocorrecties werden doorgevoerd: figuur 2:geen; figuur 3: leeftijd en geslacht; figuur 4:
leeftijd, geslacht en severity of illness (SOI); figuur 5: leeftijd, geslacht en risk of mortality
(ROM); figuur 6: leeftijd, geslacht en Charlson’s comorbidity index, zoals toegepast door
D’Hoore (drie digit ICD-9-CM codes) (Tabel 2).325;326;493
Uit de figuren blijkt dat in functie van de gebruikte correctie de afwijking en eventueel de
significantie van de afwijking veranderen. Voor ZH 54 bijvoorbeeld bedraagt de afwijking
ongeveer + 110 indien er 1) geen risicocorrectie uitgevoerd wordt, of 2) er gecorrigeerd
wordt voor leeftijdsgroep en geslacht. In deze gevallen is de afwijking niet alleen
belangrijk wegens zijn omvang maar ook statistische significant na een Bonferroni
correctie. Daarentegen indien er gecorrigeerd wordt voor leeftijd, geslacht en 1) Severity
of Illness (SOI), of 2) Risk of Mortality (ROM), of 3) Charlson daalt de afwijking tot
ongeveer + 70 en is het niet langer significant bij Bonferroni correctie.
Voor ZH 77 zien we een omgekeerd beeld, behalve wanneer we corrigeren voor leeftijd,
geslacht en Charlson. Dit fenomeen van veranderende significanties gaat, bij toenemende
Hoofdstuk 3: Methodologische aspecten
166
risicocorrectie, vaak in de richting van een verminderende interziekenhuis
variabiliteit.101;189;329;331
Naast leeftijd en geslacht kozen we de Charlson comorbidity index voor de risicocorrectie
in deze studie. Deze index is gebaseerd op ICD-9-CM codes waarover we in de MKG
beschikken en houdt minder dan SOI en ROM rekening met verwikkelingen die optraden
tijdens het ziekenhuisverblijf. SOI en ROM kunnen dus eventueel mindere kwaliteit
reflecteren, hiervoor corrigeren leidt dan tot overadjustment.188;196;197;494
De risicocorrectie met de Charlson’s comorbidity index leidt in het heupfractuur voorbeeld
tot het verdwijnen van alle significantie t.o.v. het nationale gemiddelde. Dit neemt niet
weg dat er tussen ziekenhuizen significante verschillen bestaan: wanneer anoniem
ziekenhuis 45 als vergelijkingsbasis genomen wordt i.p.v. het nationale gemiddelde zijn er
11 ziekenhuizen die significant verschillen met p <0,0001 wat beduidend kleiner is dan de
Bonferroni-drempel van p =0,000439.
Figuur 2: Afwijking van de intramurale letaliteit (in %), per ziekenhuis, ten opzichte van het nationale gemiddelde na een opname voor heupfractuur, geen risicocorrectie.
40BHoofdstuk 3: Methodologische aspecten
167
Tabel 2: Charlson’s comorbidity index (naar D’Hoore)
Punten Nevendiagnosen ICD-9-CM codes
1 Myocardinfarct 410
Hartinsufficiëntie 398, 402, 428
Aandoeningen van de perifere
bloedvaten
440 – 447
Cerebro-vasculair accident 430 – 433, 435
Dementie 290, 291, 294
Chronische pulmonaire aandoeningen 491 – 493
Systeemziekten 710, 714, 725
Gastro-duodenaal ulcus 531 – 534
Minder ernstige leverziekten 571, 573
2 Hemiplegie 342, 434, 436, 437
Nierziekten 403, 404, 580 – 586
Diabetes 250
Tumoren 140-195
Leukemie 204 – 208
Lymfomen 200, 202, 203
3 Ernstige leverziekten 070, 570, 572
6 Metastasen 196 – 199
Voor een eerste analyse over performance / kwaliteitsindicatoren opteerden we er voor het
nationale gemiddelde als referentiepunt te nemen, dat later in het licht van de toetsing van
de screening aan de werkelijkheid aangepast kan worden.
Hoofdstuk 3: Methodologische aspecten
168
Figuur 3: Afwijking van de intramurale letaliteit (in %), per ziekenhuis, ten opzichte van het nationale gemiddelde na een opname voor heupfractuur, risicocorrectie voor leeftijd en geslacht.
Figuur 4: Afwijking van de intramurale letaliteit (in %), per ziekenhuis, ten opzichte van het nationale gemiddelde na een opname voor heupfractuur, risicocorrectie voor leeftijd, geslacht en SOI
40BHoofdstuk 3: Methodologische aspecten
169
Figuur 5: Afwijking van de intramurale letaliteit (in %), per ziekenhuis, t.o.v. het nationale gemiddelde na een opname voor heupfractuur, risicocorrectie voor leeftijd, geslacht en ROM
Figuur 6: Afwijking van de intramurale letaliteit (in %), per ziekenhuis, ten opzichte van het nationale gemiddelde na een opname voor heupfractuur, risicocorrectie voor leeftijd, geslacht en Charlson’s comorbidity index.
Hoofdstuk 3: Methodologische aspecten
170
3.3.5 Type van uitgevoerde analyses Bij de analyse van een indicator komen er twee aspecten aan bod: een periodeaspect en
een evolutie-over-de-tijd aspect (de trend).
Door middel van het periodeaspect gaan we na of er ziekenhuizen zijn, die over gans de
beschouwde periode samen genomen en vergeleken met al de andere ziekenhuizen
significant meer of minder processen of uitkomsten van een bepaald type uitvoeren
respectievelijk registreren.
Door middel van het evolutieaspect gaan we na of er ziekenhuizen zijn, die over de tijd
(per semester/jaar) en vergeleken met al de andere ziekenhuizen significant meer of minder
processen of uitkomsten van een bepaald type gaan uitvoeren of registreren. Het is niet
eenvoudig een trendanalyse te interpreteren wanneer het aantal observaties per semester
klein is (bvb. in geval van mortaliteit) en daarenboven dient men rekening te houden met
het fenomeen van de in sectie 3.2 vermelde “regression towards the mean”.
De twee types van analyse zijn complementair. Het periodeaspect is preciezer want
gebaseerd op grotere aantallen maar is terzelfder tijd meer blootgesteld aan bias omwille
van patiëntenselectie en differentiële kwaliteit van de gegevens.313;355;355 Het evolutieaspect
daarentegen is minder precies maar minder gevoelig voor bias: het is weinig waarschijnlijk
dat patiëntenselectie en gegevenskwaliteit in belangrijke mate gaan veranderen in een
korte tijdsspanne. Wel dient er rekening gehouden te worden met een mogelijk fenomeen
van “regression to the mean”.
3.3.6 Hulp bij de interpretatie De bedoeling van de analyse is het aanreiken van elementen ter verbetering van de
kwaliteit van zorgen binnen het ziekenhuis en niet het “shame and blame of
individuals”.495;496
Vooraleer uitspraken te doen over de vermoedelijke kwaliteit van de zorgen dient men na
te gaan of codeerproblemen niet de verklaring zijn van de voorgestelde resultaten.
Indien er zich geen belangrijke codeerproblemen voordoen, stellen we volgende werkwijze
voor. Neem de omvang van de afwijking als aanknopingspunt voor de interpretatie.
Vooralsnog nemen we her nationale gemiddelde als “benchmark” waarmee de afwijking
40BHoofdstuk 3: Methodologische aspecten
171
van de individuele ziekenhuizen wordt vergeleken. Verder stellen we voor eerst aandacht
te besteden aan het periodeaspect en nadien aan het evolutieaspect (trend).
Wegens de inherente beperkingen van administratieve gegevens lijkt het voorzichtig geen
“uitspraak” te doen indien de afwijking voor de periode zich tussen + 35% en - 25%
bevindt100, een zone van niet-interpretatie, en bij dergelijke waarden eerder aandacht te
besteden aan het implementeren van “Algemene maatregelen” (zie verder).
Indien de afwijking groter is dan + 35% of kleiner dan – 25% stellen we voor de
beschikbare evidentie om tot een outlying ziekenhuis te besluiten als volgt te omschrijven:
1. sterk: indien de probabiliteit om een afwijking te vinden met een waarde,
gelijk aan de waarde van het beschouwde ziekenhuis, die kleiner of gelijk is
aan 0,05/aantal vergeleken ziekenhuizen (significant na Bonferroni correctie),
2. matig: indien de probabiliteit om een afwijking te vinden met een waarde,
gelijk aan de waarde van het beschouwde ziekenhuis, die kleiner of gelijk is
aan 0,05 maar groter dan 0,05/aantal ziekenhuizen,
3. zwak: indien de probabiliteit om een afwijking te vinden met een waarde,
gelijk aan de waarde van het beschouwde ziekenhuis, die groter is dan 0,05.
Voor de trendanalyse volgen we een gelijkaardige benadering. Hier stellen we echter voor
1) alleen een uitspraak te doen indien de omvang van de afwijking voor de trend groter is
dan + 5% of kleiner is dan – 5%, en 2) rekening te houden met het fenomeen van
“regression to the mean”464 , indien de omvang van de afwijking voor de periode groter of
gelijk is aan + 5% of kleiner of gelijk is aan –5%.
Wij trachten bij de interpretatie te helpen door ziekenhuizen met zowel potentieel
bovenmaatse als met potentieel ondermaatse kwaliteit te identificeren. Voor beide
extremen wordt een externe audit aanbevolen om uit te maken of het gaat over een
werkelijk (on)gunstige toestand. Verder wordt, in functie van de graad van de aanwezige
evidentie, interne audit aanbevolen of ter overweging aangeboden. In alle gevallen worden
“Algemene maatregelen” aanbevolen zoals het opvolgen van richtlijnen en protocollen, en
het scheppen van een verbeteringsklimaat. Dit bestaat uit sterk en gedreven leiderschap,
duidelijke organisatorische verantwoordelijkheid m.b.t. kwaliteit, het toekennen van de
Hoofdstuk 3: Methodologische aspecten
172
nodige middelen voor verbeteringsactiviteiten, klinische audit en zorgvuldige monitoring
van vooruitgang en impact.496-498
De beslisboom voor de interpretatie wordt als “Bijlage 1” in hoofdstuk 5, sectie 5.2
verstrekt.
3.3.7 Trend Simulatie Voor het periode aspect van de analyse hadden we in de literatuur een aanknopingspunt
voor het bepalen van een zone van niet-interpretatie. Voor het trend aspect hadden we dat
niet.
We hebben ons derhalve zeer voorzichtig opgesteld. Een kleine simulatie (Tabel 3) waarbij
afwisselend een bovengrens en ondergrens van een zone van niet interpretatie voor de
trend worden verstrekt geeft aan hoe groot de reële “toegelaten” afwijking wordt bij een
trend van 5%, 4%, 3% en 2% boven en onder de nationale trend. Onze gebruikte 5% is
werkelijk zeer tolerant.
Tabel 3: Trend: simulatie van de invloed van de waarde van de toegestane afwijking (in %) op de boven- en ondergrens van de zone van niet-interpretatie.
5% 4% 3% 2%
OG BG OG BG OG BG OG BG
Semester 1 1,05 0,95 1,04 0,96 1,03 0,97 1,02 0,98
Semester 2 1,10 0,90 1,08 0,92 1,06 0,94 1,04 0,96
Semester 3 1,16 0,86 1,12 0,88 1,09 0,91 1,06 0,94
Semester 4 1,22 0,81 1,17 0,85 1,13 0,89 1,08 0,92
Semester 5 1,28 0,77 1,22 0,82 1,16 0,86 1,10 0,90
Semester 6 1,34 0,74 1,27 0,78 1,19 0,83 1,13 0,89
Semester 7 1,41 0,70 1,32 0,75 1,23 0,81 1,15 0,87
Semester 8 1,48 0,66 1,37 0,72 1,27 0,78 1,17 0,85
40BHoofdstuk 3: Methodologische aspecten
173
3.4 BESLUIT
De gevolgde methodologie is een eerste benadering. De opvolging van deze screening zal
moeten uitwijzen in welke mate de ziekenhuizen die vermoedelijk outliers zijn dat ook
werkelijk zijn.
Het valt te verwachten dat de grenzen van de zone van niet-interpretatie voor het trend
aspect moeten herzien worden, want te weinig gevoelig.
De huidige benchmark bepaling heeft als voornaamste objectief een zinvolle screening
mogelijk te maken, waarbij het nationale periodecijfer of trend niet noodzakelijk een ideaal
instrument zijn. De keuze van de uiteindelijk te gebruiken benchmark zal in overleg met de
sector moeten gebeuren in functie van wat haalbaar en wenselijk lijkt.
Het is daarbij belangrijk dat de overheid de nodige middelen ter beschikking stelt en de
anonimiteit van de ziekenhuizen opheft voor een visitatie door uit en door de sector
erkende experts.
DEEL II: CASUSSEN
177
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België:
overlijdensstatistieken en MKG
Na in hoofdstuk 1 een referentiekader uitgewerkt te hebben voor het beoordelen van
administratieve gegevens, passen we het hier toe op de kwaliteit van de gegevens van de
Overlijdensstatistieken en de Minimaal Klinische Gegevens. De bedoeling van dit
onderzoek was na te gaan in welke mate deze gegevens bruikbaar zijn voor de
beleidsvoering en hoe deze bruikbaarheid kan verhoogd worden.
4.1 KWALITEIT VAN CODERING EN CERTIFICATIE IN VLAANDEREN EN BELGIË, 1980-
1997.
We vatten hier het werk samen dat we uitgevoerd hebben tussen 1988 en 2004. Meer
uitgebreide versies werden elders gepubliceerd.20;21;33;34;36;120;499-505
Vertrekkend van de vaststelling dat het geïnformatiseerd controleprogramma, dat in België
gebruikt werd voor het nagaan van de codeerkwaliteit, slechts een beperkte predictieve
waarde had, hebben we een codeervergelijking doorgevoerd met het WGO
referentiecentrum van Parijs, waaruit duidelijk de beperkingen van onze codering bleken.
Op basis van deze ervaring, van de uitgevoerde kwaliteitscontroles op de gegevens met
feedback en discussie naar de codeurs toe (1988-1993) en het informatiseren van de WGO
codeerregels werd geleidelijk aan het controleprogramma verder ontwikkeld (1993-1997).
Naast de codeerproblematiek hebben we ook de kwaliteit van de certificering onderzocht
en meegewerkt aan het conform maken van de Belgische certificaten aan de WGO
modellen.
Het inzetten van een gecentraliseerd en opgeleid codeerteam in 1993 en dit initiële werk
leidden tot een progressieve verbetering van de codeerkwaliteit. Dit vond onder meer een
neerslag in volgende publicaties20;120;500:
- Aelvoet W, Humblet PC, Lagasse R. Het in routine gebruikmaken van een
geïnformatiseerd controleprogramma als middel tot kwaliteitsbewaking van de statistieken
van de burgerlijke stand in Vlaanderen. Arch Public Health 1991;49:1-8.
- Aelvoet W. Mortaliteitsstatistieken voor een gezondheidsbeleid. In: Nijs H, Denekens J,
editors. Preventieve Gezondheidszorg.Diegem Editorial: Kluwer; 1997. p. 914-21.
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België 178
- Aelvoet W, Molenberghs G, van Sprundel M. Mortality Statistics in Belgium 1980-1997:
Quality of coding. Arch Public Health 2005;63(2):127-48.
Een verdere neerslag was een master thesis36 en een aantal rapporten21;33;34;499;501-503. Naast
de beperkingen op gebied van de kwaliteit van de gegevens hebben we ook andere
beperkingen van de overlijdensstatistieken, waaronder het gebrek aan bruikbare sociaal-
economische gegevens, verkend en gepubliceerd.504;505
4.1.1 Codering 4.1.1.1 Inleiding
De doodsoorzakenstatistieken zijn in België, zoals in andere landen, een zeer belangrijke
informatiebron voor de volksgezondheid.4;35;207;208;227;246;506
Hoewel deze statistieken, op enkele perinatale randgevallen na, als exhaustief kunnen
beschouwd worden, is hun accuratesse beperkt zoals onder meer bleek uit de vergelijking
van overlijdenscertificaten met medische dossiers of autopsiebevindingen.203;243;244;507;508
Zowel nationale als internationale verschillen in sterftepatronen werden onder meer op
gebied van vaatziekten, neoplasmata en diabetes aangetoond.235;509-515De interpretatie van
die verschillen was echter moeilijk wegens verschillen in certificering- en
coderingpraktijken, en dit ondanks het bestaan van internationaal geldende regels voor
certificering en codering.211;238-242;516Voor ons land bijvoorbeeld werden er in vergelijking
met andere Europese landen zowel verschillen in certificering als codering
vastgesteld.238Ook de vergelijking van de mortaliteit t.g.v. een acuut myocardinfarct in de
doodsoorzakenstatistiek en in de “Multinational Monitoring of Trends and Determinants
in Cardiovascular Diseases (MONICA)” registratie toonde een belangrijk probleem van
misclassificatie van ischemische hartziekten aan.165
Het gebruik van een van het WGO model27 afwijkend certificaat (Figuur 1), het tot 1993
gedecentraliseerd coderen, en de voormelde vastgestelde codering- en
certificeringproblemen zetten ons er toe aan de codeerkwaliteit verder te onderzoeken.
Voor de evolutie van de codeerkwaliteit in Vlaanderen is het niet onbelangrijk de
oprichting in 1993 te vermelden van een centraal codeerteam, dat bestaat uit
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
179
Figuur 1: Het Belgisch Certificaat en het WGO-model
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België 180
medewerkers van de Vlaamse Vereniging voor Respiratoire Gezondheidszorg en
Tuberculose bestrijding (VRGT).
Het Belgische certificaat, dat geldig was tijdens de ganse studieperiode (1980-1997), week
in belangrijke mate af van het internationaal model. Het stelde in principe slechts ruimte
ter beschikking voor het invullen van een oorspronkelijke en een onmiddellijke doods-
oorzaak, hoewel er in de praktijk soms meerdere doodsoorzaken ingevuld werden.33 In
figuur 1 worden ter vergelijking het toenmalige Belgische certificaat en het WGO-model
nogmaals afgebeeld. Het is evident dat ons certificaat een adequate rapportering van een
ingewikkelde causale keten niet echt vergemakkelijkte.
4.1.1.2 Materiaal en methoden De voor de codering gebruikte ICD-9 classificatie bestaat uit 17 hoofdstukken en een
bijkomende classificatie voor uitwendige oorzaken. Zij is verder opgedeeld in een aantal
onderhoofdstukken, die een aantal verwante aandoeningen groepeert. Aan elke aandoening
wordt een code toegekend bestaande uit drie of vier digits, waarbij de vierde digit vaak een
verdere verfijning is van een in drie digits weergegeven aandoening. Zo staat 157 voor
pancreaskanker en 157.0 voor kanker van de pancreaskop.
Om de internationale vergelijkbaarheid te bevorderen bevat de ICD-classificatie in de
secties “Regels” en “Noten” een aantal richtlijnen over de manier waarop de
oorspronkelijke doodsoorzaak dient geselecteerd te worden.231
Op deze “Regels” en “Noten” hebben wij ons gebaseerd om vier codeeroefeningen uit te
voeren. Hierbij werden de codeerfouten als volgt geklasseerd: 0: totale overeenkomst
tussen coderen en hercoderen; 1: fout ter hoogte van de vierde digit; 2: fout ter hoogte van
de derde digit; 3: fout ter hoogte van een onderhoofdstuk; en, 4: fout ter hoogte van een
hoofdstuk. Tabel 1 geeft hier een voorbeeld van.
Volgens de Belgische wetgeving dienen de geboorte- en overlijdenscertificaten vernietigd
te worden zodra het verificatieproces van de certificaten afgesloten is. Een belangrijk
onderdeel van dit proces is het toetsen van de aan de medische gegevens toegekende codes
aan de richtlijnen van de ICD-classificatie. Dit houdt in dat na het beëindigen van dit
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
181
proces alleen gecodeerde medische gegevens beschikbaar zijn en dat men niet langer een
directe vergelijking tussen certificaat en geregistreerde doodsoorzaak kan maken.
Een eerste oefening had als doel de predictieve waarde van het nationale, geautomatiseerde
controleprogramma na te gaan, dat de codes en/of anthropometrische waarden van de
geboorte- en overlijdenscertificaten verifieert. Van de 10.679 nog niet-vernietigde
certificaten van de maand maart 1987 werden er door het programma 122 codes als “na te
kijken” opgegeven en verder 178 anthropometrische waarden, die we hier verder buiten de
bespreking laten. We gingen na of de 122 als fout bestempelde codes inderdaad fout
waren. Om een idee te krijgen over de negatieve voorspellende waarde van het
programma, werd ook de accuratesse van de niet gewraakte codes nagegaan. Hierbij was
het mogelijk alle codeerregels en -noten te toetsen.
Een tweede codeeroefening voerden we uit in samenwerking met het Parijse WGO
referentiecentrum op een systematische steekproef van 566 nog niet vernietigde
certificaten van het jaar 1988. Ook hier konden alle codeerregels en -noten getoetst
worden.
Bij het inzetten van een Vlaams gecentraliseerd codeerteam in 1993 werd een derde
codeeroefening uitgevoerd. Ditmaal werden in een systematische steekproef van 704
certificaten, gecodeerd door provinciale codeurs van de gezondheidsinspecties in 1989-
1990 en blind hergecodeerd door het nieuwe team in opleiding, de toegekende codes
vergeleken met een referentiecode, die met alle codeerregels en –noten rekening hield.
Voor een vierde codeeroefening bezorgden het Nationaal Instituut voor de Statistiek en de
Administratie Gezondheidszorg van het Ministerie van de Vlaamse Gemeenschap ons de
mortaliteitsgegevens voor België voor de jaren 1980-1997 over personen van tenminste
één jaar oud. Per individu werden het geslacht, de leeftijdsgroep (minder dan 25 jaar, 25-
64 jaar en 65 jaar en meer), de woonplaats, de gecodeerde oorspronkelijke en
onmiddellijke doodsoorzaken verstrekt. Hier was uiteraard slechts een partiële toetsing van
regels en noten mogelijk. Zij beperkte zich tot een beoordeling van de mate waarin een
aantal codeerregels opgevolgd werden, die bepalen hoe de oorspronkelijke doodsoorzaak
moet gekozen worden.
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
182
Belangrijke oorzaken voor het ontstaan van codeervertekeningen zijn het niet toepassen
van de regels in verband met “Senilitas”, “Slecht gedefinieerde aandoeningen”, en de
zogenaamde “linkage” regel. Deze laatste stelt dat een doodsoorzaak, aanvankelijk geko-
zen als oorspronkelijke doodsoorzaak, in welomschreven gevallen uiteindelijk niet als
oorspronkelijke doodsoorzaak weerhouden wordt. Wanneer de certificerende arts bvb.
atherosclerose (ICD-9: 440) als oorspronkelijke doodsoorzaak opgeeft en hartinfarct (ICD-
9:410) als onmiddellijke, wordt door toepassing van de regel het hartinfarct weerhouden
als oorspronkelijke doodsoorzaak en wordt de atherosclerose als bijkomende geregistreerd.
Na de voormelde Regels en Noten van de classificatie geprogrammeerd te hebben was het
vervolgens mogelijk de gepubliceerde statistieken hieraan te toetsen en een
“gecorrigeerde” versie te produceren, die ermee in overeenstemming was gebracht.
Tenslotte vergeleken we de “gepubliceerde” met de “gecorrigeerde” versie.
Voor deze oefening voerden we voornamelijk grafische analyses uit, aangevuld met een
meer formele statistische benadering om op een synthetische manier de determinanten van
codeerfouten weer te geven benevens evoluties in de tijd, en conclusies te kunnen trekken
over onze nationale en regionale statistieken. We gebruikten hiervoor een multinomiaal
logistisch regressie model.517Hierbij groepeerden we, wegens de kleine aantallen, de
leeftijdsgroepen van minder dan 25 jaar en die van 25-64 jaar en corrigeerden voor
“overdispersion” ten gevolge van correlatie van de gegevens.484
Om de performance van de geprogrammeerde foutendetectie te beoordelen pasten we de
geprogrammeerde foutendetectie ook toe op het bestand, dat we gebruikten voor de
vergelijking tussen Vlaanderen en het WGO referentiecentrum. Vermits de
geprogrammeerde foutendetectie alleen fouten kan opsporen als de gecodeerde
onmiddellijke doodsoorzaak verschilt van de gecodeerde oorspronkelijke doodsoorzaak,
analyseerden we hier ook de “subset” van gegevens waarin meer dan één doodsoorzaak
gecodeerd was.
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België 183
Tabel 1: Classificatie van codeerfouten.
Originele codering Hercodering Classificatie van een codeerfout
Onmiddellijke doodsoorzaak
Beschrijving Oorspronkelijke doodsoorzaak
Beschrijving Oorspronkelijke doodsoorzaak
Beschrijving
198.3 Secundair kwaadaardig neoplasma van de hersenen
162.0 Trachea kanker 162.0 Trachea kanker 0
036.0 Meningokokken meningitis
036.2 Meningokokken septicemie
036.0 Meningokokken meningitis
1
410.x Acuut myocard infarct
413.x Angina pectoris 410.x Acuut myocard infarct
2
304.9 Drugsverslaving 292.9 Drugspsychose 304.9 Drugsverslaving 3 571.2 Levercirrose 303.x Alcoholafhankelijkheid 571.2 Levercirrose 4
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België 184
4.1.1.3 Resultaten Predictieve waarde van het geautomatiseerd controleprogramma.
Van de 122 als fout bestempelde codes bleken er 109 ook fout, of een positieve predictieve
waarde van 89%. Daarenboven bleken er zich in deze groep certificaten nog 122
codeerfouten te bevinden, die niet door het programma als verdacht gesignaleerd waren.
Niet alleen waren deze door het programma niet-gedetecteerde fouten talrijker maar ook
ernstiger (RR:1,35 [95% BI: 1,06;1,72]) dan de gedetecteerde fouten (Tabel 2).
Tabel 2: Ernstigheidsgraad en frequentie van de gedetecteerde en niet-gedetecteerde fouten
Foutentype Ernstigheidsgraad
3 of 4 1 of 2 Totaal
Gedetecteerd 51 58 109
Niet-gedetecteerd 77 45 122
Vergelijking Vlaanderen versus WGO Referentie centrum
De vergelijking tussen Vlaanderen en het WGO Referentie centrum brengt een groot
aantal belangrijke codeerfouten aan het licht: in ¼ van de gevallen betrof het een fout op
het niveau van hoofdstuk of onderhoofdstuk (Tabel 3). Vooral in de hoofdstukken van de
symptomen (overschatting) en uitwendige oorzaken (onderschatting) werden heel wat
codeerfouten aangetroffen.36In de onderhoofdstukken bleken voornamelijk arteriosclerose
en “andere respiratoire aandoeningen” overschat en bleken de hartvaatziekten (zonder
arteriosclerose) onderschat.
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
185
Tabel 3:Verschil tussen de oorspronkelijke (Vlaanderen) en referentie (WGO Frankrijk) codering. Vlaanderen 1988.
Verschil Frequentie Percent
Geen 315 55,7
4e digit 36 6,4
3e digit 74 13,1
Onderhoofdstuk 66 11,7
Hoofdstuk 75 13,3
Totaal 566 100.0
Vergelijking van provinciale codeurs met de vier leden van een centraal team
Uit deze vergelijking blijkt duidelijk dat de leden van het nieuw codeerteam significant
minder fouten maakten dan de provinciale codeurs (Tabel 4). Wanneer we de leden van het
nieuwe team onderling vergeleken waren de codeerverschillen niet langer significant.
Tabel 4:Vergelijking van provinciale codeurs met de vier leden van een centraal team m.b.t. de coderingsprecisie, uitgedrukt als verschil t.o.v. een referentiecode. Verschil Provinciaal VRGT A VRGT B VRGT C VRGT D Geen 432 (- 5,9) 598 (+1,0) 629 (+2,3) 595 (+0,9) 614 ( +1,7)4e digit 42 (+2,5) 28 (-2,1) 18 (-2,0) 28 (- 0,1) 28 (- 0,1)3e digit 81 (+9,4) 22 (-1,4) 11 (-3,4) 23 (- 1,2) 12 (- 3,3)Onderhoofdstuk 42 (+3,7) 22 (-0,4) 14 (-2,0) 23 (- 0,2) 19 (- 1,0)Hoofdstuk 107 (+8,6) 34 (-2,0) 32 (-2,3) 35 (- 1,9) 31 (- 2,4)Totaal 704 704 704 704 704 ( ) Vierkantswortel van de celbijdrage tot de chi-kwadraat toets: waarde = 279.983 voor 16 df., met prob. < 0.001
Evolutie van de codeerfouten in de tijd in functie van woonplaats, geslacht en
leeftijdsgroep
De voornaamste resultaten van de derde oefening500 kunnen als volgt samengevat worden.
Over de jaren heen verminderde het aantal codeerfouten significant (van ongeveer 100 ‰
tot 10‰) (Figuur 2).
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België 186
Figuur 2: Evolutie van het globale foutencijfer en het foutencijfer in functie van hun ernstigheidsgraad in België, 1980-1997.
0
20
40
60
80
100
120
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
Cijf
er(/0
00)
1997
Totaal Hoofdstuk Onderhoofdstuk Derde digit Vierde digit
Gegevensbron: Nationaal Instituut voor de Statistiek en Ministerie van de Vlaamse Gemeenschap.
Verder veranderden in de loop der jaren de omvang en het patroon van de codeerfouten in
functie van het Gewest van de woonplaats, van het geslacht en van de leeftijdsgroep
(hogere foutencijfers in de oudere leeftijdsgroep, lagere cijfers in Brussel) (Fig 3 en 4).
De belangrijke proportie certificaten waarin slechts één doodsoorzaak vermeld werd,
maakte een analyse in functie van het type pathologie onmogelijk.
Figuur 3: Evolutie van het globale foutencijfer in België, per Regio,1980-1997.
0
20
40
60
80
100
120
140
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
Cijf
er (/
1000
)
1996
1997
Brussel Vlaanderen Wallonië België
Gegevensbron: Nationaal Instituut voor de Statistiek en Ministerie van de Vlaamse Gemeenschap.
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
187
Figuur 4: Evolutie van het globale foutencijfer, per geslacht en per leeftijdsgroep. België,1980-1997.
0
20
40
60
80
100
120
1980
1981
1982
1983
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
Cijf
er (/
1000
)
1996
1997
01-24jaar 25-64jaar 65jaar+ Mannen Vrouwen
Gegevensbron: Nationaal Instituut voor de Statistiek en Ministerie van de Vlaamse Gemeenschap.
Zoals voormeld is het niet toepassen van de zogenaamde linkage-regel een belangrijke
oorzaak voor het ontstaan van de codeervertekeningen, die we illustreerden door figuren 5
en 6. Hierin werd voor de oorspronkelijke doodsoorzaken van ischemische hartzieken
(IHD), cerebrovasculair accident (CVA), atherosclerose (ART), en andere hartziekten
(OHD) aangegeven in welke mate de geregistreerde onmiddellijke doodsoorzaak door het
toepassen van de regel had hergecodeerd moeten worden als oorspronkelijke
doodsoorzaak.
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België 188
Figuur 5: Effect van het hercoderen op de doodsoorzakenstatistieken. Ischemische hartziekten (IHD) en Cerebro-vasculaire accidenten (CVA). België1980-1997.
020406080
100120140160180
1980
1982
1984
1986
1988
1990
1992
1994
1996
Cijf
er (/
1000
)
IHD oorspronkelijk IHD hergecodeerdCVA oorspronkelijk CVA hergecodeerd
Gegevensbron: Nationaal Instituut voor de Statistiek en Ministerie van de Vlaamse Gemeenschap. Figuur 6: Effect van het hercoderen op de doodsoorzakenstatistieken. Andere hartziekten (OHD) en atherosclerose (ART). België1980-1997.
020406080
100120140160
1980
1982
1984
1986
1988
1990
1992
1994
1996
Cijf
er (/
1000
)
OHD oorspronkelijk OHD hergecodeerdART oorspronkelijk ART hergecodeerd
Gegevensbron: Nationaal Instituut voor de Statistiek en Ministerie van de Vlaamse Gemeenschap.
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
189
Performance van de geprogrammeerde foutendetectie
We pasten de geprogrammeerde foutendetectie toe op het bestand, dat gebruikt werd voor
de vergelijking tussen Vlaanderen en het WGO referentie centrum (oefening 2) en maakten
ook hier een subset aan van de certificaten waarin meer dan één doodsoorzaak gecodeerd
werd.
Tabel 5: Verdeling van de codeerfouten opgespoord via de geprogrammeerde foutendetectie (volledig bestand en “subset”) versus vastgesteld door het referentiecentrum. Vlaanderen 1988.
Fout Pgm (%) Referentie (%) PgmNU (%) RefNU (%)
0 504 (89.0) 315 (55.7) 167 (77.7) 95 (44.2) 1 1 (0.2) 36 (6.4) 1 (0.5) 14 (6.5) 2 14 (2.5) 74 (13.1) 2 (0.9) 27 (12.6) 3 28 (4.9) 66 (11.7) 28 (13) 45 (20.9) 4 19 (3.4) 75 (13.3) 17 (7.9) 34 (15.8)
Totaal 566 (100.0) 566 (100.2) 215(100.0) 215 (100.0) Pgm: geprogrammeerde foutendetectie toegepast op het volledige bestand; Referentie: fouten geïdentificeerd door het referentiecentrum in het volledige bestand; PgmNU: geprogrammeerde foutendetectie toegepast op de subset;RefNU: fouten geïdentificeerd door het referentiecentrum in de subset. Bron: Ministerie van de Vlaamse Gemeenschap Zoals blijkt uit tabel 5 is de performance van de geprogrammeerde foutendetectie
significant kleiner dan die van het Referentiecentrum en dit zowel voor het ganse bestand
(p <0.01) als voor de subset (p <0.01). Bij het ganse bestand stelde het referentiecentrum
ongeveer driemaal meer fouten van klasse drie en vier vast en bij de subset was dit
ongeveer tweemaal zoveel.
4.1.1.4 Discussie
Het coderen van overlijdenscertificaten verbeterde aanzienlijk tijdens de periode 1980-
1997. Verscheidene factoren hebben bijgedragen tot deze verbetering. Vergelijkingen met
het buitenland via deelname aan internationale studies235;238; contacten met het WGO
referentiecentrum; samenwerking met onderzoekers36;120; en, vergelijking met
gespecialiseerde registers zoals het kankerregister134 en MONICA165 speelden hierin een
belangrijke rol. Noteren we dat ook door het MONICA register er een duidelijke
ondercodering van IHD (36% in Vlaanderen en 32% in Wallonië) werd vastgesteld in de
overlijdensstatistieken en een nog belangrijkere ondercodering van het acuut
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België 190
myocardinfarct (respectievelijk 41% en 59% in Vlaanderen en Wallonië).165 Verdere op
verbetering gerichte acties bestonden uit (1) supervisie van het coderen; (2) samenwerking
van de codeerverantwoordelijken van beide Gemeenschappen36; (3) “bevraging”518 van de
certificerende artsen wanneer er zich een codeerprobleem voordeed, en (4) initiële en
continue vorming van de codeurs in Vlaanderen in 1993 en soortgelijke initiatieven in
Wallonië.
Bij deze vaststellingen dient men er rekening mee te houden dat de provinciale codeurs
géén specifieke vooropleiding gekregen hadden en dat coderen slechts een onderdeel van
hun takenpakket vormde. De mindere codeerprestaties in het verleden waren dan ook
grotendeels onvermijdelijk. Ze kunnen zeker niet toegeschreven worden aan een gebrek
aan inzet van de provinciale codeurs.
De vastgestelde verbeteringen mogen echter niet tot een overdreven optimisme leiden. De
performance van de geprogrammeerde detectie is immers beperkt zodat een groot aantal
codeerfouten niet opgespoord wordt. Verschillende codeerregels en noten vereisen immers
een aanpassing van het overlijdenscertificaat aan het WGO-model, wat slechts in 1998
gebeurde. Op de grote proportie van certificaten met slechts één gecodeerde doodsoorzaak
(39,5%) kon derhalve de geprogrammeerde detectie niet toegepast worden.
De geleidelijke en ongelijke verbetering van de codeerkwaliteit heeft als gevolg dat er
voorzichtigheid geboden is bij de interpretatie van (1) tijdreeksen onder meer m.b.t. hart-
en bloedvatenaandoeningen, zoals hartinfarcten en cerebro-vasculaire accidenten, en (2)
geografische verschillen. Gelukkig lijkt vermijdbare sterfte, een belangrijke
gezondheidsindicator, die cruciaal is voor het ontwikkelen en evalueren van een
preventieve gezondheidspolitiek en op jongere leeftijdsgroepen (< 65 jaar) van toepassing
is, minder aangetast.
Een laatste belangrijke tekortkoming van de overlijdensstatistieken is dat zij veel te
laattijdig beschikbaar zijn: de laatste Belgische gegevens dateren van 1997.110Dit staat in
schrille tegenstelling tot de EU suggestie van een tijdsinterval van ongeveer twee jaar
tussen het jaar waarvan de gegevens verzameld worden en hun publicatie.519 Vergeten we
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
191
daarbij niet dat zulke oude gegevens weinig bruikbaar zijn voor de beleidsvoering en dat
zij de beleidsmakers slechts matig motiveren om voor de verbetering en de tijdige
oplevering van de overlijdensstatistieken de nodige middelen vrij te maken.
4.1.2 Certificatie
4.1.2.1 Inleiding Zoals voormeld in sectie 1.3.1 is de diagnosestelling geen eenvoudige taak en wordt zij
beïnvloed door situatiegebonden kenmerken zoals de ter beschikking staande
diagnostische middelen en voorkennis over de patiënt. Daarnaast werden er, zoals
voormeld, bij internationale vergelijkingen belangrijke verschillen in
certificeringpraktijken vastgesteld.211;238;239;242;516
Een belangrijke oversterfte in december 1989 na een griepepidemie (zie de pijl in Figuur
1) leek dan ook een uitgelezen gelegenheid om de validiteit van de certificering in
Vlaanderen te onderzoeken.
Figuur 1: Aantal sterfgevallen per maand. België, 1978-1991.
4.1.2.2 Methoden Naar aanleiding van deze oversterfte vroegen we aan 398 Vlaamse artsen het overlijden
van een patiënt te hercertificeren op basis van het medisch dossier. Daarvoor dienden ze
een vragenlijst in te vullen (zie Bijlage), die onder meer een definitie van de
oorspronkelijke, onmiddellijke en bijkomende doodsoorzaken bevatte.36 In overleg met de
Orde van de geneesheren en met de medewerking van de gemeentelijke diensten van de
burgerlijke stand werd een speciale procedure uitgewerkt om de anonimiteit van de
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België 192
overledene kenbaar te maken aan de arts en toch de anonimiteit te bewaren voor de
onderzoekers.
Van de 398 aangeschreven artsen kregen we 334 antwoorden waarvan er 309 bruikbaar
waren voor verdere analyse. De antwoorden werden als niet-bruikbaar bestempeld
wanneer de arts meldde dat hij geen toegang had tot het medisch dossier.
Voor de vergelijking van de oorspronkelijke certificatie met de hercertificatie op basis van
het medisch dossier, klasseerden we de mate van overeenkomst als volgt:
1) zelfde oorspronkelijke doodsoorzaak
2) een omruiling van de originele oorspronkelijke doodsoorzaak met een toenmalige
onmiddellijke of bijkomende doodsoorzaak, of, een grotere precisie m.b.t. de
natuur of anatomische localisatie van de aandoening of letsel (bvb. Tumor van de
long versus longkanker)
3) duidelijk andere oorspronkelijke doodsoorzaak
Verder gingen we na of de hercertificatie leidde tot een grotere precisie. Hiervoor werden
de diagnoses tentatief gehergroepeerd in:
1) vaag: als het ging over (1) symptomen of hoge leeftijd (ICD-9: 780-799),
(2)kankers waarvan de primaire localisatie onbekend was (ICD-9:199), (3)
hartfalen (ICD-9: 428-9), en andere ademhalingsziekten (ICD-9: 518.8),
2) precies in de andere gevallen
4.1.2.3. Resultaten Bij de 309 bruikbare antwoorden vonden we een overeenkomst in 188 gevallen
(60,8 %), een omruiling of verschillen in precisie in 58 gevallen (18,8 %) en een totaal
andere oorspronkelijke doodsoorzaak in 63 gevallen (20,4 %) (Tabel 1). Het verschil in
overeenkomst tussen certificering en hercertificering was veel groter in de oudere
leeftijdsgroep (OR: 2,04 [ 95% BI: 1,50; 2,78]).
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
193
Tabel 1: Overeenstemming over de oorspronkelijke doodsoorzaak zoals ze oorspronkelijk vermeld was en na hercertificatie.
Leeftijdsgroep Overeenstemmend Omruiling/
Precisie
Niet
overeenstemmend
Totaal
< 80 jaar 155 (67,1 %) 43 (18,6 %) 33 (14,3 %) 231
≥ 80 jaar 33 (42,3 %) 15 (19,2 %) 30 (38,5 %) 78
Totaal 188 (60,8 %) 58 (18,8 %) 63 (20,4 %) 309
In tegenstelling tot de oudere leeftijdsgroep, waar we veeleer een verandering dan wel een
precisering (p: 0,53) leken te noteren, leidde de hercertificatie in de jongere leeftijdsgroep
blijkbaar wel tot een grotere precisie (p < 0,03). We konden geen significant verschil
aantonen tussen het hercertificeren door de arts, die het certificaat invulde, of het
hercertificeren door een andere arts.
Tabel 2: Graad van precisie van de oorspronkelijke doodsoorzaak zoals ze oorspronkelijk vermeld was en na hercertificatie.
< 80 jaar ≥ 80 jaar Hercertificatie Certificatie Hercertificatie Certificatie Vaag Precies Totaal Vaag Precies TotaalVaag 6 4 10 Vaag 5 4 9Precies 13 208 221 Precies 6 63 69Totaal 19 212 231 Totaal 11 67 78McNemar: 4,765,df=1,p: 0,0290 McNemar: 0,400,df=1,p: 0,5271
4.1.2.4. Discussie In de literatuur werden herhaalde malen onnauwkeurigheden bij het invullen van
overlijdenscertificaten gedocumenteerd.211;238;239;243;244;508;516 Deze onnauwkeurigheden
worden in de hand gewerkt door de moeilijkheid om een unieke, oorspronkelijke
doodsoorzaak te definiëren. Zoals voormeld dateert dit concept uit de tijd dat maternale
sterfte en infectieuze aandoeningen belangrijke doodsoorzaken waren, maar blijkt het niet
adequaat om het ganse proces dat tot de dood leidde weer te geven wanneer er zich
verschillende levensbedreigende aandoeningen voordeden.215;219;226;228;246 Een typisch
voorbeeld van deze problematiek treffen we aan bij het prostaatcarcinoom bij oudere
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België 194
mannen waar het vaak moeilijk is een onderscheid te maken tussen een sterfgeval
tengevolge van een prostaatcarcinoom en een sterfgeval waarbij naast een andere
oorspronkelijke doodsoorzaak ook een prostaatcarcinoom vermeld wordt.520
Het zal dan ook geen verwondering wekken dat zowel het concept van één oorspronkelijke
doodsoorzaak als het WGO-formulier in de oudere leeftijdsgroepen dermate inadequaat
bevonden werden dat er in de VS aan een speciaal overlijdensbericht gedacht wordt246.
Men kan zich overigens de vraag stellen of een oorspronkelijke doodsoorzaak bij mensen
van 80 jaar en meer erg zinvol is in termen van preventie van deze doodsoorzaak. Het is
wellicht zinvoller de beperkingen, die optreden bij het ouder worden en de levenskwaliteit
negatief beïnvloeden, te registreren en als vertrekpunt te gebruiken voor preventie.
Verscheidene methodes werden voorgesteld om de validiteit van het certificeren te
bestuderen: een vergelijking tussen overlijdenscertificaat en (1) autopsie rapporten243,
(2) ziekenhuisontslaggegevens244, en (3) specifieke enquêtes ter validatie van
overlijdenscertificaten246.
Wij stelden hier een benadering voor waarbij aan een arts gevraagd werd een sterfgeval te
hercertificeren aan de hand van een vragenlijst. Deze vragenlijst bevatte een aantal
gesloten vragen en definities. Uit onze vergelijking van het oorspronkelijk certificaat en de
hercertificering blijkt duidelijk dat de validiteit van de overlijdensstatistieken, beperkt tot
oorspronkelijke doodsoorzaak, zwak is, zeker in de leeftijdsgroep van de tachtig plussers.
Het positieve aspect aan deze oefening is de vaststelling dat duidelijker instructies de
precisie van de statistiek kunnen verbeteren, zoals blijkt uit de grotere precisie na
hercertificatie in de jongere leeftijdsgroep. In de oudere leeftijdsgroep waren de aantallen
dermate klein dat we misschien power misten om een eventueel verschil aan te kunnen
tonen.
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
195
Bijlage: Vragenlijst
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België 196
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
197
4.2 KWALITEIT VAN DE GEGEVENS IN EEN PROSPECTIEF FINANCIERINGSSYSTEEM
Wanneer ontslaggegevens in verband met ziekenhuisverblijven alleen gebruikt worden
voor de financiering van die ziekenhuizen, is het niet ondenkbeeldig dat de kwaliteit van
de registratie door deze finaliteit beïnvloed wordt. Vermits die gegevens naast hun
financieringsdoeleinden ook voor kwaliteitsinitiatieven gebruikt worden leek een
onderzoek naar hun kwaliteit wenselijk.
Gebaseerd op dit onderhoofdstuk, dat onderzoek uit 2004-6 weergeeft, werd aan de Revue
d’Epidémiologie et Santé Publique (RESP) volgend manuscript aangeboden: “Miscoding a
threat to the hospital care system: How to detect it?”met als auteurs Aelvoet W., Terryn N,
Windey F, Redivo M., Faes C, en de Cell Audit.
4.2.1 Inleiding. Vanuit een standpunt van ziekenhuismanagement bleek het wenselijk ziektebeelden met
gelijkaardige behandelingen en kosten te hergroeperen. Dit gaf aanleiding tot het ontstaan
van het concept Diagnosis Related Group (DRG).2;195 De idee om DRGs te gebruiken als
maat voor case mix1 in het kader van terugbetaling van ziekenhuiskosten, berustte op het
gegeven dat de verblijfsduur, de afhankelijke variabele bij de bepaling van DRGs,
behoorlijk goed correleerde met de totale ziekenhuiskosten.83
Het prospectief financieringssysteem, waarop ook het Belgische
ziekenhuisfinancieringssysteem berust, is gebaseerd op DRGs. Hieronder verstaat men dat
ziekenhuizen een vast bedrag ontvangen voor het behandelen van patiënten geklasseerd in
een bepaalde ziekte, ongeacht de verblijfsduur of het type zorg, met uitzondering van
sommige patiënten met uitzonderlijk hoge kosten, outliers genaamd.521;522Deze tarifering
wordt vastgesteld voorafgaandelijk aan de periode waarin de ziekenhuisopnamen zich
voordoen, die aan dit tarief zullen terugbetaald worden.
In ons land berust dit systeem op de “All Patient Refined Diagnosis Related Groups”
(APR-DRGs). In functie van de ernst van de aandoening kent het klassificatie algoritme
binnen de APR-DRGs een Severity of Illness (SOI) toe, die in functie van een stijgende
ernst van 1 tot 4 gescoord wordt. Het kan dan aanlokkelijk zijn de hoofddiagnose van een
verblijfsduur, die te lang is voor de APR-DRG waarin het verblijf geklasseerd werd,
zodanig te herformuleren dat zij leidt tot een meer lucratieve classificatie bijvoorbeeld tot
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België 198
een classificatie in andere APR-DRG met een gemiddeld langere duur of in dezelfde APR-
DRG maar met een hogere SOI.
Het systematisch en intentioneel overwaarderen van de case mix om een hogere
terugbetaling te bekomen wordt “DRG creep” of “upcoding” genaamd.83 Men
onderscheidt optimalisatie, wat in overeenstemming is met de codeerregels en “creep”,
wat het niet is. Een voorbeeld van optimalisatie is het selecteren van een aanvaardbare,
alternatieve hoofddiagnose (“selection” of “gaming”) of het toevoegen van meer
secundaire diagnosen (“supplementation”).336 Een voorbeeld van “gaming” is het klasseren
van iemand met een systeem lupus en een “milde” chronische nierinsufficiëntie in DRG
316 (“Renal failure diagnoses without dialysis”) i.p.v. in DRG 240 (“Connective-tissue
disorders with complicating condition or age > 69”) wat leidt tot een met een derde
verhoogde terugbetaling.337 Stippen we hierbij echter aan dat volgens de huidige
codeerregels de voormelde systemische lupus verplicht geselecteerd moet worden.523
Bronnen van creep zijn: misspecificatie, fout coderen (“miscoding”) en herrangschikken
van diagnosen (“resequencing”). Een codeur, die een TIA codeert als een cerebro-vasculair
accident en een informaticus die de door de arts weerhouden hoofddiagnose van acute
bronchitis omruilt met de secundaire diagnose van chronische obstructieve longaandoening
zijn voorbeelden van respectievelijk fout coderen en herrangschikken.336 Misspecificatie is
het ten onrechte specificeren van een diagnose als hoofddiagnose en het optekenen van
diagnosen of ingrepen, die niet voorkomen in het medisch dossier.140 Bijvoorbeeld
wanneer een behandelende arts voor een opname van een pneumonie, een niet gerelateerd
myocardinfarct, dat zich na de opname voordeed, tegen de regels in selecteert als
hoofddiagnose spreekt men van misspecificatie.
In uitzonderlijke omstandigheden kan een arts verkeerdelijk een diagnose of ingreep
vermelden om bij een patiënt een naar zijn mening noodzakelijke behandeling uit te
voeren, waarvoor de patiënt bij de geldende regels niet in aanmerking komt, en die door
deze misspecificatie wel kan. Dergelijke handeling, hoewel ethisch niet correct,
beantwoordt aan het verwachtingspatroon, eigen aan de arts-patiënt relatie. Om dit soort
praktijken tegen te gaan is een gezamenlijke inspanning vereist zoals het opstellen of
aanpassen van richtlijnen.524-528
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
199
Naast “upcoding” werd ook het tegenovergestelde fenomeen, ondercodering genaamd of
“undercoding” in de Angelsaksische literatuur, vastgesteld. Dit bestaat vaak uit een
onzorgvuldige abstractie en codering die tot een DRG leiden met een gemiddeld kortere
verblijfsduur.1 Soms kan er echter sprake zijn van frauduleuze praktijken waarbij er, door
een bewuste ondercodering, naar gestreefd wordt “outlier” te worden in een DRG met een
kortere gemiddelde verblijfsduur en daaruit financiële winst te puren.
Een DRG studie, uitgevoerd op 7050 opnames onmiddellijk na het invoeren van het
prospectieve financieringsmechanisme , toonde een hoog percentage (20,8%) ernstige
codeerfouten met een verandering van terugbetaling tot gevolg. Hoewel vroeger ook
tussen ongeveer 20 en 75 percent ernstige codeerfouten werden opgetekend, bleken de
codeerfouten nu echter niet langer neutraal te zijn maar leidden ze in 61,7% van de
gevallen tot een overbetaling.140Misspecificatie door de artsen gaf aanleiding tot de helft
van de codeerfouten; in de andere gevallen ging het over het coderen van niet-
geattesteerde diagnoses, het toekennen van foutieve ICD-9-CM codes en het
herrangschikken van de diagnoses, die door de arts werden opgegeven.336
Als remedie tegen creep formuleerde de Amerikaanse overheid een aantal voorstellen. Een
eerste betrof het zich concentreren op een aantal DRGs en een aantal ziekenhuizen. Verder
stelde ze voor aselect een voldoende aantal ontslagen na te gaan om de globale integriteit
van het systeem te onderzoeken, wat terzelfder tijd een “ontradend” karakter heeft.336
Tenslotte werden artsen verplicht de opgegeven diagnoses te certificeren en werden er
peer review organisaties (PROs) opgezet voor de bewaking van de gegevenskwaliteit.
Deze maatregelen bleven niet zonder gevolg zoals uit een nieuwe nationale DRG validatie
studie bleek: het percentage van ernstige codeerfouten was dan teruggelopen 14,7%, en de
codeerfouten resulteerden niet langer systematisch in een hogere terugbetaling.140 De
Amerikaanse gezondheidszorgadministratie gaf echter toe niet te beschikken over
dergelijke preventieve mechanismen voor de problemen van het foutief coderen of van het
herrangschikken.140
Naast een directe vaststelling van creep, werd ook een indirecte maat voor fraude-detectie
ontwikkeld: de Medicare Case-mix Index (MCI), die het relatieve gewicht van de
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België 200
pathologieën in de financiering weergeeft. Een econometrische analyse over de periode
1980-6 toonde een onterechte toename in “meer rendabele” DRGs, die ongeveer 10% van
de toename in de MCI verklaarde. Een ander verrassend en sterk resultaat van de studie
betrof de rol van de Peer Review Organisations (PROs): hoe inschikkelijker een PRO hoe
hoger de gemiddelde MCI van zijn ziekenhuizen.321
Een samenvatting van de Amerikaanse gegevens voor de fiscale jaren 1981-1987 waarbij
de MCI werd opgedeeld in reële en upcoding effecten, geeft aan dat na een aanvankelijke
sterke stijging van upcoding, tot 68% van de totale MCI-toename, een afzwakking ervan
werd vastgesteld tot 24% van de totale MCI-toename.338Deze systematische opwaardering
van de MCI in de hand gewerkt door de invoering van het prospectieve
financieringssysteem had het ontstaan van een breuk in de epidemiologische tijdreeksen
als gevolg.529
In België zijn er verschillende elementen aanwezig, die het ontstaan van “creep”
bevorderen. Vooreerst is er het toenemende belang van de, op het prospectieve
financieringsmechanisme gebaseerde, verantwoorde activiteit waarbij men een
overschakeling krijgt van de notie van “erkende” ziekenhuisbedden naar de notie van door
pathologie “verantwoorde” ziekenhuisbedden. Deze verantwoorde activiteit wordt
berekend op basis van oudere MKG-registratiejaren (prospectieve financiering). In het
nieuwe systeem hangt de financiering nog alleen af van het aantal gerechtvaardigde
verpleegdagen. Hierin spelen APR-DRG, SOI en leeftijd een fundamentele rol.
Vervolgens komen APR-DRG en SOI in belangrijke mate tussen in de berekening van het
Forfait Klinische Biologie, een andere nieuwe ontwikkeling. Ook de op ons afkomende
financieringsmechanismen zoals de referentiebedragen en de forfaitarisering van de
verzekeringstegemoetkoming voor de vergoedbare farmaceutische specialiteiten in het
ziekenhuis zijn eveneens functie van APR-DRG en SOI. Een juiste codering van deze
elementen is bijgevolg een basisvoorwaarde voor de financiering.
Naast het prospectieve financieringsmechanisme zijn de geringe frequentie waarmee
vooralsnog de controles op de codeerkwaliteit uitgevoerd worden en de beperkte aselecte
steekproef (een veertigtal ziekenhuisverblijven), waarop zij gebaseerd zijn, weinig “creep-
ontradend”. Ook wordt in geval van creep, wegens de bestaande gaten in de mazen van het
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
201
juridisch arsenaal, vooralsnog niet tot een concrete bestraffing overgegaan. Vermits er
daarenboven in een systeem van een gesloten enveloppe gewerkt wordt, zal een
systematische fraude van een ziekenhuis negatieve gevolgen hebben op de financiering van
de andere ziekenhuizen.
Om al deze redenen werd er besloten een onderzoek uit te voeren om na te gaan of er al
dan niet een algemene tendens bestaat van over-codering en frauderende ziekenhuizen op
te sporen.
4.2.2 Methodes Design van de studie Voortbouwend op de Amerikaanse ervaringen en op de methodologie ontwikkeld door
Kirkhove et al.530 wordt eerst op “macroscopisch” niveau nagegaan (1) of het
ziekenhuissysteem in zijn geheel al dan niet een tendens vertoont tot verzwaring van de
pathologie, die, indien ze kunstmatig is, de stabiliteit van het systeem in gevaar brengt, en
(2) of een eventuele verzwaring geheel of gedeeltelijk te wijten is aan veranderingen in de
registratiepraktijk.
Twee types van methoden worden hiervoor gebruikt:
1) Het volgen van het verschil in evolutie tussen de geobserveerde en de
gestandaardiseerde verblijfsduur, berekend volgens de methodologie van de
financiering der ziekenhuizen.
2) Het volgen van de evolutie over de jaren van de proportie verblijven met een
severity of illness (SOI), graad =1.
Het eerste type analyse moet toelaten de algemene efficiëntie van het systeem te
beoordelen: een kleiner wordend verschil - vergeleken met de gestandaardiseerde
verblijfsduur wordt de geobserveerde verblijfsduur korter - zou wijzen op een systeem dat
efficiënter wordt, een constant en een groter wordend verschil zouden respectievelijk op
stabiliteit en op een verlies aan efficiëntie wijzen. Bij gebrek aan een onderbouwde
referentie, is het echter moeilijk een onderscheid te maken tussen winst in efficiëntie en het
effect van een veranderende codeer- of ontslagpraktijk van de ziekenhuizen (bijvoorbeeld
d.m.v. een voortijdig ontslag tot een kortere verblijfsduur komen). Een veranderende
codeerpraktijk kan op zijn beurt het gevolg zijn zowel van een verbetering van een
voorafgaande ondercodering tot een correcte codering als van een overcodering338.
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België 202
Met het tweede type analyse trachten we aan te tonen of er zich een algemene verzwaring
van de pathologie voordoet of niet. Ook hier dient een onderscheid gemaakt te worden
tussen reële en artificiële toename.
Naast het aspect verzwaring van de pathologie werden ook de “rest diagnosegroepen”
bestudeerd, die iets zeggen over de algemene kwaliteit van de gegevens. Type 1, geeft aan
dat er geen of geen aanvaardbare hoofddiagnose vermeld werd (APR-DRG 955 en 956).
Type 2 (APR-DRG 950, 951 en 952) gaat over verblijven waarvoor een belangrijke
chirurgische ingreep vermeld werd, die niet overeenstemt met de hoofddiagnose. In beide
gevallen wordt er in de financiering geen gemiddelde verblijfsduur berekend.531
Na een beoordeling van het systeem in zijn geheel wordt er overgegaan tot een globale
beoordeling van de individuele ziekenhuizen. Net zoals voor de studie van de stabiliteit
van het systeem, werd voor de individuele ziekenhuizen de evolutie van zowel het
(gewogen) verschil tussen de geobserveerde en gestandaardiseerde verblijfsduur
bestudeerd, als de proportie van verblijven met SOI gelijk aan 1 of van verblijven die in
een restdiagnose geklasseerd worden. Tenslotte kan een ziekenhuis handig inspelen om via
overcoderen en/of ondercoderen een outlier status te bekomen, die financiële baten
oplevert. Daarom worden “kleine” outliers bij SOI klassen 3 en 4 bij personen die levend
het ziekenhuis verlaten, en “grote” outliers bij SOI klassen 1 en 2 onderzocht.
Waar we niet beschikken over een op de pathologie gebaseerde typologie van de
ziekenhuizen, lijkt een vergelijking van SOI en APR-DRG over een globale periode
weinig pertinent. Voor individuele ziekenhuizen mag er echter aangenomen worden dat er
zich weinig veranderingen in het APR-DRG en SOI patroon “spontaan” zullen voordoen
in een tijdsspanne van enkele jaren en lijkt een longitudinale benadering derhalve
aangewezen. Dergelijke benadering laat overigens niet alleen het identificeren toe van
ziekenhuizen met een “afwijkend temporeel gedrag”, maar biedt tevens een gedeeltelijke
correctie voor het fenomeen van stochastische variaties, die maken dat sommige
ziekenhuizen – vooral de kleinere – ten onrechte als outlier beschouwd zouden worden.
Indien uit de globale beoordeling blijkt dat een ziekenhuis als “afwijkend” t.o.v. het
landsgemiddelde dient beschouwd te worden, wordt er, om tot een meer efficiënte
fraudeopsporing te komen, overgegaan tot een “gerichte” benadering. Hiervoor doet men
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
203
beroep op de zogenaamde “knipperlichten”. Zij gaan ervan uit dat men de
ernstigheidsgraad van een ziekenhuisopname artificieel kan opwaarderen door een
techniek (zoals mechanische ventilatie) of een pathologie (zoals chronisch obstructief
longlijden, septicemie of morbide obesitas) aan het verblijf toe te voegen. Het vergelijkend
tijdsverloop van dergelijke pathologie of techniek tussen een individueel ziekenhuis en het
geheel der ziekenhuizen laat toe systematisch afwijkende (“outlying”) ziekenhuizen te
identificeren en een gerichte keuze van te auditeren dossiers te maken. Het is tevens een
supplementaire screeningsmethode om ziekenhuizen met eventueel onjuiste
codeerpraktijken op te sporen. Stippen we hierbij aan dat de audit - het ter plaatse toetsen
aan het medisch dossier van de toegekende codes - bepaalt of de statistisch vastgestelde
evolutie al dan niet een artefact is.
Er werden, op basis van hun klinische waarschijnlijkheid, 21 knipperlichten gedefinieerd.
We geven ze hier, zoals in tabellen 2 en 3, onder vorm van hun ICD-9-CM code weer:
038.9: septicemie; 278.00: niet-gespecificeerde obesitas; 278.01: morbide obesitas; 285.1:
acute post-hemorragische anemie; 285.9: niet-gespecificeerde anemie; 287.5: niet
gespecificeerde thrombocytopenie; 413.9: ander en niet gespecificeerde angor pectoris;
425.4: primaire cardiomyopathie; 426.89: overige gespecificeerde
geleidingsstoornissen;429.79: overige sequelen van myocardinfarct
NEC;491.21:obstructieve chronische bronchitis met acute exacerbatie; 496: chronische
obstructieve longaandoening; 511.9: niet gespecificeerde pleurale uitstorting; 518.81 niet
gepreciseerde respiratoire decompensatie; 530.2: slokdarmulcus; 560.39: intestinale
impactie, andere; 584.9: niet gespecificeerde nierinsufficiëntie; 585: chronische
nierinsufficiëntie; 707.0: doorligwonde; 799.0: asfyxie; V46.1: mechanische ventilatie
(“ijzeren long”).
Aansluitend op de resultaten van de globale analyse en van de knipperlichten worden er
twee types van audit uitgevoerd: 1) een aselecte audit, en 2) een audit op knipperlicht of
“gerichte” audit. In geval van een niet-afwijkende globale analyse gaat men over tot een
aselecte audit op een gestratificeerde, aselecte steekproef van 48 dossiers, waarbij de
stratificatie gebeurt aan de hand van volgende criteria: All Patients Diagnosis Related
Groups (AP-DRG) met of zonder verwikkelingen en vier leeftijdsgroepen: < 35 jaar, 35-
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België 204
54 jaar, 55-74 jaar en 75 jaar en meer. In geval van een afwijkende globale analyse wordt
een audit op knipperlichten uitgevoerd. Men speurt dan afwijkende proporties van
“lucratieve” aandoeningen op 1) over een globale periode, of 2) in de loop van de tijd (per
semester trend). Telkens wordt hierbij een ziekenhuis vergeleken met het geheel van de
andere ziekenhuizen. Vermits er belangrijke verschillen bestaan in case mix tussen de
ziekenhuizen gaat de aandacht vooral uit naar de evolutie per semester (trend) van het
cijfer van het knipperlicht. Een voorbeeld van een afwijkende trend voor septicemie wordt
in figuur 1 gegeven.
Figuur 1: Septicemie: nationale trend versus een afwijkende trend van een ziekenhuis.
De te selecteren aandoeningen worden gekozen op basis van een rooster met de periode-
en evolutiecijfers van de 21 knipperlichten, dat hiervoor werd aangemaakt voor de periode
2000-3. Voor de ziekenhuizen met een macroscopisch afwijkend patroon wordt er, indien
er voor een of meerdere knipperlichten een afwijkend verloop wordt vastgesteld, een
selectie gemaakt van een 80-tal dossiers op basis van de proportie van dossiers per
leeftijdscategorie.
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
205
De auditeurs gaan vervolgens na of er zich voldoende gegevens bevinden in de
geselecteerde dossiers om de knipperlichtcode te verrechtvaardigen of niet. Zij dienen uit
te maken of de afwijkende trend het gevolg is van een reële toename in de frequentie van
het bestudeerde knipperlicht of van veranderende codeerpraktijken (het evolueren van
ondercoderen naar correct coderen, of van ondercoderen of correct coderen naar
overcoderen).
Voor de MKG van 2003 werd vanuit een financieringsperspectief een audit gepland voor
6.154 verblijven in 102 ziekenhuizen. Voor 90 (1,5%) verblijven kon het dossier in het
ziekenhuis niet terug gevonden worden. 987 dossiers gingen over daghospitalisaties, die
niet tussenkomen in de berekening van de ligduur en derhalve niet bruikbaar voor deze
studie. Van de 5.077 resterende dossiers werden er 104 verblijven uitgesloten omdat ze
betrekking hadden op ziekenhuizen die niet via het toenmalige financieringssysteem
betoelaagd werden. We presenteren hier de resultaten van de audits op de bruikbare
dossiers (N=4973). Het gaat over 63 aselecte audits waarbij 2.158 verblijven onder de loep
werden genomen en over 40 gerichte audits (knipperlichten) over 2.815 verblijven.
De statistische methodologie hebben we uitvoerig beschreven in hoofdstuk 3.
4.2.3 Resultaten
4.2.3.1 Macroscopische analyse De variantie-analyse toont aan dat het verschil tussen de geobserveerde (O) en
gestandaardiseerde (E) gemiddelde verblijfsduur een significante daling vertoont. Zij kon
niet aantonen dat deze daling verschilde in functie van het type ziekenhuis (al dan niet een
universitaire functie of publiek versus privaat ziekenhuis). De daling van dit verschil
bedraagt ongeveer 0,87 dagen (Tabel 1).
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België 206
Tabel 1: Geobserveerde en verwachte gemiddelde ligduur. België, 2000-2003.
2000 2001 2002 2003
Geobserveerde gemiddelde verblijfsduur 7,36 7,23 7,06 6,87
Verwachte gemiddelde verblijfsduur 6,94 7,05 7,20 7,32
Verschil gemiddelde verblijfsduur 0,42 0,18 -,14 -,45
In vergelijking met de geobserveerde gemiddelde ligduur voor 2000, dient deze daling als
belangrijk beschouwd te worden. Ook is de evolutie van dit verschil niet dezelfde voor het
geheel der ziekenhuizen (Figuur 2).
Figuur 2: Evolutie van het verschil tussen de geobserveerde en de verwachte gemiddelde ligduur nationaal en in een afwijkend ziekenhuis. België, 2000-2003.
-1,5
-1
-0,5
0
0,5
1
1,5
2000 2001 2002 2003
Jaar
Vers
chil
NationaalAfw. ZH
De analyse van de ratio (O-E)/√E leidt tot gelijkaardige vaststellingen.
De Mahalanobis-afstand (Figuur 3) toont het bestaan aan van drie afwijkende
ziekenhuizen met een probabiliteit ≤ de Bonferroni-gecorrigeerde significantie drempel
van 0,000442 (= 0,05/114).118;438;532 Voor 4 ziekenhuizen werd een probabiliteit ≤ 0,01 en
groter dan 0,001 genoteerd en voor 7 andere ziekenhuizen was ze ≤ 0,05 en > 0,01. In
figuur 3 stelt de y-as de “geobserveerde”probabilistische afstand ten opzichte van de
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
207
evolutie van de nationale gemiddelde verblijfsduur voor. De x-as is dan de “verwachte”
probabilistische afstand mocht een ziekenhuis dezelfde evolutie van de verblijfsduur
hebben als de nationale. De volle lijn, die de spreiding van de probabilistische afstanden
weergeeft indien al de ziekenhuizen een met de nationale vergelijkbare evolutie kennen, is
een visuele hulp bij de interpretatie van deze figuur.
Figuur 3: Mahalanobis-afstand voor de Belgische Ziekenhuizen, 2000- 2003.
De evolutie van de proportie ziekenhuisverblijven met een SOI gelijk aan één vertoont een
significante en aanzienlijk dalende trend (trend van de ORSOI=1 vs SOI >1= 0.90). Hij kan niet
toegeschreven worden aan een verschuiving van patiënten met SOI=1 van de klassieke
naar de daghospitalisatie, vermits dit fenomeen zich ook in die sector voordoet (Figuur 4).
Voor de periode 2000-2003 noteerden we, vergeleken met de nationale trend, een
significant lagere trend voor 35 en een significant hogere trend voor 47 ziekenhuizen.
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België 208
Figuur 4: Evolutie van het percentage verblijven van de SOI klassen in de acute ziekenhuizen en daghospitalisatie.
Percentage verblijven met SOI = 1
0%10%20%30%40%50%60%70%80%90%
100%
2000 2001 2002 2003 2004
Daghospitalisatie Klassieke Hospitalisatie
Zoals hoger vermeld definieert de financiering van de ziekenhuizen kleine en grote
outliers. Voor de kleine outliers stellen we, vergeleken met het nationale gemiddelde, bij 6
ziekenhuizen significant minder outliers vast, bij 22 significant meer en voor 86 geen
significant verschil. Voor de grote outliers bedragen deze cijfers respectievelijk, 11, 25 en
78. De proportie ziekenhuizen “met significant meer outliers” is significant groter dan die
“met significant minder outliers” en dit zowel voor de kleine (p= 0,0025) als voor de grote
(p=0,018) outliers.
4.2.3.2 Gerichte analyse: de knipperlichten Zoals voormeld werden er voor de periode 2000-2003 twee roosters aangemaakt: één
rooster met trend-ORs en één met periode-ORs. Voorbeelden van beide roosters worden in
tabellen 2 en 3 gegeven.
In tabel 2 stemmen de waarden van de eerste rij (in het blauw en vet) overeen met de
nationale trend over de semesters van de knipperlichten. De waarden van de vier volgende
rijen stemmen overeen met de afwijking voor elk knipperlicht in de eerste vier
ziekenhuizen t.o.v. die nationale trend.
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
209
In tabel 3 worden de periode odds ratio’s voor dezlfde vier ziekenhuizen weergegeven.
Ook hier worden de niet significant afwijkende ORs voor de leesbaarheid als 1
weergegeven en geeft de kolom “Totaal” aan hoeveel knipperlichten als afwijkend moeten
geïnterpreteerd worden. Hier wordt geen nationale odds ratio berekend omdat die per
definitie gelijk is aan 1.
Voor 12 knipperlichten was de nationale trend stijgend, voor 7 was hij stationair en voor 2
daalde hij. De laatste kolom met als hoofding “Totaal” geeft aan hoeveel knipperlichten als
afwijkend moeten geïnterpreteerd worden. Voor de ziekenhuizen en voor de nationale
trend worden alle niet-significant stijgende odds ratio’s als 1 weergegeven.
Hierin worden het aantal en de proporties van juiste en foute coderingen weergegeven,
benevens hun globale weerslag op de ligduur (LOS).
De onenigheden tussen auditeur en geauditeerde worden in tabel 4 weergegeven.
4.2.3.3 Resultaten van de audit In het kader van fraude detectie stelt de politieke overheid dat men alleen tot fraude kan
besluiten indien een systematische foutieve codering ook daadwerkelijk leidt tot een
financiële winst voor het frauderend ziekenhuis.
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België 210 Tabel 2: Overzichtstabel van de trend van odds ratio's, waarbij een ziekenhuis met het nationale gemiddelde vergeleken wordt, voor een selectie knipperlichten en ook de trend van het geheel der Belgische ziekenhuizen (in het vet). België, 2000-2003. 0389278002780128512859 2875 4139 4254 42689 42979 49121 496 5119 51881 5302 56039 5849 585 7070 7990 V461 Totaal
1 1,14 1,12 1,09 1,19 1 1,07 0,75 1 1 1 1,19 1,48 0,89 1 1,06 1,09 1 1,1 1,26 1,47 14 1 1 1.16 1.32 1 1.16 1 1 1 1.15 1.21 1.29 1 1 1 1.15 1 1.25 1 1.12 1 9 1 1 1 1 1.16 1.16 1.26 1.86 1 1.22 1 1.19 1 1 1.60 1 1 1 1 1 1 7 1 1 1 1.12 1.12 1 1 1.14 1 1 1.37 1.17 1 1 1 1 1 1.10 1.26 1 1 7 1 1.34 1.41 1 1.48 1.22 1 1 1 1 1 1 1 1.20 1 1 1 1 1 1.20 1 6
Nota’s: 1) de hoofding van de kolommen bevat de ICD-9-CM code van de verschillende knipperlichten. 2) de niet-significante odds ratio's worden in de tabel met een 1 weergegeven. 3) een rij wordt gevormd door de waarden voor een bepaald ziekenhuis van elk knipperlicht. Deze waarden geven telkens de afwijking van een ziekenhuis t.o.v.de nationale trend weer 4) de rij met vette cijfers geeft voor elk knipperlicht de waarde van de nationale trend aan.
Tabel 3: Overzichtstabel van de periode ORs voor een selectie knipperlichten. België, 2000-2003.
0389 27800 27801 2851 2859 2875 4139 4254 42689 42979 49121 496 5119 51881 5302 56039 5849 585 7070 7990 V461 Totaal 1.72 1 4.46 1.65 4.13 1 1 1 1 1 14.50 2.46 1 1 2.11 1 1.39 1.39 1 1 134.77 10 2.24 1 1 1 1 2.56 1 1 1 1 13.43 1 1 1 3.39 1 1 1 1 1 2.81 5 2.04 1 3.55 2.21 1 1.36 3.49 1 1 1 14.92 1 6.01 2.69 1 1 1 1 1 1.56 9.13 10
1 3.55 1 1 1 1 1 1 1 1 32.63 1 1.59 1 1 1 2.56 1 1 1.40 164.53 6 Nota’s: 1) de hoofding van de kolommen bevat de ICD-9-CM code van de verschillende knipperlichten. 2) de niet-significante odds ratio's worden in de tabel met een 1 weergegeven. 3) een rij wordt gevormd door de waarden voor een bepaald ziekenhuis van elk knipperlicht. Deze waarden geven telkens de afwijking van een ziekenhuis t.o.v. het nationale gemiddelde weer
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België 211
Aangezien de audit ging over verschillende AP-DRGs/ knipperlichten en uitgevoerd werd
door verschillende auditeurs is het moeilijk besluiten te trekken op ziekenhuisniveau. Toch
menen we dat op nationaal niveau een aantal voorzichtige vaststellingen mogelijk zijn.
Er lijken nog steeds een groot aantal codeerfouten gemaakt te worden: respectievelijk 38,6
% voor de aselecte audit en 44,4% voor de gerichte audit. Dat er significant meer
onenigheden (RR:1,14; 95%BI [1,07-1,22]) aangetroffen worden in de gerichte steekproef
beantwoordt aan de verwachtingen. Evenmin lijkt het verwonderlijk dat, n.a.v. een
gerichte audit, er zich in belangrijke mate meer veranderingen in de toekenning van de
APR-DRG voordoen wanneer tijdens een aselecte audit het ganse dossier wordt
doorgenomen (RR:3,03; 95% BI [2,33-3,93]) en niet alleen de gewraakte nevendiagnose.
Het is verder opmerkelijk dat voor beide types audit ongeveer 7/10 van de onenigheden
geen weerslag hebben in termen van APR-DRG, SOI en LOS, al zijn ze proportioneel
significant talrijker bij de aselecte audit (RR: 1,06; 95% BI [1,00 - 1,12]). In geval er
alleen een verandering optreedt van SOI, blijken er bij de gerichte audit duidelijk meer en
significante veranderingen te bestaan (RR:1,72; 95% BI [1,39-2,12]), die significant vaker
in de richting gaan van een dalende SOI dan bij een aselecte audit (RR:1,59; 95% BI
[1,35-1,88]). Bij de aselecte audits is de proportie (0,56) van verblijven met dalende SOI
(65) over het totaal van verblijven niet significant verschillend van 0,5 (p = 0.2273). Voor
de gerichte audit bedraagt deze proportie 0,89 (95%BI [0,85;0,92]) en p <0,0001.
Al deze bevindingen schijnen erop te wijzen dat er nog een groot aantal codeerfouten
gemaakt worden, dat er nog steeds ondercodering bestaat (56,0% van de verblijven van de
gerichte audits, uitgevoerd wegens een afwijkende stijgende trend, bleken correct
gecodeerd), dat de gerichte audits bij foutieve codering een fraudedetecterend vermogen
lijken te hebben, en dat aselecte audits aantonen dat er in ziekenhuizen met een niet-
afwijkend codeergedrag er nog een belangrijk aantal codeerfouten gemaakt worden.
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België 212
Tabel 4: Onenigheden tussen auditeur en geauditeerde. Per type audit: aantal, percentage, weerslag op APR-DRG-, SOI toekenning aan de verblijven, en verschil in ligduur. Aselect Gericht
Verblijven % Dagen Verblijven % Dagen
Geanalyseerde verblijven 2158 100 2815 100
Verblijven zonder
onenigheden 1326 61,5 1575 56,0
Verblijven met
onenigheden 832 38,6 -28.23 1240 44,0 - 642,68
Verblijven met foutieve
codes zonder weerslag op
gebied van APR-DRG /SOI 574 26,7 0 906 32,2 0
Verblijven met een
verandering van APR-
DRG en eventueel SOI 142 6,6 8,75 74 2,6 -224,61
Verblijven met een
toename van SOI zonder
verandering van APR-
DRG 51 2,4 148,28 28 1,0 0,59
Verblijven met een daling
van SOI zonder
verandering van APR-
DRG 65 3,0 -185,26 232 8,2 - 418,65
APR-DRG: all patient refined diagnosis related groups; SOI: severity of illness; Dagen: veranderingen in LOS uitgedrukt in dagen = dagen zoals geregistreerd vóór audit – dagen zoals herberekend na de audit.
Vermits de selectie van de knipperlichten gebaseerd is op hun fraudepotentieel, beoordeeld
op gronden van klinische waarschijnlijkheid, lijkt het zinvol hun waarde als
opsporingsmiddel van “up-coding” beter te omschrijven aan de hand van de opgedane
ervaring. Daarom keken we ook, in gevallen van onenigheid, naar de mate van onenigheid
tussen auditeur en geauditeerde per knipperlicht (Tabel 6).
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
213
Vooral chronische obstructieve longaandoening (496), morbide obesitas (278.01), niet
gepreciseerde respiratoire decompensatie (518.81), chronische nierinsufficiëntie (585) en
doorligwonden (707) schijnen efficiënte knipperlichten te zijn. Acute post-hemorragische
(285.1) en niet-gespecificeerde anemie (285.9) schijnen weinig efficiënte knipperlichten
op gebied van fraudedetectie en lijken meer een teken van onzorgvuldig coderen te zijn.
Tabel 6: Onenigheid tussen auditeur en geauditeerde voor een bepaalde aandoening: aantal, percentage en weerslag op de LOS.
ICD-9-CM code V D+ V D- V D0 V Totaal
038.9 13 108.53 28 -122.69 87 0 128 -14.16
278.01 4 34.94 22 -74.91 76 0 102 -39.97
285.1 5 39.22 3 -5.39 59 0 67 33.82
285.9 13 32.51 8 -75.23 70 0 91 -42.73
287.5 1 2.72 4 -8.65 59 0 64 -5.92
425.4 1 23.30 15 -79.65 25 0 41 -56.35
426.89 0 0 0 0 18 0 18 0
429.79 0 0 2 -8.10 33 0 35 -8.10
496 6 34.31 72 -171.93 322 0 400 -137.62
518.81 13 43.24 77 -400.17 56 0 146 -356.92
560.39 1 1.94 1 -2.88 33 0 35 -0.94
585 3 24.57 7 -21.49 92 0 102 3.09
707.0X 1 0.33 3 -17.20 7 0 11 -16.87
Totaal 61 345.62 242 -988.30 937 0 1240 -642.68
V: aantal verblijven; D+: toename van LOS uitgedrukt in dagen (dagen zoals geregistreerd vóór audit – dagen zoals herberekend na de audit ); D- : daling van LOS uitgedrukt in dagen (dagen zoals geregistreerd vóór audit – dagen zoals herberekend na de audit ); D0: geen verandering in LOS
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België 214
Naast deze explorerende benadering wordt op dit ogenblik op basis van het algoritme dat
de SOI toekent195 systematisch gezocht naar nieuwe knipperlichten. Deze aanpak moet
toelaten het detectiearsenaal te optimaliseren.
Merken we tenslotte op dat er naast evidentie van een evolutie van onder-coderen naar
normo-coderen er een groot aantal abstractie- en codeerfouten gemaakt worden zonder
weerslag op de financiering maar die wel andere toepassingen van de MKG, zoals
indicatoren van performance/kwaliteit, in gevaar kunnen brengen.
4.2.4 Discussie Wij hebben een belangrijke evolutie kunnen aantonen van het verschil tussen de
waargenomen en verwachte gemiddelde ligduur in de Belgische ziekenhuizen. Ook stelden
we een aanzienlijk aantal codeerfouten vast zonder financiële implicaties en dit zowel
tijdens de aselecte als de gerichte audits. Bij gerichte audits, uitgevoerd wegens een
opwaartse trend van een knipperlicht, werd er in meer dan de helft der gevallen geen
codeerfout aangetroffen, wat, indien supplementatie uitgsloten werd, wijst op een
verbetering van de codeerpraktijk in die ziekenhuizen.
Verder bleken de codeerfouten vastgesteld tijdens een aselecte audit zeer bi-directioneel te
zijn, waar dit voor de gerichte audits helemaal niet het geval was. In het laatste geval werd
er een onterechte verlenging van de verblijfsduur vastgesteld van 642,68 dagen voor 334
verblijven wat ons vermoeden van fraude bevestigde. Deze bevindingen kunnen
bijgedragen hebben tot de veranderingen in de geobserveerde en verwachte verblijfsduur.
Ook op het niveau van de individuele ziekenhuizen stelden we sterk afwijkende tijdtrends
vast en dit zowel op het niveau van de macroanalyse als op dat van de knipperlichten.
Het fout coderen heeft meerdere ongewenste gevolgen. Naast de financiële en
epidemiologische implicaties op het gebied van respectievelijk kostenbeheersing en
tijdsreeksen529, bemoeilijken zij de analyse van kwaliteitsindicatoren op basis van
administratieve gegevens door hun vertekenend impact op de co-morbiditeit en bijgevolg
op de risicocorrectie. Ook benadeelt het frauduleus coderen door een ziekenhuis de
financiering van de andere ziekenhuizen omdat voor de ziekenhuisfinanciering een vast
bedrag voorzien is voor het geheel der ziekenhuizen. Verder kunnen codeerafwijkingen
leiden tot moeilijkheden bij de interpretatie van de evolutie van belangrijke kenmerken van
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
215
het zorgsysteem zoals de zwaarte van de pathologie. Tenslotte kunnen zij de evaluatie van
het functioneren van het zorgsysteem verstoren, met name wanneer de geobserveerde
verblijfsduur vergeleken wordt met de verwachte verblijfsduur kan een systematische
overcodering de berekening van de verwachte verblijfsduur verstoren.
Fraude is derhalve een praktijk die niet alleen de financiering van het gezondheidssysteem
maar ook de bruikbaarheid van de MKG voor het volksgezondheidsbeleid in gevaar
brengt. Nochtans toont de ervaring aan dat het fraudebevorderend effect van het PPS kan
tegengegaan worden. Maatregelen zoals het verplicht attesteren door de behandelende
geneesheer van de bij ontslag vermelde diagnoses en ingrepen, en de kordate audit van de
ontslaggegevens met financiële weerslag in geval van fraude hebben hun doeltreffendheid
bewezen.140;321;336
Onze studie vertoont een aantal beperkingen. Zo is de keuze van knipperlichten, gebaseerd
op hun klinisch potentieel, voor verbetering vatbaar. Een selectie gebaseerd op een
grondige analyse van het algoritme dat de SOI-klasse toekent is wellicht efficiënter.
Verder is het niet onmogelijk dat de lineaire trend, die we gebruikten, niet altijd in de best
mogelijk fit van het model resulteerde. We menen nochtans dat de bereikte fits een
efficiënte, routinematig uitgevoerde fraudedetectie toelieten. Tenslotte is het aannemelijk
dat ziekenhuizen, die reeds lang frauduleus coderen en een bepaald fraudeniveau
aanhouden, ontsnappen aan onze, op een trendanalyse toegespitste fraudeopsporing. Aan
dit euvel kan verholpen worden door imput van de aselecte audits te gebruiken en door een
classificatie van de ziekenhuizen in termen van case mix uit te werken, die de
periodeanalyse meer zinvol zou maken.
Een andere zwakte van onze studie bestaat uit een mogelijk maar moeilijk te meten gebrek
aan interbeoordelaar betrouwbaarheid tussen de auditeurs, wat tot verschillende
appreciaties zou kunnen geleid hebben bij een zelfde type van codeerprobleem.
Interbeoordelaar variabiliteit is een welbekend nadeel verbonden aan het peer-review 279;349, waaraan we trachten te verhelpen door intensieve casusbesprekingen door de
auditeurs, door het uitwerken van en verwijzen naar nationale codeerrichtlijnen en door in
de mogelijkheid te voorzien om beroep aan te tekenen voor een ziekenhuis dat zich
onrechtvaardig behandeld voelt.
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België 216
Het was vooralsnog niet mogelijk, wegens het beperkt aantal auditeurs, op een correcte
manier aselecte en gerichte audits met elkaar te vergelijken op hun doeltreffendheid.
Dergelijke doelstelling veronderstelt immers het uitvoeren in dezelfde ziekenhuizen van
beide types van audit op hetzelfde ogenblik, een doelstelling die we in de toekomst hopen
te verwezenlijken.
Zoals voormeld vertoont het ‘systeem’ een neiging tot verzwaring van de pathologie en dit
zowel voor ziekenhuisopnamen als voor daghospitalisaties. Is dit een reëel verschijnsel en
betekent dit dat de gezondheid van de bevolking erop achteruit gaat, of dat zieken meer
laattijdig opgenomen worden (verminderde toegankelijkheid van het gezondheidssysteem),
of vertaalt dit een groeiend bewustzijn bij de artsen van een tot dan onderschat
gezondheidsprobleem, of heeft dit te maken met het aanbieden van meer gespecialiseerde
diensten, of is dit een gevolg van veranderende codeergewoonten?
We hebben het bestaan aangetoond zowel van verbetering van het coderen als van het
overcoderen. Het is niet onwaarschijnlijk dat nog andere van deze fenomenen bijdragen
tot de vastgestelde verzwaring van de pathologie.
De voorgestelde knipperlichtmethodologie is alleen een screening: namelijk het vaststellen
van een afwijkende evolutie van een knipperlicht. Het is de audit die uiteindelijk bepaalt of
en in welke mate de afwijkende evolutie te wijten is aan het ten onrechte toekennen van
«verzwarende» codes. De knipperlichtenmethode, vooralsnog een concept, heeft nood aan
feedback en input van de auditeurs om zijn nut aan te tonen en te verhogen. Het chronisch
gebrek aan dit type personeel is hierbij een te betreuren belemmering. Een sporadisch
uitgevoerde audit kan overigens niet dezelfde graad van ontrading genereren op de
ziekenhuizen om niet-correct te coderen als een regelmatige audit.
Tenslotte wensen wij de noodzaak te onderstrepen om de MKG te gebruiken vanuit
meerdere, complementaire invalshoeken. De kwaliteit van de gegevens is hier een
illustratie van. Het overcoderen bijvoorbeeld, berust vaak op een kunstmatige verzwaring
van de pathologie en verwikkelingen, zoals septicemie, zijn hiervoor een geschikt
instrument.
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België
217
De ICD-9CM classificatie en de erop gebaseerde APR-DRG en SOI bepalingen, maken
geen onderscheid tussen bestaande en in het ziekenhuis opgelopen verwikkelingen.
Vermits de financiering op haar beurt gebaseerd is op APR-DRGs en SOIs, levert dit
bijgevolg ook winst op aan het ziekenhuis in termen van de “verantwoorde activiteit”.
Toch lijkt het niet onlogisch dat de meerkosten die voortvloeien uit de behandeling van
verwikkelingen vergoed worden, ook al zijn ze iatrogeen. Het is dan wel nodig dat de
kwaliteit van de zorgen bijgestuurd wordt. Dit zorgenaspect veronderstelt een goede
monitoring van de zorgenkwaliteit via de MKG, die op zijn beurt een adequate
risicocorrectie veronderstelt. De gerichte audit lijkt derhalve belangrijk om, gecombineerd
met de aselecte audit, de codeerkwaliteit van het geheel der ziekenhuizen op te volgen en
te evalueren, en op die manier de monitoring van de kwaliteit van zorgen gebaseerd op
onze administratieve gegevens op een zinvolle manier mogelijk te maken.
4.3 ALGEMEEN BESLUIT
Tijdens het ganse verzamelings- en verwerkingsproces, van af de diagnosestelling tot het
aanmaken van het gegevensbestand kunnen onvolmaaktheden, fouten en vergetelheid de
kwaliteit van de gegevens aantasten en doen ze dit ook werkelijk. Ook varieert de kwaliteit
van de gegevens over de tijd en is functie van de leeftijd, geslacht van de geregistreerde;
van het type aandoening; van het type medische handeling (diagnose, ingreep); van het
gebruik van de gegevens door de diensten, die registreren; en, van het registratiesysteem
en zijn bewakingsmechanismen.
Dit betekent niet dat deze gegevens onbruikbaar zijn – laten we de baby niet weggooien
met het badwater533 – wel (1) dat ze grondig op hun waarde getoetst moeten worden, en
(2) dat er voorzichtig omgesprongen wordt met de interpretatie van de resultaten van
uitgevoerde studies. De nodige methoden en na te volgen voorbeelden van “hoe het kan”
zijn voorhanden.
Verder zijn samenwerking met andere registraties, creativiteit bij de validatie, feedback en
intensieve audit noodzakelijk, zeker wanneer deze gegevens een belangrijke rol blijken te
spelen in het financieringsmechanisme van ziekenhuizen en het gebruik van
kwaliteitsindicatoren. Vorming van de artsen, stringente regelgeving op het aanmaken van
Hoofdstuk 4: Kwaliteit van administratieve gegevens in België 218
de gegevensbestanden met inbegrip van het verplicht attesteren van de diagnosen door de
arts en intensief peer review kunnen in belangrijke mate de verstoring van de
gegevenskwaliteit veroorzaakt door het financieringsmechanisme opvangen.
De kwaliteit van de gegevens van de overlijdensstatistieken deelt grotendeels in de
gebreken van de ziekenhuisontslaggegevens. Specifieke moeilijkheden worden gesteld
door de certificatie met zijn specifieke, oorzakelijke logica, waar artsen vaak geneigd zijn
te redeneren vanuit het principe van de ernst. Ook hier lijkt een adequate vorming van de
artsen een noodzakelijke voorwaarde voor verbetering. Hoewel over het ganse land een
duidelijke verbetering van de codeerkwaliteit wordt vastgesteld blijft de tijdigheid van de
statistiek problematisch in het zuidelijk landsgedeelte en derhalve ook van de nationale
statistiek. Vergeten we hierbij niet “dat er binnen het systeem van de
bevolkingsstatistieken geen enkele andere bron voor gezondheidsgegevens bestaat, die
even universeel is in dekkingsgraad, in uniformiteit, en tijdigheid als de
sterftegegevens.”250
219
Hoofdstuk 5: Kwaliteit van zorgen
In dit hoofdstuk trachten we aan de hand van twee casussen het gebruik te illustreren van
administratieve gegevens, in casu de MKG, ten behoeve van de volksgezondheid. Zij
geven de mogelijkheden en beperkingen van administratieve gegevens weer op gebied van
het beoordelen van de kwaliteit van zorgen in de Belgische ziekenhuizen. Dit gebeurt
enerzijds via de analyse van interziekenhuis verschillen m.b.t. het keizersnedencijfer, een
procesindicator, en anderzijds via een gelijkaardige analyse maar dit keer op gebied van
letaliteit na een opname voor acuut myocardinfarct, een uitkomstindicator. Deze twee
kwaliteitsindicatoren werden uitgewerkt volgens de in deel I voorgestelde concepten en
uitgewerkte methodologie
Kwaliteit is echter organisatiegebonden en kwaliteitsinitiatieven vinden plaats binnen
organisaties, die zelf deel uitmaken van het gezondheidssysteem. Veranderingen zullen
derhalve een “multifaceted” en organisatorische aanpak vragen.534-536
Het is hier onze bedoeling beide kwaliteitsinitiatieven te kaderen in een organisatorisch
perspectief, dat een aantal aanknopingspunten biedt voor hun welslagen.
5.1 INLEIDING: KWALITEIT VAN ZORGEN, ORGANISATORISCHE CULTUUR EN
ADEQUATE GEGEVENS.
Sinds oktober 1990 worden de Minimale Klinische Gegevens (MKG) door de
ziekenhuizen geregistreerd en vervolgens door de overheid verzameld en verwerkt. Deze
gegevensset werd ontwikkeld in overeenstemming met Europese aanbevelingen.537
Vooralsnog werden de MKG voornamelijk gebruikt voor de financiering van de
ziekenhuizen. Het is in dit proefschrift de bedoeling het toepassingsgebied van de MKG
uit te breiden naar kwaliteit257/performance264 van de zorgen en de resultaten van deze
eerste verkenning ter beschikking te stellen van clinici, ziekenhuisverantwoordelijken,
artsencolleges en de overheid, als “borger” van de publieke belangen.72 Dergelijke
informatie, hoe partieel ook, biedt niet alleen aan de zorgensector de mogelijkheid tot
kwaliteitstoetsing en verbetering waar nodig maar is ook fundamenteel voor het voeren
van een gezondheidsbeleid, zeker voor een “terugtredende” overheid, die de
Hoofdstuk 5: Kwaliteit van zorgen 220
dagdagelijkse verantwoordelijkheid voor de zorgen “uitbesteedt” maar wel de
“toezichthouder, marktmeester en de borger van publieke belangen” blijft.72
Zoals voormeld (Hoofdstuk 2, sectie 2.1.1) zijn kwaliteit en performance echter complexe
begrippen, die op verschillende manieren gedefinieerd worden en die mekaar vaak
overlappen.72;262 en waarvan doeltreffendheid13 (“effectiveness”), potentiële
doeltreffendheid265 (“efficacy”), doelmatigheid13 (“efficiency”), billijkheid (“equity”) 6;15;16;538;539 en verantwoording afleggen (“accountability”)70;71;540;541 door zorgverstrekkers
en overheid basisbegrippen vormen(Hoofdstuk 2, sectie 2.1.1). Donabedian voegt hieraan
de begrippen aanvaardbaarheid van de behandeling, legitimiteit en optimaliteit toe om tot
een overkoepelende visie van kwaliteit te komen.265
Aanvaardbaarheid van de behandeling houdt in dat artsen rekening houden met
patiëntenvoorkeuren, met zijn vragen en bekommernissen waaronder de kosten, en hem de
doeltreffendheid van de zorg zodanig uitlegt dat de patiënt een werkelijk geïnformeerde
keuze kan maken. Deze speciale focus op de patiënt, de zogenaamde patient-
centeredness265;268;542, en ook op het tijdig verstrekken van zorgen krijgen overigens heden
ten dage steeds meer aandacht bij de beoordeling van kwaliteit268;543. Legitimiteit betekent
dat de zorg aanvaardbaar moet zijn voor de maatschappij. Optimaliteit tenslotte wordt
bereikt wanneer de verstrekte zorg “optimaal” doeltreffend is of bij de beste verhouding
tussen kwaliteit en kosten.
Kwaliteitselementen kunnen elkaar versterken of integendeel met mekaar in conflict
komen. De meest storende conflicten ontstaan wanneer maatschappelijke en individuele
voorkeuren verschillen. Het is dan de faire verdeling over de ganse bevolking van zorgen
in functie van medische noden, risico en het nut van de zorgen, die het arbitrageproces
dient te leiden.265;270Kwaliteit, waarin het begrip aanvaardbaarheid voor de individuele
patiënt en voor de maatschappij vervat zijn, kan dus niet alleen in technische termen
beoordeeld worden door professionele zorgverleners.257;265;269 In deze visie, die onze
analyses inspireerde, wordt er bijgevolg rekening gehouden met zowel technische aspecten
als interpersonele relaties.257;265
Hoofdstuk 5: Kwaliteit van zorgen
221
Administratieve gegevens, zoals onze MKG, laten echter niet toe de kwaliteit van zorgen
in hun totaliteit te meten. Zij zijn immers alleen een neerslag van een selectie van
technische aspecten van zorg in verband met diagnose, behandeling en uitkomsten.
Uitkomsten van behandelingen kunnen uitgedrukt worden als de som van de
doeltreffendheid van de behandeling plus risicofactoren, die het antwoord op de
behandeling beïnvloeden, plus kwaliteit van de zorg plus toeval.188Vermits de
doeltreffendheid van een behandeling gekend is en de toevalsfactor door statistische
methodologie kan ondervangen worden, is het mogelijk de kwaliteit van de verstrekte
zorgen te beoordelen op voorwaarde dat men corrigeert voor de risicofactoren.178;188Door
de afwezigheid van een ideaal systeem van risicocorrectie en het feit dat de gebruikte
systemen tot verschillende resultaten leiden is deze correctie, zoals voormeld (Hoofdstuk
2, sectie 2.2.1.4), geen eenvoudige zaak189;325 en stelt men dat de grootste voorzichtigheid
geboden is bij de interpretatie van studies gebaseerd op administratieve
gegevens102;103;319;494.Verder is het zo dat risicocorrectie niet alleen problemen kan stellen
wanneer het over uitkomstindicatoren gaat maar ook bij de interpretatie van
procesindicatoren zoals het onder- of overgebruik van diensten.
Overigens hebben we te maken met nog andere beperkingen en onzekerheden: verschillen
in definities van diagnosen en ingrepen, en onvoldoende correctie voor vertekening
(“confounding”) door geen of onvoldoende rekening te houden met de sociaal-
economische status (SES) en met verwijzingspatronen en andere vormen van
patiëntenselectie544. Een laatste, dubbele onzekerheid houdt verband met de
onvolmaaktheid van de gegevens en dit enerzijds wegens problemen in verband met het
abstraheerproces en het toekennen van een diagnose en anderzijds wegens
codeerproblemen (overcodering en ondercodering), die maken dat de vergelijkingen tussen
ziekenhuizen vertekend kunnen zijn.1;60;79;101;135;138;163;169;189;312;319.
Administratieve gegevens laten derhalve geen definitieve uitspraken toe op gebied van
kwaliteit/performance. Hun gebruik als een screening545 naar onder- en bovenmaatse
kwaliteit van zorgen op basis van duidelijk omschreven en goed geregistreerde processen
(bijvoorbeeld het keizersnedencijfer) of uitkomsten [bijvoorbeeld perinatale uitkomsten na
keizersnede, en sterfte na een acuut myocardinfarct (AMI)] lijkt wel een bruikbare
Hoofdstuk 5: Kwaliteit van zorgen 222
werkhypothese. Laten we ervan uitgaan dat het adagium “Wat niet gemeten kan worden
kan ook niet veranderd worden” het begin is van de wijsheid ook bij het onderzoek over
gezondheidsdiensten546, en dat elke benadering voor het beoordelen van kwaliteit kan
bekritiseerd worden, of de meting nu berust op ontslaggegevens of op patiëntendossiers. 547
Daar we ons bewust zijn van de beperkingen bij de analyses, trachten we verder de nodige
caveats op een zichtbare manier aan te brengen en rekenen op de inbreng van de clinici en
de Colleges van geneesheren om deze indicatoren tot een voor hen bruikbaar instrument te
maken.409;548
Concluderend: de bij de indicatoren gewonnen informatie is een screening545, die alleen
via een verder onderzoek tot een vaststelling kan leiden. Zij tracht aan de ziekenhuizen
een aanknopingspunt aan te reiken voor zelfevaluatie en eventuele verbetering, helpt de
Colleges ziekenhuizen met vermoedelijke bovenmaatse en ondermaatse zorgen te
identificeren, en biedt hen en aan de overheid de mogelijkheid om bepaalde facetten en
oorzaken van mogelijke verscheidenheid364 binnen het gezondheidssysteem te
identificeren, aanknopingspunten voor verder te ondernemen acties.
Voor onbedoelde voorvallen (Hoofdstuk 2, sectie 2.3) lijkt, zoals voormeld, de rol van
administratieve gegevens echter beperkter en situeert zich vooralsnog veeleer in hun
monitoring zowel op een globaal nationaal vlak als op dat van individuele ziekenhuizen
dan wel in een vergelijking tussen ziekenhuizen.177;258Verder zijn sommige auteurs ervan
overtuigd dat, wegens de mogelijke gerechtelijke implicaties, het melden van een
ongewenste gebeurtenis een systeem veronderstelt dat bescherming biedt aan de melder
behalve in geval van patente nalatigheid.495;549;550 Vanuit een standpunt van
kwaliteitsverbetering en van gedeelde verantwoordelijkheid van alle partners in het
zorgsysteem, lijkt het daarentegen beter openheid na te streven. Een melding laat immers
toe verbeteringsacties op te zetten en biedt ook op gerechtelijk vlak het voordeel
kwaliteitsvolle praktijken te kunnen aantonen.496;551
Voor onze analyses deden wij beroep op de indicatoren van de Agency of Healthcare
Research and Quality (AHRQ), uitgewerkt door de AHRQ in samenwerking met het
Evidence-based Practice Center van de Stanford universiteit. Deze, naar we menen,
uitstekend onderbouwde indicatoren zijn net als de onze gebaseerd op
Hoofdstuk 5: Kwaliteit van zorgen
223
ziekenhuisontslaggegevens, ICD-9-CM codering, AP-DRGs en APR-DRGs. 77;552 Bij deze
oefening stellen we twee indicatoren voor: het keizersnedencijfer bij laagrisico
verlossingen en ziekenhuisletaliteit na opname voor acuut myocardinfarct. We menen
echter dat een aantal processen en structuurelementen gemeenschappelijk zijn binnen een
ziekenhuis en dat hiermee rekening dient gehouden te worden bij de verbeteringsacties die
men, naar aanleiding van de resultaten van de uitgevoerde screening, wil opzetten.
Het verzekeren van de verantwoordelijkheid en de verbetering van de kwaliteit zijn twee
van de meest betekenisvolle uitdagingen waarvoor de gezondheidssystemen geplaatst
worden553:
“Health systems fail to provide treatments that are know to work, persist in using
treatments that don’t work, enforce delays and tolerate high levels of error”.554Om hieraan
te verhelpen is er inzicht nodig in wat een organisatie is en hoe een verandering best
doorgevoerd wordt, maar ook welke rol de MKG hierin eventueel kunnen vervullen.
Een werkelijke verbetering vereist niet alleen een verandering van de individuele
praktijkvoering maar ook van het zorgsysteem als organisatie.555 Het is immers zo dat
organisatorische problemen - het “systeem” en niet de “individuen” - en organisatorische
cultuur bijna altijd de oorzaak zijn van “rampen” op gebied van mortaliteit en dat ze,
wanneer onderkend, een vertrekput zijn voor verbeteringsacties.426;495-498;556 “In aviation it
is not merely the pilot who is responsible for the outcome of a flight; it is the pilot, the air
traffic controllers, the maintenance crew, the stewards, and the ground staff – in other
words, the aviation system.”495
Als men wenst een organisatie te veranderen lijkt het aangewezen die strategieën voor
kwaliteitsverbetering te gebruiken die de grootste slaagkans bieden.557 Dit houdt onder
meer in (1) dat men beter interventies plant met meerdere facetten dan enkelvoudige zoals
het verspreiden van richtlijnen of opvoedkundig materiaal; (2) dat men grotere slaagkansen
heeft indien interventies gecombineerd zijn met audit en feedback, en met een
“onderscheiding” voor kwaliteitsvolle organisaties; en, (3) dat financiële stimulansen
verandering kunnen teweegbrengen, maar een bot instrument zijn en er gevaar bestaat voor
perverse reacties.557
Hoofdstuk 5: Kwaliteit van zorgen 224
Elke veranderingsstrategie van de organisatorische cultuur dient een evenwicht na te
streven tussen continuïteit en vernieuwing, waarbij een identificatie gebeurt van de te
behouden en versterken, en de te veranderen culturele aspecten.558Succesvolle strategieën
houden rekening met de noden, vrees en motivatie van het personeel en dit op alle
niveaus.558Het is daarbij belangrijk voor ogen te houden dat diepgewortelde meningen en
waarden zoals de autonomie van de clinicus bijvoorbeeld moeilijk te veranderen zijn.558
Verandering heeft overigens alleen een slaagkans wanneer degenen waarvan het werk
bestudeerd wordt ook in het veranderingsproces betrokken werden.555
Een aantal ervaringen kunnen behulpzaam zijn bij de concrete uitwerking van een
veranderingsinitiatief. Hoewel een uitgebreide artsenparticipatie in een kwaliteitsteam
wenselijk is, lijkt ook een intense deelname van ziekenhuisstaf en managers belangrijk en
stelt men dat samenwerking tussen beide groepen de sleutel tot verandering is.547;559 Het is
ook niet zeker dat clinici, die vrijwilligers zijn voor de rol van klinische leiders, de nodige
ervaring met organisatorische verandering hebben.557
Men acht het in het algemeen verkieslijk beroep te doen op multidisciplinaire teams om
veranderingen te verwezenlijken, maar dit vereist volgehouden aandacht en aanpassing.560
Hierbij dient men er rekening mee te houden dat een inzet van meerdere eenheden in een
ziekenhuis best gebeurt voor aan elkaar gerelateerde kwaliteitsprojecten. Immers, indien
men ze inzet voor een wijde waaier van ongerelateerde kwaliteitsprojecten is het gevaar
voor focusvervaging niet ondenkbeeldig.547
Een randvoorwaarde voor succes van een nationale, kwaliteitsverbeterende strategie is de
voortdurende investering in een passende infrastructuur en in beschermde tijd voor
kwaliteitsbevorderende activiteiten.557 Veranderingen veronderstellen namelijk tijd en
ruimte waarbinnen de nieuwe vaardigheden kunnen verworven worden zoals controle op
het werkproces, ontwikkelen en implementeren van klinische paden, en het veranderen van
de natuur van het professionele werk.561
Adequate informatie, die verschillen beschrijft tussen gezondheidszorgverleners in
kwaliteit, kosten en beschikbaarheid van diensten, wordt vaak als essentieel beschouwd
voor verbeteringsinitiatieven. Zij zou onder meer tot een bewuste en gefundeerde
Hoofdstuk 5: Kwaliteit van zorgen
225
consumentenkeuze kunnen leiden, die op haar beurt de zorgensector zou verplichten tot
kwaliteitsverbetering.562
In een studie, waarbij het effect van niet of nauwelijks risicogecorrigeerde “profielen” op
het consumentengedrag bestudeerd werd, bleken profielen dit gedrag echter niet te
beïnvloeden,562 zelfs indien dat publiek het verlangen naar dergelijke informatie kenbaar
gemaakt had.402;553 Zijn de consumenten ontevreden over wat zij beschouwen als de sluier
van geheimhouding en beroepsbescherming en/of verlangen zij niet steeds te handelen als
consument in alle aspecten van het moderne leven? 553
Profielen stimuleerden echter wel organisaties om hun eigen gegevenssystemen te
ontwikkelen en te verbeteren.553
Wegens het vaak misleidende karakter van profielen (zie hoofdstuk 3, sectie 3.3.1)
verkozen wij een anonieme feedback te verstrekken aan de clinici en de verschillende
beleidsinstanties. Wij maakten op de anonimiteitregel één uitzondering: in de feedback
naar de Colleges van geneesheren kan de anonimiteit van de Bonferroni-gecorrigeerde
“outlier” ziekenhuizen opgeheven worden, indien de betrokken ziekenhuizen hiermee
instemmen. Het leek ons overigens noodzakelijk dat de feedback naar de clinici gedragen
werd door gezaghebbende instanties zoals de Colleges van geneesheren, dat hij verbetering
als bedoeling had, dat hij duidelijk de graad van evidentie aangaf en dat hij voorzag in een
hulp bij de interpretatie.
Gegevens gebruikt voor verbeteringsinitiatieven moeten accuraat genoeg zijn om acties op
te zetten maar hoeven niet perfect zijn553;554omdat het bekomen van perfecte gegevens
uitermate kostelijk en tijdsverslindend190;553is. We gaan er derhalve van uit dat
pragmatisme de sleutel voor verandering is. Bijvoorbeeld bleek het gebruik maken van
kleine representatieve steekproeven met zowel kwantitatieve als kwalitatieve gegevens en
het inbouwen van gegevensverzameling in het dagelijkse werk gepaard te gaan met een
toename van het voorgeschreven oogonderzoek bij diabeteslijders van 65% tot 85%.554
Een stevige structuur voor adequate gezondheidsinformatie is bijgevolg een belangrijke
hulp voor het opzetten van verbeteringsinitiatieven in de gezondheidszorg.563Het is dan
zaak na te gaan of de MKG voldoende accuraat zijn om zinvolle kwaliteitsinitiatieven te
laten kiemen.
Hoofdstuk 5: Kwaliteit van zorgen 226
5.2 KAN HET SCREENEN VOOR INTERZIEKENHUIS VERSCHILLEN IN
KEIZERSNEDENCIJFER BIJ LAAGRISICO VERLOSSINGEN DOOR MIDDEL VAN
ADMINISTRATIEVE GEGEVENS BIJDRAGEN TOT KWALITEITSINITIATIEVEN IN DE
GEZONDHEIDSZORG?
Gebaseerd op dit onderhoofdstuk, dat onderzoek uit 2004-6 weergeeft, boden we een
manuscript aan: Aelvoet W, Windey F, Molenberghs G, Verstraelen H, Van Reempts P,
Foidart JM. Screening for inter-hospital differences in cesarean section rates in low-risk
deliveries using administrative data. An initiative to improve the quality of care.
BMC Health Services Research 2008;8(1)3.133
5.2.1 Inleiding Tijdens de laatste drie decennia namen de keizersnedencijfers (KSCs) voortdurend toe en
werden er ruime verschillen in KSCs vastgesteld tussen landen, streken en zelfs
ziekenhuizen, met een vergelijkbaar sociaal-economisch profiel.564-574. Dit leidde er toe dat
keizersneden (KS) gingen beschouwd worden als een te vaak gebruikte ingreep. Zowel
electieve herhalingssectio’s als primaire electieve KS droegen in belangrijke mate bij tot
de stijging van het KSC. In de VS bijvoorbeeld, steeg, tijdens de periode 1998 tot 2001,
het KSC met ongeveer 14%, en stegen de cijfers voor een primaire en een electieve,
primaire KS met respectievelijk 13% en 53%.575 terzelfder tijd daalde, tijdens de periode
1996 tot 2000, het cijfer van de vaginale bevallingen na sectio (VBS) met 27% wegens, de
zelden optredende maar potentieel catastrofale risico’s en medico-legale
beschouwingen.576-582
In afwezigheid van gerandomiseerde klinische studies is het moeilijk de balans op te
maken tussen een electieve KS en een vaginale bevalling.572 De bestaande evidentie
suggereert dat verschillen in korte en lange termijn uitkomsten voor moeder en kind tussen
een electieve KS en vaginale bevalling verminderen583 maar geeft nog steeds aan vaginale
bevalling het voordeel565;573;583-588, hoewel sommige auteurs stellen dat een electieve KS
even veilig is of zelfs veiliger dan een vaginale bevalling589-592.
Hoofdstuk 5: Kwaliteit van zorgen
227
De korte en lange termijn verwikkelingen na een vaginale bevalling bestaan onder meer uit
perineale pijn; urinaire en fecale incontinentie (vooral na een forceps 583;590;593-595) en
maternale transmissie van bepaalde infectieziekten. Een poging tot vaginale bevalling kan
resulteren in een spoedkeizersnede, die geassocieerd wordt met een verhoogde maternale
mortaliteit en morbiditeit. Tenslotte kunnen vaginale verlossingen gepaard gaan met intra-
partum sterfgevallen en geboorte traumata’s.583;589
Voor KS omvatten de korte en lange termijn verwikkelingen pijn; urinaire en
wondinfecties; maternale sterfte; thrombo-embolische verwikkelingen; abruptio placentae
(2-4%); placenta previa (1-4%) en accreta (toegenomen met een factor van 10 over de
laatste 50 jaar) tijdens de volgende zwangerschappen; hysterectomie van het post-partum
(0.25-4.6%); ectopische zwangerschap; belangrijke obstetrische bloedingen bij de
volgende bevallingen; beschadiging van de bekkenbodem; fecale en urinaire incontinentie,
zij het waarschijnlijk in mindere mate dan na een vaginale
bevalling.574;583;589;590;593;595;596;596-598 Daarenboven zijn keizersneden gekenmerkt door
hogere kosten voor moeder en maatschappij564;568;593 en ging de toename van het KSC niet
gepaard met een lagere perinatale sterfte of met lagere asfyxiecijfers.574 Financiële
motieven en relatieve gemakkelijkheid kunnen tussenkomen in de besluitvorming en het
kan moeilijk zijn een onderscheid te maken tussen patiënten- en artsenkeuze.565;572;583-
585;589;599-601 Geïnformeerde toestemming; voorkeur en autonomie van de moeder; en
artsenfactor spelen eveneens een rol.573;574;583;602-606 De afnemende pariteit (de meeste
vrouwen hebben minder dan twee zwangerschappen) en medico-legale beschouwingen
kunnen de beslissing over de wijze van bevalling beïnvloeden.583;589;590;594
Om in een context van een eventueel overgebruik een valide, interziekenhuis vergelijking
van KSCs te maken, dient men de verplichte keizersneden uit te sluiten, uitgevoerd
wegens medische indicaties. Na exclusie van vrouwen, die reeds een keizersnede
ondergingen, identificeerden Gregory et al., o.b.v administratieve gegevens over 463.196
bevallingen, een aantal klinische indicaties voor een electieve (vóór de arbeid), primaire
KS (een vrouw die nog geen KS onderging).577 Twaalf klinische entiteiten bleken in
92,9% van alle keizersneden terug gevonden te worden: malpresentatie met inbegrip van
stuit (57,6%), antepartum bloeding (10,1%), herpes (5,49%), ernstige hypertensie (4,01%),
ander uteruslitteken (1,12%), meerlingzwangerschap (2,33%), macrosomie (4,52%), niet-
Hoofdstuk 5: Kwaliteit van zorgen 228
ingedaald foetaal hoofd (1,57%), maternale collageenziekten (1,60%), andere hypertensie
(3,03%), preterme zwangerschap (1,49%), fetale congenitale aandoening (0,15%), andere
(7,13%). Deze auteurs bepaalden een normatief cijfer van 4% primaire, electieve KS, en
stelden dat bij lagere cijfers ondergebruik dient vermoed te worden. 577
Een andere studie, ditmaal over de ganse VS, bevestigde niet alleen deze bevindingen
maar stelde daarenboven tussen 1997 en 2001 een significante toename vast van primaire,
electieve keizersneden. Meer bepaald voor ICD-9-CM codes m.b.t. malpresentatie (van
26.1 naar 29.8 ‰), antepartum bloeding (van 4,3 naar 5,9 ‰), ernstige hypertensie (van
1,9 naar 2,8 ‰), niet-ingedaald hoofd (van 1,0 naar 2,2 ‰), preterme zwangerschap (van
0,8 naar 2,0 ‰), maternale collageenziekten (van 0,9 naar 1,8 ‰) werden deze toenamen
vastgesteld. Dit wijst ofwel op een toegenomen incidentie van ernstiger vormen van deze
aandoeningen ofwel op een verandering van praktijkvoering, waarbij de arts voor dezelfde
indicatie voor een andere wijze van verlossing opteert.575
Doeltreffendheid, doelmatigheid, billijkheid en verantwoording afleggen zijn
basisbegrippen die gebruikt worden door zorgverstrekkers, onderzoekers, internationale
organisaties en overheden om performance en kwaliteit te beschrijven.6;7;15;16;70-72;265;538;539
We steunden hierbij op de definitie van het Institute of Medicine (IOM): “Kwaliteit van
zorg is de mate waarin de gezondheidsdiensten voor individuen en bevolkingen de
waarschijnlijkheid van verhoopte uitkomsten verhogen en overeenstemmen met de huidige
professionele kennis” en erkennen we de noodzaak om zowel processen als uitkomsten te
betrekken bij het beoordelen van kwaliteit.272;607 Verder inspireren we ons op het National
Healthcare Quality Report, dat een kader uitwerkte voor kwaliteit in de gezondheidszorg
met elementen zoals effectiviteit, veiligheid, tijdigheid, patiëntengerichtheid, billijkheid en
patiëntennoden (bijvoorbeeld gezond blijven, beter worden, leven met ziekte en
onbekwaamheid, omgaan met het einde van het leven).608 Tenslotte ontlenen we aan
Donabedian het inzicht dat kwaliteit technische, interpersonele en maatschappelijke
aspecten bevat, en dat daarbij rekening dient gehouden te worden met de aanvaardbaarheid
van de zorg voor de maatschappij.257;265
Hoofdstuk 5: Kwaliteit van zorgen
229
Ondanks de complexiteit van de keuze tussen electieve KS en vaginale bevalling bij
laagrisico verlossingen, menen we, zoals voormeld, dat de bestaande evidentie in het
voordeel pleit van een vaginale bevalling. Overigens zijn er verschillende landen waar lage
KSCs gepaard gaan met lage perinatale sterftecijfers, wat suggereert dat goede perinatale
uitkomsten geen hogere KSCs vereisen en dat lagere gestandaardiseerde cijfers
overeenkomen met betere obstetrische zorgen, hoewel een optimaal KSC nog niet bepaald
werd en ondergebruik van KS beschreven werd. 573;607 Klinische en epidemiologische
beschouwingen en ook het feit dat verschillende landen de wijze van verlossing als
kwaliteitsindicator564;609 gebruiken of gaan gebruiken, en dat geïnformeerde toestemming
en maatschappelijke beschouwingen tussenkomen in de besluitvorming leidden er ons toe
het KSC te gebruiken als kwaliteitsindicator. We dienden dan wel aan te tonen dat
verschillen in KSC tot verschillen in uitkomst leidden. 257;276;294;607
In een perspectief van kwaliteitsverbetering toonden we in deze studie klinisch en
statistisch belangrijke interziekenhuis verschillen aan in KSCs en een opwaartse nationale
KSC trend bij laagrisico bevallingen. Verder stelden we ook vast dat ziekenhuizen met een
hoog KSC geen betere neonatale uitkomsten hebben en dat er ook sprake was van
ondergebruik.
5.2.2 Methoden
5.2.2.1 Gegevensbronnen De MKG bevat patiëntengegevens (waaronder geboortejaar, geslacht, verblijfplaats, een
anoniem ziekenhuisidentificatienummer), verblijfgegevens(waaronder het jaar en de
maand van opname en ontslag, transfer vanuit en naar een ander ziekenhuis met
specificatie van het type ziekenhuis) en een onbeperkt aantal nevendiagnosen en ingrepen.
De ziekenhuizen worden verder gekarakteriseerd volgens onderwijsopdracht (al dan niet),
type van eigenaar (publiek of privé) en het al dan niet beschikken over intensieve
maternale en neonatale zorgen. De MKG verzamelt gegevens over alle verblijven met
inbegrip van niet-residenten.
Omdat we niet beschikken over een uniek identificatienummer dat zou toelaten een
transfer van een kind van één ziekenhuis naar een ander op te volgen, zijn de maternale en
Hoofdstuk 5: Kwaliteit van zorgen 230
de geboortegegevens van een getransfereerd kind niet beschikbaar in het opnemend
ziekenhuis. Deze gegevens zijn echter wel beschikbaar in het ontslagend ziekenhuis.
Om de volledigheid en de accuratesse van de gegevens na te gaan, welbekende pijnpunten
van administratieve gegevens182, werden ze vergeleken met gegevens van (1) het Nationaal
Instituut voor de Statistiek (NIS), dat voornamelijk betrekking heeft op residenten, (2) het
Studiecentrum voor Perinatale Epidemiologie (SPE) 610 en (3) elders gepubliceerde611
gegevens, om vervolgens te bepalen welke gegevens zouden gebruikt worden voor de
analyse. In het SPE register worden de perinatale sterfgevallen en de geboorten
geregistreerd, die zich in de Vlaamse obstetrische eenheden (residenten en niet-residenten)
voordoen, en verder een proportie van thuisbevallingen, die ongeveer 1 % van alle
bevallingen uitmaken. De gegevens worden op continue wijze verzameld en onderworpen
aan een georganiseerd systeem van kwaliteitsbewaking.610
5.2.2.2 Definitie van de studiepopulatie
Een valide interziekenhuis vergelijking van KSCs vereist ofwel een correctie voor case
mix of de definitie van een homogene risicogroep. In deze studie, trachtten we een
deelgroep van parturiënten te identificeren met een laag risico op een KS.607;612;613
Daarvoor steunden we op het werk van de Agency for Healthcare Research and Quality
(AHRQ)564, op literatuur die de redenen voor een verplichte KS575;577;607 aangeeft, op input
van het “College van geneesheren voor de moeder en pasgeborene” en op de volledigheid
en accuratesse van de gegevens.
Uit het geheel der bevallingen werden de laagrisico bevalling afgezonderd door exclusie
van bevallingen gekarakteriseerd door een abnormale ligging (met inbegrip van stuit), een
prematuriteit (< 37 weken), een doodgeboorte, een meerlingzwangerschap, een ingreep
voor stuitligging, wat de exclusiecriteria van de AHRQ zijn. Op vraag van het College
werden daarenboven bevallingen van kinderen met intra-uteriene groeirestrictie (IUGR) (<
2500g) of macrosomie (> 4499g) uitgesloten. Alle maternale karakteristieken werden
geïdentificeerd aan de hand van DRGs, of ICD-9-CM diagnoses and ingrepencodes
(Precieze ICD-9-CM diagnose en ingrepencodes kunnen op de AHRQ website gevonden
worden : (p. A27 http://www.qualityindicators.ahrq.gov/iqi_download.htm)).
Hoofdstuk 5: Kwaliteit van zorgen
231
Vanuit de MKG identificeerden we, voor de periode 2001 tot 2004, 459.171 levend
geboren eenlingen, in hoofdligging. Voor 455.933 kinderen, de bronpopulatie, konden we
de obstetrische gegevens van hun moeder terugvinden. Hiervan werden er 86.310 kinderen
(18,96%) via een keizersnede geboren. Door toepassing van de voormelde criteria op de
bronpopulatie definieerden we een studie en een controle populatie met respectievelijk
381.989 en 73.944 kinderen waarvan er respectievelijk 49.578 (12,98%) en 36.732
(49,68%) via keizersnede geboren werden.
5.2.2.3 Analyse De analyse had als bedoeling kwaliteitsinitiatieven te onderbouwen en niet het blameren
van individuen.495;496 We streefden ernaar zowel ziekenhuizen te identificeren met
bovenmaatse als met ondermaatse kwaliteit. De eersten als benchmark en
voorbeeldfunctie, de laatsten om hen te helpen hun kwaliteit te verbeteren. Daarom werd
ieder Belgisch ziekenhuis vergeleken met het geheel der ziekenhuizen.
Twee types analyses werden uitgevoerd: een eerste gericht op de KSCs van de ganse
tijdsspanne van de studie (de periode) en een tweede waarbij de aandacht uitgaat naar de
semestriële evolutie (de trend) van de KSCs.
In de literatuur werd er gesuggereerd dat administratieve gegevens niet de nodige
informatie van voldoende kwaliteit bevatten om systematische verschillen in case mix te
corrigeren in geval van een eerder klein relatief risico (RR), zoals een RR van 0,75.100
Daarom bepaalden we een zone van niet-interpretatie waarin we het cijfer of trend van een
ziekenhuis, vergeleken met het nationale cijfer en trend, als niet interpreteerbaar in termen
van “hoger” of “lager” beschouwden. Om de grenzen van dit gebied vast te leggen
berekenden we eerst de afwijking van een ziekenhuis ten opzichte van het nationale cijfer
en trend als volgt: afwijking (in %) = (RR -1) x 100. Vervolgens werd voor het KSC de
ondergrens gedefinieerd als een afwijking van - 25 % - wat overeenstemt met de RR van
0,75 - en de bovengrens als een afwijking van + 35%. Voor de trend, waar we over geen
literatuurreferentie beschikten, bepaalden we de boven- en ondergrens respectievelijk als
+ 5% en - 5%. In de andere gevallen, met een belangrijke afwijking, werden de resultaten
van de “screening” in functie van de beschikbare evidentie geïnterpreteerd.
Hoofdstuk 5: Kwaliteit van zorgen 232
Deze getallen werden eerder als een maatstaf van statistische evidentie gezien. Wij
noemden ze 1) “sterk” indien de probabiliteit om een even grote of nog grotere afwijking
aan te treffen als die van het bestudeerde ziekenhuis, gelijk is aan of kleiner dan
0,05/aantal te vergelijken ziekenhuizen (de zogenaamde Bonferroni-correctie voor
meervoudig gelijktijdig toetsen); 2) “matig” indien die probabiliteit kleiner is dan 0.05
maar groter dan 0,05/aantal te vergelijken ziekenhuizen; en 3) in de andere gevallen
“zwak”.
5.2.2.4 Doelstellingen van de studie De feedback van deze analyses viseert drie doelen: een feedback naar de ziekenhuizen om
kwaliteitsverbetering te stimuleren, een feedback naar de Colleges van geneesheren om
hen toe te laten ziekenhuizen te identificeren met zowel bovenmaatse als ondermaatse
kwaliteit, en een feedback naar de overheid om haar beleid te onderbouwen. Hij bestaat
hoofdzakelijk uit een grafische weergave van de afwijkingen van alle ziekenhuizen van het
nationale cijfer/trend, en uit een tabel met deze afwijkingen met een aanduiding van hun
statistische evidentie. Een hulp bij de interpretatie, met informatie over zowel de periode
als trendanalyse wordt er tevens in verstrekt. De beslissingsboom ervan wordt in “Bijlage
1” gegeven.
In de grafieken presenteren we drie categorieën ziekenhuizen: een groep met een “hoog
KSC”, bestaande uit de ziekenhuizen waarvan het betrouwbaarheidsinterval van het
keizersnedencijfer (na Bonferroni correctie) boven de zone van niet-interpretatie ligt; een
“laag KSC” groep bestaande uit de ziekenhuizen waarvan het betrouwbaarheidsinterval
van het keizersnedencijfer (na Bonferroni correctie) onder de zone van niet-interpretatie
ligt; en, in de andere gevallen, een “gemiddeld KSC” groep.
5.2.2.5 Neonatale eindpunten Daar het optimale KSC onbekend is, vergeleken we de drie KSC groepen op gebied van
neonatale uitkomsten. Perinatale morbiditeit en mortaliteit zijn voornamelijk te wijten aan
ademhalingsstoornissen, waarvan hyaliene membraanziekte (RDS), meconium aspiratie
syndroom (MAS) en tachypnee van de neonaat (TTN) de meest frequente zijn.614;615 Wij
selecteerden 1-minuut Apgar scores616-618; RDS, MAS, TTN, respectievelijk ICD-9-CM
Hoofdstuk 5: Kwaliteit van zorgen
233
codes 769,770.1 en 770.6; nood aan ademhalingondersteunende behandeling, en transfer
naar een gespecialiseerde dienst als perinatale eindpunten. Merk op dat in onze ogen de 1-
minuut Apgar scores, die in essentie foetaal lijden weerspiegelen, eerder als
procesindicator dan als uitkomstindicator dient beschouwd te worden. De 5-minuut Apgar
scores dienden dan om gevallen te identificeren van borelingen die langs vaginale weg
geboren waren en die wellicht beter via een KS zouden geboren zijn.
Om variabiliteit tussen verschillende waarnemers tegen te gaan en in overeenstemming
met de literatuur categoriseerden we de Apgar scores in drie groepen: “zeer lage” (Apgar
0-3), “lage” (Apgar 4-6), en “goede” (Apgar > 6) scores. 618-620 De volledigheid van de
Apgar scores is wellicht beter dan die van de andere neonatale eindpunten vermits ze
opgevraagd worden door middel van expliciet in te vullen items in tegenstelling tot de
andere, die van het type “open vragen” zijn en door een ziekenhuis al dan niet
geregistreerd worden. Omdat sommige majeure congenitale afwijkingen gerelateerd
kunnen zijn met een lagere Apgar score (Bijlage 2)621, voerden we de analyses ook uit met
uitsluiting van die gevallen.
5.2.2.6 Statistische methodes Wij veronderstelden dat wij via onze selecties een "Studie populatie" van laagrisico
bevallingen geïdentificeerd hadden. Om dit na te gaan hebben we het relatief risico en zijn
95% betrouwbaarheidsinterval berekend van een bevalling via keizersnede in de "Studie
populatie" versus in de "Controle Populatie". Deze RRs en hun 95%
betrouwbaarheidsinterval werden berekend door middel van StatCalc, een statistische
module van Epi Info 2000, gecreëerd door de Centers for Disease Control, en het Global
Program on IADS van de WGO.
Vermits onze aandacht voornamelijk uitging naar het geheel van de Belgische
ziekenhuizen en naar het identificeren van “outlying” ziekenhuizen, maakten we gebruik
van de zogenaamd “fixed effects” modellen.622 Hiërarchische modellen, gewoonlijk een
zogenaamd “random-effects” model, zouden een alternatief kunnen geweest zijn. Deze
modellen werden echter niet ontwikkeld om outliers te identificeren. Verder dient de
theorie voor het bepalen van wat outliers zijn nog ontwikkeld te worden voor de “linear
mixed” modellen en is het onmogelijk om outliers te identificeren in “non-linear mixed”
Hoofdstuk 5: Kwaliteit van zorgen 234
modellen. Tenslotte worden ziekenhuizen in de random-effects modellen beschouwd als
een aselecte steekproef uit de populatie van alle ziekenhuizen, wat in deze studie, waarin
alle ziekenhuizen zijn opgenomen, niet het geval was.
We vergeleken elk individueel ziekenhuis met alle Belgische ziekenhuizen door middel
van een logistische regressie442;484;623 om zowel een praktisch relevante als statistisch
significante afwijking van het nationale cijfer of trend te bepalen. Door een interactie term
in te bouwen in de logistische regressie tussen een lineaire tijdstrend, uitgedrukt in
semesters, en de individuele ziekenhuizen, werden ziekenhuizen met een abnormale
tijdsevolutie geïdentificeerd. Meer precies, vergeleken we de “slope” van de trend van elk
ziekenhuis met de nationale trend door middel van lineaire contrasten.
In geval van een frequente uitkomst (> 10%), of wanneer de odds ratio (OR) groter is dan
2,5 of kleiner dan 0,5, kan de schatting van het RR door de odds ratio’s, die de logistische
regressie produceert, in belangrijke mate vertekend worden. Zoals vermeld in hoofdstuk 3
deden we, om deze vertekening te verminderen, beroep op de benadering van het RR door
Zhang486, die we in de tekst en tabellen zullen vermelden als RRZ, en die we gebruikten om
de bovenvermelde afwijking te berekenen. Het verband tussen RRZ en OR kan als volgt
gelegd worden:
RRZ= OR/ ((1-P0)+(P0*OR)),
waar P0 staat voor de incidentie van de bestudeerde uitkomst in de niet-blootgestelde
groep, namelijk het geheel van de Belgische ziekenhuizen.486 Zoals reeds vermeld hielden
we rekening met het probleem van het meervoudige, gelijktijdige toetsen door het
berekenen van Bonferroni-gecorrigeerde p-waarden.313;438;607
In de hoofdanalyse, maakten we een correctie voor leeftijd van de moeder en per-semester
evolutie van de KSCs. In een nevenanalyse werden het type van ziekenhuis (privé versus
publiek, met versus zonder onderwijsfunctie) en verblijfplaats van de moeder beschouwd
als determinanten, waarvan men kan veronderstellen dat ze zowel het KSC van een
ziekenhuis kunnen beïnvloeden als ze beïnvloedbaar zijn door kwaliteitsgerichte
initiatieven. Ook met de correlatie van de gegevens hielden we rekening door middel van
“rescaling” technieken. 443;444 Deze techniek bestaat erin de standaard fouten van de
Hoofdstuk 5: Kwaliteit van zorgen
235
parameters te vermenigvuldigen met de vierkantswortel van de ratio van de “goodness-of-
fit” chi-kwadraten over het aantal vrijheidsgraden. Om een eventuele nationale trend op te
sporen maakten we gebruik van de zogenaamde Generalised Estimating Equations (GEE),
een verfijning van de logistische regressie waarbij er rekening gehouden wordt met de
correlatie van de gegevens. 430;431;483;624
Voor de Apgar categorieën, een multinomiale uitkomst, planden we een zogenaamd
‘proportional odds’ logistisch model te fitten, op voorwaarde dat de veronderstelling van
een constante OR niet weerlegd werd.625
Al deze analyses werden uitgevoerd met SAS version 8.1, SAS Institute Inc., SAS Campus
Drive, Cary, North Carolina 27513,US.
5.2.3 Resultaten
5.2.3.1 Volledigheid en accuratesse van de gegevens
Vergeleken met de gegevens van het NIS bleken de MKG zeer vergelijkbaar wat betreft de
aantallen levendgeborenen en hun verdeling volgens de woonplaats van de moeder (Tabel
1). Voor de vergelijking met het SPE en met het Office de la Naissance et de l’Enfance
(ONE) selecteerden we in de MKG respectievelijk de ziekenhuizen, die meewerken aan de
SPE registratie, en de ziekenhuizen gelegen in Brussel (behalve het UZ-VUB) en
Wallonië.
Wat de perinatale aspecten betreft stelden we een aanvaardbare overeenkomst vast tussen
MKG en SPE i.v.m. meerlingzwangerschap, zwangerschapsduur, verlossing door
keizersnede, ligging van het kind, geboortegewicht, geslacht en Apgar score (Tabellen 2
en 3). Voor hypertensie, diabetes, inductie van de arbeid, epidurale anesthesie, en
voorgeschiedenis van een keizersnede, stelden we echter belangrijke verschillen vast. Een
vergelijking tussen MKG en het ONE is zeer bevredigend wat de geboortegewichten
tussen 2,500 en 4,500 kg betreft. De lage Apgar scores lijken daarentegen frequenter voor
te komen in de MKG (Tabel 2).
Voor andere perinatale eindpunten, vonden we vergelijkbare gegevens in de literatuur.
In de MKG bedroeg de incidentie van het meconium aspiratie syndroom (MAS) 0,69%,
waar er waarden tussen 0,12 % en 7,87 % geciteerd worden.615;626-628 De incidentie
(uitgedrukt in %) per week zwangerschapsduur bedroeg 0,54 voor week 36, 0,37 voor
Hoofdstuk 5: Kwaliteit van zorgen 236
week 37, 0,42 voor week 38, 0,61 voor week 39, 0,83 voor week 40, 1,27 voor week 41,
en 1,50 voor week 42, cijfers die vergelijkbaar zijn met deze van Yoder et al.615 De
associatie van MAS met 1-minuut en 5-minuut Apgar scores, uitgedrukt als odds ratio’s en
hun 95% betrouwbaarheidsinterval, waren kleiner in onze gegevens maar gingen wel in
dezelfde richting als deze vermeld door Wiswell et al.626: 6,21 (5,71;6,76) versus 10,03
(5,97;16,88) op één minuut en 8,71(7,62;9,97) versus 21,35 (8,65;53,04) op vijf minuten.
Wanneer we onze gegevens met die van Levin et al.629 vergeleken, stelden we een
gelijkaardig verband vast tussen hyaliene membranenziekte (RDS) en transiënte tachypnee
(TTN) met de wijze van verlossing. Uitgedrukt als odds ratio’s en hun 95%
betrouwbaarheidsinterval, bedroeg de associatie respectievelijk 3,0 (1,6;5,3) versus 3,1
(2,8;3,4) in geval van RDS, and 3,3 (2,6; 3,9) versus 3,2 (2,9;3,6) in geval van TTN.
5.2.3.2 Laagrisico verlossingen en interziekenhuis verschillen in KSC Wanneer we de studiebevolking (N=381.989 waarvan 12,98 % met een KS geboren
werden) vergeleken met de controle populatie (N=73.944 waarvan 49,68 % met een KS
geboren werden) , vonden we voor de controle populatie een RR om via keizersnede
geboren te worden van 3,83 ( 95% BI [3,79;3,87]). Deze bevinding suggereert dat we er
aan de hand van deze inclusie criteria tenminste gedeeltelijk in slaagden laag
risicoverlossingen te identificeren.
Hoewel onze studie over laagrisico verlossingen ging, stelden we belangrijke
interziekenhuis verschillen vast (Figuren 1 en 2).
Voor de periodeanalyse varieerden de afwijkingen tussen de – 65 % en de + 75 %. In
termen van outliers onderscheidden we 9 “hoog KSC” en 13 “laag KSC” outlying
ziekenhuizen.
De trendafwijkingen situeerden zich tussen de – 6 % en + 6% en er waren geen outlying
ziekenhuizen.
Wanneer de gevallen van congenitale anomalie uitgesloten werden bleef de variatiebreedte
nagenoeg dezelfde zowel voor de periode als de trend. De figuren waren merkwaardig
gelijkend (Figuren 1 en 2, sectie 2). Er waren overigens slechts minimale verschillen
betreffende outlying ziekenhuizen: ziekenhuis 30 werd significant en ziekenhuis 26 was
Hoofdstuk 5: Kwaliteit van zorgen
237
het niet langer. Noteer dat in beide gevallen de afwijking praktisch niet veranderde, wat
impliceert dat de verandering het gevolg was van het weglaten van enkele gevallen.
Naast de figuren bevatte de feedback naar de ziekenhuizen een tabel, waarin de periode- en
trendafwijkingen met hun Bonferroni-gecorrigeerd en hun 95 % BI intervallen gegeven
worden, verder een p-waarde waarbij de hypothese van een afwijking = 0 getoetst wordt,
en tenslotte een hulp bij de interpretatie.Een voorbeeld van deze feedback voor de eerste
tien ziekenhuizen vindt u in Tabel 4.
Hoofdstuk 5: Kwaliteit van zorgen 238
Tabel 1: Percentage levend geboren kinderen i.f.v. de verblijfplaats van de moeder.Vergelijking tussen MKG en NIS, 2001-4.
2001 2002 2003 2004 Verblijfplaats MKG NIS MKG NIS MKG NIS MKG NIS
België (N=113.600) (N=114.172) (N=111.609) (N=111.225) (N=112.704) (N=112.149)(N=116.142)(N=115.618) Vlaanderen 52,6 53,1 53,1 53,7 52,6 53,5 53,0 53,9 Wallonië 33,7 34,2 33,2 33,8 33,0 33,5 32,4 32,9 Brussel 13,2 12,7 13,1 12,5 13,7 13,1 13,8 13,1 Buitenland 0,5 - 0,6 - 0,7 - 0,8 -
NIS: Nationaal Instituut voor de statistiek Tabel 2: Verdeling (in %) van geboortegewicht en Apgar scores.Vergelijking tussen MKG (2001) en gepubliceerde cijfers voor SPE (2000) en ONE (2000).
MKG-2001 ONE-2000 MKG-2001 SPE-2000 Geboortegewicht < 500 g 0,02 0,06 0,02 n/b 500-1499 g 0,96 1,18 0,83 0,9 < 1500 g 0,98 1,24 0,85 0,9 1500-2499 7,02 6,25 5,76 5,66 < 2500 g 8,00 7,48 6,61 6,56 2500-4499 g 91,39 90,77 92,43 92,49 4500 g+ 0,61 1,75 0,96 0,95 Apgar scores < 4 4,2 2,8 3,7 2,5 <7 17,5 14,4 18,6 18,1
ONE: Office de la naissance et de l’enfance SPE: Studiecentrum voor Perinatale n/b:nietbeschikbaar
Hoofdstuk 5: Kwaliteit van zorgen
239
Tabel 3a: Perinatale karakteristieken, uitgedrukt als een percentage. Vergelijking tussen MKG en SPE, 2001-4. 2001 2002 2003 2004 VERLOSSINGEN MKG SPE MKG SPE MKG SPE MKG SPE (N=58.158) (N=59.750) (N=58.194) (N=58.841) (N=56.678) (N=59.253) (N=59.126) (N=61.647) Tweelingen 2,1 1,7 2,3 2,0 2,3 1,9 2,0 1,6 Meerlingen (>=3) 0,1 0,0 0,1 0,0 0,1 0,0 0,1 0,0 Hypertensie 5,4 4,9 5,5 4,9 5,7 4,8 5,8 4,8 Diabetes 1,5 ng 1,6 1,2 2,1 1,4 2,1 1,4 Zwangerschapsduuur: 20-31 weken 1,0 1,0 1,0 1,0 1,1 1,3 1,1 1,1 32-36 weken 5,9 6,1 6,1 6,3 6,4 6,1 6,4 6,5 >=37 weken 92,9 92,8 92,9 92,7 92,6 92,6 92,8 92,5 Inleiding van de arbeid 19,6 30,7 19,4 30,1 18,4 30,0 17,7 27,6 Epidurale anesthesie 47,8 62,7 48,3 63,2 47,1 64,4 51,3 61,6 Keizersnede 17,4 17,1 18,1 17,7 18,6 18,3 18,5 18,3 Vorige keizersnede 3,9 7,7 4,6 7,6 5,2 7,6 5,7 8,2
Hoofdstuk 5: Kwaliteit van zorgen
240
Tabel 3b: Perinatale karakteristieken, uitgedrukt als een percentage. Vergelijking tussen MKG en SPE, 2001-4. (vervolg) GEBOORTEN MKG SPE MKG SPE MKG SPE MKG SPE (N=58.302) (N=60.813) (N=58.529) (N=60.048) (N=56.848) (N=60.406) (N=59.110) (N=62.657) Type geboorte: spontaan 74,3 70,3 72,5 69,9 71,8 70,0 71,3 70,2 vacuum 8,5 10,5 8,5 10,3 8,7 9,7 9,1 9,7 forceps 0,6 1,2 0,6 1,1 0,6 1,0 0,5 0,9
keizersnede 16,9 17,6 17,9 18,3 18,4 18,9 18,2 18,9 vaginale stuit 0,6 0,4 0,5 0,4 0,5 0,3 0,4 0,3
Geboortegewicht: <1500 g 0,8 1,1 0,8 1,2 0,9 1,2 0,8 1,1 1500-2499 g 5,4 5,9 5,6 6,2 5,7 6,2 5,4 5,8 >=2500 g 93,4 92,9 93,3 92,7 93,5 92,7 93,7 93,1 Geslacht: man 51,4 51,3 51,4 51,4 51,2 51,1 51,4 51,4 vrouw 48,6 48,6 48,6 48,6 48,8 48,9 48,6 48,6 Congenitale afwijkingen 3,0 1,5 3,0 1,8 3,0 1,6 3,1 1,6 Transfer =>gespecialiseerde eenheid 18,8 17,1 17,9 17,9 18,9 18,2 17,9 17,8
Hoofdstuk 5: Kwaliteit van zorgen
241
Tabel 4: Afwijking van het KSC van een ziekenhuis (uitgedrukt in percent) t.o.v. het nationale KSC of trend, België, 2001- 4. ID1 Periode Trend IP10
OG_B2OG_953 A(%)4BG_955BG_B6BI_957BI_B8 P9 OG_B2 OG_953 A(%)4 BG_955 BG_B6 BI_957 BI_B8 P9
1 -18 -10 3 16 28 NS NS 0,68283 -11 -7 -2 4 8 NS NS 0,51065 AMG 2 24 33 44 56 66 + + 0,00000 -8 -5 -1 3 6 NS NS 0,57928 EAE A>0 3 -20 -10 5 23 38 NS NS 0,49978 -16 -11 -5 2 8 NS NS 0,18024 AMG 4 9 18 31 44 56 + + 0,00000 -8 -4 0 5 9 NS NS 0,90712 AMG 5 -20 -11 1 15 27 NS NS 0,88383 -10 -6 0 5 10 NS NS 0,93539 AMG 6 9 14 21 29 35 + + 0,00000 0 2 5 8 10 + + 0,00045 AMG 7 0 7 16 26 35 + + 0,00061 -9 -7 -3 1 4 NS NS 0,11081 AMG 8 -32 -26 -19 -11 -5 - - 0,00001 -10 -7 -3 1 4 NS NS 0,10727 AMG 9 -12 -7 1 10 17 NS NS 0,75745 -2 1 4 8 11 + NS 0,01709 AMG
10 -45 -40 -33 -26 -19 - - 0,00000 -7 -3 1 6 9 NS NS 0,67442 EAE A<0 1 ID: Anoniem ziekenhuisnummer; 2 OG_B: Ondergrens van het Bonferroni betrouwbaarheidsinterval; 3 OG_95: Ondergrens van het 95% betrouwbaarheidsinterval; 4 A: Afwijking van het ziekenhuis KS cijfer/trend vergeleken met het nationale KS cijfer/trend; 5 BG_95: Bovengrens of the 95% betrouwbaarheidsinterval; 6 BG_B: Bovengrens van het Bonferroni betrouwbaarheidsinterval; 7 BI_95: +: het 95% BI suggereert een significant hoger ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend,
-: het 95% BI suggereert een significant lager ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend, NS: het 95% BI suggereert geen significante afwijking van het ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend.
8BI_B: +: het Bonferroni−gecorrigeerd BI suggereert sterk een significant hoger ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend, -: het Bonferroni−gecorrigeerd BI suggereert sterk een significant lager ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend,
NS: het Bonferroni−gecorrigeerd BI suggereert geen significante afwijking van het ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend. 9 P: Probabiliteit dat een ziekenhuisafwijking t.o.v. het nationale KS cijfer/trend = 0. 10IP: Interpretatie: EAE: Externe audit en algemene maatregelen aanbevolen; AMG: algemene maatregelen aanbevolen.
Hoofdstuk 5: Kwaliteit van zorgen 242
Figuur 1: Interziekenhuis verschillen in keizersnedencijfers, congenitale afwijkingen
inbegrepen (bovenste deel van de figuur) en uitgesloten (onderste deel van de figuur).
Nationaal KSC: 13%
Hoofdstuk 5: Kwaliteit van zorgen
243
Figuur 2: Interziekenhuis verschillen in keizersnedentrend, congenitale afwijkingen
inbegrepen (bovenste deel van de figuur) en uitgesloten (onderste deel van de figuur).
Hoofdstuk 5: Kwaliteit van zorgen 244
5.2.3.3 Nationaal KSC en zijn determinanten We berekenden een KSC van 18,93% in de populatie van levend geboren eenlingen in
hoofdligging en een KSC van 12,98% voor de studiebevolking.
Vermits we ons vooral interesseerden voor de evolutie van de KSC en hoewel een model
waarin leeftijdsgroep en semester als categorische variabelen gefit werden tot een betere fit
leidde, verkozen we het model waarin evolutie over de tijd als een trend gefit werd en dat
de gegevens op een meer spaarzame en praktisch bruikbare manier samenvatte (Tabel 5,
sectie a).
Beginnend bij het eerste semester van 2001 vonden we een nationale trend, gecorrigeerd
voor leeftijdsgroep, van ongeveer 2% per semester.
De resultaten van een multivariabele GEE waarin de waarschijnlijkheid van een KS de
afhankelijke variabele was en waarin, benevens de trend en de leeftijdsgroep, de andere
determinanten de onafhankelijk variabelen vormen, worden in Tabel 5, sectie b getoond.
Zo werden bij toenemende leeftijd van de moeder ook toenemende KSCs waargenomen en
waren de verblijfplaats van de moeder en de dag van opname op een significante manier
geassocieerd met de wijze van verlossing. Verder vonden we in functie van de opnamedag
belangrijke en statistisch significante verschillen in aantallen borelingen en proporties van
keizersneden, die varieerden tussen 64.422 en 14,84% op maandag; en, 33.836 en 7,21%
op zaterdag, cijfers die wijzen op een intens medisch ingrijpen rond de geboorte (Tabel 6).
Verlossingen op 37 en 38 weken en op 41 en 42 weken waren geassocieerd met een
verhoogde KSC. We konden echter geen significante associatie aantonen tussen het
keizersnedencijfer en het type eigenaarschap of een opleidingsfunctie van een ziekenhuis
(Tabel 7). In een analyse met exclusie van congenitale afwijkingen kwamen we tot zeer
vergelijkbare resultaten.
Noteren we dat we in de “hoog KSC” groep op de 35.287 verlossingen 19,3%
keizersneden telden. Voor de “gemiddeld KSC” groep bedroegen die cijfers respectievelijk
298.204 en 12,9%, en voor de “laag KSC” groep 48.436 en 8,8%.
Hoofdstuk 5: Kwaliteit van zorgen
245
Tabel 5: Nationale keizersnedentrend, gecorrigeerd voor leeftijdsgroep, en determinanten. OR P a) Nationale keizersnedentrend gecorrigeerd voor leeftijdsgroep Semestriële trend basis 1ste semester 2001 1,02 (1,02;1,02) <,0001Leeftijdsgroep 20-24 jaar vs < 20 jaar 1,11 (1,11;1,11) <,0001 25-29 jaar vs < 20 jaar 1,30 (1,30;1,30) <,0001 30-34 jaar vs < 20 jaar 1,53 (1,53;1,53) <,0001 35-39 jaar vs < 20 jaar 1,86 (1,86;1,86) <,0001 40 jaar+ vs < 20 jaar 2,41 (2,41;2,41) <,0001 b) Nationale keizersnedentrend, gecorrigeerd voor leeftijdsgroep, en determinanten Semestriële trend basis 1ste semester 2001 1,02 (1,01;1,02) <,0001Leeftijdsgroep 20-24 jaar vs < 20 jaar 1,12 (1,02;1,22) 0,0188 25-29 jaar vs < 20 jaar 1,31 (1,20;1,43) <,0001 30-34 jaar vs < 20 jaar 1,55 (1,42;1,69) <,0001 35-39 jaar vs < 20 jaar 1,89 (1,73;2,07) <,0001 40 jaar+ vs < 20 jaar 2,45 (2,21;2,71) <,0001Zwangerschapsduur 37-38 weken vs 39-40 weken 1,95 (1,88;2,01) <,0001 41-42 weken vs 39-40 weken 1,29 (1,24;1,34) <,0001Verblijfplaats Antwerpen vs Elke woonplaats 0,99 (0,94;1,05) 0,7271 Brussel vs Elke woonplaats 0,89 (0,84;0,94) <,0001 Brabant (Vl) vs Elke woonplaats 0,97 (0,91;1,05) 0,2848 Brabant (Wa) vs Elke woonplaats 0,82 (0,75;0,89) <,0001 West Vlaanderen vs Elke woonplaats 1,10 (1,02;1,18) 0,0001 Oost Vlaanderen vs Elke woonplaats 1,06 (1,00;1,13) 0,0054 Henegouwen vs Elke woonplaats 0,94 (0,88;1,00) 0,0034 Luik vs Elke woonplaats 1,34 (1,25;1,44) <,0001 Limburg vs Elke woonplaats 1,24 (1,14;1,34) <,0001 Luxemburg vs Elke woonplaats 1,01 (0,86;1,18) 0,9151 Namen vs Elke woonplaats 0,83 (0,77;0,90) <,0001 Buitenland vs Elke woonplaats 0,93 (0,79;1,09) 0,2006Type eigenaarschap Publiek vs Privaat 0,98 (0,95;1,01) 0,1478Teaching status Geen wel specialisten in opleiding 0,98 (0,94;1,03) 0,4271Dag van opname Maandag vs Zondag 1,22 (1,15;1,29) <,0001 Dinsdag vs Zondag 1,13 (1,06;1,19) <,0001 Woensdag vs Zondag 1,17 (1,10;1,23) <,0001 Donderdag vs Zondag 1,17 (1,11;1,24) <,0001 Vrijdag vs Zondag 0,85 (0,80;0,90) <,0001 Zaterdag vs Zondag 0,55 (0,52;0,59) <,0001
OR: odds ratio; ( ) :95% betrouwbaarheidsinterval; P: probabiliteit van OR=1.
Hoofdstuk 5: Kwaliteit van zorgen 246
Tabel 6: Maternale karakteristieken van de studiepopulatie en wijze van verlossing. België 2001-2004.
KS % Aantal KS % AantalLeeftijdsklassen Semester
< 20 jaar 765 9,40 8.140 2001-1 5.672 11,99 47.287
20-24 jaar 5.910 10,37 57.010 2001-2 5.975 12,43 48.058
25-29 jaar 15.987 11,92 134.071 2002-1 5.757 12,51 46.023
30-34 jaar 17.342 13,75 126.098 2002-2 6.254 13,14 47.605
35-39 jaar 7.746 16,27 47.613 2003-1 6.161 13,27 46.421
40 jaar+ 1.828 20,18 9.057 2003-2 6.550 13,55 48.356
Dag van opname Woonplaats (provincie)
Maandag 9.560 14,84 64.422 Antwerpen 7.411 12,58 58.924
Dinsdag 8.827 13,80 63.948 Brabant (Vlaams) 4.492 12,80 35.098
Woensdag 8.780 14,22 61.762 Brabant (Waals) 1.476 11,35 13.009
Donderdag 8.961 14,29 62.729 Brussel 5.947 11,43 52.024
Vrijdag 5.212 10,73 48.555 West-Vlaanderen 4.867 13,42 36.262
Zaterdag 2.441 7,21 33.836 Oost-Vlaanderen 6.195 13,13 47.175
Zondag 5.797 12,40 46.737 Henegouwen 5.785 12,21 47.388
MAAND Luik 6.043 16,75 36.07
Januari 4.280 13,20 32.434 Limburg 3.766 14,83 25.399
Februari 3.821 12,98 29.428 Luxemburg 1.281 12,69 10.098
Maart 4.032 12,56 32.112 Namen 1.920 11,08 17.326
April 3.941 12,56 31.365 Buitenland 395 12,28 3.216
Mei 4.025 12,69 31.726
Juni 4.109 12,99 31.626
Juli 4.357 12,78 34.093
Augustus 4.206 12,76 32.968
September 4.319 13,28 32.519
Oktober 4.114 12,89 31.923
November 4.040 13,40 30.158
December 4.334 13,70 31.637 KS: keizersnede; %: proportie van keizersneden uitgedrukt als een percentage.
Hoofdstuk 5: Kwaliteit van zorgen
247
Tabel 7: Neonatale en ziekenhuis karakteristieken van de studiepopulatie en wijze van verlossing. België 2001-2004. KS % Neonati KS % Neonati 1) Neonatale 2) Ziekenhuis Geslacht Micu 290 23,82 1.251Jongens 26.862 13,69 196.191 Eigenaarschap Meisjes 22.713 12,23 185.755 Publiek 17.210 13,12 131.176 Onbepaald 3 23 Privaat 32.368 12,91 250.813 Geboortegewicht Specialisten 2500-2999 g 9.444 13,78 68.511 in opleiding 3000-3499 g 20.431 12,18 167.699 Ja 43.393 13.03 332.953 3500-3999 g 15.119 12.89 117.250 Neen 6.185 12,61 49.0364000-4499 g 4.584 16,07 28.529 Zwangerschapsduur 37-38 weken 18.531 18,77 98.712 39-40 weken 25.628 10,56 242.645 41-42 weken 5.419 13,34 40.632 1 min Apgar Ontbrekend 10 16,13 62 < 4 1.141 21,61 5.281 4 - 6 2.857 14,65 19.507 > 6 45.570 12,76 357.139 5 min Apgar Ontbrekend 10 15,38 65 < 4 163 21,73 750 4 - 6 703 18,03 3.898 > 6 48.702 12,91 377.276 Respiratoire Syndromen RDS 480 31,27 1.535 Wet lung 552 32,43 1.702 Meconium Aspiratie 510 19,23 2.652 Intubatie/Ventilatie 959 27,88 3.440 Congenitale Afw. 559 16.57 3.374
Transfer 9.850 15,31 64.326 KS: keizersnede; %: proportie van keizersneden uitgedrukt als een percentage.
Hoofdstuk 5: Kwaliteit van zorgen 248
5.2.3.4 Neonatale uitkomsten Zeer lage één-minuut Apgar scores (Tabel 8) schenen meer frequent te zijn in geval van
KS en vooral in de “laag KSC” groep. Noteren we nochtans dat de proportie van zeer lage
scores in de “hoog KSC” groep versus de “laag KSC” groep hoger leek in geval van een
vaginale verlossing dan na een keizersnede.
Een gelijkaardig fenomeen deed zich voor m.b.t. de vijf minuten Apgar scores (Tabel 8),
hoewel de incidentie van zeer lage vijf-minuten Apgar-scores veel kleiner was.
Voor RDS en MAS (Tabel 8) troffen we in de drie KSC groepen praktisch dezelfde
incidentie aan na een vaginale verlossing, maar bleken er belangrijke verschillen te bestaan
na een keizersnede. Inderdaad, de “gemiddeld KSC” groep leek na een keizersnede een
kleinere incidentie te hebben in geval van RDS, waar in geval van MAS er vooral een lage
incidentie werd vastgesteld in de “hoog KSC” groep.
TTN scheen minder een probleem te vormen in de “hoog KSC” groep, welke ook de wijze
van verlossing was (Tabel 9). Voor de “laag KSC” groep scheen de nood aan respiratoire
ondersteuning het grootst en dit zowel na een keizersnede als na een vaginale verlossing.
De verschillen in proporties van pasgeborenen, die in een gespecialiseerde afdeling
opgenomen werden waren uiterst verschillend: in de “hoog KSC” groep deed zulke
opname zich vijfmaal minder voor dan in de andere, en dit voor beide types van verlossing
(Tabel 9). Bij het doorvoeren van een analyse waarbij congenitale afwijkingen uitgesloten
waren kwamen we tot zeer vergelijkbare resultaten.
Hoofdstuk 5: Kwaliteit van zorgen
249
Tabel 8: 1 minuut en 5 minuut Apgar scores, RDS en MAS in functie van de wijze van verlossing en van KSC groep
KSC groep Hoog (%) Gemiddeld (%) Laag (%) Totaal 1 min Apgar
Vaginaal < 4 299 1,05 3.169 1,22 672 1,52 4.140 4 –6 1.512 5,31 12.857 4,95 2.281 5,16 16.650 >6 26.680 93,64 243.671 93,83 41.218 93,31 311.569 KS < 4 96 1,41 918 2,38 127 2,98 1.141 4 –6 349 5,14 2.223 5,77 285 6,68 2.857 >6 6.351 93,45 35.366 91,84 3.853 90,34 45.570 5 min Apgar
Vaginaal < 4 32 0,11 478 0,18 77 0,17 587 4 –6 180 0,63 2.533 0,98 482 1,09 3195 >6 28.279 99,26 256.686 98,84 43.609 98,73 328.574 KS < 4 11 0,16 135 0,35 17 0,40 163 4 –6 51 0,75 564 1,46 88 2,06 703 >6 6.734 99,09 37.808 98,18 4.160 97,54 48.702 RDS Vaginaal Afwezig 28.405 99,68 258.913 99,69 44.038 99,66 331.356 Aanwezig 90 0,32 816 0,31 149 0,34 1.055 KS Afwezig 6.718 98,84 38.174 99,12 4.206 98,57 49.098 Aanwezig 79 1,16 340 0,88 61 1,43 480 MAS Vaginaal Afwezig 28.331 99,42 257.974 99,32 43.964 99,50 330.269 Aanwezig 164 0,58 1.755 0,68 223 0,50 2.142 KS Afwezig 6.744 99,22 38.116 98,97 4.208 98,62 49.068 Aanwezig 53 0,78 398 1,03 59 1,38 510 Totaal Vaginaal 28.495 259.729 44.187 332.411 Keizersnede 6.797 38.514 4.267 49.578
(%): kolom percentage
Hoofdstuk 5: Kwaliteit van zorgen 250
Tabel 9: TTN, nood aan respiratoire ondersteuning en transfer naar een N*/NIC dienst, in functie van de wijze van verlossing en van KSC groep
KSC groep Hoog (%) Gemiddeld (%) Laag (%) Totaal TTN Vaginaal Afwezig 28.425 99,75 258.814 99,65 44.022 99,63 331.261 Aanwezig 70 0,25 915 0,35 165 0,37 1.150 KS Afwezig 6.740 99,16 38.082 98,88 4.204 98,52 49.026 Aanwezig 57 0,84 432 1,12 63 1,48 552 Intubatie/Ventilatie Vaginaal Afwezig 28.295 99,30 257.854 99,28 43.781 99,08 329.930 Aanwezig 200 0,70 1.875 0,72 406 0,92 2.481 KS Afwezig 6.670 98,13 37.804 98,16 4.145 97,14 48.619 Aanwezig 127 1,87 710 1,84 122 2,86 959 Transfer Vaginaal Afwezig 27.818 97,62 212.951 81,99 37.166 84,11 277.935 Aanwezig 677 2,38 46.778 18,01 7.021 15,89 54.476 KS Afwezig 6.459 95,03 29.950 77,76 3.319 77,78 39.728 Aanwezig 338 4,97 8.564 22,24 948 22,22 9.850 Totaal Vaginaal 28.495 259.729 44.187 332.411 Keizersnede 6.797 38.514 4.267 49.578
(%): kolom percentage
Vermits de “proportional odds” veronderstelling onjuist bleek, voerden we een general
logits analyse uit om de associatie tussen wijze van verlossing, KSC groep en 1 minuut
Apgar scores op een meer formele manier te analyseren. Hieruit bleek dat er duidelijk
minder gevallen van zeer lage Apgar scores waren in de “hoog KSC” groep dan in de
“gemiddeld KSC” groep, die op zijn beurt significant minder vaak geassocieerd bleek met
zeer lage Apgar scores dan de “laag KSC” groep (Tabel 10). Voor de lage Apgar scores
vonden we niet langer een significant verschil tussen de “gemiddeld KSC” groep en de
“hoog KSC” groep, maar wel tussen de “gemiddeld KSC” en de “laag KSC” groepen. Een
deel van dit verschijnsel was misschien te wijten aan sociaal-economische status
gerelateerde verstorende variabelen, die we, uit de natuur zelf van onze gegevens, niet uit
de analyse konden verwijderen. Opmerkelijk is het feit dat, wanneer we de “hoog KSC”
Hoofdstuk 5: Kwaliteit van zorgen
251
groep vergeleken met de andere groepen, we een relatief exces van zeer lage Apgar scores
vaststelden wanneer het een vaginale verlossing betrof, waar we dat eerder na een
keizersnede, uitgevoerd voor medische redenen, verwachtten. Deze bevinding suggereert
dat het exces aan KS in de“hoog KSC” groep voor een deel te wijten was aan niet-
medische redenen en schijnt te wijzen op een niet-adequate selectie van de wijze van
bevalling. Noteren we tenslotte dat mannelijk geslacht negatief geassocieerd was met de
Apgar scores. Ook wanneer gevallen van congenitale afwijking uitgesloten werden
kwamen we bij deze analyses tot zeer gelijkaardige vaststellingen.
We gingen ook het verband na tussen wijze van verlossing, KSC groep en respiratoire
syndromen, bepaalde types van ademhalingsondersteunende behandelingen en/of de
opname van een boreling in een gespecialiseerde pediatrische dienst of in een NICU
(Tabel 11).
In de volgende secties zijn de odds ratio’s voor KSC, leeftijdsgroep, wijze van verlossing,
zwangerschapsduur, geslacht, en tenslotte een interactie term tussen KSC en wijze van
verlossing voor elkaar gecorrigeerd. Voor al deze eindpunten bleek er een significant
verband te bestaan tussen keizersnede en minder goede uitkomst, wat consistent is met wat
reeds geweten was over het verband tussen een electieve herhalingssectio en RDS,
respiratoire problemen zoals TTN en persistente pulmonaire hypertensie, zelfs bij een
levend geboren, voldragen eenling.629 Voor mannelijk geslacht stelden we, op MAS na,
een gelijkaardig verband vast.
Wanneer we de “hoog KSC” en de “laag KSC” groepen vergeleken met de “gemiddeld
KSC” groep stelden we voor de eerst vermelde groepen een exces aantal RDS gevallen
vast. Deze excessen waren bijzonder belangrijk in geval van keizersnede. Voor MAS
stelden we, wanneer we de drie KSC groepen onderling vergeleken, een exces vast in de
“laag KSC” groep, vooral na een keizersnede. Voor een deel kan dit fenomeen te wijten
zijn aan de correctie voor de zwangerschapsduur, vermits er significant meer verlossingen
waren op 41 en 42 weken in de “laag KSC” groep (RR: 1.09; 95% CI [1.07;1.12]). In
tegenstelling hiermee vonden we significant meer gevallen van MAS in de “laag KSC”
groep na een keizersnede. Ademhalingsondersteunende behandelingen bleken vaker
noodzakelijk in de “laag KSC” groep. Verder stelden we een negatief verband vast tussen
Hoofdstuk 5: Kwaliteit van zorgen 252
neonatale opname in een gespecialiseerde dienst en “hoog KSC” en “laag KSC” groepen,
voornamelijk na een vaginale bevalling. Verlossingen op 37-38 weken en op 41-42 weken
bleken vaak gecorreleerd met minder gunstige eindpunten. Deze bevinding stemt overeen
met de literatuur die stelt dat een electieve KS beter uitgevoerd wordt op een leeftijd van
39 à 40 weken, eerder dan op 37-38 weken, wat het geval is in België (Tabel 5).574 Op dat
ogenblik echter, namelijk voor het begin van een spontane arbeid, doen zich vaker
ademhalingsproblemen voor. Wanneer we de KSC groepen vergeleken in termen van de
ratio van het aantal KS uitgevoerd op die zwangerschapsduur over het aantaal aantal
sectio’s vonden we 40,1% in de “hoog KSC” versus 24,2% en 37,2% in respectievelijk de
“laag KSC” en “gemiddeld KSC” groepen.
Tabel 10: Effect van KSC-groep en wijze van verlossing, gecorrigeerd voor geslacht, leeftijdsklas en semester, op 1-minuut Apgar scores.
Dependente Variabele OR P
Mannen vs Vrouwen Apgar 0-3 1,32 (1,25; 1,40) <0,0001 Apgar 4-6 1,22 (1,19; 1,26) <0,0001KS vs VB Apgar 0-3 1,76 (1,59; 1,95) <0,0001 Apgar 4-6 1,17 (1,10; 1,24) <0,0001KSC groep: Hoge vs Lage Apgar 0-3 0,56 (0,48; 0,65) <0,0001 Apgar 4-6 0,87 (0,80; 0,95) 0,0016KSC groep: Hoge vs Gemiddelde Apgar 0-3 0,71 (0,63; 0,80) <0,0001 Apgar 4-6 0,97 (0,91; 1,03) 0,333KSC groep: Lage vs Gemiddelde Apgar 0-3 1,27 (1,14; 1,40) <0,0001 Apgar 4-6 1,12 (1,04; 1,19) 0,0016Hoge KSC groep en KS vs Lage KSC groep en VB
Apgar 0-3 0,82 (0,70; 0,95) 0,0083
Apgar 4-6 0,85 (0,78; 0,93) 0,0003Hoge KSC groep en KS vs Gemiddelde en VB Apgar 0-3 0,82 (0,73; 0,93) 0,0017 Apgar 4-6 0,90 (0,85; 0,96) 0,0016Lage KSC groep en KS vs Gemiddelde en VB Apgar 0-3 1,01 (0,91; 1,12) 0,8843 Apgar 4-6 1,06 (0,99; 1,14) 0,0864KS: keizersnede; VB: vaginale bevalling; OR: odds ratio; ( ) :95% BI; P: prob. van OR=1. Het verband tussen zwangerschapsduur en MAS was bijzonder in die zin dat het negatief
was bij een zwangerschapsduur van 37-38 weken en positief voor een zwangerschapsduur
van 41-42 weken. Dit is nochtans niet in tegenspraak met de literatuur, die meldt dat de
hoogste cijfers voor MAS vastgesteld worden bij borelingen met een zwangerschapsduur
van 41-42 weken en dat onder meer veranderingen in het hartritme patroon, foetale
Hoofdstuk 5: Kwaliteit van zorgen
253
acidose, meconium in de trachea, KS, en lage Apgar scores de voornaamste risico factoren
zijn. 615;615;626;628 Wanneer we ons herinneren dat de gecorrigeerde odds ratio voor KS 1,63
bedroeg en dat, daarenboven, veel van de andere risico factoren kunnen vermeden worden
door een electieve KS op week 37-38, kan de lage incidentie van MAS bij borelingen met
die zwangerschapsduur niet beschouwd worden in tegenspraak te zijn met de literatuur.
5.2.4 Discussie
5.2.4.1 Voornaamste bevindingen Onze resultaten suggereerden voor laag risico verlossingen het bestaan van een belangrijke
interziekenhuis variabiliteit, die zich vertaalde in afwijkingen van het nationale cijfer
variërend tussen – 65 % en + 75 % en die tevens statistisch significant waren.
Ze berustten op een zeer conservatieve analyse en interpretatieve benadering, die erin
bestond een zone te definiëren waarin geen interpretaties gemaakt worden en in het
gebruik van aanzienlijke drempelwaarden vooraleer een afwijking van het nationale cijfer
of trend als belangrijk bestempeld werd. Meer in het bijzonder corrigeerden we voor
meervoudige, gelijktijdige vergelijkingen en voor de aanwezigheid van correlatie in de
gegevens. 313;444
Verder verstrekten we graden van evidentie m.b.t. de vastgestelde afwijking van een
ziekenhuis en ook een hulp bij de interpretatie. Wel dient er rekening gehouden te worden
met een eventuele “regression to the mean”. 462 Op die manier trachtten we vals alarm en
valse geruststelling te vermijden en tevens het onderscheid toe te laten tussen een reël
verschil en een statistisch artefact. Dit soort problemen duikt vaak op bij een kwantitatieve
analyse, zeker wanneer zij gebaseerd is op administratieve gegevens.180;319;396
Een ander belangrijk resultaat was de vaststelling van een KSC evolutie, die het best kan
geresumeerd worden als een trend van 2 % per semester. Een veranderende medische
praktijkvoering kan hierin een rol gespeeld hebben. Deze medische, groeiende
beïnvloeding van het geboortegebeuren uitte zich verder in de geografische en
ziekenhuisgerelateerde verdelingen 364;630 van het KSC, en de temporele verdeling van het
aantal verlossingen en de wijze van verlossing, hoewel de evidentie van doelmatigheid van
dergelijke tussenkomsten nog dient geleverd te worden.571
Hoofdstuk 5: Kwaliteit van zorgen 254
Tabel 11: Voorkomen van respiratoire syndromen, respiratoire ondersteuning, opname in een gespecialiseerde dienst geassocieerd met wijze van verlossing en KSC groep, gecorrigeerd voor geslacht, leeftijd van de moeder, zwangerschapsduur en semester van verlossing. RDS MAS TTN Resp.Ond. N*of NIC OR OR OR OR OR Wijze van verlossing Keizersnede vs vaginaal 2,47 (2,18;2,81) 1,64 (1,47; 1,82) 2,83 (2,52;3,18) 2,45 (2,23;2,68) 1,30 (1,26;1,34) KSC Hoog vs Gemiddeld 0,98 (0,79;1,22) 0,90 (0,77; 1,05) 0,68 (0,53;0,86) 0,97 (0,83;1,13) 0,11 (0,10;0,12) Laag vs Gemiddeld 1,08 (0,90;1,28) 0,74 (0,64; 0,85) 1,06 (0,90;1,25) 1,27 (1,14;1,43) 0,86 (0,84;0,89) Geslacht Jongens vs Meisjes 1,64 (1,48;1,82) 1,04 (0,97; 1,12) 1,46 (1,32;1,61) 1,36 (1,27;1,46) 1,05 (1,03;1,07) Leeftijd van de moeder < 20 jaar vs 40 jaar+ 1,02 (0,69;1,51) 0,76 (0,54; 1,08) 0,95 (0,63;1,43) 1,21 (0,90;1,62) 1,49 (1,37;1,62) 20-24 jaar vs 40 jaar+ 0,71 (0,53;0,94) 0,89 (0,70; 1,12) 0,87 (0,66;1,16) 0,91 (0,72;1,13) 1,25 (1,17;1,34) 25-29 jaar vs 40 jaar+ 0,67 (0,51;0,89) 0,80 (0,64; 1,00) 0,82 (0,62;1,07) 0,88 (0,71;1,09) 1,04 (0,98;1,11) 30-34 jaar vs 40 jaar+ 0,71 (0,54;0,93) 0,79 (0,63; 0,99) 0,77 (0,58;1,01) 0,84 (0,68;1,04) 0,92 (0,86;0,98) 35-39 jaar vs 40 jaar+ 0,82 (0,61;1,10) 0,89 (0,70; 1,13) 0,81 (0,60;1,08) 0,85 (0,67;1,06) 0,90 (0,84;0,96) Zwangerschapsduur 37-38 weken vs 39-40 weken 2,15 (1,93;2,39) 0,51 (0,46; 0,57) 2,16 (1,96;2,39) 1,43 (1,33;1,55) 1,20 (1,17;1,22) 41-42 weken vs 39-40 weken 1,29 (1,09;1,54) 1,75 (1,59 ; 1,93) 1,12 (0,94;1,33) 1,43 (1,28;1,59) 0,91 (0,88 ;0,94) Semester 2001-1 vs 2004-2 1,12 (0,93;1,35) 0,95 (0,83 ; 1,10) 0,61 (0,51;0,73) 1,08 (0,94;1,25) 1,30 (1,26 ;1,35) 2001-2 vs 2004-2 0,96 (0,79;1,16) 0,78 (0,67 ; 0,90) 0,53 (0,44;0,65) 1,06 (0,92;1,23) 1,15 (1,11 ;1,19) 2002-1 vs 2004-2 0,81 (0,66;0,99) 0,83 (0,72 ; 0,97) 0,65 (0,55;0,79) 1,28 (1,11;1,47) 1,03 (0,99 ;1,07) 2002-2 vs 2004-2 0,93 (0,76;1,13) 0,83 (0,72 ; 0,96) 0,57 (0,47;0,68) 1,27 (1,11;1,46) 1,06 (1,02 ;1,10) 2003-1 vs 2004-2 1,00 (0,82;1,21) 0,69 (0,60 ; 0,81) 0,75 (0,63;0,89) 1,37 (1,20;1,57) 1,09 (1,05 ;1,13) 2003-2 vs 2004-2 0,97 (0,80;1,18) 0,81 (0,70; 0,93) 0,79 (0,66;0,93) 1,08 (0,94;1,25) 1,08 (1,04;1,13) 2004-1 vs 2004-2 0,90 (0,74;1,09) 0,99 (0,86; 1,14) 0,87 (0,74;1,02) 0,95 (0,82;1,10) 1,03 (0,99;1,07) Interactie wijze van verlossing en KSC groep KS en Hoog vs VB en Gemiddeld 1,34 (0,97;1,86) 0,87 (0,63; 1,20) 1,08 (0,75;1,55) 1,04 (0,81;1,34) 1,66 (1,43;1,93) KS en Laag vs VB en Gemiddeld 1,53 (1,11;2,12) 1,74 (1,29; 2,36) 1,26 (0,92;1,72) 1,23 (0,98;1,55) 1,18 (1,08;1,29) KS: keizersnede; VB: vaginale bevalling; OR: odds ratio; ( ) :95% betrouwbaarheidsinterval.
Hoofdstuk 5: Kwaliteit van zorgen 255
Structurele problemen zoals verpleegkundige bestaffing, beschikbaarheid van artsen en
anesthesiologen, die niet in de MKG geregistreerd worden, kunnen ook een rol gespeeld
hebben bij de beslissing om een electieve keizersnede uit te voeren. 607
5.2.4.2 Beperkingen van de studie Sommige van de beperkingen van onze studie zijn intrinsiek aan gegevens afkomstig van
de statistieken van de burgerlijke stand631 en van ziekenhuisontslaggegevens100. Meer
specifiek, zijn ze beperkt in volledigheid en in accuratesse van het coderen van
obstetrische gegevens. 632 Bijvoorbeeld bleken onze gegevens i.v.m. inleiding van de
arbeid, epidurale anesthesie en KS voorgeschiedenis onvolledig en stelden we een
waarschijnlijke over-registratie vast van hypertensie en diabetes (Tabel 1). Het feit hiermee
geen rekening te kunnen houden kon tot foutieve conclusies leiden bij de interziekenhuis
vergelijking. Deze ingrepen en aandoeningen zijn immers allen gerelateerd aan een hoger
KSC en kunnen verschillen in ziekenhuispraktijk weerspiegelen. Wegens de omvang van
het voorkomen en het miscoderen van deze ingrepen en aandoeningen (1) lieten we ze
buiten beschouwing bij het samenstellen van onze studiebevolking, en (2) gebruiken we de
term van “screening” voor de interziekenhuis verschillen, die aangevuld dient te worden
door externe en interne audits.
Uit de aard zelf van onze gegevens was het ook onmogelijk het onderscheid te maken
tussen primaire electieve en herhalingssectio’s. Dit kan als een andere tekortkoming van
onze studie beschouwd worden. Al zijn analyses betreffende primaire electieve
keizersneden van vitaal belang - het beteugelen van dit type KS precies het uitgangspunt is
voor het verhinderen van het verder stijgen van het KSC - toch is de analyse van het totale
keizersnedencijfer bruikbaar voor het beantwoorden van de onderzoeksvraag van deze
studie.
Onze definitie van een laagrisico verlossing, die voortbouwde op het werk van de
AHRQ564, dat gebaseerd is op de basis triade van “ voldragen (37 weken en meer)
eenlingen in kruinligging”, en die recent gebruikt werd om maternale risicoprofielen te
beschrijven612, is wellicht onvolledig. Een meer uitgesponnen selectieprocedure, gebaseerd
op ICD-9-CM codes, en waarin diabetes, hypertensieve aandoeningen, placenta previa en
een aantal congenitale afwijkingen werden opgenomen, werd onlangs gebruikt door Kabir
Hoofdstuk 5: Kwaliteit van zorgen 256
et al..633 Hoewel de medische noodzaak voor het uitvoeren van een KS in geval van
diabetes zonder macrosomie601;634 en hypertensie (met uitzondering van enkele gevallen
van eclampsie met langdurig foetaal lijden635) nog niet aangetoond werd, is het zo dat zij in
de gewone praktijk geassocieerd zijn met hogere KSCs. Anderzijds kunnen placenta previa
en sommige congenitale afwijkingen terecht beschouwd worden als een indicatie voor KS.
Wegens de vaak zwakke identificatie in administratieve gegevens van gevallen d.m.v.
diagnose codes180;182, namen we een intermediaire positie aan. Hierbij sloten we gevallen
uit van abnormale ligging (met inbegrip van stuit en ingrepen voor stuit), prematuren,
doodgeboorte, meerlingzwangerschap, en geboortegewicht van minder dan 2500g of meer
dan 4499 g.
Onze gegevens bevatten ook geen informatie over sommige vormen van dystocie (zoals
disproportie en obstructie van de arbeid), en sociaal-economische status, die onze
bevindingen konden vertekend hebben.604;630;636Rekening houdend met de laagrisico aard
van de verlossingen en vermits in ons land bijna de ganse bevolking geniet van een
ziekteverzekering, die het grootste deel van de kosten voor medische zorgen draagt, lijkt
een SES vertekening echter klein. Ook de kleine odds ratio (1.034 met 95% B.I.[1.003;
1.066]), die we vaststelden wanneer we het KSC vergeleken tussen openbare en privé
ziekenhuizen (waarin, zeer approximatief gesteld, de meer bemiddelde moeders bevallen),
schraagde deze veronderstelling.
De afwezigheid van maternale eindpunten vormt een ander minpunt van onze studie.
Hoewel ernstige onder−registratie beschreven werd in verschillende Europese landen597,
kan maternale sterfte bruikbaar zijn voor vergelijkingen tussen landen, maar is ze
onbruikbaar voor interziekenhuizen vergelijkingen wegens haar lage incidentie (8 gevallen
in de studiebevolking in 4 jaar tijd en 12 gevallen in de bronpopulatie). Maternale
morbiditeit, het andere maternale eindpunt, is totnogtoe niet duidelijk omschreven.
Aandoeningen met blijvende beperkingen voor de moeder zoals infertiliteit en vaginale
fistels zijn uitzonderlijk in Europa.597 “Near misses” of “levensbedreigende voorvallen” en
zwangerschaps− of verlossinggerelateerde letsels, die leiden tot urinaire of fecale
incontinentie worden beschouwd als mogelijke indicatoren voor moederlijke morbiditeit
Hoofdstuk 5: Kwaliteit van zorgen
257
maar moeten nog vertaald worden in bruikbare indicatoren.597Hierbij dient men op te
merken dat deze indicatoren, wanneer ze berekend worden op basis van administratieve
gegevens verwant zijn aan indicatoren van patiëntveiligheid en dat men dan geredelijk kan
veronderstellen dat zij delen in hun beperkingen, meer bepaald de zeer beperkte validiteit
van hun gebruik voor interziekenhuis vergelijkingen.290
Tenslotte komen de beperkingen van administratieve gegevens gedeeltelijk voort uit het
spanningsveld dat erin bestaat dezelfde gegevens te gebruiken voor terugbetaling en voor
het meten van kwaliteit in ziekenhuizen. “When the use is reimbursement, there is a
tendency to perform coding quickly and to maximize the coding of complications and
comorbidities. When the use is to assess quality, however, it is important for coders to
have a complete record and to restrict diagnosis coding to conditions that affect patient
care.”637 Het is bijvoorbeeld dat hypertensie en diabetes tussenkomen in het algoritme, dat
gebruikt wordt voor het bepalen van de case mix van een verblijf en derhalve financieel
lucratief, waar dit niet het geval is voor inductie van de arbeid, epidurale anesthesie en een
voorgeschiedenis van een vroegere keizersnede.
5.2.4.3 Sterkten van de studie De vergelijking van de voor de studie geselecteerde variabelen en de beschikbare
informatie (Tabel 1), toont een goede overeenkomst aan in termen van volledigheid en
accuratesse. Verder toonde onderzoek aan dat keizersneden praktisch altijd correct
geclassificeerd worden82;95;632en werd er aangetoond dat een analyse d.m.v. een beperkt
aantal variabelen met gekende betrouwbaarheid tot een interziekenhuis vergelijking komt,
die behoorlijk overeenstemt met een interziekenhuis vergelijking gebaseerd op gegevens
uit een medisch dossier638. Stippen we tenslotte aan dat we door het toepassen van onze, bij
de klassieke triade bijkomende criteria op de bronbevolking zich vertaalde in een verdere
KSC reductie van 12%.
Hoofdstuk 5: Kwaliteit van zorgen 258
Hoewel leeftijd van de moeder vaak, maar niet altijd, erkend wordt als een onafhankelijke
risicofactor594;639-641, stemt de leeftijdscorrectie die we gebruikten overeen met de tijdens de
studieperiode geldende obstetrische praktijk630;640 en heeft ze wellicht de interziekenhuis
vergelijkbaarheid verbeterd.
5.2.4.4 Perinatale eindpunten Wij namen de neonatale sterfte niet op bij de te bestuderen perinatale eindpunten omdat ze
beïnvloed wordt door neonatale zorgen, wat buiten de scope ligt van deze studie, en
vervolgens omdat ze een zeldzaam verschijnsel is, dat zich niet leent tot een
interziekenhuis vergelijking. Tenslotte kan de neonatale sterfte, tengevolge van onze
registratiemodaliteiten, niet gekoppeld worden aan de wijze van verlossing in geval van
een transfer naar een ander ziekenhuis, wat dus, precies bij een risicogroep, de voor deze
studie nodige informatie ontoegankelijk maakt.
Daarentegen ontbreekt de informatie over Apgar scores slechts zeer zelden: in 0,39 % der
gevallen in een Zweedse studie642 en zelfs minder vaak in de onze. Zeer lage en lage één
minuut Apgar scores worden beschouwd als een uitdrukking van een niet−geruststellende
toestand643 of als een marker van een foetus in moeilijkheden615;628, die de toestand van de
foetus onmiddellijk voor de geboorte weerspiegelt. Bij correct gebruik, laten één minuut
Apgar scores toe de obstetrische praktijk616 over de ziekenhuizen te vergelijken en de
evolutie van de obstetrische zorgen te evalueren.617;618
De evidentie, die we verzamelden, over verschillen in neonatale uitkomsten in functie van
de KSC van de ziekenhuizen, kunnen als gemengd omschreven worden. Het verband
tussen een “hoog” KSC en minder “zeer lage” één minuut Apgar scores schenen in het
voordeel te pleiten van deze groep. Zoals hoger vermeld was het nochtans in deze groep
dat we een relatief exces aantroffen van zeer lage Apgar scores na een vaginale verlossing,
waar men eerder het omgekeerde had verwacht. Deze vaststelling impliceert dat minstens
een deel van de keizersneden niet verricht werd voor medische redenen. Dit wijst op een
minder goede indicatie stelling, een nochtans belangrijk onderdeel van deze
procesindicator, en derhalve een minder goede kwaliteit.
Hoofdstuk 5: Kwaliteit van zorgen
259
Meer algemeen gesteld, van de 45.104 borelingen, zonder congenitale afwijking en met
een goede één minuut Apgar score, is tenminste een groot deel verlost d.m.v. een
keizersnede voor niet−medische redenen. Evidentie vanuit Vlaanderen toont aan dat
ongeveer 8 % van de vrouwen, die bevielen tijdens onze studieperiode, al een keizersnede
ondergaan hadden644. Wanneer we deze informatie op het hele land toepassen en ervan
uitgaan dat vrouwen met een voorgeschiedenis van KS ook via een keizersnede verlost
worden, zou een meer precieze benadering een bovengrens van overgebruik aangeven van
ongeveer 40.000 keizersneden over vier jaar, aangenomen dat hogere leeftijd van de
moeder geen indicatie is voor een KS en dat de Apgar scores correct geregistreerd werden.
Anderzijds werd er in de groep van borelingen zonder congenitale afwijkingen geen
keizersnede uitgevoerd bij 574 met een “zeer lage” en 3.114 met een “lage” 5-minuten
Apgar score, waar zij er wellicht voordeel bij gehad zouden hebben via een keizersnede
geboren te zijn, wat ondergebruik van de ingreep suggereert. Vijf minuten Apgar scores
worden immers nog altijd beschouwd als een valide predictor van neonatale sterfte en
soms van neurologische letsels.619;620 Hun gebruik als predictor voor neurologische letsels
echter staat ter discussie.619;620;645-647 Noteren we dat onze bevinding van zowel over− als
ondergebruik van KS overeenstemmen met die van een andere, gelijkaardige studie.607
Het kan moeilijk of tegenaangewezen zijn Apgar waarden te interpreteren in geval van
vroeggeboorte, ernstige afwijkingen, meerlingzwangerschap, rookgedrag, drugs, trauma,
infecties, hypoxie, hypovolemie, laag geboortewicht, IUGR, stuit of van toenemende
maternale leeftijd. 621;642;645 Ook een spontane, tijdelijke verlaging van de neonatale
bloedsomloop en ademhalingsstelsel kan de interpretatie van de Apgar scores
bemoeilijken.642 Electieve KS, een zwangerschapsduur van < 38 en > 41weken, mannelijk
geslacht, foetale asfyxie, moederlijk astma en diabetes, en type van anesthesie648 (regionale
versus algemene) zijn risicofactoren voor respiratoir lijden bij borelingen. Vermits we
meerlingzwangerschappen, gevallen van prematuriteit, IUGR, congenitale afwijkingen, en
abnormale ligging met inbegrip van stuitligging 621;642;645uit onze studie sloten, vermeden
we tenminste een belangrijk deel van deze beperkingen en verder kunnen we de invloed
van anesthesie als minimaal beschouwen op voorwaarde van een oordeelkundige keuze
van type anesthesie en pijnstillende medicatie.649;650
Hoofdstuk 5: Kwaliteit van zorgen 260
Zoals het wel vaker voorkomt op diagnostisch gebied en in peer review, kan men terecht
stellen dat Apgar scores onderhevig zijn aan variabiliteit tussen
waarnemers.129;131;145;148;279;349;643;645;651-654 Hieraan menen we ten dele verholpen te hebben
door de categorisatie van de score in internationaal, gebruikelijke klassen.618-620;642;651
Verder menen we door de gehanteerde exclusiecriteria dit probleem nog verder verkleind
te hebben, vermits het zich vooral voordoet bij de lagere scores145. Spijtig genoeg hadden
we geen gegevens over andere bronnen van minder gunstige Apgar scores zoals
ongunstige sociaal−economische status655, roken en andere factoren die rechtstreeks of
onrechtstreeks Apgar scores kunnen beïnvloeden zoals geboren worden “buiten de
diensturen”, op een bepaalde dag in de week of op een feestdag. Met uitzondering van
SES kunnen die factoren aangepakt worden door organisatorische maatregelen en adviezen
aan de zwangeren, en zijn dus in zekere mate kwaliteitsgebonden.642;656;657 Verder
verschaffen Apgar scores informatie over een “gecompromitteerde” neonatus, die niet
altijd kan ingewonnen worden door biochemische metingen.642 Een ander, operationeel
argument ten voordele van de Apgar score bestaat in zijn praktisch volledige registratie in
de MKG, wat niet zondermeer kan aangenomen worden voor de andere neonatale
eindpunten. Tenslotte ontbreekt het ons vooralsnog aan algemeen aanvaarde en over het
ganse land beschikbare alternatieven.642;658
De resultaten voor de andere neonatale eindpunten waren ook niet éénduidig. We
twijfelden daarenboven aan de volledigheid van onze gegevens, wegens het “open vragen”
type van de registratie en het proportioneel zeer lage opnamecijfer in gespecialiseerde
diensten van borelingen met ongunstige neonatale eindpunten in de “hoog KSC” groep.
Verder scheen KS voor de meeste van deze eindpunten geassocieerd te zijn met minder
gunstige uitkomsten en schenen de ziekenhuizen met een laag KSC het minder goed te
doen, wat ook elders werd vastgesteld607. Deze bevindingen suggereren dat ziekenhuizen
met een gemiddeld KSC wellicht de betere benchmark zijn.
5.2.4.5 Organisationele aspecten Ondanks onze inspanningen om de typische beperkingen van administratieve gegevens
zoveel mogelijk te omzeilen, kunnen onze bevindingen best omschreven worden als een
“bruikbare screening”, die kan aanzetten tot het nemen van kwaliteitsbevorderende
Hoofdstuk 5: Kwaliteit van zorgen
261
initiatieven in de ziekenhuizen, veeleer dan als uitspraken over kwaliteit van de
zorgen.180;659 In onze benadering werden ziekenhuizen beschouwd als individuele
structuren van het gezondheidssysteem, waarvan de diensten een gemeenschappelijk
organisatorische cultuur en een aantal gemeenschappelijk processen deelden, en die
verantwoording dienden af te leggen.
Zoals voormeld werden niet het tot schande maken, noemen en blameren van individuen
of instituten maar het identificeren van organisatie− en cultuurgerelateerde problemen
beschouwd als het aanknopingspunt voor kwaliteitsbevorderende acties.269;426;495-498;556;660
Daarom was deze feedback anoniem en had als doel de clinici, diensten en ziekenhuizen
informatie te verschaffen, die hen toeliet zich met de anderen op een zinvolle manier te
vergelijken. Daarenboven is het mogelijk dat niet ziekenhuisspecifieke KS−gerelateerde
informatie zoals de nationale opwaartse trend, de toenemende incidentie van respiratoire
problemen na KS, en het KSC in functie van opnamedag hen kan gestimuleerd hebben
eventuele structurele problemen in het eigen ziekenhuis op te sporen. Vermelden we
hierbij het werken met shiften; het zich teveel verlaten op te weinig ervaren personeel ’s
nachts; het beschikbaar zijn en de kwaliteit van artsen, verpleegkundigen en ander
personeel; en, de mogelijkheid om diagnostische testen en ingrepen uit te voeren.656;657
5.2.4.6 College van geneesheren Hoewel er aangetoond werd dat feedback kwaliteitsinitiatieven kan stimuleren566, schijnt
het verkieselijker dat hij zou gedragen worden door iemand, gevormd in de interpretatie
van gegevens, die geldt als een autoriteit en over de nodige middelen beschikt.269 Daarom
werd aan het College van geneesheren dezelfde feedback voorgelegd als aan de
ziekenhuizen. Hij zou hen kunnen helpen ziekenhuizen te identificeren, met zowel
bovenmaatse als ondermaatse kwaliteit, om een benchmark vast te leggen en om
ziekenhuizen met kwaliteitsproblemen te helpen ze op te lossen. Daarenboven kan de
feedback en het betrokken zijn in verbeteringsprocessen hen wijzen op problemen die niet
onmiddellijk door de indicator bestudeerd worden zoals de relevantie van het “informed
consent”, electieve keizersneden met inbegrip van de KS op vraag van de moeder575;605,
stuitligging, en de afwezigheid van protocollen en richtlijnen.
Vermits medico-legale implicaties op indirecte manier de vooruitgang van
kwaliteitsbevorderende initiatieven kunnen vertragen, is het interessant te weten dat het
Hoofdstuk 5: Kwaliteit van zorgen 262
opvolgen van protocollen meer en meer in rechtszaken gebruikt wordt, en dat, in de meeste
staten van de VS, het toepassen van klinische paden beschouwd wordt als relevante maar
niet beslissende informatie om vast te stellen of een arts afweek van de
standaardbehandeling.661
In deze context, wordt het College geadviseerd zijn houding te definiëren betreffende drie
belangrijke ter discussie staande topics, te weten: stuitligging en vaginale verlossing,
vaginale verlossing na sectio, en keizersnede op vraag van de moeder.
1) Stuitligging en vaginale verlossing
Stuitligging bij een voldragen zwangerschap is een vrij vaak voorkomend (3 tot 4 % van
alle zwangerschappen) en fel gedebatteerd fenomeen.
De “Term Breech Trial” concludeerde dat een KS aanbieden in dit geval tot betere
resultaten leidde voor de foetus dan een vaginale verlossing, en tot even goede resultaten
voor de moeder.662;663 De resultaten van deze ene studie deden de medische praktijkvoering
in grote mate en universeel veranderen.580
Zowel methodologische gebreken als inherente beperkingen bij het toepassen van een
grootschalige, gerandomiseerde klinische studie op een complex fenomeen, waarbij
zorgverstrekkers integraal deel uitmaken van de behandeling, doen twijfelen aan de
conclusies van de studie.580;581;664 Het in acht nemen van de inclusie− en exclusiecriteria
vormen een majeur probleem bij het beoordelen van de conclusies: bijvoorbeeld bij meer
dan 30% van de moeders (in beide armen van de studie) waren er gevallen van
hyperextensie van het foetaal hoofd, die hadden moeten uitgesloten worden; tweelingen,
prematuren en doodgeboren kinderen waren ten onrechte opgenomen in de studie; en, er
waren significant meer borelingen met een gewicht van > 4.000 g in de arm van de
vaginale verlossing.580 Daarenboven hield de studie onvoldoende rekening met de het
complexe karakter van een verlossing bij stuitligging, die een correcte uitvoering van een
grootschalige, gerandomiseerde klinische studie uiterst moeilijk maakt581;665 en lijkt het
bovendien zeer moeilijk om terzelfder tijd kwaliteit te verzekeren in 121 centra.581 Verder
nodigde het protocol de deelnemende centra uit om hun cijfer van vaginale bevallingen op
Hoofdstuk 5: Kwaliteit van zorgen
263
te drijven en daarvoor de noodzakelijke veiligheidscriteria te versoepelen (het protocol
stond een dilatatie van 0,5 cm/uur toe en van 3,5 uur voor het tweede stadium).580;581
Tenslotte dienden de auteurs toe te geven dat een electieve KS, vergeleken met een
vaginale bevalling, na twee jaar geen voordeel meer bleek te bieden.666;667
Een grote Zweedse cohort studie gekoppeld met een gevallen−controle studie, kwam tot de
bevinding dat een geplande KS in geval van stuitligging leidde tot een significante
vermindering van perinatale en kindersterfte.668 Zij vermeldde nochtans dat een Noorse en
Finse studie concludeerden dat een vaginale bevalling voor een voldragen stuit in passende
gevallen, na zorgvuldige selectie, strikte foetale monitoring en in aanwezigheid van een
ervaren obstetrisch team, kan geadviseerd worden.668 Een Schotse bevolkingsstudie die
reikte tot de schoolleeftijd en waarbij gevallen van doodgeboorte en neonatale sterfte
uitgesloten waren, kwam tot de conclusie dat in geselecteerde gevallen van een voldragen
stuitligging een geplande vaginale bevalling met KS wanneer nodig, even veilig was als
een KS in termen van lange termijn handicap.669
Een recente observationele studie670 over een voldragen stuitligging, waaraan ons land
deelnam, stelde naast belangrijke interregionale praktijkverschillen in wijze van
verlossing, een laag cijfer (1.59%; 95%CI (1.33-1.89)) vast van de gecombineerde
neonatale uitkomst (foetale en neonatale mortaliteit of ernstige neonatale morbiditeit) en
geen significante verschillen (OR: 1.10; 95% BI [0.75-1.61]) tussen de geplande vaginale
verlossingsgroep (N = 2.502) en de geplande keizersnedengroep (N = 5.573).
In geval van een voldragen stuitligging, werd er in Nederland voorgesteld aan ouders het
advies te verstrekken dat een geplande KS niet zou resulteren in een verminderd
sterfterisico noch in een verbetering van de neurologische uitkomst na twee jaar.671
2) Vaginale verlossing na sectio.
Hoewel arbeidsmanagement en objectieve criteria voor het diagnosticeren van dystocie
hoekstenen zijn van een institutionele verbetering van de keizersnedenpraktijk577, blijft
vaginale bevalling na sectio een waardevol alternatief voor een herhalingssectio hoewel
hiertegen een probleem in termen van veiligheid aangevoerd wordt.564;577;672-675
Hoofdstuk 5: Kwaliteit van zorgen 264
Bij de vergelijking van een proefarbeid met een electieve KS, vonden McMahon et al.
tweemaal zoveel belangrijke maternale verwikkelingen (hysterectomie, uterusruptuur en
operatief letsel) in de arm van de proefarbeid. Apgar scores, opname in een NICU, en
perinatale mortaliteit, waren nochtans vergelijkbaar bij borelingen van moeders met een
proefarbeid en die waarvan de moeder een electieve herhalingssectio ondergingen.675
Het risico van een uterusruptuur werd bevestigd in andere studies.632;676 Toegenomen
perinatale mortaliteit en morbiditeit werden eveneens geassocieerd met een proefarbeid na
voorafgaande sectio.567;588;632;676 Vermelden we dat in de VS ongeveer één derde van de
sectio’s herhalingssectio’s zijn.564;677
Men vindt grote interziekenhuis praktijkverschillen, die niet verklaard kunnen worden
door verschillen in de klinische bevolkingen of in het type van ziekenhuis. Markers van
SES schijnen het meest uitgesproken effect te hebben op het cijfer van de pogingen tot
vaginale bevalling na een eerdere keizersnede.629;678 Recente rapporten verdedigen
nochtans een vaginale bevalling na een eerdere keizersnede, al dan niet op voorwaarde dat
het advies voor vaginale bevalling na een eerdere keizersnede gebaseerd zou zijn op een
scoresysteem.576;578;579;679-681
Bij gebrek aan gerandomiseerde klinische studies, besloot een peer−reviewed evidentie
rapport dat de uitkomsten vergeleek van een electieve herhalingssectio met een proefarbeid
voor een vaginale bevalling na een eerdere keizersnede (met inbegrip van de studie van
McMahon) dat maternale sterftecijfers niet verschilden; dat infectiecijfers hoger lagen bij
electieve herhalingssectio, maar dat in subgroepanalyses voor proefarbeid al dan niet
gevolgd door een KS deze cijfers hoger lagen in de groep vrouwen die uiteindelijk een
sectio ondergingen. Verder stelde men vast dat in geval van uterusruptuur het risico voor
een maternale hysterectomie 4,8/ 10.000 bedraagt en het risico voor perinatale sterfte
1,5/10.000; en, dat er onvoldoende materiaal beschikbaar is om het effect van de wijze van
verlossing op Apgar scores en respiratoire morbiditeit vast te stellen.576
In een review van 2005 concludeerden de auteurs dat studies op een consistente manier
hoge slaagcijfers ( 60 tot 80 %) rapporteerden bij vaginale bevalling na een eerdere
keizersnede bij vrouwen die eerder een lage segment incisie gehad hadden en dat : “De
Hoofdstuk 5: Kwaliteit van zorgen
265
huidige evidentie suggereert dat de meeste vrouwen, die insneden van het lage segment
hadden bij een vorige keizersnede, veilig een proefarbeid kunnen ondergaan.”680
Voortbouwend op het AHRQ Evidence Report Number 71, werden er klinische richtlijnen
uitgewerkt, met inbegrip van de beoordeling van de waarschijnlijkheid op succes van een
vaginale bevalling na een eerdere keizersnede.682
Van twee lopende gerandomiseerde klinische studies wordt uitsluitsel verwacht
betreffende de VABC problematiek.680 Onnodig te zeggen dat deze problematiek uitvoerig
met de patiënte dient besproken te worden vooraleer een beslissing rond de
bevallingswijze genomen wordt.588;682;683
3) Keizersnede op vraag van de moeder.
Het National Institute for Clinical Excellence adviseert dat zwangere vrouwen, die om een
KS vragen, er niet automatisch een krijgen indien er daarvoor geen medische redenen
bestaan.684 Ook ACOG waarschuwt voor een electieve herhalingssectio voor
niet−medische redenen, zeker bij vrouwen die meerdere kinderen verlangen, omdat het
risico op placenta previa en accreta stijgen bij iedere KS.685
Naast medische redenen toonde het National Collaborating Centre for Women's and
Children's Health aan dat significante kostenbesparingen kunnen gemaakt worden door een
beleid te voeren dat erop gericht is de maternale vraag naar KS te verminderen.593 Beide
aspecten zijn essentieel in Donabedian’s benadering van kwaliteit.265
5.2.4.7 Feedback naar beleidsverantwoordelijken Onze feedback kan, naast ziekenhuizen en het College, ook nuttig blijken voor
beleidsverantwoordelijken. Hij kan immers de groeiende medicalisering van het
geboortegebeuren onder hun aandacht brengen en meer bepaald een aantal van zijn
structurele oorzaken. Dit materiaal kan een beleid schragen dat erin bestaat een
operationele structuur te creëren die ermee belast wordt de toekomstige nationale
feedbacks te begeleiden, de ontwikkeling van hierop gebaseerde kwaliteitsbevorderende
acties en het initiëren van bijkomende indicatoren.Verder zullen lokale initiatieven, die
aansluiten op de feedback, aangemoedigd worden. Zowel een continue investering in een
infrastructuur voor kwaliteitsbevordering als het voorzien in een beschermde tijd voor deze
activiteiten zijn vereist om het project te laten slagen.557
Hoofdstuk 5: Kwaliteit van zorgen 266
Tenslotte blijkt uit deze feedback duidelijk dat de organisatie van de obstetrische zorgen
van fundamenteel belang is voor het beheersen van het keizersnedencijfer. Dit probleem
zal in overleg tussen de verschillende niveaus dienen aangepakt te worden. Elementen van
overweging bevatten (1) regionalisatie van diensten zodat er ook tijdens de weekends en
buiten de diensturen altijd over het nodige personeel kan beschikt worden, (2) herziening
van het financieringsmechanisme met onder meer een relatieve opwaardering van de
vaginale verlossing en een betaling voor een zwangerschapsepisode, (3) operationele
opsplitsing van het specialisme gynecologie-obstetrie, en herwaardering en
herpositionering van de vroedvrouw, (4) aanduiding door de bevoegde overheden van een
groep experten waarop de rechters dienen beroep te doen in geval van een gerechtelijk
proces, (5) een door de Colleges en beroepvereningingen uit te werken “informed
consent” waarin de indicaties voor een keizersnede objectief worden toegelicht, en (6)
objectieve informatie naar de toekomstige moeders waarbij het beeld van “de keizersnede
als de uiteindelijke manier van verlossing” objectief benadert wordt.
Bijlage 1: Feedback. Beslisboom.
Stap1: Periode analyse In overeenstemming met de aanwezige informatie wordt een periode score toegekend.
Afwijking Bonferroni bovengrens
95% bovengrens
95% ondergrens
Bonferroni onder grens
Periode score
> + 35 ≥ 0 1 > + 35 ≥ 0 < 0 2 < - 25 ≤ 0 3 < - 25 > 0 ≤ 0 4 < + 36 en > -26
5
> + 35 < 0 6 < - 25 > 0 7
Hoofdstuk 5: Kwaliteit van zorgen
267
Stap 2: Trend analysis In overeenstemming met de aanwezige informatie wordt een trend score toegekend.
Afwijking Bonferroni bovengrens
95% bovengrens
95% ondergrens
Bonferroni onder grens
Trend score
> + 5 ≥ 0 1 > + 5 ≥ 0 < 0 2 < - 5 > 0 ≤ 0 3 < - 5 ≤ 0 4 < 6 en > -6 5 Stap 3: Combinatie van periode en trend analyse
Periode score Trend score Cat Feedback 1 1 1 EAE A>01 2 1 EAE A>01 3 2 IAI A>0 1 4 2 IAI A>0 1 5 1 EAE A>02 1 2 IAI A>0 2 2 2 IAI A>0 2 3 3 iai A>0 2 4 3 iai A>0 2 5 2 IAI A>0 3 1 5 iai A<0 3 2 5 iai A<0 3 3 7 EAE A<03 4 7 EAE A<03 5 7 EAE A<04 1 6 IAI A<0 4 2 6 IAI A<0 4 3 5 iai A<0 4 4 5 iai A<0 4 5 5 iai A<0 5 1 2 IAI A>0 5 2 3 iai A>0 5 3 5 iai A<0 5 4 5 iai A<0 5 5 4 AMG 6 Eender welke 3 iai A>0 7 Eender welke 5 iai A<0
Cat: globale score; EAE: externe audit aanbevolen; IAI: interne audit aanbevolen; iai: interne audit valt te overwegen; AMG: neem algemene maatregelen. A < 0: afwijking < 0; A > 0: afwijking > 0.
Hoofdstuk 5: Kwaliteit van zorgen 268
Bijlage 2: Majeure congenitale afwijkingen mogelijkerwijs gerelateerd met geboorte asfyxie
Congenitale afwijking ICD−9−CM Neuraalbuis defecten 740.0−741.9 Hersenafwijkingen 742.0, 742.2−742.4, 745.9 Microcefalie 742.1 Majeure aangeboren hartafwijkingen
745.0−745.3, 745.6, 746.0−746.9, 747.1, 747.3, 747.41
Cerebrovasculaire anomalie 747.81 Anomalie van het ademhalingstelsel 748.3−748.6 Gastrointestinale anomalie 750.3, 751.0−751.5,751.8, 751.9 Renale/blaas anomalie 753.0−753.9 Cranosynostose 756.0 Defect van de abdominale wand 756.7 Down syndroom 758.0 Andere congenitale afwijkingen 758.1−758.9 Multipele anomalieën niet gespecificeerd
759.7
5.3 INTERZIEKENHUIS VERGELIJKING VAN LETALITEITCIJFERS NA EEN OPNAME VOOR
ACUUT MYOCARDINFARCT.
De tekst van dit hoofdstuk is gebaseerd op onderzoek van de jaren 2004 tot 2007.
Vertrekkend van een tekst van de AHRQ wordt de analyse van deze kwaliteitsindicator
met input van de Collegs van cardiologen, intensivisten en urgentisten, en van het
MONICA-register (Gent-Brugge) verfijnd en aangepast aan de Belgische context.
5.3.1 Inleiding
Het acuut myocardinfarct (AMI) is een belangrijk gezondheidsprobleem in termen van
frequentie, ernst, sociale en economische kosten, behandelbaarheid, en wordt beschouwd
als een prioriteit door beleidsmakers en gemeenschap.500;686;687
Het is gekenmerkt door een hoog letaliteitcijfer (AMI-LC), tot negen maal meer in de
oudere leeftijdsgroepen (> 65 jaar)688. Deze leeftijdsgroepen vertonen overigens minder
typische symptomen en vaker een cardiogene shock.688
Hoofdstuk 5: Kwaliteit van zorgen
269
Acute hartdecompensatie doet zich binnen de 24 uur na een AMI voor bij 30% van de
patiënten en leidt in 7-10 % der patiënten tot een cardiogene shock, de meest gevreesde
verwikkeling van AMI.689 Dergelijke shock is gekenmerkt door een sombere prognose en
doet zich ongeveer in 1/3 der gevallen vóór de ziekenhuisopname voor.690-696 Indien
systematisch en onmiddellijk een angioplastie, wat door de Europese richtlijn697
aanbevolen werd, toegepast wordt, situeert de intramurale letaliteit bij cardiogene shock
zich rond 25% versus ongeveer 1% indien het een AMI zonder shock is.693
Er bleek anno 2000 weinig of geen letaliteit- en therapieverschil tussen mannen en
vrouwen meer te bestaan, wel verschillen in symptomatologie.698-703 Daartegenover staat
dat er bij oudere patiënten een ondergebruik bestaat van thrombolytische therapie.688
In de midden-negentiger jaren stelde men dat het natuurlijk verloop van AMI moeilijk te
beschrijven was wegens het bestaan van asymptomatische infarcten, van fatale acute
coronaire sterfgevallen buiten het ziekenhuis en van verschillen in de gebruikte
diagnostische methodologie.697
De “community” 30-dagen AMI-sterfte werd op een consistente manier geëvalueerd op
50% waarvan de helft binnen de eerste twee uur.697 De intramurale AMI letaliteit
evolueerde van een 25-30% in de 60ger jaren tot een 18% in de midden-tachtiger jaren, de
extramurale sterfte daarentegen veranderde in Europa, in tegenstelling met Minnesota
(Verenigde Staten)704, in die tijdsspanne nagenoeg niet697.
Het type ziekenhuis (met of zonder een cardiologiedepartement) scheen een invloed te
hebben op behandeling en uitkomst na een AMI, gekenmerkt door een lagere mortaliteit en
minder hartfalen. Men slaagde in ziekenhuizen met een cardiologiedepartement er vaker
in de doorstroming te herstellen.705
Hoewel er aangetoond werd dat richtlijnen het AMI-LC doen dalen706-709, werden ze in
Europea710-712 en Noord-Amerika688;713-717 niet altijd en niet eenvormig toegepast, onder
meer wegens het niet doorstromen van richtlijnen uit “cardiologen” tijdschriften naar
huisartsen en internisten.706;714;718Verder schijnt het zo te zijn dat er een omgekeerd
verband bestaat tussen de ernst van een geval en het toepassen van richtlijnen, 710en zijn de
richtlijnen voor thrombolyse in oudere patiënten niet eenduidig688.
Het publiekelijk vrijgeven van AMI-LC schijnt in een Canadese context een positieve
invloed uit te oefenen op kwaliteitsinitiatieven.298
Hoofdstuk 5: Kwaliteit van zorgen 270
Om de zorg van AMI-patiënten te rationaliseren, werd in België een cardiaal
zorgprogramma ingevoerd.719 Een structuur bestaande uit drie niveaus werd opgezet:
basiszorg ziekenhuizen (met A als label) zonder catheterisatie mogelijkheden,
intermediaire ziekenhuizen (met B1 als label) waar coronaire angiografieën kunnen
uitgevoerd worden maar geen percutaneous coronary intervention (PCI), en tertiaire
ziekenhuizen (met B2-B3 als label), die de ganse gamma van cardiale therapieën
aanbieden met inbegrip van PCI en coronary artery bypass graft (CABG).
Nochtans bleek een recente studie niet bij machte een betere uitkomst aan te tonen voor
patiënten, behandeld in een dienst waar een PCI uitgevoerd kon worden.720
Een vergelijking van de intramurale AMI-LC tussen de ziekenhuizen is geen eenvoudige
opgave. Als voormeld doen een groot deel van de sterfgevallen zich voor in de eerste twee
uur na het infarct, wat tot het niet-stellen van een “vaste klinische” diagnose op basis van
de klassieke criteria (symptomen, EKG en enzymen) kan leiden, en bestaan er verschillen
in diagnosestelling met een eventuele weerslag op teller en noemer van het
letaliteitcijfer.697;721
Twee van de belangrijkste problemen in verband met cardiale zorg, te weten het volume-
uitkomst verband voor PCI en de superioriteit van primaire angioplastie ten aanzien van
thrombolytische therapie, beheersten anno 2000 - onze studieperiode liep van 2002 tot
2005 - het wetenschappelijke debat.716Hierbij dient men er rekening mee te houden dat in
het “reële leven” patiënten in eerste instantie beroep doen op lokale spoeddiensten en
lokale ziekenhuizen en dat daar de therapeutische beslissing over een eventuele
angioplastie versus thrombolyse genomen wordt.722In België bepaalde de toenmalig
geldende bepalingen trouwens dat patiënten door de spoeddiensten naar het
dichtstbijzijnde ziekenhuis moesten gebracht worden.720
Laten we om een faire interziekenhuis vergelijking te kunnen doorvoeren de toenmalige,
zich ontwikkelende en actuele stand van de wetenschap summier trachten weer te geven.
Wij baseerden ons hiervoor bij voorkeur op klinische studies of meta-analyses.
Men nam aan dat er een onderscheid diende gemaakt te worden tussen ST segment
elevatie myocardinfarct (STEMI) en nieuwe Linker Bundeltakblok (LBTB), en niet-ST
Hoofdstuk 5: Kwaliteit van zorgen
271
segment elevatie myocardinfarct (NSTEMI), wegens hun verschillende prognose en
behandeling.697;705;717;723;724
In geval van STEMI of een nieuwe LBTB gold het voorschrift zo snel mogelijk de
perfusie te herstellen.697;704;713;717;725-727Dit gebeurde dan liefst via PCI of CABG697;728-732,
zeker in de hoogrisico gevallen697, maar ook als een thrombolyse niet tijdig kon
doorgevoerd worden.733
Verder kwam men tot de bevinding dat het veilig was patiënten te vervoeren van
basiszorg naar tertiaire ziekenhuizen733, op voorwaarde dat verkeersopstoppingen geen
courant probleem vormden725. Men stelde vast dat hoogrisicopatiënten – er bestonden
bruikbare classificatiesystemen om hen te identificeren734 - en patiënten met extensieve
infarcten beter getransporteerd werden voor een angioplastie dan dat ze een thrombolyse
kregen735-737. Wel bestonden er opinieverschillen over transfer bij slechte hemodynamische
toestand (o.a. cardiogene shock)725;733;738-740.
Het was ook zo dat patiënten met contra-indicaties voor thrombolyse bijna steeds d.m.v.
een invasieve benadering konden behandeld worden in competente centra.739Het begon
eveneens duidelijk te worden dat stents en abciximab - een bloedplaatjesaggregatie
inhibitor - de uitkomsten van primaire angioplastie verbeteren.739
Het inzicht groeide dat primaire angioplastie meer kosten-effectief zou zijn dan
thrombolyse, en dat primaire angioplastie waarschijnlijk veilig uitgevoerd kon worden
zonder chirurgische back-up, mits het rigoureus toepassen van eligibiliteitscriteria.739 De
relatieve merites van pre-hospitaal (“on-site”) thrombolyse en Primary PCI (PPCI) stonden
ter discussie736;741en pre-hospitaal thrombolyse werd als efficiënter beschouwd dan
intramurale thrombolyse.742 Men stelde verder vast dat een opname buiten de diensturen
het starten van de therapie vertraagde, wat vooral in geval van thrombolyse tot slechtere
resultaten leidde743en dat het volume van uitgevoerde PTCAs omgekeerd evenredig was
met mortaliteit717;738;741;744.
De gehanteerde definitie en veranderingen in de definitie van AMI kunnen in grote mate
de incidentie en letaliteitcijfers van AMI beïnvloed hebben, net zoals de verscheidenheid
van de verschillende cardiale troponine assays.721;745-749 Er bleek overigens slechts een
Hoofdstuk 5: Kwaliteit van zorgen 272
matige overeenkomst te bestaan tussen diagnose bij opname en bij ontslag.712 Verder
maakte de Internationale Classificatie van Ziekten, Negende Herziening, Klinische
Modificatie194 (ICD-9-CM) voor 2006 – dus tijdens de studieperiode - geen onderscheid
tussen STEMI en NSTEMI, hoewel ze daarvoor nu richtlijnen verschaft.750 STEMI wordt
gecodeerd als 410.0-6, 410.8; NSTEMI als 410.7; en AMI “Not Otherwise Specified”
(AMI NOS) als 410.9. Het wordt dan, behalve het problematische AMI NOS, mogelijk de
codering te herinterpreteren in overeenstemming met deze update.
Een volgende moeilijkheid betreft het presenteren van de eventuele verschillen in AMI-
LCs tussen de ziekenhuizen. “League tables” (profielen zonder adequate risicocorrectie)
zijn hiervoor inadequate instrumenten.286 Administratieve gegevens en meer specifiek hun
correctie-maten (zoals ROM) dienen in deze context van risicocorrectie trouwens zeer
omzichtig gebruikt te worden.188;196Verschillende alternatieve benaderingen werden
ontwikkeld. Vaak gaat het dan over geselecteerde studiegroepen of leeftijden.715;751 Een
eenvoudig drievariabelen model, bestaande uit leeftijd, hartslag en systolische bloeddruk
bij opname (allen als continue variabelen gemodelleerd) bleek voor patiënten van alle
leeftijdsgroepen een goede predictor te zijn voor de 30-dagen mortaliteit zoals uit een
“area under the receiver operatings characteristic curve” (AROC) van ongeveer 0,75
bleek.751Geslacht leek geen invloed uit te oefenen, maar leeftijd alleen bleek een AROC
van 0,71 op te leveren.751 Ongeveer gelijktijdig werden in Canada twee modellen,
gebaseerd op elf secundaire oorzaken of op Charlson’s comorbidity index in
ziekenhuisontslaggegevens, ontwikkeld, die vergelijkbare resultaten opleverden (met iets
betere resultaten voor het elfvariabelen model), ook wanneer het toegepast werd op een
bevolking in de VS.752
Naast klinische en epidemiologische bevindingen, die een verband aantoonden tussen
betere zorg en betere uitkomst707;753, leidden de maatschappelijke implicaties bij de
programmering van cardiale zorgen en het feit dat meerdere landen AMI-LC reeds als
kwaliteitsindicator gebruikten286;301;752 of van plan waren te gaan gebruiken ons er toe
AMI-LC te gebruiken als kwaliteitsindicator.
Onder voorbehoud over voldoend volledige en accurate gegevens te beschikken, trachtten
we aan de hand van ontslaggegevens het bestaan aan te tonen van (1) klinisch belangrijke
Hoofdstuk 5: Kwaliteit van zorgen
273
en statistisch significante interziekenhuis verschillen in AMI-LC, en (2) een nationale
trend van het AMI-LC. Daarenboven trachtten we de letaliteit te vergelijken in functie van
het type ziekenhuis.
5.3.2 Methoden
5.3.2.1 Gegevensbronnen De Minimale Klinische Gegevens (MKG) bevatten patiëntengegevens (waaronder
geboortejaar, geslacht, verblijfplaats, een anoniem ziekenhuisidentificatienummer),
verblijfsgegevens (waaronder het jaar en de maand van opname en ontslag, transfer vanuit
en naar een ander ziekenhuis) en een onbeperkt aantal nevendiagnosen en ingrepen. De
MKG verzamelt gegevens over alle verblijven met inbegrip van verblijven van patiënten,
die in het buitenland verblijven. Een uniek identificatienummer, dat het opvolgen van een
getransfereerde patiënt moet toelaten, ontbreekt. Daarentegen is het mogelijk de
“Charlson’s comorbidity index” te berekenen, die bijzonder geschikt lijkt voor het
bestuderen van de ziekenhuisletaliteit bij patiënten met een ischemische hartziekte.326
Daar volledigheid en accuratesse van de gegevens welgekende beperkingen zijn van
administratieve gegevens182;718 vergeleken we onze gegevens met die van het MONICA
(Multinational Monitoring of Trends and Determinants in Cardiovascular Disease)
register, die verzameld worden volgens de WGO richtlijnen.745 Deze vergelijking dient met
de grootste omzichtigheid uitgevoerd te worden: de studiepopulatie is niet helemaal
identiek en de definitie van de gevallen gebeurt niet op dezelfde manier. Voor MONICA
wordt de studiepopulatie gedefinieerd als alle personen woonachtig in de studieregio i.e. in
Groot Gent en in het arrondissement Brugge, met uitzondering van Knokke-Heist. De niet-
fatale gevallen worden opgespoord via een gestandaardiseerde benadering van de
ziekenhuizen in de regio en via een bevraging van huisartsen van de studieregio met
inbegrip van gevallen elders in België en het buitenland. Voor de fatale gevallen wordt
daarenboven beroep gedaan op de overlijdensberichten van personen woonachtig in de
studieregio. Uit de MKG selecteerden wij alle personen met een woonplaats in de
studieregio. Waar de criteria voor het definiëren van een AMI-geval op eenvormige manier
gehanteerd wordt in de MONICA registratie (gebaseerd op kliniek, EKG en cardiale
enzymen), die dezelfde blijven over de jaren kunnen we dit niet zo maar veronderstellen
Hoofdstuk 5: Kwaliteit van zorgen 274
voor de MKG. In functie van de aanwezige evidentie onderscheidt MONICA onder meer
“bewezen”, “mogelijke” en “fatale gevallen met onvoldoende gegevens”. Zoals Kuch et
al. het stellen berust de klinische definitie van AMI op een aan de hand van symptomen,
EKG en enzymen gestelde diagnose van acuut myocardinfarct wat overeenkomt met een
“bewezen” geval van MONICA.721Merken we hierbij op dat MONICA om de tijdstrend
van AMI-gevallen en de resultaten van hun behandeling te volgen geen beroep doet op de
meer gevoelige nieuwere cardiale enzymen. Tenslotte dient men er rekening mee te
houden dat de AMI diagnose van de MKG gebaseerd is op de diagnose bij opname waar
dit voor MONICA de diagnose bij ontslag is.
5.3.2.2 Studiepopulatie Voortbouwend op het werk van de Agency for Healthcare Research and Quality
(AHRQ)753, selecteerden we voor de periode van 2002 tot 2005 uit de MKG alle verblijven
met een hoofddiagnose van AMI (ICD-9-CM code 410.*1). Gevallen zonder informatie
betreffende de vitale status bij ontslag of van minder dan 18 jaar werden uitgesloten.
Vermits ziekenhuizen met zeer weinig observaties ook extreme, niet significante waarden
vertonen, die de interpretatie van de figuren bemoeilijken, sloten wij daarenboven
ziekenhuizen met minder dan 20 gevallen per jaar uit.
Wegens problemen verbonden aan het transfereren van zieken, met name het dubbel tellen
van gevallen, en om de vergelijking tussen de ziekenhuizen zo eerlijk mogelijk door te
voeren, werd naar het voorbeeld van het AHRQ het AMI-LC op twee manieren berekend.
Een eerste, de zogenaamde IQI 15753 waarin de “uitgaande” transfers werden uitgesloten
(om geen nationale cijfers te berekenen met tweemaal getelde observaties) (N = 46287) en
een tweede, de zogenaamde IQI 32754, waarin zowel de “binnenkomende” als de
“uitgaande” transfers werden uitgesloten (om een vergelijking tussen ziekenhuizen
mogelijk te maken in de subset van gevallen die er van opname tot ontslag behandeld
werden) (N = 38121).
We hebben het probleem van de transfers meer uitvoerig bestudeerd op basis van de MKG
2001-2004.
Hoofdstuk 5: Kwaliteit van zorgen
275
5.3.2.3 Analyse Voor de bedoeling, de eenheid van analyse, de bepaling van een “zone van niet-
interpretatie”, de gegenereerde feedback en zijn interpretatie, en de statistische analyse
verwijzen we naar de gelijknamige secties in 5.2.2 van onze studie m.b.t. het
keizersnedencijfer.
Bij gebrek aan een uniek identificatienummer trachtten we getransfereerde patiënten te
identificeren met een samengestelde sleutel bestaande uit het geboortejaar van de patiënt;
geslacht; woonplaats; jaar en maand van opname en ontslag; en, in de veronderstelling van
zeer korte transfer tijden, weekdag van het ontslag (in het ziekenhuis van waaruit
getransfereerd werd) of opname (in het ziekenhuis waar naartoe getransfereerd werd).
Wegens het numerieke en therapeutisch belang van transfers na een AMI, trachtten we na
te gaan hoe belangrijk dit fenomeen in onze studie was. Verder zou uit de transfer
reconstructie ook belangrijke aanduidingen i.v.m. kwaliteit van de gegevens en van de
zorgen kunnen gewonnen worden. Het zou mogelijk zijn bij dergelijke patiënten na te gaan
(1) of de Charlson’s comorbidity index constant bleef en (2) hoelang de patiënt in het
ziekenhuis van de uitgaande transfer verbleef vooraleer hij getransfereerd werd. Een
constante Charlson’s co-morbidity index is belangrijk in termen van
codeervergelijkbaarheid en derhalve voor onze risicocorrectie. De verblijfsduur vóór
transfer is belangrijk om het onderscheid te kunnen maken tussen een onmiddellijke
doorverwijzing of een noodangioplastie na een mislukte thrombolyse en een latere transfer
voor een electieve PTCA in afwezigheid van spontane of provoceerbare ischemie, die noch
het functioneren van de linker ventrikel, noch de overlevingskansen verbetert.697
Tenslotte voerden we een sensitiviteitsanalyse uit door cardiogene shock aan het model toe
te voegen al dan niet in combinatie met angioplastie en STEMI, waarbij STEMI uit drie
categorieën bestond, afgeleid op basis van de voormelde ICD-9-CM codes en met name
STEMI, NSTEMI en AMI NOS. Het al dan niet toedienen van een thrombolytische
therapie kan op basis van de MKG alleen niet achterhaald worden, maar vereist een
koppeling met de RIZIV gegevens. Vermits deze koppeling een bijzondere toelating
vereist (waarvoor de procedure nog niet definitief vastligt) konden we thrombolyse in deze
studie niet opnemen en dient de bruikbaarheid van dit gegeven voor een routine analyse
nog uitgeklaard te worden.
Hoofdstuk 5: Kwaliteit van zorgen 276
5.3.3 Resultaten
5.3.3.1 Volledigheid en accuratesse van de gegevens. Vergelijking tussen MKG en MONICA Gent Brugge
Bij de vergelijking van de gegevens tussen beide registratiesystemen vallen de bijzonder
grote verschillen op zowel qua aantallen gevallen als qua aantallen fatale gevallen (Tabel
1). Het gaat hierbij over een veel groter aantal gevallen in de MKG registratie, op de
vrouwen in Gent na, en over een veel groter aantal fatale gevallen geregistreerd in de
MONICA registratie.
Noteren we dat in de MONICA registratie 32 van de 77 sterfgevallen zich in het eerste uur
na het ontstaan van de symptomen voordeden (Tabel 2), toen die patiënten zich
waarschijnlijk nog in de spoeddienst bevonden en derhalve niet als een AMI geregistreerd
werden in de MKG. Verder is het mogelijk dat een deel van de patiënten die na meer dan
24 uur overleden, thuis overleden zijn.
Tabel 1 Volledigheid en accuratesse van de gegevens Vergelijking tussen MKG en MONICA Gent Brugge BRUGGE Mannen Vrouwen MKG MONICA MKG MONICA Leeftijd Fatale
gevallen Totaal Fatale
gevallen Totaal Fatale
gevallen Totaal Fatale
gevallen Totaal
25-34 0 0 0 0 0 0 0 0 35-44 0 5 0 6 0 1 0 1 45-54 1 38 5 44 0 2 1 6 55-64 1 51 5 48 1 5 1 5 65-69 1 23 5 21 0 7 3 11 70-74 2 26 5 27 2 13 4 16 Totaal 5 143 20 146 3 28 9 39 GENT Mannen Vrouwen MKG MONICA MKG MONICA Leeftijd Fatale
gevallen Totaal Fatale
gevallen Totaal Fatale
gevallen Totaal Fatale
gevallen Totaal
25-34 0 2 0 2 0 3 0 2 35-44 0 8 1 13 0 0 0 1 45-54 1 26 5 31 1 4 3 9 55-64 5 46 12 49 1 11 5 11 65-69 0 16 4 21 1 5 2 9 70-74 4 25 9 24 0 15 7 15 Totaal 10 123 31 140 3 46 17 47
Hoofdstuk 5: Kwaliteit van zorgen
277
Tabel 2: Aantal fatale gevallen per tijdsperiode van overlijden, geregistreerd in de MONICA registratie.
Tijdsperiode van overlijden Brugge Gent Totaal
Mannen Vrouwen Mannen Vrouwen
< 1 uur 6 2 17 7 32
1-24 uur 6 4 9 5 24
> 24 uur 8 3 5 5 21
Totaal 20 9 31 17 77
5.3.3.2 Transfers We bestudeerden het probleem van de transfers op basis van de MKG 2001-4.
Zoals blijkt uit figuur 1 werd er bij 23.556 (37%) van de 63.237 verblijven, met AMI
(410.*1) als hoofddiagnose, een transfer geregistreerd. De onvolledigheid van de
registratie m.b.t. transfers kwam aan het licht wanneer we de binnenkomende (IN) en
uitgaande transfers (OUT), respectievelijk 6.555 en 12.409 trachtten te koppelen. We
konden dan slechts 2.524 van de inkomende transfers terugvinden in de uitgaande
transfers. Van deze 2524 inkomende transfers waren er daarenboven 513 afkomstig uit
een B2-B3 ziekenhuis en getransfereerd naar een A of B1 ziekenhuis. Het ging hierbij
waarschijnlijk over patiënten afkomstig uit een A of B1 ziekenhuis, doorverwezen naar
een B2-B3 ziekenhuis voor een angioplastie, na behandeling terug opgenomen in het eerste
ziekenhuis en waarbij de transfers onvolledig geregistreerd waren.
De verblijven met transfers, waarbij we een koppeling hebben kunnen maken tussen
binnenkomende en uitgaande transfers, werden verder onderzocht met een dubbele
bedoeling. Een eerste ging over de accuratesse van de gegevens en met name in welke
mate de co-morbiditeit bij dezelfde patiënt in twee ziekenhuizen eenvormig geregistreerd
werd. Hiervoor vergeleken we de kwartielenwaarden van de Charlson scores in het
ziekenhuis van waaruit de patiënten getransfereerd werden met de kwartielenwaarden van
de Charlson scores voor dezelfde patiënten in het ziekenhuis waarheen zij getransfereerd
werden. Deze nogal summiere vergelijking leverde volgend resultaat op: vóór transfer
Hoofdstuk 5: Kwaliteit van zorgen 278
bedroegen de kwartielwaarden voor het eerste kwartiel 0, voor de mediaan 0 en voor het
derde kwartiel 2. Na transfer bedroegen die waarden respectievelijk 0, 1 en 2. Wanneer we
de Charlson’s comorbidity index vóór en na transfer bij de binnenkomende (IN) en
binnenkomende en uitgaande transfers (IN én OUT) bleken de drie kwartielen van de
scores dezelfde waarde te hebben. Dit wijst, menen we, op een aanvaardbare
codeervergelijkbaarheid in de meerderheid van de gevallen en met een beperkte weerslag
op de riscocorrectie.
Figuur 1: Interziekenhuizen transfer van patiënten in geval van een verblijf met AMI
(410.*1) als hoofddiagnose. MKG 2001-4
39711 verblijvenzonder transfer
(63%)
6555 verblijventransfer IN
(10%)
12409 verblijventransfer OUT
(20%)
4592 verblijventransfer IN èn OUT
(7%)
23556 verblijvenmet transfer (in en/of out)
(37%)
Hoofddiagnose = AMI63267 verblijven
Een tweede aandachtspunt betrof het ogenblik van de transfer. Dit gegeven laat immers toe
na te gaan of de transfer gebeurde voor een onmiddellijke (“rescue”) angioplastie, in
principe minder dan 24 uur. Bij deze groep patiënten was de verblijfsduur (LOS) vóór een
transfer naar een B2-B3 ziekenhuis groter dan 24 uur bij minstens 50% der patiënten
(Mediaan van LOS = 2). Dit suggereert dat het in een behoorlijk aantal gevallen niet om
een transfer voor een spoed angioplastie ging maar wel voor een electieve angioplastie.
Hoofdstuk 5: Kwaliteit van zorgen
279
5.3.3.3 Sensitiviteitsanalyse Vertrekkend van een basismodel met leeftijd, geslacht en Charlson’s comorbidity index als
verklarende variabelen, voegden we eerst het al dan niet aanwezig zijn van een cardiogene
shock en vervolgens het uitvoeren van een angioplastie als verklarende variabelen aan het
basismodel toe. We herhaalden deze opzet maar nu met een het al dan niet aanwezig zijn
van een STEMI in plaats van een shock. Zowel de periode als trendanalyses werden
telkens uitgevoerd. Deze oefening deden we zowel voor de gegevens zonder uitgaande
transfers (IQI 15) als voor de gegevens waarbij alle transfers werden uitgesloten (IQI 32).
Voor deze analyses maakten we gebruik van MKG 2002-5.
Om de invloed van het toevoegen van verklarende variabelen aan het model te resumeren,
hebben we de ziekenhuizen in zeven categorieën ondergebracht. Zij varieerden van sterke:
categorie 1, matige: categorie 2, zwakke: categorie 3 evidentie van een afwijking boven
het nationale gemiddelde cijfer en trend; over geen of geen interpreteerbaar verschil:
categorie 4; tot zwakke: categorie 5, matige: categorie 6 en sterke: categorie 7 evidentie
van een afwijking onder het nationale gemiddelde cijfer en trend. Hierbij gingen we na of
de verschillende modellen ook leidden tot een verandering van categorie voor de
ziekenhuizen.
We vonden geen invloed, onafhankelijk van de gebruikte correctie en van de selectie van
de verblijven in functie van een eventuele transfer, in 26 ziekenhuizen [20 maal categorie
4; 2 maal categorie 1 en 2 maal categorie 5; 1 maal categorie 2; 1 maal categorie 7]. De
ziekenhuizen met een constante categorie 1 en categorie 7 waren van het type A.
Bij 61 ziekenhuizen vonden we een geringe invloed van de gebruikte correctie. Hierbij
definieerden we gering als maximaal 2 categorieën verschil tussen hoogste en laagste
score. Voor 18 ziekenhuizen bestempelden we de invloed van de gebruikte correctie als
belangrijk. We deden dit wanneer er een verschil van drie categorieën werd vastgesteld
maar er consistent boven of onder categorie 4 gescoord werd. We besloten tot een
uitzonderlijke invloed voor de andere 4 ziekenhuizen (Tabel 3).
Hoofdstuk 5: Kwaliteit van zorgen 280
Tabel 3: Invloed van het al dan niet uitsluiten van binnenkomende transfers en van de gebruikte correcties op de afwijking van een ziekenhuis tov het nationale gemiddelde of de nationale trend.
Cardiaal zorgprogramma Invloed Totaal
geen gering belangrijk uitzonderlijk
A 17 (27,87) 40 (65,57) 2 ( 3,28) 2 (3,28) 61 B1 4 (21,05) 12 (63,16) 3 (15,79) 0 (0,00) 19 B2-B3 5 (17,24) 9 (31,03) 13 (44,83) 2 (6,90) 29 Totaal 26 61 18 4 109
( ): rij percentage
In de MKG 2002-5 stelden we bij vier ziekenhuizen, 2 A ziekenhuizen en 2 B2-B3
ziekenhuizen, een uitzonderlijke invloed van de gebruikte correctie vast. Op 29 B2-B3
ziekenhuizen bleken er 15 een belangrijke of uitzonderlijke invloed te ondergaan t.g.v. de
modellering. Het ging daarbij vaak om een verslechtering van de AMI-LC categorie
wanneer aan een model met een basiscorrectie (leeftijd, geslacht, Charlson score en trend)
en een correctie voor shock, nadien een model gefit werd waarbij ook gecorrigeerd werd
voor angioplastie en dit zowel wanneer de inkomende transfers in de analyse werden
opgenomen (IQI15) als wanneer dit niet gebeurde (IQI32).
We illustreren de invloed van de verschillende modellen op de categorisatie van de B2-B3
ziekenhuizen aan de hand van tabel 4.
Hoofdstuk 5: Kwaliteit van zorgen
281
Tabel 4: Voorbeeld van de invloed van het gebruikte statistisch model op de categorisatie van drie B2-B3 ziekenhuizen.
ID Model Periode
(%) Trend (%) Categorie Invloed 21 B 17 7 3 3
BS 30 4 4 BSA 52 4 1 BST 20 9 3 BSTA 34 10 3
56 B -34 -3 7 3 BS -31 -4 7 BSA 5 -1 4 BST -29 -4 7 BSTA -5 -2 4
65 B 5 -8 5 4 BS 3 -12 5 BSA 49 -11 2 BST 3 -8 5 BSTA 35 -8 5
ID: Anoniem ziekenhuisnummer; B: basiscorrectie (leeftijd, geslacht, Charlson score en trend) BS: basiscorrectie + correctie voor shock BSA: basiscorrectie + correctie voor shock + correctie voor angioplastie BST: basiscorrectie + correctie voor STEMI BSTA: basiscorrectie + correctie voor STEMI + correctie voor angioplastie
Periode (%): afwijking van het ziekenhuis bij de periodeanalyse Trend (%):afwijking van het ziekenhuis bij de trendeanalyse Een verdere analyse volgens het model “basiscorrectie + correctie voor shock + correctie
voor angioplastie” uitgevoerd op de groep van B2-B3 ziekenhuizen toonde aan dat het
AMI-LC een zeer belangrijke invloed onderging zowel van shock (OR: 28,8; 95% BI
[25,2; 32,8]) als van het uitvoeren van een angioplastie (OR: 0,24; 95% BI [0,20;0,29]).
Verder stelden we vast dat de B2-B3 ziekenhuizen met een “belangrijke” of
“uitzonderlijke” invloed significant meer angioplasties uitvoerden (OR: 1,26; 95% BI
[1,19;1,33]) dan de andere B2-B3 ziekenhuizen. Verder bleken ze daarenboven significant
meer angioplasties uit te voeren in geval van STEMI zoals de interactie term tussen
“belangrijke” of “uitzonderlijke” invloed versus “geen” of “matige” invloed en het al dan
niet corrigeren voor STEMI (OR: 1,11; 95% BI [1,02;1,21]) aantoonde.
Hoofdstuk 5: Kwaliteit van zorgen
282
5.3.3.4 Interziekenhuis verschillen in AMI-LC, MKG 2002-5 We stelden belangrijke en significante (Bonferroni-gecorrigeerd) interziekenhuis
verschillen vast (Figuren 2a, 2b, 3a en 3b). Voor de periodeanalyse (bovenste deel van de
figuren) varieerden de afwijkingen tussen de – 63 % en de + 182 %, indien alleen de
uitgaande transfers werden uitgesloten. Ze varieerden tussen de – 65 % en de + 196 %,
wanneer alle transfers werden uitgesloten. Voor de trend analyse bedroegen deze cijfers
respectievelijk –41% en + 30%, en – 47% en + 39%.
Een overzicht van de invloed van de verschillende modellen op de afwijking presenteren
we in volgende tabel.
Tabel 5: Sensitiviteitsanalyse van intramurale letaliteit na een opname voor AMI. Bereik van de puntschatters van de “afwijkingen” per model. MKG 2002-5.
B B+ Sh B + Sh + A B + St B + St +A
Max Min Max Min Max Min Max Min Max Min
Periode 140 -64 182 -63 152 -70 97 -59 91 -64 Geen
uitgaande
transfer
Trend 25 -38 30 -41 29 -42 27 -54 26 -31
Periode 153 -62 196 -65 163 -71 104 -64 84 -63 Geen transfer
Trend 29 -42 39 -47 42 -48 30 -32 31 -33
B: basismodel (leeftijd, geslacht en Charlson); B+Sh: basismodel + shock; B+ Sh +A: basismodel +shock + angioplastie; B + St: basismodel + STEMI; B + St +A: basismodel + STEMI + angioplastie; Max en Min: respectievelijk maximum en minimumwaarde van het bereik. Het al dan niet uitsluiten van de inkomende transfers bleek voor sommige ziekenhuizen
een belangrijke invloed te hebben op hun afwijking t.o.v. het nationale gemiddelde/trend.
Een voorbeeld van deze feedback voor de eerste tien ziekenhuizen vindt u in tabel 6.
Binnen de groep B2-B3 ziekenhuizen bleken er eveneens belangrijke verschillen in AMI-
LC te bestaan (Figuren 4 en 5).
Hoofdstuk 5: Kwaliteit van zorgen 283 Tabel 6: Afwijking van het AMI-LC van een ziekenhuis (uitgedrukt in percent) t.o.v. het nationale AMI-LC of trend, België, 2001-4.
ID1 Periode Trend IP10
OG_B2OG_953A(%)4BG_955 BG_B6 BI_957 BI_B8 P9 OG_B2 OG_953 A(%)4 BG_955 BG_B6 BI_957 BI_B8 P9
1 -52 -42 -25 -5 15 - NS 0.00000 -15 -8 2 12 21 NS NS 0.61403 AMG 2 -14 2 26 53 78 + NS 0.03696 -15 -9 0 9 16 NS NS 0.88558 AMG
3 -45 -33 -13 10 33 NS NS 0.03606 -29 -23 -15 -5 3 - NS 0.00000 iai A<0
4 26 56 101 152 195 + + 0.00013 -7 3 17 32 45 + NS 0.02095 EAE A>0
5 -63 -43 -1 62 127 NS NS 0.94745 -14 2 26 54 79 + NS 0.03412 iai A>0
6 -47 -20 29 98 165 NS NS 0.23656 -36 -23 -3 21 43 NS NS 0.73364 AMG
7 102 136 182 230 268 + + 0.00000 -18 -11 -1 10 19 NS NS 0.81802 EAE A>0
8 -60 -46 -21 13 48 NS NS 0.01782 -18 -8 6 22 35 NS NS 0.35683 AMG 9 -42 -17 28 88 146 NS NS 0.20483 -34 -22 -4 16 35 NS NS 0.50037 AMG
10 -51 -36 -12 20 51 NS NS 0.20888 -16 -6 7 23 36 NS NS 0.23705 AMG
1 ID: Anoniem ziekenhuisnummer; 2 OG_B: Ondergrens van het Bonferroni betrouwbaarheidsinterval; 3 OG_95: Ondergrens van het 95% betrouwbaarheidsinterval; 4 A: afwijking van het ziekenhuis AMI-LC vergeleken met het nationale AMI-LC cijfer/trend; 5 BG_95: Bovengrens of the 95% betrouwbaarheidsinterval; 6 BG_B: Bovengrens van het Bonferroni betrouwbaarheidsinterval; 7 BI_95:+: a 95% CI suggereert een significant hoger ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend,
-: a 95% CI suggereert een significant lager ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend, NS: a 95% CI suggereert geen significante afwijking van het ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend.
8BI_B: +: het Bonferroni−gecorrigeerd CI suggereert sterk een significant hoger ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend, -: het Bonferroni−gecorrigeerd CI suggereert sterk een significant lager ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend, NS: het Bonferroni−gecorrigeerd CI suggereert geen significante afwijking van het ziekenhuis cijfer/trend vergeleken met het nationale cijfer/trend.
9 P: Probabiliteit dat een ziekenhuisafwijking t.o.v. het nationale cijfer/trend = 0. 10IP: Interpretatie: EA: External audit en algemene maatregelen aanbevolen; AGM: algemene maatregelen aanbevolen.
Hoofdstuk 5: Kwaliteit van zorgen 284
Figuur 2a: Periode-analyse van interziekenhuis verschillen in AMI-LC met alleen inkomende transfers. MKG 2002-5.
Figuur 2b: Periode-analyse van interziekenhuis verschillen in AMI-LC, geen transfers. MKG 2002-5.
Hoofdstuk 5: Kwaliteit van zorgen
285
Figuur 3a: Trend-analyse van interziekenhuis verschillen in AMI-LC met alleen inkomende transfers. MKG 2002-5
Figuur 3b: Trend-analyse van interziekenhuis verschillen in AMI-LC, geen transfers. MKG 2002-5
Hoofdstuk 5: Kwaliteit van zorgen 286
Figuur 4: Periodeanalyse van verschillen tussen B2-B3 ziekenhuizen in AMI-LC. Geen transfers. MKG 2002- 5.
Figuur 5: Trendanalyse van verschillen tussen B2-B3 ziekenhuizen in AMI-LC. Geen transfers. MKG 2002- 5.
Hoofdstuk 5: Kwaliteit van zorgen
287
5.3.3.5 Het nationale AMI-LC, trend en determinanten Voor de periode 2002-2005 noteerden we in België 7.099 fatale gevallen voor
46.287opnamen of een bruto AMI-LC van 15,34% (95% BI:15,01%; 15,67%).
Van de modellen die gefit werden in de sensitiviteitsanalyse weerhielden we de modellen
met als verklarende variabelen leeftijd, geslacht, Charlson, trend, en shock. We deden dit
om de invloed van het type ziekenhuis niet te neutraliseren door angioplastie in het model
op te nemen. Omwille van de uitgesproken associatie tussen shock en STEMI verkozen we
shock te nemen als verklarende variabele en niet STEMI. Vooreerst is shock een betere
predictor van letaliteit, verder is er minder eenduidigheid rond STEMI - de verschillen in
EKG diagnose bij opname en ontslag zijn belangrijk712 - en tenslotte omdat de groep AMI
NOS een supplementaire categorie opleverde, die eigenlijk als missing te beschouwen valt
in termen van STEMI, en moeilijk te interpreteren valt. De AMI NOS als een derde
categorie behandelen is overigens niet correct.121
Wanneer we de basis modellen en de modellen met shock fitten stellen we vast dat het
sterfterisico (1) bij elke bijkomende leeftijdsgroep van 5 jaar met ongeveer 40% toeneemt;
(2) bij mannen ongeveer 10% lager is; (3) bij elke toename van Charlson’s comorbidity
index met één eenheid stijgt met 5 à 10 %; en, (4) bij shock in uiterst belangrijke mate
toeneemt. Verder noteerden we een licht dalende AMI-LC trend van ongeveer 1% per
semester. Verder vonden we een lager AMI-LC in de B2-B3 ziekenhuizen en dit zowel
t.o.v. de A als B1 ziekenhuizen (Tabel 7). Noteren we dat er tussen de ziekenhuizen B2-B3
grote verschillen bestaan (Figuren 4 en 5)..
Hoofdstuk 5: Kwaliteit van zorgen 288
Tabel 7: Odds ratio’s en 95% betrouwbaarheidsinterval ( ) van AMI-letaliteit in functie van leeftijd (toename per 5 jaar), geslacht, co-morbiditeit, per semester trend, met al dan niet cardiogene shock, cardiaal zorgprogramma en met uitsluiting of niet van binnenkomende transfers.
Basis 1 Basis 2 Shock 1 Shock 2
Leeftijd 1,37(1,35;1,40) 1,36(1,34;1,39) 1,36 (1,34;1,39) 1,35(1,32; 1,38)
Mannen 0,90(0,84;0,96) 0,92(0,86;0,99) 0,91 (0,84;0,98) 0,93(0,86; 1,01)
Charlson 1,09(1,08;1,10) 1,07(1,06;1,09) 1,06 (1,05;1,08) 1,05(1,04; 1,06)
Trend (semester)0,98(0,96;0,99) 0,98(0,97;1,00) 0,98 (0,96;0,99) 0,99(0,97; 1,00)
Shock . . . . . . 23,0 (20,9;25,2) 21,0(19,0; 23,2)
A vs B2-B3 1,21(1,12;1,30) 1.47(1,37;1,59) 1,39 (1,28;1,50) 1,61(1,48; 1,75)
B1 vs B2-B3 1,08(0,99;1,19) 1,38(1,25;1,52) 1,23 (1,11;1,36) 1,48(1,33; 1,65)
Basis 1: uitgaande transfers uitgesloten; Basis 2: alle transfers uitgesloten; Shock 1: uitgaande transfers uitgesloten; Shock 2: alle transfers uitgesloten In termen van de c-statistiek zijn de modellen met shock duidelijk beter dan de
basismodellen: 0.84 versus 0.74. Een overzicht van de waarden van de c-statistiek van alle
gefitte modellen vindt u in tabel 8.
Tabel 8: Waarden van de c-statistiek, bereikt bij de verschillende gefitte modellen en dit zowel voor de periode als de trend analyse.
Model Binnenkomende transfers Geen transfers Periode Trend Periode Trend Basis 0,736 0,741 0,733 0,739 Shock 0,840 0,844 0,832 0,837 Shock en angioplastie 0,853 0,856 0,848 0,852 Stemi 0,782 0,785 0,781 0,785 Stemi en angioplastie 0,791 0,794 0,793 0,797
Hoofdstuk 5: Kwaliteit van zorgen
289
5.3.4 Discussie
5.3.4.1 AMI een diagnostisch probleem In het kader van kwaliteitsverbetering, die vertrekt van een interziekenhuis vergelijking,
dient men over één enkele definitie te beschikken, die overal kan toegepast worden.559
Het in gebruik nemen van troponinen, beschouwd als de “definitive marker”747, en de
verschillende assays voor hun bepaling hebben echter voor een substantiële verwarring
gezorgd bij clinici en klinische biologen747. Deze troponinen waren gevoeliger en
specifieker dan de oudere en detecteren ook minimale hartletsels.747;755 Verder konden in
functie van de gebruikte definitie patiënten met één van de acute coronaire syndromen met
elk zijn eigen mortaliteitsrisico al dan niet als AMI beschouwd worden.745;748Op het
ogenblik van de registratie van onze gegevens (2001-5) diende het gebruik van de assays
nog gestandaardiseerd te worden. Onder meer diende informatie over de graad van precisie
van de assays, referentie intervallen en andere voor het laboratorium belangrijke
gebruiksvoorwaarden nog geleverd te worden.747
Deze onduidelijkheden en verschillen zijn niet zonder invloed op de risicocorrectie bij het
berekenen en het vergelijken van AMI-LCs, en zijn een hinderpaal voor het beoordelen
van lange termijn trends in myocardinfarct voorvallen.746;747;755
5.3.4.2 Accuratesse en volledigheid van de gegevens De volledigheid en accuratesse van de gegevens is een belangrijke beperking in onze
studie. De vergelijking met de MONICA gegevens toont immers duidelijk een
onderschatting aan van het letaliteitcijfer, een in epidemiologisch opzicht belangrijke
tekortkoming van de MKG. Het lager dodenaantal in de MKG kan wellicht voor een deel
verklaard worden door het overlijden van een belangrijk deel van de patiënten vóór er een
vaste klinische diagnose gesteld werd.721 De betere registratie van het aantal gevallen kan
wellicht toe te schrijven zijn aan verschillen in voormelde diagnostische criteria en meer
bepaald in het type en de interpretatie van het cardiale enzym.746;747
Kuch et al.721 vergeleken het AMI-LC zoals het bekomen werd wanneer AMI volgens
epidemiologische criteria (MONICA criteria) gedefinieerd werd en wanneer het via
een klinische diagnose gedefinieerd werd. In hun studie bedragen de cijfers
respectievelijk 28% en 13,5 %, wat duidelijk verschilt van de analoge cijfers voor het
MONICA-registratie gebied van Gent en Brugge waar ze respectievelijk 25,7% en
Hoofdstuk 5: Kwaliteit van zorgen 290
7,7% bedragen voor Gent en 15,7% en 4,7% voor Brugge. Merken we op dat AMI-
LC voor gans België (klinische definitie) 15,5% bedraagt, duidelijk beter
vergelijkbaar met de Duitse cijfers en met de Europese intramurale AMI
letaliteitcijfers van de 80ger jaren697. Dit schijnt te wijzen op een onderregistratie van
letale gevallen door de MKG in de arrondissementen Gent en Brugge. Een
gelijkaardige vergelijking uitgevoerd in samenwerking met MONICA-Luxemburg
kwam tot de bevinding dat de MKG een sensitiviteit van 87% en een specificiteit van
55% hadden.756
Bevolkingsstudies toonden overigens aan dat de 30-dagen STEMI mortaliteit tussen
de 30 en 50% ligt waarvan ongeveer de helft in de eerste twee uur.757 Het adagium
“Time is myocardium and time is outcomes” is hier de weerspiegeling van.
De MKG biedt vooralsnog – in afwachting van de nieuwe spoedregistratie - geen
enkele informatie over (1) de tijd die verloopt tussen het ontstaan van de symptomen
en het inroepen van hulp, (2) de tijd die verloopt tussen inroepen van hulp en de
aankomst met de ziekenwagen in het ziekenhuis, en (3) de tijd die verloopt tussen de
aankomst in het ziekenhuis en het instellen van de thrombolyse of de angioplastie. De
eerste is mogelijkerwijs beïnvloedbaar door gezondheidsopvoeding en voorlichting.
De tweede is organisatorisch beïnvloedbaar door de spoeddiensten, maar wordt verder
bepaald door de afstand en eventuele verkeersopstoppingen. De derde kan
organisatorisch verbeterd worden. Alle aspecten zijn in mindere of meerdere mate
kwaliteitsgebonden en alle verdienen aandacht.747
De onderregistratie van fatale gevallen was waarschijnlijk niet uniform over de
ziekenhuizen zoals de vergelijking met MONICA aantoonde. Verder weten we niet
welke criteria in de Belgische ziekenhuizen gehanteerd werden voor het stellen van
een diagnose van AMI. Het is niet onwaarschijnlijk dat die zoals elders niet uniform
waren, zeker als het over de keuze van het type, het uitvoeren en interpreteren van de
cardiale enzymen gaat. Ook shock als verklarende variabele stelde een interpretatie
probleem: was hij aanwezig bij opname, vóór het instellen van de behandeling of was
hij het gevolg van de behandeling?
Hoofdstuk 5: Kwaliteit van zorgen
291
Verder stelt de AHRQ: “Er bestaat een spanningsveld wanneer gegevens gebruikt worden
zowel voor terugbetaling als voor het meten van kwaliteit. Wanneer het over terugbetaling
gaat is men geneigd om snel te coderen en om het coderen van verwikkelingen en co-
morbiditeit te maximaliseren. Daarentegen wanneer het over kwaliteitsbeoordeling gaat is
het belangrijk voor de codeurs over het gehele medisch dossier te beschikken en het
coderen van diagnoses te beperken tot aandoeningen die de zorg voor de patiënt
beïnvloeden”.637
Toch bleek in een recente studie dat administratieve gegevens een redelijk surrogaat
zijn voor klinische gegevens uit het medisch dossier.758Het dient wel opgemerkt dat in
die studie belangrijke gegevens uit vorige opnamen en transfers van patiënten
routinematig konden gebruikt of opgevolgd worden. In de MKG was dat ten tijde van
de studie beperkt tot verblijven in hetzelfde ziekenhuis en hetzelfde kalenderjaar.
5.3.4.3 Nationale trend van het AMI-LC en interziekenhuis verschillen. Onze studie suggereerde dat het AMI-LC functie was van leeftijd, co-morbiditeit en vooral
shock. De evidentie van een betere uitkomst voor mannen was zwak: ze bevond zich in de
zone van niet interpretatie. Er was verder slechts een indicatie van een kleine verbetering
van de uitkomsten over de tijd. Wel stelden we betere uitkomsten vast in B2-B3
ziekenhuizen. Toch vonden we geen aanwijzing – geen significante interactie tussen
cardiaal zorgprogramma en trend - voor een verbetering van evolutie van de letaliteit in
functie van het zorgprogramma, waar dit elders wél werd vastgesteld.759
Deze studie kan niet zomaar met die van Van Brabandt et al720 vergeleken worden. Hun
studie gaat over de periode van 1999 tot 2001, de onze echter over de periode 2002 tot
2005 en er bestaat evidentie dat de behandeling van AMI over de jaren
verbetert.759;760Verder beschikten zij over de gekoppelde gegevens, die hun toegang gaf tot
alle therapeutische gegevens, en beschikten zij over een uniek identificatienummer dat hen
toeliet nauwkeurig de eventuele transfers van patiënten op te volgen. Het is nochtans zo
dat hun vaststellingen i.v.m. B2-B3 ziekenhuizen niet in tegenspraak zijn met de onze.
Hoofdstuk 5: Kwaliteit van zorgen 292
De nochtans vermoedelijk belangrijke interziekenhuizen verschillen, die we
vaststelden, zijn moeilijk interpreteerbaar en, wegens de klaarblijkelijke, onvoldoende
accuratesse en volledigheid van de gegevens, moeilijk becijferbaar.
Dit leidt onvermijdelijk tot de vraag of dit “good enough, easy to get data?”554 zijn om in
een context van kwaliteitsverbetering gebruikt te worden. Inderdaad, de volledigheid en
accuratesse van de ziekenhuisontslaggegevens zijn in de arrondissementen van Brugge en
Gent problematisch. Maar dit geldt misschien niet voor België in zijn geheel, zoals
gesuggereerd wordt door het voormelde nationale letaliteitcijfer.
Onze bevindingen gebaseerd op de MKG worden wellicht, ondanks onze inspanningen om
de typische beperkingen van administratieve gegevens zoveel mogelijk te omzeilen, best
omschreven als een “bruikbare screening”, die kan aanzetten tot het nemen van
kwaliteitsbevorderende initiatieven in de ziekenhuizen, veeleer dan als uitspraken over
kwaliteit van de zorgen.180;659
Vanuit een kwaliteitsstandpunt kon het nuttig zijn bijkomende informatie in te winnen
over de ziekenhuizen die op constante manier een bovenmaatse of ondermaatse outliers
schijnen te zijn.
Verder menen we aanwijzingen gevonden te hebben dat B2-B3 centra electieve PTCAs
uitvoerden bij laattijdig getransfereerde patiënten, waarvan de Europese richtlijnen stellen
dat ze geen enkel functioneel of overlevingsvoordeel opleveren.697Wij baseerden ons
hiervoor op de gegevens in verband met het ogenblik van de transfer waaruit bleek dat de
mediaan van de verblijfsduur voor transfer 2 “dagen” bedroeg.
De wisselende afwijking ten opzichte van het nationale cijfer en trend wanneer het
uitvoeren van een angioplastie in de modellering wordt opgenomen dient verder
bestudeerd te worden. Het schijnt hier meestal te gaan over B2-B3 ziekenhuizen, die meer
angioplasties uitvoeren op een meer oordeelkundige manier dan de andere B2-B3s. Daar
deze bevinding zichtbaar werd bij een verschillende modellering van dezelfde data kan
men geredelijk aannemen dat ze geen artefact is. Tenslotte vraagt de schijnbare
heterogeniteit van de B2-B3 ziekenhuizen op gebied van AMI-LC een verklaring.
5.3.4.4 Transfer Bij een vergelijking van AMI-LC was het belangrijk rekening te houden met transfer van
zieken. Soms gaat men ervan uit - een beetje zoals het “intention to treat” principe bij
Hoofdstuk 5: Kwaliteit van zorgen
293
klinische studies - dat de uitkomst van de AMI episode toegeschreven wordt aan het
ziekenhuis waar de patiënt opgenomen wordt.720;751;752;758In navolging van het AHRQ
model753 werden bij een eerste reeks analyses, waarbij de uitgaande transfers werden
uitgesloten, de uitkomsten toegeschreven aan het ontvangende ziekenhuis. Mochten de
transfers op systematische manier met inachtneming van de heersende richtlijnen697
gebeuren viel wellicht de eerste zienswijze te verkiezen. In de toenmalige Belgische
context, waarbij een ruim deel van de transfers niet als een onmiddellijke transfer voor PCI
of een “rescue angioplasty” na een niet-geslaagde thrombolyse kon beschouwd worden,
leek dit niet de meer aangewezen manier. Het is ook zo, menen we, dat deze niet-urgente
transfers voor een electieve PTCA niet als een teken van kwaliteitsvol klinisch handelen
kunnen gezien worden.
5.3.4.5 Risicocorrectie Een ideaal model dient een goede balans te maken tussen zuinigheid van het aantal
verklarende variabelen en het gemakkelijk verzamelen van gegevens enerzijds, en zijn
predictief vermogen anderzijds.”715 Onze modellen met leeftijd, geslacht, Charlson’s
comorbidity index en shock als verklarende variabelen, en met binnenkomende transfers al
dan niet opgenomen in de studiepopulatie hadden met een c-statistiek761;762 van ongeveer
0.84, een zeer goed discriminatievermogen. Deze modellen hadden duidelijk een beter
discriminatie vermogen dan de modellen zonder shock en dan de voormelde, uitgevoerde
studies715;751;752. Een recente Amerikaanse studie gebaseerd op administratieve gegevens
had een AROC van 0,71 in een finaal model met 27 variabelen.758 Het lijkt dan
voorzichtig aan te nemen dat het discriminatievermogen van onze modellen met shock,
wegens een niet gekende proportie van in het ziekenhuis opgelopen verwikkelingen,
vertekend zijn. Hoe dan ook beide soorten modellen (basis, of basis met shock) leidden tot
dezelfde conclusies betreffende de verklarende variabelen.
Het letaliteitcijfer van AMI is gekenmerkt door een grote variabiliteit over de
ziekenhuizen, die niet noodzakelijk een weerspiegeling is van werkelijke verschillen
inzake performance. Correctie voor het risico is derhalve belangrijk en in het bijzonder
voor de uiterste waarden, zoniet zouden bepaalde verzorgingsinstellingen incorrect als
“outliers” geklasseerd kunnen worden298;753. Onze keuze van Charlson’s comorbidity index
Hoofdstuk 5: Kwaliteit van zorgen 294
was gebaseerd op de excellente c-statistiek (0,83) in een studie over mortaliteit door
ischemische hartaandoeningen bij ziekenhuispatiënten.325;326 In tegenstelling met Severity
of Illness and Risk of Mortality, de risicocorrectie van de All Patient Refined Diagnosis
Related Groups (APR-DRGs)195houdt deze index geen rekening met verwikkelingen die na
de opname optreden196;197;758. Wel is co-morbiditeit, zoals voormeld,
codeergevoelig.637Hierdoor vermijdt men gedeeltelijk dat een ziekenhuis ten onrechte
“beloond” wordt voor verwikkelingen, die misschien te wijten waren aan slechtere
zorg.196;301;751;758
5.3.4.6 Andere beperkingen van de studie Hoewel er meestal een goede correlatie bestaat tussen de intra-ziekenhuis mortaliteit
en de dertig dagen mortaliteit 367is het mogelijk dat verschillen in ontslagpraktijken
de cijfers beïnvloeden. In geval van AMI kan de mortaliteit op 30 dagen beduidend
van de ziekenhuissterfte verschillen753. Hoewel letaliteit vergeleken met
procesindicatoren een minder gevoelige performance/kwaliteit indicator van AMI is
blijft ze waardevol voor het beoordelen van richtlijnen en
procesindicatoren,178;706;763want: “In tegenstelling tot structuur en proces, verschaffen
uitkomsten een meer globale beoordeling van de kwaliteit van de gezondheidszorg en
vertegenwoordigen ze wat voor de patiënten het belangrijkst is”. 758
Zoals voornoemd berust de AMI behandeling op een snel hulp zoeken van de patiënt, een
snelle en adequate opvang, diagnose en behandeling in functie van de diagnose en het type
ziekenhuis. Er is daarbij een potentiële rol weggelegd voor gezondheidsvoorlichting om
patiënten sneller medische hulp te laten zoeken in geval van symptomen van een (nakend)
AMI.704 Benevens de toegediende behandeling (zelf functie van de leeftijd van de
patiënt)688 is de prognose functie van de verstopte slagader(s), het aantal getroffen
bloedvaten, variabiliteit van het hartritme, en van de leeftijd van de patiënt.
Niet alleen strikt medische factoren maar ook het sociaal-economische niveau spelen een
belangrijke rol in de AMI-epidemiologie. Zo genereerde een zwakke sociaal-economische
toestand in de jaren ’80 hoge mortaliteitscijfers voor coronaire aandoeningen met hoge
letaliteitcijfers voor een eerste hartaanval en dat zowel voor als na de
Hoofdstuk 5: Kwaliteit van zorgen
295
ziekenhuisopname764;765. De letaliteit verklaarde bij de mannen voor de helft en bij
vrouwen voor meer dan een derde het verschil inzake mortaliteit tussen de groepen met
hoge en lage inkomens8. Er moet verder op gewezen worden dat geneesmiddelen voor
secundaire preventie, een belangrijk gegeven voor de verdere prognose en derhalve een
kwaliteitsaspect559;758, minder vaak aan patiënten van de lagere sociaal-economische
klassen764 voorgeschreven werden.
Jammer genoeg beschikken we in de MKG maar fragmentarisch over al die gegevens en
lijdt onze kwaliteitsbenadering onder hetzelfde euvel. Wij konden in deze studie alleen
corrigeren voor leeftijd, geslacht, co-morbiditeit (Charlson-d’Hoore index) en
shock.325;326;493 Andere kwaliteitsaspecten dan letaliteit konden wij niet analyseren. Het is
dus niet onmogelijk dat een ziekenhuis dat een goed AMI-LC heeft niet goed is voor
andere aspecten en omgekeerd.
Een laatste beperking van onze studie is het belangrijke tijdsinterval tussen de registratie
en de rapportering. Hoewel er hier door de verdere automatisering van de
gegevensverzameling en -verwerking winst zal geboekt worden, zal er wel altijd minstens
een jaar verlopen vooraleer deze processen afgesloten zijn. Daarenboven zijn er een
minimale analyse- en rapporteringtijd nodig. Toch lijkt dit tijdsinterval minder belangrijk
voor uitkomstindicatoren, die een ruimere interpretatie vergen met terugkoppeling naar
verschillende belanghebbenden en niet noodzakelijk een onmiddellijke terugkoppeling
naar de zorgverleners vereisen, dan voor procesindicatoren, waar een onmiddellijke
terugkoppeling door de clinici als een noodzaak aangevoeld wordt.
5.3.4.7 AMI-LC en kwaliteitsinitiatieven In onze benadering werden ziekenhuizen eerder gezien als individuele structuren van het
gezondheidssysteem, met een gemeenschappelijk organisatorische cultuur en een aantal
gemeenschappelijk processen, en die verantwoording dienden af te leggen. Niet het tot
schande maken, noemen en blameren van individuen of ziekenhuizen maar het
identificeren van organisatie− en cultuurgerelateerde problemen werden beschouwd als het
aanknopingspunt voor kwaliteitsbevorderende acties.269;426;495-498;556;660 Daarom was deze
Hoofdstuk 5: Kwaliteit van zorgen 296
feedback anoniem en had als doel de clinici, diensten en ziekenhuizen informatie te
verschaffen, die hen toeliet zich met de anderen op een zinvolle manier te vergelijken.
Het betrokken zijn van senior managers en ziekenhuisstaf bij kwaliteitsverbetering kan
succesvol zijn547, op voorwaarde dat het over een veranderingsproces gaat met meerdere
facetten ( protocollen, richtlijnen die ook de niet-cardiologen bereiken, lokale
kwaliteitsbevorderende groepen)557;766 in samenwerking met de personen waarvan het werk
onderzocht wordt555. Formele of informele beoordeling van de zorg door peers en feedback
kunnen de beoogde veranderingen vergemakkelijken.557
Hoewel er aangetoond werd dat feedback kwaliteitsinitiatieven kan stimuleren566,
schijnt het verkieslijker dat hij zou gedragen worden door iemand, gevormd in de
interpretatie van gegevens, die geldt als een autoriteit en over de nodige middelen
beschikt.269;718 Daarom werd aan het College van geneesheren dezelfde feedback
voorgelegd als aan de ziekenhuizen. Hij zou hen kunnen helpen ziekenhuizen te
identificeren, met zowel bovenmaatse als ondermaatse kwaliteit, om een benchmark
vast te leggen en om ziekenhuizen met kwaliteitsproblemen te helpen ze op te lossen.
Ervaring uit de UK suggereert dat mensen meer geneigd zijn op een adequate manier
te werken als ze weten dat er iemand is die observeert en registreert wat zij doen.559
Daarenboven kan de feedback en het betrokken zijn in verbeteringsprocessen hen
wijzen op problemen die niet onmiddellijk door de indicator bestudeerd worden zoals
het voorschrijven van adequate medicatie na een opname voor AMI. Verder menen
we dat de Colleges en andere beroepsverenigingen kwaliteitsverbetering kunnen
stimuleren door het opstellen en verspreiden van richtlijnen, het opstellen van
doelstellingen (zoals tegen 1 januari 2008 zal 90% van de AMI patiënten bij ontslag
een voorschrift hebben van geneesmiddelen voor secundaire preventie) en de artsen
helpen bij het overstijgen van wat zij aanvoelen als een verlies van professionele
autonomie.718
Voor de overheid is een rol weggelegd die erin bestaat een operationele structuur te
creëren die ermee belast wordt de toekomstige nationale feedbacks te begeleiden, de
ontwikkeling van hierop gebaseerde kwaliteitsbevorderende acties te ondersteunen - de
Hoofdstuk 5: Kwaliteit van zorgen
297
uitbouw van de secundaire preventie is een van de belangrijke uitdagingen - en
bijkomende indicatoren te initiëren. Verder zullen lokale initiatieven, die aansluiten op de
feedback, aangemoedigd worden. Een continue investering in een infrastructuur voor
kwaliteitsbevordering en ook het voorzien in een beschermde tijd voor deze activiteiten
zijn vereist om het project te laten slagen.557 Tenslotte menen we dat de overheid zich
dient te buigen over het probleem van de koppeling van relevante gegevens over dezelfde
personen in geval van transfer versus de bescherming van de privé-sfeer. Dergelijke
koppeling is noodzakelijk voor de evaluatie van de zorg en dus ook voor de toekomstige
behandeling van de nieuwe en de niet overleden AMI patiënten.
5.3.4.8 Besluit en perspectieven Hoewel de complexiteit van de case mix niet volledig door administratieve gegevens kan
ondervangen worden716, dient men er zich rekenschap van te geven dat alleen dit soort
gegevens toelaat landelijke, interziekenhuis vergelijkingen te corrigeren voor case mix.758
Willen we de MKG in het domein van AMI gebruiken voor kwaliteitsbewaking dan is er
dringend nood aan een harmonisatie van de registratie en een betere registratie bij opname.
Ook het registreren bij de pathologieën en symptomen of ze al dan niet aanwezig waren bij
opname lijkt een belangrijk aandachtspunt. Het opzetten van de nieuwe spoedregistratie en
de nieuwe minimale ziekenhuisgegevens (MZG), waarin MKG en Minimaal
Verpleegkundige Gegevens versmolten zijn, zal hier ongetwijfeld verbetering brengen.
Het meenemen van gegevens uit vroegere opnamen en het traceren van transfers, wat in de
MZG alleen binnen hetzelfde ziekenhuis zal mogelijk zijn, zou niet alleen betere
vergelijkingen en evaluaties toelaten maar ook ten goede komen van de patiënten.
Naast deze verbeteringen aan het registratiesysteem vallen er ook een aantal
analyseaspecten bij te schaven, die tot een meer bruikbare indicator kunnen leiden. Wij
denken hier onder meer aan (1) het uitsluiten van verblijven van ≤ 1 dag758, (2) weekend
opnamen767, (3) een geografische analyse en (4) een analyse van de verblijfsduur753.
Verder kan het gebruik van propensity scores484;716 en hiërarchische regressie modellen758
de analyses verrijken.
Tenslotte vallen er een aantal structurele en operationele maatregelen te treffen in verband
met het aantal centra waar PCI kan uitgevoerd worden. Volume-uitkomst beschouwingen
Hoofdstuk 5: Kwaliteit van zorgen 298
rond primaire PCI dienen echter ook rekening te houden met geografische en sociaal-
economische toegankelijkheid van de zorgen.716 Tenslotte bestaat er nood aan ”low tech”
strategieën om te verzekeren dat de PPCI uitgevoerd wordt binnen de 90 minuten, een
doelstelling die zou kunnen bereikt worden via continuous quality improvement.704
5.4 KWALITEIT VAN ZORGEN: ALGEMEEN BESLUIT
Wij hebben onze benadering voor verbeteringsinitiatieven van zorgenkwaliteit door middel
van administratieve gegevens geschetst. Een goede organisatie en organisatorische cultuur
zijn hiervoor de randvoorwaarden.
Kwaliteit van zorgen is een dagdagelijkse, gedeelde verantwoordelijkheid tussen patiënt,
zorgverleners, ziekenhuisdirecties, College van geneesheren en beroepsverenigingen. De
verantwoordelijkheid van de overheid als borger van de belangen voor de gemeenschap
bestaat erin kwaliteitsinitiatieven te ondersteunen en te laten ontkiemen.
Bij de analyse van kwaliteitsindicatoren kwamen we tot het besluit dat uit de aard zelf van
onze gegevens, we alleen van een screening konden gewagen. Zij bood wel perspectieven
voor kwaliteitsinitiatieven maar vereiste verder onderzoek vooraleer uitspraken konden
gedaan worden. Verder gaf deze screening bruikbare informatie voor
verbeteringsinitiatieven op het gebied van de kwaliteit van de gegevens. Vermits het om
een screening gaat wordt de feedback gericht tot clinici, ziekenhuisdirecties, College van
geneesheren, beroepsverenigingen en overheid. Om dezelfde reden is hij ook anoniem.
De voornaamste resultaten van de analyse van het keizersnedencijfer bij laagrisico
verlossingen kunnen als volgt samengevat worden. Er bestaan in België belangrijke
interziekenhuis verschillen in keizersnedencijfer, een nationale opwaartse trend van 2%
per semester, en een intens medisch ingrijpen rond het geboortegebeuren. Als men
verlangt het keizersnedencijfer om te buigen zal dit een georganiseerde aanpak vereisen en
dit zowel op het centraal als intermediair en lokaal niveau.
Hoofdstuk 5: Kwaliteit van zorgen
299
Voor de analyse van het letaliteitcijfer bij AMI wijzen de voornaamste resultaten eerder
naar de beperkingen van de gegevens. De nood aan een eenvormige definitie, de
volledigheid van de gegevens, de traceerbaarheid van patiënten en een goede
risicocorrectie zijn daarbij de voornaamste aandachtspunten. Het is daarbij belangrijk dat
men zich, vanuit het standpunt van de bescherming van de privé-sfeer, realiseert dat
traceerbaarheid noodzakelijk is voor de evaluatie van de behandeling en bijgevolg voor het
welzijn van de patiënten in de toekomst.
Op gebied van kwaliteit van de zorgen kunnen reeds een aantal behartigenswaardige
bevindingen verder uitgediept worden. De belangrijke interziekenhuis verschillen zijn
wellicht moeilijk interpreteerbaar maar lijken toch belangrijk genoeg om verder
onderzocht te worden. Ook de transfer van AMI-patiënten voor een electieve PCI verdient
de aandacht.
301
Hoofdstuk 6: Complementariteit van gegevensbanken. Gebruik van routinematig verzamelde gegevens om de reproductieve gezondheid te beoordelen in een gemeenschap gevestigd rond twee verbrandingsovens
Deze casus geeft weer hoe door het samenbrengen van gegevens uit verscheidene
bestaande administratieve en klinische gegevensbanken in een beperkte tijdsspanne de
beleidsvoering in verband met een dringend milieuprobleem in niet onbelangrijke mate
kan onderbouwd worden.
Het veldonderzoek waarop hij gebaseerd is werd uitgevoerd in 1997. De voorliggende
tekst is een vertaling van het hierover gepubliceerde manuscript: “Aelvoet W,
Vanoverloop J, Molenberghs G, Schoeters G, van Sprundel M. Adequacy of Routinely
Collected Data for the Assessment of the Reproductive Health of a Community Living in
the Neighbourhood of Two Household Refuse Incinerators: a Critical Case Study. Arch
Public Health 2005; 63:259-278.” 768
Abstract Background. Na herhaalde klachten over congenitale afwijkingen in de buurt van twee
verbrandingsovens, gesloten wegens het overschrijden van de emissienormen, besloot de
overheid de herneming van de activiteiten slechts toe te laten indien aan die normen
voldaan werd en indien de resultaten van een uit te voeren studie over de mogelijke
schadelijke gevolgen op de perinatale gezondheid van de buurt dit toelieten. Aangezien de
lokale bevolking weigerachtig stond t.a.v. een deelname aan dergelijke studie, konden we
alleen op routinegegevens beroep doen.
Methoden. Het betrof een observationele studie over de Neerland wijk in de Antwerpse
agglomeratie, met een ecologische en een retrospectieve cohort component, waarbij
gegevens uit verschillende medische en administratieve gegevensbanken gekoppeld
werden. In een gegevensbank van alle kinderen (N= 506.632), die in Vlaanderen geboren
waren tijdens de periode 1989-1996, werd een groep van 636 kinderen, waarvan de
moeder ooit in Neerland woonachtig was, geïdentificeerd en vergeleken met de doorsnee
Vlaamse bevolking.
Resultaten. De vergelijking met de doorsnee bevolking, afgezien van een meerlingenexces,
toonde geen significant teveel aan van congenitale afwijkingen (gecorrigeerde odds ratio
(OR) 1,20; 95% Betrouwbaarheidsinterval (BI) 0,69-2,08),
Hoofdstuk 6: Complementariteit van gegevensbanken 302
perinatale mortaliteit, laag geboortegewicht, korte zwangerschapsduur, verminderde
pariteit of omkering van de geslachtsratio. Binnen de groep van Neerland kinderen werd
wel een significant en negatief verband vastgesteld tussen blootstellingduur van de moeder
en het voorkomen van congenitale afwijkingen (OR 0,78; 95% BI 0,60-0,95).
Conclusies. Hoewel de studie duidelijk een aantal beperkingen vertoonde en hoewel een
overmaat van congenitale afwijkingen noch bevestigd noch uitgesloten kon worden, leken
de vaststellingen geen ernstige gezondheidsbedreigingen te suggereren.
6.1. INLEIDING
De publieke bezorgdheid over de gezondheidsrisico’s die verband houden met
milieuverontreiniging is groot, zeker als de bron van de verontreiniging zich in de
onmiddellijke buurt bevindt.769-776
In de jaren die aan deze studie voorafgingen, hebben de inwoners van Neerland, een wijk
van Wilrijk in de agglomeratie van Antwerpen, herhaaldelijk het voorkomen van gevallen
van congenitale afwijkingen zonder gevolg aan de overheid gemeld. Ze schreven deze
afwijkingen toe aan de dioxine uitwasemingen van twee huisvuilverbrandingsovens in de
buurt, die op minder dan twee kilometer van elkaar stonden.
Wegens het niet naleven van de geldende dioxine-uitstootnormen was op het ogenblik van
de studie de eerste van de verbrandingsovens (gelegen in het zuidoosten van Neerland)
definitief en de tweede voorlopig gesloten777.
Gebaseerd op de hoeveelheden verbrand afval en het filtratietype van de uitstootgassen,
werd de mass-flow van beide verbrandingsovens berekend vanaf hun opstarting. Hierop
gebaseerd werd de neerslag (depositie) van de dioxines in de omgeving berekend en
vergeleken met de dioxineconcentraties in bodemstalen, genomen in de buurt van de
ovens. Hieruit bleek niet alleen dat de berekende bodemvervuiling kleiner was dan de
gemeten, maar ook dat het depositiepatroon in functie van de twee methodes tamelijk
verschillend was, wat op de aanwezigheid van andere belangrijke bronnen van
dioxineblootstelling wees. Het gebied van maximale blootstelling aan de uitstoot van de
tijdelijk gesloten oven stemt overeen met de Neerlandwijk, die zich tussen 1 en 2 kilometer
ten noordoosten van de oven bevindt, de richting van de overheersende winden.
Hoofdstuk 6: Complementariteit van gegevensbanken.
303
Alarmerende rapporten over aangeboren afwijkingen, toenemende druk van de plaatselijke
bevolking en de media lokten bij de politieke overheden de beslissing uit om de herneming
van de activiteiten afhankelijk te maken van het naleven van de normen èn van een
onderzoek betreffende de reproductieve gezondheid van de buurtbewoners.
De studie diende rekening te houden met een hele waaier van mogelijke, voor de
gezondheid schadelijke effecten, die in verband stonden met de verontreinigende stoffen,
en hun vermoedelijke bron.
Dioxines en aanverwante stoffen werden in verband gebracht met congenitale afwijkingen,
immunologische stoornissen, omgekeerde geslachtsratio, kanker, vertraagde groei,
endocriene en neurale gedragstoornissen.778-794
Vroegere studies wezen uit dat gezondheidsrisico’s te wijten aan de uitstoot van
verbrandingsovens èn zeer klein èn onbetekenend waren t.o.v. ander achtergrondbronnen,
op voorwaarde dat de ovens volgens de regels van de kunst gebouwd en uitgebaat
werden.779;795;796 Eventuele gezondheidseffecten kunnen de vorm aannemen van
meerlingzwangerschap797;798, fertiliteitsstoornissen799 en misschien kanker tijdens de
kinderjaren800;801.
Ten gevolge van een politieke beslissing diende de studie uitgevoerd te worden in een
tijdsspanne van slechts drie maand. Omdat de plaatselijke bevolking weigerachtig stond
tegenover een deelname aan dergelijke studie, was het onmogelijk een klassieke
epidemiologische studie uit te voeren zoals een patiënt-controle onderzoek. 802;803 Daar we
ons uitsluitend dienden te verlaten op routinematig verzamelde gegevens uit verscheidene
medische en administratieve gegevensbanken met een wisselende graad van bruikbaarheid 202;631;804;805, dienden we relevante stukken informatie te identificeren en tot voldoend
overtuigende evidentie samen te bundelen om een onderbouwd antwoord op de gestelde
vraag te kunnen geven.
De voornaamste onderzoeksvraag bestond erin of er voldoende volksgezondheidskundige
redenen waren om de activiteiten van de tijdelijk gesloten verbrandingsoven te hernemen.
Wetenschappelijke argumenten kunnen afgeleid worden (1) uit de wetenschappelijke
literatuur, (2) een studie gebaseerd op bestaande informatiebronnen, en (3) een helemaal
Hoofdstuk 6: Complementariteit van gegevensbanken 304
opnieuw uitgetekende studie. Wij verkozen een combinatie van (1) en (2), omdat (3) een,
in deze omstandigheden, onaanvaardbaar lange tijdsduur voor de studie zou vergen. De
juiste definitie van de onderzoeksvragen en van de studieopzet worden in de volgende
sectie beschreven.
6.2 METHODEN
6.2.1 Eindpunten van de studie Omdat voor de gezondheid schadelijke effecten van verbrandingsovens het probleem van
congenitale afwijkingen overstijgen, hebben we ook meerdere andere eindpunten van
reproductieve gezondheid in de studie opgenomen: spontane en medisch geïnduceerde
abortussen, perinatale mortaliteit, laag geboortegewicht, korte zwangerschapsduur, minder
gunstige leeftijd van de moeder, verminderde pariteit, omgekeerde geslachtsratio, een
overmaat van meerlingzwangerschappen of van medisch begeleide totstandkomingen van
de zwangerschap.
6.2.2 Gegevensverzameling Wij maakten gebruik van medische en openbare gegevensbanken, ons ter beschikking
gesteld door officiële en private instanties.
Van het gemeentelijk register van Antwerpen ontvingen we twee bestanden met gegevens
van de periode van 1989 tot 1997. (1) Een bestand van alle kinderen geboren in de
Antwerpse agglomeratie en waarvan de moeder op enig ogenblik in Neerland verbleven
had. Deze gegevens bestonden uit volgende variabelen: geslacht, geboortedatum, de
geboortedatum van de moeder en haar nummer van het rijksregister. (2) Een bestand met
alle vrouwen die op enig ogenblik in Neerland verbleven met hun geboortedatum, nummer
van het Rijksregister, de datum waarop ze in een bepaalde woning gingen wonen met het
precies adres, en de datum van vertrek, wanneer dit van toepassing was.
Het Rijksregister verstrekte de lijst van hun nakomelingen, wat de identificatie mogelijk
maakte van kinderen geboren buiten Antwerpen.
Het Studiecentrum voor Perinatale epidemiologie (SPE) stelde een bestand ter beschikking
van 506.632 geboorten voor de periode van 1989 tot 1996. Sinds 1989 registreerde dit
centrum meer dan 90% van alle levend geborenen in Vlaanderen, en daarnaast, de
Hoofdstuk 6: Complementariteit van gegevensbanken.
305
doodgeboren kinderen (van minstens 500g) en de gevallen van neonatale sterfte. De
gegevens bevatten onder meer de geboortedatum van moeder en kind, de
zwangerschapsduur, geboortegewicht, geslacht anoniem ziekenhuisnummer, verblijfplaats
van de moeder, en voorkomen en type van congenitale afwijking. Vanaf 1991 werden ook
de pariteit en de manier van de totstandkoming van de zwangerschap geregistreerd.
Geboortedatum van moeder en kind, verblijfplaats van de moeder en volgorde bij de
geboorte in geval van meerlingzwangerschap werden gebruikt als uniek
“identificatienummer” om de SPE gegevens te koppelen met de Neerlandbestanden.
Het gekoppelde gegevensbestand maakte het mogelijk een groep van 636 kinderen te
identificeren waarvan de moeder ooit in Neerland woonachtig was.
De volkstelling van 1991 en de statistieken van het fiscaal inkomen verschaften een ruwe
schatting van de sociaal-economische status (SES) van de wijk, die hoger was dan die van
Vlaanderen in zijn geheel. Tenslotte, om in onze analyse rekening te kunnen houden met
de SES van de individuele moeders van de wijk, koppelden we de subset van 636 kinderen
met de officiële geboortebestanden van 1989 tot 1996, wat toeliet hun gegevens aan te
vullen met de beroepsgroep van beide ouders, die we gebruikten als een proxy voor SES.
6.2.3 Opzet Daar we ons moesten verlaten op geregistreerde gegevens, zonder details over individuele
blootstelling, dienden we een “post-hoc small-area” studie op te zetten.
Verder waren we verplicht ons, uit de aard van de beschikbare gegevens, te beperken tot
de periode van 1 januari 1989 tot 31 december 1996.
Vermits we over het volledige adres en de juiste duur van iedere verblijfsperiode
beschikten, was het nochtans mogelijk een retrospectieve cohort studie uit te voeren over
de reproductieve gezondheid, door de verblijfsduur te nemen als een proxy voor
blootstelling.
Wij gebruikten hiervoor drie niveaus van vergelijkingen.
Op een eerste niveau werd de relatieve frequentie van zwangerschapsgerelateerde
problemen in Neerland vergeleken met Vlaanderen min Neerland, dat we verder in tekst en
tabellen als Vlaanderen zullen benoemen. In deze vergelijking waren de eindpunten
Hoofdstuk 6: Complementariteit van gegevensbanken 306
meestal eenduidig. Congenitale afwijkingen echter worden noch op uniforme manier
vastgesteld, noch geregistreerd, wat de vergelijkingsmogelijkheden beperkte tot de
frequentie van het voorkomen van congenitale afwijkingen in beide groepen, zonder
verdere specificatie.
Omdat er bij de vergelijking met Vlaanderen een behoorlijk aantal obstetrici betrokken
waren, wat tot een wisselende graad van overeenstemming tussen de verschillende
beoordelaars kon leiden, vergeleken we op een tweede niveau het voorkomen van
congenitale afwijkingen bij borelingen van moeders, die ooit woonachtig waren in
Neerland, met borelingen van moeders, die in dezelfde verloskundige eenheden bevielen
en nooit in Neerland gewoond hadden.
Op een derde niveau bestudeerden we binnen de groep van Neerland moeders het verband
tussen het voorkomen van congenitale afwijkingen en volgende verklarende variabelen:
leeftijd van de moeder (opgesplitst in minder dan 35 jaar of niet); beroepsgroep van de
ouders; meerlingzwangerschap; geslacht; totale verblijfsduur en verblijfsduur tijdens de
tien aan de geboorte voorafgaande jaren; kalenderjaar en, wanneer van toepassing,
tijdsspanne tussen vertrekdatum en geboorte.
We gebruikten verblijfsduur als een proxy voor blootstelling. Een positief dosis-antwoord
verband zou wijzen op een etiologische bijdrage van de ovens in het voorkomen van
congenitale afwijkingen.9;806-808Hierbij dient men er rekening mee te houden dat deze
blootstellingvariabele een surrogaat is voor de werkelijke blootstelling, die men bij de
analyses wenst te gebruiken maar waarover men niet beschikt. Dit impliceert bijgevolg een
grote voorzichtigheid bij de interpretatie van de vatstellingen.
Voor vrouwen die in Neerland kwamen wonen werd de datum van inschrijving in het
gemeenteregister genomen als beginpunt van de verblijfsduur. Voor vrouwen met
meerdere episodes van immigratie en emigratie berekenden we een globale verblijfsduur.
Vermits Neerland een gebied is waarin vaak verhuisd wordt, bleek het onmogelijk een
juiste afstand te bepalen tussen de woonplaats en de ovens.
Hoofdstuk 6: Complementariteit van gegevensbanken.
307
6.2.4 Statistische aspecten. Leeftijd van de moeder, geboortegewicht en zwangerschapsduur, die gekarakteriseerd zijn
door een niet-lineaire associatie met de bestudeerde perinatale eindpunten, werden
gecategoriseerd.809
Voor nominale multinomiale variabelen gebruikten we voor het toetsen van verschillen
tussen proporties de “likelihood ratio” toets en, waar nodig de Fisher’s exact toets. In geval
van interval variabelen gebruikten we de Cochran-Armitage trend test.156
Voor binomiale variabelen berekenden we odds ratio’s en hun 95%
betrouwbaarheidsintervallen.460 We rapporteren ze als volgt: OR (OG,BG), waar OG staat
voor ondergrens en BG voor bovengrens. Voor de multivariabele analyses gebruikten we
de dichotome logistische regressie in geval van binomiale variabelen en de generalised
logit modelling (baseline category)156in geval van een multinomiale antwoordvariabele.
De modellen werden a priori geformuleerd, gebaseerd op wetenschappelijk inzicht. Daar
onze aandacht vooral uitging naar de mogelijke invloed van verblijfplaats op de
bestudeerde perinatale eindpunten, bleef de modellering beperkt tot het bereiken van een
goede fit en tot de vaststelling of verblijfplaats al dan niet significant was. In dat geval
zullen odds ratio’s en hun betrouwbaarheidsintervallen gepresenteerd worden.
6.3 RESULTATEN
6.3.1 Vergelijking tussen Neerland en Vlaanderen Hoewel gecorrigeerde odds ratio’s belangrijker zijn dan de niet-gecorrigeerde, geloven we
dat het aanbeveling verdient beide te rapporteren voor een studie die, althans gedeeltelijk,
uitgevoerd werd wegens de bezorgdheid van een gemeenschap. Puntschatters en 95%
betrouwbaarheidsintervallen, die de grootte van de evidentie aantonen, worden in Tabel 1
weergegeven. De odds ratio’s van perinatale sterfte (p=0,089) en van congenitale
afwijkingen (p=0,414) zijn niet significant. Mocht men al iets willen zeggen i.v.m.
perinatale mortaliteit, zou het zijn dat ze lager zou kunnen zijn in de Neerland groep.
Hoofdstuk 6: Complementariteit van gegevensbanken 308
Tabel 1: Verdeling van de binaire eindpunten van de reproductieve gezondheid volgens de verblijfplaats van de moeder. Vlaanderen, 1989-1996. Neerland Vlaanderen Odds Ratio ( 95% BI) Neerland versus Vlaanderen
Perinatale sterfte 1/636 4.344/505.996 0,18 (0,03;1,29)
Congenitale afwijking 13/636 8.259/505.996 1,26 (0,73;2,18)
Meerlingen 55/636 17.601/505.996 2,62 (1,99;3,47)
Jongens 340/636 259.629/505.996 1,09 (0,93;1,27)
Onze analyse i.v.m. congenitale afwijkingen had slechts een power van 0.20.453;810We
zouden immers 122 gevallen nodig gehad hebben uit 5847 geboorten om significantie te
bereiken met een power van 0,80. Wel vonden we een belangrijk en significant teveel van
meerlingen in Neerland (Tabel 1). Daarentegen schenen leeftijd van de moeder,
zwangerschapsduur, geboortegewicht, proportie jongens bij de geboorte (een equivalent
voor geslachtsratio), de pariteit van moeders bij eenlingzwangerschappen en de
leeftijdsopbouw van de moeders een gelijkaardige verdeling te vertonen (Tabellen 1 en 2).
De puntschatters 95% betrouwbaarheidsintervallen en de probabiliteiten van de
multivariabele analyse werden weergegeven in tabellen 3 en 4. Zij weerspiegelen in
essentie dezelfde informatie als de univariate analyse over perinatale sterfte, geslachtsratio,
congenitale afwijkingen of meerlingen. Medisch begeleide totstandkomingen van de
zwangerschap bij eenlingen waren vergelijkbaar in beide groepen (Tabel 3). Daarentegen
waren er significant meer medisch begeleide totstandkomingen van de zwangerschap bij
moeders van meerlingen in Neerland (Tabel 3). Zwangerschapsduur, geboortegewicht en
pariteit bij eenlingen waren echter zeer vergelijkbaar verdeeld (Tabel 4)
Hoofdstuk 6: Complementariteit van gegevensbanken.
309
Tabel 2: Verdeling van multi-categorie eindpunten van reproductieve gezondheid volgens de verblijfplaats van de moeder, Vlaanderen, 1989-1996. NEERLAND VLAANDEREN
Leeftijd van de moeder (in verstreken jaren) N % N %
< 20 jaar 9 1,42 10.605 2,10
20 - 34 jaar 580 91,19 461.432 91,19
> 34 jaar 47 7,39 33.959 6,71
Totaal 636 100,00 505.996 100,00 Likelihood ratio chi-square: p=0.366
Geboortegewicht (eenlingen)
< 1500 g 3 0,52 3.506 0,72
1500 – 2499 g 19 3,27 19.527 4,00
>= 2500 g 559 96,21 465.362 95,28
Totaal 581 100,00 488.395 100,00 Likelihood ratio chi-square: p=0.539
Zwangerschapsduur (eenlingen)
< 32 weken 3 0,52 3.582 0,73
32 – 36 weken 28 4,82 20.707 4,24
>= 37 weken 550 94,66 464.106 95,03
Totaal 581 100,00 488.395 100,00 Likelihood ratio chi-square: p=0.649
Pariteit (Eenlingen)
1 226 45,29 179.989 45,84
2 173 34,67 136.272 34,71
3 72 14,43 51.078 13,01
4 17 3,41 15.639 3,98
5+ 11 2,20 9.658 2,46
Totaal 499 100,00 392.636 100,00 Likelihood ratio chi-square: p=0,926 ; Cochran-Armitage trend test (two-tailed): p=0,995
Hoofdstuk 6: Complementariteit van gegevensbanken 310
Tabel 3: Eindpunten van reproductieve gezondheid volgens de verblijfplaats van de moeder. Resultaten van de logistische regressie, Vlaanderen, 1989-1996. Eindpunt Gecorrigeerd
voor
Goodness-of-fit
(Deviance)
Verblijfplaats Odds Ratio (95% CI)
Neerland versus Vlaanderen
Vg Chi² Prob. Vg Chi² Prob.
Perinatale sterfte M, G, A, C, B 58 58,52 0,456 1 3,173 0,0750 0,16 (0,01; 1,77)
Geslacht M, A, C 14 13,07 0,521 1 1,167 0,2800 1,09 (0,91; 1,31)
Meerlingen A, G 5 5,511 0,357 1 26,04 0,0001 2,25 (1,65; 3,07)
Congenitale afwijking M, G, A, D 16 9,471 0,893 1 0,430 0,5120 1,20 (0,69, 2,08)
Medisch Begeleide
Totstandkoming van de
Zwangerschap
- Eenlingen
- Meerlingen
A
2
1
1,536
0,031
0,463
0,860
1
1
2,490
8,045
0,1150
0,0046
2,04 (0,71; 5,82)
2,50 (1,16; 5,38)
Gecorrigeerd voor: M: meerlingen, G: geslacht, A: leeftijd van de moeder, C: congenitale afwijking, D: zwangerschapsduur, B: geboorte gewicht; Vg: vrijheidsgraden.
Hoofdstuk 6: Complementariteit van gegevensbanken 311
Tabel 4: Eindpunten van reproductieve gezondheid volgens de verblijfplaats van de moeder. Resultaten van het modelleren van baseline-category logits, Neerland versus Vlaanderen, 1989-1996. Eindpunt Gecorrigeerd voor Goodness-of-fit
(Likelihood ratio)
Verblijfplaats Conclusie
Vg Chi² Prob. Vg Chi² Prob.
Zwangerschapsduur M, G, A, C 26 32,78 0,169 2 1,86 0,395 NS
Geboorte gewicht M, G, A, C 26 27,35 0,391 2 1,88 0,390 NS
Parity A 8 3,34 0,911 4 1,40 0,845 NS Gecorrigeerd voor: M: meerlingen, G: gender, A: leeftijd van de moeder, C: congenitale afwijking, D: zwangerschapsduur, B: geboorte gewicht; Vg: vrijheidsgraden.
Hoofdstuk 6: Complementariteit van gegevensbanken. 312
6.3.2 Voorkomen van congenitale afwijkingen bij moeders ooit woonachtig versus nooit woonachtig in Neerland, die in dezelfde obstetrische eenheden bevielen
578 van de 636 baby’s van de ooit in Neerland woonachtige moeders werden in 12
obstetrische eenheden geboren en worden vergeleken met 83.474 andere baby’s, die daar
geboren werden. 12 gevallen van congenitale afwijkingen werden vastgesteld bij de
Neerland kinderen versus 1297 bij de andere kinderen, wat overeenkomt met een niet-
significante odds ratio van 1,34 (0,72-2,44) en praktisch dezelfde als we observeerden bij
de vergelijking met Vlaanderen min Neerland.
Een multivariabele analyse, met correctie voor leeftijd van de moeder, geslacht en
meerlingzwangerschap resulteerde ook in een niet-significante odds ratio van 1,29 (0,73-
2,23).
6.3.3 Frequentie van congenitale afwijkingen en van meerlingzwangeschappen bij de moeders ooit woonachtig in Neerland. We bestudeerden het dosis-antwoord verband tussen een congenitale afwijking en de
verklarende variabelen,namelijk leeftijd van de moeder (gedichotomiseerd in al dan niet
minder dan 35 jaar); beroepsgroep van de ouders; meerlingzwangerschap; geslacht, totale
verblijfsduur en verblijfsduur gedurende de tien jaar voorafgaand aan de geboorte;
kalenderjaar en tijdsspanne tussen vertrekdatum en geboorte. Om mogelijke vertekeningen
te vermijden bij de keuze van de modellen, gebruikten we hier de automatische selectie
opties ter beschikking gesteld door de LOGISTIC Procedure van SAS.811Telkens
verkregen we een model bestaande uit één enkele verklarende variabele, namelijk de
prenatale verblijfsduur van de moeder met een odds ratio van 0,78 (0,60- 0,95).
Noteren we dat alle gevallen van congenitale afwijking zich voordeden bij moeders met
een verblijfsduur van 6 jaar of minder, ongeveer 2/3de van de totale cohort (Figuur 1).
Daarentegen was het voorkomen van meerlingzwangerschap niet significant gerelateerd
met de verblijfsduur.
Hoofdstuk 6: Complementariteit van gegevensbanken.
313
Figuur 1: Aantal kinderen met of zonder een congenitale afwijking volgens verblijfsduur (in jaren) van de moeder in Neerland vóór de geboorte
0
10
20
30
40
50
60
70
80
90N
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Verblijfsduur in jaren
Congenitale afwijkingen
Afwezig
Aanwezig
6.4 BESPREKING
6.4.1 Opzet van de studie Het luik over congenitale afwijkingen in onze studie was duidelijk van het “post hoc” type.
In dergelijke gevallen kan het gebied waarover men zich zorgen maakt de administratieve
grenzen overschrijden en een verdunning van de reële effecten veroorzaken wegens de
grootte van deze eenheden, die vaak aanzienlijk groter zijn dan het blootgestelde gebied.
Een “natuurlijke” reactie hierop is het vernauwen van de grenzen door het kunstmatig
afbakenen van het blootgestelde gebied met een maximale concentratie van gevallen, zoals
in Neerland gebeurde.772 We hadden dus te kampen met problemen van occult meervoudig
toetsen en grensvernauwing, wat leidde tot een overschatting van de prevalentie van
ongenitale afwijkingen. 769;772;812;813 Zelfs al was de SES in Neerland hoger, kan, in deze
context, de niet-gecorrigeerde odds ratio van 1,20 (0,69- 2,08) als een geringe evidentie
voor een overmaat van congenitale afwijkingen beschouwd worden.
Hoofdstuk 6: Complementariteit van gegevensbanken 314
Vermits er regionale verschillen in het beoordelen van casussen kunnen bestaan
vergeleken we het voorkomen van congenitale afwijkingen bij moeders die ooit in
Neerland woonden met moeders die er nooit gewoond hadden en die in dezelfde
obstetrische eenheden bevielen. Die vergelijking leverde praktisch dezelfde resultaten op
als de vergelijking met Vlaanderen.
6.4.2 Statistische aspecten Zoal reeds vermeld zijn statistische toetsen vertekend in een “post hoc” situatie. Toch
moesten we, in een context van een wantrouwige gemeenschap802 en een delicate, te
onderbouwen politieke beslissing, de omvang van mogelijke gezondheidsbedreigingen
inschatten. De statistische methodes, die we gebruikten, zijn klassieke methodes, waarbij
problemen met de onderliggende geografische spreiding van de bestudeerde eindpunten uit
de weg gegaan worden. Vermits de geografische precisie van onze gegevens veel groter
was in de index populatie dan in Vlaanderen, onze referentie populatie, waren spatiale
methodes niet bruikbaar.772 Wegens de intense verhuisbewegingen in Neerland konden ze
ook niet gebruikt worden voor de analyse van de in Neerland woonachtige moeders.
Noteren we tenslotte dat 338 van de 636 kinderen in onze studie, waaronder 6 van de 13
gevallen van congenitale afwijkingen, niet in Neerland geboren werden en niet in
aanmerking zouden genomen zijn door methodes van geografische analyse. De gevolgde
methodologie bood hier enige bescherming tegen migratiebias.631
6.4.3 Waarde van routinematig verzamelde gegevens Geregistreerde gegevens laten een objectieve classificatie toe, voorafgaandelijk aan enige
kennis van een eindpunt, wat een ingebouwde bescherming biedt tegen informatie bias. De
kleine tijdsspanne tussen het voorkomen van een gezondheidsfenomeen en zijn registratie
vermindert ook het gevaar voor misclassificatie en voor een verlies aan statistische power
met een vertekening van de resultaten in de richting van geen associatie.814
In tegenstelling met de andere eindpunten van de studie, die eenduidig zijn, vormen
congenitale afwijkingen een complex probleem.805 Specifieke nadelen behelzen onder
meer laattijdige detectie, prenatale diagnose en codering.803;815 Verder zijn congenitale
afwijkingen eerder prevalenties dan incidenties, en kunnen in competitie treden met andere
eindpunten van reproductieve epidemiologie.816 Daarenboven registreert het SPE slechts
Hoofdstuk 6: Complementariteit van gegevensbanken.
315
foetussen met een geboortegewicht van tenminste 500g en sluit op die manier vroege
miskramen en medisch geïnduceerde abortussen uit.610 Het nationale abortusregister, dat
alleen de provincie van de woonplaats registreert, was hierbij van weinig nut. Merken we
nochtans op dat al deze nadelen van toepassing zijn zowel op de index als de referentie
bevolking en dat het precies de vergelijking is tussen deze twee groepen, die het
belangrijkste aandachtspunt vormt, en niet het cijfer van congenitale afwijkingen.
Men mag aannemen dat de volledigheid van de SPE-gegevens groot is. In de deelnemende
Vlaamse moederhuizen worden immers alle perinatale sterfgevallen en levend geboren
kinderen geregistreerd, op een deel van de thuisbevallingen na, die slechts ongeveer 1%
van de verlossingen uitmaken. De gegevens worden op continue wijze verzameld en
worden onderworpen aan een georganiseerd systeem van kwaliteitsbewaking.610
Om onze cohort studie te corrigeren voor SES werd het SPE-bestand gekoppeld aan de
officiële geboortebestanden met een geslaagde koppeling in 96% der gevallen. Noteren we
dat we in ons eindbestand alle gevallen terugvonden, die gemeld waren door de Neerland
bewoners en zich tijdens de studieperiode voordeden.
De gegevens van het Antwerpse gemeenteregister en van het Rijksregister kunnen we als
praktisch volledig en kwaliteitsvol beschouwen, vermits zij vaak gebruikt worden voor
administratieve doeleinden.
6.4.4 Eindpunten van de studie Op de meerlingen na bleek geen enkel ander eindpunt statistisch significant te verschillen
in index en referentie populatie. Betreffende congenitale afwijkingen liet een power
analyse toe de grijze zone van niet-significante odds ratio’s te beperken tot odds ratio’s
van minder dan twee. Een mogelijk “oogst” effect, waarbij bij lage dosissen randgevallen
worden geëlimineerd, kan geresulteerd hebben in minder gevallen en een hogere sterfte.817
De cijfers van perinatale mortaliteit en congenitale afwijkingen in de index versus de
referentie populatie, de afwezigheid van een exces mortaliteit en van een omgekeerde
geslachtsratio onderbouwen deze hypothese niet.791
Het schijnbaar beschermende effect, aangegeven door een omgekeerde dosis-antwoord
relatie, kan te wijten zijn aan het gebruiken van de verblijfsduur als een niet adequaat
surrogaat voor een kwantitatieve blootstellingsmaat818 of aan de competitie met andere
Hoofdstuk 6: Complementariteit van gegevensbanken 316
reproductieve eindpunten zoals zeer vroegtijdige zwangerschapsonderbreking. 803 Geen
van deze twee hypotheses kunnen we uitsluiten. Ook de andere eindpunten, behalve
meerlingzwangerschap, en de bodemstudie, die de aanwezigheid van andere, belangrijke
bronnen van dioxine blootstelling aanduidt, schijnen een significante etiologische bijdrage
van de verbrandingsovens uit te sluiten.
De wetenschappelijke discussie over het verband tussen het voorkomen van
meerlingzwangerschap en milieuverontreiniging is nog steeds lopend. Mocht ze bestaan,
dan zou ze eerder klein en niet eenduidig zijn.798Het lijkt vermeldenswaard dat er zich, in
een straal van minder dan vijf kilometer rond Neerland, drie centra bevinden waar medisch
begeleide totstandkoming van de zwangerschap toegepast wordt. Hun aanwezigheid kan
meer vraag naar dit soort medische zorg gestimuleerd hebben en hebben bijgedragen tot
het meerlingzwangerschappenexces.255 Men kan verder aanvoeren dat vergeleken met
Vlaanderen de praktisch identieke pariteit van de Neerland moeders, de leeftijdsverdeling,
de vergelijkbare geslachtsratio en de afwezigheid van een dosis-antwoord verband tussen
blootstelling en het voorkomen van congenitale afwijkingen of van een overmaat van
meerlingzwangerschappen bij moeders, die ooit woonachtig waren in Neerland, weinig
evidentie opleveren voor een verminderde fertiliteit ten gevolge van een
milieuverontreiniging.
6.4.5 Risicoperceptie en -communicatie Gemeentelijke verbrandingsovens waren vroeger zware vervuilers, die hinder
veroorzaakten en misschien een bedreiging vormden voor de gezondheid. De
vreesverwekkende factoren aanwezig in Neerland kunnen in belangrijke mate bijgedragen
hebben tot de risicoperceptie. Zij bestonden onder meer uit een ongewilde blootstelling,
waaraan door persoonlijke voorzorgsmaatregelen niet kon ontsnapt worden, en een
nieuwe, door de mens gecreëerde bron van verontreiniging, die onomkeerbare schade
toebracht aan kleine kinderen.819 Daarenboven werden de klachten van de plaatselijke
bevolking al te lang genegeerd door de autoriteiten en verder bestond er geen systeem dat
bekwaam was om snel en effectief een antwoord te geven op milieuproblemen.818;820 Dit
alles, op zijn beurt, kan langdurige stress veroorzaakt hebben. 821
Hoofdstuk 6: Complementariteit van gegevensbanken.
317
6.5 BESLUIT
Studie van clusters dragen slechts zelden bij tot de wetenschap en zouden moeten
vermeden worden.812In de gegeven omstandigheden echter werd een snel en onderbouwd
advies gevraagd. Geconfronteerd met een weinig meewerkende plaatselijke gemeenschap,
hadden we geen andere keuze dan een post hoc clusteranalyse uit te voeren betreffende
congenitale afwijkingen en de reproductieve gezondheid te beoordelen, gebruik makend
van beschikbare, routinematig verzamelde gegevens.
Onze studie gaat gebukt onder verschillende methodologische beperkingen. De analyse –
een suboptimale vergelijking tussen gemeenschappen818 i.p.v., bijvoorbeeld, een patiënt-
controle onderzoek – bleef beperkt tot alleen maar een vergelijking van gevallen in een
blootgesteld gebied met deze van de algemene bevolking, zonder een precieze beschrijving
van de letsels en zonder informatie over vroegtijdige miskramen en abortussen.
Daarenboven beschikten we niet over voldoende details i.v.m. SES, type en bron van
vervuiling, en intensiteit van de blootstelling, wat een formele uitsluiting van een cluster
van congenitale afwijkingen uitsloot. Nochtans vertrouwen we erop, wegens de
ingebouwde beveiliging tegen misclassificatie, dat deze gegevens ons toelieten een
eventueel exces van congenitale afwijkingen te beperken tot een odds ratio van minder dan
twee, en, vermits de baseline frequentie zeer laag is, voldoende evidentie verschaft te
hebben om een zorgwekkende situatie i.v.m. de reproductieve gezondheid in Neerland uit
te sluiten.
De Neerland studie onderstreept het belang van een efficiënte risicocommunicatie
vanwege de overheid naar een ongeruste gemeenschap in geval van een milieuprobleem.
Tenslotte maakt ze duidelijk dat de koppeling van gegevens van bestaande
gegevensbanken in een beperkte tijdspanne nuttige informatie kan verschaffen wanneer
zich dergelijke problemen stellen. Het is dan zaak het gemeenschappelijke belang af te
wegen tegen het individuele recht op bescherming van zijn privé-sfeer.
Hoofdstuk 6: Complementariteit van gegevensbanken 318
Bedankingen
We danken de professoren Bartsch, Van Larebeke en Van Oyen voor hun opbouwende
kritiek over de opzet en de resultaten van onze studie. We zijn grote dank verschuldigd aan
Mevr. E. Wallyn van het Antwerpse Register van de Burgerlijke Stand, het SPE en het
Rijksregister voor hun vriendelijke en behulpzame samenwerking.
319
ALGEMEEN BESLUIT EN AANBEVELINGEN
Een door evaluatie bijgestuurd beleid heeft nood aan bruikbare gegevens, die toelaten een
beleid te voeren gefundeerd op prioritaire gezondheidsproblemen. Op basis hiervan
formuleren lokale, intermediaire en landelijke beleidsmakers algemene en specifieke
doelstellingen, die op hun beurt vertaald worden in activiteiten, die uitmonden in prestaties
en vervolgens in uitkomsten. In deze benadering is het gebruik van administratieve
gegevensbanken - alleen of in combinatie - fundamenteel: zij leveren aanknopingspunten
voor de evaluatiecyclus (definitie van prioritaire gezondheidsproblemen, evaluatie van
prestaties en uitkomsten, evaluatie van de pertinentie van het gevoerde beleid) ten behoeve
van het beleid op alle niveaus.
Wegens een aantal beperkingen laten de administratieve gegevensbanken slechts tot op
zekere hoogte toe een onderbouwd beleid te voeren op alle niveaus van het
gezondheidssysteem.
Deze beperkingen vloeien deels voort uit de ongelijke kwaliteit van de gegevens, deels uit
het vooralsnog eenzijdig gebruik van de Minimaal Klinische Gegevens in een financiële
optiek en deels uit de versnippering, de geringe toegankelijkheid en de te beperkte scoop
van de bestaande gegevensbanken. Laten we daarbij niet uit het oog verliezen dat, hoewel
de complexiteit van de case mix niet volledig door administratieve gegevens kan
ondervangen worden, alleen dit soort gegevens toelaat landelijke, interziekenhuis
vergelijkingen te corrigeren voor case mix.
De kwaliteit van de gegevens van de overlijdensstatistieken deelt grotendeels in de
gebreken van de ziekenhuis ontslaggegevens. Specifieke moeilijkheden worden gesteld
door de certificatie met zijn specifieke, oorzakelijke logica, waar artsen vaak geneigd zijn
te redeneren vanuit het principe van de ernst. Ook hier lijkt een adequate vorming van de
artsen een noodzakelijke voorwaarde voor verbetering. Hoewel over het ganse land een
duidelijke verbetering van de codeerkwaliteit wordt vastgesteld blijft de tijdigheid van de
statistieken problematisch in het zuidelijk landsgedeelte en derhalve ook die van de
nationale statistieken. Vergeten we hierbij niet dat er geen enkele andere bron voor
Algemeen Besluit en Aanbevelingen 320
gezondheidsgegevens bestaat, die even universeel is in dekkingsgraad, in uniformiteit, en
tijdigheid als de sterftegegevens binnen het systeem van de bevolkingsstatistieken.
Toch wensen wij hier duidelijk te stellen dat de voormelde administratieve gegevens zeker
geen antwoord kunnen verstrekken op alle beleids- of onderzoeksvragen. Vaak kunnen zij
slechts een nuttige screening verschaffen en dient er op basis hiervan een gericht
wetenschappelijk onderzoek volgens de regels der kunst uitgevoerd te worden. Het kan
hierbij noodzakelijk blijken een specifieke registratie op te zetten. De internationaal
vastgestelde verschillen in mortaliteit ten gevolge van ischemische hartziekten, die leidden
tot het opzetten van het MONICA project, is hiervan een mooie illustratie. In andere
gevallen, zoals voor het uitvoeren van een kosten baten analyse van een vaccinatie voor
humaan pappilomavirus en baarmoederhalskanker, kunnen de administratieve gegevens
geen nuttige informatie leveren en zal wetenschappelijk onderzoek, gebaseerd op door de
onderzoekers verzameld feitenmateriaal nodig zijn, om dat soort vragen te beantwoorden.
Om de bruikbaarheid van deze administratieve gegevensbanken te verhogen lijkt een
strategie, gebaseerd op een progressieve verbetering een haalbaar project. Zij berust erop
dat de kwaliteit van de gegevens en dus hun beleidsonderbouwend potentieel zal
verbeteren indien ze ook voor volksgezondheidkundige doeleinden gebruikt worden. Zoals
de beperkte ervaring, die in dit proefschrift weergegeven wordt, leert is het mogelijk aan
de hand van kwaliteitsindicatoren niet alleen problemen in verband met kwaliteit van
zorgen te identificeren maar ook problemen in verband met de kwaliteit van de gegevens.
Deze laatste kunnen via de audits die de FOD Volksgezondheid uitvoert onderzocht en
waar nodig gecorrigeerd worden. Het kan hierbij zowel over overcoderen (bijvoorbeeld co-
morbiditeit) als ondercoderen (bijvoorbeeld het niet coderen van een vermelde vorige
keizersnede) gaan.
Problemen in verband met de kwaliteit van zorgen kunnen aangepakt worden in een brede
samenwerking binnen de sector tussen clinici en het management, tussen de sector en het
College van geneesheren en beroepsverenigingen, en in samenwerking met de overheid.
Dit veronderstelt een brede mentaliteits- en gedragsverandering, met een herdenking van
de organisatie op alle niveaus, een openheid naar en een implicatie van de patiënt en de
Algemeen Besluit en Aanbevelingen
321
gemeenschap, waarbij de overheid niet alleen gezien wordt en zich gedraagt als een
controlerende instantie maar als een heuse partner, die, naast zijn verantwoordelijkheid
voor het opzetten van administratieve gegevensbanken en het analyseren van de gegevens,
ook zijn verantwoordelijkheid als borger van de publieke belangen opneemt.
Een eerste belangrijk initiatief van een brede samenwerking op alle niveaus werd
genomen. Het bestaat in de creatie van een operationele structuur, die ermee belast wordt
(1) de toekomstige nationale feedbacks, bestaande uit klinische en niet-klinische
indicatoren, te begeleiden, (2) de ontwikkeling van hierop gebaseerde
kwaliteitsbevorderende acties te initiëren en (3) het identificeren van bijkomende
indicatoren.Verder zullen lokale initiatieven, die aansluiten op de feedback, aangemoedigd
worden. Zowel een continue investering in een infrastructuur voor kwaliteitsbevordering
als het voorzien in een beschermde tijd voor deze activiteiten zijn vereist om het project te
laten slagen.
Een goede samenwerking tussen de bestaande gegevensbanken, naar het Canadese
voorbeeld, moet een volgende doelstelling zijn. In onze Neerland studie menen we niet
alleen aangetoond te hebben dat een samenwerking mogelijk is, maar tevens dat de voor
het beleid noodzakelijke informatie op deze manier kon verzameld worden. Deze
doelstelling zal echter alleen verwezenlijkt kunnen worden indien de politieke overheden
zich hiervoor inzetten. De versnippering van de bevoegdheden over het federaal en het
gemeenschapsniveau, en de huidige wetgeving in verband met de bescherming van de
persoonlijke levenssfeer maken deze opzet niet eenvoudig. Toch moet het mogelijk zijn
via geijkte procedures een koppeling van gegevens mogelijk te maken en de voorwaarden
tot koppeling te versoepelen in functie van het minder of meer dringend karakter van de
aanvraag.
Tenslotte formuleren we volgende dubbele aanbeveling:
1) het opzetten van een operationeel landelijk gezondheidsinformatie systeem, dat de
noodzakelijke gegevens toegankelijk maakt, de kwaliteit ervan waarborgt, ze tijdig
verwerkt en ze op een correcte manier met de nodige garanties voor de
Algemeen Besluit en Aanbevelingen 322
persoonlijke levenssfeer ter beschikking stelt voor het beleid en de
wetenschappelijke wereld,
2) het structureel verankeren van een tijdige oplevering van de landelijke
mortaliteitsgegevens.
323
SAMENVATTING Een behoeftengestuurd en bevolkingsgericht gezondheidsbeleid vereist een betrouwbaar
gezondheidsinformatiesysteem. Hierbij lijkt er een belangrijke rol weggelegd voor
secundaire gegevensbanken. Hij bestaat in het in kaart brengen van de gezondheidsstatus
van de bevolking en het om het verantwoording afleggen over het gebruik van de
toegekende middelen en over de kwaliteit en de uitkomsten van de verstrekte zorgen
mogelijk te maken.
Op basis van literatuurgegevens werd een referentiekader voor het beoordelen van
gegevenskwaliteit uitgewerkt met een bijzondere nadruk op de potentieel negatieve
invloed van het financieringsmechanisme van ziekenhuizen hierop. Meer speciaal gaat
onze aandacht uit naar het “creep” fenomeen, het kunstmatig verzwaren van de case mix
van een ziekenhuis om een hogere terugbetaling te krijgen.
Tijdens het ganse verzamelings- en verwerkingsproces van de gegevens tasten
onvolmaaktheden, fouten en vergetelheid de kwaliteit van de gegevens aan. De
gegevenskwaliteit varieert over de tijd en in functie van leeftijd; geslacht van de
geregistreerde; het type aandoening; het type medische handeling (diagnose, ingreep); het
gebruik van de gegevens door de diensten die registreren; en, het registratiesysteem en zijn
bewakingsmechanismen. Dit betekent dat ze grondig op hun waarde getoetst moeten
worden en dat er voorzichtig omgesprongen wordt met de interpretatie van de resultaten
van uitgevoerde studies.
Een zorgvuldig design van de registratie is uiterst belangrijk. De bewaking van de
gegevenskwaliteit omvat de te gebruiken formulieren of beeldschermen; de selectie van te
registreren items (zoals klinische, radiologische en laboratoriumgegevens, EKG en
beeldvorming); eenduidige instructies; het toepassen van internationaal aanvaarde
classificatiesystemen en bijbehorende codeerregels; het op systematische wijze
verzamelen, verwerken en interpreteren van de gegevens en het monitoren ervan over de
tijd. Verder zijn gegevensvergelijking en samenwerking met andere registraties, creativiteit
bij de validatie, feedback en intensieve audit noodzakelijk, zeker wanneer deze gegevens
een belangrijke rol blijken te spelen in het financieringsmechanisme van ziekenhuizen.
Samenvatting 324
Er lijken twee, los van elkaar staande werelden te bestaan: een van volksgezondheid en een
andere van gezondheidsdiensten, met twee eigen informatiesystemen, respectievelijk
volksgezondheidsinformatie en managementinformatie. Wij trachten de conceptuele
eenheid te herstellen door te streven naar een kwaliteitsvolle volksgezondheid.
Na een omschrijving van wat kwaliteit is, wordt nagegaan welke van haar aspecten aan de
hand van administratieve gegevens kunnen beschreven worden. Een eerste benadering is
gebaseerd op kwaliteitsindicatoren. Achtereenvolgens worden de types en het gebruik van
kwaliteitsindicatoren besproken, en de mogelijkheden van administratieve gegevens om
ondermaatse of bovenmaatse kwaliteit aan te tonen onderzocht. Een tweede benadering is
gebaseerd op incidenten n.a.v. toegediende zorgen. Het begrip “onbedoelde uitkomst”
wordt omschreven, gegevensbronnen worden vermeld, de omvang van het fenomeen
geschetst en de beperkte bruikbaarheid van administratieve gegevensbanken aangegeven.
Wij wijdden een hoofdstuk aan methodologische aspecten in verband met de analyse van
administratieve gegevens voor het opsporen van afwijkend codeergedrag en het
identificeren van ziekenhuizen met een vermoedelijke, bovenmaatse of ondermaatse
kwaliteit. In beide gevallen gaat het over een “outlier” probleem. We gebruikten hiervoor
de logistische regressie en corrigeerden voor het multipel gelijktijdig toetsen d.m.v.de
Bonferroni correctie en voor de correlatie tussen de gegevens d.m.v.“rescaling”
technieken.
Kwaliteit van zorgen is een dagdagelijkse, gedeelde verantwoordelijkheid tussen patiënt,
zorgverleners, ziekenhuisdirecties, College van geneesheren en beroepsverenigingen. De
verantwoordelijkheid van de overheid als borger van de belangen voor de gemeenschap
bestaat erin kwaliteitsinitiatieven te ondersteunen en te stimuleren. In onze benadering
werden ziekenhuizen eerder gezien als individuele structuren van het gezondheidssysteem,
waarvan de diensten een gemeenschappelijk organisatorische cultuur en een aantal
gemeenschappelijk processen deelden, en die verantwoording dienden af te leggen. Niet
het tot schande maken, noemen en blameren van individuen of instituten maar het
identificeren van organisatie− en cultuurgerelateerde problemen werden beschouwd als het
aanknopingspunt voor kwaliteitsbevorderende acties.
Samenvatting
325
De voornaamste resultaten van de analyse van het keizersnedencijfer bij laagrisico
verlossingen kunnen als volgt samengevat worden. Er bestaan in België belangrijke en
onverklaarde interziekenhuis verschillen in keizersnedencijfer, een nationale opwaartse
trend van 2% per semester, en een intens medisch ingrijpen rond het geboortegebeuren.
Als men verlangt het keizersnedencijfer om te buigen zal dit een georganiseerde aanpak
vereisen en dit zowel op het centraal als intermediair en lokaal niveau.
Voor de analyse van het letaliteitcijfer bij AMI wijzen de voornaamste resultaten eerder
naar de beperkingen van de gegevens. De nood aan een eenvormige definitie, de
volledigheid van de gegevens, de traceerbaarheid van patiënten en een goede
risicocorrectie zijn daarbij de voornaamste aandachtspunten. Op gebied van kwaliteit van
de zorgen kunnen reeds een aantal behartigenswaardige bevindingen verder uitgediept
worden. De belangrijke interziekenhuis verschillen zijn wellicht moeilijk interpreteerbaar
maar lijken toch belangrijk genoeg om verder onderzocht te worden. Ook de transfer van
AMI-patiënten voor een electieve PCI verdient de aandacht. Hoewel de complexiteit van
de case mix niet volledig door administratieve gegevens kan ondervangen worden, dient
men er zich tenslotte rekenschap van te geven dat alleen dit soort gegevens toelaat
landelijke, interziekenhuis vergelijkingen te corrigeren voor case mix.
Bij de analyse van kwaliteitsindicatoren kwamen we tot het besluit dat, uit de aard zelf van
onze gegevens, die alleen informatie bevatten over een aantal technische aspecten maar
niet over interpersonele relaties, we alleen van een screening konden gewagen. Daarom
werd de feedback gericht tot clinici, ziekenhuisdirecties, College van geneesheren,
beroepsverenigingen en overheid. Om dezelfde reden was hij ook anoniem.
De Neerland studie gaf aan dat het eventueel exces aan congenitale aandoeningen beperkt
bleef tot een odds ratio van maximaal twee en dat er voldoende evidentie voorhanden was
om een bedreiging voor de reproductieve gezondheid uit te sluiten. Ze benadrukte het
belang voor de overheden om te luisteren naar een verontruste gemeenschap en om tot een
echte risicocommunicatie te komen. Ze maakte ook duidelijk dat koppeling van gegevens
van bestaande gegevensbanken nuttige informatie kan verschaffen.
Samenvatting 326
De moeilijkheid om het juiste evenwicht te vinden tussen de bescherming van het
individuele recht op privacy en het gemeenschappelijk belang komt tot zowel uiting in de
studie van het letaliteitcijfer na een opname voor een AMI als in de Neerland
problematiek. Het is in het eerste geval belangrijk zich te realiseren dat traceerbaarheid
een randvoorwaarde is voor de evaluatie van de behandeling van een AMI en bijgevolg
voor het toekomstige welzijn van dit type patiënten. In het tweede geval hadden we nooit
een verontrustende gezondheidssituatie kunnen uitsluiten zonder een koppeling van de
gegevens tussen registers.
Samenvattend kan men stellen dat administratieve gegevensbanken in beperkte mate
toelaten een onderbouwd beleid te voeren op alle niveaus van het gezondheidssysteem. De
beperkingen vloeien voort deels uit de gebrekkige kwaliteit van de gegevens, deels uit het
vooralsnog eenzijdig gebruik van de Minimaal Klinische Gegevens in een financiële
optiek en deels uit de versnippering, de geringe toegankelijkheid en de te beperkte scoop
van de bestaande gegevensbanken. De kwaliteit van de gegevens en dus hun
beleidsonderbouwend potentieel zal verbeteren indien ze ook voor
volksgezondheidkundige doeleinden gebruikt worden. De kwaliteit van de zorgen is
hiervan een belangrijk domein. Om deze doelstelling te bereiken is een opbouwende
samenwerking van alle beleidsniveaus noodzakelijk.
327
SUMMARY
A need-driven and population-directed health policy requires a reliable health information
system. Herein secondary databases may play an important part. Indeed they contribute to
the assessment of the health status of the population and allow health services to be
accountable for the use of the resources, placed at their disposal, and the quality and
outcomes of the care they offer.
Based on the literature, a frame of reference has been elaborated to assess the quality of
data laying an emphasis on the potential negative influence of the financing mechanism of
the hospitals hereupon. In particular we paid attention to the phenomenon of creep, which
consists in the artificially aggravating of a hospital’s case mix in order to obtain a higher
reimbursement.
During the whole process of data collection and processing the data may be fraught with
imperfections, errors and forgetfulness. Data quality varies over time and according to age
and gender of the patient; the type of the disorder; the type of medical act (diagnosis,
procedure); the use of their own data by the registering services; and, the registration
system and its control mechanisms. This means that administrative data are to be
scrutinized and to be handled with great care when interpreting the results of studies
carried out using them.
A careful design of the registration is of the utmost importance. The assurance of the
quality of the data includes the forms or screens to be used, the selection of items to be
registered (such as clinical, radiological and laboratory data, ECG and medical imaging);
univocal instructions; the implementation of international agreed to classification systems
and accompanying rules; the systematic collecting, processing and analyzing of the data
and its monitoring in time. Comparison of the data and collaboration with other registries;
creativity while validating; feedback and intensive audit; all are required, especially if the
data play an important role in the financing mechanism of hospitals.
Summary 328
Two separate worlds seem to exist: the world of public health and the world of health
services. Both have their own information system, respectively information of public
health and management information. We try to restore the conceptual unity by aiming at a
public health of superior health care quality.
Having defined the concept of quality, we examined to which extent it could be analyzed
using administrative data. A first approach relies on quality indicators. Successively the
differential types and uses of these indicators are discussed. We also examined the
potential of administrative data to identify both superior and inferior quality of care. A
second approach is that of the patient safety indicators, based on adverse events. The
concept of adverse event is described; sources of data are mentioned; the magnitude of the
phenomenon is outlined and the limitations in the use of administrative data in that respect
are reported.
We dedicated a chapter to the methodological aspects regarding the use of administrative
data both to detect deviant coding practices as to identify hospitals of superior or inferior
quality of care. In both cases it is about a problem of outliers. To handle these problems
we made use of logistic regression techniques and corrected for multiple, simultaneous
testing by the Bonferroni correction and for correlation within the data by rescaling
techniques.
Quality of care is a continuous, shared responsibility between patients, care providers,
hospital directions, College of physicians and professional bodies. The responsibility of the
authorities, the guarantor of the community’s interests, consists in supporting and eliciting
quality initiatives. In our approach hospitals are considered individual structures of the
health care system, consisting of services sharing a common organizational culture and
certain common processes and being accountable to the community. Not the “shame, name
and blame” of individuals or organizations but the identification of organizational
problems was considered a starting point for quality improvement.
The main results of our analysis regarding the cesarean section rate in low risk deliveries
may be summarized as follows. In Belgium important and unexplained differences in rates
exist between hospitals. We found a national upward trend of 2% per semester and a
Summary
329
pervading medicalization of childbirth. An organized approach on lokal, intermediate and
central level will be required to stop the rise of the cesarean section rate.
The main results of the analysis of the in hospital case fatality rate of AMI point to the
limitations of the data. The need of a univocal definition of an AMI, the completeness of
the data, the traceability of transferred patients and an adequate risk adjustment draw
particular attention. Some of our findings in the field of quality of care are worthy to be
further examined. Although it may show difficult to interpret the between hospital
differences, they seemed sufficiently important to be investigated. The transfer of patients
with AMI to undergo an elective PCI requires attention as well.
Finally, although it is impossible to completely reflect the complexity of the case mix by
means of administrative data, one has to realize that only this type of data allows to dajust
countrywide inter-hospital comparisons for case mix.
Analyzing quality indicators led us to the conclusion that, due to the very nature of our
data, which contain only information about technical aspects of care but not about
interpersonal relations, we provided only a screening of and not a firm statement about
quality. Therefore our feedback has been directed to the clinicians, hospital directions,
College of physicians, professional bodies and authorities. For that same reason our
feedback remained anonymous.
The Neerland study showed able to restrict the potential excess of cases of congenital
anomalies to an odds ratio of less than two and to have furnished sufficient evidence to
exclude a worrisome situation regarding the reproductive health in Neerland. The study
highlighted the need for the authorities of listening to and communicating with a
community about its health risks. It made it clear that linking of data between existing
registries may provide the needed information.
The difficulty of striking a balance between the common good and the right to the
protection of one’s privacy is common to both the case fatality rate of AMI and the
Neerland study. In the first case it seems important to realize that traceability constitutes a
prerequisite for the evaluation of the treatment of AMI and as a consequence for the well
Summary 330
being of this type of patients in the future. In the second case we would never have been
able to exclude a worrisome health situation without the linkage of data between registries.
Concluding, one may argue that administrative data allow to a certain extent the
underpinning of a policy on all the levels of the health care system. The limitations are due
to the perfectible quality of the data; to the until now almost exclusive, financial use of the
Minimal Clinical Data; and, to the poor accessibility and the too restricted scope of the
existing data banks.
The quality of data and hence their policy-sustaining potential will increase if the data are
used in a perspective of public health, wherein quality of care constitutes an important
domain. To realize this objective a constructive collaboration is required of all levels of
both the public health and the health services worlds.
331
Literatuur
(1) Doremus HD, Michenzi EM. Data quality. An illustration of its potential impact upon a diagnosis-related group's case mix index and reimbursement. Med Care 1983; 21(10):1001-1011.
(2) Scerbo M, Dickstein C, Wilson A. Health Care Data and the SAS System. Cary NC: SAS Institute Inc.; 2001.
(3) Belgisch Staatsblad, Moniteur Belge. Koninklijk besluit houdende oprichting van een Commissie voor toezicht op en evaluatie van statistische gegevens die verband houden met de medische aktiviteiten in de ziekenhuizen. 21-6-1990.
(4) Hill AB. The Aim of the Statistical Method. In: Hill AB, editor. A Short Textbook of Medical Statistics. London: Hodder and Stoughton; 1977. 1-21.
(5) Baker TD, Reinke WA. Epidemiologic Base for Health Planning. In: Reinke WA, editor. Health Planning for Effective Management. New York: Oxford University Press; 1988. 117-130.
(6) Reinke WA. Health Services Program Evaluation. In: Reinke WA, editor. Health Planning for Effective Management. New York: Oxford University Press; 1988. 42-53.
(7) Cochrane AL, St Leger AS, Moore F. Health service 'input' and mortality 'output' in developed countries. J Epidemiol Community Health 1978; 32(3):200-205.
(8) Reinke WA. Health Systems Reserch in Relation to Planning. In: Reinke WA, editor. Health Planning for Effective Management. New York: Oxford University Press; 1988. 31-41.
(9) Last JM, Spasoff RA, Harris SS, Thuriaux MC, Anderson JB. A Dictionary of Epidemiology. 4th ed. New York: Oxford University Press; 2001.
(10) Van Oyen H. Belang van gezondheidgegevens voor een gezondheidsbeleid. In: Nijs H, Denekens J, editors. Preventieve Gezondheidszorg.Verslagboek. Diegem Editorial: Kluwer; 1997. 74-82.
(11) Gonnella JS, Louis DZ, Zeleznik C, Turner BJ. The problem of late hospitalization: a quality and cost issue. Acad Med 1990; 65(5):314-319.
(12) Asch SM, Sloss EM, Hogan C, Brook RH, Kravitz RL. Measuring underuse of necessary care among elderly Medicare beneficiaries using inpatient and outpatient claims. JAMA 2000; 284(18):2325-2333.
Literatuur 332
(13) Cochrane AL. L'inflation médicale. Réflexions sur l'efficacité de la médicine. Paris: Galilée; 1977.
(14) Mercenier P. Santé Publique. Notes de cours. Antwerpen: CIPS, ITG; 1976.
(15) Roos NP, Black C, Roos LL, Frohlich N, DeCoster C, Mustard C et al. Managing health services: how the Population Health Information System (POPULIS) works for policymakers. Med Care 1999; 37(6 Suppl):JS27-JS41.
(16) WHO. Health for all targets: the health policy for Europe. 4, 199-215. 1991. Geneva, WHO. European Health for All Series.
(17) Anonymous. Estimation of the incidence of acute myocardial infarction using record linkage: a feasibility study in Nova Scotia and Saskatchewan. Nova Scotia-Saskatchewan Cardiovascular Disease Epidemiology Group. Can J Public Health 1989; 80(6):412-417.
(18) Cotter JJ, Smith WR, Rossiter LF, Pugh CB, Bramble JD. Combining state administrative databases and provider records to assess the quality of care for children enrolled in Medicaid. Am J Med Qual 1999; 14(2):98-104.
(19) Haas JS, Brandenburg JA, Udvarhelyi IS, Epstein AM. Creating a comprehensive database to evaluate health coverage for pregnant women: the completeness and validity of a computerized linkage algorithm. Med Care 1994; 32(10):1053-1057.
(20) Aelvoet W. Mortaliteitsstatistieken voor een gezondheidsbeleid. In: Nijs H, Denekens J, editors. Preventieve Gezondheidszorg. Diegem Editorial: Kluwer; 1997. 914-921.
(21) Aelvoet W, Mertens I, van Sprundel M. Uitwendige oorzaken in de Minimale Klinische Gegevens. 2002. Brussel, FOD Volksgezondheid, Veiligheid van de Voedselketen en Leefmilieu.
(22) Aelvoet W, Bogaert J, Gillet P, Molenberghs G. Bepaling van de invloed van sociale factoren en van het individueke ziekenhuis op de verblijfsduur in de sector van de acute ziekenhuizen, aan de hand van de gekoppelde MKG- en MFG-1996. 2001. Brussel, Ministerie van Sociale Zaken, Volksgezondheid en Leefmilieu.
(23) Chatfield C. Problem Solving. A Statistician's Guide. 2nd ed. London: Chapman&Hall; 1995.
(24) Van Oyen H, Moens G. Conceptueel kader van een gezondheidsinformatiesysteem. In: Nijs H, Denekens J, editors. Preventieve Gezondheidszorg. Diegem Editorial: Kluwer; 1997. 881-895.
Literatuur
333
(25) Baert E, Byttebier G, De Backer G, Van Oyen H, Aelvoet W, De Henauw S. Ontwikkeling van geïntegreerde gezondheidsindicatoren op basis van bestaande Vlaamse gegevens in zake ziekte en gezondheid. PBO/UG/43, 1-98. 2001. Gent, RUG.
(26) Vandenbroeck H, Van Loon H. Evaluatie van bestaande pathologieregistraties. Onderzoek Milieu & Gezondheid. 2000. Brussel, Ministerie van de Vlaamse Gemeenschap.
(27) WHO. International Classification of Diseases.1975 Revision. Ninth Revision. ed. Geneva.: World Health Organisation.; 1977.
(28) Roos NP, Black C, Roos LL, Frohlich N, DeCoster C, Mustard C et al. Managing health services: how administrative data and population- based analyses can focus the agenda. Health Serv Manage Res 1998; 11(1):49-67.
(29) MacMahon B, Pugh TF. Sources of Data. In: MacMahon B, Pugh TF, editors. Epidemiology: Principles and Methods. Boston: Little, Brown and Company; 1970. 73-102.
(30) MacMahon B, Trichopoulos D. Epidemiology. Principles and Methods. New York: Little, Brown and Company; 1996.
(31) Rothman KJ, Greenland S. Modern Epidemiology. Second ed. Philadelphia: Lippincott Williams & Wilkins; 1998.
(32) Van de Sande S, De Wachter D, Swartenbroeckx N, Peers J, Debruyne H, Moldenaers I et al. Inventaris van databanken gezondheidszorg. KCE reports vol.30A, 1-135. 2006.
(33) Aelvoet W, Bogaerts K, Capet F. Gezondheidsindicatoren 1994. Brussel: Ministerie van de Vlaamse Gemeenschap; 1996.
(34) Aelvoet W, Bogaerts K, Capet F, Quataert PK. Gezondheidsindicatoren 1995. Brussel: Ministerie van de Vlaamse Gemeenschap; 1997.
(35) Mackenbach JP. Mortality and medical care:studies of mortality by cause of death in the Netherlands and other European countries. Rotterdam, Erasmus Universiteit; 1988.
(36) Aelvoet W. Vital Statistics in Flanders. An Exploration of Possible Biases due to Coding and Certification Practices. Limburgs Universitair Centrum; 1994.
(37) AHRQ Quality Indicators - Guide to Inpatient Quality Indicators: Quality of Care in Hospitals - Volume, Mortality, and Utilization. Revision 4 ed. Rockvile, MD: Agency for Healthcare Research and Quality; 2004.
Literatuur 334
(38) Hosmer DW, Lemeshow S. Applied Logistic Regression. 2nd ed. New York: John Wiley & Sons, INC.; 2000.
(39) Grundy F, Reinke WA. Recherche en Organisation Sanitaire et Techniques de Managemenet. [No 51]. 1973. Genève, Organisation Mondiale de la Santé. Cahiers de Santé Publique.
(40) Charlton JR, Hartley RM, Silver R, Holland WW. Geographical variation in mortality from conditions amenable to medical intervention in England and Wales. Lancet 1983; 1(8326 Pt 1):691-696.
(41) Weissman J, Epstein AM. Case mix and resource utilization by uninsured hospital patients in the Boston metropolitan area. JAMA 1989; 261(24):3572-3576.
(42) Ayanian JZ, Weissman JS, Schneider EC, Ginsburg JA, Zaslavsky AM. Unmet health needs of uninsured adults in the United States. JAMA 2000; 284(16):2061-2069.
(43) Closon MC, Maes N, Duchaine A, Bellemans M, Gilbert P, Van Hee W. Impact des facteurs sociaux sur la durée de séjour et les coûts dans les hôpitaux. Bruxelles, CIES: 1998.
(44) Peeters RF, Van der Veen F. De perinatale en zuigelingensterfte van ethnische minderheden in België/Vlaanderen. 1989. Antwerpen, UA ESOC.
(45) Alexander S. Crosscultural aspects of risks in pregnancy. Ph D Thesis. ULB; 1995.
(46) Bollini P, Siem H. No real progress towards equity: health of migrants and ethnic minorities on the eve of the year 2000. Soc Sci Med 1995; 41(6):819-828.
(47) Aelvoet W, Vanoverloop J, Molenberghs G, Buekens P, Timmerman C, De Muynck A. Loop je in Vlaanderen, als je een baby van een Turkse moeder bent, een groter risico op kindersterfte? In: Aelvoet W, Capet F, Vanoverloop J, editors. Gezondheisindicatoren 1996. Brussel: Ministerie van de Vlaamse Gemeenschap; 1998. 105-107.
(48) Hadley J, Steinberg EP, Feder J. Comparison of uninsured and privately insured hospital patients. Condition on admission, resource use, and outcome. JAMA 1991; 265(3):374-379.
Literatuur
335
(49) Ancona C, Agabiti N, Forastiere F, Arca M, Fusco D, Ferro S et al. Coronary artery bypass graft surgery: socioeconomic inequalities in access and in 30 day mortality. A population-based study in Rome, Italy. J Epidemiol Community Health 2000; 54(12):930-935.
(50) Franks P, Clancy CM, Gold MR. Health insurance and mortality. Evidence from a national cohort. JAMA 1993; 270(6):737-741.
(51) Closon MC, Azoury E, Duchaine A, Caes T, Bellemans M. Impact des facteurs sociaux sur la durée de séjour dans les hôpitaux. 1997. Bruxelles, CIES.
(52) Epstein AM, Stern RS, Tognetti J, Begg CB, Hartley RM, Cumella E et al. The association of patients' socioeconomic characteristics with the length of hospital stay and hospital charges within diagnosis- related groups. N Engl J Med 1988; 318(24):1579-1585.
(53) Epstein AM, Stern RS, Weissman JS. Do the poor cost more? A multihospital study of patients' socioeconomic status and use of hospital resources. N Engl J Med 1990; 322(16):1122-1128.
(54) Miller MG, Miller LS, Fireman B, Black SB. Variation in practice for discretionary admissions. Impact on estimates of quality of hospital care. JAMA 1994; 271(19):1493-1498.
(55) Rose G. The Strategy of Preventive Medicine. New York: Oxford University Press; 1992.
(56) McMahon B, Pugh TF. Sources of Data. In: McMahon B, Pugh TF, editors. Epidemiology: Principles and Methods. Boston: Little, Brown and Company; 1970. 73-85.
(57) Billings J. Using Administrative Data To Monitor Access, Identify Disparities, and Assess Performance of the Safety Net. 2003. http://www.ahrq.gov/data/safetynet/billings.htm.
(58) Research Methods Server in the Division of Social Sciences. SoLaSSGCU. Sources & Uses of Secondary Data. http://oassis.gcal.ac.uk/rms/crml/ crml.html.
(59) Data and Information Services Center UoW-M. An Introduction to Using Data at DPLS. 2003. http://www.disc.wisc.edu/types/indextxt.html, acceeded 280107.
Literatuur 336
(60) Colin C, Ecochard R, Delahaye F, Landrivon G, Messy P, Morgon E et al. Data quality in a DRG-based information system. Int J Qual Health Care 1994; 6(3):275-280.
(61) Garnick DW, Hendricks AM, Comstock CB. Measuring quality of care: fundamental information from administrative datasets. Int J Qual Health Care 1994; 6(2):163-177.
(62) Buehler JW. Surveillance. In: Rothman KJ, Greenland S, editors. Modern Epidemiology. Second ed. Philadelphia: Lippincott Williams & Wilkins; 1998. 435-457.
(63) Kantor J, Margolis DJ. The accuracy of using a wound care specialty clinic database to study diabetic neuropathic foot ulcers. Wound Repair Regen 2000; 8(3):169-173.
(64) Coady SA, Sorlie PD, Cooper LS, Folsom AR, Rosamond WD, Conwill DE. Validation of death certificate diagnosis for coronary heart disease: the Atherosclerosis Risk in Communities (ARIC) Study. J Clin Epidemiol 2001; 54(1):40-50.
(65) Inoue M, Tajima K, Tominaga S, Sugiura T, Inuzuka K. Evaluation of the death certificate follow-up method for the analysis of survival rate: data from Aichi Prefecture, Japan. Jpn J Clin Oncol 1998; 28(1):30-35.
(66) Messite J, Stellman SD. Accuracy of death certificate completion: the need for formalized physician training. JAMA 1996; 275(10):794-796.
(67) McMahon B, Pugh TF. Concepts of Cause. In: McMahon B, Pugh TF, editors. Epidemiology: Principles and Methods. Boston: Little, Brown and Company; 1970. 17-27.
(68) Hill AB. Standardised Death-rates and Indices. In: Hill AB, editor. A Short Textbook of Medical Statistics. London: Hodder and Stoughton; 1977. 181-198.
(69) Shapiro MF, Park RE, Keesey J, Brook RH. The effect of alternative case-mix adjustments on mortality differences between municipal and voluntary hospitals in New York City. Health Serv Res 1994; 29(1):95-112.
(70) WHO. World Health Report 2000. Health Systems: Improving Performance. 1-206. 2000. Geneva, WHO.
(71) OECD. Measuring Up. Immproving Health System Performance In OECD Countries. http://www1.oecd.org/publications/e-book/8102011E.PDF: OECD; 2002.
Literatuur
337
(72) Delnoij DMJ, ten Asbroek AHA, Arah OA, Custers T, Klazinga NS. Bakens zetten. Naar een Nederlands raamwerk voor de gezondheidszorg. 1-44. 2002. http://www.ggzbeleid.nl/pdfstelsel/vws_bakenszetten.pdf, Ministerie van Volksgezondheid, Welzijn en Sport.
(73) Perrin EB, Koshell JJ. Assessment of Performance Measures for Public Health, Substance Abuse, and Mental Health. 1-160. 1997. Washington,DC, National Academy Press.
(74) Ansari MZ, Ackland MJ, Jolley DJ, Carson N, McDonald IG. Inter-hospital comparison of mortality rates. Int J Qual Health Care 1999; 11(1):29-35.
(75) Thomas JW, Holloway JJ, Guire KE. Validating risk-adjusted mortality as an indicator for quality of care. Inquiry 1993; 30(1):6-22.
(76) Marshall EC, Spiegelhalter D. Institutional Performance. In: Leyland AH, Goldstein H, editors. Multilevel Modelling of Health Statistics. Chichester: John Wiley & Sons, LTD; 2001. 127-142.
(77) Davies SM, Geppert J, McClellan M. Refinement of the HCUP Quality Indicators. Technical Review Number 4 (Prepared by UCSF-Stanford Evidence-based Practice Center under Contract No. 209-97-0013). No.01-0035. 2001. Rockville,MD, Agency for Healthcare Research and Quality.
(78) Hobbs FD, Parle JV, Kenkre JE. Accuracy of routinely collected clinical data on acute medical admissions to one hospital. Br J Gen Pract 1997; 47(420):439-440.
(79) Every NR, Frederick PD, Robinson M, Sugarman J, Bowlby L, Barron HV. A comparison of the national registry of myocardial infarction 2 with the cooperative cardiovascular project. J Am Coll Cardiol 1999; 33(7):1886-1894.
(80) Malenka DJ, McLerran D, Roos N, Fisher ES, Wennberg JE. Using administrative data to describe casemix: a comparison with the medical record. J Clin Epidemiol 1994; 47(9):1027-1032.
(81) Gabriel SE, Amadio PC, Ilstrup D. The feasibility and validity of studies comparing orthopedists and non-orthopedists caring for musculoskeletal injuries: results of a pilot study. Arthritis Care Res 1997; 10(3):163-168.
(82) Meyer GS, Krakauer H. Validity of the Department of Defense Standard Inpatient Data Record for quality management and health services research. Mil Med 1998; 163(7):461-465.
Literatuur 338
(83) Simborg DW. DRG creep: a new hospital-acquired disease. N Engl J Med 1981; 304(26):1602-1604.
(84) Weissman JS, Gatsonis C, Epstein AM. Rates of avoidable hospitalization by insurance status in Massachusetts and Maryland. JAMA 1992; 268(17):2388-2394.
(85) Casanova C, Starfield B. Hospitalizations of children and access to primary care: a cross- national comparison. Int J Health Serv 1995; 25(2):283-294.
(86) Pappas G, Hadden WC, Kozak LJ, Fisher GF. Potentially avoidable hospitalizations: inequalities in rates between US socioeconomic groups. Am J Public Health 1997; 87(5):811-816.
(87) Jackson G, Tobias M. Potentially avoidable hospitalisations in New Zealand, 1989-98. Aust N Z J Public Health 2001; 25(3):212-221.
(88) Bindman AB, Grumbach K, Osmond D, Komaromy M, Vranizan K, Lurie N et al. Preventable hospitalizations and access to health care. JAMA 1995; 274(4):305-311.
(89) Begley CE, Slater CH, Engel MJ, Reynolds TF. Avoidable hospitalizations and socio-economic status in Galveston County, Texas. J Community Health 1994; 19(5):377-387.
(90) Djojonegoro BM, Aday LA, Williams AF, Ford CE. Area income as a predictor of preventable hospitalizations in the Harris County Hospital District, Houston. Tex Med 2000; 96(1):58-62.
(91) Parchman ML, Culler S. Primary care physicians and avoidable hospitalizations. J Fam Pract 1994; 39(2):123-128.
(92) Kozak LJ, Hall MJ, Owings MF. Trends in avoidable hospitalizations, 1980-1998. Health Aff (Millwood) 2001; 20(2):225-232.
(93) Glance LG, Dick AW, Osler TM, Mukamel DB. Accuracy of hospital report cards based on administrative data. Health Serv Res 2006; 41(4 Pt 1):1413-1437.
(94) Pilpel D, Fraser GM, Kosecoff J, Brook RH. Validation of a centrally maintained computerized hospital database: comparison with operating room logbooks. Isr J Med Sci 1993; 29(5):287-291.
(95) Fisher ES, Whaley FS, Krushat WM, Malenka DJ, Fleming C, Baron JA et al. The accuracy of Medicare's hospital claims data: progress has been made, but problems remain. Am J Public Health 1992; 82(2):243-248.
(96) Smith CJ, Scott SM, Wagner BM. The necessary role of the autopsy in cardiovascular epidemiology. Hum Pathol 1998; 29(12):1469-1479.
Literatuur
339
(97) Burnand B, Feinstein AR. The role of diagnostic inconsistency in changing rates of occurrence for coronary heart disease. J Clin Epidemiol 1992; 45(9):929-940.
(98) Stehbens WE. The quality of epidemiological data in coronary heart disease and atherosclerosis. J Clin Epidemiol 1993; 46(12):1337-1346.
(99) Kesteloot H, Joossens JV. The quality of epidemiological data on coronary heart disease. J Clin Epidemiol 1995; 48(2):293-295.
(100) Mark DH. Race and the limits of administrative data. JAMA 2001; 285(3):337-338.
(101) Dubois RW, Rogers WH, Moxley JH, Draper D, Brook RH. Hospital inpatient mortality. Is it a predictor of quality? N Engl J Med 1987; 317(26):1674-1680.
(102) Jencks SF, Daley J, Draper D, Thomas N, Lenhart G, Walker J. Interpreting hospital mortality data. The role of clinical risk adjustment. JAMA 1988; 260(24):3611-3616.
(103) Kahn KL, Brook RH, Draper D, Keeler EB, Rubenstein LV, Rogers WH et al. Interpreting hospital mortality data. How can we proceed? JAMA 1988; 260(24):3625-3628.
(104) Shahian DM, Normand SL. The volume-outcome relationship: from Luft to Leapfrog. Ann Thorac Surg 2003; 75(3):1048-1058.
(105) Green J, Wintfeld N, Sharkey P, Passman LJ. The importance of severity of illness in assessing hospital mortality. JAMA 1990; 263(2):241-246.
(106) Merriam-Webster. Medical Dictionary. http://www.intelihealth.com/IH/ihtIH/: Meriam-Webster.; 2002.
(107) U.S.Department of Labour. Occupational Outlook Handbook. 2002-03. ed. http://www.bls.gov/oco/print/ocos103.htm: U.S. Department of Labour. Bureau of Labor Statistics.; 2002.
(108) McGuire MR. Automation of thePatient Medical Record:Steps Toward a Universal Patient Record. 2000. http://www.uprforum.com/Promises.htm.
(109) Holt G, Feurer ID, Schwartz HS. An analysis of concordance among hospital databases and physician records. Ann Surg Oncol 1998; 5(6):553-556.
(110) Wyatt JC, Liu JL. Basic concepts in medical informatics. J Epidemiol Community Health 2002; 56(11):808-812.
Literatuur 340
(111) Freedman AM, Gay GA, Brockert JE, Potrzebowski PW, Rothwell CJ. The 1989 revisions of the US Standard Certificates of Live Birth and Death and the US Standard Report of Fetal Death. Am J Public Health 1989; 78(2):168-172.
(112) Petersen LA, Wright S, Normand SL, Daley J. Positive predictive value of the diagnosis of acute myocardial infarction in an administrative database. J Gen Intern Med 1999; 14(9):555-558.
(113) Rosamond WD, Chambless LE, Sorlie PD, Bell EM, Weitzman S, Smith JC et al. Trends in the sensitivity, positive predictive value, false-positive rate, and comparability ratio of hospital discharge diagnosis codes for acute myocardial infarction in four US communities, 1987-2000. Am J Epidemiol 2004; 160(12):1137-1146.
(114) Kennedy GT, Stern MP, Crawford MH. Miscoding of hospital discharges as acute myocardial infarction: implications for surveillance programs aimed at elucidating trends in coronary artery disease. Am J Cardiol 1984; 53(8):1000-1002.
(115) Campbell SE, Campbell MK, Grimshaw JM, Walker AE. A systematic review of discharge coding accuracy. J Public Health Med 2001; 23(3):205-211.
(116) Fleege JC, van Diest PJ, Baak JP. Quality control methods for data entry in pathology using a computerized data management system based on an extended data dictionary. Hum Pathol 1992; 23(2):91-97.
(117) Armitage P, Berry G. Statistical Methods in Medical Research. Third ed. Oxford: Blackwell Science Ltd.; 1994.
(118) Everitt BS. The Cambridge Dictionary of Statistics in the Medical Sciences. Cambridge: University Press; 1995.
(119) Hoaglin DC, Mosteller F, Tukey JW. Exploring Data Tables, Trends and Shapes. New York: John Wiley & Sons; 1985.
(120) Aelvoet W, Humblet PC, Lagasse R. Het in routine gebruikmaken van een geïnformatiseerd controleprogramma als middel tot kwaliteitsbewaking van de statistieken van de burgerlijke stand in Vlaanderen. Arch Public Health 1991; 49:1-17.
(121) Greenland S, Rothman KJ. Fundamentals of Epidemiologic Data Analysis. In: Rothman KJ, Greenland S, editors. Modern Epidemiology. Second ed. Philadelphia: Lippincott Williams & Wilkins; 1998. 201-229.
(122) Pavillon G, Coleman M, Johansson LA, Jougla E, Kardaun J. Coding of Causes of Death in European Community. OS/E3/98/COD/3, 1-180. 1998. Luxembourg, Eurostat.
Literatuur
341
(123) Stellman SD. The case of the missing eights. An object lesson in data quality assurance. Am J Epidemiol 1989; 129(4):857-860.
(124) Molenberghs G, Burzykowski T, Michiels B, Kenward MG. Analysis of incomplete public health data. Rev Epidemiol Sante Publique 1999; 47(6):499-514.
(125) Capet F, Bogaerts K, Aelvoet W. Verwerking Registratiegegevens van het Medisch Schooltoezicht. Lengte en gewicht. 4-5. 1996. Brussel, Ministerie van de Vlaamse Gemeenschap.
(126) Bravo G, Potvin L. Estimating the reliability of continuous measures with Cronbach's alpha or the intraclass correlation coefficient: toward the integration of two traditions. J Clin Epidemiol 1991; 44(4-5):381-390.
(127) Booth JL, Collopy BT. A national clinical indicator database: issues of reliability and validity. Aust Health Rev 1997; 20(4):84-95.
(128) Kleinbaum DG, Kupper LL, Morgenstern H. Validity: General Considerations. In: Kleinbaum DG, Kupper LL, Morgenstern H, editors. Epidemiologic Research.Principles and Quantitative Methods. New York: Van Nostrand Reinhold; 1982. 183-193.
(129) Tennis P, Bombardier C, Malcolm E, Downey W. Validity of rheumatoid arthritis diagnoses listed in the Saskatchewan Hospital Separations Database. J Clin Epidemiol 1993; 46(7):675-683.
(130) WHO. International Classification of Diseases. Tenth Revision. Geneva: World Health Organisation.; 1992.
(131) McKee M. Routine data: a resource for clinical audit? Qual Health Care 1993; 2(2):104-111.
(132) Human, social and economic costs due to non-fatal motor vehicle traffic accidents. An approach based on routinely collected data. [ 2003.
(133) Aelvoet W, Windey F, Molenberghs G, Verstraelen H, Van Reempts P, Foidart JM. Screening for inter-hospital differences in cesarean section rates in low-risk deliveries using administrative data. An initiative to improve the quality of care. BMC Health Services Research 2008;8(1);3.
(134) Haelterman G, Capet F. Kankerregistratie in Vlaanderen. In: Aelvoet W, Bogaerts K, Capet F, Quataert PK, editors. Gezondheidsindicatoren 1995. Brussel: Ministerie van de Vlaamse Gemeenschap; 1997.
(135) Gollub EL, Trino R, Salmon M, Moore L, Dean JL, Davidson BL. Co-occurrence of AIDS and tuberculosis: results of a database "match" and investigation. J Acquir Immune Defic Syndr Hum Retrovirol 1997; 16(1):44-49.
Literatuur 342
(136) Berlowitz DR, Brand HK, Perkins C. Geriatric syndromes as outcome measures of hospital care: can administrative data be used? J Am Geriatr Soc 1999; 47(6):692-696.
(137) Berrino F, Gatta G, Chessa E, Valente F, Capocaccia R. Introduction: the EUROCARE II Study. Eur J Cancer 1998; 34(14 Spec No):2139-2153.
(138) Crabbe T, Donmall M, Millar T. Validation of the University of Manchester Drug Misuse Database. J Epidemiol Community Health 1999; 53(3):159-164.
(139) Hunt JP, Baker CC, Fakhry SM, Rutledge RR, Ransohoff D, Meyer AA. Accuracy of administrative data in trauma. Surgery 1999; 126(2):191-197.
(140) Hsia DC, Ahern CA, Ritchie BP, Moscoe LM, Krushat WM. Medicare reimbursement accuracy under the prospective payment system, 1985 to 1988. JAMA 1992; 268(7):896-899.
(141) Cattaruzzi C, Troncon MG, Agostinis L, Garcia Rodriguez LA. Positive predictive value of ICD-9th codes for upper gastrointestinal bleeding and perforation in the Sistema Informativo Sanitario Regionale database. J Clin Epidemiol 1999; 52(6):499-502.
(142) Cassidy LD, Marsh GM, Holleran MK, Ruhl LS. Methodology to improve data quality from chart review in the managed care setting. Am J Manag Care 2002; 8(9):787-793.
(143) Margo CE. A pilot study in ophthalmology of inter-rater reliability in classifying diagnostic errors: an underinvestigated area of medical error. Qual Saf Health Care 2003; 12(6):416-420.
(144) Korteweg FJ, Gordijn SJ, Timmer A, Erwich JJ, Bergman KA, Bouman K et al. The Tulip classification of perinatal mortality: introduction and multidisciplinary inter-rater agreement. BJOG 2006; 113(4):393-401.
(145) O'donnell CP, Kamlin CO, Davis PG, Carlin JB, Morley CJ. Interobserver variability of the 5-minute Apgar score. J Pediatr 2006; 149(4):486-489.
(146) Hofer TP, Asch SM, Hayward RA, Rubenstein LV, Hogan MM, Adams J et al. Profiling quality of care: Is there a role for peer review? BMC Health Serv Res 2004; 4(1):9.
(147) Lok CE, Morgan CD, Ranganathan N. The accuracy and interobserver agreement in detecting the 'gallop sounds' by cardiac auscultation. Chest 1998; 114(5):1283-1288.
Literatuur
343
(148) Scheel AK, Schmidt WA, Hermann KG, Bruyn GA, D'Agostino MA, Grassi W et al. Interobserver reliability of rheumatologists performing musculoskeletal ultrasonography: results from a EULAR "Train the trainers" course. Ann Rheum Dis 2005; 64(7):1043-1049.
(149) Shibata A, Longacre TA, Puligandla B, Parsonnet J, Habel LA. Histological classification of gastric adenocarcinoma for epidemiological research: concordance between pathologists. Cancer Epidemiol Biomarkers Prev 2001; 10(1):75-78.
(150) Cleary R, Beard RW, Coles J, Devlin HB, Hopkins A, Roberts S et al. The quality of routinely collected maternity data. BJOG 1994; 101(12):1042-1047.
(151) Kuhn K, Gaus W, Wechsler JG, Janowitz P, Tudyka J, Kratzer W et al. Structured reporting of medical findings: evaluation of a system in gastroenterology. Methods Inf Med 1992; 31(4):268-274.
(152) Audet AM, Scott HD. The Uniform Clinical Data Set: an evaluation of the proposed national database for Medicare's quality review program. Ann Intern Med 1993; 119(12):1209-1213.
(153) Gjorup T. The kappa coefficient and the prevalence of a diagnosis. Methods Inf Med 1988; 27(4):184-186.
(154) May SM. Modelling observer agreement--an alternative to kappa. J Clin Epidemiol 1994; 47(11):1315-1324.
(155) Fleiss JL. Statistical Methods for Rates and Proportions. 2nd ed. New York: John Wiley; 1981.
(156) Agresti A. Categorical Data Analysis. New York: John Wiley &Sons.; 1990.
(157) SAS Institute Inc. The FREQ Procedure. SAS/STAT User's Guide, Version 8. Cary NC: Sas Institue Inc.; 1999. 1247-1362.
(158) Weiss NS. Diagnostic and Screening Tests:Measuring Their Ability to Predict Adverse Outcomes of Illness. In: Weiss NS, editor. Clinical Epidemiology:the Study of the Outcome of Illness. New York: Oxford University Press; 1996. 9-46.
(159) Coggon D, Rose G, Barker DJP. Epidemiology for the Uninitiated. Forth ed. http://bmj.com/collections/epidem/epid.shtml: BMJ; 1997.
(160) Rose G, Barker DJP. Epidemiology for the Uninitiated. BMJ; 1986.
(161) Luck J, Peabody JW. Using standardised patients to measure physicians' practice: validation study using audio recordings. BMJ 2002; 325(7366):679.
Literatuur 344
(162) Peabody JW, Luck J, Glassman P, Dresselhaus TR, Lee M. Comparison of vignettes, standardized patients, and chart abstraction: a prospective validation study of 3 methods for measuring quality. JAMA 2000; 283(13):1715-1722.
(163) Grover FL, Hammermeister KE, Shroyer AL. Quality initiatives and the power of the database: what they are and how they run. Ann Thorac Surg 1995; 60(5):1514-1521.
(164) Kahn KL, Rubenstein LV, Sherwood MJ, Brook RH. Structured implicit interview for physician implicit measurement of quality of care: development of the form and guidelines for its use. N-3016-HCFA. 1989. http://www.rand.org/publications/N/N3016/, The RAND Corporation.
(165) De Henauw S, de Smet P, Aelvoet W, Kornitzer M, De Backer G. Misclassification of coronary heart disease in mortality statistics. Evidence from the WHO-MONICA Ghent-Charleroi Study in Belgium. J Epidemiol Community Health 1998; 52(8):513-519.
(166) Nieto FJ. Cardiovascular disease and risk factor epidemiology: a look back at the epidemic of the 20th century. Am J Public Health 1999; 89(3):292-294.
(167) Tunstall-Pedoe H, Kuulasmaa K, Amouyel P, Arveiler D, Rajakangas AM, Pajak A. Myocardial infarction and coronary deaths in the World Health Organization MONICA Project. Registration procedures, event rates, and case-fatality rates in 38 populations from 21 countries in four continents. Circulation 1994; 90(1):583-612.
(168) Porta M, Marrugat J, Perez G. Trends in cardiovascular mortality and the quality of vital statistics. J Clin Epidemiol 1997; 50(2):221-222.
(169) Wolff N, Helminiak TW. Nonsampling measurement error in administrative data: implications for economic evaluations. Health Econ 1996; 5(6):501-512.
(170) Biller J, Feinberg WM, Castaldo JE, Whittemore AD, Harbaugh RE, Dempsey RJ et al. Guidelines for carotid endarterectomy: a statement for healthcare professionals from a Special Writing Group of the Stroke Council, American Heart Association. Circulation 1998; 97(5):501-509.
(171) Chaturvedi S, Halliday A. Concerns regarding carotid endarterectomy guidelines. Stroke 1998; 29(7):1475-1476.
(172) Rothwell PM, Eliasziw M, Gutnikov SA, Fox AJ, Taylor DW, Mayberg MR et al. Analysis of pooled data from the randomised controlled trials of endarterectomy for symptomatic carotid stenosis. Lancet 2003; 361(9352):107-116.
(173) Rothwell PM, Eliasziw M. Stenosis and carotid endarterectomy. Lancet 2003; 361(9369):1656.
Literatuur
345
(174) Russell DA, McPherson S, Gough MJ. Stenosis and carotid endarterectomy. Lancet 2003; 361(9369):1655.
(175) Robless P, Bicknell C, Chataway J, Cheshire N, Wolfe J. Stenosis and carotid endarterectomy. Lancet 2003; 361(9369):1655.
(176) Roberts SE, Goldacre MJ. Time trends and demography of mortality after fractured neck of femur in an English population, 1968-98: database study. BMJ 2003; 327(7418):771-775.
(177) Iezzoni LI, Davis RB, Palmer RH, Cahalane M, Hamel MB, Mukamal K et al. Does the Complications Screening Program flag cases with process of care problems? Using explicit criteria to judge processes. Int J Qual Health Care 1999; 11(2):107-118.
(178) Mant J, Hicks N. Detecting differences in quality of care: the sensitivity of measures of process and outcome in treating acute myocardial infarction. BMJ 1995; 311(7008):793-796.
(179) To err is human: building a safer health system. Kohn LT, Corrigan JM, Donaldson MS, editors. 1-312. 2000. Washington DC, National Academy Press.
(180) Powell AE, Davies HT, Thomson RG. Using routine comparative data to assess the quality of health care: understanding and avoiding common pitfalls. Qual Saf Health Care 2003; 12(2):122-128.
(181) Rubin HR, Pronovost P, Diette GB. From a process of care to a measure: the development and testing of a quality indicator. Int J Qual Health Care 2001; 13(6):489-496.
(182) Schwartz RM, Gagnon DE, Muri JH, Zhao QR, Kellogg R. Administrative data for quality improvement. Pediatrics 1999; 103(1 Suppl E):291-301.
(183) Goldacre MJ, Griffith M, Gill L, Mackintosh A. In-hospital deaths as fraction of all deaths within 30 days of hospital admission for surgery: analysis of routine statistics. BMJ 2002; 324(7345):1069-1070.
(184) Roberts SE, Goldacre MJ. Case fatality rates after admission to hospital with stroke: linked database study. BMJ 2003; 326(7382):193-194.
(185) Goldacre MJ. Cause-specific mortality: understanding uncertain tips of the disease iceberg. J Epidemiol Community Health 1993; 47(6):491-496.
(186) Shwartz M, Iezzoni LI, Ash AS, Mackiernan YD. Do severity measures explain differences in length of hospital stay? The case of hip fracture. Health Serv Res 1996; 31(4):365-385.
Literatuur 346
(187) Iezzoni LI, Ash AS, Shwartz M, Landon BE, Mackiernan YD. Predicting in-hospital deaths from coronary artery bypass graft surgery. Do different severity measures give different predictions? Med Care 1998; 36(1):28-39.
(188) Iezzoni LI. The risks of risk adjustment. JAMA 1997; 278(19):1600-1607.
(189) Iezzoni LI, Ash AS, Shwartz M, Daley J, Hughes JS, Mackiernan YD. Predicting who dies depends on how severity is measured: implications for evaluating patient outcomes. Ann Intern Med 1995; 123(10):763-770.
(190) Iezzoni LI. How much are we willing to pay for information about quality? Ann Intern Med 1997; 126(5):391-393.
(191) Green J, Wintfeld N. Report cards on cardiac surgeons. Assessing New York State's approach. N Engl J Med 1995; 332(18):1229-1232.
(192) Sowden AJ, Deeks JJ, Sheldon TA. Volume and outcome in coronary artery bypass graft surgery: true association or artefact? BMJ 1995; 311(6998):151-155.
(193) Spiegelhalter DJ. Mortality and volume of cases in paediatric cardiac surgery: retrospective study based on routinely collected data. BMJ 2002; 324(7332):261-263.
(194) ICD-9-CM International Classification of Diseases, 9th Revision, Clinical Modification. Sixth Edition 2005 ed. 2004.
(195) Averill RF, Goldfield N, Steinbeck BA, Grant T, Muldoon J, Brough AJ et al. All Patient Refined Diagnosis Related Groups (APR-DRGs). Version 15.0. 98-054 Rev. 00, 1-34. 1998. Wallingford, CT, 3M Health Information Systems.
(196) Romano PS, Chan BK. Risk-adjusting acute myocardial infarction mortality: are APR- DRGs the right tool? Health Serv Res 2000; 34(7):1469-1489.
(197) Aelvoet W. On the use of administrative databases to support planning activities: a comment. Eur J Public Health 2005; 15(2):215.
(198) Glance LG, Dick AW, Osler TM, Mukamel DB. Does date stamping ICD-9-CM codes increase the value of clinical information in administrative data? Health Serv Res 2006; 41(1):231-251.
(199) Froom P, Shimoni Z. Prediction of hospital mortality rates by admission laboratory tests. Clin Chem 2006; 52(2):325-328.
(200) Bindman AB, Bennett A. Date stamping: will it withstand the test of time? Health Serv Res 2006; 41(4 Pt 1):1438-1443.
Literatuur
347
(201) Legrand V, Wijns W, Vandenbranden F, Benit B, Boland J, Claeys M et al. Recommendations for Percutaneous Coronary Intervention in Belgium. 1-24. 2003. Belgian Working Group on Invasive Cardiology.
(202) Hertoghe L, De Wals P, Piron M, Bertrand F, Lechat MF. Quality of perinatal death registration. A study in Hainaut, Belgium. Eur J Pediatr 1987; 146(5):473-476.
(203) Keirse MJ. Perinatal mortality rates do not contain what they purport to contain. Lancet 1984; 1(8387):1166-1169.
(204) Derom R, Vlietinck R. Beschikbaarheid van perinatale gegvens met het oog op een preventief gezondheidsbeleid. In: Nijs H, Denekens J, editors. Preventieve Gezondheidszorg. Diegem Editorial: Kluwer; 1997. 930-941.
(205) Hansell AL, Walk JA, Soriano JB. What do chronic obstructive pulmonary disease patients die from? A multiple cause coding analysis. Eur Respir J 2003; 22(5):809-814.
(206) Westendorp RG. Dwalingen in de methodologie. VI. Doodsoorzaken in perspectief. [Roaming through methodology. VI. Medical perspective on the causes of death]. Ned Tijdschr Geneeskd 1998; 142(35):1950-1953.
(207) Friedman GD. Primer of Epidemiology. New York: McGraw-Hill Book Company; 1980.
(208) Moolgavkar SH, Lee JAH, Stevens RG. Analysis of Vital Statistics Data. In: Rothman KJ, Greenland S, editors. Modern Epidemiology. Second ed. Philadelphia: Lippincott Williams & Wilkins; 1998. 481-497.
(209) Anonymous. Death certification in asthma. Lancet 1984; 2(8404):676.
(210) Lenfant C, Friedman L, Thom T. Fifty years of death certificates: the Framingham Heart Study. Ann Intern Med 1998; 129(12):1066-1067.
(211) Farebrother MJ, Kelson MC, Heller RF. Death certification of farmer's lung and chronic airway diseases in different countries of the EEC. Br J Dis Chest 1985; 79(4):352-360.
(212) Lu TH, Shau WY, Shih TP, Lee MC, Chou MC, Lin CK. Factors associated with errors in death certificate completion. A national study in Taiwan. J Clin Epidemiol 2001; 54(3):232-238.
(213) Berrill WT. Trends in asthma mortality. Death certification in asthma is inaccurate. BMJ 1997; 315(7114):1013.
(214) Goldacre MJ, Roberts SE, Griffith M. Multiple-cause coding of death from myocardial infarction: population-based study of trends in death certificate data. J Public Health Med 2003; 25(1):69-71.
Literatuur 348
(215) Israel RA, Rosenberg HM, Curtin LR. Analytical potential for multiple cause-of-death data. Am J Epidemiol 1986; 124(2):161-179.
(216) Fries JF. Aging, natural death, and the compression of morbidity. N Engl J Med 1980; 303(3):130-135.
(217) Ayeni O, Banoub SN, Denton CF, Grimley-Evans J, Gore MS, Kalache A et al. Applications de l'épidémiologie à l'étude du vieilissement. Rapport d'un Groupe scientifique de l'OMS à l'étude du viellissement. 706, 1-93. 1984. Genève, OMS. Rapports techniques.
(218) Epstein AM. Volume and outcome--it is time to move ahead. N Engl J Med 2002; 346(15):1161-1164.
(219) Dorn HF, Moriyama IM. Uses and significance of multiple cause tabulations for mortality statistics. Am J Public Health 1964; 54:400-406.
(220) Steenland K, Nowlin S, Ryan B, Adams S. Use of multiple-cause mortality data in epidemiologic analyses: US rate and proportion files developed by the National Institute for Occupational Safety and Health and the National Cancer Institute. Am J Epidemiol 1992; 136(7):855-862.
(221) Mackenbach JP. Secundaire doodsoorzaken. Tijdschrift voor Sociale Gezondheidszorg 1987; 65:524-528.
(222) Mackenbach JP, Kunst AE, Lautenbach H, Bijlsma F, Oei YB. Competing causes of death: an analysis using multiple-cause-of- death data from The Netherlands. Am J Epidemiol 1995; 141(5):466-475.
(223) Mackenbach JP, Kunst AE, Lautenbach H, Oei YB, Bijlsma F. Competing causes of death: a death certificate study. J Clin Epidemiol 1997; 50(10):1069-1077.
(224) Dorn HF. Underlying and Contributory Causes of Death. Natl Cancer Inst Monogr 1966; 19:421-430.
(225) Guralnick L. Some Problems in the Use of Multiple Causes of Death. J Chronic Dis 1966; 19:979-990.
(226) An Alternative Procedure for Classifying and Analizing Mortality Data. LIEGE: International Union for the Scientific Study of Populations; 1973.
(227) Schadé E, Ijzermans CJ. Hoe informeert de huisarts het Centraal Bureau Statistiek over de doodsoorzaak? Tijdschrift voor Sociale Gezondheidszorg 1987; 65(3):74-78.
Literatuur
349
(228) Crews DE, Stamler J, Dyer A. Conditions other than underlying cause of death listed on death certificates provide additional useful information for epidemiologic research. Epidemiology 1991; 2(4):271-275.
(229) Anderson RN, Minino AM, Hoyert DL, Rosenberg HM. Comparability of cause of death between ICD-9 and ICD-10: preliminary estimates. Natl Cancer Inst Monogr 2001; 49(2):1-32.
(230) Llorca J, Delgado-Rodriguez M. Competing risks analysis using Markov chains: impact of cerebrovascular and ischaemic heart disease in cancer mortality. Int J Epidemiol 2001; 30(1):99-101.
(231) WHO. Definitions and Recommandations. In: WHO, editor. International Classification of Diseases. 1975 Revision. 9th Revision. ed. WHO; 1977. 763-768.
(232) WHO. Medical Certification and Rules for Classification. In: WHO, editor. International Classification of Diseases. 1975 Revision. 9th Revision. ed. WHO; 1977. 697-741.
(233) WHO. Rules and guidelines for mortality and morbidity coding. In: WHO, editor. International Statistical Classification of Diseases and Related Health Problems. Tenth Revision. 10th Revision. ed. Geneva: WHO; 1993. 30-123.
(234) Anderson RN, Rosenberg HM. Disease classification: measuring the effect of the Tenth Revision of the International Classification of Diseases on cause- of-death data in the United States. Stat Med 2003; 22(9):1551-1570.
(235) Jougla E, Papoz L, Balkau B, Maguin P, Hatton F. Death certificate coding practices related to diabetes in European countries--the 'EURODIAB Subarea C' Study. Int J Epidemiol 1992; 21(2):343-351.
(236) New approaches to Coding and Analyzing Mortality Data. American Statistical Association; 1972.
(237) Lu TH. Using ACME (Automatic Classification of Medical Entry) software to monitor and improve the quality of cause of death statistics. J Epidemiol Community Health 2003; 57(6):470-471.
(238) Kelson MC, Heller RF. The effect of death certification and coding practices on observed differences in respiratory disease mortality in 8 E.E.C. countries. Rev Epidemiol Sante Publique 1983; 31(4):423-432.
(239) Kelson M, Farebrother M. The effect of inaccuracies in death certification and coding practices in the European Economic Community (EEC) on international cancer mortality statistics. Int J Epidemiol 1987; 16(3):411-414.
Literatuur 350
(240) Heller RF, Kelson MC. Respiratory disease Mortality in Agricultural workers in eight member countries of the European community. Int J Epidemiol 1982; 11(2):170-174.
(241) Percy C, Dolman A. Comparison of the coding of death certificates related to cancer in seven countries. Public Health Rep 1978; 93(4):335-350.
(242) An assessment of the contribution of differences in coding and certification practices to reported levels of avoidable deaths in the European Community. EC Workshop on Health Services on Avoidable Mortality; 1988.
(243) Kircher T, Nelson J, Burdo H. The autopsy as a measure of accuracy of the death certificate. N Engl J Med 1985; 313(20):1263-1269.
(244) Gittelsohn A, Senning J. Studies on the reliability of vital and health records: I. Comparison of cause of death and hospital record diagnoses. Am J Public Health 1979; 69(7):680-689.
(245) Percy C, Stanek E, Gloeckler L. Accuracy of cancer death certificates and its effect on cancer mortality statistics. Am J Public Health 1981; 71(3):242-250.
(246) Feinleib M, editor. Causes of Death Among the Elderly.Information From the Death Certificate. Hyattsville,MD: NCHS; 1991.
(247) Chio A, Magnani C, Oddenino E, Tolardo G, Schiffer D. Accuracy of death certificate diagnosis of amyotrophic lateral sclerosis. J Epidemiol Community Health 1992; 46(5):517-518.
(248) Flanders WD. Inaccuracies of death certificate information. Epidemiology 1992; 3(1):3-5.
(249) Lloyd-Jones DM, Martin DO, Larson MG, Levy D. Accuracy of death certificates for coding coronary heart disease as the cause of death. Ann Intern Med 1998; 129(12):1020-1026.
(250) Lozano R, Murray CJL, Lopez AD, Satoh T. Miscoding and misclassification of ischaemic heart disease mortality. Working Paper No.12, 1-19. 2001. World Health Organisation. Global Programme on Evidence for Health Policy.
(251) Iribarren C, Crow RS, Hannan PJ, Jacobs DR, Luepker RV. Validation of death certificate diagnosis of out-of-hospital sudden cardiac death. Am J Cardiol 1998; 82(1):50-53.
(252) Ederer F, Geisser MS, Mongin SJ, Church TR, Mandel JS. Colorectal cancer deaths as determined by expert committee and from death certificate: a comparison. The Minnesota Study. J Clin Epidemiol 1999; 52(5):447-452.
Literatuur
351
(253) Goldacre MJ, Roberts SE, Yeates D. Mortality after admission to hospital with fractured neck of femur: database study. BMJ 2002; 325(7369):868-869.
(254) Klazinga NS, Stronks K, Delnoij DMJ, Verhoeff A. Indicators without a cause. Reflections on the development and use of indicators in health care from a public health perspective. Int J Qual Health Care 2001; 13(6):433-438.
(255) Gittelsohn A, Powe NR. Small area variations in health care delivery in Maryland. Health Serv Res 1995; 30(2):295-317.
(256) Lubetkin EI, Sofaer S, Gold MR, Berger ML, Murray JF, Teutsch SM. Aligning quality for populations and patients: do we know which way to go? Am J Public Health 2003; 93(3):406-411.
(257) Donabedian A. The quality of care. How can it be assessed? JAMA 1988; 260(12):1743-1748.
(258) Weingart SN, Iezzoni LI, Davis RB, Palmer RH, Cahalane M, Hamel MB et al. Use of administrative data to find substandard care: validation of the complications screening program. Med Care 2000; 38(8):796-806.
(259) Lohr KN, Schroeder SA. A strategy for quality assurance in Medicare. N Engl J Med 1990; 322(10):707-712.
(260) AHRQ. NHQR Preliminary Measure Set. Establish conceptual framework. 2003. http://www.ahcpr.gov/qual/measurix.htm.
(261) Quaethoven P. Over klinische performantie-indicatoren. Acta Hospitalia 2003;(1):87-106.
(262) Public Health Development Unit. Quality and performance in the NHS:Clinical Indicators. 1-90. 1999. http://www.doh.gov.uk/nhsci.pdf, NHS.
(263) Campbell SM, Braspenning J, Hutchinson A, Marshall MN. Research methods used in developing and applying quality indicators in primary care. BMJ 2003; 326(7393):816-819.
(264) Arah OA, Klazinga NS, Delnoij DM, ten Asbroek AH, Custers T. Conceptual frameworks for health systems performance: a quest for effectiveness, quality, and improvement. Int J Qual Health Care 2003; 15(5):377-398.
(265) Donabedian A. The seven Pillars of Quality. Arch Pathol Lab Med 1990; 114:1115-1118.
(266) Brook RH. Managed care is not the problem, quality is. JAMA 1997; 278(19):1612-1614.
Literatuur 352
(267) Veillard J, Champagne F, Klazinga N, Kazandjian V, Arah OA, Guisset AL. A performance assessment framework for hospitals: the WHO regional office for Europe PATH project. Int J Qual Health Care 2005; 17(6):487-496.
(268) AHRQ. 2005 National Healthcare Quality Report. 06-0018, 1-95. 2005. Rockville, MD.
(269) Pringle M, Wilson T, Grol R. Measuring "goodness" in individuals and healthcare systems. BMJ 2002; 325(7366):704-707.
(270) Fiscella K, Franks P, Gold MR, Clancy CM. Inequality in quality: addressing socioeconomic, racial, and ethnic disparities in health care. JAMA 2000; 283(19):2579-2584.
(271) Shine KI. Health care quality and how to achieve it. Acad Med 2002; 77(1):91-99.
(272) Chassin MR, Galvin RW, National Roundtable on Heath Care Quality. The Urgent Need to Improve Health Care Quality. JAMA 1998; 280(11):1000-1005.
(273) Weiss KB, Wagner R. Performance measurement through audit, feedback, and profiling as tools for improving clinical care. Chest 2000; 118(2 Suppl):53S-58S.
(274) Topol EJ, Califf RM. Scorecard and Cardiovascular Medicine Its Impact and Future Directions. Ann Intern Med 1994; 120(1):65-70.
(275) Localio AR, Hamory BH, Fisher AC, TenHave TR. The Public Release of Hospital and Physician Mortality Data in Pennsylvania A Case Study. Med Care 1997; 35(3):272-286.
(276) Quality of care. Council on Medical Service. JAMA 1986; 256(8):1032-1034.
(277) Jencks SF, Cuerdon T, Burwen DR, Fleming B, Houck PM, Kussmaul AE et al. Quality of medical care delivered to Medicare beneficiaries: A profile at state and national levels. JAMA 2000; 284(13):1670-1676.
(278) Health Care Systems in Transition. Belgium 2000. 1-85. 2000. Copenhagen, European Observatory on Health Car Systems.
(279) Hayward RA, Hofer TP. Estimating hospital deaths due to medical errors: preventability is in the eye of the reviewer. JAMA 2001; 286(4):415-420.
(280) McGlynn EA, Asch SM, Adams J, Keesey J, Hicks J, DeCristofaro A et al. The quality of health care delivered to adults in the United States. N Engl J Med 2003; 348(26):2635-2645.
Literatuur
353
(281) Meyer GS. Building the bridge across the quality chasm. Bulletin of th world Health Organization 2003; 81(5):313.
(282) McLoughlin V, Leatherman S, Fletcher M, Owen JW. Improving performance using indicators. Recent experiences in the United States, the United Kingdom, and Australia. Int J Qual Health Care 2001; 13(6):455-462.
(283) Wu AW. The measure and mismeasure of hospital quality: appropriate risk- adjustment methods in comparing hospitals. Ann Intern Med 1995; 122(2):149-150.
(284) Richardson WC, Berwick DM, Bisgard JC, Bristow LR, Buck CR, Cassel CK et al. The Institute of Medicine Report on Medical Errors: misunderstanding can do harm. Quality of Health Care in America Committee. MedGenMed 2000; 2(3):E42.
(285) Fihn SD. The quest to quantify quality. JAMA 2000; 283(13):1740-1742.
(286) Leyland AH, Boddy FA. League tables and acute myocardial infarction. Lancet 1998; 351(9102):555-558.
(287) Giuffrida A, Gravelle H, Roland M. Measuring quality of care with routine data: avoiding confusion between performance indicators and health outcomes. BMJ 1999; 319(7202):94-98.
(288) Cleary PD, Edgman-Levitan S. Health care quality. Incorporating consumer perspectives. JAMA 1997; 278(19):1608-1612.
(289) Califf RM, Jollis JG, Peterson ED. Operator-Specific Outcomes A Call to Professional Responsibility. Circulation 1996; 93:403-406.
(290) Zhan C, Miller MR. Administrative data based patient safety research: a critical review. Qual Saf Health Care 2003; 12 Suppl 2:ii58-ii63.
(291) Arah OA, Klazinga NS. How safe is the safety paradigm? Qual Saf Health Care 2004; 13(3):226-232.
(292) Bates DW, Evans RS, Murff H, Stetson PD, Pizziferri L, Hripcsak G. Detecting adverse events using information technology. J Am Med Inform Assoc 2003; 10(2):115-128.
(293) Begrippenkader Patientveiligheid. 2005. http://www.onderzoekpatientveiligheid.nl/begrippenkader.htm
(294) Hammermeister KE, Shroyer AL, Sethi GK, Grover FL. Why it is important to demonstrate linkages between outcomes of care and processes and structures of care. Med Care 1995; 33(10 Suppl):OS5-O16.
Literatuur 354
(295) Mainz J. Defining and classifying clinical indicators for quality improvement. Int J Qual Health Care 2003; 15(6):523-530.
(296) Kuttner R. The risk-adjustment debate. N Engl J Med 1998; 339(26):1952-1956.
(297) Brook RH, McGlynn EA, Cleary PD. Quality of health care. Part 2: measuring quality of care. N Engl J Med 1996; 335(13):966-970.
(298) Tu JV, Cameron C. Impact of an acute myocardial infarction report card in Ontario, Canada. Int J Qual Health Care 2003; 15(2):131-137.
(299) Palmer RH. Using health outcomes data to compare plans, networks and providers. Int J Qual Health Care 1998; 10(6):477-483.
(300) Rubin HR, Pronovost P, Diette GB. The advantages and disadvantages of process-based measures of health care quality. Int J Qual Health Care 2001; 13(6):469-474.
(301) Jollis JG, Romano PS. Pennsylvania's Focus on Heart Attack--grading the scorecard. N Engl J Med 1998; 338(14):983-987.
(302) Begg CB, Cramer LD, Hoskins WJ, Brennan MF. Impact of hospital volume on operative mortality for major cancer surgery. JAMA 1998; 280(20):1747-1751.
(303) Hannan EL, Siu AL, Kumar D, Kilburn H, Chassin MR. The decline in coronary artery bypass graft surgery mortality in New York State. The role of surgeon volume. JAMA 1995; 273(3):209-213.
(304) Dudley RA, Johansen KL, Brand R, Rennie DJ, Milstein A. Selective referral to high-volume hospitals: estimating potentially avoidable deaths. JAMA 2000; 283(9):1159-1166.
(305) Wennberg DE, Lucas FL, Birkmeyer JD, Bredenberg CE, Fisher ES. Variation in carotid endarterectomy mortality in the Medicare population: trial hospitals, volume, and patient characteristics. JAMA 1998; 279(16):1278-1281.
(306) Luft HS, Hunt SS, Maerki SC. The volume-outcome relationship: practice-makes-perfect or selective-referral patterns? Health Serv Res 1987; 22(2):157-182.
(307) Hannan EL, Racz M, Ryan TJ, McCallister BD, Johnson LW, Arani DT et al. Coronary angioplasty volume-outcome relationships for hospitals and cardiologists. JAMA 1997; 277(11):892-898.
(308) Cebul RD, Snow RJ, Pine R, Hertzer NR, Norris DG. Indications, outcomes, and provider volumes for carotid endarterectomy. JAMA 1998; 279(16):1282-1287.
Literatuur
355
(309) Luft HS, Garnick DW, Mark DH, Peltzman DJ, Phibbs CS, Lichtenberg E et al. Does quality influence choice of hospital? JAMA 1990; 263(21):2899-2906.
(310) Birkmeyer JD, Siewers AE, Finlayson EV, Stukel TA, Lucas FL, Batista I et al. Hospital volume and surgical mortality in the United States. N Engl J Med 2002; 346(15):1128-1137.
(311) Begg CB, Riedel ER, Bach PB, Kattan MW, Schrag D, Warren JL et al. Variations in morbidity after radical prostatectomy. N Engl J Med 2002; 346(15):1138-1144.
(312) Halm EA, Chassin MR. Appendix C. How is volume related to quality in health care? A systematic review of the research literature. In: Hewitt M, editor. Interpreting the Volume-Outcome Relationship in the Context of Health care Quality: Workshop Summary. Washington,DC: National Academy Press; 2000. 27-102.
(313) Localio AR, Hamory BH, Sharp TJ, Weaver SL, TenHave TR, Landis JR. Comparing hospital mortality in adult patients with pneumonia. A case study of statistical methods in a managed care program. Ann Intern Med 1995; 122(2):125-132.
(314) Showstack JA, Rosenfeld KE, Garnick DW, Luft HS, Schaffarzick RW, Fowles J. Association of volume with outcome of coronary artery bypass graft surgery. Scheduled vs nonscheduled operations. JAMA 1987; 257(6):785-789.
(315) Pennsylvania Health Care Cost Containment Council. Focus on Heart Attack in Southeastern Pennsylvania. A 1993 Summary Report for Health Benefits Purchasers, Health Care Providers, Policy-makers and Consumers. 1-75. 1996. http://www.phc4.org/adobe/h_se.pdf.
(316) Orchard C. Comparing healthcare outcomes. BMJ 1994; 308(6942):1493-1496.
(317) Jarman B, Gault S, Alves B, Hider A, Dolan S, Cook A et al. Explaining differences in English hospital death rates using routinely collected data. BMJ 1999; 318(7197):1515-1520.
(318) Stark J, Gallivan S, Lovegrove J, Hamilton JR, Monro JL, Pollock JC et al. Mortality rates after surgery for congenital heart defects in children and surgeons' performance. Lancet 2000; 355(9208):1004-1007.
(319) Park RE, Brook RH, Kosecoff J, Keesey J, Rubenstein L, Keeler E et al. Explaining variations in hospital death rates. Randomness, severity of illness, quality of care. JAMA 1990; 264(4):484-490.
(320) Interpreting the Volume-Outcome Relationship in the Context of Health Care Quality: Workshop Summary. Washington,DC: National Academy Press; 2000.
Literatuur 356
(321) Goldfarb MG, Coffey RM. Change in the Medicare case-mix index in the 1980s and the effect of the prospective payment system. Health Serv Res 1992; 27(3):385-415.
(322) Majeed A, Bindman AB, Weiner JP. Use of risk adjustment in setting budgets and measuring performance in primary care II: advantages, disadvantages, and practicalities. BMJ 2001; 323(7313):607-610.
(323) Greenfield S, Aronow HU, Elashoff RM, Watanabe D. Flaws in mortality data. The hazards of ignoring comorbid disease. JAMA 1988; 260(15):2253-2255.
(324) Elixhauser A, Steiner C, Harris DR, Coffey RM. Comorbidity measures for use with administrative data. Med Care 1998; 36(1):8-27.
(325) D'Hoore W, Sicotte C, Tilquin C. Risk adjustment in outcome assessment: the Charlson comorbidity index. Methods Inf Med 1993; 32(5):382-387.
(326) D'Hoore W, Bouckaert A, Tilquin C. Practical considerations on the use of the Charlson comorbidity index with administrative data bases. J Clin Epidemiol 1996; 49(12):1429-1433.
(327) Stukenborg GJ, Wagner DP, Connors_ AF. Comparison of the performance of two comorbidity measures, with and without information from prior hospitalizations. Med Care 2001; 39(7):727-739.
(328) Cleary R, Beard R, Coles J, Devlin B, Hopkins A, Schumacher D et al. Comparative hospital databases: value for management and quality. Qual Health Care 1994; 3(1):3-10.
(329) Hofer TP, Hayward RA, Greenfield S, Wagner EH, Kaplan SH, Manning WG. The unreliability of individual physician "report cards" for assessing the costs and quality of care of a chronic disease. JAMA 1999; 281(22):2098-2105.
(330) Luft HS, Bunker JP, Enthoven AC. Should operations be regionalized? The empirical relation between surgical volume and mortality. N Engl J Med 1979; 301(25):1364-1369.
(331) Hartz AJ, Krakauer H, Kuhn EM, Young M, Jacobsen SJ, Gay G et al. Hospital characteristics and mortality rates. N Engl J Med 1989; 321(25):1720-1725.
(332) Mozes B, Easterling MJ, Sheiner LB, Melmon KL, Kline R, Goldman ES et al. Case-mix adjustment using objective measures of severity: the case for laboratory data. Health Serv Res 1994; 28(6):689-712.
(333) Pine M, Norusis M, Jones B, Rosenthal GE. Predictions of hospital mortality rates: a comparison of data sources. Ann Intern Med 1997; 126(5):347-354.
Literatuur
357
(334) Welton JM, Halloran EJ. A comparison of nursing and medical diagnoses in predicting hospital outcomes. Proc AMIA Symp 1999;171-175.
(335) Long LE, Mann R. Casemix: challenges for nursing care. Med J Aust 1998; 169 Suppl:S44-S45.
(336) Hsia DC, Krushat WM, Fagan AB, Tebbutt JA, Kusserow RP. Accuracy of diagnostic coding for Medicare patients under the prospective-payment system. N Engl J Med 1988; 318(6):352-355.
(337) Stern RS, Epstein AM. Institutional responses to prospective payment based on diagnosis-related groups. Implications for cost, quality, and access. N Engl J Med 1985; 312(10):621-627.
(338) Lungen M, Lauterbach KW. [Upcoding--a risk for the use of diagnosis-related groups]. Dtsch Med Wochenschr 2000; 125(28-29):852-856.
(339) Carr-Hill RA, Jamison JQ, O Reilly D, Stevenson MR, Reid J, Merriman B. Risk adjustment for hospital use using social security data: cross sectional small area analysis. BMJ 2002; 324(7334):390.
(340) Elliott MN, Swartz R, Adams J, Spritzer KL, Hays RD. Case-mix adjustment of the National CAHPS benchmarking data 1.0: a violation of model assumptions? Health Serv Res 2001; 36(3):555-573.
(341) Steyerberg EW, Harrell FEJr. Statistical Models for Prognostication. Development of Regression Models. In: Max MB, Lynn J, editors. Interactive Textbook of Symptom Research. Bethesda MD: National Institute of Dental Research, Department of Health and Human Services.http://symptomresearch.nih.gov; 2003. 1-12.
(342) DeLong ER, Peterson ED, DeLong DM, Muhlbaier LH, Hackett S, Mark DB. Comparing Risk-Adjustment Methods for Provider Profiling. Stat Med 1997; 16:2645-2664.
(343) Iezzoni LI, Ash AS, Shwartz M, Daley J, Hughes JS, Mackiernan YD. Judging hospitals by severity-adjusted mortality rates: the influence of the severity-adjustment method. Am J Public Health 1996; 86(10):1379-1387.
(344) Schneider EC, Epstein AM. Influence of cardiac-surgery performance reports on referral practices and access to care. A survey of cardiovascular specialists. N Engl J Med 1996; 335(4):251-256.
(345) Mainz J. Developing evidence-based clinical indicators: a state of the art methods primer. Int J Qual Health Care 2003; 15 Suppl 1:i5-11.
Literatuur 358
(346) Caminal J, Starfield B, Sanchez E, Casanova C, Morales M. The role of primary care in preventing ambulatory care sensitive conditions. Eur J Public Health 2004; 14(3):246-251.
(347) Smeets PM, Verheggen FW, Pop P, Panis LJ, Carpay JJ. Assessing the necessity of hospital stay by means of the appropriateness evaluation protocol: how strong is the evidence to proceed? Int J Qual Health Care 2000; 12(6):483-493.
(348) Hofer TP, Kerr EA, Hayward RA. What is an error? Eff Clin Pract 2000; 3(6):261-269.
(349) Hofer TP, Asch SM, Hayward RA, Rubenstein LV, Adams J, Kerr EA. Profiling quality of care: Is there a role for peer review? BMC Health Services Research 2004; 4(1):9.
(350) Brennan TA, Leape LL, Laird NM, Hebert L, Localio AR, Lawthers AG et al. Incidence of adverse events and negligence in hospitalized patients. Results of the Harvard Medical Practice Study I. N Engl J Med 1991; 324(6):370-376.
(351) Wilson RM, Harrison BT, Gibberd RW, Hamilton JD. An analysis of the causes of adverse events from the Quality in Australian Health Care Study. Med J Aust 1999; 170(9):411-415.
(352) Leape LL. Institute of Medicine medical error figures are not exaggerated. JAMA 2000; 284(1):95-97.
(353) Hannan EL, O'Donnell JF, Kilburn H, Bernard HR, Yazici A. Investigation of the relationship between volume and mortality for surgical procedures performed in New York State hospitals. JAMA 1989; 262(4):503-510.
(354) Chassin MR, Hannan EL, DeBuono BA. Benefits and hazards of reporting medical outcomes publicly. N Engl J Med 1996; 334(6):394-398.
(355) Halm EA, Lee C, Chassin MR. Is volume related to outcome in health care? A systematic review and methodologic critique of the literature. Ann Intern Med 2002; 137(6):511-520.
(356) Urbach DR, Bell CM, Austin PC. Differences in operative mortality between high- and low-volume hospitals in Ontario for 5 major surgical procedures: estimating the number of lives potentially saved through regionalization. CMAJ 2003; 168(11):1409-1414.
(357) Urbach DR, Baxter NN. Does it matter what a hospital is "high volume" for? Specificity of hospital volume-outcome associations for surgical procedures: analysis of administrative data. BMJ 2004; 328(7442):737-740.
(358) Sibbald B. Move to close low-volume surgical sites gaining speed. CMAJ 2002; 167(2):177.
Literatuur
359
(359) Shroyer AL, Marshall G, Warner BA, Johnson RR, Guo W, Grover FL et al. No continuous relationship between Veterans Affairs hospital coronary artery bypass grafting surgical volume and operative mortality. Ann Thorac Surg 1996; 61(1):17-20.
(360) Tucker J. Patient volume, staffing, and workload in relation to risk- adjusted outcomes in a random stratified sample of UK neonatal intensive care units: a prospective evaluation. Lancet 2002; 359(9301):99-107.
(361) Benavente O, Moher D, Pham B. Carotid endarterectomy for asymptomatic carotid stenosis: a meta- analysis. BMJ 1998; 317(7171):1477-1480.
(362) Warlow C. Carotid endarterectomy for asymptomatic carotid stenosis. Better data, but the case is still not convincing. BMJ 1998; 317(7171):1468.
(363) Barnett HJ, Meldrum HE, Eliasziw M. The appropriate use of carotid endarterectomy. CMAJ 2002; 166(9):1169-1179.
(364) Wennberg DE. Variation in the delivery of health care: the stakes are high. Ann Intern Med 1998; 128(10):866-868.
(365) Pekoz EA, Shwartz M, Iezzoni LI, Ash AS, Posner MA, Restuccia JD. Comparing the importance of disease rate versus practice style variations in explaining differences in small area hospitalization rates for two respiratory conditions. Stat Med 2003; 22(10):1775-1786.
(366) Jencks SF, Williams DK, Kay TL. Assessing hospital-associated deaths from discharge data. The role of length of stay and comorbidities. JAMA 1988; 260(15):2240-2246.
(367) Rosenthal GE, Baker DW, Norris DG, Way LE, Harper DL, Snow RJ. Relationships between in-hospital and 30-day standardized hospital mortality: implications for profiling hospitals. Health Serv Res 2000; 34(7):1449-1468.
(368) Taylor B. Common bile duct injury during laparoscopic cholecystectomy in Ontario: does ICD-9 coding indicate true incidence? CMAJ 1998; 158(4):481-485.
(369) Chang A, Schyve PM, Croteau RJ, O'Leary DS, Loeb JM. The JCAHO patient safety event taxonomy: a standardized terminology and classification schema for near misses and adverse events. Int J Qual Health Care 2005; 17(2):95-105.
(370) Walshe K. Adverse events in health care: issues in measurement. Qual Health Care 2000; 9:47-52.
(371) Michel P, Quenon JL, de_Sarasqueta AM, Scemama O. Comparison of three methods for estimating rates of adverse events and rates of preventable adverse events in acute care hospitals. BMJ 2004; 328(7433):199.
Literatuur 360
(372) Leape LL, Brennan TA, Laird N, Lawthers AG, Localio AR, Barnes BA et al. The nature of adverse events in hospitalized patients. Results of the Harvard Medical Practice Study II. N Engl J Med 1991; 324(6):377-384.
(373) Thomas EJ, Brennan TA. Incidence and types of preventable adverse events in elderly patients: population based review of medical records. BMJ 2000; 320(7237):741-744.
(374) Sox_Jr HC, Woloshin S. How many deaths are due to medical error? Getting the number right. Eff Clin Pract 2004; 3(6):277-283.
(375) McDonald CJ, Weiner M, Hui SL. Deaths due to medical errors are exaggerated in Institute of Medicine report. JAMA 2000; 284(1):93-95.
(376) Anderson RE. How many deaths are due to medical errors? JAMA 2000; 284(17):2188; author reply 2.
(377) Hayward RA. Counting deaths due to medical errors. JAMA 2002; 288(19):2404-5; author reply 2405.
(378) McDonald CJ, Weiner M, Siu AL. How many deaths are due to medical errors? JAMA 2000; 284(17):2188; author reply 2-2189; author reply 2.
(379) Leape LL. Counting deaths due to medical errors. JAMA 2002; 288(19):2405; author reply 2.
(380) Barach P, Mohr JJ. Preventable deaths from medical errors. JAMA 2001; 286(22):2813-2814.
(381) Hayward RA, Hofer TP. Preventable deaths from medical errors. In reply. JAMA 2001; 286(22):2814.
(382) Hughes CM. How many deaths are due to medical errors? JAMA 2000; 284(17):2187; author reply 2.
(383) Gabel RA. Counting deaths due to medical errors. JAMA 2002; 288(19):2404; author reply 2.
(384) Honig P, Phillips J, Woodcock J. How many deaths are due to medical errors? JAMA 2000; 284(17):2187-8; author reply 2188.
(385) Pierluissi E, Fischer MA, Campbell AR, Landefeld CS. Discussion of medical errors in morbidity and mortality conferences. JAMA 2003; 290(21):2838-2842.
(386) Brennan TA, Hebert LE, Laird NM, Lawthers A, Thorpe KE, Leape LL et al. Hospital characteristics associated with adverse events and substandard care. JAMA 1991; 265(24):3265-3269.
Literatuur
361
(387) Weingart SN, Wilson RM, Gibberd RW, Harrison B. Epidemiology of medical error. BMJ 2000; 320(7237):774-777.
(388) Spear SJ, Schmidhofer M. Ambiguity and workarounds as contributors to medical error. Ann Intern Med 2005; 142(8):627-630.
(389) Romano PS, Geppert JJ, Davies S, Miller MR, Elixhauser A, McDonald KM. A national profile of patient safety in U.S. hospitals. Health Aff (Millwood ) 2003; 22(2):154-166.
(390) Bates DW, Evans RS, Murff H, Stetson PD, Pizziferri L, Hripcsak G. Policy and the future of adverse event detection using information technology. J Am Med Inform Assoc 2003; 10(2):226-228.
(391) Pawlson LG, O'Kane ME. Malpractice prevention, patient safety, and quality of care: a critical linkage. Am J Manag Care 2004; 10(4):281-284.
(392) Shahian DM, Normand SL, Torchiana DF, Lewis SM, Pastore JO, Kuntz RE et al. Cardiac Surgery Report Cards: Comprehensive Review and Statistical Critique. Ann Thorac Surg 2001; 72:2155-2168.
(393) Berwick DM. Public Performance Reports and the Will for Change. JAMA 2002; 288(12):1523-1524.
(394) Adab P, Rouse AM, Mohammed MA, Marshall T. Performance league tables: the NHS deserves better. BMJ 2002; 324(7329):95-98.
(395) Sanderson C, McKee M. Commentary: How robust are rankings? The implications of confidence intervals. BMJ 1998; 316:1705.
(396) Marshall EC, Spiegelhalter DJ. Reliability of league tables of in vitro fertilisation clinics: retrospective analysis of live birth rates. BMJ 1998; 316(7146):1701-4; discussion 1705.
(397) Marshall MN, Shekelle PG, Leatherman S, Brook RH. The public release of performance data: what do we expect to gain? A review of the evidence. JAMA 2000; 283(14):1866-1874.
(398) Hibbard JH, Slovic P, Peters E, Finucane ML. Strategies for reporting health plan performance information to consumers: evidence from controlled studies. Health Serv Res 2002; 37(2):291-313.
(399) Wakefield JC, Best NG, Waller L. Bayesian approaches to disease mapping. In: Elliott P, Wakefield JC, Best NG, Briggs DJ, editors. Spatial Epidemiology: Methods and Applications. Oxford: Oxford University Press; 2000. 104-127.
(400) Marshall MN, Shekelle PG, Leatherman S, Brook RH. The public disclosure of performance data: learning from the US experience. Qual Health Care 2000; 9:53-57.
Literatuur 362
(401) Bronskill SE, Normand SL, Landrum MB, Rosenheck RA. Longitudinal profiles of health care providers. Stat Med 2002;(21):1067-1088.
(402) Schneider EC, Lieberman T. Publicly disclosed information about the quality of health care: response of the US public. Qual Health Care 2001; 10:96-103.
(403) Howley PP, Gibberd R. Using hierarchical models to analyse clinical indicators: a comparison of the gamma-Poisson and beta-binomial models. Int J Qual Health Care 2003; 15(4):319-329.
(404) McCormick D, Himmelstein DU, Woolhandler S, Bor DH, Wolfe SM. Relationship Between Low Quality-of-Care Scores and HMOs' Subsequent Public Disclosure of Quality-of-Care Scores. JAMA 2002; 288(12):1484-1490.
(405) Epstein A. Performance reports on quality--prototypes, problems, and prospects. N Engl J Med 1995; 333(1):57-61.
(406) McCormick D, Himmelstein DU, Woolhandler S, Bor DH, Wolfe SM. Public disclosure of health plan quality of care. JAMA 2003; 289(7):845-847.
(407) McKee M. Indicators of clinical performance. BMJ 1997; 315(7101):142.
(408) Ravaud P, Giraudeau B, Roux PM, Durieux P. [Are mortality indicators acceptable indicators for the quality of health care?]. Presse Med 1999; 28(29):1604-1609.
(409) Naylor CD. Public Profiling of Clinical Performance. JAMA 2002; 287(10):1323-1325.
(410) Peterson ED, DeLong ER, Jollis JG, Muhlbaier LH, Mark DB. The Effects of New York's Bypass Surgery Provider Profiling on Access to Care and Patient Outcomes in the Elderly. J Am Coll Cardiol 1998; 32:993-999.
(411) Kassirer JP. The use and abuse of practice profiles. N Engl J Med 1994; 330(9):634-636.
(412) Jones RH. In Search of the Optimal Surgical Mortality. Circulation 1989; 79(Suppl I):I-132-I-136.
(413) Schokkaert E, Van de Voorde C. Belgium: Risk adjustment and financial responsibility in a centralised system. Health Policy 2003; 65(1):5-19.
(414) Pennsylvania Health Care Cost Containment Council. Focus on Heart Attack in Pennsylvania. Research Methods and Results. 1-36. 1996. http://www.phc4.org/adobe/fhrrm.pdf.
Literatuur
363
(415) Hibbard JH, Jewett JJ, Engelmann S, Tusler M. Can Medicare Beneficiaries Make Informed Choices? Health Aff (Millwood) 1998; 17(6):181-193.
(416) Mannion R, Goddard M. Impact of published clinical outcomes data: case study in NHS hospital trusts. BMJ 2001; 323(7307):260-263.
(417) Ryan TP. Control Charts for Measurements with Subgrouping (for One Variable). In: Ryan TP, editor. Statistical Methods for Quality Improvement. New York: John Wiley & Sons; 2000. 77-132.
(418) Johnson RA, Wichern DW. Applied Multivariate Statistical Analysis. Upper Saddle River, NJ: Prentice Hall; 1998.
(419) Tekkis PP, McCulloch P, Steger AC, Benjamin IS, Poloniecki JD. Mortality control charts for comparing performance of surgical units: validation study using hospital mortality data. BMJ 2003; 326(7393):786-788.
(420) Mohammed MA, Cheng KK, Rouse A, Marshall T. Bristol, Shipman, and clinical governance: Shewhart's forgotten lessons. Lancet 2001; 357(9254):463-467.
(421) Ryan TP. Control Charts for Attributes. In: Ryan TP, editor. Statistical Methods for Quality Improvement. New York: John Wiley & Sons; 2000. 152-185.
(422) Hoey J, Todkill AM, Flegel K. What's in a name? Reporting data from public institutions. CMAJ 2002; 166(2):193-194.
(423) Christiansen CL, Morris CN. Improving the Statistical Approach to Health Care Provider Profiling. Ann Intern Med 1997;(127):764-768.
(424) Brook RH. Appropriateness: the next frontier. BMJ 1994; 308(6923):218-219.
(425) Aylin P, Alves B, Best N, Cook A, Elliott P, Evans SJ et al. Comparison of UK paediatric cardiac surgical performance by analysis of routinely collected data 1984-96: was Bristol an outlier? Lancet 2001; 358(9277):181-187.
(426) Walshe K. Understanding and learning from organisational failure. Qual Saf Health Care 2003; 12:81-82.
(427) Littell RC, Freund RJ, Spector PC. Repeated-Measures Analysis of Variance. SAS® System for Linear Models. Third ed. Cary,NC: SAS® Institute Inc.; 1991. 265-291.
(428) Verbeke G, Molenberghs G. Linear Mixed Models in Practice: A Sas-oriented Approach. New York: Springer-verlag.; 1997.
(429) Molenberghs G, Verbeke G. Generalized Estimating Equations. Longitudinal data analysis. Diepenbeek: Limburgs Universitair Centrum; 2002. 336-363.
Literatuur 364
(430) Burton P, Gurrin L, Sly P. Extending the simple linear regression model to account for correlated responses: an introduction to generalized estimating equations and multi-level mixed modelling. Stat Med 1998; 17(11):1261-1291.
(431) Stokes ME, Davis CS, Koch GG. Generalized Estimating Equations. Categorical Data Analysis Using the SAS System. Second ed. Cary, NC: SAS Institute Inc., 2000. 469-549.
(432) Armitage P, Berry G. Comparison of Several Groups. Statistical Methods in Medical Research. Oxford: 1994. 207-237.
(433) Neter J, Wasserman W, Kutner MH. Single-factor ANOVA Model and Tests. In: Neter J, Wasserman W, Kutner MH, editors. Applied Linear Statistical Models Regression, Analysis of Variance and Experimental Designs. Third ed. Homewood,IL: IRWIN; 1990. 519-567.
(434) Verbeke G, Molenberghs G. Linear Mixed Models for Longitudinal Data. New York: Springer-verlag.; 2000.
(435) Molenberghs G, Verbeke G. Models for Discrete Longitudinal Data. New York: Springer-verlag.; 2005.
(436) Rosenthal R, Rosnow RL. Contrast analysis: Focused comparisons in the analysis of variance. New York: Cambridge University Press; 1985.
(437) Johnson RA, Wichern DW. Inferences about a Mean Vector. Applied Multivariate Statistical Analysis. Upper Saddle River, NJ: Prentice Hall; 1998. 224-289.
(438) Armitage P, Berry G. Multiple Measurements. Statistical Methods in Medical Research. Third ed. Oxford: Blackwell Science Ltd.; 1994. 312-385.
(439) Soudan M. Détection de Valeurs Aberrantes dans les Données Administratives à Variables Multiples Obtenues par Extrapolation, dans le Cadre de la Comptabilité Nationale Belge. CES/AC.68/2002/10, 1-10. 18-2-2002. Genève, Réunion commune CEE/Eurostat/OCDE sur la comptabilité nationale. 18-2-2002.
(440) Friendly M. Multivariate Statistical Methods. SAS System for Statistical Graphics. First ed. SAS Institute Inc., Cary,NC,USA; 1991. 447-498.
(441) Hosmer DW, Lemeshow S. Introduction to the Logistic Regression Model. In: Hosmer DW, Lemeshow S, editors. Applied Logistic Regression. 2nd ed. New York: John Wiley & Sons, INC.; 2000. 1-30.
Literatuur
365
(442) Hosmer DW, Lemeshow S. Interpretation of the Fitted Logistic Regression Model. In: Hosmer DW, Lemeshow S, editors. Applied Logistic Regression. 2nd ed. New York: John Wiley & Sons, INC.; 2000. 47-90.
(443) Collett D. Overdispersion. In: Collett D, editor. Modelling binary data. Boca Raton: Chapman & Hall/CRC; 1991. 188-222.
(444) Allison PD. Logit Analysis of Contingency Tables. In: Allison PD, editor. Logistic Regression Using the SAS System: Theory and Application. Cary, NC: SAS Institute Inc., 1999. 81-110.
(445) SAS Institute Inc. The GLM Procedure. SAS/STAT User's Guide, Version 8. Cary NC: Sas Institue Inc.; 1999. 1465-1636.
(446) SAS Institute Inc. The LOGISITC Procedure. SAS/STAT User's Guide, Version 8. Cary NC: Sas Institue Inc.; 1999. 1901-2042.
(447) SAS Institute Inc. The GENMOD Procedure. SAS/STAT User's Guide, Version 8. Cary NC: Sas Institue Inc.; 1999. 1363-1464.
(448) Breslow NE, Day NE. Unconditional Logistic Regression for Large Strata. Lyon: IARC; 1980. 191-246.
(449) Bland JM, Altman DG. Statistics notes. The odds ratio. BMJ 2000; 320(7247):1468.
(450) Armitage P, Berry G. Sampling. Statistical Methods in Medical Research. Third ed. Oxford: Blackwell Science Ltd.; 1994. 78-92.
(451) Fleiss JL. Inferences about a Single Proportion. Statistical Methods for Rates and Proportions. 2nd ed. New York: John Wiley; 1981. 13-17.
(452) Zaslavsky AM. Statistical issues in reporting quality data: small samples and casemix variation. Int J Qual Health Care 2001; 13(6):481-488.
(453) Clayton D, Hills M. The size of investigations. In: Clayton D, Hills M, editors. Statistical Models in Epidemiology. Oxford: Oxford University Press; 1993. 205-213.
(454) Breslow NE, Day NE. Statistical Methods in Cancer Research. Volume II - The Design and Analysis of Cohort Studies. 1-406. 1987. Lyon, IARC. IARC Scientific Publications No. 82.
(455) Marshall G, Shroyer AL, Grover FL, Hammermeister KE. Time series monitors of outcomes. A new dimension for measuring quality of care. Med Care 1998; 36(3):348-356.
Literatuur 366
(456) Wears RL. Performance charts and multiple comparisons. BMJ 2002; bmj.com/cgi/eletters.
(457) Clement S. Scorecard Medicine -- Measuring Process and Outcome. Ann Intern Med 1994; 120(11):971-972.
(458) Diggle PJ. Overview of statistical methods for disease mapping and its relationship to cluster detection. In: Elliott P, Wakefield JC, Best NG, Briggs DJ, editors. Spatial Epidemiology: Methods and Applications. Oxford: Oxford University Press; 2000. 87-103.
(459) Burgess JF, Christiansen CL, Michalak SE, Morris CN. Medical profiling: improving standards and risk adjustments using hierarchical models. J Health Econ 2000;(19):291-309.
(460) Altman DG, Machin D, Bryant TN, Gardner MJ. Statistics with Confidence. Bristol: BMJ Books; 2000.
(461) Luft HS, Brown BWJr. Calculating the Probability of Rare Events: Why Settle for an Approximation? Health Serv Res 1993; 28(4):419-439.
(462) Bland JM, Altman DG. Statistics Notes: Regression towards the mean. BMJ 1994; 308(6942):1499.
(463) Barnett AG, van der Pols JC, Dobson AJ. Regression to the mean: what it is and how to deal with it. Int J Epidemiol 2005; 34(1):215-220.
(464) Bland JM. Regression towards the mean or Why was Terminator III such a disappointment?1-1-2004.
(465) Morton V, Torgerson DJ. Effect of regression to the mean on decision making in health care. BMJ 2003; 326(7398):1083-1084.
(466) Bland JM, Altman DG. Some examples of regression towards the mean. BMJ 1994; 309(6957):780.
(467) Rice N. Binomial Regression. In: Leyland AH, Goldstein H, editors. Multilevel Modelling of Health Statistics. Chichester: John Wiley & Sons, LTD; 2001. 27-43.
(468) Normand SL, Zou KH. Sample size considerations in observational health care quality studies. Stat Med 2002; 21:331-345.
(469) Drijver M, Melse JM. Ziekteclusters en milieuverontreiniging II Inventarisatie van statistische methoden en achtergronden van clusteronderzoek. T Soc Gezondheidsz 1992; 70:624-630.
Literatuur
367
(470) Savitz DA, Olshan AF. Multiple comparisons and related issues in the interpretation of epidemiologic data. Am J Epidemiol 1995; 142(9):904-908.
(471) Goodman SN. Multiple comparisons, explained. Am J Epidemiol 1998; 147(9):807-12; discussion 815.
(472) Thompson JR. Invited commentary: Re: "Multiple comparisons and related issues in the interpretation of epidemiologic data". Am J Epidemiol 1998; 147(9):801-806.
(473) Rothman KJ. Fundamentals of Epidemiologic Data Analysis. In: Rothman KJ, editor. Modern Epidemiology. Boston: Little, Brown and Company; 1986. 131-151.
(474) Bland JM, Altman DG. Multiple significance tests: the Bonferroni method. BMJ 1995; 310(6973):170.
(475) Perneger TV. What's wrong with Bonferroni adjustments. BMJ 1998; 316(7139):1236-1238.
(476) Bender R, Lange S. Multiple test procedures other than Bonferroni's deserve wider use. BMJ 1999; 318(7183):600-601.
(477) Neter J, Wasserman W, Kutner MH. Applied Linear Statistical Models: Regression, Analysis of Variance, and Experimental Design. Third ed. Homewood, IL: Irwin; 1990.
(478) Anonymous. Address Multiple Comparisons before Starting a Study. June 2002. http://vanbelle.org/rom%5CROM_2002_06.pdf
(479) Levin B. On the Holm, Simes, and Hochberg multiple test procedures. Am J Public Health 1996; 86(5):628-629.
(480) Aickin M, Gensler H. Adjusting for multiple testing when reporting research results: the Bonferroni vs Holm methods. Am J Public Health 1996; 86(5):726-728.
(481) SAS Institute Inc. The MULTTEST Procedure. SAS/STAT User's Guide, Version 8. Cary NC: Sas Institue Inc.; 1999. 2313-2356.
(482) Diggle PJ, Liang K-Y, Zeger SL. Analysis of Longitudinal Data. Oxford: Oxford University Press; 1994.
(483) Hanley JA, Negassa A, Edwardes MD, Forrester JE. Statistical analysis of correlated data using generalized estimating equations: an orientation. Am J Epidemiol 2003; 157(4):364-375.
Literatuur 368
(484) Allison PD. Logit Analysis of Longitudinal and Other Clustered Data. In: Allison PD, editor. Logistic Regression Using the SAS System: Theory and Application. Cary, NC: SAS Institute Inc., 1999. 179-216.
(485) Kiefe CI, Weissman NW, Allison JJ, Farmer R, Weaver M, Williams OD. Identifying achievable benchmarks of care: concepts and methodology. Int J Qual Health Care 1998; 10(5):443-447.
(486) Zhang J, Yu KF. What's the relative risk? A method of correcting the odds ratio in cohort studies of common outcomes. JAMA 1998; 280(19):1690-1691.
(487) Altman DG. Why We Need Confidence Intervals. World J Surg 2005.
(488) Altman D, Bland JM. Confidence intervals illuminate absence of evidence. BMJ 2004; 328(7446):1016-1017.
(489) Greenhalgh T. How to read a paper. Statistics for the non-statistician. II: "Significant" relations and their pitfalls. BMJ 1997; 315(7105):422-425.
(490) Orav EJ. Statistical presentation. Int J Qual Health Care 2001; 13(2):151-153.
(491) Armitage P, Berry G. Further Analysis of Categorical Data. Statistical Methods in Medical Research. Third ed. Oxford: Blackwell Science Ltd.; 1994. 402-447.
(492) Hosmer DW, Lemeshow S. Multiple Logistic Regression. In: Hosmer DW, Lemeshow S, editors. Applied Logistic Regression. 2nd ed. New York: John Wiley & Sons, INC.; 2000. 31-46.
(493) D'Hoore W. Mise en oeuvre de l'évaluation de la qualité des soins par l'approche des résultats - Application à une banque de résumés d'hospitalisations - [ UCL ESP Département des Sciences Hospitalières et Médicales; 1993.
(494) Krumholz HM, Rathore SS, Chen J, Wang Y, Radford MJ. Evaluation of a consumer-oriented internet health care report card: the risk of quality ratings based on mortality data. JAMA 2002; 287(10):1277-1287.
(495) Liang BA. A system of medical error disclosure. Qual Saf Health Care 2002; 11(1):64-68.
(496) Reason J. Human error: models and management. BMJ 2000; 320(7237):768-770.
(497) Hart E, Hazelgrove J. Understanding the organisational context for adverse events in the health services: the role of cultural censorship. Qual Health Care 2001; 10(4):257-262.
Literatuur
369
(498) Walshe K, Offen N. A very public failure: lessons for quality improvement in healthcare organisations from the Bristol Royal Infirmary. Qual Health Care 2001; 10(4):250-256.
(499) Aelvoet W, Cloots H, Fortuin M, Hooft P, Vanoverloop J. Gezondheidsindicatoren 1998. Brussel: Ministerie van de Vlaamse Gemeenschap; 2000.
(500) Aelvoet W, Molenberghs G, van Sprundel M. Mortality Statistics in Belgium 1980-1997: Quality of coding. Arch Public Health 2005; 63(2):127-148.
(501) Aelvoet W. Gezondheidsindicatoren 1993. Brussel: Ministerie van de Vlaamse Gemeenschap; 1995.
(502) Aelvoet W, Capet F, Vanoverloop J. Gezondheidsindicatoren 1996. Brussel: Ministerie van de Vlaamse Gemeenschap; 1998.
(503) Aelvoet W, Fortuin M, Hooft P, Vanoverloop J. Gezondheidsindicatoren 1997. Brussel: Ministerie van de Vlaamse Gemeenschap; 1999.
(504) Aelvoet W. Mortinataliteit en zuigelingensterfte. In: Van Der Haeghe H, editor. Over sterfte. Brussel: CBGS; 1991. 69-80.
(505) Aelvoet W, Capet F, Vanoverloop J. Verhoogde sterfte in het arrondissement Dendermonde. Kunnen overlijdensstatistieken hierover uitsluitsel brengen? Tijdschr voor Geneeskunde 1998; 54(22):1548-1557.
(506) Van Oyen H, Aelvoet W, Tafforeau J. Overlijdenspatroon in het Vlaamse Gewest. Tijdschr voor Geneeskunde 1993; 49:821-828.
(507) MacFarlane A. Perinatal mortality surveys. Br Med J (Clin Res Ed) 1984; 289(6457):1473-1474.
(508) Carter JR. The problematic death certificate. N Engl J Med 1985; 313(20):1285-1286.
(509) Holland WW. European Community Atlas of Avoidable Death. Oxford: Oxford University Press; 1988.
(510) Humblet P, Lagasse R, Moens G, Van de Voorde H, Wollast E. Atlas de la mortalité évitable en Belgique - Atlas van de vermijdbare sterfte in België (1974-1978). 1-94. 1986. Bruxelles, Ecole de Santé Publique.
(511) Humblet PC, Lagasse R, Moens GF, Wollast E, Van de Voorde H. [Avoidable mortality in Belgium]. Soc Sci Med 1987; 25(5):485-493.
(512) Lagasse R, Humblet P, Hooft P, Van de Voorde H, Wollast E. Atlas of avoidable mortality in Belgium 1980-1984. Arch Public Health 1992; 50:1-97.
Literatuur 370
(513) Leveque A, Humblet PC, Lagasse R. Atlas of avoidable mortality in Belgium 1985-1989. Arch Public Health 1999; 57:1-87.
(514) Moens GF, Haenen W, Van de Voorde H. Epidemiological aspects of suicide among the young in selected European countries. J Epidemiol Community Health 1988; 42(3):279-285.
(515) Moens GFG, Lagasse R, Humblet P, Van de Voorde H, Wollast E. "Vermijdbare sterfte": een evaluatie-instrument van de Gezondheidszorg in België? Tijdschr voor Geneeskunde 1986; 42(13):921-931.
(516) Mackenbach JP, Van Duyne WM, Kelson MC. Certification and coding of two underlying causes of death in The Netherlands and other countries of the European Community. J Epidemiol Community Health 1987; 41(2):156-160.
(517) Hosmer DW, Lemeshow S. Special Topics: The Multinomial Logistic Regression Model. In: Hosmer DW, Lemeshow S, editors. Applied Logistic Regression. 2nd ed. New York: John Wiley & Sons, INC.; 2000. 260-287.
(518) Rosenberg HM. The Impact of Cause-of-death Querying. 45, 1-7. 1991. Bethesda,Maryland, International Institute for Vital Registration and Statistics. Technical Papers.
(519) Hooft P. Verslag van de bijeenkomst van de Eurostat "Technical Group on Causes of Death Statistics". 2004.
(520) Newschaffer CJ, Otani K, McDonald MK, Penberthy LT. Causes of death in elderly prostate cancer patients and in a comparison nonprostate cancer cohort. J Natl Cancer Inst 2000; 92(8):613-621.
(521) RAND. Effects of Medicare's Prospective Payment System on the Quality of Hospital Care. RB-4519, 1-3. 1998. http://www.rand.org/publications/RB/RB4519/.
(522) American Hospital Directory. Medicare Prospective Payment System. 2006. http://www.ahd.com/pps.html acceeded 13/06/2007, American Hospital Directory.
(523) ICD-9-CM Coding Fundamentals, Multiple Coding. ICD-9-CM International Classification of Diseases 9th Revision Clinical Modification Sixth Edition 2005. 2004. 19-78.
(524) Kinghorn W. Should doctors ever lie on behalf of patients? JAMA 1999; 282(17):1674.
Literatuur
371
(525) Webster G. Serving two masters: medical practice vs administrative ethics. JAMA 1999; 282(17):1678-1679.
(526) Rifkin DE. Community considerations: the many effects of miscoding. JAMA 1999; 282(17):1676-7, 1679.
(527) Ubel PA. Physicians' duties in an era of cost containment: advocacy or betrayal? JAMA 1999; 282(17):1675.
(528) Weinstein MC. Should physicians be gatekeepers of medical resources? J Med Ethics 2001; 27(4):268-274.
(529) Roger VL. Invited commentary: Will heart attacks be "gone with the century"? Am J Epidemiol 2004; 160(12):1147-1149.
(530) Kirkhove P, Gillet P, Terryn N, Aelvoet W. Des Audits Aléatoires à des Audits Ciblés. Le Bulletin 2002; http:/www.health.fgov.be/vesalius/devnew/FR/prof/news/bulletin/ (acceeded 15/06/2005):1-9.
(531) Bijlage 3 aan het koninklijk besluit van 25 april 2002. Annexe N° 3 à l'arrêté royal du 25 avril 2002. Vaststelling van een gemiddelde ligduur per diagnosegroep en berekening van een aantal verantwoorde bedden. Fixation d'une durée de séjour moyenne par groupe de diagnostics et calcul d'un nombre de lits justifiés. 25-4-2002.
(532) Campbell MJ, Daly LE, Machin D. Special Topics. In: Altman DG, Machin D, Bryant TN, Gardner MJ, editors. Statistics with Confidence. Bristol: BMJ Books; 2000. 153-167.
(533) Black C, Roos NP. Administrative data. Baby or bathwater? Med Care 1998; 36(1):3-5.
(534) Chaillet N, Dumont A. Evidence-based strategies for reducing cesarean section rates: a meta-analysis. Birth 2007; 34(1):53-64.
(535) Curry SJ. Organizational interventions to encourage guideline implementation. Chest 2000; 118(2 Suppl):40S-46S.
(536) Kostis WJ, Demissie K, Marcella SW, Shao YH, Wilson AC, Moreyra AE. Weekend versus weekday admission and mortality from myocardial infarction. N Engl J Med 2007; 356(11):1099-1109.
(537) Roger-France FH, Mertens I. Case Mix in Belgium: A Rapid Coverage and a Progressive AP-DRG Use. In: Roger-France FH, Mertens I, Closon MC, Hofdijk J, editors. Case Mix: Global Views, Local Actions. 2001. 31-39.
Literatuur 372
(538) Lorant V, Boland B, Humblet P, Deliege D. Equity in prevention and health care. J Epidemiol Community Health 2002; 56(7):510-516.
(539) Starfield B. Equity in health. J Epidemiol Community Health 2002; 56(7):483-484.
(540) Lee TH, Meyer GS, Brennan TA. A middle ground on public accountability. N Engl J Med 2004; 350(23):2409-2412.
(541) Lee TH, Meyer GS, Brennan TA. A middle ground on public accountability. N Engl J Med 2004; 350(23):2409-2412.
(542) Veillard J, Champagne F, Klazinga N, Kazandjian V, Arah OA, Guisset AL. A performance assessment framework for hospitals: the WHO regional office for Europe PATH project. Int J Qual Health Care 2005; 17(6):487-496.
(543) Veillard J, Champagne F, Klazinga N, Kazandjian V, Arah OA, Guisset AL. A performance assessment framework for hospitals: the WHO regional office for Europe PATH project. Int J Qual Health Care 2005; 17(6):487-496.
(544) Lee TH, Meyer GS, Brennan TA. A middle ground on public accountability. N Engl J Med 2004; 350(23):2409-2412.
(545) Iezzoni LI. Assessing quality using administrative data. Ann Intern Med 1997; 127(8 Pt 2):666-674.
(546) Clancy CM. AHRQs National Healthcare Quality and Disparities Reports: resources for health services researchers. Health Serv Res 2006; 41(2):xiii-xxix.
(547) Weiner BJ, Alexander JA, Shortell SM, Baker LC, Becker M, Geppert JJ. Quality improvement implementation and hospital performance on quality indicators. Health Serv Res 2006; 41(2):307-334.
(548) Lee TH, Meyer GS, Brennan TA. A middle ground on public accountability. N Engl J Med 2004; 350(23):2409-2412.
(549) Sheldon T. Netherlands plans system for reporting errors 8. BMJ 2004; 329(7457):68.
(550) Beresford NW, Evans TW. Legal safeguards for the audit process. Are essential for effective clinical governance. BMJ 1999; 319(7211):654-655.
(551) Walshe K. Legal safeguards for audit process are a bad idea. BMJ 1999; 319(7223):1499.
Literatuur
373
(552) AHRQ Quality Indicators. Guide to Inpatient Quality Indicators: Quality of Care in Hospitals - Volume, Mortality and Utilization. Version2.1, Revision 4. 02-R0204, 1-179. 22-12-0004. Rockville, MD, Agency for Healthcare Research and Quality.
(553) Marshall MN. Accountability and quality improvement: the role of report cards. Qual Health Care 2001; 10(2):67-68.
(554) Smith J. Redesigning health care. BMJ 2001; 322(7297):1257-1258.
(555) Moss F, Garside P, Dawson S. Organisational change: the key to quality improvement. Qual Health Care 1998; 7 Suppl:S1-S2.
(556) Buetow SA, Roland M. Clinical governance: bridging the gap between managerial and clinical approaches to quality of care. Qual Health Care 1999; 8(3):184-190.
(557) Roland M. Choosing effective strategies for quality improvement. Qual Health Care 2001; 10(2):66-67.
(558) Davies HT, Nutley SM, Mannion R. Organisational culture and quality of health care. Qual Health Care 2000; 9(2):111-119.
(559) Pearson M. Lessons from the management of acute myocardial infarction. Heart 2005; 91 Suppl 2:ii28-ii30.
(560) Firth-Cozens J. Multidisciplinary teamwork: the good, bad, and everything in between. Qual Health Care 2001; 10(2):65-66.
(561) Smith J, Walshe K, Hunter DJ. The "redisorganisation" of the NHS. BMJ 2001; 323(7324):1262-1263.
(562) Vladeck BC, Goodwin EJ, Myers LP, Sinisi M. Consumers and hospital use: the HCFA "death list". Health Aff (Millwood ) 1988; 7(1):122-125.
(563) Detmer DE. Erring is human: will we cross the quality chasm? Qual Health Care 2001; 10(2):68-69.
(564) Cesarean Delivery Rate. In: Agency for Healthcare Research and Quality, editor. AHRQ Quality Indicators - Guide to Inpatient Quality Indicators: Quality of Care in Hospitals - Volume, Mortality, and Utilization. Revision 4 ed. Rockvile, MD: Agency for Healthcare Research and Quality; 2004. 67-69.
(565) Belizan JM, Althabe F, Barros FC, Alexander S. Rates and implications of caesarean sections in Latin America: ecological study. BMJ 1999; 319(7222):1397-1400.
Literatuur 374
(566) Main EK. Reducing cesarean birth rates with data-driven quality improvement activities. Pediatrics 1999; 103(1 Suppl E):374-383.
(567) Smith GC, Pell JP, Cameron AD, Dobbie R. Risk of perinatal death associated with labor after previous cesarean delivery in uncomplicated term pregnancies. JAMA 2002; 287(20):2684-2690.
(568) Lucet C, Di Zinno T, De Gauquier K, Remacle A. Recours à la césarienne en Belgique: évolution générale et disparités Gebruik van keizersneden in België: algemene evolutie en discrepanties. Intermutualistisch Agentschap, editor. 1-23. 2006. Brussel.
(569) Villar J, Valladares E, Wojdyla D, Zavaleta N, Carroli G, Velazco A et al. Caesarean delivery rates and pregnancy outcomes: the 2005 WHO global survey on maternal and perinatal health in Latin America. Lancet 2006; 367(9525):1819-1829.
(570) Ronsmans C, Campbell OM, McDermott J, Koblinsky M. Questioning the indicators of need for obstetric care. Bull World Health Organ 2002; 80(4):317-324.
(571) Johanson R, Newburn M, MacFarlane A. Has the medicalisation of childbirth gone too far? BMJ 2002; 324(7342):892-895.
(572) Anderson GM. Making sense of rising caesarean section rates. BMJ 2004; 329(7468):696-697.
(573) Guihard P, Blondel B. Trends in risk factors for caesarean sections in France between 1981 and 1995: lessons for reducing the rates in the future. BJOG 2001; 108(1):48-55.
(574) Kolas T, Saugstad OD, Daltveit AK, Nilsen ST, Oian P. Planned cesarean versus planned vaginal delivery at term: Comparison of newborn infant outcomes. Am J Obstet Gynecol 2006.
(575) Meikle SF, Steiner CA, Zhang J, Lawrence WL. A national estimate of the elective primary cesarean delivery rate. Obstet Gynecol 2005; 105(4):751-756.
(576) Guise JM, McDonagh MS, Hashima J, Kraemer DF, Berlin M, Nygren P et al. Vaginal Birth After Cesarean (VBAC). AHRQ Publication No. 03-E018, 1-526. 2003. Rockville,MD, AHRQ.
(577) Gregory KD, Korst LM, Gornbein JA, Platt LD. Using administrative data to identify indications for elective primary cesarean delivery. Health Serv Res 2002; 37(5):1387-1401.
Literatuur
375
(578) Gonen R, Tamir A, Degani S, Ohel G. Variables associated with successful vaginal birth after one cesarean section: a proposed vaginal birth after cesarean section score. Am J Perinatol 2004; 21(8):447-453.
(579) Zweifler J, Garza A, Hughes S, Stanich MA, Hierholzer A, Lau M. Vaginal birth after cesarean in California: before and after a change in guidelines. Ann Fam Med 2006; 4(3):228-234.
(580) Glezerman M. Five years to the term breech trial: the rise and fall of a randomized controlled trial. Am J Obstet Gynecol 2006; 194(1):20-25.
(581) Kotaska A. Inappropriate use of randomised trials to evaluate complex phenomena: case study of vaginal breech delivery. BMJ 2004; 329(7473):1039-1042.
(582) Wareham V, Bain C, Cruickshank D. Caesarean section audit by peer review. Eur J Obstet Gynecol Reprod Biol 1993; 48(1):9-14.
(583) Minkoff H, Chervenak FA. Elective primary cesarean delivery. N Engl J Med 2003; 348(10):946-950.
(584) Stirrat GM, Dunn PM. Elective caesarean section on request. Obstetricians are more than technicians. BMJ 1999; 318(7176):120-121.
(585) Castro A. Commentary:increase in cesarean sections may reflect medical control not woma's choice. BMJ 2006; 319:1401-1402.
(586) van Roosmalen J. Elective caesarean section on request. Unnecessary caesarean sections should be avoided. BMJ 1999; 318(7176):121.
(587) Idama TO, Lindow SW. Elective caesarean section on request. Safest option is still to aim for vaginal delivery. BMJ 1999; 318(7176):121.
(588) Greene MF. Vaginal delivery after cesarean section--is the risk acceptable? N Engl J Med 2001; 345(1):54-55.
(589) Paterson-Brown S, Fisk NM. Caesarean section: every woman's right to choose? Curr Opin Obstet Gynecol 1997; 9(6):351-355.
(590) Paterson-Brown S. Should doctors perform an elective caesarean section on request? Yes, as long as the woman is fully informed. BMJ 1998; 317(7156):462-463.
(591) Norman B, Crowhurst JA, Plaat F. Elective caesarean section on request. All types of anaesthesia carry risks. BMJ 1999; 318(7176):120.
(592) Rozenberg P. [Evaluation of cesarean rate: a necessary progress in modern obstetrics]. J Gynecol Obstet Biol Reprod (Paris) 2004; 33(4):279-289.
Literatuur 376
(593) National Collaborating Centre for Women's and Children's Health. Caesarean Section. Moody J, editor. 1-143. 2004. London NW1 4RG, RCOG Press.
(594) Amu O, Rajendran S, Bolaji II. Should doctors perform an elective caesarean section on request? Maternal choice alone should not determine method of delivery. BMJ 1998; 317(7156):463-465.
(595) Rortveit G, Daltveit AK, Hannestad YS, Hunskaar S. Urinary incontinence after vaginal delivery or cesarean section. N Engl J Med 2003; 348(10):900-907.
(596) Usta IM, Hobeika EM, Musa AA, Gabriel GE, Nassar AH. Placenta previa-accreta: risk factors and complications. Am J Obstet Gynecol 2005; 193(3 Pt 2):1045-1049.
(597) Alexander S, Wildman K, Zhang W, Langer M, Vutuc C, Lindmark G. Maternal health outcomes in Europe. Eur J Obstet Gynecol Reprod Biol 2003; 111 Suppl 1:S78-S87.
(598) Kritchevsky SB, Braun BI, Gross PA, Newcomb CS, Kelleher CA, Simmons BP. Definition and adjustment of Cesarean section rates and assessments of hospital performance. Int J Qual Health Care 1999; 11(4):283-291.
(599) Gonen R, Tamir A, Degani S. Obstetricians' opinions regarding patient choice in cesarean delivery. Obstet Gynecol 2002; 99(4):577-580.
(600) Langer A, Villar J. Promoting evidence based practice in maternal care. BMJ 2002; 324(7343):928-929.
(601) Naylor CD, Sermer M, Chen E, Sykora K. Cesarean delivery in relation to birth weight and gestational glucose tolerance: pathophysiology or practice style? Toronto Trihospital Gestational Diabetes Investigators. JAMA 1996; 275(15):1165-1170.
(602) Bastia H. Commentary:"health has become secondary to a sexually attractive body". BMJ 2006; 319:1402.
(603) Showalter E, Griffin A. Commentary: all women should have a choice. BMJ 1999; 319:1401.
(604) Penn Z, Ghaem-Maghami S. Indications for caesarean section. Best Pract Res Clin Obstet Gynaecol 2001; 15(1):1-15.
(605) Jacquemyn Y, Ahankour F, Martens G. Flemish obstetricians' personal preference regarding mode of delivery and attitude towards caesarean section on demand. Eur J Obstet Gynecol Reprod Biol 2003; 111(2):164-166.
Literatuur
377
(606) Lavender T, Kingdon C, Hart A, Gyte G, Gabbay M, Neilson JP. Could a randomised trial answer the controversy relating to elective caesarean section? National survey of consultant obstetricians and heads of midwifery. BMJ 2005; 331(7515):490-491.
(607) Gould JB, Danielsen B, Korst LM, Phibbs R, Chance K, Main E et al. Cesarean delivery rates and neonatal morbidity in a low-risk population. Obstet Gynecol 2004; 104(1):11-19.
(608) Agency for Healthcare Research and Quality. 2003 National Healthcare Quality Report. 1-208. 2003. Rockville,MD, U.S. Department of Health and Human Services, Agency for Healthcare Research and Quality.
(609) Zeitlin J, Wildman K, Breart G, Alexander S, Barros H, Blondel B et al. Selecting an indicator set for monitoring and evaluating perinatal health in Europe: criteria, methods and results from the PERISTAT project. Eur J Obstet Gynecol Reprod Biol 2003; 111 Suppl 1:S5-S14.
(610) Bekaert A, Martens G, Devlieger H, Amy JJ. Perinatal Activities in Flanders,1996. 1-62. 1997. Brussels, SPE.
(611) Buitendijk S, Zeitlin J, Cuttini M, Langhoff-Roos J, Bottu J. Indicators of fetal and infant health outcomes. Eur J Obstet Gynecol Reprod Biol 2003; 111 Suppl 1:S66-S77.
(612) Declercq E, Menacker F, MacDorman M. Maternal risk profiles and the primary cesarean rate in the United States, 1991-2002. Am J Public Health 2006; 96(5):867-872.
(613) Elliott JP, Russell MM, Dickason LA. The labor-adjusted cesarean section rate--a more informative method than the cesarean section "rate" for assessing a practitioner's labor and delivery skills. Am J Obstet Gynecol 1997; 177(1):139-143.
(614) Dani C, Reali MF, Bertini G, Wiechmann L, Spagnolo A, Tangucci M et al. Risk factors for the development of respiratory distress syndrome and transient tachypnoea in newborn infants. Italian Group of Neonatal Pneumology. Eur Respir J 1999; 14(1):155-159.
(615) Yoder BA, Kirsch EA, Barth WH, Gordon MC. Changing obstetric practices associated with decreasing incidence of meconium aspiration syndrome. Obstet Gynecol 2002; 99(5 Pt 1):731-739.
(616) Papile LA. The Apgar score in the 21st century. N Engl J Med 2001; 344(7):519-520.
Literatuur 378
(617) Baumer JH, Wright D, Mill T. Illness severity measured by CRIB score: a product of changes in perinatal care? Arch Dis Child Fetal Neonatal Ed 1997; 77(3):F211-F215.
(618) Patel D, Piotrowski ZH, Nelson MR, Sabich R. Effect of a statewide neonatal resuscitation training program on Apgar scores among high-risk neonates in Illinois. Pediatrics 2001; 107(4):648-655.
(619) Moster D, Lie RT, Irgens LM, Bjerkedal T, Markestad T. The association of Apgar score with subsequent death and cerebral palsy: A population-based study in term infants. J Pediatr 2001; 138(6):798-803.
(620) Casey BM, McIntire DD, Leveno KJ. The continuing value of the Apgar score for the assessment of newborn infants. N Engl J Med 2001; 344(7):467-471.
(621) Wu YW, Backstrand KH, Zhao S, Fullerton HJ, Johnston SC. Declining diagnosis of birth asphyxia in California: 1991-2000. Pediatrics 2004; 114(6):1584-1590.
(622) Neter J, Wasserman W, Kutner MH. Two-Factor Analysis of Variance - Equal Sample Sizes. In: Neter J, Wasserman W, Kutner MH, editors. Applied Linear Statistical Models Regression, Analysis of Variance and Experimental Designs. Third ed. Homewood,IL: IRWIN; 1990. 673-729.
(623) Collett D. Modelling data from epidemiological studies. In: Collett D, editor. Modelling binary data. Boca Raton: Chapman & Hall/CRC; 1991. 223-276.
(624) Molenberghs G, Verbeke G. Generalized Estimating Equations. Models for Discrete Longitudinal Data. New York: Springer; 2005. 151-187.
(625) Agresti A. Multinomial Response Models. Categorical Data Analysis. New York: John Wiley &Sons.; 1990. 306-346.
(626) Wiswell TE, Gannon CM, Jacob J, Goldsmith L, Szyld E, Weiss K et al. Delivery room management of the apparently vigorous meconium-stained neonate: results of the multicenter, international collaborative trial. Pediatrics 2000; 105(1 Pt 1):1-7.
(627) Fraser WD, Hofmeyr J, Lede R, Faron G, Alexander S, Goffinet F et al. Amnioinfusion for the prevention of the meconium aspiration syndrome. N Engl J Med 2005; 353(9):909-917.
(628) Dargaville PA, Copnell B. The epidemiology of meconium aspiration syndrome: incidence, risk factors, therapies, and outcome. Pediatrics 2006; 117(5):1712-1721.
(629) Levine EM, Ghai V, Barton JJ, Strom CM. Mode of delivery and risk of respiratory diseases in newborns. Obstet Gynecol 2001; 97(3):439-442.
Literatuur
379
(630) Freeman RK, Cohen AW, Depp III R, Frigoletto Jr FD, Hankins GDV, Lieberman E et al. Evaluation of Cesarean Delivery. American College of Obstetricians and Gynecologists Task Force on Cesarean Delivery Rates, editor. i-5. 2000. Washington,DC, The American College of Obstetricians and Gynecologists.
(631) Arnold RA, Diamond ID, Wakefield JC. The use of population data in spatial epidemiology. In: Elliott P, Wakefield JC, Best NG, Briggs DJ, editors. Spatial Epidemiology: Methods and Applications. Oxford: Oxford University Press; 2000. 30-50.
(632) Lydon-Rochelle M, Holt VL, Easterling TR, Martin DP. Risk of uterine rupture during labor among women with a prior cesarean delivery. N Engl J Med 2001; 345(1):3-8.
(633) Kabir AA, Pridjian G, Steinmann WC, Herrera EA, Khan MM. Racial differences in cesareans: an analysis of U.S. 2001 National Inpatient Sample Data. Obstet Gynecol 2005; 105(4):710-718.
(634) Jovanovic L, Pettitt DJ. Gestational diabetes mellitus. JAMA 2001; 286(20):2516-2518.
(635) Sibai BM. Diagnosis, prevention, and management of eclampsia. Obstet Gynecol 2005; 105(2):402-410.
(636) Krieger N. Overcoming the absence of socioeconomic data in medical records: validation and application of a census-based methodology. Am J Public Health 1992; 82(5):703-710.
(637) AHRQ. AHRQuality Indicators e-Newsletter: AHRQ QI TIPS: ICD-9-CM Coding Issues. 2005. http://qualityindicators.ahrq.gov/newsletter/2005-September-AHRQ-QI-Newsletter.htm
(638) DiGiuseppe DL, Aron DC, Payne SM, Snow RJ, Dierker L, Rosenthal GE. Risk adjusting cesarean delivery rates: a comparison of hospital profiles based on medical record and birth certificate data. Health Serv Res 2001; 36(5):959-977.
(639) Rosenthal AR. Elective caesarean section on request. Maternal age is important. BMJ 1999; 318(7176):121-122.
(640) Cleary-Goldman J, Malone FD, Vidaver J, Ball RH, Nyberg DA, Comstock CH et al. Impact of maternal age on obstetric outcome. Obstet Gynecol 2005; 105(5 Pt 1):983-990.
(641) Heffner LJ, Elkin E, Fretts RC. Impact of labor induction, gestational age, and maternal age on cesarean delivery rates. Obstet Gynecol 2003; 102(2):287-293.
Literatuur 380
(642) Thorngren-Jerneck K, Herbst A. Low 5-minute Apgar score: a population-based register study of 1 million term births. Obstet Gynecol 2001; 98(1):65-70.
(643) MacLennan A. A template for defining a causal relation between acute intrapartum events and cerebral palsy: international consensus statement. BMJ 1999; 319(7216):1054-1059.
(644) Perinatale Activiteiten in Vlaanderen 2005. Cammu H, Martens G, De Coen K, Van Mol C., Defoort P, editors. Perinatale Activiteiten in Vlaanderen 2005. 1-71. 2006. Brussel, Studiecentrum Perinatale Epidemiologie.
(645) ACOG Committee Opinion. Number 333, May 2006 (replaces No. 174, July 1996): The Apgar score. Obstet Gynecol 2006; 107(5):1209-1212.
(646) Fan AP, Eaton WW. Longitudinal study assessing the joint effects of socio-economic status and birth risks on adult emotional and nervous conditions. Br J Psychiatry Suppl 2001; 40:s78-s83.
(647) Young P, Hamilton R, Hodgett S, Moss M, Rigby C, Jones P et al. Reducing risk by improving standards of intrapartum fetal care. J R Soc Med 2001; 94(5):226-231.
(648) Stutchfield P, Whitaker R, Russell I. Antenatal betamethasone and incidence of neonatal respiratory distress after elective caesarean section: pragmatic randomised trial. BMJ 2005; 331(7518):662.
(649) Littleford J. Effects on the fetus and newborn of maternal analgesia and anesthesia: a review. Can J Anaesth 2004; 51(6):586-609.
(650) Pottecher J, Benhamou D. [Labor pain and obstetric analgesia]. J Gynecol Obstet Biol Reprod (Paris) 2004; 33(3):179-191.
(651) Lopriore E, van Burk GF, Walther FJ, de Beaufort AJ. Correct use of the Apgar score for resuscitated and intubated newborn babies: questionnaire study. BMJ 2004; 329(7458):143-144.
(652) Boog G. La souffrance foetale aiguë [Acute fetal distress]. J Gynecol Obstet Biol Reprod (Paris) 2001; 30(5):393-432.
(653) Stoler MH, Schiffman M. Interobserver reproducibility of cervical cytologic and histologic interpretations: realistic estimates from the ASCUS-LSIL Triage Study. JAMA 2001; 285(11):1500-1505.
(654) Grotta JC, Chiu D, Lu M, Patel S, Levine SR, Tilley BC et al. Agreement and variability in the interpretation of early CT changes in stroke patients qualifying for intravenous rtPA therapy. Stroke 1999; 30(8):1528-1533.
Literatuur
381
(655) Hemminki E, Malin M, Rahkonen O. Mother's social class and perinatal problems in a low-problem area. Int J Epidemiol 1990; 19(4):983-990.
(656) Stewart JH, Andrews J, Cartlidge PH. Numbers of deaths related to intrapartum asphyxia and timing of birth in all Wales perinatal survey, 1993-5. BMJ 1998; 316(7132):657-660.
(657) Gould JB, Qin C, Chavez G. Time of birth and the risk of neonatal death. Obstet Gynecol 2005; 106(2):352-358.
(658) McNutt RA, Abrams R, Arons DC. Patient safety efforts should focus on medical errors. JAMA 2002; 287(15):1997-2001.
(659) Lanier DC, Roland M, Burstin H, Knottnerus JA. Doctor performance and public accountability. Lancet 2003; 362(9393):1404-1408.
(660) Lilford R, Mohammed MA, Spiegelhalter D, Thomson R. Use and misuse of process and outcome data in managing performance of acute medical care: avoiding institutional stigma. Lancet 2004; 363(9415):1147-1154.
(661) Ransom SB, Studdert DM, Dombrowski MP, Mello MM, Brennan TA. Reduced medicolegal risk by compliance with obstetric clinical pathways: a case--control study. Obstet Gynecol 2003; 101(4):751-755.
(662) Hannah ME, Hannah WJ, Hewson SA, Hodnett ED, Saigal S, Willan AR. Planned caesarean section versus planned vaginal birth for breech presentation at term: a randomised multicentre trial. Term Breech Trial Collaborative Group. Lancet 2000; 356(9239):1375-1383.
(663) Lumley J. Any room left for disagreement about assisting breech births at term? Lancet 2000; 356(9239):1369-1370.
(664) Boutron I, Tubach F, Giraudeau B, Ravaud P. Methodological differences in clinical trials evaluating nonpharmacological and pharmacological treatments of hip and knee osteoarthritis. JAMA 2003; 290(8):1062-1070.
(665) Boutron I, Ravaud P, Giraudeau B. Inappropriateness of randomised trials for complex phenomena: single trial is never enough evidence to base decisions on. BMJ 2005; 330(7482):94.
(666) Hannah M. Inappropriateness of randomised trials for complex phenomena: are the results of the term breech trial generalisable? BMJ 2005; 330(7482):95.
(667) Whyte H, Hannah ME, Saigal S, Hannah WJ, Hewson S, Amankwah K et al. Outcomes of children at 2 years after planned cesarean birth versus planned vaginal birth for breech presentation at term: the International Randomized Term Breech Trial. Am J Obstet Gynecol 2004; 191(3):864-871.
Literatuur 382
(668) Term breech delivery in Sweden: mortality relative to fetal presentation and planned mode of delivery. Acta Obstet Gynecol Scand 2005; 84(6):593-601.
(669) Danielian PJ, Wang J, Hall MH. Long-term outcome by method of delivery of fetuses in breech presentation at term: population based follow up. BMJ 1996; 312(7044):1451-1453.
(670) Carayol M, Alexander S, Goffinet F. [Mode of delivery and term breech presentation in the PREMODA cohort]. J Gynecol Obstet Biol Reprod (Paris) 2004; 33(1 Suppl):S37-S44.
(671) Scherjon SA, van RJ. [Breech presentation at term: the caesarean section that is routinely advised is ultimately not safe for the child]. Ned Tijdschr Geneeskd 2005; 149(40):2204-2206.
(672) Varma R, Gupta JK. Internationally agreed strategy is needed on vaginal birth after caesarean. BMJ 2004; 329(7462):403.
(673) Janssen PA, Lee SK, Ryan EM, Etches DJ, Farquharson DF, Peacock D et al. Outcomes of planned home births versus planned hospital births after regulation of midwifery in British Columbia. CMAJ 2002; 166(3):315-323.
(674) Verschoore S, Martens G, Delbaere I, Temmerman M. Vaginale bevalling na sectio in vergelijking met een herhalingssectio gevolgen voor moeder en kind. In: Cammu H, Martens G, De Coen K, Van Mol C., Defoort P, editors. Perinatale Activiteiten in Vlaanderen 2005. Brussel: Studiecentrum Perinatale Epidemiologie; 2006. 59-66.
(675) McMahon MJ, Luther ER, Bowes WA, Jr., Olshan AF. Comparison of a trial of labor with an elective second cesarean section. N Engl J Med 1996; 335(10):689-695.
(676) Smith GC, Pell JP, Pasupathy D, Dobbie R. Factors predisposing to perinatal death related to uterine rupture during attempted vaginal birth after caesarean section: retrospective cohort study. BMJ 2004; 329(7462):375.
(677) Vaginal birth after cesarean birth--California, 1996-2000. MMWR Morb Mortal Wkly Rep 2002; 51(44):996-998.
(678) Dunsmoor-Su R, Sammel M, Stevens E, Peipert JL, Macones G. Impact of sociodemographic and hospital factors on attempts at vaginal birth after cesarean delivery. Obstet Gynecol 2003; 102(6):1358-1365.
(679) Brill Y, Windrim R. Vaginal birth after Caesarean section: review of antenatal predictors of success. J Obstet Gynaecol Can 2003; 25(4):275-286.
(680) Guise JM, Hashima J, Osterweil P. Evidence-based vaginal birth after Caesarean section. Best Pract Res Clin Obstet Gynaecol 2005; 19(1):117-130.
Literatuur
383
(681) Durnwald C, Mercer B. Vaginal birth after Cesarean delivery: predicting success, risks of failure. J Matern Fetal Neonatal Med 2004; 15(6):388-393.
(682) Wall E, Roberts R, Deutchman M, Hueston W, Atwood LA, Ireland B. Trial of Labor After Caesarean (TOLAC), Formerly Trial of Labor Versus Elective Repeat Cesarean Section for the Woman With a Previous Cesarean Section A Review of the Evidence and Recommendations by the American Academy of Family Physicians. 1-18. 2005. AAFP.
(683) Rozenberg P. [The counselling of patient with prior C-section]. Gynecol Obstet Fertil 2005; 33(12):1003-1008.
(684) Kmietowicz Z. NICE advises against caesarean section on demand. BMJ 2004; 328(7447):1031.
(685) ACOG. Patient-Requested Cesarean Update. 5-9-2006. http://ftp.acog.org/from_home/publications/press_releases/nr05-09-06-1.cfm
(686) Danchin N, De Benedetti E, Urban P. Acute myocardial infarction. Am Fam Physician 2003; 68(3):519-521.
(687) OECD Health Data 2005: Statistics and Indicators for 30 Countries. 2005.
(688) Boucher JM, Racine N, Thanh TH, Rahme E, Brophy J, LeLorier J et al. Age-related differences in in-hospital mortality and the use of thrombolytic therapy for acute myocardial infarction. CMAJ 2001; 164(9):1285-1290.
(689) Bednar F, Widimsky P, Groch L, Aschermann M, Zelizko M, Krupicka J. Acute myocardial infarction complicated by early onset of heart failure: safety and feasibility of interhospital transfer for coronary angioplasty. Subanalysis of Killip II-IV patients from the PRAGUE-1 study. J Interv Cardiol 2003; 16(3):201-208.
(690) Dauerman HL, Ryan TJ, Jr., Piper WD, Kellett MA, Shubrooks SJ, Robb JF et al. Outcomes of percutaneous coronary intervention among elderly patients in cardiogenic shock: a multicenter, decade-long experience. J Invasive Cardiol 2003; 15(7):380-384.
(691) Zeymer U, Vogt A, Zahn R, Weber MA, Tebbe U, Gottwik M et al. Predictors of in-hospital mortality in 1333 patients with acute myocardial infarction complicated by cardiogenic shock treated with primary percutaneous coronary intervention (PCI); Results of the primary PCI registry of the Arbeitsgemeinschaft Leitende Kardiologische Krankenhausarzte (ALKK). Eur Heart J 2004; 25(4):322-328.
Literatuur 384
(692) Hochman JS, Sleeper LA, Webb JG, Sanborn TA, White HD, Talley JD et al. Early revascularization in acute myocardial infarction complicated by cardiogenic shock. SHOCK Investigators. Should We Emergently Revascularize Occluded Coronaries for Cardiogenic Shock. N Engl J Med 1999; 341(9):625-634.
(693) Antoniucci D, Valenti R, Santoro GM, Bolognese L, Trapani M, Moschi G et al. Systematic direct angioplasty and stent-supported direct angioplasty therapy for cardiogenic shock complicating acute myocardial infarction: in-hospital and long-term survival. J Am Coll Cardiol 1998; 31(2):294-300.
(694) Goldberg RJ, Samad NA, Yarzebski J, Gurwitz J, Bigelow C, Gore JM. Temporal trends in cardiogenic shock complicating acute myocardial infarction. N Engl J Med 1999; 340(15):1162-1168.
(695) White HD, Assmann SF, Sanborn TA, Jacobs AK, Webb JG, Sleeper LA et al. Comparison of percutaneous coronary intervention and coronary artery bypass grafting after acute myocardial infarction complicated by cardiogenic shock: results from the Should We Emergently Revascularize Occluded Coronaries for Cardiogenic Shock (SHOCK) trial. Circulation 2005; 112(13):1992-2001.
(696) Babaev A, Frederick PD, Pasta DJ, Every N, Sichrovsky T, Hochman JS. Trends in management and outcomes of patients with acute myocardial infarction complicated by cardiogenic shock. JAMA 2005; 294(4):448-454.
(697) Acute myocardial infarction: pre-hospital and in-hospital management. The Task Force on the Management of Acute Myocardial Infarction of the European Society of Cardiology. Eur Heart J 1996; 17(1):43-63.
(698) Rathore SS, Foody JM, Radford MJ, Krumholz HM. Sex differences in use of coronary revascularization in elderly patients after acute myocardial infarction: a tale of two therapies. Chest 2003; 124(6):2079-2086.
(699) Leape LL, Hilborne LH, Bell R, Kamberg C, Brook RH. Underuse of cardiac procedures: do women, ethnic minorities, and the uninsured fail to receive needed revascularization? Ann Intern Med 1999; 130(3):183-192.
(700) Roeters Van Lennep JE, Zwinderman AH, Roeters Van Lennep HW, Westerveld HE, Plokker HW, Voors AA et al. Gender differences in diagnosis and treatment of coronary artery disease from 1981 to 1997. No evidence for the Yentl syndrome. Eur Heart J 2000; 21(11):911-918.
(701) Gottlieb S, Harpaz D, Shotan A, Boyko V, Leor J, Cohen M et al. Sex differences in management and outcome after acute myocardial infarction in the 1990s: A prospective observational community-based study. Israeli Thrombolytic Survey Group. Circulation 2000; 102(20):2484-2490.
Literatuur
385
(702) Watson RE, Stein AD, Dwamena FC, Kroll J, Mitra R, McIntosh BA et al. Do race and gender influence the use of invasive procedures? J Gen Intern Med 2001; 16(4):227-234.
(703) Harrold LR, Esteban J, Lessard D, Yarzebski J, Gurwitz JH, Gore JM et al. Narrowing gender differences in procedure use for acute myocardial infarction: insights from the Worcester heart attack study. J Gen Intern Med 2003; 18(6):423-431.
(704) Gibson CM. Time is myocardium and time is outcomes. Circulation 2001; 104(22):2632-2634.
(705) Gottwik M, Zahn R, Schiele R, Schneider S, Gitt AK, Fraunberger L et al. Differences in treatment and outcome of patients with acute myocardial infarction admitted to hospitals with compared to without departments of cardiology; results from the pooled data of the Maximal Individual Therapy in Acute Myocardial Infarction (MITRA 1+2) Registries and the Myocardial Infarction Registry (MIR). Eur Heart J 2001; 22(19):1794-1801.
(706) Schiele F, Meneveau N, Seronde MF, Caulfield F, Fouche R, Lassabe G et al. Compliance with guidelines and 1-year mortality in patients with acute myocardial infarction: a prospective study. Eur Heart J 2005; 26(9):873-880.
(707) Marciniak TA, Ellerbeck EF, Radford MJ, Kresowik TF, Gold JA, Krumholz HM et al. Improving the quality of care for Medicare patients with acute myocardial infarction: results from the Cooperative Cardiovascular Project. JAMA 1998; 279(17):1351-1357.
(708) Mehta RH, Montoye CK, Gallogly M, Baker P, Blount A, Faul J et al. Improving quality of care for acute myocardial infarction: The Guidelines Applied in Practice (GAP) Initiative. JAMA 2002; 287(10):1269-1276.
(709) Eagle KA, Montoye CK, Riba AL, DeFranco AC, Parrish R, Skorcz S et al. Guideline-based standardized care is associated with substantially lower mortality in medicare patients with acute myocardial infarction: the American College of Cardiology's Guidelines Applied in Practice (GAP) Projects in Michigan. J Am Coll Cardiol 2005; 46(7):1242-1248.
(710) Bassand JP, Priori S, Tendera M. Evidence-based vs. 'impressionist' medicine: how best to implement guidelines. Eur Heart J 2005; 26(12):1155-1158.
(711) Van de WF, Ardissino D, Betriu A, Cokkinos DV, Falk E, Fox KA et al. Management of acute myocardial infarction in patients presenting with ST-segment elevation. The Task Force on the Management of Acute Myocardial Infarction of the European Society of Cardiology. Eur Heart J 2003; 24(1):28-66.
Literatuur 386
(712) Hasdai D, Behar S, Wallentin L, Danchin N, Gitt AK, Boersma E et al. A prospective survey of the characteristics, treatments and outcomes of patients with acute coronary syndromes in Europe and the Mediterranean basin; the Euro Heart Survey of Acute Coronary Syndromes (Euro Heart Survey ACS). Eur Heart J 2002; 23(15):1190-1201.
(713) White CW. Simplicity's virtue scorned. Precision comes to TIMI flow grading and the results are ...surprising. Circulation 1996; 93(5):853-856.
(714) Bestul MB, McCollum M, Stringer KA, Burchenal J. Impact of a critical pathway on acute myocardial infarction quality indicators. Pharmacotherapy 2004; 24(2):173-178.
(715) Krumholz HM, Chen J, Wang Y, Radford MJ, Chen YT, Marciniak TA. Comparing AMI mortality among hospitals in patients 65 years of age and older: evaluating methods of risk adjustment. Circulation 1999; 99(23):2986-2992.
(716) Jollis JG, Romano PS. Volume-outcome relationship in acute myocardial infarction: the balloon and the needle. JAMA 2000; 284(24):3169-3171.
(717) Ryan TJ, Antman EM, Brooks NH, Califf RM, Hillis LD, Hiratzka LF et al. 1999 update: ACC/AHA Guidelines for the Management of Patients With Acute Myocardial Infarction: Executive Summary and Recommendations: A report of the American College of Cardiology/American Heart Association Task Force on Practice Guidelines (Committee on Management of Acute Myocardial Infarction). Circulation 1999; 100(9):1016-1030.
(718) O'Connor GT, Quinton HB, Traven ND, Ramunno LD, Dodds TA, Marciniak TA et al. Geographic Variation in the Treatment of Acute Myocardial Infarction. JAMA 1999; 281(7):627-633.
(719) Moniteur Belge, Belgisch Staatsblad. Arrêté royal fixant les normes auxquelles les programmes de soins "pathologie cardiaque" doivent répondre pour être agréés. 15 Juillet 2004. 2004.
(720) Van Brabandt H, Camberlin C, Vrijens F, Parmentier Y, Ramaekers D, Bonneux L. More is not better in the early care of acute myocardial infarction: a prospective cohort analysis on administrative databases. Eur Heart J 2006; 27(22):2649-2654.
(721) Kuch B, Bolte HD, Hoermann A, Meisinger C, Loewel H. What is the real hospital mortality from acute myocardial infarction? Epidemiological vs clinical view. Eur Heart J 2002; 23(9):714-720.
(722) Dalby M, Bouzamondo A, Lechat P, Montalescot G. Transfer for primary angioplasty versus immediate thrombolysis in acute myocardial infarction: a meta-analysis. Circulation 2003; 108(15):1809-1814.
Literatuur
387
(723) Antman EM, Fox KM. History of guidelines for unstable angina/non-ST-elevation MI. Eur Heart J Supplements 2001;J1-J5.
(724) Bertrand ME, Simoons ML, Fox KA, Wallentin LC, Hamm CW, McFadden E et al. Management of acute coronary syndromes: acute coronary syndromes without persistent ST segment elevation; recommendations of the Task Force of the European Society of Cardiology. Eur Heart J 2000; 21(17):1406-1432.
(725) Zijlstra F, van't Hof AW, Liem AL, Hoorntje JC, Suryapranata H, de Boer MJ. Transferring patients for primary angioplasty: a retrospective analysis of 104 selected high risk patients with acute myocardial infarction. Heart 1997; 78(4):333-336.
(726) Ross AM, Coyne KS, Moreyra E, Reiner JS, Greenhouse SW, Walker PL et al. Extended mortality benefit of early postinfarction reperfusion. GUSTO-I Angiographic Investigators. Global Utilization of Streptokinase and Tissue Plasminogen Activator for Occluded Coronary Arteries Trial. Circulation 1998; 97(16):1549-1556.
(727) Brodie BR, Stuckey TD, Wall TC, Kissling G, Hansen CJ, Muncy DB et al. Importance of time to reperfusion for 30-day and late survival and recovery of left ventricular function after primary angioplasty for acute myocardial infarction. J Am Coll Cardiol 1998; 32(5):1312-1319.
(728) Boersma E. Does time matter? A pooled analysis of randomized clinical trials comparing primary percutaneous coronary intervention and in-hospital fibrinolysis in acute myocardial infarction patients. Eur Heart J 2006; 27(7):779-788.
(729) Zijlstra F, Hoorntje JC, de Boer MJ, Reiffers S, Miedema K, Ottervanger JP et al. Long-term benefit of primary angioplasty as compared with thrombolytic therapy for acute myocardial infarction. N Engl J Med 1999; 341(19):1413-1419.
(730) Morrow DA, Antman EM, Charlesworth A, Cairns R, Murphy SA, de Lemos JA et al. TIMI risk score for ST-elevation myocardial infarction: A convenient, bedside, clinical score for risk assessment at presentation: An intravenous nPA for treatment of infarcting myocardium early II trial substudy. Circulation 2000; 102(17):2031-2037.
(731) Grines CL, Browne KF, Marco J, Rothbaum D, Stone GW, O'Keefe J et al. A comparison of immediate angioplasty with thrombolytic therapy for acute myocardial infarction. The Primary Angioplasty in Myocardial Infarction Study Group. N Engl J Med 1993; 328(10):673-679.
Literatuur 388
(732) Weaver WD, Simes RJ, Betriu A, Grines CL, Zijlstra F, Garcia E et al. Comparison of primary coronary angioplasty and intravenous thrombolytic therapy for acute myocardial infarction: a quantitative review. JAMA 1997; 278(23):2093-2098.
(733) Widimsky P, Budesinsky T, Vorac D, Groch L, Zelizko M, Aschermann M et al. Long distance transport for primary angioplasty vs immediate thrombolysis in acute myocardial infarction. Final results of the randomized national multicentre trial--PRAGUE-2. Eur Heart J 2003; 24(1):94-104.
(734) Madias JE. Killip and Forrester classifications: should they be abandoned, kept, reevaluated, or modified? Chest 2000; 117(5):1223-1226.
(735) Lim R, Walters MI, Norell MS. Transferring patients for primary infarct angioplasty. Heart 1997; 78(4):325-326.
(736) Widimsky P, Groch L, Zelizko M, Aschermann M, Bednar F, Suryapranata H. Multicentre randomized trial comparing transport to primary angioplasty vs immediate thrombolysis vs combined strategy for patients with acute myocardial infarction presenting to a community hospital without a catheterization laboratory. The PRAGUE study. Eur Heart J 2000; 21(10):823-831.
(737) Zijlstra F. Angioplasty vs thrombolysis for acute myocardial infarction: a quantitative overview of the effects of interhospital transportation. Eur Heart J 2003; 24(1):21-23.
(738) Andersen HR, Nielsen TT, Rasmussen K, Thuesen L, Kelbaek H, Thayssen P et al. A comparison of coronary angioplasty with fibrinolytic therapy in acute myocardial infarction. N Engl J Med 2003; 349(8):733-742.
(739) Wharton TP, Jr., McNamara NS, Fedele FA, Jacobs MI, Gladstone AR, Funk EJ. Primary angioplasty for the treatment of acute myocardial infarction: experience at two community hospitals without cardiac surgery. J Am Coll Cardiol 1999; 33(5):1257-1265.
(740) Vermeer F, Oude Ophuis AJ, vd Berg EJ, Brunninkhuis LG, Werter CJ, Boehmer AG et al. Prospective randomised comparison between thrombolysis, rescue PTCA, and primary PTCA in patients with extensive myocardial infarction admitted to a hospital without PTCA facilities: a safety and feasibility study. Heart 1999; 82(4):426-431.
(741) Bonnefoy E, Lapostolle F, Leizorovicz A, Steg G, McFadden EP, Dubien PY et al. Primary angioplasty versus prehospital fibrinolysis in acute myocardial infarction: a randomised study. Lancet 2002; 360(9336):825-829.
Literatuur
389
(742) Morrison LJ, Verbeek PR, McDonald AC, Sawadsky BV, Cook DJ. Mortality and prehospital thrombolysis for acute myocardial infarction: A meta-analysis. JAMA 2000; 283(20):2686-2692.
(743) de Jaegere PP, Serruys PW, Simoons ML. Should all patients with an acute myocardial infarction be referred for direct PTCA? Heart 2004; 90(11):1352-1357.
(744) Magid DJ, Calonge BN, Rumsfeld JS, Canto JG, Frederick PD, Every NR et al. Relation between hospital primary angioplasty volume and mortality for patients with acute MI treated with primary angioplasty vs thrombolytic therapy. JAMA 2000; 284(24):3131-3138.
(745) Tunstall-Pedoe H, Kuulasmaa K, Amouyel P, Arveiler D, Rajakangas AM, Pajak A. Myocardial infarction and coronary deaths in the World Health Organization MONICA Project. Registration procedures, event rates, and case-fatality rates in 38 populations from 21 countries in four continents. Circulation 1994; 90(1):583-612.
(746) Salomaa V, Koukkunen H, Ketonen M, Immonen-Raiha P, Karja-Koskenkari P, Mustonen J et al. A new definition for myocardial infarction: what difference does it make? Eur Heart J 2005; 26(17):1719-1725.
(747) Apple FS, Wu AH. Myocardial infarction redefined: role of cardiac troponin testing. Clin Chem 2001; 47(3):377-379.
(748) Fox KA, Birkhead J, Wilcox R, Knight C, Barth J. British Cardiac Society Working Group on the definition of myocardial infarction. Heart 2004; 90(6):603-609.
(749) Abildstrom SZ, Rasmussen S, Madsen M. Changes in hospitalization rate and mortality after acute myocardial infarction in Denmark after diagnostic criteria and methods changed. Eur Heart J 2005; 26(10):990-995.
(750) Official ICD-9-CM Alerts Archives. Acute myocardial infarction. 2005.
(751) Dorsch MF, Lawrance RA, Sapsford RJ, Oldham J, Greenwood DC, Jackson BM et al. A simple benchmark for evaluating quality of care of patients following acute myocardial infarction. Heart 2001; 86(2):150-154.
(752) Tu JV, Austin PC, Walld R, Roos L, Agras J, McDonald KM. Development and validation of the Ontario acute myocardial infarction mortality prediction rules. J Am Coll Cardiol 2001; 37(4):992-997.
Literatuur 390
(753) Acute Myocardial Infarction Mortality Rate (IQI 15). In: Agency for Healthcare Research and Quality, editor. AHRQ Quality Indicators - Guide to Inpatient Quality Indicators: Quality of Care in Hospitals - Volume, Mortality, and Utilization. Revision 4 ed. Rockvile, MD: Agency for Healthcare Research and Quality; 2004. 54-56.
(754) Acute Myocardial Infarction Mortality Rate, Without Transfer Cases (IQI 32). In: Agency for Healthcare Research and Quality, editor. AHRQ Quality Indicators - Guide to Inpatient Quality Indicators: Quality of Care in Hospitals - Volume, Mortality, and Utilization. Rockvile, MD: Agency for Healthcare Research and Quality; 2004. 54-56.
(755) Luepker RV, Apple FS, Christenson RH, Crow RS, Fortmann SP, Goff D et al. Case definitions for acute coronary heart disease in epidemiology and clinical research studies: a statement from the AHA Council on Epidemiology and Prevention; AHA Statistics Committee; World Heart Federation Council on Epidemiology and Prevention; the European Society of Cardiology Working Group on Epidemiology and Prevention; Centers for Disease Control and Prevention; and the National Heart, Lung, and Blood Institute. Circulation 2003; 108(20):2543-2549.
(756) Gilbert M, Thimus A, Roger-France FH, Jeanjean M, Camberlain C, Mertens I et al. L'infarctus du myocarde/Myocardinfarct. In: Gilbert M, Thimus A, Roger-France FH, Camberlain C, Mertens I, Figeys A et al., editors. Validité des données hospitalières pour leur exploitation en épidémiologie/ De validiteit van ziekenhuisgegevens voor gebruik in de epidemiologie. SSTC/AG/10/031 ed. Bruxelles/Brussel: Agora; 2004. 10-13.
(757) Van de WF, Ardissino D, Betriu A, Cokkinos DV, Falk E, Fox KA et al. Management of acute myocardial infarction in patients presenting with ST-segment elevation. The Task Force on the Management of Acute Myocardial Infarction of the European Society of Cardiology. Eur Heart J 2003; 24(1):28-66.
(758) Krumholz HM, Wang Y, Mattera JA, Wang Y, Han LF, Ingber MJ et al. An administrative claims model suitable for profiling hospital performance based on 30-day mortality rates among patients with an acute myocardial infarction. Circulation 2006; 113(13):1683-1692.
(759) Stenestrand U, Lindback J, Wallentin L. Long-term outcome of primary percutaneous coronary intervention vs prehospital and in-hospital thrombolysis for patients with ST-elevation myocardial infarction. JAMA 2006; 296(14):1749-1756.
(760) Gandjour A, Kleinschmit F, Lauterbach KW. European comparison of costs and quality in the treatment of acute myocardial infarction (2000-2001). Eur Heart J 2002; 23(11):858-868.
Literatuur
391
(761) Harrell FE, Jr., Lee KL, Califf RM, Pryor DB, Rosati RA. Regression modelling strategies for improved prognostic prediction. Stat Med 1984; 3(2):143-152.
(762) Shwartz M, Ash AS. Evaluating Risk-Adjustment Models Empirically. In: Iezzoni LI, editor. Risk Adjustment for Measuring Health Care Outcomes. Third ed. Chicago, IL: 2003. 231-273.
(763) Eagle KA, Lim MJ, Dabbous OH, Pieper KS, Goldberg RJ, Van de WF et al. A validated prediction model for all forms of acute coronary syndrome: estimating the risk of 6-month postdischarge death in an international registry. JAMA 2004; 291(22):2727-2733.
(764) Salomaa V, Miettinen H, Niemela M, Ketonen M, Mahonen M, Immonen-Raiha P et al. Relation of socioeconomic position to the case fatality, prognosis and treatment of myocardial infarction events; the FINMONICA MI Register Study. J Epidemiol Community Health 2001; 55(7):475-482.
(765) Kunst AE, Groenhof F, Mackenbach JP, Health EW. Occupational class and cause specific mortality in middle aged men in 11 European countries: comparison of population based studies. EU Working Group on Socioeconomic Inequalities in Health. BMJ 1998; 316(7145):1636-1642.
(766) Zijlstra F. Does it matter where you go with an acute myocardial infarction? Eur Heart J 2001; 22(19):1764-1766.
(767) Kostis WJ, Demissie K, Marcella SW, Shao YH, Wilson AC, Moreyra AE. Weekend versus weekday admission and mortality from myocardial infarction. N Engl J Med 2007; 356(11):1099-1109.
(768) Aelvoet W, Vanoverloop J, Molenberghs G, Schoeters G, van Sprundel M. Adequacy of Routinely Collected Data for the Assessment of the Reproductive Health of a Community Living in the Neighbourhood of Two Household Refuse Incinerators: a Critical Case Study. Arch Public Health 2005; 63:259-278.
(769) Thomas DC. The problem of multiple inference in identifying point-source environmental hazards. Environ Health Perspect 1985; 62:407-414.
(770) Wartenberg D, Greenberg M. Detecting disease clusters: the importance of statistical power. Am J Epidemiol 1990; 132(1 Suppl):S156-S166.
(771) Neutra RR. Counterpoint from a cluster buster. Am J Epidemiol 1990; 132(1):1-8.
(772) Olsen SF, Martuzzi M, Elliott P. Cluster analysis and disease mapping--why, when, and how? A step by step guide. BMJ 1996; 313(7061):863-866.
(773) Kulldorff M, Athas WF, Feurer EJ, Miller BA, Key CR. Evaluating cluster alarms: a space-time scan statistic and brain cancer in Los Alamos, New Mexico. Am J Public Health 1998; 88(9):1377-1380.
Literatuur 392
(774) Geschwind SA, Stolwijk JA, Bracken M, Fitzgerald E, Stark A, Olsen C et al. Risk of congenital malformations associated with proximity to hazardous waste sites. Am J Epidemiol 1992; 135(11):1197-1207.
(775) Dolk H, Vrijheid M, Armstrong B, Abramsky L, Bianchi F, Garne E et al. Risk of congenital anomalies near hazardous-waste landfill sites in Europe: the EUROHAZCON study. Lancet 1998; 352(9126):423-427.
(776) Fielder HMP, Poon-King CM, Palmer SR, Moss N, Coleman G. Assessment of impact on health of residents living near the Nant- y-Gwyddon landfill site: retrospective analysis. BMJ 2000; 320(7226):19-22.
(777) Schoeters G, Cornelis C, De Fré R, Hooghe R, Collier M, Maes C et al. Studie van gezondheidsaspecten en gezondheidsrisico's ten gevolge van de milieuverontreiniging in de Neerlandwijk te Wilrijk. 1998/TOX/R/009., 1-139. 1998. Mol, VITO.
(778) Birnbaum LS. Workshop on perinatal exposure to dioxin-like compounds. V. Immunologic effects. Environ Health Perspect 1995; 103 Suppl 2:157-160.
(779) Fries GF, Paustenbach DJ. Evaluation of potential transmission of 2,3,7,8- tetrachlorodibenzo-p-dioxin-contaminated incinerator emissions to humans via foods. J Toxicol Environ Health 1990; 29(1):1-43.
(780) Neubert R, Maskow L, Webb J, Jacob-Muller U, Nogueira AC, Delgado I et al. Chlorinated dibenzo-p-dioxins and dibenzofurans and the human immune system. 1. Blood cell receptors in volunteers with moderately increased body burdens. Life Sci 1993; 53(26):1995-2006.
(781) Koopman-Esseboom C, Weisglas-Kuperus N, de Ridder MA, Van der Paauw CG, Tuinstra LG, Sauer PJ. Effects of polychlorinated biphenyl/dioxin exposure and feeding type on infants' mental and psychomotor development. Pediatrics 1996; 97(5):700-706.
(782) Kogevinas M, Becher H, Benn T, Bertazzi PA, Boffetta P, Bueno-de-Mesquita HB et al. Cancer mortality in workers exposed to phenoxy herbicides, chlorophenols, and dioxins. An expanded and updated international cohort study. Am J Epidemiol 1997; 145(12):1061-1075.
(783) Feeley MM. Workshop on perinatal exposure to dioxin-like compounds. III. Endocrine effects. Environ Health Perspect 1995; 103 Suppl 2:147-150.
(784) Egeland GM, Sweeney MH, Fingerhut MA, Wille KK, Schnorr TM, Halperin WE. Total serum testosterone and gonadotropins in workers exposed to dioxin. Am J Epidemiol 1994; 139(3):272-281.
Literatuur
393
(785) Weisglas-Kuperus N. Neurodevelopmental, immunological and endocrinological indices of perinatal human exposure to PCBs and dioxins. Chemosphere 1998; 37(9-12):1845-1853.
(786) Peper M, Klett M, Frentzel-Beyme R, Heller WD. Neuropsychological effects of chronic exposure to environmental dioxins and furans. Environ Res 1993; 60(1):124-135.
(787) Mukerjee D. Health impact of polychlorinated dibenzo-p-dioxins: a critical review. J Air Waste Manag Assoc 1998; 48(2):157-165.
(788) James WH. Re: "Male pesticide exposure and pregnancy outcome". Am J Epidemiol 1999; 149(3):290-291.
(789) Williams FL, Lawson AB, Lloyd OL. Low sex ratios of births in areas at risk from air pollution from incinerators, as shown by geographical analysis and 3- dimensional mapping. Int J Epidemiol 1992; 21(2):311-319.
(790) Mocarelli P, Brambilla P, Gerthoux PM, Patterson DG, Needham LL. Change in sex ratio with exposure to dioxin. Lancet 1996; 348(9024):409.
(791) Hansen D, Moller H, Olsen J. Severe periconceptional life events and the sex ratio in offspring: follow up study based on five national registers. BMJ 1999; 319(7209):548-549.
(792) Clapp R, Ozonoff D. Where the boys aren't: dioxin and the sex ratio. Lancet 2000; 355(9218):1838-1839.
(793) Mocarelli P, Gerthoux PM, Ferrari E, Patterson DG, Kieszak SM, Brambilla P et al. Paternal concentrations of dioxin and sex ratio of offspring. Lancet 2000; 355(9218):1858-1863.
(794) James WH. Re: "Total serum testosterone and gonadotropins in workers exposed to dioxin". Am J Epidemiol 1995; 141(5):476-7; discussion 477-8.
(795) Nessel CS, Butler JP, Post GB, Held JL, Gochfeld M, Gallo MA. Evaluation of the relative contribution of exposure routes in a health risk assessment of dioxin emissions from a municipal waste incinerator. J Expo Anal Environ Epidemiol 1991; 1(3):283-307.
(796) Pleus RC, Kelly KE. Health effects from hazardous waste incineration facilities: five case studies. Toxicol Ind Health 1996; 12(2):277-287.
(797) Lloyd OL, Lloyd MM, Williams FL, Lawson A. Twinning in human populations and in cattle exposed to air pollution from incinerators. Br J Ind Med 1988; 45(8):556-560.
Literatuur 394
(798) Rydhstroem H. No obvious spatial clustering of twin births in Sweden between 1973 and 1990. Environ Res 1998; 76(1):27-31.
(799) James WH. Secular trends in monitors of reproductive hazard. Hum Reprod 1997; 12(3):417-421.
(800) Knox E. Childhood cancers, birthplaces, incinerators and landfill sites. Int J Epidemiol 2000; 29(3):391-397.
(801) Savitz DA. Environmental exposures and childhood cancer: our best may not be good enough. Am J Public Health 2001; 91(4):562-563.
(802) Neutra RR. Epidemiology for and with a distrustful community. Environ Health Perspect 1985; 62:393-397.
(803) Weinberg CR, Wilcox AJ. Reproductive Epidemiology. In: Rothman KJ, Greenland S, editors. Modern Epidemiology. Second ed. Philadelphia: Lippincott Williams & Wilkins; 1998. 585-608.
(804) Staines A, Järup L. Health event data. In: Elliott P, Wakefield JC, Best NG, Briggs DJ, editors. Spatial Epidemiology: Methods and Applications. Oxford: Oxford University Press; 2000. 15-29.
(805) De Wals P, Vincotte-Mols M, Lys F, Borlee I, Lechat MF. [Evaluation of the registration of congenital abnormalities in Belgian civilian vital statistics]. Arch Belg 1987; 45(11-12):441-451.
(806) Sedman RM, Esparza JR. Evaluation of the public health risks associated with semivolatile metal and dioxin emissions from hazardous waste incinerators. Environ Health Perspect 1991; 94:181-187.
(807) Hill AB. Statistical Evidence and Inference. In: Hill AB, editor. A Short Textbook of Medical Statistics. London: Hodder and Stoughton; 1977. 285-296.
(808) Rothman KJ, Greenland S. Causation and Causal Inference. In: Rothman KJ, Greenland S, editors. Modern Epidemiology. Second ed. Philadelphia: Lippincott Williams & Wilkins; 1998. 7-28.
(809) Buekens P, Derom R, De Wals P. Perinatal health in Belgium: an introduction. Biol Neonate 1989; 55(1):6-9.
(810) Oakes MW. Statistical Inference. One Newton Executive Park,Newton Lower Falls: One Newton Epidemiology Resources Inc.; 1990.
(811) SAS Institute Inc. The LOGISTIC Procedure. In: SAS Institute Inc., editor. SAS/STAT User's Guide, Version 6. Fourth ed. Cary, NC: SAS Institue Inc.; 1989. 1071-1126.
Literatuur
395
(812) Rothman KJ. A sobering start for the cluster busters' conference. Am J Epidemiol 1990; 132(1 Suppl):S6-13.
(813) Quataert PK, Armstrong B, Berghold A, Bianchi F, Kelly A, Marchi M et al. Methodological problems and the role of statistics in cluster response studies: a framework. Eur J Epidemiol 1999; 15(9):821-831.
(814) McMahon B, Trichopoulos D. Epidemiology: Principles and Methods. 2 ed. Boston: Little, Brown and Company; 1996.
(815) Dolk H, De Wals P. Congenital Anomalies. In: Elliott P, Cuzick J, English D, Stern R, editors. Geographical and Environmental Epidemiology: Methods for Small- Area Studies. Oxford: Oxford University Press.; 1992. 72-88.
(816) Rothman KJ, Greenland S. Measures of Disease Frequency. In: Rothman KJ, Greenland S, editors. Modern Epidemiology. Second ed. Philadelphia: Lippincott Williams & Wilkins; 1998. 29-46.
(817) Schwartz J. Harvesting and long term exposure effects in the relation between air pollution and mortality. Am J Epidemiol 2000; 151(5):440-448.
(818) Hertz-Picciotto I. Environmental Epidemiology. In: Rothman KJ, Greenland S, editors. Modern Epidemiology. Second ed. Philadelphia: Lippincott Williams & Wilkins; 1998. 555-583.
(819) Bennett P. Understanding responses to risk: some basic findings. In: Bennett P, Calman K, editors. Risk communication and public health. Oxford University Press; 2001. 3-19.
(820) Rothenberg RB, Thacker SB. Guidelines for the investigation of clusters of adverse health events. In: Elliott P, Cuzick J, English D, Stern R, editors. Geographical and Environmental Epidemiology: Methods for Small- Area Studies. Oxford: Oxford University Press.; 1992. 264-277.
(821) Dolk H. Commentary: impact on health needs assessing from different angles. BMJ 2000; 320(7226):23.
397
Curriculum vitae Willem H. G. Aelvoet MD, MPH, MSc(Biost.), geboren:14/02/1947.
Ervaring:
I Sinds 1/11/2000 tot op heden.
Geneesheer-statisticus op de F.O.D. Volksgezondheid, Veiligheid van de Voedselketen en
Leefmilieu - DG1 - Datamanagement - Cel Studies, verantwoordelijke voor de cel studies
en belast met analyses en rapportage van de Minimale Klinische Gegevens (MKG).
Voornaamste opdrachten : uitwerken en begeleiden van klinische performance indicatoren
en methodologische ondersteuning bij de kwaliteitsbewaking van de MKG.
Vanaf het academisch jaar 2002-2003 tot op heden: verstrekken van een cursus over
Gezondheidsindicatoren voor de “Interuniversitaire opleiding Geneesheer specialist in het
beheer van gezondheidsgegevens.”
II 1987 tot oktober 2000 Verantwoordelijk voor de Geboorte en Sterftestatistiek van
Vlaanderen
Verantwoordelijk voor de kwaliteitsbewaking van het coderen, het verzamelen, verwerken
en rapporteren van de geboorte- en overlijdensstatistieken ten behoeve van het
gezondheidsbeleid.
Voornaamste verwezenlijkingen: centralisatie en evaluatie van het codeergebeuren; tijdige
rapportage van de geboorte- en overlijdensstatistieken onder vorm van
gezondheidsindicatoren met inbegrip van risicogedrag (bijvoorbeeld Tabaksgerelateerde
mortaliteit);
III Projectleider: Projet Centre d'Instruction Médicale de Maroua, Kameroen, 1980-6.
Werkte mee aan het ontwikkelen van en was verantwoordelijk voor het uitvoeren van een
geïntegreerd eerstelijns en tweedelijns gezondheidzorg pilootproject in het Diamaré
district.
IV Geneesheer-directeur van het rurale ziekenhuis Miabi en zijn attractie-zone, Zaire
1972-1979.
Curriculum vitae 398
Opleiding:
Diploma Instelling Jaar
Master of Science in Biostatistics Limburgs Universitair
Centrum
1994
Statistical, Epidemiological and Operational
Methods Applied in Medicine and Public
Health
Université Libre de Bruxelles 1987
Maîtrise en Santé Publique IMT, Antwerpen 1977
Diploma Tropische Geneeskunde ITG, Antwerpen 1971
Doctor in de Genees-, Heel- en Verloskunde Katholieke Universiteit
Leuven
1971
Cursussen & Workshops
1) Longitudinal Data Analysis januari-maart 2005 Censtat, UHasselt
2) Workshop on Statistical Inference. LUC Diepenbeek: April 10-12,2000.
3) Bayes and Empirical Bayes methods for data analysis. KUL, TA Louis: Dec. 9/11/1998
4) Spatial Statistical Methods in Epidemiology. A. Lawson: March 24-26/1998 at BCT-
KUL.
5) Exact Methods for Contingency Tables and Logistic Regression. C. Mehta: 9/06/1995.
Hasselt.
6) Fourth International Course on Ageing. A. Kalache, London School of Hygiene &
Tropical Medecine: 30 August-23 September 1988
399
Literatuurlijst Willem AELVOET
ARTIKELS
Lauwers P, Aelvoet W, Sneppe R, Remion M. Effect of car driving on the
electrocardiogram of patients with myocardial infarction and an E.C.G. at rest devoid of
dysrhythmia and repolarisation abnormalities: comparison with the E.C.G. changes
obtained during exercise. Acta Cardiol. 1973;28(1):27-43.
Aelvoet W, Humblet PC, Lagasse R. Het in routine gebruik maken van een
geïnformatiseerd controleprogramma als middel tot kwaliteitsbewaking van de statistieken
van de burgerlijke stand in Vlaanderen. Arch Public Health 1991;49:1-8.
Snacken R, Lion J, Van Casteren V, Cornelis R, Yane F, Mombaerts M, Aelvoet W,
Stroobant A. Five years of sentinel surveillance of acute respiratory infections (1985-
1990): the benefits of an influenza early warning system. Eur J Epidemiol. 1992
Jul;8(4):485-90.
Van Oyen H, Aelvoet W, Tafforeau J. Overlijdenspatroon in het Vlaamse Gewest.
Tijdschrift voor Geneeskunde 1993; 49:821-828
Beutels M, Van Damme P, Aelvoet W, Desmyter J, Dondeyne F, Goilav C, Mak R,
Muylle L, Pierard D, Stroobant A, Van Loock F, Waumans P, Vranckx R.
Prevalence of hepatitis A, B and C in the Flemish population. Eur J Epidemiol. 1997
Apr;13(3):275-80.
De Henauw S, de Smet P, Aelvoet W, Kornitzer M, De Backer G. Misclassification of
coronary heart disease in mortality statistics. Evidence from the WHO-MONICA Ghent-
Charleroi Study in Belgium. J Epidemiol Community Health 1998;52:513-9.
Literatuurlijst Willem Aelvoet 400
Aelvoet W, Capet F, Vanoverloop J. Verhoogde sterfte in het arrondissement
Dendermonde. Kunnen overlijdensstatistieken hierover uitsluitsel brengen? Tijdschrift
voor Geneeskunde 1998;54:1548-57.
Moens G, Capet F, Aelvoet W, Van Oyen H, Drieskens S, Van Casteren V. De recente
evolutie van suïcidaal gedrag in Vlaanderen. Tijdschrift voor Geneeskunde 1999; 55(2):96-
104.
Aelvoet W, Wildemeersch D. De peilpraktijken en het gezondheidsbeleid: een
toekomstperspectief voor de Vlaamse overheid. Huisarts Nu 1, 46-47. 2000.
Aelvoet W. On the use of administrative databases to support planning activities: a
comment. Eur.J.Public Health 2005;15:215 (letter).
Aelvoet W, Molenberghs G, van Sprundel M. Mortality Statistics in Belgium 1980-1997:
Quality of coding. Arch Public Health 2005;63:127-48.
Aelvoet W, Vanoverloop J, Molenberghs G, Schoeters G, van Sprundel M. Adequacy of
Routinely Collected Data for the Assessment of the Reproductive Health of a Community
Living in the Neighbourhood of Two Household Refuse Incinerators: a Critical Case
Study. Arch Public Health 2005;63:259-78.
Aelvoet W, Terryn N, Windey F, Redivo M, Faes C. Miscoding a threat to the hospital care
system: how detect it ? Submitted RESP,2007.
Aelvoet W, Windey F, Molenberghs G, Verstraelen H, Van Reempts P, Foidart JM.
Screening for inter-hospital differences in cesarean section rates in low-risk deliveries
using administrative data. An initiative to improve the quality of care. BMC Health
Services Research 2008;8(1);3.
Literatuurlijst Willem Aelvoet
401
HOOFDSTUKKEN IN BOEK
Aelvoet W. Mortaliteitsstatistieken voor een gezondheidsbeleid. In Nijs H, Denekens J,
eds.Preventieve Gezondheidszorg, pp 914-21. Diegem Editorial: Kluwer, 1997.
Depoorter AM, Aelvoet W, Bogaerts K, Capet F, De Greef M, Dewolf D et al.
Gezondheidgegevens m.b.t. de jeugd in Vlaanderen. In: Nijs H, Denekens J, editors.
Preventieve Gezondheidszorg. Diegem Editorial: Kluwer; 1997. 942-968.
Aelvoet W. Mortinataliteit en zuigeligensterfte. In Van Der Haeghe H, ed. Over sterfte, pp
69-80. Brussel: CBGS, 1991.
RAPPORTEN
Aelvoet W. Essai de rationalisation d’un service médical de zone rurale au Zaire
MPH Thesis. IMT/ITG Antwerpen 1977
Aelvoet, W. Vital Statistics in Flanders. An Exploration of Possible Biases due to Coding
and Certification Practices. 1-46. 1994. MSc Thesis. Limburgs Universitair Centrum.
Van Oyen H., Tafforeau J., Aelvoet W., Felten G.: Overlijden en oorzaakspecifiek
overlijden in de Vlaamse Gemeenschap 1987. Brussel: COOV, IHE, 1992.
Tafforeau J, Van Oyen H, Drieskens S, Demoulin P, Pirenne Y, Aelvoet W et al.
Statistiques de décès en communauté francaise: 1987. 1992. Bruxelles, CROSP, IHE.
Van Oyen H., Tafforeau J., Aelvoet W., Felten G.: Overlijden en oorzaakspecifiek
overlijden in de Vlaamse Gemeenschap 1988. Brussel: COOV, IHE, 1994.
Van Oyen H., Drieskens S., Tafforeau J., Aelvoet W., Felten G.: Geboorten, perinatale
sterfte en kindersterfte, 1987. Brussel. COOV, IHE, 1994.
Literatuurlijst Willem Aelvoet 402
Tafforeau J, Van Oyen H, Drieskens S, Squilbin G, Demoulin P, Aelvoet W. Naissancces,
mortalité périnatale et infantile: statistiques 1988 et 1989. 1996. Bruxelles, CROSP, IHE.
Capet F, Bogaerts K, Aelvoet W. Verwerking Registratiegegevens van het Medisch
Schooltoezicht. Lengte en gewicht. 1996. Brussel, Ministerie van de Vlaamse
Gemeenschap.
Tafforeau J, Van Oyen H, Drieskens S, Demoulin P, Pirenne Y, Aelvoet W et al.
Statistiques de décès en communauté francaise: 1989-1991. 1997. Bruxelles, CROSP,
IHE.
Aelvoet W, Nelen V, Schoeters G, Vanoverloop J, Wallijn E, Vlietinck R:
Risico op gezondheidsschade bij kinderen van de Neerlandwijk te Wilrijk.
Rapport 1998/TOX/R/030, 1998.
Aelvoet, W., Bogaert, J., Gillet, P., and Molenberghs, G. Bepaling van de invloed van
sociale factoren en van het individuele ziekenhuis op de verblijfsduur in de sector van de
acute ziekenhuizen, aan de hand van de gekoppelde MKG- en MFG-1996. 2001. Brussel,
Ministerie van Sociale Zaken, Volksgezondheid en Leefmilieu.
Baert, E., Byttebier, G., De Backer, G., Van Oyen, H., Aelvoet, W., and De Henauw, S.
Ontwikkeling van geïntegreerde gezondheidsindicatoren op basis van bestaande Vlaamse
gegevens in zake ziekte en gezondheid. PBO/UG/43, 1-98. 2001. Gent, RUG.
Aelvoet, W., Mertens, I., and van Sprundel, M. Uitwendige oorzaken in de Minimale
Klinische Gegevens. 2002. Brussel, FOD Volksgezondheid, Veiligheid van de
Voedselketen en Leefmilieu.
Kirkhove P, Gillet P, Terryn N, Aelvoet W. Des Audits Aléatoires à des Audits Ciblés. Le
Bulletin 2002; http:/www.health.fgov.be/vesalius/devnew/FR/prof/news/bulletin/
(acceeded 15/06/2005):1-9.
Literatuurlijst Willem Aelvoet
403
Aelvoet, W., Dargent, G., Delvaux, A., Iweins, F., Terryn, N, Mertens, I, and van Sprundel,
M. Human, social and economic costs due to non-fatal motor vehicle traffic accidents. An
approach based on routinely collected data. 2003. FOD Volksgezondheid, Veiligheid van
de Voedselketen en Leefmilieu.
Aelvoet W, Terryn N, Windey F, Loosen F, Faes C, Molenberghs G et al. Audit MKG en
fraudeopsporing - ontwikkeling van een methodologie. 1-45. 2006. Brussel, FOD
Volksgezondheid, Veiligheid van de Voedselketen, Leefmilieu.
Aelvoet W, Terryn N, Windey F, Loosen F. MKG en screening van problemen i.v.m.
performance/kwaliteit van zorgen. 1-24. 2006. Brussel, FOD Volksgezondheid,
Veiligheid van de Voedselketen, Leefmilieu
Aelvoet W, Terryn N, Windey F, Loosen F. Keizersnedencijfer (IQI 21). 1-28. 2006.
Brussel, FOD Volksgezondheid, Veiligheid van de Voedselketen, Leefmilieu.
Aelvoet W, Terryn N, Windey F, Loosen F. Laparoscopische Cholecystectomie (IQI 23).
1-24. 2006. Brussel, FOD Volksgezondheid, Veiligheid van de Voedselketen, Leefmilieu
Aelvoet W, Terryn N, Windey F, Loosen F. Intraziekenhuis letaliteit na opname voor
Acuut Myocardinfarct (AMI) (IQI 15 en IQI 15 en IQI 32). 1-27. 2006. Brussel, FOD
Volksgezondheid, Veiligheid van de Voedselketen, Leefmilieu.
Aelvoet W, Terryn N, Windey F, Loosen F. Ziekenhuisletaliteit na een opname voor
Pneumonie (Community-Acquired Pneumonia) (CAP) (IQI 20). 1-26. 2006. Brussel, FOD
Volksgezondheid, Veiligheid van de Voedselketen, Leefmilieu.
Aelvoet W, Terryn N, Windey F, Loosen F. Ziekenhuisletaliteit na opname voor
Heupfractuur (IQI 19). 1-25. 2006. Brussel, FOD Volksgezondheid, Veiligheid van de
Voedselketen, Leefmilieu.
Literatuurlijst Willem Aelvoet 404
GEZONDHEIDSINDICATOREN VLAAMSE GEMEENSCHAP
Aelvoet W. Gezondheidsindicatoren 1993. Brussel: Ministerie van de Vlaamse
Gemeenschap., 1995.
Aelvoet W. Bogaerts K, Capet F. Gezondheidsindicatoren 1994. Brussel: Ministerie van de
Vlaamse Gemeenschap., 1996.
Aelvoet W, Bogaerts K, Capet F, Quataert PK. Gezondheidsindicatoren 1995. Brussel:
Ministerie van de Vlaamse Gemeenschap., 1997.
Aelvoet W, Capet F, Vanoverloop J. Gezondheidsindicatoren 1996. Brussel: Ministerie van
de Vlaamse Gemeenschap., 1998.
Aelvoet W, Fortuin M, Hooft P, Vanoverloop J. Gezondheidsindicatoren 1997. Brussel:
Ministerie van de Vlaamse Gemeenschap., 1999.
Aelvoet W, Cloots H, Fortuin M, Hooft P, Vanoverloop J. Gezondheidsindicatoren 1998.
Brussel: Ministerie van de Vlaamse Gemeenschap., 2000.