25
1 Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában Szép Katalin – Gadácsi Katalin KSH Fényes Elek Műhely 2010. május 26.

Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában

  • Upload
    zoltin

  • View
    23

  • Download
    0

Embed Size (px)

DESCRIPTION

Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában. Szép Katalin – Gadácsi Katalin KSH Fényes Elek Műhely 2010. május 26. Vázlat. Alapok: statisztikai cél Adatkiadás, kockázatok, csatornák Alapelvek Dilemmák Eurostat gyakorlat, fejlesztési irányok - PowerPoint PPT Presentation

Citation preview

Page 1: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában

1

Anonimizálási és adathozzáférési eljárások a hivatalos statisztika

gyakorlatában

Szép Katalin – Gadácsi Katalin KSHFényes Elek Műhely

2010. május 26.

Page 2: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában

2

Vázlat

1. Alapok: statisztikai cél

2. Adatkiadás, kockázatok, csatornák

3. Alapelvek

4. Dilemmák

5. Eurostat gyakorlat, fejlesztési irányok

6. Záró gondolatok

Page 3: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában

3

Milyen adatok vannak?

„ 2008-ban XYZ Kft. nettó árbevétele 345678 ezer Ft ”

• Adóbevallás – adminisztratív adat

• KSH kérdőív – statisztikai adat

• …

Page 4: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában

4

Mitől függ?

Minden esetben adott egységre vonatkozik, de a cél különbözik:

• Igazgatási/adminisztratív –felhasználása közvetlenül az adott egységet érinti, adott egységre vonatkozó intézkedések alapja

• Statisztikai – sokaságot akarjuk jellemezni.

Page 5: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában

5

Adatgyűjtés – feldolgozás - használat

Adminisztratív célAdatgyűjtés Ellenőrzés, Egységet

érintő

nyilvántartás intézkedés

Statisztikai célAdatgyűjtés Adatellenőrzés,ösz- Sokaságot

szesítés, becslés jellemző adat

Page 6: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában

6

Adatgyűjtés – feldolgozás - használat

Adminisztratív célAdatgyűjtés Ellenőrzés, Egységet

érintő

nyilvántartás intézkedés

Statisztikai célAdatgyűjtés Adatellenőrzés,ösz- Sokaságot

szesítés, becslés jellemző adat

Page 7: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában

7

Egy speciális kérdés: adat-összekapcsolás

• Célok– Költségcsökkentés– Adatszolgáltatói terheket ne növeljük– Meglévő adatokból max információ kinyerése

• Megoldás: adatösszekapcsolás– Kapcsolás a lehető legpontosabb adatokból– Összekapcsolt állomány gondos anonimizálása

(kapcsolás előtti anonimizálás rontja a kapcsolás minőségét, és nem biztos, hogy anonim kapcsolt állományt eredményez)

Page 8: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában

8

EU Statisztikai Rendszer jövőképeCél: adatszolgáltatói terhek mérséklése, minőség javítása

Különböző adatforrások

Statisztikai elemzések

Feldolgozás

Forrás: Communication from the Commission to the European Parliament and the Council …COM(2009)404. 8. August 2009

Page 9: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában

9

Statisztikai célból gyűjtött/kezelt adat csak statisztikai célra használható, azaz a sokaság jellemzésére.

Adatkiadáskor adminisztratív célra alkalmatlanná kell tenni, azaz ne legyen alkalmas egyedek azonosítására, egyedekre vonatkozó információ felfedésére.

Page 10: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában

10

Milyen információ felfedését akadályozzuk meg?

• Ország kultúrájától függ.

• Magyarországon: – különleges adat (jogi alap)– érzékeny adat (vállalati, lakossági kultúra)

Page 11: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában

11

Felfedés elleni védelem

• Felfedés kockázata függ:– Adat jellege (érzékeny, különleges+közvetlen és

közvetett azonosítást lehetővé tevő)– Adathasználat közvetlen célja, adathasználó

rendelkezésére álló egyéb információ, eszközök, nyilvántartás, adathasználó háttérintézményének feladata

– Jogi védelem lehetősége• Adatvédelem: felfedés elleni logikai, jogi, fizikai

védelem• Tökéletes védelem nincs, cél, hogy szokásos idő

és eszközráfordítással ne legyen felfedhető

Page 12: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában

12

Felfedés tipikus esetei - Táblázatból

• Ha az érzékeny kategóriába túl kevés adatszolgáltató esik pl. személygépkocsi-gyártás megyei adatai

• Ha az érzékeny kategóriába túl sok/összes adatszolgáltató esik pl. „B régióban minden hajótulajdonos környezetszennyező”

Védelem: aggregálás, cellaelnyomás, kerekítés

Page 13: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában

13

Felfedés tipikus esetei - Mikroadatokból

• Közvetlen azonosítókból (név, telephely, adószám)

• Ritka értékkombinációkból (főtevékenység, régió, létszámkategória)

Védelem: közvetlen azonosítók törlése, csonkolás, cellaelnyomás, átkódolás-kerekítés, összekeverés

Page 14: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában

14

Főbb adatkiadási csatornák a KSH-ban

Kutatók a Hivatal kutató-szobájában

Jogi védelem

Eurostat Statisztikai Hivatal

Kutatók az Eurostat kutató-

szobájában

EU-s mikroadatot használó kutatók

Hazai mikroadatot használó kutatók

Nyilvánosság

c)

b)

a) a)

b)

c)

Felfed

és elleni

védelem

a) aggregált és mikroadatok nyilvánosságra hozása b) anonimizált mikroadatkiadás (kutatási célra) c) mikroadat-hozzáférés

Page 15: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában

15

Adatkiadási/hozzáférési csatornák

• Táblázatos– Kész táblázatok (kiadványok, Stadat vagy

egyedi)– Adatbázisokból lekérdezéssel

• Mikroadat– Távoli hozzáférés– Kutatószoba– Adatállomány kiadása (kutatónak, v. publikus)– Adatállomány átadása kutatói adatbázisba

Page 16: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában

16

• Maximális biztonság – minimális kockázat• Minimális információveszteség• Hatékonyság, összehangoltság• Megalapozottság

Különböző formában, különböző csatornákon

Egyenkockázat elve

Felfedés elleni védelem alapelvei

Page 17: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában

17

Dilemmák az adatkiadásban

• Felhasználók megkülönböztetése – egyenkockázat elve

• Egyedi igényeknek megfelelő anonimizálás – kockázatnövekedés - erőforrásigény - ingyenesség

Page 18: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában

18

EU: bizalmas adatokhoz való tudományos célú hozzáférés

Bizottság 831/2002/EK rendelete

Bizalmas adatok – statisztikai egység közvetlen azonosíthatóság nélkül

Bizalmas adatokhoz való hozzáférés – hivatali helységben, vagy anonimizált mikroadat kiadása

Kérelem: • Intézmény (egyetem, tudományos kutatóintézet,

statisztikai intézet, EKB, jegybankok) Bizottság 2004/452/EK határozata a szervezetek jegyzékéről

• Kutatók• Kutatási cél• Adatállomány

Page 19: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában

19

Page 20: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában

20

Fejlesztési irányok a világban

• Nemzetközi összehasonlítási igény, lehetőség • Új technikai lehetőségek (távoli hozzáférés,

adatbázisok mérete, hozzáférési eszközök, adatelemzési eszközök)

• Speciális kérések, kérdések

Válaszok: kutatás, fejlesztés a felfedés elleni logikai védelemben, informatikai, jogi eszközökben

Page 21: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában

21

Adatvédelmi fejlesztések az EU-ban

• Adatvédelmi kézikönyv felülvizsgálata– érthetőség

• Hozzáférés mikroadatokhoz EU szinten (Eurostaton keresztül)– Intézményi engedélyeztetés egyszerűsítése– Adatállományok bővítése

• Hozzáférés kutatószobák hálózatán keresztül– Kutatószobák standardja– Anonimizálás, felhasználók minősítése,

dokumentáció, szerződés standardja– Szabályozás standardizálása

Page 22: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában

22

Fejlesztések a KSH-ban

• Részvétel EU grantokban/fejlesztésekben

• Adathozzáférési csatornák bővítése

• Adatvédelmi szempontok egységesítése

Csökkenő pénzügyi erőforrások, igen korlátozott emberi kapacitások mellett.

Page 23: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában

23

Összegzés (1)

Statisztikai célokat szolgáló adat csak úgy adható ki (statisztikai szolgálaton kívülre), hogy ne szolgálhasson közvetlenül adminisztratív intézkedés alapjául.

Eszköz: felfedés elleni logikai, technikai, jogi védelem

Kiadható anonimizált mikroadat, biztonságos táblázat.

Page 24: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában

24

Összegzés (2)

• Statisztikai célnak való megfelelés– Befogadhat egyedi adatot– Kiad csak anonimizált adatot

• Mikroadatkiadáshoz– Termelési folyamat átalakítása– Módszertani felkészülés– Költség és emberi erőforrásigény

• Jogi környezet (koncepcionális összhang, EU konformitás)

Page 25: Anonimizálási és adathozzáférési eljárások a hivatalos statisztika gyakorlatában

25

Köszönöm a figyelmet!

[email protected]