Upload
suchi
View
28
Download
0
Embed Size (px)
DESCRIPTION
Intelligens rendszerfelügyelet. Szolgáltatásbiztonság IT rendszerekben. Micskei Zoltán (részben Dr. Majzik István előadásai alapján). Szolgáltatásbiztonság??. hideg tartalék. rendelkezésre állás. hibatűrés. szoftver redundancia. nem tervezett leállás. szoftver RAID. 0 perc leállás. - PowerPoint PPT Presentation
Citation preview
1Budapesti Műszaki és Gazdaságtudományi EgyetemMéréstechnika és Információs Rendszerek Tanszék
Szolgáltatásbiztonság IT rendszerekben
Micskei Zoltán(részben Dr. Majzik István előadásai alapján)
Intelligens rendszerfelügyelet
2
Szolgáltatásbiztonság??
rendelkezésre állás
hibatűrés
0 perc leállás
HA fürt
szoftver RAID
business continuity
katasztrófa elhárítás
replikáció
hideg tartalék
megbízhatóság
meghibásodás
szoftver redundancia
visszalépéses helyreállítás
„öt kilences” rendszer
nem tervezett leállás
hibajavító kódok
3
Tartalomjegyzék
A szolgáltatásbiztonság fogalma
A szolgáltatásbiztonságot befolyásoló tényezők
A szolgáltatásbiztonság eszközei
Szolgáltatásbiztonság analízise
4
Szolgáltatásbiztonság
Szolgáltatásbiztonság (dependability): a képesség, hogy igazoltan bízni lehet a szolgáltatásban
o igazoltan: elemzésen, méréseken alapulo bizalom: szolgáltatás az igényeket kielégíti
5
Szolgáltatásbiztonság jellemzői
Rendelkezésre állás
Megbízhatóság
Biztonságosság
Bizalmasság
Integritás
Karbantarthatóság
Szolgáltatás-biztonság
(Adat)Biztonság
Laprie et. al.: Basic Concepts and Taxonomy of Dependable and Secure Computing
6
Szolgáltatásbiztonság jellemzői
Rendelkezésre állás
Megbízhatóság
Biztonságosság
Bizalmasság
Integritás
Karbantarthatóság
Szolgáltatás-biztonság
(Adat)Biztonság
Laprie et. al.: Basic Concepts and Taxonomy of Dependable and Secure Computing
Használatra kész szolgáltatás esélye
Folytonosan hibamentes szolgáltatás
Katasztrofális következmények
nélküli szolgáltatás
Nincs hibás változtatásJavítás és módosítás
lehetősége
Nincs jogosulatlan hozzáférés
7
Rendelkezésre állás követelményei
Elosztott rendszerek (hibatűrés nélkül, irányadó számok): 1 szgép: 95% 2 szgép: 90% 5 szgép: 77% 10 szgép: 60%
Készenléti tényező Max. kiesés 1 év alatt2 db 9-es (99%) 3,5 nap3 db 9-es (99,9%) 9 óra4 db 9-es (99,99%) 1 óra5 db 9-es (99,999%) 5 perc6 db 9-es (99,9999%) 32 másodperc7 db 9-es (99,99999%) 3 másodperc
8
Tartalomjegyzék
A szolgáltatásbiztonság fogalma
A szolgáltatásbiztonságot befolyásoló tényezők
A szolgáltatásbiztonság eszközei
Szolgáltatásbiztonság analízise
9
Befolyásoló tényezők Hibajelenség (failure):
A specifikációnak nem megfelelő szolgáltatás
Hiba (error):Hibajelenséghez vezető rendszerállapot
Meghibásodás (fault):A hiba feltételezett oka
10
Hatáslánc Meghibásodás Hiba Hibajelenség
o pl. szoftver:• meghibásodás: programozó hiba: csökkentés helyett növel• hiba: vezérlés ráfut, változó értéke hibás lesz• hibajelenség: számítás végeredménye rossz
o pl. hardver:• meghibásodás: kozmikus sugárzás egy bitet átbillent• hiba: hibás memóriacella olvasása• hibajelenség: robotkar a falnak ütközik
Rendszer hierarchiaszintjének függvényeo alsó szintű hibajelenség felsőbb szinten meghibásodás
• kimenet beragadás egy chip szintjén hibajelenség• rendszer szintjén meghibásodás (chip a cserélhető komponens)
11
A hibajelenségek okai IT rendszerek esetén
Forrás: Medgyesi Zoltán: Nagy rendelkezésre állású kiszolgálófürtök vizsgálata, Diplomamunka, BME, 2007.
12
Meghibásodások kategorizálása Hardverhibák
o alaprendszer (alaplap, processzor, memória)
o tápellátás (tápegység, szünetmentes táp)
o adattároló alrendszer o hálózat
Szoftverhibák o az operációs rendszer hibái o alkalmazáshibák o illesztőprogram-hibák
…
Emberi hibák o rendszergazdai hibák o illetékes felhasználók nem
rosszindulatú hibái o illetékes felhasználók
rosszindulatú hibái o illetéktelen felhasználók
támadásai Környezeti hatások
o üzemeltetési környezet rendellenességei, például a légkondicionálás leállása, bombariadó, csőtörés
o természeti katasztrófák
13
Tartalomjegyzék
A szolgáltatásbiztonság fogalma
A szolgáltatásbiztonságot befolyásoló tényezők
A szolgáltatásbiztonság eszközei
Szolgáltatásbiztonság analízise
14
A szolgáltatásbiztonság eszközei Hiba megelőzés: Meghibásodás megakadályozása
o fizikai hibák: jó minőségű alkatrészek, árnyékolás,...o tervezési hibák: verifikáció
Hiba megszüntetés:o prototípus fázis: tesztelés, diagnosztika, javításoműködés közben: monitorozás, javítás
Hibatűrés: Szolgáltatást nyújtani hiba esetén isoműködés közben: hibakezelés, redundancia
Hiba előrejelzés: Hibák és hatásuk becsléseomérés és „jóslás”, megelőző karbantartás
15
Hibatűrő rendszerek
Fel kell készülni a működés közbeni hibákra!
Hibatűrés: Szolgáltatást nyújtani hiba esetén isoműködés közbeni autonóm hibakezeléso beavatkozás a meghibásodás hibajelenség láncba
Alapfeltétel: Redundancia (tartalékolás)o többlet erőforrások a hibás komponensek kiváltására
16
Redundancia megjelenése1. Hardver redundancia
o többlet hardver erőforrások• eleve a rendszerben lévők (elosztott rendszer)• hibatűréshez betervezett (tartalék)
2. Szoftver redundanciao többlet szoftver modulok
3. Információ redundanciao többlet információ a hibajavítás érdekében
• hibajavító kódolás (ECC)
4. Idő redundanciao ismételt végrehajtás, hibakezelés többlet ideje
Együttes megjelenés!
17
Redundancia típusai
Hidegtartalék (passzív redundancia)
Langyos tartalék
Meleg tartalék (aktív redundancia)
18
Költségoptimalizálás
Hibatűrés mértéke
Hibatűrés költsége
Kialakítás költsége
Kiesés költsége
Eredő
Optimum
19
Tartalomjegyzék
A szolgáltatásbiztonság fogalma
A szolgáltatásbiztonságot befolyásoló tényezők
A szolgáltatásbiztonság eszközei
Szolgáltatásbiztonság analízise
20
Szolgáltatásbiztonság analízise Feladatok:
o Hibamódok, meghibásodások azonosításao Analízis: kvalitatív és kvantitatívo…
21
Példa: szolgáltatásbiztonság analízise
Feladat: Milyen meghibásodások esetén nem lesz elérhető a szolgáltatás (webáruház)?
22
Feladat: Meghibásodások azonosítása Milyen meghibásodás esetén nem lesz elérhető a
szolgáltatás (webáruház)?
Áramkimaradás, HW hiba, hálózati elem/kábel hiba, szerver szolgáltatások hibája, alkalmazás hiba, frissítés telepítése, túlterhelés, támadás, félrekonfigurálás, verzió inkompatibilitás, vírus…
Hogyan lehetne ezeket szisztematikusan összegyűjteni?
23
Hibamód és hatás analízis (FMEA) Meghibásodás és hatásaik felsorolása
Komponens Hibamód Valószínűség Hatás
Webszerver HW hiba 10% Szolg. kiesés, alkatrész csere
SW frissítés 80% Időleges kiesés
SQL szerver Lemez megtelik 20%
Csak statikus tartalom érhető el
…
24
Hibafa (Fault tree) Hogyan állhat elő a gyökérben lévő hibajelenség?
Elemek (részlet)o AND kapuo OR kapuo Téglalap: köztes eseményo Kör: alapszintű meghibásodásoko „Gyémánt”: nem kibontott esemény
25
Szolgáltatásbiztonság analízise Feladatok:
o Hibamódok, meghibásodások azonosításao Analízis: kvalitatív és kvantitatívo …
Módszereko Ellenőrző listáko Táblázatok (pl. FMEA: Failure Mode and Effect Analysis)o Hibafáko Állapot alapú módszerek (pl. Petri hálók)o …
26
Példa: hibatűrés beépítése
27
Példa: hibatűrés beépítése
Másodlagos DNS szerver alkalmazása
Terheléselosztó fürt
Hálózati utak duplikálása Melegtartalék
SQL szerver
2. ISP használata
Melyik megoldás(oka)t éri meg használni?
28
Analízis: hibafa SHARPE eszköz Hibafa rajzolása
29
Hibafa – analízis Kvalitatív:
o egyszeres hibapont (SPOF) azonosításao kritikus esemény: több úton is hibajelenséget okoz
Kvantitatív:o alapszintű eseményekhez valószínűség rendeléseo gyökérelem jellemzőjének (pl. megbízhatóság)
számolásao Probléma: honnan lesznek jó bemenő adataink?
30
Meghibásodási adatok Analízis alapja: meghibásodási valószínűségek Honnan lesznek jó adatok:
o Becsléso Saját monitorozó rendszero Külső tanulmányok, számok (hihetőség, pontosság?)
Példák:o Cisco switch MTBF ~ 200000 óra (=22,8 év)o IBM S/390 mainframe MTTF 45 évoWindows XP MTTF 608 óraowebszerver MTTF ~ 16 nap…
31
Meghibásodási adatok – példa
Forrás: Jeff Dean, „Designs, Lessons and Advice from Building Large Distributed Systems”, Google
32
Időzített Petri hálók Elemek:
Helyek (kör), tokenek (Figyelem ez csak most, csak itt jelent állapotot!)
Átmenetek (téglalap) Időzítés rendelése az átmenetekhez
Determinisztikus Valószínűségi eloszlás alapján
Alap meghibásodási blokkok:
33
Analízis: Petri-háló TimeNET eszköz Alap blokkok és paraméterek
34
Analízis: Petri-hálóA teljesmodell:
35
Analízis: érzékenység és költségvizsgálat Érzékenység: melyik paraméter változása
befolyásol a legjobban:
Költségoptimalizálás:Költség Rendelkezésre állás Kiesés Kiesés költsége Nyereség
Alapmodell 0 0,904 34,931Tartalék SQL 0,913 31,792Tartalék web 0,921 28,945Tartalék mindkettőből 0,930 25,733Web szerver 0,914 31,463SQL szerver 0,914 31,536Web szerver + tartalék 0,933 24,565SQL szerver + tartalék 0,936 23,506
3 493 050,000500 000 3 179 150,000 -186 100,000500 000 2 894 450,000 98 600,000
1 000 000 2 573 250,000 -80 200,0001 000 000 3 146 300,000 -653 250,0002 000 000 3 153 600,000 -1 660 550,0002 000 000 2 456 450,000 -963 400,0003 000 000 2 350 600,000 -1 857 550,000
36
Példa: hibatűrés beépítése
Hibatűrő a rendszerünk?
37
Példa: hibatűrés beépítése
Hibatűrő a rendszerünk?
Attól függ:o Bizonyos SPOF-ek ellen védekeztünk
DEo sok kiesési lehetőség maradt mégo Adatok törlése, teljes szerverterem elpusztulása,
adminisztrátori hibák, OS hotfix miatti újraindítás…
38
Példa: hibatűrés beépítése
Tanulság: mindig tudjuk, hogy• mi ellen akarunk védekezni,• milyen módszerek vannak arra,• megéri-e védekezni.
39
Összefoglalás Szolgáltatásbiztonság
o Jellemzők, hatáslánc, eszközök
Hibatűréso Redundancia megjelenése
Analízis: oMérnöki és matematikai módszereko Hibamódok azonosításaoMegfelelő védekezési módszer kiválasztása