Gyors hibahely azonosítás optikai hálózatokban
Rónyai Lajos (BME MI, Sztaki) és Tapolcai János (TMIT)
1
High Speed Networks Laboratoryhttp://hsnlab.tmit.bme.hu
BME Matematikai Modellalkotás Szemináriuma
• A legtöbb hiba kábelszakadás• 200km kábel évente átlagosan egyszer szakad el
• Kábelszakadás esetén az optikai kapcsolatokat minél hamarabb helyre kell állítani • Mielőtt a magasabb rétegekben (pl. IP) elindul a
helyreállítás (100ms)
Optikai hálózatok
22
• Teljesen statikus• Hozzárendelt védelem
• Dinamikus kapcsolás a hiba helyének ismerete nélkül• Megosztott védelem
• Dinamikus kapcsolás a hiba hely ismerete alapján• Helyreállítás
Védelmi megoldások optikai hálózatban
3
AmsterdamLondon
Brussels
Paris
Zurich
Milan
Berlin
Vienna
PragueMunich
Rome
Hamburg
Lyon
Frankfurt
Strasbourg
Zagreb
• Célunk optikai gerinchálózatban gyorsan és hatékonyan meghatározni a szakadás helyét
• „In band” vs „Out-of-the band” monitorozás• Link monitorozás
• Minden csomópontban létezik egy monitorozó eszköz
Motiváció
4
STTL
SNFC
CHCG
NYCM
LSAN
LSVG
SLKC
DNVR KSCY
TULS
CLEV
STLS
WASH
BSTN
CHRL
DTRT
TRNT
ATLN
IPLS
HSTN
DLLSELPS
NSVL
MIAM
MPLS
NWOR
• Monitorozó körök segítségével
• Ismert a hálózat topológia• Kétszeresen összefüggő
• Célunk linkhiba (kábelszakadás) lokalizációja• A teljes hossz és a monitorozó eszközök száma együtt
* monitorok száma + teljes hossz
Egyszeres optikai link hiba monitorozás kevesebb monitorozó eszköz segítségével
5
0
1 2
3
Hiba kód tábla c2 c1 c0
0-1 0 0 10-2 0 1 00-3 0 1 11-2 1 0 0
1-3 1 0 12-3 1 1 0
c0c1
c2
0-3 0 1 1
Monitorok száma= 3
Teljes hossz= 9
• Ha található a gráfban 2 fokszámú pont, akkor a körök segítségével a két szomszédos él már megkülönböztethetetlen:
• Használjunk körök helyett sétákat
Optikai link hiba monitorozás sétákkal
6
2
0 3
14
(b) An m-trail solution
t1
t0
t2
(0,1) 1 0 1 5(0,2) 1 1 1 7(0,3) 1 0 0 4(1,2) 0 1 1 3(1,3) 1 1 0 6(2,4) 0 0 1 1(3,4) 0 1 0 2
t2 t1 t0Link
(c) Alarm code table
Decimal
(a) m-trail
R
T
ab
c
d
e
• N. Harvey, M. Patrascu, Y. Wen, S. Yekhanin, and V. Chan, “Non-Adaptive Fault Diagnosis for All-Optical Networks via Combinatorial Group Testing on Graphs,” in IEEE INFOCOM, 2007, pp. 697–705.• MIT, Harvey 2006-ban Machtey-díjat nyert, Patrascu pedig 2008
Optikai link hiba monitorozás tetszőleges összefüggő gráffal
7
Optical loopback switching
• Adva van egy G=(V,E) irányítatlan gráf• 2 él-összefüggő
• Cél: minimális számú monitorozó tree/trail/cycle kialakítása a gráfban úgy, hogy ne legyen két olyan él, amelyen pontosan ugyanazok az tree/trail/cycle mennek keresztül.
• Cél: élekhez egyedi nem nulla kódokat rendelünk úgy, hogy az azonos helyértékhez tartozó 1 bitekre teljesüljön • M-tree – összefüggő részgráfok• M-trail – séták (ez irányított G gráfra is
érdekes kérdés lenne)• M-cycle – zárt séták
A feladat
8
Monitorok száma log (élszám+1)
0
1 2
3
001 010011
100
101
110
• Monitorozó séták száma = élszám/2
• Az e és f él megkülönböztetéséhez kell egy olyan monitorozó út, ami n-ben végződik.
• Minden út két pontban végződhet, azaz 2*[monitorok száma] [pontok száma]
Gyűrű topológia
9
f
en
• 2log(élszám+1) összefüggő gráf (m-tree)• Monitorok száma =log(élszám+1)• Nash-Williams és Tutte tétele: minden 2k él-összefüggő gráf k
diszjunkt feszítőfát tartalmaz• 2log(élszám+1) összefüggő
Nagyon összefüggő gráf
10
• b=log(élszám+1) független feszítőfa• i. feszítőfához rendelt kódban az i. bit 1• Ekkor az i. bithez tartozó élek garantáltan összefüggőek
lesznek (sőt kifeszítik az egész gráfot)• A b hosszú bináris kódokat b vödörbe csoportosítjuk, és
minden vödörben legalább és legfeljebb kód kerül.• Indukció: rekurzív konstrukció
• b=1,2 jó• b-re van megoldásunk
Nagyon összefüggő gráf
11
1 2 b
• Csapjunk a végére 0 bitet b+1 bites kódjaink
• Csapjunk a végére 1 bitet a maradék b+1 bites kódjaink
• A második csoportból tegyünk át megfelelő darab kódot az utolsó vödörbe.
• Ha b 3 a független feszítő fák miatt igaz
• Teljes gráfra igaz ha V 18
Nagyon összefüggő gráf
12
1 2 b b+1
•Véletlen módon generáltunk 5320 topológiát• 20, 30, 40, 50, 60
csomópontos• Kezdetben gyűrű és
folyamatosan véletlenül belehúzunk húrokat
• 30 véletlen gráf sorozat• 95% konfidencia intervallum
Topológia elemzés
13
• Heurisztikával kiértékeltük őket
Szimulációs tapasztalatok
14
• Bin Wu, P.-H. Ho, and K. Yeung, “Monitoring trail: a new paradigm for fast link failure localization in WDM mesh networks,” in IEEE GLOBECOM ’08, 2008.
• Egészértékű lineáris programként (ILP,MIP) fogalmazták és oldották meg a feladatot
Egészértékű lineáris program
15
ILP számítási idő = 9573.47 sec ~ 2:30óra
A becsült optimumhoz képest = 20.41%
Monitorozó séták száma = 11
Költség=98
1
2
3
4
5
6
7 8 9
12
14
10
11
13
15
16 17
18
20
19
t0
0
1
2
3
4
5
6
7 8 9
12
14
10
11
13
15
16 17
18
20
19
t1
0
1
2
3
4
5
6
7 8 9
12
14
10
11
13
15
16 17
18
20
19
t2
0
1
2
3
4
5
6
7 8 9
12
14
10
11
13
15
16 17
18
20
19
t3
0
1
2
3
4
5
6
7 8 9
12
14
10
11
13
15
16 17
18
20
19
t4
0
1
2
3
4
5
6
7 8 9
12
14
10
11
13
15
16 17
18
20
19
t5
0
1
2
3
4
5
6
7 8 9
12
14
10
11
13
15
16 17
18
20
19
t6
0
1
2
3
4
5
6
7 8 9
12
14
10
11
13
15
16 17
18
20
19
t7
0
1
2
3
4
5
6
7 8 9
12
14
10
11
13
15
16 17
18
20
19
t8
0
1
2
3
4
5
6
7 8 9
12
14
10
11
13
15
16 17
18
20
19
t9
0
1
2
3
4
5
6
7 8 9
12
14
10
11
13
15
16 17
18
20
19
t10
0
=5
1. tulajdonság: minden él egyedi kódot kapjon• Unambiguous Failure Localization (UFL)
2. tulajdonság: minden bitpozícióban az ”1” bites élek sétát formáljanak
• S. Ahuja, S. Ramasubramanian, and M. Krunz, “SRLG Failure Localization in All-Optical Networks Using Monitoring Cycles and Paths,” in IEEE INFOCOM ’08
• 1. tulajdonság volt a cél és a 2. tulajdonság a módszerükre automatikusan teljesült
• Köröket adtak hozzá a gráfhoz, amíg minden él egyedi kódot kapott
• 2. tulajdonság volt a cél és az 1. tulajdonság a módszerünknél automatikusan teljesült
• Sokkal hatékonyabb, ha a séták számát szeretnénk minimalizálni
Heurisztikus megoldás
16
• Egyedi bináris kódot generálunk véletlen sorrendben az élekhez• Helyiértékenként külön-külön
fogjuk a problémát kezelni• Kezdjük a legkisebb helyiértékű
bittel és megjelöljük azokat az éleket, amelyeknél 1-bit szerepelt az adott helyiértéken
• Cél, hogy ezek egy sétát formáljanak
Heurisztika alapötlete
17
Nincs párja:
00010011
0010
010101
11
1001
1010
1011
1101
0110
1110 1100
0100
1000 1111
• Minden linknek vagy van párja • Ahol a bináris kód teljesen azonos kivéve az adott helyiértéken
• Az egyik él benne van a megjelölt élhalmazban a másik nincs• Ha megcserélnénk a két él kódját, akkor csak az adott helyiértékhez
tartozó élhalmazban történne változás• Nem mindig létezik pár
• 0000 kódot nem választhatjuk (1 link kivétel)• Vagy nem használtuk fel a kódpárját (szabadon ki-be tehető)
• Mohó kódcserék• Euler tételei alapján
megpróbáljuk javítani őket• Páratlan fokszámú pontból
legfeljebb 2 legyen• Összefüggő legyen az
élhalmaz• Majd ezt folytatjuk a többi
helyiértékkel• Amíg mindenhol sétát kapunk• Ha elakadtunk, megismételjük
a véletlen kód hozzárendelést, és esetleg növeljük a bitek számát
Heurisztika alapötlete
18
Nincs párja:
00010011
0010
010101
11
1001
1010
1011
1101
0110
1110 1100
0100
10001111
Heurisztika teljesítménye az ILP-hez képest
19
• Az elméleti minimum log(élszám-1) szinte mindig elérhető, ha nincsenek 2 fokú pontok a hálózatban
• 2 fokszámú pontok száma erősen befolyásolja az m-trailek számát
Ökölszabály a topológia elemzés eredményeként
20
1
2
3
4
5
6
7 8 9
12
14
10
11
13
15
16 17
18
20
19
0
• Ellenpélda • csupa harmadfokú pont• Monitorok száma lineáris a gráf méretéhez képest
Fokszám önmagában kevés
21
• Korábbi eredmény n x n négyzetrácsra
• N. Harvey, M. Patrascu, Y. Wen, S. Yekhanin, and V. Chan, “Non-Adaptive Fault Diagnosis for All-Optical Networks via Combinatorial Group Testing on Graphs,” in IEEE INFOCOM, 2007
• Majdnem optimális megoldás• Közel az információelméleti határhoz
Négyzetrács
22
log2(#links+1)4 + log2(#links+1) #mtrails
3x5
• Síkbarajzolható• Legnagyobb fokszáma 4• Nagy a gráf átmérője
• Két m-trailt hozzáadunk
Csokoládé gráf (m-trail)
23
[11]
[10]
[01]
[00]
Egyedi kódok
Egyedi kódok
Egyedi kódok
• n darab b hosszú bitvektort generálunk: r1,r2,…,rn
Csokoládé gráf
24
1. az ri mind különböző legyen, és ne legyen csupa nulla2. az ri ri+1 mind különböző legyen3. az ri és rn első bitje azonos legyen
• Absztrakt algebra• Galois testek
• Két művelet: összeadás és szorzás• q=2b elemű lesz jó
Bitvektorok generálása r1,r2,…,rn
25
100
010
001
110
011
111
101
110
011
111
101
100
010
001
• Polinomokkal ábrázoljuk az elemeit• b-nél kisebb fokú és F2 felett
• Pl. b=3 esetén [1 0 1] 1+ x2
• Kiválasztunk egy irreducibilis polinomot (R), amely foka b F2
felett.• F8–hoz például
• A operátor a két polinom összeadása (modulo R), F2 felett• Ez bitenkénti kizáró VAGY-nak felel meg
[1 1 1] [1 0 1] = [0 1 0]• A * operátor két polinom szorzásának modulo R, F2 felett
• Létezik primitív elem : az ő hatványai mind különbözőek
Galois testek
26
• Ha i j
• viszont 1 0, azaz i= j ami ellentmondás.
A konstrukció ellenőrzése
27
• Csokoládé gráfra generált megoldásokat általánosítjuk• A kód első fele az él függőleges értéket adja meg• A kód második fele az él vízszintes értéket adja meg
Tetszőleges négyzetrácsra (m-tree)
28
Benchmarks
29
[1] J. Tapolcai, Bin Wu, Pin-Han Ho, "On Monitoring and Failure Localization in Mesh All-Optical Networks", In Proc. IEEE INFOCOM, Rio de Janero, Brasil, pp. 1008-1016, 2009. [acceptance rate 19.7%]
[2] J. Tapolcai, L. Rónyai, Pin-Han Ho, "Optimal Solutions for Single Fault Localization in Two Dimensional Lattice Networks", In Proc. IEEE INFOCOM Mini-Symposium, San Diego, CA, USA, 2010. [acceptance rate 24.2%]
[3] Bin Wu, Pin-Han Ho, J. Tapolcai, X. Jiang, "A Novel Framework of Fast and Unambiguous Link Failure Localization via Monitoring Trails", In Proc. IEEE INFOCOM, Work in Progress Track, 2010.
[4] Bin Wu, Pin-Han Ho, J. Tapolcai, P. Babarczi, "Optimal Allocation of Monitoring Trails for Fast SRLG Failure Localization in All-Optical Networks", In Proc. IEEE Global Telecommunications Conference (GLOBECOM), Miami, Florida, USA, 2010.
[5] P. Babarczi, J. Tapolcai, Pin-Han Ho, Bin Wu, "SRLG failure localization in transparent optical mesh networks with monitoring trees and trails", In International Conference on Transparent Optical Networks (ICTON), pp. 1 -4, 2010.
[6] P. Babarczi, J. Tapolcai, Pin-Han Ho, "Adjacent Link Failure Localization with Monitoring Trails in All-Optical Mesh Networks", IEEE/ACM Transactions on Networking, 2011. [Accepted for future publication, impact factor (in 2009) 2.051]
[7] J. Tapolcai, Pin-Han Ho, Bin Wu, L. Rónyai, "A Novel Approach for Failure Localization in All-Optical Mesh Networks", IEEE/ACM Transactions on Networking, 2011. [Accepted for future publication, impact factor (in 2009) 2.051]
[8] Bin Wu, Pin-Han Ho, K.L. Yeung, J. Tapolcai, H.T. Mouftah, "Optical Layer Monitoring Schemes for Fast Link Failure Localization in All-Optical Networks", IEEE Comm. Surveys & Tutorials, 2011. [Accepted for future publication, impact factor (in 2009) 1.7]
Hivatkozások
30
• It scales very well with the size of network~ log2(#links-1)
• We gave a fast and efficient algorithm on m-trail design problem http://opti.tmit.bme.hu/~tapolcai/mtrail/
• We gave a polynomial time essentially optimal construction for m-trees to achieve UFL in 2D lattice networks
• Practical aspects • Relatively sparse graphs with low nodal degree• Large diameter• Benchmarking
• Future Work• Improve the construction for general graphs
Conclusions
31
• We need codes where the bitwise or of any two codes is unique
• Strongly union-free sets• The alarm code is the characteristic vector of a set• Péter Frankl, Zoltán Füredi, Pál Erdős, Miklós Ruszinkó
Dual Failures
32
0
1 2
3
Alarm code table
c2 c1 c0
0-1 0 0 10-2 0 1 00-3 0 1 11-2 1 0 0
1-3 1 0 12-3 1 1 0
c0c1
c2
0 1 10-20-1
• Combinatorial Group Testing• Non-adaptive• 1942 Washington, DC
• Searching for syphilitic antigen in blood samples with chemical analysis
• It might be economical to pool the blood samples, since there are only a few blood samples with syphilitic antigen • Annals of Mathematical Statistics
• Statistical „group test”• 1973 Gyula O. H. Katona emphasized the combinatorial
aspect of group testing• 1987 F. K. Hwang, V. T. Sós :number of tests O(d2 log E),
where E is the number of elements• 2007 Eppstein, Goodrich, Hirschberg : more efficient code
for real size problems • Superimposed Codes
Multiple failures (maximum d failure)
33