Primjena metode nezavisnih komponenti ( ICA ) u EEGLAB

Embed Size (px)

DESCRIPTION

ICA, EEGLAB

Citation preview

Univerzitet u SarajevuElektrotehniki fakultet SarajevoOdsjek: Automatika i elektronikaKolegij: Biomedicinski signali i sistemi

Primjena metode nezavisnih komponenti ( ICA ) u EEGLAB-u

1. UvodU mnogim dananjim aplikacijama za obradu signala pojavljuju se signali koji se sastoje od skupa mijeanih signala. To su uglavnom signali koji nisu dostupni u izvornom obliku. Pravi problem razdvajanja skupa signala nastaje kada nije mogue kontrolirati mijeanje izvornih signala. Kada bi se izvorni signal mogao izdvojiti iz nekog mijeanog signala omoguio bi znatnu primjenu u praktinim aplikacijama. Velika primjena mogua je pri razdvajanju biomedicinskih signala u elektromiogramu (EMG) i elektroencefalogramu (EEG). U ovom radu bavit emo se primjenom metode nezavisnih komponenti za analizu EEG-a. Elektroencefalogram registruje elektrine impulse koji se javljaju u mozgu preko elektroda postavljenih na kou lubanje i snima ih na papir koritenjem elektroencefalografa. To je snimak modane aktivnosti koji je rezultat milijarde neuronskih elija u mozgu. EEG moe pomoi u dijagnozi epilepsije, modanih udara, potresa mozga i drugih fiziolokih problema. Uzorak EEG aktivnosti se mijenja shodno uzbuenosti pacijenta, to daje uvid u modanu aktivnost i otvara brojna polja u oblasti istraivanja i razumijevanja ljudskog organizma. U tom smislu od posebnog su znaaja aplikacije tipa brain-machine okruenja u kojima se heuristika znanja iz oblasti analize i tumaenja EEG signala koriste kao ulazi i slue kao jedina informacija koja upravlja ureajima koji su korisni i vani za normalan ivot osoba sa nekim disfunkcijama, poput npr. kolica za nepokretne i nijeme osobe. Zato je od izuzetnog znaaja ispravno i vjerodostojno analiziranje i tumaenje EEG signala, a posebno pronalaenje izvora tih signala. S tim u vezi, metoda nezavisnih komponenti daje vane rezultate i u ovom radu pokuat emo date osnovnu matematsku osnovu za koritenje ovog aparata i opisati njegovu primjenu u okvirima koje prua EEGLAB toolbox u MATLAB-u. EEGLAB je interaktivni MATLAB toolbox koji se koristi za obradu kontinualnih i dogaajno vezanih EEG, MEG i drugih elektrofiziolokih podataka iji se postupci obrade zasnivaju na analizi nezavisnih komponenti (ICA), vremensko-frekventnoj analizi, izbacivanju artefakta, statistikoj analizi vezanoj uz dogaaje. Sadri takoer nekoliko korisnih naina vizualizacije srednje vrijednosti podataka i vrijednosti zabiljeenih iz jednog ispitivanja (pri emu ispitivanje oznaava jedan vremenski interval u kojem se desi relevantni dogaaj unutar snimljene sekvence podataka). EEGLAB prua interaktivno grafiko korisniko okruenje (GUI) koje omoguava korisnicima da fleksibilno i interaktivno obrauju EEG signale i druge dinamike podatke vezane za modane signale, koristei analizu nezavisnih komponenti (ICA) i/ili vremensko-frekventnu analizu (TFA), kao i standardne metode usrednjavanja.

2. Metoda nezavisnih komponenti (Independent component analysis-ICA)

2.1 Slijepa separacija signala (BSS)Pretpostavite da ste prislukivali na zabavi gdje je bilo mnogo ljudi koji su priali istovremeno. ta biste uli? Vjerovatno, to bi bila mjeavina svih razgovora koja ne bi bila ba akustina i razumljiva. Sigurno bi glas govornika koji su blii sluaocu (mikrofonu) dominirali nad onim udaljenijim govornicima u odnosu na posmatrani mikrofon, ali ipak nije jednostavno razdvojiti pojedinane glasove svih govornika niti ak identificirati njihov broj, ukoliko ih je bilo mnogo u istoj prostoriji. Ovakva situacija nas dovodi do vanog pitanja, a to je moe li osoba koja prislukuje na nekoj zabavi izdovojiti glasove pojedinih govornika iz mjeavine snimljenih glasova koje opaa bez ikakvog znanja o tome koliko je ljudi prisutno i gdje se nalaze u prostoriji? Prethodno opisani scenario se obino vezuje za naziv cocktail-party problem. Takav problem nastojanja da se razdvoji grupa izmjeanih signala bez ikakvog znanja o broju izvornih signala ili o nainu njihove meusobne povezanosti se zove slijepa separacija signala ili slijepa separacija izvora. U tom smislu posmatra je 'slijep' prema znanju o broju izvornih tj. originalnih signla i nainima njihove meusobne povezanosti. Ako je n govornika u prostoriji i njihovi glasovi su snimljeni sa m mikrofona, tada kaemo da se radi o sistemu reda n x m.Na primjer, neka je n=m=2 i s1(t) i s2(t) neka budu originalni signali izvora, a neka su x1(t) i x2(t) dva snimljena signala. Dalje, ako su snimljeni signali linearno povezani sa izvornim signalima, tada vrijedi:

gdje su h11, h12, h21, h22 nepoznati ( 'slijepi' ) koeficijenti veze koji daju snimljene signale x1(t)i x2(t).Za na rad sa EEG signalima modelirat emo sistem reda n x m gdje je n = m. Odmah se ini upitnom pretpostavka da je EEG signal snimljen sa m elektroda proizveden od tano n statistiki nezavisnih komponenti, s obzirom da ne moemo sa sigurnou znati taan broj nezavisnih komponenti koji ine snimljeni EEG signal. Ova pretpostavka je detaljnije razmotrena u potpoglavlju 2.4. Za veliki broj izvora bolja je predstava problema u matrinom obliku:

gdje su:

.

Ukoliko znamo parametre mijeanja hij , j=1, , n, i ukoliko je mijeanje uistinu bilo linearno, takav problem je mogue rijeiti jednostavnim invertiranjem matrice mijeanja H. Meutim, cijela filozofija slijepe separacije signala je u tome to se zapravo ne poznaju ni parametri mijeanja hij, j= 1, , n, niti izvori sj(t) , j=1, , n, to BSS ini znaajno kompleksnim problemom. Matrina predstava data jednainom 2.1 se uklapa u nae potrebe s obzirom da je u EEG signalu takoer nepoznato, tanije nemogue znati nain na koji su signali izmijeani u mozgu prije nego su snimljeni koritenjem odgovarajuih elektroda. Podaci snimljeni elektrodama su mjeavina beskorisnih artefakata miia koji se manifestuju na koi lubanje i korisnog signala iz mozga. Algoritam koji razdvaja izmijeana oitanja sa elektroda sastavljena od artefakata miia i korisnog signala, kao jedinu informaciju ima snimljene potencijale elektroda bez znanja o nainu njihove povezanosti. Jedan od naina da se rijei ovaj problem bio bi da se koristi temeljna statistika svojstva signala sj(t) da bi se aproksimirali kako hij , j=1, , n, tako i sj(t) , j=1, , n. Metoda nezavisnih komponenti upravo nastoji postii takav rezultat.Preostali dio ovog poglavlja se bavi osnovnim znanjima ICA pristupa, njenih pretpostavki, nejasnoa i primjene na EEG signale. Kao zavrni dio ovog poglavlja izveden je Bell-Sejnowski ICA algoritam maksimizacije informacije tzv. infomax i data je njegova implementacija u Matlabu, koji je u EEGLAB toolboxu implementiran kroz funkciju runica().2.2 ta uopte predstavlja ICA?Metoda nezavisnih komponenti (Independent Component Analysis-ICA), kao to i samo ime da naslutiti, moe se definisati kao metod rastavljanja grupe multivarijantnih podataka u njihove izvorne, fundamentalne statistiki nezavisne komponente. Hyvarinen i Oja [1] strogo definiraju ICA-u koritenjem modela statistiki latentnih varijabli. U okviru ovog modela vri se opaanje n sluajnih varijabli x1, x2, , xn , koje su linearne kombinacije n sluajnih latentnih varijabli s1, s2, , sn , kao:

za sve i = 1, , n , gdje su aij j=1,...,n , neki realni koeficijenti. Po definiciji , izvori sj(t) , j=1, , n su statistiki nezavisni. Latentne varijable su izvori sj(t) , j=1, , n, koji se jo nazivaju i nezavisne komponente. Oni se nazivaju latentnim (skrivenim) zbog toga to se ne mogu direktno mjeriti. Nezavisni komponente ili izvori sj(t) , j=1, , n, kao i koeficijenti mijeanja aij i,j=1, , n , su nepoznati i moraju se odrediti ili procijeniti koritenjem izmjerenih podataka xi , i=1, , n.

Multivarijantni podaci se mogu dobiti iz raznih izvora , kao to su:1. Audio signali, kao to su oni iz primjera cocktail party problema, koji smo prethodno izloili, gdje se ICA koristi da se razdvoje pojedini govornici iz podataka snimljenih iz vie mikrofona2. Biomedicinski podaci, kao to su elektroencefalogramu (EEG) i magnetoencefalogram (MEG) gdje je cilj da se izbace ometajui artefakti miia kao to su treptaji oka, pomjeranje glave, otkucaji srca, disanje itd. , ali i da se doe do informacije o izvornim nezavisnim signalima3. Slike sa satelite gdje se ICA koristi da se izdvoje odgovarajui sadraji4. Telekomunikacije , posebno CDMA tehnologija.

ICA model sa latentnim varijablama se bolje moe predstaviti koritenjem matrine forme. Ako S = [s1, s2, s3, , sn]T predstavljaju originalne multivarijantne podatke koji su transformisani kroz matricu neke transformacije H, dajui X ,tako da vrijedi:

ICA algoritam zatim pokuava identificirati takvu matricu razdvajanja W da vrijedi:

i da je rezultujua matrica Y :

Kao to je ranije konstatovano, jedina stvar koji ICA zahtijeva jeste da izvorni signali s1, s2, sn, budu statistiki nezavisni i da mijeanje signala bude linearno.2.3 Pretpostavke za primjenu ICA-eSljedee pretpostavke obezbjeuju da ICA modeli procijene nezavisne izvore svrsishodno. Ustvari, prva pretpostavka je jedini pravi uslov koji ICA zahtjeva. Ostale pretpostavke obezbjeuju da su procijenjene nezavisne komponente jedinstvene, tj. da bi se garantovala konvergencija jedinstvenom rjeenju i njegova egzistencija moraju biti zadovoljenje sljedee pretpostavke:

1. Latentne varijable (ili nezavisne komponente) su statistiki nezavisne i mijeanje je linearno.2. Nema vie od jednog signala sa Gaussovom raspodjelom meu latentnim varijablama i latentne varijable imaju kumulativnu gustinu raspodjele ne puno razliitu od sigmoidne.3. Broj praenih signala m je vei ili jednak od broja latentnih varijabli n tj. . U sluaju da je dobivamo specijalnu kategoriju ICA-e u kojoj mjereni signali nemaju dovoljno informacija za razdvajanje nezavisnih komponenti. Postoje pokuaji rjeavanja ovakvih problema, ali ne postoje strogi dokazi za ekzistenciju takvog rjeenja. Ukoliko je , tada postoji redundancija ili predefinisanost sistema koji je mogue rjeiti u smislu najmanjih kvadrata. ICA model najbolje radi za sluaj kada je .4. Matrica mijeanja ima puni rang kolona, to znai da su redovi matrice mijeanja linearno nezavisni. Ukoliko matrica mijeanja nema puni rang, to znai da su mjereni signali linearne kombinacije jedni drugih.5. Vrijeme prenoenja signala kroz medij je zanemarivo

2.4 ICA model primjenjen na EEG podatkeU sluaju EEG signala imamo m elektroda postavljenih na kou lubanje ( u nastavku skalp elektrode) kojima se snimaju korelisani signali iz mozga. Pri tome nastojimo saznati koji korisni nezavisni signali iz modanih izvora prozvode ove signale. ICA model se pokazao kao model koji se jako dobro uklapa u ovaj scenario jer isti zadovoljava veinu pretpostavki datih u potpoglavlju 2.3. Polazimo od pretpostavke da se EEG signali mogu modelirati kao kolekcija ili skup statistiki nezavisnih modanih signala. Pretpostavka pod rednim brojem 5 iz potpoglavlja 2.3 je ispravna jer prenosni medij iz okoline mozga posmatrane signale prenosi trenutano, kao to je i pretpostavka pod rednim brojem 2 prihvatljiva. U ovom radu nastojat emo da m izmjerenih EEG signala razdvojimo u n statistiki nezavisnih komponenti, pretpostavljajui pri tome da su zadovoljene pretpostavke 3 i 4 iz potpoglavlja 2.3. U svakom sluaju, ostaje upitna pretpostaka da li je EEG signal snimljen pomou m elektroda proizvod mijeanja tano n izvora, jer ne moemo pouzdano znati taan broj nezavisnih izvora koji ini EEG snimljeni signal. Bez obzira na to ova pretpostavka je obino dovoljna da se identifikuju i razdvoje artefakti koji su koncentrisani u pojedinim podrujima mozga kao to su potiljani i sljepooni artefakti. ICA model tei veem vremenu razdvajanja artefakta koji su vie proireni du lubanje, kao to su artefakti miia.

2.5 Vieznanosti i neodreenosti u ICA rjeenjimaS obzirom da je pretpostavka 1 iz potpoglavlja 2.3 jedini zahtjev koji se uvijek striktno zahtijeva i zato to su istovremeno matrica mijeanja H i matrica izvora S , pripadno rjeenje e uvijek imati sljedee vieznanosti i/ili neodreenosti . Za potpuniji uvid vezan za ovu tematiku mogue je konsultirati knjigu o ICA-i autora Hyvarinen i Oja [1].Vieznanosti i neodreenosti ICA algoritma su:

1. Nije mogue mjeriti energije nezavisnih komponenti, zbog toga to su istovremeno nepoznate matrice H i S. Prema tome, mnoenje matrice S sa konstantom moe biti poniteno dijeljenjem matrice H istim koeficijentom i obrnuto:

Prema tome bilo koja kombinacija mnoenja jedne matrice nekom konstantom i dijeljenja druge istom moe dati rjeenje za H i S. Da bi se suprotstavili ovom efektu, fiksiramo magnitude nezavisnih komponenti uz pretpostavku da svaka od njih ima E{si2}=1. Kakogod, postavljanje magnituda na 1, jo uvijek nam ne pomae kada je konstanta -1. Zbog toga moemo zakljuiti da mnoenje nezavisne komponente sa -1 nee imati uticaja na ispravnost rjeenja. Stoga vrijedi da moemo reflektirati bilo koju od nezavisnih komponenti i da e rezultat i dalje biti ispravan.2. Redoslijed dobivenih nezavisnih komponenti moda nee biti isti kao redoslijed originalnih signala. Na primjer, ako je S = [s1, s2, s3]T, krajnji rezultat moe biti permutacija od Y = [s1, s2, s3]. Obrazloenje je isto kao i u prethodnom sluaju. Naime, kako su obe matrice S i H nepoznate, moemo ubaciti permutacijsku matricu P i P-1 u dobiveno rjeenje bez promjene istog:

gdje su mjereni signali u promijenjenom redoslijedu i je nova matrica razdvajanja dobivena ICA-om.

2.6 Statistika nezavisnost, nekorelisanost i izbjeljivanjeSada emo ukratko razmotriti osnovne koncepte iz teorije vjerovatnoe koje se tiu metode nezavisnih komponenti.2.6.1 Statistika nezavisnostICA algoritmi su zasnovani na pretpostavci da su originalni signali statistiki nezavisni.

Definicija: Ako su s1, s2, s3, , sn sluajne varijable i njihova zajednika funkcija gustine raspodjele je jednaka proizvodu njihovih graninih vjerovatnoa , tada su s1, s2, s3, , sn , definisani kao statistiki nezavisni:

f(s1, s2, s3, , sn) = f(s1) f(s2) f(s3)f(sn)

2.6.2 NekorelisanostNekorelisanost je definisana kao:

E{s1,s2,s3,,sn}=E{s1}E{s2}E{s3} E{sn} ,

gdje je E{.} operator oekivanja.Nekorelisanost je slabija od statistike nezavisnosti. Nezavisnost podrazumijeva nekorelisanost, ali nekorelisanost ne povlai uvijek statistiku nezavisnost. U svakom sluaju, postoji itava klasa sluajnih varijabli gdje nekorelisanost uvijek znai i statistiku nezavisnost. To je sluaj kada su s1, s2, s3, ,sn gausovske varijable. Pozabavit emo se gausovskim varijablama neto vie u poglavlju 2.8.

2.6.3 IzbjeljivanjeVaan korak preprocesiranja prije prosljeivanja podataka ICA algoritmu jeste izbjeljivanje. Izbjeljivanje je slabije od statistike nezavisnosti, ali je blago jai zahtjev od nekorelisanosti. Izbjeljenost vektora X sluajnih varijabli sa srednjom vrijednosti nula znai da su njegove komponente nekorelisane i da je njihova varijansa jednaka jedinici. To znai da je kovarijantna matrica od X jednaka jedininoj matrici I:

Za sluaj naih mijeanih podataka X, izbjeljivanje znai da isti transformiemo linearnom transformacijom mnoenjem drugom matricom V , tako da je rezultujua matrica Z izbjeljenja:

Vaan rezultat izbjeljivanja je to da je nova matrica mjeanja ortogonalna tj.njena inverzna matrica je jednaka transponovanoj. Izbjeljivanje samo za sebe ne garantuje statistiku nezavisnost podataka iz X , kao to emo pokazati u narednom odjeljku, ali je vaan korak u procesu razdvajanja. 2.6.4 Transformacija funkcije gustine vjerovatnoeAko je X transformisano u Y preko neke matrice transformacije, tada se gustina raspodjele Y moe predstaviti preko izvorne varijable X kao:

gdje je Jy(X) Jacobijan od Y u odnosu na X. Ako su X i Y skalarne funkcije promjenljivih x i y, onda se prethodna relacija pojednostavljuje na:

2.7 Objanjenje ICA-e preko funkcije gustine vjerovatnoeGrafika predstava promjene multivarijantne funkcije gustine vjerovatnoe u ovisnosti o mijeanju latentnih varijabli, daje bolje razumijevanje o tome kako se ICA algoritmi nose s problemom slijepe separacije. Ovo poglavlje je skraena verzija sline teme koja je detaljnije objbanjena u knjizi Hyvarinen i Oja [1]. Za vie informacije moe se konsultovati pomenuta literatura [1] u poglavlju 7.5 na strani 155 gdje predstavljena detaljna diskusija na ovu temu.Razmotrimo matricu izvora koja se sastoji od dvije statistiki nezavisne i uniformno raspodjeljenje sluajne varijable S= [s1, s2]T . Slika 2.1 prikazuje njihovu zajedniku funkciju gustine raspodjele, dobivenu crtanjem taaka iz njihova raspodjele. Primjetimo to da je njihova zajednika vjerovatnoa uniformna na kvadratu jer je prozvod njihovih graninih gustina.

Slika 2.1 Zajednika raspodjela sluajnih varijabli s1 i s2 . Horizontalna osa s1 i vertikalna osa s2.

Jasno je da su s1 i s2 statistiki nezavisne varijable jer poznavanje vrijednosti s1 u bilo kojoj taki ni na koji nain ne pomae u odreivanju vrijednosti s2 . Sada moemo pomijeati ove dvije nazavisne komponente sa bilo kojom 2x2 realnom matricom mijeanja H npr.

Na slici 2.2 je prikazana rezultujua funkcija gustine raspodjele. Vidimo da mijeanje nezavisnih komponenti donekle zakree funkciju gustoe raspodjele.

Slika 2.2 Zajednika raspodjela izmjeanih sluajnih varijabli x1 i x2 . Horizontalna osa x1 i vertikalna osa x2.

Ove dvije izmijeane varijable x1 i x2 nisu vie statistiki nezavisne jer bilo koja od njih u potpunosti odreuje vrijednost druge na svojim minimumima i maksimumima. Sada se vri izbjeljivanje ovako pomijeanih varijabli, a rezultat izbjeljivanja je prikazan na slici 2.3.

Slika 2.3 Zajednika raspodjela dobivena izbjeljivanjem pomijeanih varijabli

Raspodjela dobivena izbjeljvanjem izgleda poput inicijalne raspodjele (Slika 2.1), osim to je zarotirana oko ishodita. Sada sve postaje stvar odreivanja ugla za koji je potrebno zarotirati raspodjelu dobivenu izbjeljivanjem, kako bi se dobila izvorna forma kakvu su imale statistiki nezavisne komponente. Kao to se vidi, izbjeljivanje uklanja asimetrinost distribucije promatranih izmijeanih varijabli i znaajno pojednostavljuje proces razdvajanja, to je i razlog koritenja ovog korisnog koraka u preprocesiranju kod ICA algoritama. Moe se pokazati da izbjeljivanje pojednostavljuje proces razdvajanja ak i do 50 % [1].

2.8 Latentne varijable Gaussovog tipa se ne mogu razdvojitiU prethodnom poglavlju smo vidjeli da izbjeljivanja uklanja asimetrinost distribucije promatranih izmijeanih varijabli i ICA algoritmima ostavlja da odrede ugao rotacije potreban da se podaci vrate u izvornu, statistiki nezavisnu, formu. Meutim, ovaj proces ne funkcionie ba najbolje kada izvorne komponente imaju Gaussovu raspodjelu vjerovatnoe. Slika 2.4 prikazuje zajedniku raspodjelu dvije statistiki nezavisne sluajne varijable Gaussovog tipa s1 i s2 .

Slika 2.4 Zajednika raspodjela dvije sluajne Gaussove varijable s1 i s2Ukoliko su podaci izbjeljeni (to je uvijek sluaj), onda se moemo ograniiti mogunosti na ortogonalne matrice mijeanja (poglavlje 2.6.3). Rezultujua raspodjela, kada se dvije nezavisne Gaussove sluajne varijable s1 i s2 pomijeaju sa ortogonalno matricom mijeanja, je prikazana na slici 2.5. Primjetimo da su raspodjele vjerovatnoe originalnih i izmijeanih varijabli identine, to pokazuje da mnoenje Gaussove raspodjele ortogonalnom matricom nema efekta na raspodjelu vjerovatnoe. Kako je raspodjela simetrina, nema naina da se rotiranjem moe svesti na izvornu raspodjelu. Prema tome, metoda nezavisnih komponenti ne moe razdvojiti izmjeane latentne varijable koje su Gaussovog tipa.Meutim, ta ako su neke nezavisne komponente Gaussove, a neke nisu Gaussovog tipa? U tom sluaju metoda nezavisnih komponenti moe razdvojiti sve komponente koje nisu Gaussovog tipa jednu od druge [1]. Upravo zbog toga se uvodi druga pretpostavka, odnosno ogranienje u poglavlju 2.3, u kojem se zahtjeva da ne smije biti vie od jedne varijable Gaussovog tipa u vektoru sluajnih varijabli S.

2.9 ICA algoritam2.9.1 EntropijaEntropija H(x) varijable x, ukoliko je x kontinualna sluajna varijabla sa funkcijom gustine vjerovatnoe p(x) se definie kao:

gdje je E{.} operator oekivane vrijednosti.Ova definicija se zadrava i za multivarijantne podatke. Tako je entropija od X = [x1, x2, x3, xn]T jednaka:

Entropiju moemo shvatiti kao mjeru sluajnosti posmatrane varijable.

2.9.2 Uzajamna informacijaUkoliko je entropija mjera sluajnosti neke varijable, uzajamna informacija se moe shvatiti kao mjera istovjetnosti u nekoj sluajnoj varijabli. Ako je X = [x1, x2, x3, xn]T, neki skup multivarijantnih podataka, tada su njihova zajednika entropija H(X) i uzajamna informacija I(X) povezani sljedeom relacijom:.To znai da je uzajamna informacija I(X) jednaka razlici sume svih graninih entropija i njihove zajednike entropije H(X). Ovo je intuitivno jasno.Prema tome, ako maksimiziramo zajedniku entropiju H(X), to e minimizirati uzajamnu informaciju I(X). S druge strane, ako se uzajamna informacija multivarijantnih podataka minimizira do iznosa nula, tada e svi pojedinani elementi postati statistiki nezavisni. Ovo je rasuivanje koje su koristili Bell i Sejnowski za izvoenje svog ICA algoritma, koji smo u ovom radu predstavili. Prema tome klju dobivanja statistike nezavisnosti, samim tim i izvoenje ICA dekompozicije, postaje maksimiziranje zajednike entropije H(X).

2.9.3 Bell Sejnowski infomax algoritam

Sada emo prikazati saetak porijekla Bell Sejnowski Information Maximization algoritma. Razmatrat e se jednostavan sluaj sistema sa jednim ulazom i jednim izlazom (SISO) da bi izveli ICA algoritam. Opi sluaj sistema sa vie ulaza i vie izlaza se izvodi na slian nain sa n-dimenzionalnim matricama vektora vrijednosti sluajnih varijabli na mjestima skalarnih vrijednosti funkcija.Razmotrimo skalarnu funkciju x sa gausovskom funkcijom gustine raspodjele[footnoteRef:1] fx(x) koja prolazi kroz funkciju transformacije y = g(x) i daje izlaz sa pdf fy(y) (slika 2.6). Ovo je analogno sa matrinom operacijom: [1: U nastavku teksta emo sa skraenicom pdf oznaavati funkciju gustine vjerovatnoe (probability density function)]

Za rad sa EEG podacima kao transformacijsku funkciju emo uzeti logistiku sigmoid funkciju definisanu sa:

gdje w = koeficijent nagiba y (takoer se naziva i teina) w0 = odstupanje teina zbog podeenja dijelova sa visokom gustinom ulaza sa y (vidi sliku 2.6)

Slika 2.6 Transformacija pdf fx(x), za x kada je x pomijean sigmoid funkcijom za mijeanje

Kao to je pokazano u dijelu 2.9.2, poveanje u zajednikoj entropiji izlaza, H(y), znai smanjenje u zajednikoj informaciji. Entropija izlaza je maksimalna kada podesimo dijelove sa visokim gustinama pdf-a x-a sa dijelovima sa velikim nagibom funkcije g(x) (dakle potreba za nepristrasnou teine w0). Funkcija g(x) je monotono rastua i prema tome pdf izlaza fy(y) moe biti napisan kao funkcija pdf-a ulaza fx(x) kao:

Entropija izlaza je data sa,

Uvrtavanjem (2.20) u (2.21) dobijemo,

Sada elimo maksimizirati H(y) za statistiku nezavisnost. Ako pogledamo desnu stranu vidimo da funkcija x fiksna i jedina varijabla koju moemo mijenjati je y. Ili jo vaznije, nagib w od y. Dakle nalazimo prvi izvod H(y) uzimajui u obzir w. Drugi lan u jednaini 2.22 ne zavisi od w pa moe zanemariti. Promjena nagiba, , neophodna za maksimalnu promjenu entropije je onda:

Sada dolazimo do vanog koraka. Trebamo izraunati izvod, ali ne moemo izraunati oekivanu vrijednost. Dakle, vrimo stohastiku aproksimaciju gradijenta: da bi se rijeili oekivane vrijdnosti. Jednaina se dakle pojednostavljuje na:

Jednaina iznad predstavlja generalnu formu naina promjena teine za bilo koju transformaciju funkcije y. Za funkciju logistikog sigmoida (jed 2.19), izrazi u jednaini 2.24 su izraunati kao:

Mijenjajui izraze iznad u jednainu 2.24 dobijemo pravilo za auriranje teine za y= logistika sigmoid funkcija:

Slino, vrijednost auriranja odstupanja, , moe biti izraunata kao:

Pratei sline korake moemo izvesti pravila uenja za multivarijabile podatke za sigmoid funkciju: 2.10 Implementacija u Matlab-uJednaine 2.29 i 2.30 daju pravila uenja za auriranje teina da b se izvrila ICA. Implementirajui ih u Matlab-u e ukljuiti nalaenje inverznih funkcija, to je raunski jako osjetljivo. Zbog toga emo modifikovati jednainu 2.29 mnoenjem sa WTW (ovo ne mijenja nita poto je W ortogonalna matrica):

Nain auriranja vrijednosti odstupanja ostaje isti:

Konstanta proporcionalnosti u jednainama 2.31 i 2.32 se stopa uenja.Saeto, sljedea dva naina auriranja teina se koriste za izvrenje ICA-e u Matalb-u:

Gdje je:lrate = stopa uenjaW = matrica teinaw0= vrijednost odstupanjaI = jedinina matricay = logistiki sigmoid = u=W x podaci +w0

3. Rad sa ICA-om u EEGLAB-u

Metoda nezavisnih komponenti - ICA (Independet Component Analysis) je metoda koja se pokazala uspjenom kod odreivanja statistiki nezavisnih komponenti iz njihove mjeavine. Sljedea slika (EEG Signal Processing, Saeid Sanei, Jonathon A. Chambers) prikazuje viekanalno mjerenje EEG signala koji je rezultat modane aktivnosti iz etiri izvora S1, S2, S3 i S4. Primjenom metoda ICA mogue je izdvojiti nezavisne komponente u ovom sluaju dijelove EEG koji se odnose na elektrine aktivnosti S1, S2, S3 i S4.

Slika 3.1. Viekanalno mjerenje EEG signala koji je rezultat modane aktivnosti iz etiri izvora S1, S2, S3 i S4

Dekompozicija podataka pomou ICA metode ukljuuje linearnu promjenu podataka prikupljenih iz skalp kanala u skup linearno nezavisnih izvora pomou posebno primijenjenog prostornog filter na viekanalni skup podataka. U izvornim podacima skalp kanala, svaki red matrice za biljeenje podataka predstavlja vremensku promjenu napona saetih u razlike izmeu izvornih projekcija na jednom podatkovnom kanalu i jedne ili vie referentnih kanala. Nakon ICA dekompozicije, svaki red matrice podataka daje vremensku ovisnost jedne komponente procesa prostorno filtrirane iz kanala podataka. U sluaju ICA dekompozicije, signali koji se dobiju na izlazu filtera su maksimalno vremenski nezavisni. To su, zapravo, izvori informacija podataka ija smjesa predstavlja signale zabiljeene na skalp kanalima. Postupak mijeanja je pasivan, linearan i ne dodaje informacije podacima. Ti izvori informacija mogu predstavljati sinhronu ili djelomino sinhonu aktivnost iz jedne (ili moda i vie) kortikalnih slojeva ili aktivnosti koje potiu iz nekortikalnih izvora (npr.potencijali induciran pokretom one jabuice ili oni proizvedeni od strane miine aktivnosti, itd.).

Da bismo izraunali komponente ICA iz EEG epohe, potrebno je izabrati Tools->Run ICA. Ovo poziva funkciju pop_runica.m.

Slika 3.2. Prozor za pokretanje algoritma za raunanje ICA-e

EEGLAB sadri razliite algoritme za proraun ICA komponenti. Algoritmi koji su ve ugraeni u EEGLAB toolbox su runica i jader, koji se pokreu pozivanjem runica.m i jader.m, respektivno. Postoji i algoritam fastica iji toolbox je potrebno instalirati i ukljuiti u Matlab Path. Sva tri navedena algoritma daju priblino iste rezultate. U narednom poglavlju e detaljnije biti objanjen algoritam koriten u runica.m funkciji.Potrebno je napomenuti da ICA algoritmi najbolje rade sa velikim brojem podataka koji su meusobno slini i dovoljno oieni od uma. Ako je broj kanala N veliki (>>32), potreban je veliki broj uzoraka po svakom kanalu da bi se pronalo N nezavisnih komponenti. U suprotnom, ukoliko je broj podataka mali, moe se koristiti PCA metoda koja pronazi manje od N komponenti. Kao i za crtanje ERP slika, postoje analogne funkcije za crtanje komponenti izraunatih primjenom ICA metode.Mogue je izabrati specifine tipove kanala (ili listu brojeva kanala) koji e se koristiti za dekompoziciju.

Prikaz skalp mapa ICA komponenti u 2D biramo na Plot->Component Maps->2D, pri emu u narednom prozoru moemo odabrati broj komponenti za crtanje.

Slika 3.3 Prozor za podeavanje broja komponenti koje elimo prikazati

Kao rezultat imamo 12 nezavisnih komponenti predstavljenje svojim skalp mapama:

Slika 3.4 Prikaz odreenog broja ICA komponenti

Prepoznavanje tipova nezavisnih komponenti zahtijeva iskustvo. Glavni kriteriji kojim bi se utvrdilo je li komponenta vezana za kognitivne funkcije, artefakt miia ili neki drugi tip artefakta su skalp mapa, vremenska promjena napona komponente, spektar snage komponente. Na primjer, oko strunjaka bi primijetilo komponentu 3 (slika 9.4) kao sastavni dio artefakta oka (aktivnost komponente se moe vidjeti pozivom Plot-> Component activations (scroll)).

Takoer, plotanje moemo vriti i u 3D, izborom Plot > Component maps > In 3-D:

Slika 3.5. Prikaz ICA komponenti u 3D

Kako kao rezultat ICA dekompozicije dobijemo izvore koji se veu za raliite poticaje, mogue je izdvojiti komponente koje nam nisu relevante za na dogaaj. Odabirom Tools > Reject data using ICA > Reject components by map, dobijamo sljedei skup skalp mapa:

Slika 3.6. Prikaz ICA komponenti koji omoguava analizu osobina pojedinanih komponenti

Klikom na pojedinu skalp mapu, imamo uvid u osobine te komponente na osnovu koje moemo izviti analizu poloaja i uticaja pojedine komponente na nae rezultate. Npr. sljedea slika koja pokazuje komponentu broj 3, nam je dovoljna da uoimo da ista predstavlja artefakt oka iz tri razloga :1. Glatko smanjenje u spektru snage2. Skalp mapa pokazuje jako djelovanje komponente u prefrontalnom dijelu3. Mogue je vidjeti pojedine treptaje oka na slici ERP-a u gornjem desnom uglu

Slika 3.7. Prikaz skalp mape, spektra i ERG-a komponente 3 (artefakt oka)

Artefakti oka su skoro uvijek prisutni u EEG podacima i relativno lahko ih je identificirati u scalp topografijama. Kako nisu vani za analizu dogaajno vezanih potencijala, nerijetko ih elimo odstraniti iz podataka, pa je to mogue uiniti klikom na Accept na prethodnoj slici, pri emu e se dugme promijeniti u Reject (pri emu komponentu za izdvajanje markiramo).

Mnoge druge komponente su vezane za same modane aktivnosti. Glavni kriterij za prepoznavanje njihovih skalp mapa su :1. Skalp mape koje izgledaju kao dipol2. Pikovi na specifinim frekvencijama u spektralnoj raspodjeli snage3. Regularne ERP mape, to znai da je aktivnost prisutna u svim ispitivanjima

Na primjer, naredna slika pokazuje aktivnost u lijevim okcipitalima korteksa, pri emu se na spektralnom dijagramu uoava pik na frekvenciji od 10 Hz koja i odgovara tom dijelu mozga (alfa komponente).

Slika 3.8. Prikaz skalp mape, spektra i ERG-a komponente 2

Primjer jo jednog artefakta u naoj dekompoziciji je komponenta 32, koja je ini se tipini primjer artefakta miia. Ova komponenta je prostorno lokalizovana i pokazuje visoku snagu na viim frekvencijama (20 50 Hz i iznad), kao to je prikazano na slici ispod.

Slika 3.9. Prikaz skalp mape, spektra i ERG-a komponente 32 (artefakt miia)

Ako elimo uz prethodnu analizu otkloniti neke komponente potrebano je odabrati Tools->Remove components, koja poziva pop_subcomp.m funkciju, i odabrati eljene. Prije toga, komponenta mora biti markirana za odstranjivanje. Nakon eljenih uklanjanja, moemo i vidjeti vremensku promjenu komponenti ukoliko odaberemo Plot->Component activation (scroll).

Slika 3.10. Prikaz vremenske promjene svih komponenti

Mogue je iscrtati ERP slike, zatim spektre snage i ITC i za izraunate ICA komponente, pri emu se koriste analogne funkcije: Plot > Component spectra and maps mogue je vidjeti koje komponente najvie doprinose kojim frekvencijama u pojedinim kanalima Plot > Component ERPs - mogue je vidjeti ERP pojedinih komponenti ili paralelni prikaz vie ERP-ova od pojedinih komponenti i njihove srednje vrijednosti Plot > Component ERP image prikazuje ERP slike komponenti, mogue je sortirati ispitivanja po ranije navedenim kriterijma, analizirati spektar snage i ITC meu pojedinim ispitivanjima

4. Funkcija runica()Funkcija runica izvrava dekompoziciju ulaznog signala metodom nezavisnih komponenti (ICA) koritenjem algoritma Bell & Sejnowski (1995.) sa opcijom ukljuenja dodatnih metoda (PCA, proirena ICA) radi poboljanja rezultata.

Upotreba runica funkcije :

>> [weights,sphere] = runica(data); % koriste se podrazumijevane vrijednostiili>> [weights,sphere,compvars,bias,signs,lrates,activations] ... = runica(data,'Key1',Value1',...); % zadaju se parametri

Opcionalni argumenti:

extended [N] izvrava tanh() "proirena-ICA" sa estimacijom znaka N trening blokovapca[N] dekompozicija glavnih komponenti iz podatakasphering[on/off] koritenje izbjeljivanjaweights[W] inicijalna teinska matricalrate[rate] inicijalna ICA stopa uenja (