45
О О п п р р е е д д е е л л е е н н и и е е к к у у р р и и л л ь ь щ щ и и к к а а п п о о к к а а р р д д и и о о г г р р а а м м м м е е алгоритм, занявший второе место на соревновании CardioQvark Александр Дьяконов Московский государственный университет имени М.В. Ломоносова (Москва, Россия)

Определение курильщика по кардиограмме

  • Upload
    -

  • View
    538

  • Download
    3

Embed Size (px)

Citation preview

ООппррееддееллееннииее ккууррииллььщщииккаа ппоо ккааррддииооггррааммммее

ааллггооррииттмм,, ззаанняяввшшиийй ввттооррооее ммеессттоо ннаа ссооррееввннооввааннииии

CCaarrddiiooQQvvaarrkk

ААллееккссааннддрр ДДььяяккоонноовв

ММооссккооввссккиийй ггооссууддааррссттввеенннныыйй ууннииввееррссииттеетт

ииммееннии ММ..ВВ.. ЛЛооммооннооссоовваа ((ММоосскквваа,, РРооссссиияя))

Соревнование CardioQVARK 2 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Соревнование CardioQvark

ППееррввыыйй ээттаапп ––2255..1122..22001155--0011..0033..22001166

РРааззррааббооттааттьь ааллггооррииттмм ооппррееддееллеенниияя ккуурряящщееггоо ччееллооввееккаа

ппоо ееггоо ккааррддииооггррааммммее

Обучающая выборка –– 110000 ккааррддииооггрраамммм ((5500++5500))

Контрольная выборка –– 225500 ккааррддииооггрраамммм ((6644++118866))

ещё:

ппррииззннааккии

ффииллььттрроовваанннныыее ккааррддииооггррааммммыы

Соревнование CardioQVARK 3 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Функционал качества

итоговая оценка решения –– ссууммммаа ммеесстт ппоо

ччууввссттввииттееллььннооссттии ((SSee))

ссппееццииффииччннооссттии ((SSpp))

1110

0100

1

0

10

xxa

xxa

yy

0111

11Sexx

x

1000

00Spxx

x

,

Соревнование CardioQVARK 4 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Бенчмарк – случайное решение

10 20 30 40 50 60 70 80 90 100

0.4

0.45

0.5

0.55

0.6

номер решения

(Se+

Sp)/

2

Соревнование CardioQVARK 5 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Бенчмарк – случайное решение

Соревнование CardioQVARK 6 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Критика функционала

ООдднноо рреешшееннииее яяввнноо ллууччшшее......

нноо ооннии ннаа ррааввнныыхх ммеессттаахх

ППоояяввлляяееттссяя ссооввссеемм ппллооххооее

рреешшееннииее,, нноо ттееппееррьь ххоорроошшееее ннаа

ввттоорроомм ммеессттее!!

П.С. ТТаакк вв ииттооггее ии ппооллууччииллооссьь...... ллууччшшееее рреешшееннииее ппоо ооццееннккее

ооррггааннииззааттоорроовв ххуужжее ппоо FF--ммееррее ии ррааззнныымм ууссррееддннеенниияямм SSee ии SSpp

Соревнование CardioQVARK 7 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Восстановление confusion matrix

1110

0100

1

0

10

xxa

xxa

yy

ччууввссттввииттееллььннооссттьь ии ссппееццииффииччннооссттьь::

0111

11

xx

x

,

1000

00

xx

x

,

ММыы ззннааеемм ччииссллоо ннууллеейй вв ннаашшеемм рреешшееннииии::

01000 xxa ,

аа ттааккжжее ччииссллоо ееддиинниицц

11101 xxa .

ИИммеееемм ччееттыыррее ууррааввннеенниияя ии ччееттыыррее ннееииззввеессттнныыхх::

1000

1101

11110

01110

1

1

1

1

xx

xx

axx

axx

Соревнование CardioQVARK 8 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Восстановление confusion matrix

ччууввссттввииттееллььннооссттьь ии ссппееццииффииччннооссттьь ддаанныы сс ооккррууггллееннииеемм

((ппооээттооммуу ммоожжеетт ббыыттьь оошшииббккаа ±±11))

ММоожжнноо ууззннааттьь FF11--ммеерруу рреешшеенниийй

ММоожжнноо ууззннааттьь ччииссллоо ккууррииллььщщииккоовв ннаа ккооннттррооллее

Соревнование CardioQVARK 9 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Общий подход

ппррееддооббррааббооттккаа ссииггннааллаа,, ввыыддееллееннииее ккааррддииооццииккллоовв

ггееннеерраацциияя ппррииззннааккоовв ((сс ппооммоощщььюю ррааззнныыхх ммееттооддоовв))

ссееллееккцциияя ппррииззннааккоовв

ннаассттррооййккаа ррееггрреессссоорраа

ввыыббоорр ппооррооггаа ии ффооррммииррооввааннииее ооккооннччааттееллььннооггоо ррееззууллььттааттаа

Генерация признаков

ФФууррььее--ааннааллиизз

ССииннггуулляяррннооее ррааззллоожжееннииее

ССттааттииссттииккии ((ннее ввоошшллии вв ффииннааллььннооее рреешшееннииее))

ППааррааммееттррыы,, ппррееддооссттааввллеенннныыее ооррггааннииззааттооррааммии

ппоо ВВ..ММ.. УУссппееннссккооммуу ((ннее ввоошшллии вв ффииннааллььннооее рреешшееннииее))

ВВееййввллеетт--ааннааллиизз ((ннее ввоошшллии вв ффииннааллььннооее рреешшееннииее))

Потом:

ссееллееккцциияя ппррииззннааккоовв ((ппоо 1100 иизз ккаажжддоойй ггррууппппыы))

ккллаассссииффииккаацциияя

Соревнование CardioQVARK 10 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Реализация

MMaattllaabb 22001122bb

PPyytthhoonn 33..55..00 ((AAnnaaccoonnddaa 22..44..00 6644--bbiitt))

Соревнование CardioQVARK 11 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Загрузка данных

файл _Обучающая выборка_.txt файл traininfo.txt | ФИО | пол | возраст |

1.1. Обучающая выборка (50 человек). Курящие.

BRA | М | 37 |

CZA | Ж | 31 |

KNN | М | 52 |

PPV | М | 32 |

SAE | М | 47 |

ZLS | Ж | 27 |

АТА | Ж | 46 |

...

BRA, 1, 37, 1

CZA, 0, 31, 1

KNN, 1, 52, 1

KVA, 1, 32, 0

PPV, 1, 32, 1

SAE, 1, 47, 1

ZLS, 0, 27, 1

АТА, 0, 46, 1

АШМ, 1, 22, 1

БАС, 1, 27, 0

БВА, 1, 44, 1

БДИ, 1, 33, 0

...

ннее ббыыллоо ппррооббллеемм сс ппууттааннииццеейй вв ииммееннаахх ффааййллоовв

((ллааттииннссккооее//ррууссссккооее ««CC»»))

Соревнование CardioQVARK 12 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Визуализация загруженных сигналов

1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2

x 104

-0.4

-0.3

-0.2

-0.1

0

0.1

0.2

время

уровень с

игн

ал

а

сигнал 8

сигнал 41

сигнал 1

Соревнование CardioQVARK 13 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Сигналы после использования фильтра низких частот

1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2

x 104

-0.35

-0.3

-0.25

-0.2

-0.15

-0.1

-0.05

0

0.05

0.1

0.15

время

уровень с

игн

ал

а

сигнал 8 после ФНЧ

сигнал 41 после ФНЧ

сигнал 1 после ФНЧ

% фильтр низких частот

function corrected = cardio_removelowerfrequencies(ecg, samplingrate)

fresult=fft(ecg);

fresult(1 : round(length(fresult)*5/samplingrate))=0;

fresult(end - round(length(fresult)*5/samplingrate)+1 : end)=0;

corrected=real(ifft(fresult));

Соревнование CardioQVARK 14 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Сигналы после использования фильтров низких и высоких частот

1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2

x 104

-0.35

-0.3

-0.25

-0.2

-0.15

-0.1

-0.05

0

0.05

0.1

время

уровень с

игн

ал

а

сигнал 8 после ФНЧ+ФВЧ

сигнал 41 после ФНЧ+ФВЧ

сигнал 1 после ФНЧ+ФВЧ

Соревнование CardioQVARK 15 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Что такое кардиограмма

Соревнование CardioQVARK 16 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Разведочный анализ данных

УУ ннаасс ппееррееввёёррннууттыыее ккааррддииооггррааммммыы

ГГллааввнныыее ввооллнныы,,

ппррееддооссттааввллеенннныыее ооррггааннииззааттооррааммии ккооннккууррссаа

Соревнование CardioQVARK 17 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Разведочный анализ данных

2 3 4 5 6 7 8

x 104

-0.02

0

0.02

0.04

0.06

0.08

0.1

время

уровень с

игн

ал

а

сигнал 50

сигнал после ФВЧ+ФНЧ

РРееззккооее ииззммееннееннииее ааммппллииттуудд

Соревнование CardioQVARK 18 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Разведочный анализ данных

2 3 4 5 6 7

x 104

-0.15

-0.1

-0.05

0

0.05

0.1

0.15

0.2

0.25

время

уровень с

игн

ал

а

сигнал 42

сигнал после ФВЧ+ФНЧ

ССттррааннннооее ппооввееддееннииее ффииллььттррааццииии

Соревнование CardioQVARK 19 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Разведочный анализ данных

4.8 4.9 5 5.1 5.2 5.3

x 104

-0.1

-0.05

0

0.05

0.1

0.15

0.2

время

уровень с

игн

ал

а

сигнал 42

сигнал после ФВЧ+ФНЧ

ЕЕссллии ууввееллииччииттьь......

ээттоо ннее ооччеенньь ппооххоожжее ннаа ккааррддииооггррааммммуу......

Соревнование CardioQVARK 20 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Выделение кардиоциклов

1.45 1.46 1.47 1.48 1.49 1.5 1.51

x 105

-0.02

0

0.02

0.04

0.06

0.08

время

уровень с

игн

ал

а

сигнал

начала циклов (версия организаторов)

J-максимумы (вычислены автором)

ККооннццыы ооттррееззккоовв ооттддееллььнныыхх ккааррддииооццииккллоовв

ССттууддееннттыы ААММАА ииссппооллььззооввааллии ммааккссииммууммыы ооррггааннииззааттоорроовв......

ММннооггииее ббииббллииооттееккии ззддеессьь ннее ррааббооттааллии......

Соревнование CardioQVARK 21 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Выделение кардиоциклов

ИИддееяя ааллггооррииттммаа::

ГГллооббааллььнныыйй MMAAXX вв ооккрреессттннооссттии

РРяяддоомм еессттьь ооттррииццааттееллььнныыее ззннааччеенниияя

1.45 1.46 1.47 1.48 1.49 1.5 1.51

x 105

-0.08

-0.06

-0.04

-0.02

0

0.02

0.04

0.06

0.08

0.1

время

уровень с

игн

ал

а

сигнал

начала циклов (версия организаторов)

J-максимумы (вычислены автором)

ККооннццыы ооттррееззккоовв ккааррддииооццииккллоовв ннаа исходном ссииггннааллее

Соревнование CardioQVARK 22 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Выделение кардиоциклов

6 7 8 9 10 11 12

x 104

-0.06

-0.04

-0.02

0

0.02

0.04

0.06

0.08

0.1

время

уровень с

игн

ал

а

сигнал

J-максимумы (вычислены автором)

ККооннццыы ооттррееззккоовв ооттддееллььнныыхх ккааррддииооццииккллоовв ннаа ппееррввоомм ссииггннааллее

ССааммооддееллььнныыйй ммееттоодд ааддееккввааттнноо ррааббооттааеетт......

Соревнование CardioQVARK 23 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Априорная оценка признаков

ДДлляя ппррииззннааккаа ),,( 1 mfff

)min()max(

)min(,,

)min()max(

)min(1

ff

ff

ff

fff mN

ЕЕссллии m

Nf ]1,0[ ввыыддааввааттьь вв ккааччеессттввее ооттввееттаа,,

ттоо ллооггииччнноо ккааччеессттввоо ппррииззннааккаа ооппррееддееллииттьь ккаакк

5.0|5.0),AUCROC(|)],AUCROC(1),,(max[AUCROC yfyfyf NNN

Апостериорная оценка признаков

ННаа ллооккааллььнноомм ккооннттррооллее –– ппррии ууддааллееннииии ппррииззннааккаа

Соревнование CardioQVARK 24 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Признаки по В.М. Успенскому и К.В. Воронцову

ССииггннаалл ккооддииррууееттссяя ссллооввоомм,, n --яя ббуукквваа –– ззааввииссиитт оотт ззннааккоовв ввыырраажжеенниийй

nnnnnn TTRR 111 ,, ..

Соревнование CardioQVARK 25 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Признаки по В.М. Успенскому и К.В. Воронцову

ВВссееггоо ввооззммоожжнныы 66 ((ннее 88)) ввааррииааннттоовв ззннааккоовв..

ВВыыччиисслляяееттссяя ччаассттооттаа ввссеехх ттррииггрраамммм ссллоовваа (( 21663 ттррииггрраамммм))..

ЕЕссллии ииссппооллььззооввааттьь ччаассттооттыы ббуукквв,, ббииггрраамммм ии ттррииггрраамммм::

258666 23 ппррииззннааккоовв..

Соревнование CardioQVARK 26 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Признаки по В.М. Успенскому и К.В. Воронцову

0 50 100 150 200 250

0.5

0.52

0.54

0.56

0.58

0.6

0.62

0.64

0.66

номер признака

AU

C-R

OC

-качеств

о

признаки Успенского

случайные признаки

ККааччеессттввоо ппррииззннааккоовв

ППооддххоодд ппррооввааллииллссяя......

Соревнование CardioQVARK 27 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Признаки, основанные на разложении Фурье

ППооссттррооееннииее ссппееккттррооггррааммммыы

РРааззббииввааеемм ннаа ннееппеерреессееккааюющщииеессяя ууччаассттккии

ДДлляя ккаажжддооггоо –– ДДППФФ

|||| ijhH ррааззммеерраа k513 ((ааббссооллююттнныыее ззннааччеенниияя ккооээффффииццииееннттоовв))

ППоо ээттоойй ммааттррииццее ссттррооииттссяя 551133--ммееррнныыйй ввееккттоорр ппррииззннааккоовв

),,,( 5131 ff

1

11, |)/log(|

1

1 k

jijjii hh

kf .

Соревнование CardioQVARK 28 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Признаки, основанные на разложении Фурье

ММоожжнноо ррааззнныыее ффууннккццииии::

k

jiji h

kf

1

1

((ууссррееддннеенниияя ДДППФФ))

ААппррииооррннооее ккааччеессттввоо ттааккиихх ппррииззннааккоовв

ННоо:: ннаа ппееррввыыхх ппррииззннааккаахх ммааккссииммааллььннооее ппееррееооббууччееннииее!!

Соревнование CardioQVARK 29 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Признаки, основанные на разложении Фурье

1

11, |)/log(|

1

1 k

jijjii hh

kf

((ииззммееннееннииее))

0 50 100 150 200 250 300 350 400 450 500

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

1.1

1.2

номер признака

значение п

ризн

ака

курящий

курящий

некурящий

некурящий

ЗЗннааччеенниияя ппррииззннааккоовв,,

ппооссттррооеенннныыхх ппоо ссппееккттррооггррааммммаамм ддлляя 44хх ссииггннааллоовв..

Соревнование CardioQVARK 30 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Признаки, основанные на сингулярном разложении

11.. ФФииллььттрраацциияя ((ФФННЧЧ++ФФВВЧЧ))

22.. ННааххоожжддееннииее J --ммааккссииммууммоовв

33.. ВВыыддееллееннииее ннееппррееррыыввнныыхх ууччаассттккоовв ссииггннааллаа

),,,( 9991 iii xxx ,, Ji ..

44.. ФФооррммииррооввааннииее ммааттррииццыы X ррааззммеерраа k1000 ,, ггддее k –– ччииссллоо

ввыыддееллеенннныыхх ооттррееззккоовв,, вв ссттооллббццаахх ккооттоорроойй ззааппииссаанныы ввееккттооррыы

т9991 ),,,( iii xxx ..

55.. ВВыыппооллннееннииее ссииннггуулляяррннооггоо ррааззллоожжеенниияя ппооллууччеенннноойй ммааттррииццыы..

ВВыыччиисслляяеемм ттооллььккоо ппееррввыыее 33 ккооммппооннееннттыы ррааззллоожжеенниияя::

kVLUX 33331000 ..

Соревнование CardioQVARK 31 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Признаки, основанные на сингулярном разложении

0 100 200 300 400 500 600 700 800 900 10000

0.05

0.1

0.15

0.2

0.25

0.3

0.35

номер строки матрицы |U|

значение э

лем

ента

в п

ервом

сто

лбце м

атр

ицы

|U

|

курящий

курящий

некурящий

некурящий

0 100 200 300 400 500 600 700 800 900 10000

0.05

0.1

0.15

0.2

номер строки матрицы |U|

значение э

лем

ента

во в

тором

сто

лбце м

атр

ицы

|U

|

курящий

курящий

некурящий

некурящий

0 100 200 300 400 500 600 700 800 900 1000

0

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

номер строки матрицы |U|

значение э

лем

ента

во т

реть

ем

сто

лбце м

атр

ицы

|U

|

курящий

курящий

некурящий

некурящий

Соревнование CardioQVARK 32 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Признаки, основанные на случайном сингулярном разложении

11.. ФФииллььттрраацциияя ((ФФННЧЧ++ФФВВЧЧ))

22.. ГГееннеерраацциияя ссллууччааййннооггоо ммнноожжеессттвваа I ((оотт 11 ддоо 229900000000)),, 10000|| I ..

ППррооссттоо ддлляя ээккооннооммииии ввррееммееннии.. ЛЛууччшшее –– ввссее ттооччккии..

33.. ВВыыддееллееннииее ннееппррееррыыввнныыхх ууччаассттккоовв ссииггннааллаа

),,,( 9991 iii xxx ,, Ii ..

44.. ФФооррммииррооввааннииее ммааттррииццыы k1000 ррааззммеерраа k1000 ,, ггддее || Ik –– ччииссллоо

ввыыддееллеенннныыхх ооттррееззккоовв,, вв ссттооллббццаахх ккооттоорроойй ззааппииссаанныы ввееккттооррыы

т9991 ),,,( iii xxx ..

55.. ВВыыппооллннееннииее ссииннггуулляяррннооггоо ррааззллоожжеенниияя ппооллууччеенннноойй ммааттррииццыы..

ВВыыччиисслляяеемм ттооллььккоо ппееррввыыее 22 ккооммппооннееннттыы ррааззллоожжеенниияя::

kVLUX 22221000 ..

Соревнование CardioQVARK 33 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Признаки, основанные на случайном сингулярном разложении

0 100 200 300 400 500 600 700 800 900 10000

0.01

0.02

0.03

0.04

0.05

0.06

0.07

номер строки матрицы |U|

значение э

лем

ента

в п

ервом

сто

лбце м

атр

ицы

|U

|

курящий

курящий

некурящий

некурящий

0 100 200 300 400 500 600 700 800 900 10000

0.01

0.02

0.03

0.04

0.05

0.06

номер строки матрицы |U|

значение э

лем

ента

во в

тором

сто

лбце м

атр

ицы

|U

|

курящий

курящий

некурящий

некурящий

Соревнование CardioQVARK 34 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Признаки, предоставленные организаторами

Фрагмент csv-файла, содержащий в названии "ucc": CZA_09-12-2015_02-27-

31_300_87302162855_1000hz_int16_I_ucc.csv

Фрагмент csv-файла, НЕ содержащий в названии "ucc": KNN_09-12-2015_13-16-

17_300_88649561808_1000hz_int16_I.csv

error, 0

quality, 48

spqrst, 115.801916104722240

spq, 14.190019818114955

sqrs, 41.586460006008991

sst, 59.911544840698710

-43.498732254252765

-43.316289798709320

-43.140302991464743

-42.993737422959335

-42.897042604584314

-42.862033117616917

-42.887039393198449

-42.954988907959326

-43.035577360470192

...

HR, 75, bpm

SDNN, 30, ms

CV, 3.7, %

SI, 120.3,

IRSA, 7,

NArr, 1.6, %

NN50, 10,

pNN50, 2.7, %

VLF, 12.4, %

LF, 86.2, %

HF, 13.8, %

TP, 1106, ms^2

VLF, 137, ms^2

LF, 834, ms^2

HF, 135, ms^2

LF/HF, 6.23,

IC, 8.0,

Соревнование CardioQVARK 35 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Статистические признаки

11.. ФФииллььттрраацциияя ((ФФННЧЧ//ФФВВЧЧ//сглаживание))

22.. ППррииззннааккии::

11)) ссррееддннееее ззннааччееннииее ссииггннааллаа

n

xxx n

21mean

22)) ссттааннддааррттннооее ооттккллооннееннииее

n

i

ni

n

xxxx

n 1

221

1

1std

33)) ддоолляя ппеерреессееччеенниийй сс ууррооввннеемм a ((ддлляя 0a ,, meana ,, stdmeana ))

1

|}0)()(|}1,,2,1{{| 1

n

axaxni ii

44)) ррааззннооссттьь ддооллеейй ппеерреессееччеенниийй сс ууррооввннеемм stdmeana ии stdmeana

Соревнование CardioQVARK 36 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Статистические признаки

ВВыыччиисслляяююттссяя ддлляя::

ссииггннааллаа ),,,( 21 nxxx

ммооддуулляя |)|,|,||,(| 21 nxxx

ппррооииззввоодднноойй ),,( 112 nn xxxx

ммооддуулляя ппррооииззввоодднноойй |)|,|,(| 112 nn xxxx

ии тт..дд..

5 10 15 20 25 30

0.5

0.55

0.6

0.65

номер признака

априорное к

ачеств

о п

ризн

ака

сигнал

ФНЧ

ФВЧ

ФНЧ+ФВЧ

ФНЧ+сглаживание

Соревнование CardioQVARK 37 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Классификация сигналов

РРееггрреессссиияя

ББииннааррииззаацциияя –– ссррааввннееннииеемм сс ппооррооггоомм

Зачем нужно решающее правило

ММааккссииммииззаацциияя ккааччеессттвваа

ДДввиижжееннииее ппоо ллииддееррббооррддуу

Соревнование CardioQVARK 38 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Классификация сигналов

ррееггрреессссооррыы::

sklearn.ensemble.RandomForestRegressor ((ссллууччааййнныыйй ллеесс)),,

sklearn.linear_model.SGDRegressor ((ллииннееййннааяя ммооддеелльь ++

ссттооххаассттииччеессккиийй ггррааддииееннттнныыйй ссппуусскк))

sklearn.ensemble.ExtraTreesRegressor ((""ээккссттррееммааллььнноо ссллууччааййнныыее

ддееррееввььяя""))

sklearn.linear_model.LogisticRegression ((ллооггииссттииччеессккааяя ррееггрреессссиияя))

sklearn.linear_model.Ridge ((ггррееббннееввааяя ррееггрреессссиияя))

Соревнование CardioQVARK 39 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Классификация сигналов

Алгоритм Параметры алгоритма

RandomForestRegressor

(n_estimators=100, criterion='mse')

max_features=5 max_features=10

(*1)

max_features=15

0.6949 / 0.7 0.72 / 0.72

0.67

0.7/ 0.69

SGDRegressor() С нормировкой

sk.preprocessing.normalize()

alpha=1.0 alpha=0.1 (*2)

alpha=0.01

0.3632 / 0.52 0.4124 / 0.52

0.3962 / 0.52

ExtraTreesRegressor(criterion='mse') n_estimators=20

max_depth=2

(*3)

n_estimators=40 max_depth=2

n_estimators=40 max_depth=1

0.6627 / 0.69

0.6175 0.6314 / 0.69 0.5994 / 0.69

GradientBoostingRegressor (n_estimators=1000, learning_rate=0.01,

max_depth=2, random_state=1,

loss='ls')

n_estimators=1000, max_depth=2,

n_estimators=1000, max_depth=1

n_estimators=100, max_depth=1

0.68 / 0.7

0.6928 /0.72

0.6048 (*4)

0.7467 / 0.75

0.5972

LogisticRegression() C=1.0

(*5)

C=0.1 C=0.01

0.6986 / 0.71

0.5467 0.6725 / 0.69

0.6794 / 0.69

Ridge(normalize=True) alpha=0.1

(*6)

alpha=0.01 alpha=0.001

0.6862 / 0.71

0.6316 0.6794 / 0.71 0.672 / 0.7

Соревнование CardioQVARK 40 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Классификация сигналов

(*1)

(*2)

(*3)

(*4)

(*5)

(*6)

Соревнование CardioQVARK 41 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Финальное решение

ЕЕщщёё ссееллееккцциияя ((!!))

sklearn.ensemble.GradientBoostingRegressor

nn__eessttiimmaattoorrss==11000000,,

lleeaarrnniinngg__rraattee==00..0011,,

mmaaxx__ddeepptthh==22,,

rraannddoomm__ssttaattee==110000,,

lloossss==''llss''

ППоорроогг ббииннааррииззааццииии == 00..888822

ООссооббееннннооссттьь:: ннеетт ссккррыыттоойй ((pprriivvaattee)) ттууррннииррнноойй ттааббллииццыы

Соревнование CardioQVARK 42 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Результаты

hhttttppss::////hhaabbrraahhaabbrr..rruu//ppoosstt//227799331199//

11.. ББееллааввиинн ВВллааддииссллаавв ССееррггееееввиичч МФТИ..

22.. ДДььяяккоонноовв ААллееккссааннддрр ГГееннннааддььееввиичч МГУ, ВЦ РАН..

33.. ИИссааккоовв РРооммаанн ВВллааддииммииррооввиичч ВлГУ..

44.. ББррююххаанноовв ИИллььяя ААллееккссааннддррооввиичч МГУ..

55.. ДДооккууккиинн ААллееккссааннддрр ААллееккссааннддррооввиичч,,

ССееннььккоо ООллеегг ВВааллееннттииннооввиичч,,

ЧЧууччууппаалл ВВллааддииммиирр ЯЯккооввллееввиичч ВЦ РАН..

114488 ккооммаанндд

ММГГУУ ((2288))

ММФФТТИИ ((2200))

ННИИУУ ВВШШЭЭ ((66))

ММГГТТУУ ииммееннии НН..ЭЭ.. ББааууммааннаа ((33))

ШШААДД ((22))

ВВЦЦ РРААНН ((44))

ИИППППИИ РРААНН ((33))

ИИММ ССОО РРААНН ((22))

ЯЯннддеекксс ((11))

Соревнование CardioQVARK 43 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Результаты

1 2 3 4 5 6 7 8 9 10

0.4

0.45

0.5

0.55

0.6

0.65

0.7

номер участника в итоговой таблице

качеств

о,

%

(Se+Sp)/2

FF-мера

F1-мера

Соревнование CardioQVARK 44 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

Выводы

ААллггооррииттмм ппоо рраассппррооссттррааннёённнныымм ккррииттеерриияямм ккааччеессттвваа ((SSee++SSpp,, FF--ммеерраа ии тт..пп..))

ппррееввооссххооддиитт ддррууггииее

ЛЛууччшшииее ппррииззннааккии::

ннаа ооссннооввее ФФууррььее--ааннааллииззаа,, ссииннггуулляяррннооггоо ррааззллоожжеенниияя,, ссттааттииссттиикк ии ссттааннддааррттнныыее

ппррииззннааккии ((ккааччеессттввоо FFFF>>00..6644))

ХХууддшшииее ппррииззннааккии::

ппоо ВВ..ММ.. УУссппееннссккооммуу ппррооввааллииллииссьь ((ккааччеессттввоо FFFF<<00..66))

ЕЕссллии ррааззнноорроодднныыее ппррииззннааккии,, ттоо ккааччеессттввоо FFFF~~00..774477

ССттааббииллььнныыее ааллггооррииттммыы ((ллооккааллььнныыйй ккооннттрроолльь == ттеесстт)) оосснноовваанныы ннаа ппооссттррооееннииии

ддееррееввььеевв.. ННоо ззааввииссиитт оотт ппррииззннааккооввооггоо ппррооссттррааннссттвваа!!

ННее ууддааллооссьь ((ддаажжее ннаа ллооккааллььнноомм ккооннттррооллее)) ппооллууччииттьь ккааччеессттввоо FFFF>>00..7755

FFFF == ((SSee++SSpp))//22

Соревнование CardioQVARK 45 слайд из 45 Александр Дьяконов (Москва, МГУ)

Определение курильщика по кардиограмме 28 марта 2016 года

ПП..СС.. ВВееддииттее ззддооррооввыыйй ооббрраазз жжииззннии......