12
توانبخشی مشهدراپزشکی وجله علوم پی م- دوره3 - شماره2 ( و زمستانیز پای3333 ) سایت مجله: http://jpsr.mums.ac.ir 22 Comparing performance of decision tree and neural network in predicting myocardial infarction Safdari R 1 , Ghazi saeedi M 2 , Gharooni M 3 , Nasiri M 4 Arji G 5 Abstract Purpose: Cardiovascular diseases are among the most common diseases in all societies. Using data mining techniques to generate predictive models to identify those at risk for reducing the effects of the disease is very helpful. The main purpose of this study was to predict the risk of myocardial infarction by Decision Tree based on the observed risk factors. Methods: The present work was an analytical study conducted on a database containing 350 records. Data were obtained from patients admitted to Shahid Rajaei specialized cardiovascular hospital, Iran, in 2011. Data were collected using a four-sectioned data collection form. Data analysis was performed using SPSS statistical software version 12 by CRISP methodology. In the modeling section decision tree and Neural Network were used. Results: The results of the data mining showed that the variables of high blood pressure, hyperlipidemia and tobacco smoking were the most critical risk factors of myocardial infarction. The accuracy of the decision tree model on the data was shown to be as 93/4%. Conclusion: The best created model was decision tree C5.0. According to the created rules, it can be predicted which patient with new specified features may affected by myocardial infarction. Keywords: Decision trees, Neural network, Myocardial infarction, Data mining دریافت مقاله: 33 / 33 / 32 ید مقاله تای: 23 / 3 / 33 ری ویم گی تصمد درختقایسه عملکر مه آنفارکتوس قلبی بی ابتشگوی در پی شبکه عصبی رضا صفدری3 ، دی سعی مرجان قاضی2 ، قارونی منوچهر3 ، ری نصی مهدی4 ، گلی ارجی5 هدف: ز شایع قلبی عروقی اماری های بیمع می باشدمی جواماری ها در تمان بی تری. ی دادهز تکنیك هاده استفا ا كاوی بر ای مدلیجاد ا پیش هایی كننده گویرض ناشهش عوای كا معرض خطر برااد دری افر ، جهت شناسایمك بسیار كماری از بی ی كننده است. ه آنفاركتوس قلبی افراد بل ابتحتمای اشگوین مطالعه پی ای هدف اصلی باستفاده ا ازاسیم بر اس تصم درختستی موثر بر ابت فاكتورها ریسك. رسیوش بر ر: ده ولی بوهش از نوع تحلی این پژوه داد پایگا شامل ه آن353 می باشد ركورد. یقز این تحق مورد نیا های داده در سال3333 ل مورگانه از جدوستفاد ا باید رجای بیمارستان شهی به كنندهان مراجعهونده بیمار از بین پر تهران بدست آمده است ابزار جمع آوری دادهی بوده استستی چهار قسمت ها چك لی. م افزارمك نریل به ك تجزیه و تحلSPSS Clementine 12 لوژیری متدو با بکارگی3 CRISP م شده استنجا ا. ر بخش مدل دیم تصمزی از درخت ساه شدهستفاد و شبکه عصبی ا است. ها یافته: با توجه به مدلخص شد كهده مشستفاده شی ا هاهای فشارخون بایب متغیر به ترت ، چربی خون با و مصرف سیگار، را در ابتن تاثیرشتری بیندی دارا بوده آنفاركتوس قلب ب . شدهیجادیم ا تصممك درخت به ك، نی استخراج شده قوانی است كه میستفاده شودركتوس قلبی اد به آنفا افرال ابتحتمای اشگوی در جهت پییوان الگوید به عن توان. صحت مدلیجاد اده ازستفا ا شده بایم تصم درخت4 / 33 بوده استرصد د. 1 Cross Industry Standard Process For Data Mining

Comparing performance of decision tree and neural …jpsr.mums.ac.ir/article_3319_c1294f9b7b51d9bacab0bf653f...3 Iterative Dichotomiser 3 4 classification and regression trees 5 Logistic

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Comparing performance of decision tree and neural …jpsr.mums.ac.ir/article_3319_c1294f9b7b51d9bacab0bf653f...3 Iterative Dichotomiser 3 4 classification and regression trees 5 Logistic

http://jpsr.mums.ac.ir : سایت مجله (3333پاییز و زمستان) 2شماره -3دوره -مجله علوم پیراپزشکی و توانبخشی مشهد

22

Comparing performance of decision tree and neural network in predicting myocardial

infarction Safdari R

1, Ghazi saeedi M

2, Gharooni M

3, Nasiri M

4 Arji G

5

Abstract

Purpose: Cardiovascular diseases are among the most common diseases in all societies.

Using data mining techniques to generate predictive models to identify those at risk for

reducing the effects of the disease is very helpful. The main purpose of this study was to

predict the risk of myocardial infarction by Decision Tree based on the observed risk factors.

Methods: The present work was an analytical study conducted on a database containing 350

records. Data were obtained from patients admitted to Shahid Rajaei specialized

cardiovascular hospital, Iran, in 2011. Data were collected using a four-sectioned data

collection form. Data analysis was performed using SPSS statistical software version 12 by

CRISP methodology. In the modeling section decision tree and Neural Network were used.

Results: The results of the data mining showed that the variables of high blood pressure,

hyperlipidemia and tobacco smoking were the most critical risk factors of myocardial

infarction. The accuracy of the decision tree model on the data was shown to be as 93/4%.

Conclusion: The best created model was decision tree C5.0. According to the created rules, it

can be predicted which patient with new specified features may affected by myocardial

infarction.

Keywords: Decision trees, Neural network, Myocardial infarction, Data mining

23/3/33:تایید مقاله 33/33/32:دریافت مقاله

شبکه عصبی در پیشگویی ابتال به آنفارکتوس قلبی مقایسه عملکرد درخت تصمیم گیری و 5گلی ارجی ،4مهدی نصیری ،3منوچهر قارونی ،2مرجان قاضی سعیدی، 3رضا صفدری

ای كاوی بر استفاده از تکنیك های داده. ترین بیماری ها در تمامی جوامع می باشد بیماری های قلبی عروقی از شایع: هدف

ی از بیماری بسیار كمك ، جهت شناسایی افراد در معرض خطر برای كاهش عوارض ناشگویی كننده های پیش ایجاد مدل

درخت تصمیم بر اساس از استفاده با هدف اصلی این مطالعه پیشگویی احتمال ابتال افراد به آنفاركتوس قلبی . كننده است

.ریسك فاكتورهای موثر بر ابتالست

داده های مورد نیاز این تحقیق. ركورد می باشد 353ه آن شامل پایگاه داداین پژوهش از نوع تحلیلی بوده و :روش بررسی

بدست آمده تهران از بین پرونده بیماران مراجعه كننده به بیمارستان شهید رجایی با استفاده از جدول مورگان3333در سال

SPSS Clementineتجزیه و تحلیل به كمك نرم افزار .ها چك لیستی چهار قسمتی بوده است است ابزار جمع آوری داده

3 با بکارگیری متدولوژی 12CRISP و شبکه عصبی استفاده شده سازی از درخت تصمیم در بخش مدل .انجام شده است

.است

و مصرف ، چربی خون باالبه ترتیب متغیرهای فشارخون باال های استفاده شده مشخص شد كه مدل با توجه به :یافته ها

قوانینی استخراج شده ،به كمك درخت تصمیم ایجاد شده. ال به آنفاركتوس قلبی دارا بودندبیشترین تاثیر را در ابتسیگار،

ایجاد مدل صحت .تواند به عنوان الگویی در جهت پیشگویی احتمال ابتال افراد به آنفاركتوس قلبی استفاده شوداست كه می

.درصد بوده است 4/33درخت تصمیم شده با استفاده از

1Cross Industry Standard Process For Data Mining

Page 2: Comparing performance of decision tree and neural …jpsr.mums.ac.ir/article_3319_c1294f9b7b51d9bacab0bf653f...3 Iterative Dichotomiser 3 4 classification and regression trees 5 Logistic

http://www.mums.ac.ir: سایت دانشگاه علوم پزشکی مشهد ...... لکرد درخت تصمیم گیری مقایسه عم -رضا صفدری

22

با بکارگیری قوانین ایجاد شده برای یك نمونه جدید با .بود C5بهترین مدل ایجاد شده درخت تصمیم :نتیجه گیری

.بتال به آنفاركتوس قلبی چقدر استویژگیهای مشخص می توان تعیین كرد كه احتمال ا

داده كاوی ، شبکه عصبی، آنفاركتوس قلبی،درخت تصمیم :کلیدی لماتک

[email protected] ،گلی ارجی :نویسنده مسئول

دانشگاه علوم پزشکی تهران،دانشکده پیراپزشکیتهران، :آدرس

، ایراندانشگاه علوم پزشکی تهرانه آموزشی مدیریت اطالعات سالمت، دانشکده پیراپزشکی،عضو هیئت علمی گرودانشیار، -3

، ایراندانشکده پیراپزشکی دانشگاه علوم پزشکی تهران روه آموزشی مدیریت اطالعات سالمت،عضو هیئت علمی گ، استادیار -2

، ایراندانشگاه علوم پزشکی تهران, استاد بیماریهای قلب و عروق -3

،تهران،ایراندانشگاه علم و صنعت ایران ،دانشجوی دكترای هوش مصنوعی -4

دانشگاه علوم پزشکی تهران، ایران ،دانشکده پیراپزشکیاطالعات سالمت، دانشجوی دكترای مدیریت -5

مقدمه

( Ischemich heart diseases) بیماری ایسکمیك قلب

بیش از هر بیماری دیگر در كشورهای توسعه یافته موجب

مرگ و ناتوانی شده و هزینه های اقتصادی تحمیل

های بیماری افزایش سریعبا توجه به . (3) می نماید

ایسکمیك قلبی در سراسر جهان احتماال این بیماری تا

به شایعترین علت مرگ تبدیل خواهد شد 2323سال

سکته قلبی اولین علت مرگ افراد باالتر از در ایران، .(2)

در تعیین عوامل موثر در ابتال به . (3) سال می باشد 35

زیادی انجام گرفته بیماری های قلبی عروقی بررسی های

. (4-2) و عوامل متعدد در آنها ذكر شده است

محیط مراقبت سالمت غنی از اطالعات و ضعیف از

حجم داده های پزشکی روز به روز در .(2) دانش است

حال افزایش است و پزشکان معموال اطالعات ارزشمندی

ها و ارتباط آنها با یکدیگر و عوامل را در خصوص بیماری

اما این .(8)ها بدست می آورند ایجاد كننده بیماری

، برای ای خام به خودی خود ارزشی ندارنده مجموعه داده

ها باید آنها را تحلیل و تبدیل معنی بخشیدن به این داده

با توجه به شیوع (.3) به اطالعات یا بهتر از آنها دانش كرد

از استفاده ،عروقی در سراسر جهان –های قلبی بیماری

روش های جدید در تحقیقات زیست پزشکی بسیار مورد

تواند ارتباطات و كاوی می داده .توجه قرار گرفته است

های بدیعی را كشف كند كه برای پزشکان بسیار وابستگی

.مفید است

كاوی به طور كلی به دو دسته توصیف تکنیکهای داده

وظایف . كننده تقسیم می شوند گویی كننده و پیش

كند و هدف ها را مشخص می توصیفی خواص عمومی داده

آن پیدا كردن الگوهای قابل تفسیر توسط افراد برای

بینی رفتار آینده گویانه، پیش وظایف پیش. هاست داده

آنهاست و منظور از آن بکارگیری چند متغیر در پایگاه

اده د (.32)گویی مقادیر آینده متغیرهاست داده برای پیش

ها برای شناسایی اطالعات و یا نه ای از تکنیككاوی گو

، به نحوی كه ها می باشد گیری از میان داده یمدانش تصم

، بینی پیش ،گیری ر حوزه های تصمیمبا استخراج آنها د

كاوی داده. تخمین بتوان از آنها استفاده كردگویی و پیش

پزشکی دارای پتانسیل زیادی برای كشف الگوهای پنهان

ها داراست كه این الگوها می تواند برای ر دادهموجود د

امروزه .(3)های بالینی مورد استفاده قرار گیرد تشخیص

كاوی و استخراج دانش های متنوع داده استفاده از روش

برای شناسایی الگوها و ارتباطات میان متغیرهای مختلف

كننده در علوم پزشکی بسیار بینی های پیش در تولید مدل

های كاربرد روش .(33)مورد توجه قرار گرفته است

،های مختلف پزشکی مانند تشخیص وزهكاوی در ح داده

.(33)گویی و حتی درمان به اثبات رسیده است پیش

،كاوی گویانه در داده ملکردهای پیشیکی از ع

است كه دسته بندی فرایند یافتن مدلی . بندی است دسته

تواند دسته ها و یا مفاهیم داده می با تشخیص دسته

یکی از (.32) گویی كند ناشناخته اشیا دیگر را پیش

درخت .بندی درخت تصمیم است های رایج دسته روش

ا در یك انتخاب خوب گیری روشی است كه به شم تصمیم

هایی كه در گیری به خصوص تصمیم .كمك می كند

درختان تصمیم .و خطرات زیادی استده هزینه باال بردارن

یك روش گرافیکی برای مقایسه رقابت جایگزین و

اختصاص ارزش به آنها از طریق تركیب عدم قطعیت ها،

های خاص عددی ها و بازپرداخت ها به وسیله ارزش هزینه

(.33) است

Page 3: Comparing performance of decision tree and neural …jpsr.mums.ac.ir/article_3319_c1294f9b7b51d9bacab0bf653f...3 Iterative Dichotomiser 3 4 classification and regression trees 5 Logistic

http://jpsr.mums.ac.ir : سایت مجله (3333پاییز و زمستان) 2شماره -3دوره -مجله علوم پیراپزشکی و توانبخشی مشهد

28

تشکیل می شود 3چندین گرهدرخت تصمیم معموال از

. و خروجی شناخته می شوندهای ورودی كه با نام گره

و "اگر"قوانین ایجاد شده در درخت تصمیم به صورت

مورد استفاده از میان الگوریتم های .آنگاه بیان می شوند"

C5 ترین آنها الگوریتم مهم ،در ساخت درخت تصمیم

.می باشد ID3 است كه توسعه یافته

،مصنوعی با پردازش داده های تجربیهای عصبی شبکه

ها را به ساختار شبکه دانش یا قانون نهفته در ورای داده

ها این سیستمبه همین دلیل به منتقل می كنند،

های زیرا بر اساس محاسبات داده .می گویند هوشمند

در واقع . قوانین كلی را فرا می گیرند ،ها عددی یا مثال

های عصبی تکنیك هایی هستند كه می توانند برای شبکه

.با ارتباطات پیچیده مورد استفاده قرار گیرند هایمدل

مصنوعی در طبقه بندی مسائلی های شبکه عصبی مدل

تشخیص فشار بینی مشکالت قلبی در بیماران، پیش ،نظیر

گویی خطر ابتال پیش(. 34) استفاده شده است... خون و

های حمایت از های قلبی به كمك سیستم به بیماری

گیری از بیماری ایفا می كندتصمیم نقش مهمی در پیش

گویی خطر دارای پتانسیل باالیی در پیش های مدل (.35)

مورد شرایط بیمار گیری در جهت كمك به فرایند تصمیم

ها چند متغیره بوده كه از برخی این مدل. را دارا هستند

گویی و تشخیص و درمان فاكتورهای مهم جهت پیش

و بر اساس آنها كنند مناسب برای افراد استفاده می

مداخالت بهداشتی یا تغییر سبك زندگی نسبت به كسانی

كه در معرض خطر تشخیص داده شده اند می تواند انجام

(.32) شود

ابتال گویی خطر ای با عنوان مدلی برای پیشدر مطالعه

، مقایسه بین درختهای قلبی عروقی به بیماری

CART ،2و پرسپترون چند الیه 5رگرسیون لجستیك

مدل و همکارانش انجام شده است، Isabell كه توسط

عنوان بهترین و شبکه عصبی به CART درخت تصمیم

(.32) های اجرا شده بیان شده استمدل در بین مدل

Christine همکارانش در مطالعه خود نشان داده اند و

،كه درختان تصمیم نسبت به مدل رگرسیون لجستیك

1 node

2 Algorithm for implementing Decision Tree

3 Iterative Dichotomiser 3

4 classification and regression trees

5 Logistic Regression

6 Multi-Layer Perceptron

افراد به گویی امکان ابتال قابلیت بیشتری در جهت پیش

در مطالعه انجام شده (.38)های قلبی دارا هستند بیماری

گویی امکان زنده جهت پیش Abdolghani توسط

با C4.5 ماندن بیماران مبتال به سرطان سینه الگوریتم

گویی درصد به عنوان بهترین مدل پیش 7/68 میزان دقت

در مطالعه انجام شده (. 91) ده استكننده معرفی ش

های درخت تصمیم بیان شده است كه مدل Starc توسط

,ID3, C4.5) از جمله7CHAID and CART )ای بر

های داده بزرگ نسبت پایگاههای اكتشافی در انجام تحلیل

.(23)كنند تر عمل میفقهای دیگر مو به مدل

Ordonze تصمیمهمکارانش از الگوریتم درخت و

C4.5 25با استفاده از 8همبستگیالگوریتم قوانین و

گویی بیماری قلبی استفاده ریسك فاكتور جهت پیش

ند و به این نتیجه رسیدند كه قوانین همبستگی عموما كرد

بت به درختان تصمیم تری نس پیش بینی ساده قواعد

در مطالعه انجام شده توسط .(23) كند ایجاد می

Jianxin درصد به عنوان 2/88شبکه عصبی با دقت مدل

درصد به عنوان 4/88بهترین مدل و درخت تصمیم با

(.22)گویی كننده معرفی شده است بدترین مدل پیش

های مربوط به آوری داده در این پژوهش ما با جمع

موثر در ابتال افراد به بیماری ریسك فاكتورهای

و به كارگیری آنفاركتوس قلبی از پرونده بیماران

های مختلف های داده كاوی به مقایسه دقت مدل الگوریتم

پرداخته و نهایتا به ارائه مدلی جهت پیش گویی احتمال

تا بتوان با استفاده از ابتالی افراد به این بیماری پرداختیم،

اساس متغیرهای فردی و نتایج مدل ایجاد شده و بر

ه آنفاركتوس قلبی آزمایشات درباره احتمال ابتال فرد ب

ای اهمیت است كه این امر از آن جهت دار .پیشگویی كرد

های تهاجمی های ناشی از روشمی توان از آسیب

های عروق كرونر مانند آنژیوگرافی تا تشخیص بیماری

حدودی پیشگیری نمود و همچنین میزان عوارض تجویز

ر داروهای مورد استفاده برای بیماری عروق كرونر را د

.كاهش داد ،مارانی كه به آن نیاز ندارندبی

مواد و روش ها

كاوی وجود های متعددی برای اجرای پروژه های دادهروشزمینه های قدرتمند در این دارد كه یکی از روش

این مقاله نیز بر اساس .(23) باشدكریسپ می متدولوژی

7 Chi-Squared Automatic Interaction Detector

8 Association rule

Page 4: Comparing performance of decision tree and neural …jpsr.mums.ac.ir/article_3319_c1294f9b7b51d9bacab0bf653f...3 Iterative Dichotomiser 3 4 classification and regression trees 5 Logistic

http://www.mums.ac.ir: سایت دانشگاه علوم پزشکی مشهد ...... لکرد درخت تصمیم گیری مقایسه عم -رضا صفدری

23

دامه به در ا(. 3شکل) شده است این متدولوژی تنظیم

رسیدن به مدلی در جهت یك از این مراحلبررسی هر

قلبیآنفاركتوس شگویی احتمال ابتال بهبرای پی

.می پردازیم

شناخت سیستم(الف

به كارگیری موفق داده كاوی مستلزم شناخت حوزه ای

است كه قرار است داده كاوی در آن به كار برده شود و

كاوی عالوه بر آن شناخت كافی از روشها و ابزارهای داده

كاوی بایستی دانش به طور كلی تیم داده. نیز الزم است

.ای كه قرار است بررسی شود داشته باشند كافی در حوزه

در گام اول پژوهشگر با مشورت پزشك متخصص قلب و

با مطالعه بر روی بیماری آنفاركتوس قلبی عروق و نیز

وتعیین فاكتورهای موثر در ابتال و همچنین روش های

های پیشگیری از ابتال به و درمانی و روش تشخیصی

.بیماری، سعی در شناخت كافی حوزه مورد بررسی داشت

مرحله آماده سازی داده ها (ب

های بیماران ها از پرونده در این گام به جمع آوری داده

های استفاده شده در این مطالعه مربوط داده .پرداخته شد

بیمارستان شهید به پرونده بیماران مراجعه كننده به

تعداد بیماران مراجعه .بود 3333رجایی تهران در سال

. نفر بود 3253كننده به این بیمارستان در سال مذكور

بدست آمد كه نهایتا 533حجم نمونه با جدول مورگان

ركورد از آنها به علت عدم تکمیل متغیرهای 353 تعداد

گام این در .مورد بررسی ،از پایگاه داده حذف گردید

بایستی داده هایی كه در حال حاضر در دسترس هستند و

. تعیین شدند داده هایی كه برای ساخت مدل نیاز بود،

برای شروع پژوهش از طریق مطالعات كتابخانه ای و

مشورت با پزشك متخصص فاكتورهایی كه بیشترین تاثیر

را در ابتالی افراد به بیماری دارا بودند تعیین شد و در

شامل داده های ك لیست چهار قسمتی كه قالب چ

، متغیرهای خونی، قندی و چربی بود و روایی دموگرافیك

آن با استفاده از نظر اساتید و متخصصین حوزه قلب و

عروق مورد تایید قرار گرفت و پایایی آن بر اساس ضریب

.بدست آمد 84/3آلفای كرونباخ

متغیرهای تعیین شده، برای ایجاد مدل به دو دسته

متغیر .متغیر هدف و متغیرهای پیشگو دسته بندی شدند

هدف ابتال یا عدم ابتال به بیماری و سایر متغیرها به عنوان

در این پژوهش . متغیر پیشگو مورد استفاده قرار گرفتند

زیر نیز برای مدیریت داده های از دست رفته متغیرهای

های مورد مطالعه چون به تعداد بسیار كمی در پرونده

ثبت شده بودند برای اینکه در فرایند ساخت مدل خللی

ایجاد نکنند از مجموعه متغیرها حذف شدند كه این

و (T3,T4,TSH) متغیرها شامل هورمونهای تیروئیدی

HBA1Cمتغیر CRPو فاكتور 3

رای سایر ب .بود 2

شان نسبت به مقادیر موجود شدهگممتغیرهایی كه مقادیر

مقدار SPSSافزار ناچیز بود با استفاده از امکانات نرم

فرض مربوط به آن جایگزین شدند،كه این مقدار با پیش

فاكتورهایی مانند قد و .توجه به نوع متغیر انتخاب گردید

شاخص توده بدنی وزن كه به تنهایی ارزشی ندارند بلکه

(Body Mass Index) آنها تاثیرگذار است، این

:شاخص به كمك آنها و با توجه به رابطه زیر بدست آمد

2(سانتی متر)قد(/كیلوگرم) وزن =شاخص توده بدنی ( 3)

( درصد34/52)نفر 233این مطالعه بر روی دو گروه بیمار

افراد سالم در .انجام شد( درصد82/42) نفر 353و سالم

های اولیه س از بررسیاین مطالعه افرادی بودند كه پ

وجود بیماری قلبی در آنها رد شده بود و تشخیص مربوط

.به عدم ابتال در پرونده این بیماران درج شده بود

یافته ها

32/53 88/33میانگین سنی بیماران تحت بررسی

در متغیرهای سن، فشارخون سیستولیك، قند .سال بود

كراتینین بین دو و BUN، خون ناشتا، قند خون كل

داری وجود داشت گروه سالم و بیمار اختالف معنی

(35/3<p ) بین سایر متغیرها اختالف معنی داری وجود ،

تعداد بیماران مرد نسبت (.3جدول )( p>35/3) نداشت

سابقه خانوادگی ابتال به . به بیماران زن بیشتر بود

های عروق كرونر، سابقه مصرف سیگار، سابقه بیماری

اعتیاد، سابقه دیابت و چربی خون در گروه بیماران بیشتر

سابقه فشارخون باال در گروه سالم اما. لم بوداز افراد سا

(.2جدول ) بیشتر از افراد بیمار بود

1Glycosylated Hemoglobin, Type A1C

2 Creactive protein

Page 5: Comparing performance of decision tree and neural …jpsr.mums.ac.ir/article_3319_c1294f9b7b51d9bacab0bf653f...3 Iterative Dichotomiser 3 4 classification and regression trees 5 Logistic

http://jpsr.mums.ac.ir : سایت مجله (3333پاییز و زمستان) 2شماره -3دوره -مجله علوم پیراپزشکی و توانبخشی مشهد

33

(B)و چارچوب استفاده شده در این مطالعه (A)ی كریسپگام های متدولوژ: 3شکل

انحراف معیار متغیرهای كمی مورد بررسی در افراد مورد مطالعه میانگین و: 3جدول

نام متغیر (انحراف معیار)میانگین

افراد سالم

(انحراف معیار)میانگین

بیمارانp-value

23/322 (25)44/333 332/3(33/32) (Systolic blood pressure)فشار خون سیستولیک

43/22 (33/4)82/22 22/3(45/4) (Body Mass Index)شاخص توده بدنی

333 (32/23)42/338 33/3(84/53) (GFBS)قند خون ناشتا

83/328 (23/322)22/323 2/3(38/45) (Cholesterol)کلسترول

23/354 (33/24)88/338 33/3(54/83) (TG)تری گلیسرید

83/333 (22/34)32/32 3/3(45/33) (LDL)لیپویروتئین کم چگال

33/43 (25/32)54/38 3/3(34/33) (HDL)پرچگاللپیوپروتئین

23/38 (23/32)88/22 334/3(38/3) (BUN)اوره

3/3 (23/3)22/3 32/3(42/3) (Creatinine)کراتینین

Page 6: Comparing performance of decision tree and neural …jpsr.mums.ac.ir/article_3319_c1294f9b7b51d9bacab0bf653f...3 Iterative Dichotomiser 3 4 classification and regression trees 5 Logistic

http://www.mums.ac.ir: سایت دانشگاه علوم پزشکی مشهد ...... لکرد درخت تصمیم گیری مقایسه عم -رضا صفدری

33

فراوانی متغیرهای كیفی در افراد مورد مطالعه توزیع: 2جدول

مدل سازی(ج

ر د .سازی وجود داردروشهای داده كاوی متنوعی برای مدل

مدل كاوی به ارائه مرحله با استفاده از تکنیکهای دادهاین

مدل سازی با استفاده از نرم افزار. پیشگویانه پرداخته شد

SPSS Clementine 12.0 انجام شد و در این مطالعه

در . از روشهای پیش گویانه در داده كاوی استفاده گردید

-این مرحله الگوریتم های درخت تصمیم، شامل الگوریتم

,C5, C&RT)های 3 QUEST, CHAID ) و شبکه

رگیری متغیرهای ورودی و تعیین متغیر عصبی با بکا

های درخت تصمیم و برای ساخت مدل. هدف ایجاد شدند

شبکه عصبی متغیرهای جنسیت، سن، سابقه مصرف

خون، سیگار، سابقه اعتیاد، سابقه فشارخون، سابقه چربی

1Quick Unbiased Efficient Statistical Tree

فاكتورهای قندی و چربی، شاخص توده بدنی و گروه

خونی به عنوان متغیرهای پیشگو تعیین شد و متغیر ابتال

یا عدم ابتال به بیماری نیز به عنوان متغیر هدف تعیین

گردید به دو بخش آموزش گردید و در مرحله بعد داده ها

مدل شبکه .تقسیم شدند( درصد23) و آزمون( درصد83)

عصبی دارای یك الیه ورودی، تعدادی الیه پنهان و یكهر گره ورودی را دریافت كرده، آن را . الیه خروجی است

تعیین اینکه . پردازش نموده و خروجی را تولید می كند

آیا هر ورودی به گره خروجی خواهد رسید یا خیر به وزن

تصمیم تركیب یك درخت (.24) آن ورودی بستگی دارد

-درخت. است( آنگاه -قانون اگر)تعدادی استلزام منطقی

های تصمیم تنها نمایشی از فرایند تصمیم گیری نیستند

بلکه می توان از آنها در حل مسائل طبقه بندی نیز

نام متغیر افراد سالم

فراوانی (درصد)

بیماران

فراوانی (درصد)

جنسیت

342(23) 28(3/45) مرد

58(23) 82(2/54) زن

سابقه خانوادگی بیماری عروق کرونر

43(23) 33(2/32) مثبت

323(83) 333(32/82) منفی

سابقه مصرف سیگار

22(32) 25(2/32) مثبت

328(24) 325(3/83) منفی

تیادسابقه اع

25(5/32) 4(2/2) مثبت

325(5/82) 342(3/32) منفی

1سابقه فشارخون باال

82(5/43) 22(2/53) (میلی متر جیوه>=141)مثبت

333(5/52) 24(3/43) (میلی متر جیوه= <131)منفی

سابقه بیماری دیابت

52(5/28) 32(24) مثبت

343(5/23) 334(22) منفی

سابقه چربی خون باال

28(33) 23(42) مثبت

322(23) 82(58) منفی

JNC( Joint National Committee)طبقه بندی سطوح فشار خون براساس راهنمای -3

.صورت گرفته است

Page 7: Comparing performance of decision tree and neural …jpsr.mums.ac.ir/article_3319_c1294f9b7b51d9bacab0bf653f...3 Iterative Dichotomiser 3 4 classification and regression trees 5 Logistic

http://jpsr.mums.ac.ir : سایت مجله (3333پاییز و زمستان) 2شماره -3دوره -مجله علوم پیراپزشکی و توانبخشی مشهد

32

C5 نمونه ای از قوانین ایجاد شده توسط الگوریتم :3جدول احتمال ابتال قوانین ردیف

%33/83 مثبت آنگاه احتمال ابتال برابر است با=مونث،سابقه مصرف سیگار=جنسیتاگر 3

%82-53 سال باشد آنگاه احتمال ابتال برابر است با 22 <منفی، سن فرد =مونث، سابقه مصرف سیگار=اگر جنسیت 2

BMI >=8/23 ، شاخص4/3=>سال،سطح كراتینین 22= <منفی،سن فرد=مونث، سابقه مصرف سیگار=اگر جنسیت 3

باشد آنگاه احتمال ابتال برابر است با

23/38%

%42/23 باشد آنگاه احتمال ابتال برابر است با +A و یا -O=مذكر ،گروه خونی فرد=اگر جنسیت 4

%33/23 =مثبت باشد آنگاه احتمال ابتال برابر است با =سابقه چربی خون باال، -A=مذكر ،گروه خونی فرد=اگر جنسیت 5

.%33 باشد آنگاه احتمال ابتال برابر است با=+ سابقه فشارخون باال، +AB=مذكر ،گروه خونی فرد=اگر جنسیت 2

%5 باشد آنگاه احتمال ابتال برابر است با -AB =مذكر ،گروه خونی فرد=اگر جنسیت 2

%32/32 آنگاه احتمال ابتال برابر است بامنفی باشد =،سابقه دیابت3 <،میزان كراتینین +B=مذكر ،گروه خونی فرد=اگر جنسیت 8

%32 باشد آنگاه احتمال ابتال برابر است با -B=مذكر ،گروه خونی فرد=اگر جنسیت 3

%43/33 مثبت باشد آنگاه احتمال ابتال برابر است با=، سابقه دیابت+O=مذكر ،گروه خونی فرد=اگر جنسیت 33

%23/82 باشد آنگاه احتمال ابتال برابر است با 323<منفی ،قند خون ناشتا =سابقه دیابت، +O=مذكر، گروه خونی فرد=اگر جنسیت 33

منفی، سابقه =، سابقه فشارخون323>منفی ،قند خون ناشتا=سابقه دیابت، +O=مذكر ،گروه خونی فرد=اگر جنسیت 32

مثبت باشد آنگاه احتمال ابتال برابر است با=مصرف سیگار

54/52%

منفی، سابقه =، سابقه فشارخون323>منفی، قند خون ناشتا=سابقه دیابت، +O=مذكر، گروه خونی فرد=جنسیتاگر 33

سال باشد آنگاه احتمال ابتال برابر است با 53= >مثبت، سن فرد =مصرف سیگار

82/23%

منفی،سابقه مصرف =فشارخون،سابقه 323>منفی، قند خون ناشتا=، سابقه دیابت+O=مذكر، گروه خونی فرد=اگر جنسیت 34

باشد آنگاه احتمال ابتال برابر است با HDL >33 سال،سطح 54<مثبت ،سن فرد=سیگار

35%

معموال مجموعه قوانین استخراج شده از .استفاده كرد

درخت تصمیم، مهمترین اطالعاتی است كه از آنها بدست

ایجاد شده در این نرم افزار جهت تقسیم در مدل . می آید

در . (25) استفاده شده است 33شاخه ها از شاخص جینی

83این مطالعه معیار اطمینان برای قوانین ایجاد شده

مجموعه قوانین ایجاد شده 3در جدول. درصد تعیین شد

دلیل انتخاب این مدل . بیان شده است C5توسط مدل

های مورد نظر محاسبه شاخصاین جهت بود كه با نیز به

نحوه . دارای باالترین دقت در بین مدلهای اجرا شده بود

ئه شده است ها در بخش ارزیابی ارا محاسبه شاخص

(.3جدول)

2Gini Index

ارزیابی (د

در این مرحله پس از ایجاد مدل بایستی به ارزیابی مدل

ها به برای بررسی صحت مدل داده .ایجاد شده پرداخت

تقسیم ( درصد23)و آزمون ( درصد83) دو دسته آموزش

های سازند و داده های بخش آموزش مدل را می داده .شدند

ده را مورد ارزیابی قرار بخش آزمون مدل ایجاد ش

های توان از شاخص ها می جهت ارزیابی مدل. می دهند

ارزش اخباری مثبت و ارزش ،دقت ،ویژگی حساسیت،

ها محاسبه این شاخصجهت . ستفاده كرداخباری منفی ا

استفاده شده در محیط نرم افزار ماتریس تداخلی ایجاد از

شبکه های مقایسه دقت الگوریتم شاخص 4در جدول .شد

شده تصمیم ارائه درخت های الگوریتم عصبی و شبکه

.است

Page 8: Comparing performance of decision tree and neural …jpsr.mums.ac.ir/article_3319_c1294f9b7b51d9bacab0bf653f...3 Iterative Dichotomiser 3 4 classification and regression trees 5 Logistic

http://www.mums.ac.ir: سایت دانشگاه علوم پزشکی مشهد ...... لکرد درخت تصمیم گیری مقایسه عم -رضا صفدری

33

درخت تصمیم و شبکه عصبی مقایسه دقت الگوریتم های: 4جدول

توسعه (ه

حتی اگر هدف نیست پروژه پایان معموال مدل ساخت

دانش است، دانش بدست آمده نیاز به افزایش مدل

آن سازماندهی دارد و نمایش به طریقی كه كاربر بتواند از

دانش كشف شده باید سازماندهی شده و به . استفاده كند

ما در این مرحله بعد .شکل قابل ارائه برای دیگران درآید

كردیم توضیح دهیم كه بر ت الزم سعی از ایجاد گزارشا

های ایجاد شده تاثیرگذارترین فاكتورها در ابتال اساس مدل

های توجه به اینکه بیماری .فرد به آنفاركتوس قلبی كدامند

مرگ ها و علل از جمله شایع ترین بیماری قلبی عروقی

محسوب می شوند، چنانچه بتوانیم یك مجموعه پرخطر را

مه های غربالگری را برای آن اجرا كنیم شناسایی و برنا

این افراد یك عالوه بر .كارایی برنامه بیشتر خواهد شد

جمعیت پرخطر ممکن است بیشتر راغب به شركت در

كه نتیجه برنامه های غربالگری باشند به خصوص هنگامی

احتمال مثبت باشد روی آنهابر ( مدل ارائه شده)تست

.گوش فرا دهندپزشکی توصیه های دارد بیشتر به

C5 الگوریتم ،های مورد استفاده دراین مطالعه مالگوریت

در مرحله .بود( درصد4/33)دارای باالترین میزان دقت

مورد قوانین ایجاد ارزیابی نظرات متخصصان حوزه نیز در

به این ترتیب كه قوانین بدست .گرددشده اعمال می

و قوانینی كه از نظر آمده به متخصص مورد نظر ارائه شده

.گردیدندبالینی معتبر باشند به عنوان قوانین نهایی ارائه

. ترین موارد این قوانین در زیر ارائه شده است برخی از مهم

توان گفت كه بنابراین طبق نظر متخصص قلب و عروق می

فشارخون باال، مصرف سیگار، ریسك فاكتورهای سن باال،

بیشترین تاثیر را در ابتال به سطوح باالی كلسترول

و این در حالی است كه بر آنفاركتوس قلبی دارا هستند

های انجام شده بر اساس اولویت بندی اساس مقایسه

های مورد بررسی نیز این متغیرها متغیرها توسط الگوریتم

اهمیت جزو فاكتورهای اول قرار گرفته اند، كه نشان از

.فاركتوس قلبی داردناین متغیرها در ابتال به آ

متخصص قوانینی كه از نظر پزشك ترین مهم برخی از

ین بررسی مورد تایید قرار گرفتند قلب و عروق در ا

:عبارتند از

i. درصد از بیماران سابقه فشار خون و ابتال به 85/23در

.آنفاركتوس قلبی با هم مشاهده شدند

ii. ابتال به درصد از بیماران سابقه چربی خون و 25/55در

.آنفاركتوس قلبی با هم مشاهده شدند

iii. به ابتال سیگار و مصرف بیماران از درصد 23/45در

.آنفاركتوس قلبی با هم مشاهده شدند

iv. به و ابتال دیابت سابقه بیماران از درصد 24/43 در

.آنفاركتوس قلبی با هم مشاهده شدند

v. درصد از بیماران گروه خونی 32/32در A+ و ابتال به

.آنفاركتوس قلبی با هم مشاهده شدند

و نتیجه گیریبحث

در این تحقیق با استفاده از الگوریتم شبکه عصبی و

درخت تصمیم به ارائه مدل و استخراج قوانین آن در

قلبی آنفاركتوس به بتال ا احتمال پیشگویی راستای

مدل

درخت تصمیم شبکه عصبی معیارها

C5 C&RT QUEST CHAID

%83 52 %22/82 %32 %32 حساسیت=

%82 %5/84 %5/22 %5/33 %5/83 ویژگی=

%5/22 %23 %5/22 %4/83 %2/82 ارزش اخباری مثبت=

%33/58 %3/23 %5/85 %8/32 %2/33 ارزش اخباری منفی=

%2/85 %28/22 %3/23 %4/33 %52/33 دقت=

Page 9: Comparing performance of decision tree and neural …jpsr.mums.ac.ir/article_3319_c1294f9b7b51d9bacab0bf653f...3 Iterative Dichotomiser 3 4 classification and regression trees 5 Logistic

http://jpsr.mums.ac.ir : سایت مجله (3333پاییز و زمستان) 2شماره -3دوره -مجله علوم پیراپزشکی و توانبخشی مشهد

34

مطالعات انجام شده در حوزه داده كاوی در بیماری قلبیمقایسه نتایج : 5جدول نویسندگان و سال

ارائه تحقیق

الگوریتم های مورد

متغیرهای پیشگویی کننده یافته ها مدل نهایی( نوع)دقت نوع بیماری استفاده

Christine(1998) رگرسیون لجستیك

،درخت طبقه بندی

عملکرد بهتر درخت تصمیم در (درخت طبقه بندی )% 83 آنفاركتوس قلبی

پیشگویی ابتال به آنفاركتوس

قلبی

مصرف سیگار، سن،سابقه خانوادگی بیماری قلبی،

دیابت، فشار خون باال، درد در ناحیه قفسه سینه،

...جنسیت و استفراغ، تعریق شبانه،

Biglarian(2004) ،شبکه عصبی مصنوعی

رگرسیون لجستیك

پیوند عروق كرونری

قلب

شبکه عصبی )% 33/33

(مصنوعی

عملکرد بهتر شبکه عصبی

مصنوعی در پیش بینی كننده

های مهم مرگ و میر درون

بیمارستانی پس از جراحی قلب

باز

لسترول، تری گلیسرید، ك شاخص توده بدنی، سن،

چربی خون، دیابت، سیگار،فشارخون، مصرف

...سابقه بیماری قلبی و

Mehrabi(2007) پرسپترون شبکه عصبی

شبکه عصبی چند الیه،

با تابع مبتنی بر شعاع

نارسایی احتقانی قلب و

بیماری مزمن انسدادی

ریه

شبکه عصبی با تابع ) % 33

(مبتنی بر شعاع

توان باالی مدل شبکه عصبی

با تابع مبتنی بر شعاع در

و CHFافتراق دو بیماری COPD

درد ناحیه قفسه سینه، تپش قلب، جنس، سن،

خستگی، ورم، ارتوپنه، تنگی نفس،

...سیانوز،سرفه،خلط خونی،كاهش وزن و

Kajabadi درخت تصمیم

عوامل تاثیر گذار عمده بر بروز محاسبه نشده بیماری عروق كرونر

.بیماری قلبی مشخص شده اند

فاكتورهای چاقی، فاكتورهای خونی، چربی،

جنس، سن،)متغیرهای عمومی متغیرهای قندی،

فاكتور آپولیپویروتئین ها، ،..(استعمال دخانیات و

CRPالتهابی

Karaolis(2010) درخت تصمیمC4.5 آنفاركتوس قلبی،پیوند

عروق كرونر قلبی

درخت تصمیم )% 22

C4.5)

عوامل تاثیر گذار عمده بر بروز

آنفاركتوس قلبی مشخص شده

.اند

چربی خون باال، فشارخون باال، سن، جنسیت،

...دیابت و سطح كلسترول، سیگار،مصرف

Jyoti (2011) درخت شبکه بیز

،شبکه عصبی تصمیم

مصنوعی

بیماری قلبی

ایجاد قوانینی جهت یافتن (درخت تصمیم) % 83

ارتباط بین متغیرها

فشارخون باال، درد قفسه سینه، سن، جنسیت،

مصرف سیگار، سطح كلسترول، قند خون ناشتا،

...شاخص توده بدنی و

Mohammadpour (2011)

بیماری عروق كرونری شبکه عصبی مصنوعی

قلب

شبکه عصبی ) % 32

(مصنوعی

طبقه بندی صحیح بیماران

نیازمند آنژیوگرافی و دارو

درمانی

كلسترول تام، شاخص توده بدنی،كراتینین، سن،

،سابقه سابقه مصرف سیگار تری گلیسرید،

قلبی،نسابقه بیماری سابقه دیابت، فشارخون،

...تیجه تست ورزش و

C5 بهترین نتایج از الگوریتم درخت تصمیم .پرداختیم

بیشترین .درصد بود 4/33بدست آمد كه دقت آن

سابقه فشار فاكتورهای تاثیرگذار در ابتال افراد سن باال،

با . ربی خون باال و مصرف سیگار بودندچ و خون باال

فرد جدید با استفاده از قوانین بدست آمده برای یك

،می توان تعیین كرد كه داشتن متغیرهای مشخص

در . احتمال ابتال وی به آنفاركتوس قلبی چقدر خواهد بود

های مشابه با پژوهش به مقایسه نتایج پژوهش 5جدول

.حاضر می پردازیم

-بندیهای طبقه عملکرد مدل ،مطابق مطالعات گذشته

مختلف نتایج های داده كننده ممکن است بر روی پایگاه

همکارانش و Karaolis برای مثال. متفاوتی داشته باشد

گویی ابتال به بیماری پیش"ای تحت عنوان در مطالعه

از الگوریتم "گیری عروق كرونر با استفاده از درخت تصمیم

بیماری میم برای ارزیابی ریسك فاكتورهایدرخت تص

كتورهای ابتال را فاآنها ریسك .عروق كرونر استفاده كردند

قبل از رویداد و ، ریسك فاكتورهای به دو دسته كلی

كرده است بندی ریسك فاكتورهای بعد از رویداد تقسیم

مشابه با قوانین استخراج شده از ی آنها یافته .(25)

.الگوریتم درخت تصمیم در مطالعه حاضر می باشد

پیش بینی جهتJyoti توسط بررسی انجام شدهدر

ابتال به بیماری قلبی مدل ارائه شده توسط درخت تصمیم

.(22) استبوده ( درصد83) باالترین میزان دقتدارای

این در حالی است كه درخت تصمیم ارائه شده در این

تفاوت . از دقت باالتری برخوردار بوده است مطالعه

توان از تعداد بیشتر متغیرهای مورد مشاهده شده را می

Page 10: Comparing performance of decision tree and neural …jpsr.mums.ac.ir/article_3319_c1294f9b7b51d9bacab0bf653f...3 Iterative Dichotomiser 3 4 classification and regression trees 5 Logistic

http://www.mums.ac.ir: سایت دانشگاه علوم پزشکی مشهد ...... لکرد درخت تصمیم گیری مقایسه عم -رضا صفدری

35

در بررسی انجام .بررسی در مطالعه اشاره شده دانست

، درخت عملکرد رگرسیون لجستیك Kurtشده توسط

گویی بیماری و شبکه عصبی در پیش CARTتصمیم

عروق انجام شده و در این مطالعه مدل شبکه عصبی به

(.22) استعنوان بهترین مدل معرفی شده

در مطالعه محمد پور به كاربرد شبکه عصبی در ارزیابی

مدل بدست حساسیت و ی عروق كرونر قلب پرداختهبیمار

كه نشان از توان باالی این مدل در بدست آمد،% 32آمده

تشخیص سریعتر بیمارانی است كه نیازمند اقدامات

حساسیت باالی مدل ارائه .تشخیصی و درمانی هستند

متغیرهای توان به كارگیری مطالعه را میین شده در ا

ه اكو و همچنین نتیجمفیدی چون نتیجه تست ورزش و

میانی شبکه عصبی الیه های كمتر درتعیین تعداد نرون

(.28) بیان كرد

به مقایسه عملکرد رگرسیون Christineدر پژوهش

لجستیك و چند الگوریتم از درخت تصمیم در تعیین ابتال

به آنفاركتوس قلبی پرداخته شده است و مدل درخت

به عنوان مدل مناسبی جهت % 83تصمیم با حساسیت

كه به ای ر مطالعهد (.23) پیشگویی معرفی شده است

با یه وهای عصبی پرسپترون چند ال مقایسه عملکرد شبکه

های تصمیم یار بالینی تابع مبتنی بر شعاع در سیستم

برای تفکیك در بیماری نارسایی قلبی و انسداد مزمن ریه

% 33پرداخته شده است، مدل شبکه عصبی با حساسیت

به عنوان مدل برتر جهت ایجاد تمایز در تشخیص بیماران

مبتال به نارسایی قلبی و انسداد مزمن ریه معرفی شده

ای كه با عنوان كاربرد شبکه عصبی در مقاله (.33)ست ا

های مهم مرگ و میر مصنوعی در تعیین پیش بینی كننده

درون بیمارستانی پس از جراحی قلب باز و مقایسه آن با

بیمارستان شریعتی تهران انجام رگرسیون لجستیك در

عملکرد % 33/33شبکه عصبی مصنوعی با دقت ،شد

(.33) داشتبهتری

اری ، راهکكاوی پزشکی ای با عنوان داده عهدر مطال

زای قلبی به ارائه جهت كشف روابط بین عوامل خطر

زای قلبی ای برقراری ارتباط بین عوامل خطرمدلی بر

مورد استفاده در این كه از بین متغیرهای ،ه استپرداخت

سن سطح كلسترول، ، LDL ی مانندفاكتورهایمطالعه،

،APOBA ،تری گلیسرید ،APOB بدن،شاخص توده

APOB/APOA (.32) استستعمال دخانیات بوده او

مطالعه در قلبی بیماری بروز در كه تاثیر این متغیرها

.حاضر نیز تایید شده است

های كاوی می تواند در طراحی مدل های داده تکنیك

بیماریهای گویی امکان ابتالی افراد به پیش مناسب جهت

دارای C5و در این مطالعه مدل دخاص استفاده شون

های باالترین میزان دقت بوده و می تواند در برنامه

غربالگری جهت شناسایی افراد در معرض خطر استفاده

های پیشنهاد می شود كه این مدل با مجموعه داده. شود

تر اجرا شده و پس از بیشتر و در بازه زمانی طوالنی

های غربالگری به سطح دقت مطلوب در برنامه رسیدن

شود در مطالعاتی پیشنهاد می .مورد استفاده قرار گیرد

های سایر مراكز درمانی و یا بعدی دقت این مدل در داده

سایر مقاطع زمانی مورد ارزیابی قرار گیرد و پس از ایجاد

در تغییرات ضروری و رسیدن به سطح مطلوب دقت،

ع و مناسب جهت پیشگویی احتمال انتخاب مدلی جام

. ابتال افراد به آنفاركتوس قلبی اقدام شود

سپاسگزاری

ه كارشناسی ارشد اینجانب این مقاله برگرفته از پایان نام

پرسنل محترم واحد مدارک بدین وسیله از می باشد،

پزشکی بیمارستان شهید رجایی تهران كمال تشکر و

.قدردانی را دارم

منابع

1. Sezavar SH, Valizade M, Moradi M, Rahbar M.H.

[review of early myocardial infarction and its risk

factor in patients hospitalized in Rasool Akram

hospital in Tehran]. Hormozgan Medical Journal

2010; 4(2): 156-163. [Persian]

2. Fauci A, Braunwald E, Kasper D, Hauser S, Longo

D. Harrison's Principles of Internal Medicine, 17th

Edition: New York; 2008:71-73.

3. Mohammadi F, Taherian A, Hosseini MA

Rahgozar M. [Effect of Home-Based Cardiac

Rehabilitation on Quality of Life in the Patient with

Myocardial Infarction]. rehabilitation journal

2006 ; 7(7): 11-19.[Persian]

4. Gavish D, Leibovitz E, Elly I, Shargorodsky M,

Zimlichman R.[Follow-up in a lipid clinic

improves the management of risk factors in

Page 11: Comparing performance of decision tree and neural …jpsr.mums.ac.ir/article_3319_c1294f9b7b51d9bacab0bf653f...3 Iterative Dichotomiser 3 4 classification and regression trees 5 Logistic

http://jpsr.mums.ac.ir : سایت مجله (3333پاییز و زمستان) 2شماره -3دوره -مجله علوم پیراپزشکی و توانبخشی مشهد

32

Cardiovascular disease patients]. The Israel

Medical Association Journal 2002; 4(9): 694-697.

5. Gavish D, Leibovitz E, Elly I, Shargorodsky M,

Zimlichman R.[Follow-up in a lipid clinic

improves the management of risk factors in

cardiovascular disease patients]. The Israel Medical

Association Journal 2002; 4(9): 694-697.

6. Smith DL, Fehling PC, Frisch A, Haller JM, Winke

M, Dailey aMW. [The Prevalence of

Cardiovascular Disease Risk Factors and Obesity

in Firefighters]. Journal of Obesity 2012:2-9.

7. Boo S, Erika Sivarajan Froelicher. [Cardiovascular

Risk Factors and 10-year Risk for Coronary Heart

Disease in Korean Women]. Asian Nursing

Research 2012; 6(3): 1-8.

8. Soni J, Ansari U, Sharma D, Soni S.[Predictive

Data Mining for Medical Diagnoses: An Overview

of Heart Disease Prediction].International Journal

of Computer Applications 2011; 17(8): 85-93.

9. Subbalakshmi G, Road Y. [Decision Support in

Heart Disease Prediction System using Naive

Bayes]. Indian Journal of Computer Science and

Engineering 2011; 2(2): 183-195.

10. Fayyad M, Piatetsky G, Uthurusamy R, Smyth P.

[Advances in Knowledge Discovery and Data

Mining]. American Association of artificial

intelligence 1996; 17(3): 37-54.

11. Lavrac N. [Selected techniques for data mining in

medicine]. Artificial Intelligence in Medicine 1999;

16(1): 3-23.

12. Huanga M, Chenb M, Leea S. [Integrating data

mining with case-based reasoning for chronic

diseases prognosis and diagnosis]. Expert Systems

with Applications 2007; 32(3): 856–867.

13. Alizadeh S, Ghazanfari M, Teimorpour B .Data

Mining and Knowledge Discovery, Publication of

Iran University of Science and Technology: 2nd ed

2011: 63-65.

14. Collins GS, Mallett S, Omar O. [Developing risk

prediction models for type 2 diabetes: a systematic

review of methodology and reporting]. BMC

Medicine 2011; 5(3): 146-159.

15. Ashwinkumar M, Anandakumar R. [Ethical and

Legal Issues for Medical Data

Mining].international Journal of Computer

Applications 2010.

16. Cooper G, Aliferis F, Ambrosinoa R, Aronisb B,

Buchananb RC, Michael J. Fined CG, et al.[An

evaluation of machine-learning methods for

predicting pneumonia mortality]. Artificial

Intelligence in Medicine 1996; 9(4): 107-138.

17. Olivas R. [DecisionTrees,A Primer for Decision-

making Professionals] 2007; 9(4): 4-6. Available

from:www.lumenaut.com/download/decision_tree_

primer.

18. Colombet I, Ruelland A, Chatellier G, Gueyffier F,

Degoulet P, Christine M. [Models to predict

cardiovascular risk: comparison of CART,

Multilayer perception and logistic regression]. Proc

AMIA Symp 2000:156-160.

19. Tsien C, Fraster H. [using classification tree and

logistic regression in myocardial infarction].

Proceeding of the 9th

world congress on medical

informatics; 1998.

20. Abdelghani B, Erhan G. [Predicting Breast Cancer

Survivability Using Data Mining Techniques].

Washington University 2005; 2(2): 53-62.

21. Stark K, Pfeiffer D. [The application of non-

parametric techniques to solve classification

problems in complex data sets in veterinary

epidemiology-An example]. Intelligent Data

Analysis 2006; 3(1): 23-25.

22. Ordonez C. [Comparing Association rules and

Decision Trees for Disease Prediction].intelligent

data analysis 2011; 15(2): 3-9.

23. Jianxin C, Yanwei X, Guangcheng X, Jianqiang Y,

Dongbin Z. [A Comparison of Four Data Mining

Models: Bayes, Neural Network, SVM and

decision Trees in Identifying Syndromes in

Coronary Heart Disease]. Springer- Verlag Berlin

Heidelberg 2007:1274–1279.

24. IBM SPSS Modeler CRISP-DM Guide. Available

from:www.spss.ch/upload/1107356429_CrispDM1

Page 12: Comparing performance of decision tree and neural …jpsr.mums.ac.ir/article_3319_c1294f9b7b51d9bacab0bf653f...3 Iterative Dichotomiser 3 4 classification and regression trees 5 Logistic

http://www.mums.ac.ir: سایت دانشگاه علوم پزشکی مشهد ...... لکرد درخت تصمیم گیری مقایسه عم -رضا صفدری

32

25. Margaret R, Kraft C, Desouza A. [Data Mining in

Healthcare Information Systems. Case Study of a

Veterans’ Administration Spinal Cord Injury

Population].Proceedings of the 36th Hawaii

International Conference on System Sciences 2003.

26. IBM SPSS Modeler 15 Applications guide.

Available from: ftp://ftp.software.ibm.com/software/analytics/spss

27. Karaolis M, Moutiris J, Papaconstantinou L,

Pattichis C S. [Association Rule Analysis for the

Assessment of the Risk of Coronary Heart Events].

Proceedings of the 31st Annual International

Conference of the IEEE Engineering in Medicine

and Biology Society 2009.

28. Jyoti S, Ujma A, Dipesh S,Sunita S. [Predictive

Data Mining for Medical Diagnosis: An Overview

of Heart Disease Prediction]. International Journal

of Computer Applications 2011; 17(8): 35-43.

29. Kurt I, Ture M, Kurum T. [Comparing

performances of logistic regression, classification

and regression tree, and neural networks for

predicting coronary artery disease]. Expert Systems

with Applications 2008; 34(3): 366–374.

30. Mohammadpour A, Esmaeili M, Ghaemian A,

Esmaeili J. [Application of Artificial Neural

Network for Assessing Coronary Artery Disease].

Journal Mazand Univ Med Sci 2012; 22(86): 9-17.

[Persian]

31. Mehrabi S, Maghsodlo M, Arab Ali Baik H,

Normand R, Nowzari Y. [Using Multilayer

Perceptron neural network and Radial Basis

Function in Clinical Diagnostic Decision Support

System for differentiated between Congestive

Heart Failure and Chronic Obstructive Pulmonary

Disorder].Medical physics journal 2007; 12(3).

[Persian]

32. Biglarian A, Babaee R, Azmie R. [Application of

Artificial Neural Network Model in Determining

Important Predictors of In Hospital Mortality After

Coronary Artery Bypass Graft Surgery, and it’s

Comparison with Logistic Regression Model].

Modarres J Med Sci 2004; 7(1): 23-30. [Persian]

33. Kajabadi A, Saraee M, Asgari S. [Medical Data

Mining: An Approach to Discovery Relationships

among Cardiovascular Risk Factors]. Available

from: www. civilica. Com/Paper- IDMC03-

IDMC03_ 065.