18
ﻣﻘﺎﻟﻪ ﻣﺮوري١٣ ، ١٣٩٣ ، ١١٧٠ - ١١٥٣ رواﯾﯽ و ﭘﺎﯾﺎﯾﯽ اﺑﺰارﻫﺎ و روش ﻫﺎ ي ﻣﺨﺘﻠﻒ اﻧﺪازه ﮔﯿﺮ ي آﻧﻬﺎ در ﭘﮋوﻫﺶ ﻫﺎ ي ﮐﺎرﺑﺮدي در ﺳﻼﻣﺖ اﺑﻮاﻟﻔﻀﻞ ﻣﺤﻤﺪﺑﯿﮕﯽ1 ، ﻧﺮﮔﺲ ﻣﺤﻤﺪﺻﺎﻟﺤﯽ2 ، ﻣﺤﻤﺪ ﻋﻠﯽ ﮔﻞ3 درﯾﺎﻓﺖ ﻣﻘﺎﻟﻪ: 3 / 6 / 93 ارﺳﺎل ﻣﻘﺎﻟﻪ ﺑﻪ ﻧﻮﯾﺴ ﻨﺪه ﺟﻬﺖ اﺻﻼح: 6 / 11 / 93 درﯾﺎﻓﺖ اﺻﻼﺣﯿﻪ از ﻧﻮﯾﺴﻨﺪه: 12 / 11 / 93 ﭘﺬﯾﺮش ﻣﻘﺎﻟﻪ: 6 / 12 / 93 ﭼﮑﯿﺪه ﭘﺪﯾﺪه اﻣﺮوزه ﺑﺎ ﮔﺴﺘﺮش ﺗﺤﻘﯿﻘﺎت در ﻋﻠﻮم ﭘﺰﺷﮑﯽ و اﺟﺘﻤﺎﻋﯽ، ﭘﮋوﻫﺶ، آﻣﻮزش و ﻣﺪﯾﺮﯾﺖ، ﺑﺴﯿﺎري از ﻫﺎ از ﻃﺮﯾﻖ اﺑﺰارﻫﺎﯾﯽ ﭼﻮن ﭘﺮﺳﺶ ﻧﺎﻣﻪ ﻫﺎ ، ﭼﮏ ﻟﯿﺴﺖ ﻫﺎ و ﺗﺴﺖ ﻫﺎ ي آﻣﻮزﺷﯽ و ﯾﺎ ارز ﯾﺎﺑﯽ ﻫﺎ ي داوران و ﺑﻪ ﻣﻨﻈﻮر ﮐ ﻤﯽ ﺳﺎزي رﻓﺘﺎر اﻓﺮاد ﯾﺎ ﺟﺎﻣﻌﻪ، ﻣﻮرد ﻣﻄﺎﻟﻌﻪ ﻗﺮار ﻣﯽ ﮔﯿﺮد. رواﯾﯽ و ﭘﺎﯾﺎﯾﯽ از ﺷﺎﺧﺺ ﻫﺎ ي ﻻزم ﺟﻬﺖ اﻧﺪازه ﮔﯿﺮ ي و دﺳﺘﯿﺎﺑﯽ ﺑﻪ ﻣﻘﺎدﯾﺮ واﻗﻌﯽ ﭘﯿﺎﻣﺪﻫﺎ ﻣﯽ ﺑﺎﺷﺪ. آﮔﺎﻫﯽ و ﻓﻬﻢ ﮐﺎﻓﯽ از رواﯾﯽ و ﭘﺎﯾﺎﯾﯽ از اﺻﻮل ﻣﺘﺪوﻟﻮژي در ﻃﺮاﺣﯽ ﻣﻄﺎﻟﻌﺎت و ﮐﺎرﺑﺮد ﺳﻨﺠ ﻫﺎ ي ﻣﺨﺘﻠﻒ اﺳﺖ ﮐﻪ ﻣﺘﺄ ﺳﻔﺎﻧﻪ در ﺑﺴﯿﺎري از ﻣﻮارد ﻧﺎدﯾﺪه ﮔﺮﻓﺘﻪ ﻣﯽ ﺷﻮد. ﻫﺪف ﻧﻮﺷﺘﺎر ﺣﺎﺿﺮ آﺷﻨﺎﯾﯽ ﻣﺤﻘﻘﯿﻦ و داﻧﺸﮕﺎﻫﯿﺎن ﺑﺎ ﻣﻔﺎﻫﯿﻢ ﭘﺎﯾﺎﯾﯽ، رواﯾﯽ و ﺷﯿﻮه ﻫﺎ ي ﻣﺨﺘﻠﻒ اﻧﺪازه ﮔﯿﺮ ي آن اﺳﺖ. واژه ﻫﺎي ﮐﻠﯿﺪي: رواﯾﯽ، ﭘﺎﯾﺎﯾﯽ، روان ﺳﻨﺠﯽ ، آﻟﻔﺎي ﮐﺮوﻧﺒﺎخ، ﺗﺤﻠﯿﻞ ﻋﺎﻣﻠﯽ1 - اﺳﺘﺎدﯾﺎر اﭘﯿﺪﻣﯿﻮﻟﻮژي، ﮔﺮوه اﭘﯿﺪﻣﯿﻮﻟﻮژي و آﻣﺎر زﯾﺴﺘﯽ، ﻣﺮﮐﺰ ﺗﺤﻘﯿﻘﺎت ﺳﯿﺎﺳﺘﮕﺬاري و ارﺗﻘﺎء ﺳﻼﻣﺖ، داﻧﺸﮑﺪه ﺑﻬﺪاﺷﺖ، داﻧﺸﮕﺎه ﻋﻠﻮم ﭘﺰﺷ ﮑﯽ و ﺧﺪﻣﺎت ﺑﻬﺪاﺷﺘﯽ درﻣﺎﻧﯽ ﻗﻢ، ﻗﻢ، اﯾﺮان ﺗﻠﻔﻦ: 37842228 - 025 ، دورﻧﮕﺎر: 37842228 - 025 ، ﭘﺴﺖ اﻟﮑﺘﺮوﻧﯿﮑﯽ: [email protected] 2 - ﮐﺎرﺷﻨﺎس ارﺷﺪ اﭘﯿﺪﻣﯿﻠﻮژي، ﻣﺮﮐﺰ ﺗﺤﻘﯿﻘﺎت ﺳﯿﺎﺳﺘﮕﺬاري و ارﺗﻘﺎء ﺳﻼﻣﺖ، داﻧﺸﮕﺎه ﻋﻠﻮم ﭘﺰﺷﮑﯽ و ﺧﺪﻣﺎت ﺑﻬﺪاﺷﺘﯽ درﻣﺎﻧﯽ ﻗﻢ، ﻗﻢ، اﯾﺮان3 - داﻧﺸﺠﻮي دﮐﺘﺮي آﻣﻮزش ﺑﻬﺪاﺷﺖ، داﻧﺸﮑﺪه ﺑﻬﺪاﺷﺖ، داﻧﺸﮕﺎه ﻋﻠﻮم ﭘﺰﺷﮑﯽ و ﺧﺪﻣﺎت ﺑﻬﺪاﺷﺘﯽ درﻣﺎﻧﯽ ﺷﻬﯿﺪ ﺑﻬﺸﺘﯽ، ﺗﻬﺮان، اﯾﺮان ﻣﻘﺪﻣﻪ اﻣﺮوزه ﺑﺎ ﮔﺴﺘﺮش ﺗﺤﻘﯿﻘﺎت در ﻋﻠﻮم ﭘﺰﺷﮑﯽ و اﺟﺘﻤﺎﻋﯽ، ﭘﮋوﻫﺶ، آﻣﻮزش و ﻣﺪﯾﺮﯾﺖ، ﺑﺴﯿﺎري از ﭘﺪﯾﺪه ﻫﺎ از ﻃﺮﯾﻖ اﺑﺰارﻫﺎﯾﯽ ﭼﻮن ﭘﺮﺳﺶ ﻧﺎﻣﻪ ﻫﺎ ، ﭼﮏ ﻟﯿﺴﺖ ﻫﺎ و ﺗﺴﺖ ﻫﺎ ي آﻣﻮزﺷﯽ و ﯾﺎ ارزﯾﺎﺑﯽ ﻫﺎ ي داوران ﻣﻮرد ﻣﻄﺎﻟﻌﻪ ﻗﺮار ﻣﯽ ﮔﯿﺮد] 1 [ ﺗﺎ ﺑﺘﻮاﻧﻨﺪ رﻓﺘﺎر اﻓﺮاد ﯾﺎ ﺟﺎﻣﻌﻪ ﻣﻮرد ﻣﻄﺎﻟﻌﻪ را ﮐ ﻤﯽ ﺳﺎ زي ﻧﻤﺎﯾﻨﺪ] 2 [ . از آﻧﺠﺎ ﮐﻪ ﺑﺴﯿﺎري از ﺗﺤﻘﯿﻘﺎت ﺑﺮ اﺳﺎس اﺑﺰارﻫﺎي ﻣﺬﮐﻮر اﻧﺠﺎم ﻣﯽ ﺷﻮد ، ﭘﺎﯾﺎﯾﯽ) Reliability ( و رواﯾﯽ(Validity) آﻧﻬﺎ اﻣﺮي اﺟﺘﻨﺎب ﻧﺎﭘﺬﯾﺮ اﺳﺖ و ﻣﻘﺪار آن ﺑﺎﯾﺪ در ﺣﺪ ﻗﺎﺑﻞ ﻗﺒﻮﻟﯽ ﺑﺎﺷﺪ] 2 - 4 [ . ﺑﺮ اﺳﺎس ﻣﻄﺎﻟﻌﺎت اﻧﺠﺎم ﺷﺪه ﺑﯿﺸﺘﺮ ﻣﻄﺎﻟﻌﺎت در ﮔﺰارش رواﯾﯽ و ﭘﺎﯾﺎﯾ ﯽ ﺑﺎ ﻣﺸﮑﻞ رو ﺑﻪ رو ﻫﺴﺘﻨﺪ ﺑﻪ ﻧﺤﻮي ﮐﻪ اﻃﻼﻋﺎت ﮐﺎﻓﯽ در ﻣﻮرد اﺑﻌﺎد روان ﺳﻨﺠﯽ اﺑﺰارﻫﺎ و ﯾﺎ در ﺑﻪ ﮐﺎر ﺑﺮدن ﺗﺴﺖ ﻫﺎ ي روان ﺳﻨﺠﯽ وﺟﻮد ﻧﺪارد. ﺑﺮ اﺳﺎسDownloaded from journal.rums.ac.ir at 11:44 IRDT on Sunday April 1st 2018

Validity and Reliability of the Instruments and Types of

Embed Size (px)

Citation preview

Page 1: Validity and Reliability of the Instruments and Types of

مروريمقاله

١١٥٣-١٣٩٣،١١٧٠، ١٣

ي هاي آنها در پژوهشگیراندازهي مختلف هاروایی و پایایی ابزارها و روشکاربردي در سالمت

3، محمد علی گل2، نرگس محمدصالحی1ابوالفضل محمدبیگی

6/12/93: پذیرش مقاله12/11/93:دریافت اصالحیه از نویسنده6/11/93:نده جهت اصالحارسال مقاله به نویس3/6/93:دریافت مقاله

چکیدهاز طریق هاامروزه با گسترش تحقیقات در علوم پزشکی و اجتماعی، پژوهش، آموزش و مدیریت، بسیاري از پدیده

سازي رفتار افراد میبه منظور کوي داوران هایابیي آموزشی و یا ارزهاو تستها، چک لیستهانامهپرسشابزارهایی چون ي و دستیابی به مقادیر واقعی گیراندازهي الزم جهت هاروایی و پایایی از شاخص. گیردمییا جامعه، مورد مطالعه قرار

ي مختلف هاشآگاهی و فهم کافی از روایی و پایایی از اصول متدولوژي در طراحی مطالعات و کاربرد سنج. باشدمیپیامدها هدف نوشتار حاضر آشنایی محققین و دانشگاهیان با مفاهیم . شودسفانه در بسیاري از موارد نادیده گرفته میاست که متأ

. ي آن استگیراندازهي مختلف هاپایایی، روایی و شیوه، آلفاي کرونباخ، تحلیل عاملیسنجیروایی، پایایی، روان:کلیديهايواژه

کی و استادیار اپیدمیولوژي، گروه اپیدمیولوژي و آمار زیستی، مرکز تحقیقات سیاستگذاري و ارتقاء سالمت، دانشکده بهداشت، دانشگاه علوم پزش-1ایرانقم،قم،خدمات بهداشتی درمانی

[email protected]: ، پست الکترونیکی025- 37842228: ، دورنگار025- 37842228: تلفن

مرکز تحقیقات سیاستگذاري و ارتقاء سالمت، دانشگاه علوم پزشکی و خدمات بهداشتی درمانی قم، قم، ایرانارشد اپیدمیلوژي،کارشناس-2دانشجوي دکتري آموزش بهداشت، دانشکده بهداشت، دانشگاه علوم پزشکی و خدمات بهداشتی درمانی شهید بهشتی، تهران، ایران-3

مقدمهبا گسترش تحقیقات در علوم پزشکی و امروزه

هااجتماعی، پژوهش، آموزش و مدیریت، بسیاري از پدیدهو ها، چک لیستهانامهپرسشاز طریق ابزارهایی چون

ي داوران مورد مطالعه هاي آموزشی و یا ارزیابیهاتستتا بتوانند رفتار افراد یا جامعه مورد ]1[گیردمیقرار

از آنجا که بسیاري از . ]2[زي نمایندسامیمطالعه را ک

، پایایی شودمیتحقیقات بر اساس ابزارهاي مذکور انجام )Reliability (و روایی(Validity) آنها امري اجتناب

- 2[ناپذیر است و مقدار آن باید در حد قابل قبولی باشدبر اساس مطالعات انجام شده بیشتر مطالعات در . ]4

ی با مشکل رو به رو هستند به نحوي گزارش روایی و پایایکه اطالعات کافی در مورد ابعاد روان سنجی ابزارها و یا در

بر اساس . ي روان سنجی وجود نداردهابه کار بردن تست

Dow

nloa

ded

from

jour

nal.r

ums.

ac.ir

at 1

1:44

IRD

T o

n S

unda

y A

pril

1st 2

018

Page 2: Validity and Reliability of the Instruments and Types of

...گیري آنها درهاي مختلف اندازهروایی و پایایی ابزارها و روش1154

1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان

مروري گرچه در برخی مطالعات روایی ايهمطالعبیان شده است اما این روایی (Content Validity)محتوي

روایی ضابطه به . نجام شده استمتخصص ا5با کمتر از ي گیراندازهندرت گزارش شده است و یا خطاهایی در

. شودمیروایی سازه گزارش ن،همچنین. ضابطه وجود دارددر خصوص پایایی بیشتر با استفاده از آلفاي کرونباخ مقدار

شود میگزارش )Internal Consistency(سازگاري درونی کمتر مورد توجه قرار هامونآز) Stability(اما ثبات

لذا بررسی ابعاد مختلف روانسنجی ابزارها و . ]5[گیردمیي در علوم مختلف و گیراندازهیکی از ضروریات هامقیاس

لذا نوشتار حاضر با هدف آشنایی محققین و . پژوهش استپژوهشگران دانشگاهی با مفاهیم روایی و پایایی و

روایی به ،ایایی و همچنیني پگیراندازهي مختلف هاروشي مختلف تهیه هامنظور استفاده صحیح و به جا از روش

در این مقاله ابتدا تعریفی از روایی و پایایی ارائه . شده است. شده و به رابطه بین پایایی و روایی پرداخته شده است

ي آن و انواع گیراندازهي هاسپس به پایایی و روشتوافق درونی در پایایی سنجشي پایایی شامل هاسنجش

و پایایی دو نیمه آزمونبا استفاده از آلفاي کرونباخ ، سنجش ثبات در ،همچنینو پایایی کادر ریچاردسن

، ي یکسانهافرم، باز آزمون- آزمون پایایی با استفاده از . اشاره شدپایایی بین مشاهده کنندگانو ي متعادلهافرم

ي تعیین روایی هاواع روشدر نهایت به تعریف روایی، انشامل روایی صوري، روایی محتوي، روایی سازه و روایی

. ضابطه اشاره شدتعریف روایی و پایایی

از صحت نتایج مطالعه است و نشان ايهروایی درجچیزي را که قصد ايهدهد که مطالعه تا چه اندازمی

ي آن را داشته است به درستی سنجیده است؟ گیراندازه

از یکسان بودن نتایج در ايهپایایی درج. ]3-1، 5- 11[طول زمان معین و تحت شرایط مشابه و با روش کار

و ) Repeatability(باشد که با قابلیت تکرار میمشابه ي گیراندازهنتایج ) Reproducibility(قابلیت تکثیر

توان گفت که پایایی میبه عبارتی ]1-3، 5-11[شودمیکه به معنی کسب ثبات. متفاوت استشامل سه بخش

نتایج یکسان در افراد مشابه در صورت تکرار آزمون است؛ هنگامی به دست ) Equivalence(هم ارزي یا تعادل

آید که چنانچه آزمون توسط محققین مختلفی به کار میرود نتایج یکسانی را به دست آورد؛ و همگنی

)Homogeneity (ي آزمون اهشاخصی است که تمام بخشبنابراین براي . مورد استفاده داراي سازگاري درونی باشند

تعیین همگنی، تعدادي از تعاریف مختلف عملیاتی از مشابه با یک روش خاص در مفاهیم مشابه بر روي افراد

شود و نتایج به دست میآزمون هاآوري دادهشیوه جمع. ]12-13[آمده باید شدیداً به یکدیگر وابسته باشند

ي به کار رفته در علوم مختلف، در هادر ارزیابیي پزشکی و هاي آموزشی و پژوهشی، تشخیصهافعالیت

که محقق بخواهد هر کدام از اجزاي غیره، بر اساس آني گیراندازهپایایی شامل ثبات، هم ارزي و یا همگنی را

ي مختلف به سنجش پایایی هاتواند از روشمینماید نامهپرسش، جهت بررسی پایایی ابزارمنظور بدین . بپردازد

باز - روش آزمون توان از میو یا هر مقیاس سنجش دیگر ي مورد هاآزمون،همچنینو)Test-Retest(آزمون

، ضریب آلفاي کرونباخاستفاده در تعیین پایایی از جمله ي موازي هاروش دو نیمه کردن، کادر ریچارسون و یا فرم

.کنداستفاده ز گروه هدفاايهنمونبر روي

Dow

nloa

ded

from

jour

nal.r

ums.

ac.ir

at 1

1:44

IRD

T o

n S

unda

y A

pril

1st 2

018

Page 3: Validity and Reliability of the Instruments and Types of

1155و همکارانابوالفضل محمدبیگی

1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان

رابطه بین پایایی و روایی، معیارهاي ضروري در تعیین هاروایی و پایایی سنجش

پایایی با خطاي تصادفی . باشندمیدقت و صحت سنجش در ارتباط است و روایی با خطاي منظم و بنابراین هرچقدر

تواند بر کاهش خطاي میکه تعداد حجم نمونه باال رود یابد میگذارد و بنابراین پایایی ابزار افزایش تأثیرتصادفی

اما باید توجه . استمؤثري گیراندازهو بنابراین بر دقت نمود که افزایش روایی مستلزم استفاده از ابزارهاي

به بیان دیگر روایی نشان . خواهد بودمؤثراستاندارد و ذکر این نکته . ]14-15[ي استگیراندازهدهنده صحت

به . م است که پایایی شرط الزم براي روایی استالزتواند میداراي پایایی نباشد نايهعبارتی چنانچه سنج

بنابراین در . مقدار درست و واقعی یک پدیده را نشان دهدید أیاعتبارسنجی ابزارها، سنجش روایی باید پس از ت

پایایی با خطاي تصادفی و روایی با . پایایی صورت گیردبنابراین افزایش ي، مرتبط استگیراندازهخطاي منظم

برد و میدقت با کاهش خطاي تصادفی، پایایی را باال افزایش صحت ناشی از کاهش خطاي منظم بوده که روایی

شرط الزم براي روایی یک ]. 13- 14، 16[بردمیرا باال براي اینکه وکافی نیست شرطآزمون پایایی آن است ولی

].1، 14، 17[باشد باید پایا باشد)وار(یک آزمون معتبراما به طور کلی اعتبار و پایایی از هم جدا نبوده و با

و ] 18-19[شودمیروایی آن هم افزوده ،افزایش پایاییگردد و میالبته پایین بودن پایایی نیز سبب کاهش روایی

از خطاهایی است که در ايهدهنده مجموعنشانگرچه برخی محققین رابطه . ]19[دهدمیي رخ گیراندازه

به ،اندو روایی را در ابزارها نشان دادهمعکوسی بین پایایی االت باز، پایایی کمی دارد حال ؤعنوان مثال مصاحبه با س

آنکه روایی باالیی دارد اما یک مصاحبه استاندارد شده

از منظر کالسیک و . ]20[نتیجه عکس خواهد داشتقابل توجهی در مفاهیم بنیادي روش شناختی نیز تفاوت

وجود دارد که در ) Certainty(و قطعیت) Truth(حقیقت .]20-21[مشخص شده است1شکل

روایی و پایایی نگاهی اجمالی به لغت شناسی مفاهیم پایه-1شکل ي کالسیک، مدرن و روش شناختیهااز دیدگاه

است و از بعد روش شناختی روایی با حقیقت در ارتباط عالوه بر این رابطه . باشدمیپایایی با قطعیت مرتبط

معکوس بین روایی و پایایی در روش متدولوژیک و رابطه معکوس بین حقیقت و قطعیت در دیدگاه ،همچنین

به این معنی که هر چه . کالسیک نشان داده شده است]20- 21[یابدمیپایایی کمتر باشد عدم قطعیت افزایش

ي آنگیراندازهي هاشپایایی و روباشد که صفر میضریب پایایی عددي بین صفر تا یک

صد را و یک پایایی صد دراستنشانگر عدم وجود پایاییبنابراین پایایی شاخصی براي . ]22[دهدمینشان

ي هااعم از آزمونهانامهپرسشو هاارزشیابی آزمونباشد میي تحقیقاتی هانامهپرسشغربالگري و تشخیصی و

اول آنکه :و به دو دلیل از اهمیت خاصی بر خوردار است

Dow

nloa

ded

from

jour

nal.r

ums.

ac.ir

at 1

1:44

IRD

T o

n S

unda

y A

pril

1st 2

018

Page 4: Validity and Reliability of the Instruments and Types of

...گیري آنها درهاي مختلف اندازهروایی و پایایی ابزارها و روش1156

1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان

) Random Error(پایایی حاکی از وجود خطاي تصادفیفاکتورهاي دالیلي است که این خطا به گیراندازهدر

و آزمونفاکتورهاي مرتبط با ،مربوط به آزمون شوندهفاکتورهاي مرتبط با امتیاز،همچنینآن وشرایط برگزاري

اینگونه خطاها تصادفی بوده و اثر شوند که میی ایجاد دهبر این . بینی استآنها بر روي امتیاز آزمون غیر قابل پیش

ت سؤاالاساس چنانچه حجم نمونه افزایش یابد و یا تعداد پایایی دوم، . رودمیي ابزار افزایش یابد پایایی باال هایا آیتم

.]8،2- 9، 23- 24[روایی استپیشگوکننده ي پایاییهاانواع سنجش

مورد استفاده براي سنجش پایایی یک ابزار روشبه دلیل عملکرد و طبیعت ابزار و ) نامهپرسشآزمون یا (

متفاوت زمینه مورد استفادهچگونگی استفاده از آن در گاهی هدف تعیین ضریب پایایی به معناي تعیین . باشدمی

اي کرونباخ، کادر ي آلفهاتوافق درونی است که از روشاما . توان استفاده کردمیدو نیمه کردن ریچارسون و

چنانچه بخواهیم ثبات ابزار را مورد ارزیابی قرار دهیم ي هاتوان از روش آزمون بازآزمون و یا از روش فرممی

گاهی هدف از تعیین ،همچنین. ]25[موازي استفاده نمودا مصاحبه ان یگرب پایایی تعیین توافق بین مشاهدهضری

.باشدمیگان و یا ارزیابان کنندهسنجش توافق درونی در پایایی

) :Cronbach's Alpha(روش آلفاي کرونباخ-1در دانشگاه استنفورد روش 1951در سال کرونباخ

آماري ضریب آلفا را براي حل مشکل تعیین پایایی تریناین روش معمول.ی ابداع کردسؤالي چند هاآزمون

که در بیشتر مطالعات از ضریب پایایی ثبات داخلی است تناسبمیزانمعرفو]26-35[شودمیآن استفاده

مقدار . سنجندمیراسازهیککهستیی اهاآیتمازگروهی

سؤالو یا بیشتر باشد تا یک 7/0آلفا باید حداقل برابر با طه بتواند در یک ابزار باقی بماند و بسیاري از محققان نق

در ابزار ضروري سؤالرا براي باقی ماندن یک 8/0یا درصدي امتیازات 70، ثبات 7/0پایایی برابر با . دانندمی

،22[دهدمیبه دست آمده از یک ابزار را نشان نمرات و روشی براي محاسبه ثبات درونی بر اساس ] 37-36

و هنگامی که باشدمیت سؤاالمیانگین همبستگی درونی از نوع مقیاس لیکرت در ابزار اطالعات به کار رود مقیاسی

محاسبه مقدار ضریب آلفا جهت تعیین پایایی ثبات درونی مقدار عددي .]22، 36، 38-40[امري ضروري است

آلفاي کرونباخ برابر با متوسط مقدار ضریب پایایی است که ي ابزار، پس از آنکه به دو هاي ممکن آیتمهااز کل ترکیب

. ]22، 38، 41- 42[آیدمیقسیم شود به دست نیمه تي سنجش پایایی است هاروشیکی از آلفاي کرونباخروش

که فقط به انجام یک بار آزمون نیاز دارد تا برآوردي از درکل ضریب پایایی ]. 22- 23[پایایی آزمون را فراهم کند

ت یک ابزار به سؤاالآلفاي کرونباخ هنگامی مفید است که و جهت باشندغلط امتیاز بندي نشده –صورت صحیح

به کار در مقیاس لیکرت ت سؤاالسنجش ثبات درونی آلفاي مقدار2003در سال ].23، 36، 41، 43[رودمی

قابل را7/0-8/0،خوبرا8/0- 9/0،عالیرا9/0بیش از کمترو ضعیف را5/0-6/0، قابل بحثرا6/0- 7/0، قبول

. ]37، 44-45[عرفی کردندل مغیر قابل قبورا5/0از]16، 42[فرمول تعیین آلفاي کرونباخ به قرار زیر است

واریانس آیتم ي ابزار هاتعداد آیتمKدر این فرمول که از مجموع کل (واریانس کل ابزار یا تست و .]25، 42[باشدمی) به دست آمده هاآیتم

Dow

nloa

ded

from

jour

nal.r

ums.

ac.ir

at 1

1:44

IRD

T o

n S

unda

y A

pril

1st 2

018

Page 5: Validity and Reliability of the Instruments and Types of

1157و همکارانابوالفضل محمدبیگی

1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان

) :Split half reliability(ایی دو نیمه آزمونپای-2در این روش یک آزمون به دو نیمه تقسیم شده و

. شودمیرابطه همبستگی بین دو نیمه آزمون سنجیده براي متغیرهاي دو حالتی که کد این آزمون معمول

ي صحیح هاي غلط و کد یک به پاسخهاصفر به پاسخین روش دو نیمه آزمون در ا. رودمیشود به کار میداده

ت باهم مشابه باشند و از سؤاالباید در محتوي و سختی ت ابزار به دو قسمت تقسیم شده سؤاالآنجا که تعداد

که به کار رودهمبستگیضریب بایست روش میاست شودمیبا استفاده از ضریب اسپیرمن و گاتمن محاسبه

ش فرمی از سنجضریب اسپیرمن براون. ]25، 41، 46[پایایی دو نیمه آزمون است که براي برآورد پایایی کل

همبستگی پیرسون بین دو نیمه . رودمیآزمون به کار کند میاز ابزار یا مقیاس را برآورد ايهآزمون، پایایی نیم

اما ضریب پیشگویی اسپیرمن، پایایی کل آزمون را بر مقدار این ضریب . کندمیي آن برآورد هااساس نیمه

است )X2وX1(ي آزمون هار از ضریب پایایی نیمهبیشتمساوي با دو برابر ضریب نیمه آزمون تقسیم و معموالً

بر مقدار یک به اضافه پایایی نیمه دیگر آزمون خواهد ضریب پایایی اسپرمن براون با فرمول زیر محاسبه .بود.]25[شودمی

ي پایایی دو نیمه آزمون، ضریب هادر بین سنجشترتیب و نحوه قرار تأثیرتحت یایی اسپیرمن شدیداًپا

ت ابزار مورد استفاده در هر یک از دو نیمه سؤاالگرفتن دقیقی، در این روش باید به شکل کامالً. باشدمیزمون آ

ت بین دو سؤاالتصادفی انجام شود و تخصیص تصادفی نیمه آزمون باید تساوي واریانس بین دو فرم را تأمین

. ما همیشه این امر باید توسط محقق چک شودا.نمایدشود و مقدار پایایی از میزیرا هیچگاه این امر تضمین ن

ي بعدي متفاوت خواهد بودگیراندازهي به گیراندازهیک کند که پایایی نیمه میفرض ضریب گاتمن]. 2-1، 47[

یکسان است و به تساوي ) دو نیمه فرم(اول و دوم بهترین .نیمه آزمون نیازي نداردي بین دو هاواریانس

تی را که سؤاالشود که هر نیمه مینیمه هنگامی ایجاد به عبارتی .بیشترین همبستگی درونی دارند، شامل شود

که شود به طوريانی که ابزاري به دو نیمه تقسیم زموابسته به همان گروه تی را که شدیداًسؤاالهر نیمه

و گروه ندارند را هستند و هیچگونه وابستگی بین دکمترین مقدار ممکن شامل شود، ضریب دو نیمه گاتمن

وابسته به ت شدیداًسؤاالکه را خواهد گرفت و زمانییکدیگر از هم جدا شده و در دو گروه متفاوت قرار

بشترین مقدار ممکن را گیرند ضریب دو نیمه گاتمن].1، 16، 41[خواهد گرفت

-Kuder(پایایی کادر ریچاردسن-3 Richardson

reliability coefficient:(این .باشدمیKR21و KR20این روش شامل دو آزمون

باشند می) تسؤاالثبات بین (ي همگنی ها، آزمونهاروشابزار یا سؤالي صحیح به غلط را در هر هاکه نسبت پاسخ

یی که پاسخ هادهند و براي آزمونمیآزمون مد نظر قرار در وباشد مفید استمیل صحیح و غلط آنها به شک

ي غلط و کد یک به هاکه کد صفر به پاسخکه صورتیاز ]. 47- 48[شود به کار رودمیي صحیح داده هاپاسخ

لحاظ ریاضی قابل اثبات است که ضریب پایایی کادر ي آزمون به هاریچاردسن برابر با میانگین ضرایب نیمه

در باشدمیک آزمون ي ممکن یهادست آمده از کل نیمه، برابر با آلفاي KR20مقدار ) دو حالتی(هااینگونه آزمون

Dow

nloa

ded

from

jour

nal.r

ums.

ac.ir

at 1

1:44

IRD

T o

n S

unda

y A

pril

1st 2

018

Page 6: Validity and Reliability of the Instruments and Types of

...گیري آنها درهاي مختلف اندازهروایی و پایایی ابزارها و روش1158

1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان

هنگامی مفید است که KR21اما روش . شودمیکرونباخ از لحاظ سختی با نامهپرسشت سؤاالمطمئن باشیم کل

در این روش آزمون یا ابزار ]. 1، 16، 19، 23[هم برابرندایایی کادر هنگامی مورد پذیرش است که ضریب پ

ي هاباشد اما در آزمون64/0ریچاردسن حداقل برابر با ].18، 45[باالتر باشد80/0استاندارد این مقدار باید از

واریانس کل تست، Var، هاتعداد آیتمnدر این فرمول آیتم مجموع ضرب درصدي از افرادي است که به

هاز کل افرادي است کدر نسبتی ) p(اندپاسخ صحیح داده.]47- 48[باشدمی) q(اندبه آیتم پاسخ غلط داده

سنجش ثبات در پایایی:باز آزمون-پایایی آزمون - الف

ت آزمون درسؤاالدر این روش جهت سنجش پایایی، دو نوبت به یک گروه واحد، تحت شرایط مشابه داده

ایت در نه.شوندمیشود و نمرات حاصل با هم مقایسه میضریب همبستگی بین نمرات حاصل از اجراي دو بار آزمون برآورد شده تا چگونگی شباهت امتیازات مشخص

ترین معمول.رودمیگردد و به عنوان ضریب پایایی به کار روش براي یافتن همبستگی بین نمرات در این روش،

، 41[باشدمیمحاسبه ضریب همبستگی اسپیرمن براون کند که متغیرها یا میفرض بازآزمون -روش آزمون].25

خصوصیات آزمون ،و همچنیني گیراندازهمفاهیم مورد به و ]49[شوندگان در طول دوره تغییر نخواهند کرد

آشنایی آزمون شوندگان با از قبیل معایب آن برخی دلیل مناسب تعیین فاصله زمانی، مشکل در تسؤاالمحتوي

دم عالقه آزمون شوندگان عو براي اجراي دو نوبت آزمون ارزش توسط بسیاري از محققان بیبه اجراي نوبت دوم

محققین سه نوع اثر متفاوت .]41، 49[دانسته شده است

، اثر خستگی(Memory Effect)شامل اثر حافظه (Fatigue Effect) و اثرات ناشی از تغییرات واقعی

(Genuine Change Effect) در مقدار پایایی آزموناثر حافظه که به دلیل . ]23[خواهند بودمؤثربازآزمون ت در آزمون است سبب ایجاد نوعی خطاي سؤاالیادآوري

شده و باعث باال رفتن ) غیر تصادفی(همبستگی گردد که پایایی را میهمبستگی نمرات آزمون و بازآزمون

اثر خستگی نوعی خطاي تصادفی در بازآزمون . بردمیباال خطاي ناشی از . دهدمیر پایایی را کاهش شده و مقدا

گرددمیتغییرات واقعی نیز معموال سبب کاهش پایایی ]23[.

ي هافاصله زمانی بین آزمون و باز آزمون یکی از چالشاصلی در به کار بردن روش آزمون بازآزمون در تعیین

فاصله زمانی مناسب براي انجام دو . استهاپایایی سنجهت متغیرهایی که عامل تحت بررسی را تحت آزمون به ثبا

به عنوان مثال چنانچه .دهد بستگی داردمیقرار تأثیري فشار خون باشد زمان کوتاه گیراندازهمتغیر مورد نظر پدیده هت سنجش نگرش در مورد یک خواهد بود اما ج

اما . روانشناختی به فاصله زمانی طوالنی تري نیاز است، 23، 41، 50[باشدمیچند هفته فاصله زمانی متداول،

دوبینزمانیفاصلهروش،ایندرمهمنکتهبنابراین . ]5نکته مهمی در استفاده از این آزمون است و اعتقاد آزمون

حديتابایدآزموندوبینزمانیفاصلهبر آن است که ازوبیفتداتفاقابزارعباراتفراموشیطرفیازکهباشدندهدرخگیرياندازهموردپدیدهردتغییردیگرطرف

دو هفته تا یک ماه برخی معتقدند که این فاصله را بین.اندپیشنهاد کردهآزمون (ترین آزمون جهت تعیین ثبات قابل قبول

ايخوشهدرونهمبستگیشاخصآزمون) پایایی

Dow

nloa

ded

from

jour

nal.r

ums.

ac.ir

at 1

1:44

IRD

T o

n S

unda

y A

pril

1st 2

018

Page 7: Validity and Reliability of the Instruments and Types of

1159و همکارانابوالفضل محمدبیگی

1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان

(Interclass Correlation Coefficient)اینچنانچه.است. ]51[استمطلوبثباتمیزانباشد 8/0ازباالترشاخص

یکسانو دقیقاً) یکسان(ي موازي هاپایایی فرم-ب(Parallel & strictly parallel forms reliability):

یی براي آزمون آماري تساوي هااین دو مدل، روشیکسان فرض روش دقیقاً. باشندمیهاو واریانسهامیانگین

درست میانگین و واریانس سؤالکند که امتیازات میکند که میکه مدل موازي فرض مشابهی دارند در حالی

آنها واریانس مشابهی دارند اما الزم نیست که میانگین برآورد پایایی در روش موازي . مشابهی داشته باشند

موازي بر باشد و در مدل دقیقاًمیمساوي با آلفاي کرونباخ ت سؤاالتفاضل میانگین اساس آلفاي کرونباخ بوده ولی از

.]25، 52[آیدمیبه دست Equivalent forms(ي متعادلهاپایایی فرم-ج

reliability(:، به دو فرم جداگانه در مورد یک موضوعدر این روش

ت سؤاالشود و هر فرم تعدادي از مییک گروه مشابه داده به عبارتی دو آزمون معادل در . شودمیآزمون را شامل

یک مفهوم یا متغیر به خصوص تهیه شده و در فاصله موردضریب همبستگی .شودمیکوتاهی به یک گروه واحد داده

ي هابین نمرات حاصل از این دو فرم برابر با پایایی فرماین روش به دلیل مشکل در طراحی و . باشدمیمتعادل

همسان و مساوي در مورد سؤالساخت دو فرم یا نمونه دم عالقه آزمون شوندگان براي پر کردن فرم یک مفهوم، ع

آن در تکمیل فرم تأثیردوم و یادگیري ناشی از فرم اول و ].25، 47[کاربرد زیادي ندارددوم Inter rater or(پایایی بین مشاهده کنندگان- د

observer reliability:(

این ضریب ثبات و همبستگی نمرات بین مشاهده مختلف یک موضوع را ارزیابانکنندگان یا داوران یا

که با ضریب شودمیسنجد و ضریب توافق هم نامیده میکه یک ابزار یا و زمانی] 19، 53[شودمیکاپا نشان داده

ت تشریحی، بر روي افراد مشابهی سؤاالبا نامهپرسشتوسط دو یا چند مصاحبه گر یا پرسشگر به کار رود و

رد ابزار دست یابیم به کار بخواهیم به یک توافق کلی در موضریب کاپا بین صفر تا یک متغیر ]. 16، 25، 54[رودمی

شود و بر اساس مقاالت میاست و به صورت درصد بیان 1موجود دسته بندي قدرت ضریب کاپا به قرار جدول

.]24[استین میزان توافق قدرت مقادیر مختلف ضریب کاپا در تعی- 1جدول

یا داورانانگبین مشاهده کننده

قدرت توافقمقدار آماره کاپا

ضعیفکمتر از صفر

کم2/0-0

پایین تر از متوسط4/0-21/0

متوسط41/0- 60/0

خوب80/0-61/0

عالی1-81/0

حداقل مقدار 1بر اساس مقادیر ارائه شده در جدول باشد و مقادیر باالتر می6/0قابل قبول ضریب کاپا بیش از

. باشدمیآل توافق دو داور یا ارزیاب ایدهدر8/0از تواند با یک میهمانطور که بیان شد ضریب پایایی

،آزمون و یا بیش از یک آزمون محاسبه شود و همچنیني مورد استفاده در یک زمان یا هاتواند آزمون یا آزمونمی

. بیش از یک زمان به کار روند

Dow

nloa

ded

from

jour

nal.r

ums.

ac.ir

at 1

1:44

IRD

T o

n S

unda

y A

pril

1st 2

018

Page 8: Validity and Reliability of the Instruments and Types of

...گیري آنها درهاي مختلف اندازهروایی و پایایی ابزارها و روش1160

1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان

ي هادر زمانآزمون انجامرابطه بین تعداد دفعات-2جدول در زمان خاصي یک آزمونهاو تعداد فرممختلف

براي الزمدفعاتاجراي آزمون

جهت مورد نیازهايتعداد سنجهتعیین پایایی

آزموندوآزمونیک

یکبار دو نیمه کردنکادر ریچارسونآلفاي کرونباخ

ي موازيهافرم

----- مونزبازآ-آزموندو بار

بر اساس تعداد دفعات انجام یک آزمون و تعداد در کلي آزمون مورد نیاز براي سنجش پایایی یک ابزار به هافرم

دلیل عملکرد و طبیعت آن و چگونگی استفاده در طرح ي فوق را که در هاتحقیقاتی یا جامعه، باید یکی از روش

رابطه بین تعداد دفعات و تعداد و شکل شماره دو 2جدول دهد، مورد استفاده قرار مییک آزمون را نشان ي هافرم. داد

]2[انواع مختلف سنجش پایایی و ارتباط آنها با یکدیگر-2شکل بر اساس نمودار شماره دو نیز مشخص شده است که پایایی دو جزء متفاوت شامل ثبات و توافق درونی را شامل

د و سنجنمیبازآزمون -شود که ثبات زمانی را با آزمونمیي دو نیمه کردن، هاتوان با یکی از روشمیتوافق درونی را

توافق بین داوران با استفاده از ضریب کاپا و یا آلفاي .کرونباخ تعیین نمود

تعریف روایییی که اعتبار آنها هاي محقق ساخته و سنجههاسنجه

رسیده باشد تأییدي دیگر به هاو زبانهادر فرهنگیی با نسخ هادر سنجه. باشندمیی نیازمند اعتبار سنجتوسط دو فرد متبحرنامهپرسشابتدا التین یا زبان بیگانه،

. شودمیاز زبان اصلی به زبان فارسی ترجمه ) و یا بیشتر()يهامتن(بررسی دو متندر مرحله بعدي طی مقایسه و

از نظر کیفیت با یکدیگر مقایسه میشوند و ترجمه شده در مواردي مشاوره با . گیرندمیر مورد ارزیابی قرا

در گیرد و میو فردي انگلیسی زبان صورت ینمترجمبراي عبارات، ترجمهترین نهایت براي انتخاب مناسب

تا در مورد هي اولیه صورت گرفتهاتلفیق و ترکیب ترجمهبدین طریق یک نسخه فارسی مشترك توافق گردد و

سپس . دوشمیبه یک ترجمه واحد تبدیل نامهپرسشنسخه نهایی ترجمه شده، جهت برگرداندن از زبان فارسی

مترجم یکدر اختیار ) ترجمه معکوس(به زبان اصلی.گیردمیقرار دیگر که متن اولیه انگلیسی را ندیده بود،

هدف از این کار اطمینان بیشتر از صحت ترجمه بهترجمه شدههپس از مقایسه نسخ. استنامهپرسش

و مشاوره با مترجم نامهپرسشبا متن اصلی انگلیسی در بر (، یکسانی مفهومی و فرد انگلیسی زبانمربوطه

و ) نامهپرسشداشتن محتواي مفهومی نسخه اصلی سپس نسخه نهایی . گرددمیکیفیت کلی ترجمه بررسی

معکوس و با نظر نامهپرسشفارسی بر اساس ترجمه نهایی در نهایت جهت . ددگرمیمترجمان و متخصصین تهیه

Dow

nloa

ded

from

jour

nal.r

ums.

ac.ir

at 1

1:44

IRD

T o

n S

unda

y A

pril

1st 2

018

Page 9: Validity and Reliability of the Instruments and Types of

1161و همکارانابوالفضل محمدبیگی

1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان

، روایی )Face Validity(تعیین روایی ابزار، روایی صوري Construct(و روایی سازه ) Content Validity(محتوي

Validity (اده باید بررسی و ابزار یا سنجه مورد استفساخته، پس از ي محقق هانامهپرسشدر . ارزیابی گرددنظر تیم موردنامهپرسشت و تهیه سؤاالتهیه بانک

بدین صورت . گیردمیپژوهش، نیز تعیین روایی صورت ي دیگر و چه در هاي برگردان از زبانهاچه در سنجه

ي محقق ساخته، پس از تهیه نسخه نهایی فارسی هاسنجهشود تا در می، در ابتدا روایی صوري بررسی نامهپرسش

نامهپرسشکل اعتبار نامهپرسشصورت نیاز به تغییر . وش تغییر نشوددستخ

قضاوت عینی در مورد ی صوريیروا: روایی صوريت سؤاالاز نگاه گروه هدف به این ساختار ابزار است و

صورت ظاهري ه آیا ابزار طراحی شده ب:دهد کهمیپاسخ با هدف مطالعه مرتبط است؟ آیا افرادي که قرار است به

افق بندي ابزار موزار پاسخ دهند، با عبارات و جملهاب)گروه هدف(هستند؟ آیا برداشت افراد غیر متخصص

اء و آیا اجزهمان برداشتی است که مورد نظر محقق است؟.]2[باشدمیدهندگانکلیت ابزار قابل پذیرش پاسخ

از دو روش توانمیابزار روایی صوريبراي تعیین در روش کیفی و .نموداستفاده کمی روایی صوريو کیفی

با کمک متخصین امر د تعیین روایی صوري، درآغاز فرآین، از نامهپرسشي مرتبط با زمینه تحقیقاتی و هادر رشته

متخصصین آمار و اپیدمیولوژي و بر حسب موضوع از براي . شودمیمتخصصین روانشناسی یا علوم دیگر استفاده

همبستگی آنها با نمره کل سؤالارزیابی ضریب تمیز هر فارسی به دو نامهپرسشمنظور بدین. شودمیسنجیده

ي هافرد هیأت علمی متبحر در زبان انگلیسی و واژهشود تا نسخه نهایی فارسی را از نظرمیتخصصی داده

ي هااستفاده از واژه(مطلوب بودن عبارات به لحاظ وضوح پرهیز از به (کاربرد زبان مشترك ،)ساده و قابل فهم

ورد بررسی قرار م) ي فنی و تخصصیهاکارگیري واژهتوان تغییراتی را در سنجه مورد میدر صورت لزوم . دهند

استفاده در جهت ساده تر کردن و قابلیت درك بیشتر براي دریافت نظرات گروه هدف، ،همچنین. انجام داد

در دشواري یافتناز آنها جهتايهبا نمونايهمصاحب،هاآیتمتناسب و ارتباط مطلوب ،کلماتودرك عبارات

ي نارسا از عبارات و یا هااحتمال وجود ابهام و برداشتشود و در صورت میانجام وجود نارسایی در معانی کلمات

نظرات آنان به صورت تغییراتی وجود مشکالت بایستی .دواعمال شنامهپرسشدر جزئی

به صورت کمی را با استفاده ازهاسنجهروایی صوري براي بدین منظور . کنندمیي رگیاندازهآیتم تأثیرروش

ی در نظر تقسم5طیف لیکرتی ، سنجهي هاهریک از آیتممهم است ،)5امتیاز (کامالً مهم است : دوشمیگرفته

اندکی ،)3امتیاز (طور متوسطی مهم است ه ب،)4امتیاز (سپس .)1امتیاز(و اصالً مهم نیست )2امتیاز (مهم است

گروه در اختیار وري صجهت تعیین روایی نامهپرسشتوسط هانامهپرسشپس از تکمیل گرفته وقرار هدف

آیتم، روایی تأثیرگروه هدف، با استفاده از فرمول روش .گرددمیصوري محاسبه

آیتم، فراوانی تکرار امتیاز توسط گروه تأثیردر فرمول . دهدمیهدف را نشان روایی محتوي

پاسخ یتسؤاالچنینی محتوي بطور معمول به یارومهم و اصلی جوانبآیا ابزار طراحی شده همه که دهدمی

ي ابزار هاي را در بردارد؟ آیا سازهگیراندازهمفهوم مورد

Dow

nloa

ded

from

jour

nal.r

ums.

ac.ir

at 1

1:44

IRD

T o

n S

unda

y A

pril

1st 2

018

Page 10: Validity and Reliability of the Instruments and Types of

...گیري آنها درهاي مختلف اندازهروایی و پایایی ابزارها و روش1162

1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان

کند؟ آیا اجزاء و کلیت میهمان چیزي را که باید بررسی جهت تعیین باشد؟میابزار قابل پذیرش متخصصان ذیربط

کمی روایی و از دو روش کیفی توان میمحتواي رواییسنجش اعتبار کیفی در روش . ]55[کرداستفاده ا محتوتوان مصاحبه با متخصصین در پیامد مورد می، محتوامشاوره با متخصصین اپیدمیولوژي ،ي و همچنینگیراندازهدر ارزیابی کیفی روایی محتوا رعایت دستور . داشتو آمار

قرارگیري ، هااهمیت آیتماز کلمات مناسب، زبان، استفادهزمان تکمیل ابزار طراحی ها در جاي مناسب خود،آیتم

آوري ارزیابی پس از جمع. مورد توجه قرار میگیردشده مورد تغییرات ، با مشاوره با اعضاي تیم تحقیق،متخصصین

.]55- 56[یردمورد توجه قرار گبایستی میدر ابزار نیازتر مطالعات تنها به ذکر این نکته بسنده گرچه در بیش

شود که روایی محتوي توسط متخصصین و میاما باید توجه ]26، 28، 30- 32[صاحبنظران بررسی شد

داشت که این شیوه از نظر متدولوژي خالی از اشکال اساس نظرات بر روایی محتوي به صورت کمی نیز . نیست

ی محتواینسبت روادو شاخص متخصصین و با محاسبه Content Validity Ratio (CVR) ی محتوایشاخص رواوContent Validity Index (CVI) 60[شودمیمحاسبه-

ترین رین و صحیحمتجهت اطمینان از اینکه مه.]57نسبت انتخاب شده است از شاخص ) ت آیتمضرور(محتوا

ي ابزار به هاکه آیتمبراي اطمینان از اینی محتوا ویروااز اند ي محتوا طراحی شدهگیراندازهن نحو جهت بهتری

جهت تعیین نسبت . گرددمیی محتوا استفاده یشاخص روااز تعدادي از متخصصین و میروایی محتوي به صورت ک

شود تا در مورد هر کدام از میصاحبنظران استفاده به سه طیف آیتم ي ابزار یا سنجه مورد استفاده هاآیتم

مفید اما ضروري نیست و ضرورتی ضروري است، شامل

بهتر آن است که از تعداد ارزیابان . پاسخ دهند،نداردبر اساس CVR. استفاده شود) نفر10باالتر از (بیشتري

:شودمیمحاسبه نظز داوران به قرار ذیل

تعداد ارزیابانی است neدر فرمول نسبت روایی محتوي، Nدانند و میکه گویه مورد نظر را ضروري یا سودمند

نی است که یک گویه را بررسی تعداد کل ارزیابان یا داوراي یک هادر تستCVRحداقل مقادیر . ]57، 59[اندکرده

- 61[آمده است3در جدول Lawsheطرفه مورد نظر 59[.

ي یک طرفه مورد نظر هادر تستCVRحداقل مقادیر - 3جدول Lawsheجهت مناسب بودن روایی محتوي

داد ارزیابانتع حداقل مقدار نسبت روایی محتوي

5 99/06 99/07 99/08 75/09 78/010 62/015 49/020 42/025 37/030 33/035 31/040 29/0

را CVIتوان شاخص می، CVRو محاسبه پس از تعیین براي محاسبه این شاخص، ارزیابان . محاسبه نمود

سه در خصوص ، م ابزار مورد استفادهبایست به هر آیتمیسادگی و روان بودن و ،معیار مربوط یا اختصاصی بودن

قسمتی 4بر اساس طیف لیکرتی ،ا شفاف بودنوضوح ی

Dow

nloa

ded

from

jour

nal.r

ums.

ac.ir

at 1

1:44

IRD

T o

n S

unda

y A

pril

1st 2

018

Page 11: Validity and Reliability of the Instruments and Types of

1163و همکارانابوالفضل محمدبیگی

1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان

بودنمربوطمعیارجهتثالًم. نمایندمیاظهار نظر ، و 2=استمربوطنسبتاً،1=نیستمربوط، يهاگزینهگرفتهکاربه، 4=استمربوطکامالًو 3=استمربوط

شاخص روایی CVIسپس با استفاده از فرمول شود و می].57، 59، 62- 64[گرددمیمحتوا محاسبه

اندداده4و 3نسبت تعداد ارزیابی که به آیتم نمره =Cv1 تعداد کل ارزیابان

مفهوم مرکبی است که مستلزم بررسی : روایی سازهکه شامل روایی چند مرحله است و با روایی ضابطه

همزمان، روایی پیشگویی کننده ، روایی تمایز و روایی .]2[شودمیهمگرایی است سنجیده

Criterion-related(روایی ضابطه Validity( :ايهدرجاز توافق بین یک تست با یک یا تعداد بیشتري تست

که بهتر است دقیق و ایده آل (معتبر دیگر در همان زمینه که معموالً با استفاده از ضریب همبستگی بین است ) باشد

. ]2[شودمیآنها سنجیده هنگامی : )Concurrent Validity(روایی همزمان- الفدر حال حاضر وجود ) استاندارد(شود که معیار میبرآورد

توان در یک بررسی از کارمندان میبه عنوان مثال . داردان یک ضابطه از میزان حقوق دریافتی را پرسید و به عنو

مدارك حسابداري به عنوان ضابطه استفاده نمود و همبستگی مقدار حقوق گزارش شده با مقدار واقعی آن بر

. اساس مدارك موجود را محاسبه کرد: )Predictive Validity(روایی پیشگویی کننده-ب

هنگامی کاربرد دارد که معیار در حال حاضر وجود ندارد و هدف آن است تا بدانیم یک . افتدمیاتفاق در زمان آینده

تواند پیامدي را در آینده میمقیاس یا ابزار تا چه اندازه به عنوان مثال بر اساس نمره میان ترم ،بینی کندپیش

رد شدن آنها را در پایان ترم دانشجویان قبولی و یا .]2[بینی کنیمپیشConvergent(روایی همگرایی-ج Validity( که

مربوط به سؤالقوي میان عبارتست از همبستگی نسبتاًبنابر توصیه سازمان اروپایی که یک حیطه با همان حیطه

تحقیقات و درمان سرطان ضریب همبستگی پیرسون باید بندي اصل در جهت گروه. ]2، 63[باشد4/0بزرگتر از

متغیرها نیز در یک حیطه خاص بر این منوال است که مبستگی جدول ماتریس همبستگی کمتر چنانچه ضریب ه

بیانگر مهم بودن متغیر ±4/0باشد حداقل بوده، ±3/0از حیطه مورد نظر بیانگر اهمیت اساسی متغیر در±5/0و

محاسبه ±3/0ضریب همبستگی کمتر از اما چنانچه . استشود محقق باید بررسی کند که آیا کاربرد تحلیل عاملی

براي ابزار مناسب ) شودمیداخته در ادامه مقاله به آن پر(.]58[بوده یا خیر؟

بر که Discriminant Validity)(روایی تمایز- دت مربوط به یک حیطه با سؤاالهمبستگی ضعیف بین

به عبارت دیگر ضریب . داللت داردهادیگر حیطهي دیگر باید کمتر از هابا حیطهسؤالهمبستگی یک

ي مربوط به خودش هاهبا حیطسؤالضریب همبستگی آن عالوه بر آنکه باید با ابزارهاي دیگر که موفقابزاریک. باشد

بابایدکند همگرا باشد میي گیراندازهسازه مشابه را بارانظریهیککهدیگريمفاهیميهاابزارهاي یا مقیاس

داشتهباالییهمبستگینیززندمیپیوندکانونیمفهومکافیامااستالزمهمگرااعتبارندهرچآنبرعالوه.باشد

زیرااستالزمهمگرااعتبارحددرتفکیکیاعتبارونیستغیرايپدیدهسنجشدرهاابزارحساسیتبررسیبه

رامفهومبودنگستردهیاابهاممیزانوپردازدمیمربوط

Dow

nloa

ded

from

jour

nal.r

ums.

ac.ir

at 1

1:44

IRD

T o

n S

unda

y A

pril

1st 2

018

Page 12: Validity and Reliability of the Instruments and Types of

...گیري آنها درهاي مختلف اندازهروایی و پایایی ابزارها و روش1164

1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان

نشان دهنده انواع 3شکل . ]2، 58، 63[دهندمینشان.تي روایی اسهازیرشاخه

ي مختلف سنجش روایی سازه و ابعاد مختلف هاروش- 3شکل روایی ضابطه و ترجمه

و روایی روایی سازه منتج از روایی ترجمه بنابراین باشد که روایی ترجمه با تعیین روایی صوري و میضابطه

آید و روایی ضابطه شامل چهار میروایی محتوي به دست یی، روایی تمایز و روایی بعد روایی همزمان، روایی همگرا

.]2[باشدمیپیشگویی ابزار یک ي هاآیتم) Construct Validity(ساختار روایی

تحلیل عاملی . شودتعیینتواند بر اساس تحلیل عاملی میگیرد که شامل تحلیل عاملی میبه دو شکل کلی انجام

تحلیل عاملی اکتشافی در بیشتر. یدي استأیاکتشافی و تقابل اجرا SPSSرهاي آماري در دسترس از جمله افزانرم

قابل SPSSیدي با أیکه تحلیل عاملی تاست حال اینافزارها براي اجراي آن انجام نبوده و باید از سایر نرم

یدي هنگامی کاربرد دارد أیتحلیل عاملی ت. استفاده نمودمورد استفاده از روایی سازه مناسب نامهپرسشکه ابزار یا

کارهاي قبلی به کار تأییدار باشد و به منظور برخوردرود بنابراین امکان استخراج فاکتورهاي جدید در این می

عاملی اکتشافی تحلیل . نوع تحلیل عاملی وجود نداردPrinciple Component(اصلیيهالفهؤممعموال با روش

Analysis (PCA) ( میاندرونیارتباطگیرد و میانجاممتغیرهاازطبقاتیتا دهدمیقراربررسیوردمرامتغیرها

هستند را کشف نمایدیکدیگرباارتباطبیشتریندارايکههایی از ابزار که در هر به این صورت آیتم. ]11، 58، 65[

دهند میفاکتور بیشترین همبستگی را با یکدیگر نشان ي مورد استفاده در تبین هر فاکتور یا هاتوانند آیتممی

تطابق و میزانبررسیجهت. ه ابزار قرار گیرندلفؤماز چرخش واریماکس و یا امل استخراج شدهوعنامگذاري

. ]58- 59، 66-68[گرددمیپروماکس استفاده نمونهنکته مورد توجه در تحلیل عاملی پرداختن به

بارتلتکرویتآزمونو (KMO)الکینمایرکیسرگیري)BT (یا ارزش ویژه عطفطهنقو همچنین مقدار عددي

Egenvalueًدر نظر گرفته 1برابر بااست که معموالحفظبراينیازموردعاملیبارحداقلعنوانبهشود و مینظردرعاملیتحلیلازشدهاستخراجعواملدرعبارتهر

قابل ذکر است که در تحلیل عاملی، مقدار . شودمیگرفتهDeterminantر و مقدار کاي اسکوئبایست مخالف صفرمی

دار از نظر آماري باشد و آزمون بارتلت عددي بزرگ و معنیبه عدد یک نزدیک باشد تا KMOهمچنین معیار

گیري و حجم نمونه کافی براي دهنده کفایت نمونهنشاندر خصوص . اجراي تحلیل عاملی مدنظر قرار گرفته شود

ت حجم نمونه الزم جهت انجام تحلیل عاملی تناقضانمونه را 300حداقل Tabachnick. متفاوتی وجود دارد

و Hairداند اما میبراي انجام تحلیل عاملی ضروري کنند که حجم نمونه باید بیش از میبیان ]69[همکاران

Dow

nloa

ded

from

jour

nal.r

ums.

ac.ir

at 1

1:44

IRD

T o

n S

unda

y A

pril

1st 2

018

Page 13: Validity and Reliability of the Instruments and Types of

1165و همکارانابوالفضل محمدبیگی

1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان

LeeوComreyباشد اما برخی منابع دیگر از جمله 100

را 200را ضعیف، 100اند که بندي انجام دادهطبقه]70[و 1000را خیلی خوب و 500را خوب، 300خوب، تاًنسب

.]58، 66- 68، 70[اند بیشتر را عالی معرفی کردهدر آخر ذکر این نکته ضروري است که روایی و پایایی از

ي و دستیابی به مقادیر گیراندازهي الزم جهت هاشاخصآگاهی و فهم کافی از آنها یکی از . باشدمیواقعی پیامدها

ي هاولوژي در طراحی مطالعات و سنجشاصول متدمختلف است که متاسفانه در بسیاري موارد نادیده گرفته

توان میبر اساس موارد ذکر شده در تعیین پایایی . شودمیت قبلی سؤاالت مشابه با سؤاالافزایش تعداد بیان کرد که متجانس و همگون کردن ، تر کردن آزمونبراي طوالنی

افزودن ، با ضریب دشواري متوسطتاالسؤافزودن ، تسؤاالگیري آزمون بر روي به کار، با ضریب تمیز باالتسؤاال

گروهی از افراد که از نظر توانایی پاسخگویی به آزمون گیري آزمون سرعت، به کار،و همچنیندارندمیتجانس ک

در مؤثرعوامل از یعنی اجراي آزمون در یک زمان محدود، 23، 47-48[باشندمیهاا یا سنجهابزارهافزایش پایایی

سنجش روایی نیز نیازمند آگاهی از علم آمار و ].1یابی به مقدار واقعی ي آماري است تا در دستهاروش

ریزي در جهت بنابراین برنامه. مفید واقع شودپیامدهاي گیراندازهطراحی و کاهش خطاهاي غیر تصادفی در

ار اضافه کرده و قدرت نتایج تواند به پایایی و روایی ابزمی

کم گزارش دهی و عدم گزارش . مطالعه را افزایش دهدروایی ممکن است به دالیلی از جمله کم بودن حجم

. ]5[نمونه، طراحی ضعیف مطالعه و یا کاهش منابع باشدین قاز آنجا که هدف نوشتار حاضر آشنایی محق،همچنین

ي مختلف هاو شیوهو دانشگاهیان با مفاهیم روایی و پایاییترین وجه ممکن ي آن است سعی شد تا به سادهگیراندازه

. مطالب مورد نیاز با یک روال منظم و منطقی بیان گرددي پیچیده واریانس ضرایب پایایی و یا هالذا از ذکر فرمول

. مفاهیم آماري مربوط به تحلیل عاملی صرف نظر شد

گیرينتیجهتایج طی زمان و قابلیت تکرار از ثبات نايهپایایی درج

باشد که سنجش پایایی عالوه بر روش معمول میآنها . ي استگیراندازهي دیگر نیز قابل هاآلفاي کرونباخ با روش

باشد و ابعاد میاز صحت نتایج ايهکه روایی درجدر حالیا توجه محققین و پژوهشگران و لذ. گوناگونی دارد

ه ارائه نتایج و آمار دقیق و اندرکاران نظام سالمت بدستي پایا و هاتواند در نتیجه استفاده از سنجشمیصحیح

یی که عالوه بر کم هاسنجش. قابل اعتماد به دست آیدخطاي منظم نیز بتواند دوري کردن خطاهاي تصادفی از

.کندتشکر و قدردانی

بدینوسیله از همکار محترم جناب آقاي دکتر شهرام ارسنگ .یمینمامیدس محسن مختاري تشکر و قدردانی جنگ و مهن

References

[1] Cook DA, Beckman TJ. Current concepts in validity

and reliability for psychometric instruments: theory

and application. The American j of Med 2006; 119(2):

166, 7-16.

Dow

nloa

ded

from

jour

nal.r

ums.

ac.ir

at 1

1:44

IRD

T o

n S

unda

y A

pril

1st 2

018

Page 14: Validity and Reliability of the Instruments and Types of

...گیري آنها درهاي مختلف اندازهروایی و پایایی ابزارها و روش1166

1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان

[2] Drost EA. Validity and Reliability in Social Science

Research. Education Research & Perspectives 2011;

38(1):105-123

[3] Golafshani N. Understanding reliability and validity

in qualitative research. The qualitative report 2003;

8(4): 597-607.

[4] Streiner DL, Norman GR, Cairney J. Health

measurement scales: a practical guide to their

development and use: Oxford university press; 2014;

[5] DeVon HA, Block ME, Moyle Wright P, Ernst DM,

Hayden SJ, Lazzara DJ, et al. A psychometric

toolbox for testing validity and reliability. J Nursing

Scholarship 2007; 39(2): 155-64.

[6] Amiri P, Ardekani EM, Jalali-Farahani S,

Hosseinpanah F, Varni JW, Ghofranipour F, et al.

Reliability and validity of the Iranian version of the

Pediatric Quality of Life Inventory™ 4.0 Generic

Core Scales in adolescents. Quality of Life Research

2010; 19(10): 1501-8.

[7] Cuthbert SC, Goodheart GJ. On the reliability and

validity of manual muscle testing: a literature review.

Chiropractic & Manual Therapies 2007; 15(1): 4

doi:10.1186/1746-1340-15-4.

[8] Healy M, Perry C. Comprehensive criteria to judge

validity and reliability of qualitative research within

the realism paradigm. Qualit Mark Res: An int J

2000; 3(3): 118-26.

[9] Litwin MS. How to measure survey reliability and

validity. Sage; 1995;

[10] Pearson Executive Office . PCAT Reliability and

Validity 2015-2016 . San Antonio, Product Number

65685PCAT: 2012.

[11] Pintrich PR, Smith DA, García T, McKeachie WJ.

Reliability and predictive validity of the Motivated

Strategies for Learning Questionnaire (MSLQ).

Educational and psychological measurement 1993;

53(3): 801-13.

[12] Quinn TJ. Validity and Reliability of the Outdoor

Education Practicum Questionnaire [microform] /

Thomas James Quinn. [Washington, D.C.]:

Distributed by ERIC Clearinghouse; 1998.

[13] Holbert RL, Lee J, Esralew S, Walther WO,

Hmielowski JD, Landreville KD. Affinity for

political humor: An assessment of internal factor

structure, reliability, and validity. Humor.

2013;26(4):551-72

[14] Lang W, Wilkerson J. Accuracy vs. Validity,

Consistency vs. Reliability, and Fairness vs. Absence

of Bias: A Call for Quality. Annual Meeting of the

American Association of Colleges of Teacher

Education (AACTE); New Orleans, LA.2008.

[15] Mohammadbeigi A, Tabatabaee S,

Mohammadsalehi N, editors. Measurment of Tests's

Reliability 8th National Conference of Medical

Education, 2006; Kerman.

[16] . Wells CS, Wollack JA. An instructor’s guide to

understanding test reliability. Testing &

Evaluation Services publication, University of

Wisconsin Retrieved January. 2003;4:2006.

[17] Carmines EG, Zeller RA. Reliability and validity

assessment. Sage 1979.

[18] Seif AA. Evaluation and assessment of educational

progeression. Agah Publication, Tehran, 1992

Dow

nloa

ded

from

jour

nal.r

ums.

ac.ir

at 1

1:44

IRD

T o

n S

unda

y A

pril

1st 2

018

Page 15: Validity and Reliability of the Instruments and Types of

1167و همکارانابوالفضل محمدبیگی

1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان

[19] Downing SM. Reliability: on the reproducibility of

assessment data. Medical Education 2004; 38(9):

1006-12.

[20] Lafaille R, Wildeboer H. Validity and Reliability of

Observation and Data Collection in Biographical

Research: International Institute for Advanced Health

Studies v.z.w. Antwerp 1995.

[21] Cuttance P, Ecob R. Structural modeling by

example: Applications in educational, sociological,

and behavioral research: Cambridge University Press,

New york. 2009

[22] Gliem JA, Gliem RR, editors. Calculating,

interpreting, and reporting Cronbach’s alpha

reliability coefficient for Likert-type scales2003:

Midwest Research-to-Practice Conference in Adult,

Continuing, and Community Education.2005..

[23] Sechrest L. Reliability and validity Research

Methods in Clinical Psychology 1984: 24-54.

[24] Gwet KL. Handbook of inter-rater reliability: The

definitive guide to measuring the extent of agreement

among raters. Advanced Analytics LLC 2014

[25] Webb NM, Shavelson RJ, Haertel EH. Reliability

coefficients and generalizability theory. Handbook of

Statistics 2006; 26: 81-124.

[26] Ghamari F, Mohammadbeigi A, Mohammadsalehi

N, Hashiani A. Internet addiction and modeling its

risk factors in medical students, Iran. Indian J

Psychol Med 2011 ;33:1562-68..

[27] Mohammadbeigi A, Mohammadsalehi N.

Prevalence of Internet Addiction and Related Risk

Factors in Students. J Guilan Univ Med Sci 2011;

20(78): 41-8.

[28] Abolfazl M, Hamidreza TS, Narges M, Maryam Y.

Gestational diabetes and its association with

unpleasant outcomes of pregnancy. Pak J Med Sci

2008; 24: 566-70.

[29] Ahmadi A, Ershad M, Givzadeh H, Mohammad-

Beigi A. General physicians' knowledge about

nutrition in Shiraz, Iran. Pakistan J of Biol Sci 2009;

12(13): 981-5.

[30] Bayati A, Beigi M, Salehi M. Depression prevalence

and related factors in Iranian students. Pak J Biol Sci

2009; 12(20): 1371-5.

[31] Beigi A. Musculoskeletal symptoms among workers

of metal structure manufacturing industry in Shiraz,

2005. Iran J Epidemio 2009; 5(3): 12-7.

[32] Beygi A, Salehi N, Bayati A. Prevalence of

unintended pregnancy and its related factors in Arak

2007. Koomesh 2009; 10(3): 201-6.

[33] Hassanzadeh J, Mohammadbeigi A, Eshrati B,

Rezaianzadeh A, Rajaeefard A. Determinants of

Inequity in Health Care Services Utilization in

Markazi Province of Iran. Iran Red Crescent Med J

2013; 15(5): 363.

[34] Mohammad BA, Tabatabaei S, Mohammad SN,

Yazdani M. Factors influencing cesarean delivery

method in Shiraz hospitals. Iran J Nursing (IJN)

2009; 21(56): 37-45.

[35] Tabatabaee HR, Mohammad-Beigi A, Yazdani M,

Zeighami B, Mohammad-Salehi N. Gestational

diabetes risk factors modeling in pregnant women. Int

J of Diab Develop Coun 2007; 27(1): 11-3.

[36] Helms JE, Henze KT, Sass TL, Mifsud VA. Treating

Cronbach’s alpha reliability coefficients as data in

Dow

nloa

ded

from

jour

nal.r

ums.

ac.ir

at 1

1:44

IRD

T o

n S

unda

y A

pril

1st 2

018

Page 16: Validity and Reliability of the Instruments and Types of

...گیري آنها درهاي مختلف اندازهروایی و پایایی ابزارها و روش1168

1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان

counseling research. The Counseling Psychologist

2006; 34(5): 630-60.

[37] DeVellis RF. Scale development: Theory and

applications. Sage Publications 2011;

[38] Cronbach L, Meehl P. Construct validity in

psychological tests'. Personality: Critical Concepts

1998; 52: 135.

[39] Cronbach LJ, Meehl PE. Construct validity in

psychological tests. Psychological bulletin 1955;

52(4): 281.

[40] Ghasemi V. Cronbach Coefficient Alpha and some

of Its Specialties With Em phasis on Applications in

Social Research. Humanities 2005; 19(2): 155-74.

[41] Guttman L. A basis for analyzing test-retest

reliability. Psychometrika 1945; 10(4): 255-82.

[42] Cronbach LJ, Shavelson RJ. My current thoughts on

coefficient alpha and successor procedures.

Educational and Psychological Measurement 2004;

64(3): 391-418.

[43] Tavakol M, Dennick R. Making sense of Cronbach's

alpha. Int J Med Edu 2011; 2: 53.

[44] Sijtsma, K., On the use, the misuse, and the very

limited usefulness of Cronbach’s alpha.

Psychometrika 2009; 74(1): 107-20.

[45] George D, Mallery M .Using SPSS for Windows

step by step: a simple guide and reference. Boston,

MA: Allyn & Bacon 2003;

[46] North Carolina State University. Introduction to

Reliability. 2012. Available at http://www-

4.ncsu.edu/~jlnietfe/

EDP560_Notes_files/Reliabilty.pdf. Access date;

04/04/2014.

[47] Introduction to Reliability. http://www4.ncsu.-

edu/~jlnietfe/EDP560_Notes_files/Reliabilty.pdf.

Access date; 2014.04.04.

[48] Miller IW, Epstein NB, Bishop DS, Keitner GI. The

McMaster Family Assessment Device: Reliability

and Validity. J Marital and Family Therapy 1985;

11(4): 345-56.

[49] Trochim WM. An introduction to concept mapping

for planning and evaluation. Evaluation and Program

Planning 1989; 12(1): 1-16.

[50] Knapp TR, Brown JK. Ten measurement

commandments that often should be broken.

Research in Nursing & Health. 1995; 18(5): 465-9.

[51] Najafi F, Kheyri B. Investigating the Impact of

Country of Origin on Customer Behavior:

Investigation of the Moderating Roles of Product

Involvement and Product Familiarity on Product

Evaluation and Customer Behavioral Intentions. J

Marketing Manangment 2013; 17: 37-60.

[52] Kristof W. The statistical theory of stepped-up

reliability coefficients when a test has been divided

into several equivalent parts. Psychometrika 1963;

28(3):221 -38.

[53] Fleiss JL, Levin B, Paik MC. The measurement of

interrater agreement. Statistical methods for rates and

proportions. 1981; 2: 212-36.

[54] Kundel H, Polansky M. Measurement of observer

agreement. Radiology 2003; 228: 303-8.

[55] Polit DF, Beck CT. The content validity index: are

you sure you know what's being reported? Critique

and recommendations. Research in Nursing & Health

2006; 29(5): 489-97.

Dow

nloa

ded

from

jour

nal.r

ums.

ac.ir

at 1

1:44

IRD

T o

n S

unda

y A

pril

1st 2

018

Page 17: Validity and Reliability of the Instruments and Types of

1169و همکارانابوالفضل محمدبیگی

1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان

[56] Yaghmale F. Content validity and its estimation. J

Med Edu 2009; 3(1): 25-7.

[57] Heravi-Karimooi M, Anoosheh M, Foroughan M,

Sheykhi MT, Hajizadeh E. Designing and

determining psychometric properties of the Domestic

Elder Abuse Questionnaire. Iran J Ageing 2010;

5(15): 7-21.

[58] Williams B, Brown T, Onsman A. Exploratory

factor analysis: A five-step guide for novices. J

Emergency Primary Health Care 2012; 8(3): 1.

[59] Lawshe CH. A Qualitative Approach to Content

Validity. Personnel Psychology 1975; 28(4): 563-75.

[60] Newman I, Lim J, Pineda F. Content Validity Using

a Mixed Methods Approach: Its Application and

Development Through the Use of a Table of

Specifications Methodology. J Mixed Methods

Research 2013.

[61] Hassanzadeh Rangi N, Allahyari T, Khosravi Y,

Zaeri F, Saremi M. Development of an Occupational

Cognitive Failure Questionnaire (OCFQ): Evaluation

validity and reliability. Iran Occupational Health

2012; 9(1): 29-40.

[62] Polit DF, Beck CT, Owen SV. Is the CVI an

acceptable indicator of content validity? Appraisal

and recommendations. Research in Nursing & Health

2007; 30(4): 459-67.

[63] Rubio DM, Berg-Weger M, Tebb SS, Lee ES, Rauch

S. Objectifying content validity: Conducting a

content validity study in social work research. Social

Work Research 2003; 27(2): 94-104.

[64] Wynd CA, Schmidt B, Schaefer MA. Two

quantitative approaches for estimating content

validity. West J Nurs Res 2003; 25(5): 508-18.

[65] Hayton JC, Allen DG, Scarpello V. Factor retention

decisions in exploratory factor analysis: A tutorial on

parallel analysis. Organizational Research Methods

2004; 7(2): 191-205.

[66] Tabachnick BG, Fidell L. Using Multivariate

Statistics: New York: Harper & Row.; 2012.

[67] Tabachnick BG, Fidell LS, Osterlind SJ. Using

multivariate statistics New York: Harper & Row

2001.

[68] Zare-Chahoki M. Multivariate Analysis Method In

SPSS Software 2010. Tehran: Tehran University;

Available at URL: http://utcan.ut.ac.ir/-

member/syllabus/ mazare/multivariate.pdf

[69] Hair JF. Multivariate data analysis. Upper Saddle

River, NJ Pearson Prentice Hall, New York; 2006.

[70] Comrey, Andrew L., and Howard B. Lee. A first

course in factor analysis. Academic Press, New York,

2013.

Dow

nloa

ded

from

jour

nal.r

ums.

ac.ir

at 1

1:44

IRD

T o

n S

unda

y A

pril

1st 2

018

Page 18: Validity and Reliability of the Instruments and Types of

...گیري آنها درهاي مختلف اندازها و روشروایی و پایایی ابزاره1170

1393، سال 12، شماره 13دوره مجله دانشگاه علوم پزشکی رفسنجان

Validity and Reliability of the Instruments and Types of MeasurmentS in

Health Applied Researches

A. Mohammadbeigi1 , N. Mohammadsalehi2, M. Aligol3

Received: 28/08/2014 Sent for Revision: 26/01/2015 Received Revised Manuscript: 01/02/2015 Accepted: 25/02/2015

Background and Objective: Nowadays, by extension of research in medical and social sciences, education and

managing most of outcomes measurers by cheklists,questionnaires, scales and educational tests or raters

evaluations to quantify the human behaviors. Reliability and validity are the most important indexes in

measurement to obtain true values. Enough knowledge and understanding the reliability and validity are

important principle of methodology in study designing. Unfortunately, psychometric aspects of measures have

not been applied in some situations and studies. The objective of current document is to show the concepts of

reliability, validity, psychometric aspects and their types of measurements for researchers .

Key words: Validity, Reliability, Psychometric , Cranach's Alpha, Kappa Coefficient, Factor Analysis

Funding: This study was funded by Qom University of Medical Sciences.

Ethical approval:The Ethics Committee of Qom University of Medical Sciences approved the study.

Conflict of interest: none declared.

How to cite this article. Mohammadbeigi A, Mohammadsalehi N, Aligol M. Validity and Reliability of the Instruments

and Types of Measurment in Health Applied Researches. J RafsanjanUniv Med Sci 2015; 13(10): 1153-70. [Farsi]

1- Assistant Prof., Dept. of Epidemiology and Biostatistics, Health Policy and Promotion Research Center, Qom University of MedicalSciences, Qom, Iran(Corresponding Author), Tel: (025)37842228, Fax: (025) 37842228, E-mail: [email protected]

2- MSC of Epidemiology, Health Policy and Promotion Research Center, Qom University of Medical Sciences, Qom, Iran3- PhD Student of Health Education and Promotion, Shahid Beheshti University of Medical Sciences, Tehran, Iran

Dow

nloa

ded

from

jour

nal.r

ums.

ac.ir

at 1

1:44

IRD

T o

n S

unda

y A

pril

1st 2

018