18
ه رف مع ل ا اعدة راء ق ق ت س ط وا ش لن م ا عل ت ل ا ي م ي ت ر ل م ا س ا ق ل وا+ ب مد ا ح م د. اس+ بس+ ب م ل سا دي+ د. وج+ وب س حا ل ا دسه ب ه م س ق+ وب س حا ل وم ا ل ع م س ق ل ير+ ب اJ ن م ع+ ب سا ل ا عه ام+ ج ل ير+ ب اJ ن م ع+ ب سا ل ا عه ام+ ج ي ن رو كت ل د ا ري+ ب[email protected] ي ن رو كت ل د ا ري+ ب[email protected] ص ل ح ت س م ر ب] واعد الأ ق مُ عل ت ل:] ي سا م+ ب م ت ه ت ، و ي] نرا ق ت س م الأ عل ت ل ا مهk ظ ن ا ه دف ر ب ر ع ت ل ا رق ط ه ورف ل ة ا هد رض ع تproduction rules ه] ئ ف ل ا دة عد ت م ف ت صن ن هام م ي فmulti-class classification tasks ي ف ف ت صن ن ي، و ل و] م الأ عل ت ل ا له رج م هاء ت~ ت ا+ ب ف ع د دي+ ع ج ض و ه صادف م د ب ع ر م ي س م م عل ت ي عل اء ق+ ت ه ، والأ سّ و ش م الأب+ ح م ماJ ن] ئ كاobject .J ن] ئلكا ا لك ي د عل ق+ ب ط ن تJ ون ب ا د ق+ وج ب دما لأ ب ع رض ع ت ه. و ئ ع ق وا اب اي ب ت اب] ب ف ل ه ق ت ق د اب ق ت صن ن م ي د ق ت ي عل ل م ع ت م عل ت ل داء وا] م الأ ت ي ق ت ق ش بJ ج م دJ ان ا ن ح ض د او ق ل س ب ر] م ا اk ظ ن ل ه ا ورف ل اARIS J ن م دق] ا ا+ ب ل ا ع ي ه ه+ ج ت ا ب ل ا اب ق ت صن ن ل اJ انJ ن' ي+ ب ت د ، وق+ وب ل س ا الأ هد ق ق ح ت ي الد جه. ق ت م ل ر ا ت غ ه رف مع ل واعد ا ق ق ب ر طJ ن ع رب ف و ب ي لت ا لك يJ ن ي ي وا ق ل ا+ ب ي ت ر ب ي عل س ب ار امk ظ ن ي ف ي س ن] ي ر ل م ا ت م ص ن لار ا ر ف مد ي ع تRules J ن م ور عل ت م ت ت ها، و ت ا ور] ا لأ ق+ ت ط اعدة ل ق ب حل ت ي علJ ج ود م ي ل ا ا هد ر كر ب ها، و+ ج م ودJ ون ب ا ق ل روط ا شJ ان اور+ ساب ح ل ر ي' ت ا+ ي ه ريk ظ ن دام ح ت س ا+ يJ ون ب ا ق ل ا. اءة ق ك+ ي ج ي ف ˆت لن ا ه ئ مل ع د ساي ب ه و رف مع ل ا س ب ار ي] ا( امk ظ ن ل ا ا هدJ انARIS اب ق س ي كا عل مد ي ع ت ا، و ب عل ا ق ت س لن) heuristics ج ي ف ˆت لن ا ه ئ مل ع ر كت ر لت امk ظ ن ل ي م ي م ص ن لر الأطا اJ ون ك ب ت ج. و ي ف ˆت لن ا اب اي ب تˆ ة¸ ئ ق ع م ما ع ا بˆ ت ر كت دو ا+ ب ت ي لت ا+ ارب+ ˆح ت ل ا لك ي ي علARIS J ن م

Active learning arabic

  • Upload
    arteimi

  • View
    442

  • Download
    4

Embed Size (px)

DESCRIPTION

 

Citation preview

Page 1: Active learning arabic

المعرفه قاعدة واستقراء النشط التعلم

. الرتيمي ابوالقاسم محمد . د سالم وجدي دبسباس

الحاسوب هندسة علوم قسم قسمالحاسوب

ابريل من السابع السابع جامعة جامعةابريل من

الكتروني الكتروني [email protected]بريد بريد[email protected]

مستخلص

: تعُل�م بمسائل وتهتم االستقرائي، التعُلم انظمة دقة لتعزيز طرقا الورقه هذه تعرضاألثر الفئه production rules قواعد متعددة تصنيف مهام multi-class classification في

tasks عقب جديد وضع مصادفة عند مستمر تعُلم عُلى واإلبقاء ، مشو>شه مجاالت فيما كائن وتصنيف األولى، التعُلم مرحُلة عُلى object انتهاء ينطبق قانون يوجد ال عندما

. الكائن ذلكلفئات دقيقه تصنيفات تقديم عُلى يعمل والتعُلم األداء تقييم نسق دمج ان اوضحنا لقد

. أريس النظام الورقه وتعرض واقعيه تبين ARIS بيانات وقد االسُلوب، هذا يحقق الذيغير المعرفه قواعد طريق عن توفرت التي تُلك من أدق غالبا هي الناتجه التصنيفات ان

المنقحه.القوانين ترتيب عُلى اريس نظام في الرئيسي التصميم قرار ألوزانها، Rulesيعتمد طبقا

ودمجها، القانون شروط اوزان لحساب باييز نظرية باستخدام القانون وزن تعُلم ويتم. بكفاءة التنقيح عمُلية ويساند المعرفه قاعدة تحُليل عُلى النموذج هذا ويركز

اريس ) أي النظام هذا كاشفات( ARISان عُلى ويعتمد تفاعُليا، لتركيز heuristics ليس . ويتكون التنقيح بيانات فئة مع تناغما اكثر تبدو التي التجارب تُلك عُلى التنقيح عمُلية

لنظام التصميمي بين ARISاالطار والعالقه القانون اوزان لتمثيل جدولي نموذج من ) وقد ) التنقيح، عمُلية لتركيز حاله كل عُلى تنطبق او تفي التي والقوانين التنقيح حاالت

صنعها معرفه قواعد لتنقيح النظام معرفه ARISاستخدم قواعد تنقيح وكذلك بنفسه،نظام .C4.5 ونظام RIPPERاختُلقها اختياها تم ميادين عشرة في

: المعرفه، قاعدة تنقيح اآلله، تعلم االصطناعي، الذكاء المفتاحيه الكلماتالنشط التعلم

مقدمه:.1مستودعات انتاج الى الحاسوب واتصاالت البيانات قواعد تقنية في التطور ادى لقد

و الطبيه والصور االعتماد، بطاقة معامالت مثل المجاالت، كل في وكفؤه ضخمه بيانات. باستمرار تتزايد ضخمه بيانات قواعد في تخزن كُلها الجوي الفضاء مسح عمُليات

تكون ان ويمكن عال مستوى ذات معُلومات واشتقاق لُلتحُليل البيانات هذه وتحتاج . النوع هذا من وألنظمة لُلبيانات المنتجه العمُلية فهم وفي القرارات اتخاذ في مجديه

. القرارات لصنع معرفه اكتساب من تمكنها مؤتمته اساليب الى نحتاج .) هذا ) ويمثل نموذج يدعى الطبيعه لهذه تبسيط ايجاد بواسطة الطبيعه فهم الناس يحاول

في . المتشابهة الكائنات تجمع الكائنات بين والتشابهات البيئه في احداث النموذجقوانين classesاصناف تبنى كائنات rulesثم بسُلوك .objectsلُلتنبؤ الصنف لذلك جديده

اوصاف او توصيفات وبناء العمُليه هذه ميكنة اآلله تعُلم مجال في descriptions نحاول . ) ويسمى ) األمثُله من مكتبه عُلى تكراريه بحث استراتيجية باستخدام النموذج لُلصنف

Page 2: Active learning arabic

استقرائي تعُلم النوع ان . inductive learning هذا هي االستقرائي االستنتاج في المشكُله ) غير ) هي اآلالت او البشر بواسطة مختُلقه كانت سواء استقرائيا المنتجه المعرفة

. uncertainمؤكده الممكنه الحاالت كل من فقط عينه عُلى بناء تأسيسها تم حيث . الموجه التعُلم في االستخدام شائعا اسُلوبان االصناف supervised learning هناك تحدد

classes . غيرالموجه التعُلم في اما صنف كل من امثُله بصحبة unsupervised لُلنظامlearning ) من ) االصناف اكتشاف النظام عُلى فيجب واالكتشاف المالحظه من التعُلم او

. االسُلوب عُلى الورقه هذه وتقتصر لُلكائنات عامه خصائص عُلى معتمدا نفسه تُلقاءاألول.

) / مهما ) مفهوما الصحيحه غير الناقصه التامه غير المعرفه قاعدة تنقيح مسألة وتعد . ظهرت وقد مسبقا رؤيتها يتم لم حاالت عُلى التعُلم لنظام التنبؤيه القدره لتحسين

االساليب ) من 1العديد 2 3 4، ، استراتيجيه(. ، وجود عدم هو االساليب هذه عُلى المآخذ احدفي أخطئء حاله تصادف عندما التحُليل من لُلمزيد بكامُلها االختبار فئة لتعريض مناسبه

. ظاهرة في الشائع السبب خطأ المشخصة الحاله لتصحيح االستعجال من بدال تصنيفها، ) وهذا ) عشوائيه اعتباطيه بطريقه يتم االستنتاج قوانين انتقاء ان هو الخاطئ التصنيف

. ترتيب من الفائده انتاجها او ظهورها اولوية حسب ترتيبها يتم القوانين ان الى راجععوامل من اقل عدد تطبيق عنه ينجم ذلك ان هو معينه اهمية لمعيار طبقا القوانين

. المعرفه قاعدة عُلى التحويليدعى استقرائي تنقيح نظام في المنهجيه لهذه وتنفيذ نظريه منهجيه الورقه هذه تصف

.ARISأريس استقرائيا المفاهيم تعُلم انظمة تحسين باتجاه لالمام خطوة يحقق والذي ، اريس اهميه ARISويستخدم االكثر االجزاء عُلى التنقيح عمُلية لتركيز التقنيات من عدد

. واصالحها المعرفه قاعدة في

الحاليه .2 االنظمة تواجه التي المصاعب

االكثر الوحده وهي التعُلم، النظمة الحل امكانيات في مهما دورا المعرفه قاعدة تُلعبجرينر ولكن في )Greiner )5قوة، غاية مسألة هي كفؤه معرفه قاعدة بناء ان اوضح

متناغمه NP hard الصعوبه غير بناؤها تم التي المعرفه قاعدة تكون ما وغالبا ، inconsistent كامُله كانت incomplete وغير اذا عما النظر بغض تامه، بكفاءه تعمل ال وقد

من مكتبة تحُليل خالل من او الخبراء من مباشرة انتزعت قد هذه المعرفه قاعدةومطور. أعم نموذج عُلى لُلحصول المعرفه قاعدة تحديث الضروري من لذا، الحاالت

: . البحث لهذا دافعه حوافز التاليه االعتبارات وتعد تأثيرا واكثر يعرف ما شرك في تضعها عيوب من االستقرائيه المفاهيم تعُلم خوارزمات تعاني

المحُليه بشكل local maxima بالقمة األمثل الحل عن جدا بعيده تكون قد والتيعام

دعمت اذا المسائل حل في ذكاء اكثر االستقرائي التعُلم انظمة تكون ان يمكن . ان التعُلم لنظام السماح بالتحديد، التعُلم عمُلية في االداء تحُليل دمج بامكانية

مُلحوظ بشكل يزيد المعرفه قاعدة في معين مثال احتواء كان اذا عما يستعُلم ) العكسيه . ) الراجعه التغذيه هذه ان هو السبب ال ام النظام قوة feedbackمن

تعميم طريق عن مختُلفه باتجاهات التعُلم مقدرة من قاعدة generalize تزيداالمثُله واستثناء التغطيه خارج تقع التي االمثُله لتضمين االصُليه المعرفه

. وإضافة القانون غطاء تعميم ذلك ويضم بالخطاء المعرفه بقاعدة المضمنة. مفرط بشكل العامه القوانين بعض وتخصيص زائده قوانين وإلغاء جديد، قانون

االنسحاب صنف تعيين الى الحاليه االنظمه ( default class تُلجأ الغالبيه ) صنف . وعند الحاله خصائص قيم عُلى ينطبق قانون يتوفر لم اذا تصنيفها، يراد حالة الى

. ثم ومن خاطئه بتنبؤات الخروج احتمال يزداد اثنين من ألكثر الحاالت عدد ازديادبديُله تقنية االمر يتطُلب

اريس .3 نظام ARISبنية

Page 3: Active learning arabic

مجموعه عُلى االستقراء باستخدام معرفه قاعدة انتاج عُلى مبدئيا اريس نظام يعملمنفصُله مجموعه عُلى المعرفه قاعدة اختبار ذلك بعد النظام ويواصل التدريب، امثُلة من

التنقيح بيانات فئة الفئه هذه وتسمى التنقيح الغراض البيانات .refinement data set منيستدعى التنقيح بيانات لبعض خاطئ تصنيف بروز حالة في وفقط االختبار هذا بعد

. لتعميم باالختبار خاصه منفصُلة فئة عُلى النظام يختبر واخيرا لُلتنقيح الفرعي النظام . المعرفه، قاعدة في المحتمُله االخطاء تحديد عُلى التنقيح نظام يعمل التنقيح عمُلية

عامه كاشفه دالة بمساعدة الممكن التنقيح الكتشاف العوامل من مكتبة ويستدعيglobal heuristic التنقيحات كافة تنتهي حتى العمُليه وتتكرر تنقيح، افضل ويطبق ،

الممكنه.التخصيص عوامل من فضاء في بحثا اريس نظم والتعميم specialization يؤدي

generalization . حيث ومن المعرفه لقاعدة تعديل او تنقيح ادنى اليجاد محاولة فيصنف او فرضيه لكل منها اثنتان تنفذ التنقيح، لنظام رئيسية مراحل ثالثة توجد المفهوم

القوانين ترتيب عُلى يحافظ بينما المعرفه، بقاعدة ألوزانها rulesمتوفر وفقا

المركزه ) األولى (Localization المرحلة

فئة ضمن من تصنيفها في أخطئء التي الحاالت كافة تحديد المرحُله هذه خالل يتمصنف الى تنتمي والتي . classالتنقيح وزن حاله كل وتمنح خالل weightمعين من

) في ) الحاله النقطه هذه عند التشابك الى هذا ويشير الحاله، عُلى تنطبق التي القوانين .) التي ) الحاالت بين من وزن االعُلى ذات الحاله اختيار ويتم الفرضيه الصنف فضاء . الخاطئه القوانين فئة من االقوى القانون يحدد هذا ألن تصنيفها، في أخطىء

) واالختبار ) والتحقق التنقيح تنفيذ الثانيه المرحلة

القانون المرحُلة هذه في عوامل ruleيحدد كافة تجربة ويتم االخطاء، عن المسئوليغطي مشابه آخر قانون ويعمم ، الخاطيء القانون تخصيص يتم أي الممكنه، التنقيح

قاعدة . وتختبر الممكنه العوامل كافة تجرب جديد قانون يستحدث كما المقصود، الصنف . التي العوامل مجموعة او التنقيح عامل اختيار يتم أخيرا الناتج باالداء ويحتفظ المعرفه

. . ممكنه اخرى تحسينات اية تبقى ال حتى العمُليه وتكرر اداء افضل تعطي

) الزائده ) القوانين وإزالة الكمال من التأكد الثالثه المرحلة

واحد . بقانون حاله كل تغطية ويجب تمامها من لُلتأكد المعرفه قاعدة تفحص أخيرا، . اضافة فيمكن ، المتوفره بالقوانين مشموله غير حاالت هناك كانت اذا األقل عُلى

. االساسيه . المكونات الحاجه عن الزائده القوانين تزال ذلك الى إضافة جديده قوانيناريس الشجره ARISلنظام >د مول القوانين tree generator هي >د مول و rule generatorو

الحكم ونموذج التنقيح االستنتاج judgement module مولد آلية .inference engineوتصنيفي خطأ أي لعالج الممكنه التنقيحات كل تطبيق عن المسئول هو التنقيح >د مول

التمكين ) ويدعى تحريرها بواسطة القوانين تتغير ان من( enabling ويمكن منعها اواإلعاقه ) ويسمى الحكم( . disabling التحرر نموذج عامل judgement module يختار

ضرورة مع المعرفه قاعدة اداء عُلى تحسين افضل تنتج التي العوامل مجموعة او التنقيح . اريس نظام بنية ادناه الشكل ويوضح السابق في خطأ المصنفه الحاالت .ARISتصحيح

Page 4: Active learning arabic

أريس: 1الشكل النظام بنية

المعرفه .4 قاعدة استقراء

القضايا تمثيل استخدام المعرفه، propositional representation تم تمثيل كُلغةالخاصيه وقيمة شرط عُلى المحتويه المنطق صيغ القضايا تمثيل -attribute.ويستخدم

value condition فمثال)colour=red v colour=green( & shape=circle

= ) = = دائره) الشكل و اخضر الُلون او احمر الُلون ) انتاج ) او أثر قوانين شكل المعرفه قاعدة تحتوي production rule وتأخذ ان يمكن والتي

مثل لُلقانون محُليه استثناءات عُلىIF outlook=sunny & humidity=low THEN class=mildIF outlook=rain & windy=true THEN class=don't play UNLESS Covered_stadium=true

اريس عُلى يعرض تصنيف، نماذج بناء -ARISوليتم قيمة اوصاف عُلى يحتوي مُلفوصف attribute-value خاصيه هي حاله وكل اصنافها، تعريف تم التي الحاالت من لفئة

. التدريب بيانات اريس نظم يحُلل واحد األثر training data لكائن قوانين من فئة >د ويولالمفاهيم تصف التي القضايا صيغة .concepts في

كوينُلن عمل الى االساسيه الفكره وترجع القرار، شجرة بتعُلم التأويل عمُلية تبدأquinlan )6( " " الى القرار شجرة تحويل ان التجارب واوضحت تسد ق فر> فكرة مستغال

لم حاالت عُلى دقيق تنبؤ وذات ومفهومه واضحه قوانين الى يؤدي القوانين من مجموعة . لكل ،قانون القوانين من مجموعة شكل في شجرة كتابة إعادة إن مصادفتها يسبق

. طرفيه وريقه لكل واحد قانون يوجد ببساطه ألنه ابسط تراكيب ينتج لن بالشجره مسارالتي الشروط بعض عُلى نتعر>ف قد القانون مقدمة في قرب عن الجيد بالتفحص ولكن

. القانون دقة في التأثير بدون جديد قانون ينتج الزائده الشروط الغاء عالقه ذات ليست . ان نفرض الشروط إلغاء وراء من الفكره ولفهم قبوال اكثر القانون يجعل مما االصُلي،

هو G القانون IF A THEN class C

ان شروط Aحيث لمجموعة اتحاد ,…….a1,a2,a3 هيعمومية اكثر آخر هو 'G وقانون

IF A' THEN class Cان واحد 'Aحيث شرط بالغاء عُليها الشروط aiيتحصل . Aمن

القصيره المقدمه تشمُلها التي التدريب بيانات في حاله ال 'Aكل او تنتمي انها اماالمعني الصنف الى الشرط Cتنتمي ترضى ال او ترضي وانها ،ai

ب

ريدلتاتناياب

القانون >د مول

ره

جشال>دولم

قاعدة القوانين

>ف المصن

االستنتاج ( آلية

التنقيح >د مول

القوانين المنق>حهقائمة

معرفه قاعدة

منق>حه

ني نا وق لا ب

رت>م

اختبار بيانات تنقيح بيانات

ؤب نلتاةجتين

التنقيح االساسيهالبنيه نموذج

مرتQبة القوانين

Page 5: Active learning arabic

: يُلي كما مجموعه كل في الحاالت عدد تنظيم يمكن

الصنف C

اخرى اصناف

الشرط ترضي ai حاالت S1 E1

الشرط ترضي ال ai حاالت S2 E2

عدد تغطيها S1+E1يوجد التي الحاالت من الشرط 'Aحاله ترضي ان ) aiوهي بمعنى( Gالقانون عدد منها ان حيث القانون E1يشمُلها . Gيصنفها ويوجد صحيح غير تصنيف

المعمم S2+E2 عدد القانون بواسطة مغطاة . 'Gحاله يوجد االصُلي القانون يغطيها والعدد . E2 منها ان وحيث اخرى اصناف الى تنتمي انها حيث بالخطأ، تضمينها تغطي 'Gتم

يغطيها التي الحاالت بواسطة Gكل المغطاة الحاالت عدد فإن S1+S2+E1 هي ' Gايضا،

+E2 . االهميه اختبار كان test of significanceاستخدم اذا ما لتقرير اعاله الجدول عُلىالشرط الغاء الواجب الشرط. aiمن يبقى ان هي معدل aiالفكره يكون عندما فقط

الحقيقي الحقيقي 'Gلُلقانون الخطأ الخطأ معدل من .Gلقانون اكبر

مقدارها خطأ نسبة يرتكب الذي لُلقانون المرجح غير من ان انه التدريب بيانات في

حدود في خطأ له خطأ يكون مقياس استخدام تم لذا رؤيتها، يسبق لم حاالت عُلى

لُلخطأ البالس تقدير يدعى Laplace error estimate تقديري

ان عدد Nحيث وان التدريب امثُلة عدد الصنف Eهو غير اصناف الى تنتمي منها

بالشرط . C المعني يحتفظ اكبر aiلذا حقيقي خطأ معدل يحدث الغاؤه كان اذا فقط. . القانون تعميم عند القانون في شرط من اكثر الغاء يمكن وبالطبع، االنسحاب خطأ من

شره اسُلوب تطبيق عُلى النظام تنتج greedy approach ويعمل التي الشروط الغاء في . المعمم لُلقانون حقيقي خطأ معدل اقل

كاشفه تقييم دالة بواسطة االسُلوب هذا ويوجه القوانين، لبناء آخر اسُلوب تطوير تم لقدheuristic evaluation function وهما مهمتين خاصيتين بتطبيق القانون جودة لتقييم

باستخدام. consistency والتناغم completeness الكمال الداله جودة قيمة احتساب ويتم

لُلقانون شرط اضافة يعمل بينما القانون، غطاء زيادة القانون، شروط احد الغاء ويسبب . اريس يتعُلم القانون نقاوة زيادة ( ARISعُلى بحيث ) االسُلوب هذا باستخدام القوانين

التغطيه عُلى اقل وبشكل التناغم عُلى اكبر بشكل هذا coverageتركز تغيير يمكن ولكن ، المتغير قيمة مع. αبتعديل ومالحظات تجارب من نتجت كاشفه، دالة عدة ARISهذه في

. المرونه، بعض البراز كطريقه التناغم عُلى القانون جودة اعتماد يعمل فعُليه مجاالتالعامه ) القوانين او نادره حاالت تغطي التي القوانين مثل متنوعه اوضاع مع والتكيف

المتغير(. قيمة تثبيت تم لقد الداله )0.8ليساوي αجدا جودة عامل(. 1وتعظيم ويساعدكما التناغم يتساوى عندما اكثر حاالت تغطي التي القوانين تفضيل عُلى التمام او الكمال

: ادناه المثال يوضحهالبيانات =) من عدد لدينا ان منها 10بفرض عدد 5حاالت و ( 5موجبه لدينا كان واذا سالبه

قانونين:الصنف + 3يغطي: 1قانون الى تنتمي كُلها حاالت

Page 6: Active learning arabic

فان + 4يغطي: 2والقانون الصنف الى تنتمي كُلها ، حاالت

األول 2ولُلقانون لُلقنون

1=4÷4التناغم=1=3÷3التناغم=0.8= 5÷4الكمال=0.6= 5÷3الكمال=

( القيمه لهما القانونين كال ترى، . 1كما لذا ( الكمال معامل يختُلف بينما التناغم لمعامل . بعد كاف غير وحده التناغم معامل ان حيث معنى له سيكون الكمال عامل اضافة فان

يشكل القوانين، كافة الوزن ARIS تعُلم تقدير ويتم قانون بكل تربط ألوزان تقديرا. بكامُلها التدريب فئة حاالت باستخدام

القانون .5 وزن احتساب

تعريف ويمكن القانون، لخصائص االوزان من تشكيُله خالل من القانون وزن تقدير يتم : القانون معتقد في الثقه مقياس بانه القانون اهمية Rule's opinion وزن مبرزا ،

) بطريقة ) القانون قوة بمعايرة هذا لنا ويسمح ، الصنف او االفتراض لالعتقاد الشروطالجدول. يصف . 1عمُليه باييز نظرية ونستخدم الشأن بهذا العالقه ذات المصطُلحات

Bayes. القانون في جزئيه لكل االوزان إلشتقاقاالحداث تقس>مه عينه فضاء ان . ,……E1,E2 تخيل الفضاء +Hوافترض في حدث تعني

) باحتمال ) معين مفهوم او صنف الى ،P)H+( 0> يشيراذا

) ( صنفين أو وافتراضين شرطين ذو بسيط -h+,hوكمثال

بالمعادله هذا تعريف ادناه 2يمكننا

ان حيث

الجدول اصطالحات استخدام 1او

Page 7: Active learning arabic

قيمة الفتره QAوتقع المعادله . [INF,+0]في الى نظرنا صيغة 2اذا انها اساس عُلىفي لُلمعتقد قيم E1تحديث من QAفان من 1االكبر تزيد انها القيم )P)E1يبدو وبالمثل

من من 1االصغر اعتبار. )P)E1 تقُلل يمكن الدليل QAلذا يحمُله ، وزن نها اساس عُلىE . داعم دليل عُلى الموجبه االوزان تدل ذاك او االتجاه بهذا المعتقد يحرك ،والذي

.) ( وتجمع الصنف او االفتراض يعارض عكسي دليل عُلى السالبه االوزان وتدل لُلصنف،لُلقانون واحد وزن في شرط كل اوزان التاليه الداله

ان . Wحيث ان ،حيث القانون مقدمة في االختبارات تأثير هذا ويحسب القانون وزن هي

0<=W<=1 .الفتره في الدليل وزن قيم بحصر مهتمين استخدمت. [1,+1]-ولكننا فقد لذاالمطُلوب المدى الى القيمه الحالة التاليه الداله

W=F)QA(ان حيث

المدى في لُلوزن قيمة المعادله هذه الوزان. [1,+1]-وتنتج اندماج هو لُلقانون الوزن

التصنيف في ولُلمساعده القانون لتنظيم ترتيب كمعيار الوزن هذا واستخدم ، اختباراته. التنقيح لعمُلية داعما وايضا

بالتنقيح .6 الخاصه Refinement knowledge المعرفه

الموجبه االخطاء عدد تقُليل هو المعرفه قاعدة تنقيح من واالخطاء false positiveالهدفالموجبه false negativeالسالبه الجديده االخطاء عدد تقُليل مع جديده، حاالت في

. عند والتناغم الكمال بين عالقه هناك أن وحيث حديثا المشخصه الحاالت في والسالبه: يُلي كما المعرفه قاعدة جودة نعر>ف فاننا المعرفه قاعدة تنقيح

القيمه تثبيت تم تجاربنا، والذي. αلُلمتغير 0.8خالل لُلتنقيح المنشود الهدف يحقق وهذا

. والتناغم الكمال من كتشكيُله المعرفه قاعدة جودة يحسب

عمليه .7 نتائج

في المعُلومات الستغالل افضل طريقة ايجاد الورقه هذه في المعروض البحث حاولالبيانات تجميع بيئات مثل باستمرار، وتنمو الحجم كبيرة المتاحه البيانات بها مجاالت

.automatedالمؤتمته .2الجدول التنقيح عمُليات انتهاء بعد التصنيف دق>ة في التحسن توضح تجارب يُلخص

الجدول في االول في 3العمود الجدول دمج وتم التجارب، في المستخدم المجال يصف : صنعها معرفه لقواعد التنقيح وبعد قبل النتائج تُلخص االولى المجموعة مجاميع ثالثة

عُلى ARISنظام الثانيه المجموعه وتحتوي والتناغم، الكمال معياري استخدام فيها وتمنظام طورها معرفه لقواعد اختبار بيانات عُلى التنقيح وبعد قبل اما. C4.5معُلومات

لقواعد اختبار بيانات عُلى التنقيح وبعد قبل معُلومات عُلى فتحتوي الثالثه المجموعةنظام اختُلقها :RIPPERمعرفه التاليه. المعُلومات تقديم تم مجموعه كل وفي

Page 8: Active learning arabic

المعنون عشرة "rules"العمود لعدد المعرفه قاعدة في القوانين عدد متوسط الى يشير. مجال كل في عشوائيا اختيرت اختبارات

لعدد %" acc "العمود معينه بيانات فئة عُلى المعرفه لقاعدة التنبؤ دق>ة 10يعطيمحاوالت

العالمات ) .√وتشير المعرفه ( قاعدة دق>ة في تحس>ن عنها نتج التنقيح عمُليات ان الىنظام من كل يعمل اذ لُلتحُليل، هامه خاصيه المعرفه قاعدة مركمة نقصد ) ARISوتعد

) ونظام والتناغم الكمال خاصيتي باستخدام القوانين من C4.5انتاج قوانين انتاج عُلىينتج النظامين وكال امثُله، من مكو>نه بيانات قاعدة بتحُليل مستقراه قرار شجرة نماذج . . نظام ينتج اخرى جهة ومن التنقيح دورة خالل الزائده القوانين هذه تحذف زائده قوانين

RIPPER اضافيه لمعُلومات كنتيجة قوانين إلضافة حاجه وهناك موجزه، معرفه قواعدالبيانات تغطية عُلى المساعدة في الحاليه القوانين تعميم يعمل لم ما حالة في وخاصة

. مصادفتها تتم التي

انظمه .8 ثالثة بين المقارنه

من افضل نتائج إحداث التقييم الستراتيجية يمكن متى تحديد هو الجزء هذا من الهدفالمقارنه، في اسُلوبنا ويتضمن المتاحه، البيانات كافة عُلى التعُلم نظام تدريب

: التاليه االستراتيجية عُلى التعُلم نظام تدريب بواسطة المعرفه قاعدة البيانات% 40استقراء من

باستخدام تنقيحها ثم المتوفره% 20المتاحه البيانات من باستخدام النظام تدريب بواسطة المعرفه قاعدة البيانات% 60استقراء من

المتاحه( البيانات باقي عُلى االسُلوبين باختبار وذلك المنتجه المعرفه لقواعد االداء قارن

40.)% أي 3الجدول الثالثه لألنظمة اخرى مقارنه ، ARISهو C4.5 نظام و ،RIPPER

. مستقراه معرفه لقواعد التقييم نتائج مقارنة تمت منتقاه اختبار مجاالت عُلىمدمجه، تدريب كفئة التنقيح بيانات وفئة التدريب بيانات فئة من كل دمج بواسطة

من كل بين عادله مقارنه يعطي و C4.5،و ARISوهذا ،RIPPER .العمود يبيننظام اداء الثاني العمود ويوضح المستخدم، المجال بيانات ARISاالول عُلى

عُلى يدرب حينما . 40االختبار اداء% الثالث العمود ويعطي المتاحه البيانات منالمدمجه ARISنظام التدريب بيانات عُلى تدريبه عند االختبار بيانات نفس عُلى

.) عُلى) المعرفه قاعدة اداء الرابع العمود ويعطي معا والتنقيح التدريب بيانات أي . نظام باداء يزودنا الخامس العمود التنقيح بعد االختبار بيانات C4.5 بيانات عُلى

عُلى تدريبه عند . 40االختبار فيوضح% السادس العمود اما المتاحه البيانات مننظام . C4.5اداء ويشير مدمجة البيانات عُلى تدريبه عند االختبار بيانات عُلى

نظام بواسطة والمستقراة المنق>حة المعرفه قاعدة اداء الى السابع C4.5 العمود . نظام اداء الثامن العمود يوضح االختبار بيانات نفس ذات RIPPERعُلى عُلى

عُلى تدريبه عند االختبار . 40بيانات التاسع% العمود ويعطي المتوفره البيانات مننظام . RIPPERاداء ويبرز مدمجة البيانات عُلى تدريبه عند االختبار بيانات عُلى

بواسطة والمستقراة المنق>حه المعرفه قاعدة اداء العاشر عُلى RIPPERالعمود. االختبار بيانات نفس

العالمات ) نتائج( √وتشير بالتنقيح متبوعة التدريب فيهاعمُلية انتجت التي المواضع الى. بأكمُلها البيانات عُلى التدريب طريق عن عُليها المتحصل تُلك من افضل جيده

نظامي من كل بين القوانين استقراء في الواضح الفرق التجارب وC4.5 وتوضحRIPPER .نظام >د يول تضارب C4.5بالتحديد، الى بعضها يؤدي والتي القوانين من العديد

. مما الزائده القوانين هذه مثل الغاء عُلى >ن المبي التنقيح نسق ويعمل القوانين بين فيما . اسُلوب يعمل ، اخرى ناحية من المعرفه قاعدة دق>ة من استقراء RIPPERيزيد في

نظام يؤدي التنقيح خالل فانه لذا القوانين، من اقل عدد انتاج عُلى عدد ARISالقوانينقواعد عُلى القوانين الغاء عمُليات من القُليل ويظهر القوانين بناء عمُليات من اكبر

بنظام الخاصه . RIPPERالمعرفه

Page 9: Active learning arabic

في الخوارزميات لكافة االصناف وصف جودة تحسين عُلى التنقيح آلية تعمل باختصار،وهي ) طبيه مجاالت مثل( Heartو Hypothyroidو Hepatitisثالثة معضالت ذات وهي

. ) الحصول ) تم ذلك وفوق الصغرى الخاصه الحاالت مشكُلة و النقاوه عدم التشويشنظامي فيها استخدم عديده اخرى مجاالت عدة عُلى تحسينات عُلى ARISو C4.5عُلى

تكون. والتي اختبار بيانات عُلى تنقيح آلية التعُلم نظم تستخدم بان ينصح لذا التوالينظام في كما المعرفه قاعدة استقراء في المستخدمة التدريب بيانات عن منفصُله

RIPPER وC4.5. عاليه جودة ذات مفاهيم اوصاف عُلى لُلحصول

االستنتاج.9

مفاهيم اوصاف بناء لمسألة الورقه هذه مجاالت concept descriptionsتعرضت في. باستمرار المتزايده البيانات من هائُله كميات من االستفاده يمكن حتى الحجم، كبيرة

الحاالت من مكتبة من معرفه قواعد بناء عُلى قادر استقرائي تنقيح نموذج تطوير وتم . خاصه اهمية النموذج لهذا ان جديده حقائق لتضمين باستمرار وتحديثها مسبقا، >فة المصن

. الطبيه والصور االعتماد بطاقة معامالت مثل والمشو>شه المتغيرة المجاالت فيالقانون شروط بين لُلعالقه تقدير عُلى معتمدا القانون وزن لتعُلم اسُلوبا طورنا لقد .) التي ) الحاالت لتحديد الوزانها طبقا القوانين ورتبت االستنتاج او القانون وخاتمة

بسهولة تصنيفها في .أخطيء

المراجع.10

]1[ Aha David w., Goldstone Robert L., Concept learning and flexible weighting, Proceedings of the Fourteenth Annual Conference of the cognitive Science Society, Bloomington, 1992, pp. 534-539.]2[ Benferhat Salem, Dobois Didier, Prode Heneri, Nonmonotonic reasoning, Conditional objects and possibility theory. Artificial Intelligence,1997, pp. 259-276]3[ Breiman Leo, Friedman Jerome, Olshen Richard, Stone Charles, Classification and regression trees. Wadsworth, Pacific Grove, CA, 1984.]4[ Brunk Clifford. An investigation of knowledge intensive approaches to concept learning and theory refinement. Ph.D. thesis, University of California, 1996.]5[ Greiner Russell, The complexity of theory revision, Proceedings of the Fourteenth International Joint Conference on Artificial Intelligence, Montreal, 1995.]6[ Quinlan John Ross, C4.5, Programs for machine learning, Morgan Kaufman, 1993.

Page 10: Active learning arabic

الرمز الوصف

Ei دليل او حدث الى (.eg. Age<=20)تشير

~Ei الحدث متمم الى ((Ei eg. Age<20تشير

H+ الصنف او لُلفرضيه الموجبه الحاالت فضاء عُلى (eg. Healthy )تدل

H- لالفتراض السالبه الحاالت فضاء عُلى (eg. Sick) تدل

P)Ei( لألمثُله الكُلي العدد الى نسبة الشرط مدى في الحاالت او لُلكائنات المسبق التوزيع (.)Age<20(e.g. P )تمثل

X1 = P)H|Ei( بالشرط المغطاة الموجبه الحاالت من .)Ei )i.e. True positives TPالجزء

X2 = P)H|~Ei( بالشرط المغطاه غير الموجبه الحاالت متمم Ei جزء الى .)Ei )i.e. False negatives FNنسبة

X3=P)Ei( الدليل يشمُلها التي الحاالت الكُلي Eجزء العدد الى نسبة

بالقانون: 1الجدول الشرط وزن اصطالحات

المجالوالتناغم الكمال أريسمستخدما نظام C4.5نظام RIPPERنظام

التنقيح قبل التنقيح بعد التنقيح قبل التنقيح بعد التنقيح قبل التنقيح بعد

#rules Acc% Acc% #rules #rules Acc% Acc% #rules #rules Acc% Acc% #rules

نبات بياناتالسوسن

2.6 93.17 95.67√ 3 4.6 93.5 93.5 2.5 2.6 90.67 90.99√ 3.1

النبيذ بيانات 3.1 87.36 88.12√ 4.1 5.7 89.72 89.72 4.3 2.8 86.25 87.64√ 3.8

الكبد التهاب بيانات 3 78.55 79.52√ 4.5 5.9 80.32 81.61√ 3.7 1.3 77.26 77.58√ 3.4

الغدة بياناتالدرقيه

3.4 97.89 98.2√ 4.5 7.6 96.99 97.67√ 5.1 2.5 98.4 98.4 2.6

القلب بيانات 26.8 48.93 49.59√ 26.2 38.9 49.26 50.66√ 12.3 2.9 52.2 53.03√ 9.5

الدوله راية بيانات 31.2 56.39 58.2√ 15.9 33 55.3 60.24√ 14.2 8.6 52.89 55.66√ 13.7

السمعيات بيانات 22.9 43.04 49.02√ 16.1 23.2 44.02 49.6√ 12.6 12.8 66.56 68.04√ 12.8

الفطر بيانات 22.7 99.69 99.85√ 9.8 34.3 98.47 98.5√ 13.6 7.5 99.84 99.86 7.5

الراشدين بيانات 160.8 71.43 71.44 57.1 228 77.62 78.61√ 36.4 4 81.27 81.27 7.5

بياناتاصطناعيه 19.4 98.09 98.11√ 20.3 47.9 92.0 93.6√ 33.2 15.6 96.34 96.35 17.9

رقم لعدد: 2الجدول المتوسط أخذ تعلم، انظمة ثالثة على التنقيح عملية مجال 10أداء لكل تجارب

Page 11: Active learning arabic

المجال ARIS والكمال التناغم باستخدام C4.5نظام RIPPERنظام التدريب

% 40باستخدام التدريبعلى

مدمجه بياناتمعرفه قاعدة

حه Qمنق التدريب

%40باستخدام التدريبعلى

مدمجه بياناتمعرفه قاعدة

حه Qمنق التدريب%40باستخدام

التدريبعلى مدمجه بيانات

معرفه قاعدةحه Qمنق

نبات بياناتالسوسن

93.17 93.67 95.67√ 93.5 94.0 93.5 90.67 93.33 90.99

النبيذ بيانات 87.36 89.72 88.12 89.72 90.0 89.72 86.25 90.14 87.64

التهاب بياناتالكبد

78.55 78.39 79.52√ 80.32 77.96 81.61√ 77.26 76.94 77.58√

الغدة بياناتالدرقيه

97.89 98.14 98.2√ 96.99 97.24 97.67√ 98.4 98.20 98.4√

القلب بيانات 48.93 47.05 49.59√ 49.26 50.19 50.66√ 52.2 52.21 53.03√

راية بياناتالدوله

56.39 59.64 58.2 55.3 55.54 60.24√ 52.89 57.23 55.66

بياناتالسمعيات

43.04 40.20 49.02√ 44.02 43.12 49.12√ 66.56 70.69 68.04

الفطر بيانات 99.69 99.77 99.85√ 98.47 98.37 98.5√ 99.84 99.87 99.86

بياناتالراشدين

71.43 70.97 71.44√ 77.62 78.07 78.61√ 81.27 82.22 81.27

بيانات اصطناعيه

98.09 98.86 98.11 92.0 98.16 96.6 96.34 97.53 96.35

رقم انظمه : 3الجدول ثالثة أداء مقارنة