การวิเคราะห์ข้อมูลใบเสร็จ7-eleven ด้วย...

Preview:

Citation preview

การวิ�เคราะห์ข้�อมู�ลใบเสร�จ 7-ELEVEN ด้�วิย

WEKA

นางสาว กรรณิกา เชื้ �อร��ง 55102010984

AGENDA

การแบ�งกล��มูข้�อมู�ล (Data Clustering) การจ�าแนกประเภทข้�อมู�ล (Data Classification) การห์ากฎควิามูส"มูพั"นธ์ (Association Rules)

CLUSTERING การแบ�งกล��มูข้�อมู�ล (Clustering) โด้ยใช้� Simple K-Means น�า

ข้�อมู�ลใบเสร�จ 7-eleven ท'(เตร'ยมูไวิ�เพั+(อมูาท�าการแบ�งกล��มู

CLUSTERING

การ Clustering โด้ยใช้�เทคน�ค SimpleKMeans

โด้ยก�าห์นด้ numCluster = 2 จนถึ-ง numClusters = 30 เพั+(อน�าCluster sum of squared errors น�ามูา Plot กราฟ เพั+(อห์า Knee Curve

CLUSTERING ต"วิอย�างห์น�าจอการท�างานโปรแกรมู WEKA ในการ Clustering ก�าห์นด้numClusters = 2

CLUSTERING ต"วิอย�างห์น�าจอการท�างานโปรแกรมู WEKA ในการ Clustering ก�าห์นด้numClusters = 10

CLUSTERING น�าค�า Within cluster sum of squared errors มูา plot Graph เพั+(อห์า Knee

Curve Graph แสด้ง Knee Curve ท'( numClusters= 18

CLUSTERING เมู+(อต�องการทราบวิ�า ใบเสร�จ แต�ละใบ อย��ใน Cluster ใด้บ�างสามูารถึ

แสด้ง โด้ย Weka ด้"งน'/ 1. ต�องท�าการ Save ไฟล การแบ�งข้�อมู�ล numClusters = 18 เป0น

ไฟล Arff

CLUSTERING 2. เมู+(อคล�ก Visualize cluster assignments จะมู'ห์น�าจอแสด้งข้-/นมูา และ

ท�าการ Save ไฟล .arff

CLUSTERING 3. เป1ด้ไฟล .arff ท'( Save ไวิ� แล�วิท�าการกด้ Save เป0นไฟล .csv

CLUSTERING 4. เป1ด้ไฟล .csv โด้ยไปท'( Tool > ArffViewer แล�วิเล+อกไฟล csv

เพั+(อเป1ด้ด้�ผลล"พัธ์

CLUSTERING 5. ผลล"พัธ์ สามูารถึบอกได้�วิ�า แต�ละใบเสร�จอย��ใน Cluster ใด้บ�าง

CLUSTERING สร�ปการแบ�งกล��มู 18 กล��มู โด้ยแบ�ง ส�นค�าท'(ซื้+/อในแต�ละ Cluster ด้"งร�ป

การท�า CLASSIFICATION โด้ยใช้�FUNCTION : MULTILAYERPERCEPTRON การเตร'ยมูข้�อมู�ลท"/งห์มูด้ เพั+(อน�ามูาสร�าง Model ส�าห์ร"บการ train

CLASSIFICATION การเตร'ยมูข้�อมู�ลจ�านวิน 10 แถึวิ เพั+(อน�ามูาสร�าง Model ส�าห์ร"บการtest

CLASSIFICATION

วิ�เคราะห์ข้�อมู�ลจากใบเสร�จ 7-eleven

“ วิ�เคราะห์ ข้�อมู�ลข้องสมูาช้�กล��มูท�านายการซื้+/อส�นค�าจาก 7-eleven วิ�า สมูาช้�กอย��บ�าน ท'(กร�งเทพัฯ (Bangkok) ห์ร+อ

ต�างจ"งห์วิ"ด้ (Countryside)”

CLASSIFICATION เล+อก Classify (1) และ Classifier>MultilayerPerceptron (2) เปล'(ยนจ�านวินTrainingTime = 200

CLASSIFICATION น�า Model ท'(เตร'ยมูไวิ�มูา Test ก"บ ข้�อมู�ลจ�านวิน 10 แถึวิท'(ได้�เตร'ยมูไวิ�ก�อนห์น�า

CLASSIFICATION Result ArffView TrainingTime = 200

โปรแกรมูจะท�านายเป0นผลล"พัธ์วิ�า สมูาช้�กอย��บ�านท'(กร�งเทพัฯ (Bangkok) ห์ร+อ ต�างจ"งห์วิ"ด้ (Countryside) ออกมูา

CLASSIFICATION เล+อก Classify และ Classifier>MultilayerPerceptron เปล'(ยนจ�านวินTrainingTime = 500

CLASSIFICATION น�า Model ท'(เตร'ยมูไวิ�มูา Test ก"บ ข้�อมู�ลจ�านวิน 10 แถึวิท'(ได้�เตร'ยมูไวิ�ก�อนห์น�า

CLASSIFICATION

Result ArffView TrainingTime = 500

โปรแกรมูจะท�านายเป0นผลล"พัธ์วิ�า สมูาช้�กอย��บ�านท'(กร�งเทพัฯ (Bangkok) ห์ร+อ ต�างจ"งห์วิ"ด้ (Countryside) ออกมูา

การท�า ASSOCIATION โด้ยใช้�APRIORI ข้�อมู�ลท'(เตร'ยมูส�าห์ร"บการท�า Associate แต�ละใบเสร�จถึ�ามู'การซื้+/อส�นค�า จะใส�ค�าเป0น t

และถึ�าไมู�มู'การซื้+/อส�นค�า ใส�ค�าเป0น ? (เพั+(อไมู�ให์�โปรแกรมูน�าค�าท'(ไมู�มู'การซื้+/อเข้�ามูาค�ด้ค�านวิณ)

ASSOCIATION เป1ด้ไฟล csv ข้องข้�อมู�ลใบเสร�จ 7-eleven ท'(เราได้�เตร'ยมูไวิ�

ASSOCIATION เล+อก Associate (1) และ

เล+อก Associator เป0น Apriori (2)

จากน"/น กด้ Start (3)

ASSOCIATION

ผลล"พัธ์

ASSOCIATION ผลล"พัธ์ท'(แสด้งออกมูา จะเป0นควิามูส"มูพั"นธ์การซื้+/อส�นค�า 7-eleven โด้ยโปรแกรมูจะ

แสด้งค�าควิามูเช้+(อมู"(น (Confidence) , Correlation Analysis (Lift) , Support(LHS) และ Support(RHS)

ASSOCIATION

ผลล"พัธ์การวิ�เคราะห์ข้�อมู�ลโด้ยใช้�กฎควิามูส"มูพั"นธ์ (Association Rules)

Best rules found:

1. IceCream=t 40 ==> Water=t 40 <conf:(1)> lift:(1.79) lev:(0.21) [17] conv:(17.67)

2. Sandwich=t 38 ==> Water=t 38 <conf:(1)> lift:(1.79) lev:(0.2) [16] conv:(16.79)

3. IceCream=t Sandwich=t 33 ==> Water=t 33 <conf:(1)> lift:(1.79) lev:(0.17) [14] conv:(14.58)

4. Milk=t IceCream=t 28 ==> Water=t 28 <conf:(1)> lift:(1.79) lev:(0.14) [12] conv:(12.37)

5. Milk=t Sandwich=t 27 ==> Water=t 27 <conf:(1)> lift:(1.79) lev:(0.14) [11] conv:(11.93)

6. Milk=t IceCream=t Sandwich=t 24 ==> Water=t 24 <conf:(1)> lift:(1.79) lev:(0.12) [10] conv:(10.6)

ASSOCIATION

Best rules found ( ต�อ ):

6. Milk=t IceCream=t Sandwich=t 24 ==> Water=t 24 <conf:(1)> lift:(1.79) lev:(0.12) [10] conv:(10.6)

7. TissuePaper=t Sandwich=t 18 ==> Water=t 18 <conf:(1)> lift:(1.79) lev:(0.09) [7] conv:(7.95)

8. TissuePaper=t IceCream=t 17 ==> Water=t 17 <conf:(1)> lift:(1.79) lev:(0.09) [7] conv:(7.51)

9. Yoghurt=t IceCream=t 16 ==> Water=t 16 <conf:(1)> lift:(1.79) lev:(0.08) [7] conv:(7.07)

10. TissuePaper=t IceCream=t Sandwich=t 14 ==> Water=t 14 <conf:(1)> lift:(1.79) lev:(0.07) [6] conv:(6.19)

THANK YOU

Recommended