16
การใชซอฟตแวร Open Source (AlphaMiner) เพื่อ วิเคราะหตะกราสินคา (Market Basket Analysis) และ วิเคราะหลักษณะลูกคาเปาหมาย (Customer Profiling) หัวเรื่อง 1) การใชงานซอฟตแวร AlphaMiner เพื่อวิเคราะหตะกราสินคา (Market Basket Analysis) 2) การใชงานซอฟตแวร AlphaMiner เพื่อการวิเคราะหลักษณะลูกคาเปาหมาย (Customer Profiling) แนวคิด 1) การวิเคราะหตะกราสินคา คือการวิเคราะหขอมูลการซื้อสินคาของลูกคา เพื่อระบุวาตัวสินคาหรือ บริการใดมีความสัมพันธตอกันในการซื้อสินคาแตละครั้ง เพื่อสรุปเปนกฎความสัมพันธ ของสินตางๆ โดยทั่วไป กฎความสัมพันธ จะสรุปผลการวิเคราะหออกเปน 3 สวนใหญๆ คือ โอกาสของสินคาหรือ บริการใดบางที่จะถูกซื้อในล าดับถัดไป โอกาสของสินคาหรือบริการใดบางที่จะถูกซื้อไปพรอมๆ กัน และระดับความนาสนใจในกฎความสัมพันธ 2) ฐานขอมูลที่จะน ามาใชในการวิเคราะหตะกราสินคานั้น มั กจะเปนขอมูลธุรกรรมที่บันทึกรายการ การซื้อสินคาแตละครั้ง ที่สรุปมาในชวงระยะเวลาหนึ่งๆ เชน รายเดือน หรือ รายป เปนตน โดยการ วิเคราะหตะกราสินคาจะวิเคราะหหาความสัมพันธของสินคาและความถี่ในการปรากฏของ ความสัมพันธนั้นๆ แลวแสดงออกมาเปนกฎความสัมพันธ พรอมดวยความนาจะเปนของเหตุการณ นั้นที่จะเกิดขึ้นในรูปของตัวเลข 3) AlphaMiner เปนฟรีซอฟตแวรที่ใชในการวิเคราะหขั้นตอนการทําเหมืองขอมูล มีความหลากหลาย ของฟงกชั่นสําหรับผูใชเพื่อดําเนินการขั้นตอนการทําเหมืองขอมูล วัตถุประสงค รายงานฉบับนี้มีวัตถุประสงคเพื่อ 1) สามารถใชงานซอฟตแวร AlphaMiner เพื่อวิเคราะหตะกราสินคา (Market Basket Analysis) ได 2) สามารถใชงานซอฟตแวร AlphaMiner เพื่อการวิเคราะหลักษณะลูกคาเปาหมาย (Customer Profiling)

การใช้ซอฟต์แวร์ Open source (alpha miner) วิเคราะห์ตะกร้าสินค้า (market basket analysis)

Embed Size (px)

Citation preview

Page 1: การใช้ซอฟต์แวร์ Open source (alpha miner) วิเคราะห์ตะกร้าสินค้า (market basket analysis)

การใชซอฟตแวร Open Source (AlphaMiner) เพื่อ วิเคราะหตะกราสินคา (Market

Basket Analysis) และ วิเคราะหลักษณะลูกคาเปาหมาย (Customer Profiling)

หัวเรื่อง

1) การใชงานซอฟตแวร AlphaMiner เพื่อวิเคราะหตะกราสินคา (Market Basket Analysis)

2) การใชงานซอฟตแวร AlphaMiner เพื่อการวิเคราะหลักษณะลูกคาเปาหมาย (Customer Profiling)

แนวคิด

1) การวิเคราะหตะกราสินคา คือการวิเคราะหขอมูลการซื้อสินคาของลูกคา เพื่อระบุวาตัวสินคาหรือ

บริการใดมีความสัมพันธตอกันในการซื้อสินคาแตละครั้ง เพื่อสรุปเปนกฎความสัมพันธ ของสินตางๆ

โดยทั่วไป กฎความสัมพันธ จะสรุปผลการวิเคราะหออกเปน 3 สวนใหญๆ คือ โอกาสของสินคาหรือ

บริการใดบางที่จะถูกซื้อในล าดับถัดไป โอกาสของสินคาหรือบริการใดบางที่จะถูกซื้อไปพรอมๆ กัน

และระดับความนาสนใจในกฎความสัมพันธ

2) ฐานขอมูลที่จะน ามาใชในการวิเคราะหตะกราสินคานั้น มั กจะเปนขอมูลธุรกรรมที่บันทึกรายการ

การซื้อสินคาแตละครั้ง ที่สรุปมาในชวงระยะเวลาหนึ่งๆ เชน รายเดือน หรือ รายป เปนตน โดยการ

วิเคราะหตะกราสินคาจะวิเคราะหหาความสัมพันธของสินคาและความถี่ในการปรากฏของ

ความสัมพันธนั้นๆ แลวแสดงออกมาเปนกฎความสัมพันธ พรอมดวยความนาจะเปนของเหตุการณ

นั้นที่จะเกิดขึ้นในรูปของตัวเลข

3) AlphaMiner เปนฟรีซอฟตแวรที่ใชในการวิเคราะหข้ันตอนการทําเหมืองขอมูล มีความหลากหลาย

ของฟงกชั่นสําหรับผูใชเพื่อดําเนินการขั้นตอนการทําเหมืองขอมูล

วัตถุประสงค

รายงานฉบับนี้มีวัตถุประสงคเพื่อ

1) สามารถใชงานซอฟตแวร AlphaMiner เพื่อวิเคราะหตะกราสินคา (Market Basket Analysis) ได

2) สามารถใชงานซอฟตแวร AlphaMiner เพื่อการวิเคราะหลักษณะลูกคาเปาหมาย (Customer

Profiling)

Page 2: การใช้ซอฟต์แวร์ Open source (alpha miner) วิเคราะห์ตะกร้าสินค้า (market basket analysis)

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 1

กิจกรรม และการจัดทํารายงาน ประกอบดวย

1) การใชงานซอฟตแวร AlphaMiner เพื่อวิเคราะหตะกราสินคา (Market Basket Analysis) โดยจับ

ภาพหนาจอของแตละข้ันตอนการ ทํางานมาแสดงในรายงาน พรอมบรรยายประกอบ และนําเสนอ

ผลการวิเคราะห ที่เปนประเด็นสําคัญมาอยางนอย 3 ประเด็น จากมุมมอง Rules View พรอมแปล

ผลมาพอสังเขป

1. การใชงานซอฟตแวร AlphaMiner เพื่อวิเคราะหตะกราสินคา (Market Basket Analysis) โดยจับภาพ

หนาจอของแตละข้ันตอนการ ทํางานมาแสดงในรายงาน พรอมบรรยายประกอบ และนําเสนอผลการ

วิเคราะห ที่เปนประเด็นสําคัญมาอยางนอย 3 ประเด็น จากมุมมอง Rules View พรอมแปลผลมาพอสังเขป

1. ขั้นตอนการใช AlphaMiner เพื่อวิเคราะหตะกราสินคา (Market Basket Analysis) มีข้ันตอน

ดังตอไปนี้

1.หลังจากเราติดตั้งโปรแกรม (โดยเวอรชั่นที่ใชเปน AlphaMiner : Data Mining Platform release 2.0 )

จากนั้นไปที่ Program > AlphaMiner หรือสามารถเขาโปรแกรมโดยคลิกที่ไอคอนดังรูปที่ 1.1

รูปที่ 1. 1 แสดงรูป Shortcut ของ AlphaMiner

2. เมื่อเปดเขาสูโปรแกรมแลวจะปรากฏหนาจอตามรูปที่ 1.2 โดยดานขวามือจะเปนพื้นที่สีขาว สวนทางดาน

ซายมือจะมีหัวขอ “ Case Management ” ประกอบไปดวย

2.1 Case list ซึ่งจะมี Case Study ตัวอยางที่ติดมากับตัวโปรแกรมเอง

2.2 Search Result

Page 3: การใช้ซอฟต์แวร์ Open source (alpha miner) วิเคราะห์ตะกร้าสินค้า (market basket analysis)

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 2

รูปที่ 1. 2 แสดงหนาโปรแกรม AlphaMiner เมื่อเปดขึ้นครั้งแรก

3. หากเราตองการสราง Case ใหมขึ้นมาใหเราเลือกที่เมนู Case > New หรือกด Ctrl+N ตามรูปที่ 1.3

(หรือสามารถเลือกศึกษาไดจาก Case Study ตามที่กลาวในขอ 2 ก็ได )

รูปที่ 1. 3 แสดงการสราง Case ใหมขึ้นมาใหม

Page 4: การใช้ซอฟต์แวร์ Open source (alpha miner) วิเคราะห์ตะกร้าสินค้า (market basket analysis)

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 3

เมื่อเราคลิ้กเลือก New จะปรากฏหนาพื้นที่ ดังรูปที่ 1.4

รปูที่ 1. 4 หนาตางเมื่อเราสราง Case ใหมขึ้นมา

โดยจะมีหัวขอใหญอยู 4 แทปคือ

1) Data Understanding และแบงเปน

1.1 Data Accesss มีหัวขอ Input Database และ Input File

1.2 Data visualization มี Explore และ MultiPlotView

รูปที่ 1. 5 แสดง Data Understanding

Page 5: การใช้ซอฟต์แวร์ Open source (alpha miner) วิเคราะห์ตะกร้าสินค้า (market basket analysis)

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 4

2) Data Preparation ประกอบไปดวย

รูปที่ 1. 6 แสดง Data

Preparation

2.1 Set Attributes

2.2 Add Expression

2.3 Outlier Treatment

2.4 Missing Values

2.5 Normalization

2.6 Sampling

2.7 Binerization

2.8 Select

2.9 Categorical

Transformation

2.10 Numeric

Transformation

2.11 Transationlization

3) Modeling ประกอบไปดวย

Page 6: การใช้ซอฟต์แวร์ Open source (alpha miner) วิเคราะห์ตะกร้าสินค้า (market basket analysis)

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 5

Modeling ประกอบไปดวย

รูปที่ 1. 7 แสดง Modeling

3.1 Classification

Prediction

3.1.1 Decision Tree

3.1.2 Navive Bayes

3.1.3 SMO

3.1.4 Logistic Regression

3.1.5 Linear Regression

3.1.6 Multilayer

Regression

3.1.7 RBF Network

3.1.8 OneR

3.1.9 WekaClassifier

3.2 Clustering

3.2.1 KMeans

3.2.1 WKMeans

3.3Association

3.3.1 Association

4) Evaluation ประกอบไปดวย Assessment

รูปที่ 1. 8 แสดงEvaluation

4. การใชงาน เราสามารถใชวิธี ลากและวาง (Drag and drop ) ตัวโหนดตางๆได แตในที่นี้ เราจะ

เลือกการแสดงจาก Case Study ที่มีอยูในโปรแกรมอยูแลว ดังนี้

Page 7: การใช้ซอฟต์แวร์ Open source (alpha miner) วิเคราะห์ตะกร้าสินค้า (market basket analysis)

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 6

4.1 ไปที่แทป Case List > Supermarket > Sale promotion campaign 2005

ตามรูปที่ 1.9 จะปรากฏรายละเอียดตางๆที่เคากําหนดไว ประกอบดวย

- Case Name, Company Name , Department Name, Industry, Problem Type, Business

Object, Data Mining GO

4.2 ขั้นตอไป เราสามารถกดไป View Case เพื่อเขาไปใชงาน Case นี้ ( หรือจะเลือกหัวขอ

อื่นๆ เชน Edit Case ในการแกไข , Copy Case เพื่อสรางสําเนาเคสนี้อีกอันหนึ่ง , Export Case คือ

สงออก case นี้ไปเก็ยไวในเครื่องเรา และ Case Report ก็จะเปนการสรางรายงาน Case นี้ออกเปน

ไฟล pdf เพื่อนําไปใชตอไป )

รูปที่ 1. 9 Case Study Sale promotion campaign 2005

5. หลังจากเรากด View Case จะเปนโมเดลการวิเคราะหตะกราสินคา ดังรูปที่ 1.11 เนื่องจากเราไดเลือก

จาก Case Study มาตัว Input File มันจึงมีขอมูลชื่อวา “Sale promotion campaign 2005” อยูแลว แต

หากเราตองการเปลี่ยนแปลงขอมูลใหม ก็สามารถคลิกขวาที่โหนด Input File แลวเลือก Open เพือ่ไป

Brows ไฟลขอมูลของเราเขามา โดย

ระบุคา File Type : คาไฟลขอมูล ในที่นี้ใหเลือก Excel

File Name : ระบุตําแหนงและชื่อไฟล ในที่นี้ใหเลือกไฟล

Supermarket_basket_transactions_2005.xls

Page 8: การใช้ซอฟต์แวร์ Open source (alpha miner) วิเคราะห์ตะกร้าสินค้า (market basket analysis)

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 7

Worksheet : กรณีเลือกชนิดไฟลเปน Excel จะสามารถระบุ Worksheet ที่ตองการได

ดังรูปที่ 1.10

รูปที่ 1. 10 แสดงการเลือกไฟลเพื่อมาประมวลผล

แตหากวาราตองการใชขอมูลนี้เลย ก็สามารถคลิกเลือกท่ีคําสั่ง “Run”

รูปที่ 1. 11 แสดงโมเดล supermarket_basket_transactions_2005.xls

ระหวางที่เราคลิก Run จะมีสถานะดังตอไปนี้

Page 9: การใช้ซอฟต์แวร์ Open source (alpha miner) วิเคราะห์ตะกร้าสินค้า (market basket analysis)

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 8

สี่เหลี่ยมสีเหลือง

แสดงวาโปรแกรม

กําลังดําเนินการอยู

สี่เหลี่ยมแดง แสดงวา

โปรแกรมไมสามารถ

ประมวลผลได ตอง

แกไขไฟลขอมูล

สี่เหลี่ยมสีเหลือง

แสดงวาโปรแกรม

ดําเนินการเสร็จ

สมบูรณ

ตารางที่ 1 แสดงสถานะเมื่อเราทําการ Run โปรแกรม

จากนั้นเมื่อเสร็จสมบูรณ เราสามารถคลิกขวาที่โหนด Input File อีกครั้ง จะมีคําสั่งเพิ่มมาคือ View Result

ดังรูปที่ 1.12

รูปที่ 1. 12 การดูผลการ Run

จะปรากฏจอภาพข้ึนมา แสดงรายละเอียดโครงสราง File และขอมูลดังนี้ โดยเราสามารถคลิก Maximize

เพื่อขยายใหใหญขึ้น ตามรูปที่ 1.13

Page 10: การใช้ซอฟต์แวร์ Open source (alpha miner) วิเคราะห์ตะกร้าสินค้า (market basket analysis)

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 9

รูปที่ 1. 13 แสดงหนาตางผลลัพธการประมวลผล

โดยจะแสดงออกเปน 2 แทปคือ Variable และ Data

- Variable จะแสดงโครงสรางไฟลที่ประกอบดวย Attribute ตางๆ ดังรูปที่ 1.14

รูปที่ 1. 14 แสดงผลหนา Variables

- Data จะแสดงขอมูลของไฟลของ Attribute ตาง ๆ ในที่นี้ขอมูลแถวที่ 1 คือขอมูลการซื้อสินคาหนึ่งครั้ง

ซึ่งจะมีขอมูลตาม Attribute เชน ซื้อสินคาจํานวนเทาไหร เพศอะไร อายุเทาไหร ซื้อสินคาชนิดใดบาง ฯลฯ

Page 11: การใช้ซอฟต์แวร์ Open source (alpha miner) วิเคราะห์ตะกร้าสินค้า (market basket analysis)

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 10

ใน Attribute สินคา เชน cookies, fish, orange juice , lemon tea เปนตน หากรายการสินคา

นั้นถูกซื้อตามชนิดสินคาที่ตรงกับชื่อ Attribute จะปรากฏตัวอักษรสีดําที่มีคําเชนเดียวกันกับชื่อ Attribute

เชน

ขอมูลแถวที่ 1 จะแสดงคําวา cookies แสดงวาในขอมูลแถวที่ 1 มีการซื้อสินคา “cookies” และถา

หาก กรณีไมไดซ้ือสินคานั้นจะปรากฏตัวอักษรสีแดงคําวา “[MISSING]”

รูปที่ 1. 15 แสดง Data ขอมูลของไฟลของ Attribute ตาง ๆ

6. ขั้นถัดไป จะระบุคาและประมวลผลที่โหนด Set Attribute ใหคลิกขวา ที่โหนด Set Attribute และเลือก

Open จะปรากฏหนาตาง Set Attributes ดังรูปที่ 1.16

รูปที่ 1. 16 การเปดเพ่ือ Set Attributes

ในสวนนี้จะสามารถระบุเลือกเฉพาะ Attribute ที่สนใจจะนํามาใหประมวลผลไดเชน หากเราสนใจ

Page 12: การใช้ซอฟต์แวร์ Open source (alpha miner) วิเคราะห์ตะกร้าสินค้า (market basket analysis)

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 11

Attribe การดไอดีของลูกคา “cardid” ใหคลิกขวาที่คอลัมน Role และเลือกคา Set to Use จากนั้น

Attribute ‘cardid’ จะถูกเซ็ทคาเปน “Use” เมื่อเรา Run เพื่อประมวลผลโหนด Attributes ก็จะนําคา

cardid มาประมวล ดวย เมื่อเราปรับปรุงคาใหมเสร็จ หลังจากเสร็จสิ้นขั้นตอนแลวใหกด Apply แลวก็

Close ทุกครั้ง ตามรูปที่ 1.17 โดยในที่นี้เราจะสนใจเฉพาะ Atribute สินคานั้น

รูปที่ 1. 17 แสดงการ set คา Role

7. หลังจากนั้น ใหชี้เมาสและคลิกขวาที่ Set Attributes และเลือก Run หากเสร็จสมบูรณไมมี Error จะ

ปรากฎ กรอบสีเขียวรอบโหนด Attributes ดังรูปที่ 1.18

รูปที่ 1. 18 แสดงการ Run Set Attributes ที่สมบูรณ

Page 13: การใช้ซอฟต์แวร์ Open source (alpha miner) วิเคราะห์ตะกร้าสินค้า (market basket analysis)

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 12

8. ขั้นตอไปเปนการประมวลผลที่โหนด Transactionalization ใหคลิกขวาและเลือก Run หากเสร็จสมบูรณ

ไมมี Error จะปรากฏกรอบสีเขียดังรูปที่ 1.19

รูปที่ 1. 19 โหนด Transactionalization

9.ขั้นตอไปเปนการระบุคาและประมวลผลที่โหนด Association ใหคลิกขวาและเลือก Open จะปรากฎ

หนาตางตามรูปที่ 1.20

รูปที่ 1. 20 การระบุคาและประมวลผลที่โหนด Association

Page 14: การใช้ซอฟต์แวร์ Open source (alpha miner) วิเคราะห์ตะกร้าสินค้า (market basket analysis)

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 13

มาดูที่แทป General สามารถกําหนดคาที่ใชในอัลกอริทึม Apriori ไดดังรูปที่ 1.21

รูปที่ 1. 21 กําหนดคาที่ใชในอัลกอริทึม Apriori

โดย

Apriori คาที่กําหนด

Min Item size คือ คานอยที่สุดของ

ความสัมพันธของจํานวนสินคา n ที่จะแสดงผล

ในที่นี้ลองกําหนด = 2

Max. Item size คือ คา สูงสุดของความสัมพันธ

ของรายการสินคา n ที่จะแสดงผล

ในที่นี้กําหนดเปนคาสูงสุด

คือคา No Limit Min

Support % คือคา Support ของ %

ความสัมพันธของสินคาที่ถูกซื้อไปพรอมกัน

ในที่นี้ลองกําหนดเปน 15

Min Confidence คือ คา Confidence ของ %

ความนาจะเปนหรือโอกาสที่จะซ้ือสินคาลําดับ

ตอไป

ในที่นี้กําหนดเปน 50

ตารางที่ 2 การกําหนดคา Apriori

Page 15: การใช้ซอฟต์แวร์ Open source (alpha miner) วิเคราะห์ตะกร้าสินค้า (market basket analysis)

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 14

มาดูที่แทป Attribute สามารถกําหนดคาที่สัมพันธกันในอัลกอริทึม Apriori โดยในที่นี้จะกําหนดคาตามภาพท่ี

1.22

รูปที่ 1. 22 การกําหนด Attribute

เมื่อตั้งคาหมดแลว จากนั้นใหคลิก Apply และ Close แลวใหไปท่ีโหนด Association เพื่อทําการประมวลผล

โดยคลิกขวา แลว Run เหมือนโหนดอื่นๆ โดยในระหวางประมวลผล กรอบสีเขียวแสดงวาเสร็จสมบูรณ

ถูกตอง กรอบสีแดงแสดงวามี Error ตามรูปที่ 1.23 แสดงวาเสร็จสมบูรณ

รูปที่ 1. 23 การประมวลผลสมบูรณที่ Association

เมื่อเสร็จสมบูรณในขั้นตอนนี้ทั้งหมด เราจะสามารถประมวลผลลัพธของการหาคาความสัมพันธของ

ตะกราสินคา (Market Basket Association) ใน Case นี้ไดโดยใหคลิกขวาที่โหนด Association และเลือก

View Result โปรแกรมจะแสดงผลลัพธที่มีคาตาง ๆ ตามรูปที่ 1.24 ดังนี้

Page 16: การใช้ซอฟต์แวร์ Open source (alpha miner) วิเคราะห์ตะกร้าสินค้า (market basket analysis)

ซอฟตแ์วร์ Open Source เพื�อทาํเหมืองขอ้มูล หน้า 15

รูปที่ 1. 24 แสดงผลการหาคาความสัมพันธของตะกราสินคา (Market Basket Association)

สรุปผลการประมวลผล

1. จากผลลัพธดังกลาวมีกฏความสัมพันธของตะกราสินคา (Market Basket Association) ที่สัมพันธกัน

ทั้งหมด 11 กฎ

2. แตละกฎมีความสัมพันธการซื้อสินคารวมกัน Items Size คือ 2 รายการ

3. ขอมูลในกฎที่ 1 Rule No. 1 โอกาสหรือความนาจะเปนที่ลูกคาจะซ้ือ lemon tea และ cookies มี

15.551% (Support 15.551%) หมายถึงถา ตะกราสินคาทั้งหมด 100 ตะกรา จะพบวามี lemon tea และ

cookies 15.551ตะกรา

4. โอกาสหรือความนาจะเปน ที่ลูกคาเมื่อซ้ือ lemon tea แลว จะซื้อ cookies ตามมามี 50.174%

(Confidence = 50.174% %) นั่นคือ ตะกราสินคาที่ซื้อ lemon tea 100 ตะกรา จะพบวาจะซื้อ cookies

ตามมามี ทั้งหมด 50.174 ตะกรา