20
อการเคราะอลวย RapidMiner Studio 6 1 ในบทผมจะแนะใกการเคราะอลวย ดาา ไมง งสามารถไายๆ โดยการใงาน ซอฟแว RapidMiner Studio 6 โดย เอกท ชรวงกดา หสม. ดาา http://facebook.com/datacube.th http://www.dataminingtrend.com แจกายคงแรกในนวาเลนไท 14 มภาน 2557

อการเคราะอลวย RapidMiner Studio 6 1 · อการเคราะอลวย RapidMiner Studio 6 1 ในบทผมจะแนะใกการเคราะอลวย=

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

Page 1: อการเคราะอลวย RapidMiner Studio 6 1 · อการเคราะอลวย RapidMiner Studio 6 1 ในบทผมจะแนะใกการเคราะอลวย=

คู่มือการวิเคราะห์ข้อมูลด้วย

RapidMiner Studio 6

1ในบทนี้ผมจะแนะนำให้รู้จักการวิเคราะห์ข้อมูลด้วยวิธีดาต้า ไมน์นิง ซึ่งสามารถทำได้ง่ายๆ โดยการใช้งานซอฟต์แวร์ RapidMiner Studio 6!!

โดย เอกสิทธิ์ พัชรวงศ์ศักดา!หสม. ดาต้า คิวบ์!

http://facebook.com/datacube.th!http://www.dataminingtrend.com!

!แจกจ่ายครั้งแรกในวันวาเลนไทน์ 14 กุมภาพันธ์ 2557

Page 2: อการเคราะอลวย RapidMiner Studio 6 1 · อการเคราะอลวย RapidMiner Studio 6 1 ในบทผมจะแนะใกการเคราะอลวย=

บทที่ 1 แนะนำการใช้งาน RapidMiner Studio 6"!หัวข้อต่างๆ"

"1." แนะนำ Data Mining และ RapidMiner Studio 6"

"2." เริ่มต้นใช้งาน RapidMiner Studio 6"

"3." องค์ประกอบของ RapidMiner Studio 6"

"4." ตัวอย่างการสร้างโมเดล Decision Tree"

"5." เอกสารอ้างอิง (Reference)

คู่มือการวิเคราะห์ข้อมูลด้วย RapidMiner Studio 6

!2

1. แนะนำ Data Mining และ RapidMiner Studio 6"คงปฏิเสธไม่ได้ว่าเราได้ก้าวเข้าสู่ยุคที่มีข้อมูลขนาดมหาศาลซึ่งเกิดจากการใช้งานในชีวิตประจำวันของเราเอง เช่น การซื้อสินค้าในซุปเปอร์มาร์เกต หรือ การใช้งานเครือข่ายสังคม (social network) แบบต่างๆ อาทิเช่น เฟซบุค (Facebook) หรือ ทวิตเตอร์ (Twitter) เมื่อข้อมูลมีจำนวนมากขึ้นย่อมทำให้เกิดความต้องการนำข้อมูลเหล่านี้มาใช้เพื่อก่อให้เกิดประโยชน์มากที่สุด วิธีการหนึ่งที่นิยมใช้กันมากในปัจจุบันคือการวิเคราะห์หาความสัมพันธ์ที่ซ่อนอยู่ในข้อมูล วิธีการนี้คือ “การขุดเหมืองข้อมูล” (data mining) หรือเรียกทับศัพท์ว่า ดาต้า ไมน์นิง (ซึ่งในหนังสือเล่มนี้ผมขอเรียกชื่อทับศัพท์เพื่อให้เป็นสากลและเข้าใจได้ง่ายกว่าครับ) การวิเคราะห์ข้อมูลด้วยวิธีดาต้า ไมน์นิงนี้มีตัวอย่างความสำเร็จให้เห็นอยู่เยอะครับ แต่ผมขอยกตัวอย่างมาให้ดูสัก 2 ตัวอย่างก่อน โดยตัวอย่างแรกเป็นตัวอย่างคลาสสิกครับ นั่นก็คือการที่ห้างวอล์มาร์ท (Walmart) ได้ทำการค้นพบพฤติกรรมการซื้อสินค้าของลูกค้าที่เป็นเพศชายว่า ในช่วงเย็นของวันศุกร์ลูกค้ากลุ่มนี้มักจะมาซื้อสินค้าสองอย่างควบคู่กันไป นั่นก็คือ “เบียร์และผ้าอ้อม” โดยจากการวิเคราะห์เจาะลึกลงไปก็พบเหตุผลว่าการที่สินค้าสองอย่างนี้มีการซื้อร่วมกันบ่อยๆ เพราะว่า พ่อบ้านส่วนใหญ่มักจะซื้อเบียร์ไปดื่มในช่วงสุดสัปดาห์และเกิดคิดถึงลูกน้อยของตัวเองขึ้นมาจึงซื้อผ้าอ้อมติดไม้ติดมือไปด้วย (ถ้าเป็นบ้านเราอาจจะพบว่าพฤติกรรมแบบนี้เกิดขึ้นเพราะพ่อบ้านถูกภรรยาใช้ให้มาซื้อผ้าอ้อมให้ลูกแล้วอยากดื่มเบียร์ด้วยหรือเปล่าก็ไม่รู้นะครับ ^^) หลังจากที่ห้างวอล์มาร์ทรู้ถึงพฤติกรรมแบบนี้ทางห้างก็สามารถที่จะจัดวางสินค้าสองชนิดนี้ให้สามารถค้นหาได้ง่ายๆ หรือมองเห็นได้ง่ายเพื่อเพิ่มโอกาสที่ลูกค้าจะได้ซื้อติดไม้ติดมือกันไปด้วยครับ ส่วนตัวอย่างที่สองก็ยังคงมาจากห้างสรรพสินค้าเหมือนกัน

เอกสิทธิ์ พัชรวงศ์ศักดา http://www.dataminingtrend.com

หมายเหตุ"บทความนี้ยินดีให้แจกจ่ายหรือส่งต่อได้แต่ขอสงวนลิขสิทธิ์ ตาม พ.ร.บ. ลิขสิทธิ์ พ.ศ. 2537 ห้ามลอกเลียนแบบไม่ว่าส่วนหนึ่งส่วนใดของเอกสารเล่มนี้ นอกจากจะได้รับอนุญาติเป็นลายลักษณ์อักษร

Page 3: อการเคราะอลวย RapidMiner Studio 6 1 · อการเคราะอลวย RapidMiner Studio 6 1 ในบทผมจะแนะใกการเคราะอลวย=

ถ้าพูดถึงซอฟต์แวร์ประเภทโอเพนซอร์สที่ใช้ในการวิเคราะห์ข้อมูลด้วยดาต้า ไมน์นิงในประเทศไทยเรามักจะคุ้นเคยกับซอฟต์แวร์ที่ชื่อว่า Weka มากกว่า ผมเองคลุกคลีกับดาต้า ไมน์นิ่งและได้ลองใช้งานซอฟต์แวร์ Weka มาเป็นระยะเวลาหลายปีจนได้เขียนบทความการใช้งาน Weka เบื้องต้นลงในนิตยสาร โอเพนซอร์ส ทูเดย์ (OpenSource2Day) ซึ่งเป็นนิตยสารเล่มแรกและเล่มเดียวในเมืองไทยที่เน้นการใช้งานซอฟต์แวร์ โอเพนซอร์ส หลังจากนั้นผมก็ได้ร่างหลักสูตรการใช้งานซอฟต์แวร์ Weka และจัดการอบรมมาเป็นจำนวนเกือบ 20 รุ่น แม้ว่าซอฟต์แวร์ Weka จะใช้งานได้ง่ายและสะดวกมากถ้าต้องการนำไปพัฒนาต่อยอดในระบบ web application ที่พัฒนาขึ้นมาเอง แต่ในหลายๆ ครั้งผมมักจะพบกับข้อจำกัดทางการใช้งานหรือการแสดงผลในรูปแบบต่างๆ และนั่นก็เป็นเหตุผลหนึ่งที่ผมได้เริ่มลองหาซอฟต์แวร์ โอเพนซอร์สอื่นๆ มาใช้งานแทน Weka และผมก็คิดว่าซอฟต์แวร์ RapidMiner Studio 6 ที่ผมจะแนะนำการใช้งานในหนังสือเล่มนี้มีสิ่งที่น่าสนใจและทำงานได้เหนือกว่าซอฟต์แวร์ Weka ครับ ผมขอสรุปข้อที่ดีกว่าของซอฟต์แวร์ RapidMiner Studio 6 ดังนี้ครับ!

• รองรับการใช้งานไฟล์ได้หลายประเภท เช่น ไฟล์ Excel 2007!• สามารถแสดงข้อมูลได้หลายรูปแบบ เช่น scatter plot 3D!• สามารถแสดงผลโมเดลที่สวยงามและแก้ไขการแสดงผลให้

สามารถอ่านได้ง่ายขึ้น!• สามารถบันทึกไฟล์โมเดลออกเป็นไฟล์ภาพประเภทต่างๆ เช่น

PNG, JPG หรือ PDF!• มีวิธีการเตรียมข้อมูล (preprocess) และการวิเคราะห์ได้หลาก

หลายรูปแบบ

บทที่ 1 แนะนำการใช้งาน RapidMiner Studio 6

!3

ครับ นั่นคือห้างทาร์เก็ต (Target) ห้างทาร์เก็ตนี้เป็นห้างที่เกิดขึ้นมาทีหลังทำให้การจะแข่งขันกับห้างวอล์มาร์ทที่มีอยู่ก่อนแล้วก็คงไม่ใช่เรื่องง่าย ดังนั้นทางห้างจึงพยายามหาวิธีที่จะดึงดูดให้ลูกค้ามาซื้อสินค้ากับทางห้างให้มากขึ้นและรักษาฐานลูกค้าที่มีอยู่ให้เชื่อใจและอยากกลับมาซื้อสินค้าที่ห้างของตนเองให้ได้มากที่สุด จากการวิจัยทางการตลาดของห้างทาร์เก็ตพบว่า เมื่อครอบครัวมีสมาชิกใหม่เกิดขึ้นคนในครอบครัวก็จะเริ่มมีการจับจ่ายใช้สอยมากขึ้นเพื่อรองรับการขยายขนาดของครอบครัว ดังนั้นเมื่อทราบเช่นนี้แล้วทางห้างทาร์เก็ตจึงได้ทำการวิเคราะห์พฤติกรรมของลูกค้าผู้หญิงที่มาซื้อสินค้าและพบว่าเมื่อลูกค้าเหล่านี้เริ่มตั้งครรภ์ ลูกค้าจะมีพฤติกรรมการซื้อสินค้าที่เปลี่ยนไป เช่น เริ่มมีการซื้อวิตามินบำรุงมากขึ้น เปลี่ยนไปกินอาหารที่มีประโยชน์ หรือแม้กระทั่งซื้อตู้เสื้อผ้าเพิ่ม จากรูปแบบพฤติกรรมลักษณะนี้ทำให้ทางห้างสามารถส่งโปรโมชันที่เกี่ยวกับการตั้งครรภ์หรือสินค้าสำหรับเด็กให้กับลูกค้ากลุ่มนี้ได้ นอกจากนี้ห้างทาร์เก็ทยังมีความมั่นใจว่าถ้าลูกค้าเชื่อใจที่จะซื้อสินค้าให้กับบุตรที่เกิดขึ้นใหม่แล้วลูกค้าเหล่านี้ก็จะเชื่อใจซื้อสินค้าชนิดอื่นๆ ของทางห้างไปอีกเรื่อยๆ (รายละเอียดเพิ่มเติมดูได้จากหัวข้อ “เอกสารอ้างอิง” ช่วงท้ายของบทนี้ครับ) !

แน่นอนว่าถ้าเราอยู่ในบริษัทใหญ่ๆ อย่างห้างวอล์มาร์ทหรือห้างทาร์- เก็ตการซื้อซอฟต์แวร์เชิงพาณิชย์ซึ่งมีราคาเฉียดล้านบาท เช่น SAS Enterprise Miner หรือ IBM Intelligent Miner เพื่อมาทำการวิเคราะห์หาพฤติกรรมเหล่านี้ก็คงไม่ใช่เรื่องยากและก็คุ้มค่ากับการลงทุน แต่ถ้าเราเป็นเจ้าของกิจการขนาดย่อมถึงปานกลาง (หรือที่เรียกว่า SME) หรือเป็นนิสิต นักศึกษา อาจารย์ การลงทุนแบบนี้ก็อาจจะเป็นไปได้ยากมาก ดังนั้นในหนังสือเล่มนี้ผมจึงอยากจะแนะนำให้รู้จักกับซอฟต์แวร์ประเภท โอเพนซอร์ส (open source) ซึ่งสามารถดาวน์โหลดมาใช้งานได้โดยไม่มีค่าใช้จ่าย หรือ ฟรีนั่นเองครับ

เอกสิทธิ์ พัชรวงศ์ศักดา http://www.dataminingtrend.com

Page 4: อการเคราะอลวย RapidMiner Studio 6 1 · อการเคราะอลวย RapidMiner Studio 6 1 ในบทผมจะแนะใกการเคราะอลวย=

!!!!!!!!!!!!

!

!4

ดังนั้นในหัวข้อนี้ผมจึงขอแนะนำให้ท่านได้รู้จักกับซอฟต์แวร์ที่ชื่อว่า RapidMiner Studio 6 ก่อนที่เราจะเริ่มต้นใช้งานกันในหัวข้อ “เริ่มต้นใช้งาน” ครับ!

ซอฟต์แวร์ RapidMiner Studio 6 แรกเริ่มพัฒนาขึ้นจากบริษัทที่ชื่อว่า Rapid-I ในประเทศเยอรมนี และเมื่อช่วงปลายปี 2013 ที่ผ่านมาได้รับทุนก้อนโตจากนักลงทุนในประเทศสหรัฐอเมริกาจึงเปลี่ยนช่ือบริษัทจาก Rapid-I เป็น RapidMiner แทน และย้ายสำนักงานใหญ่มาอยู่ประเทศสหรัฐอเมริกา เราสามารถดาวน์โหลดซอฟต์แวร์ RapidMiner Studio 6 ซึ่งเป็นเวอร์ชันปัจจุบันได้จากเว็บไซต์ http://rapidminer.com ครับ และเลือกที่เมนู Products และ RapidMiner Studio ซึ่งจะแสดงหน้าจอดังในรูปที่ 1-1 หลังจากนั้นให้คลิกที่ปุ่ม Download RapidMiner 6 Now! หน้าเว็บจะเปลี่ยนไปเป็นหน้า Create an Account (รูปที่ 1-2) ซึ่งเราจะต้องกรอกรายละเอียดเพื่อให้ทาง RapidMiner เก็บข้อมูลสักเล็กน้อยครับ ถัดมาเราจะสามารถเลือกดาวน์โหลดซอฟต์แวร์ที่ตรงกับระบบปฏิบัติการที่เราใช้งานอยู่ ซึ่งในหนังสือเล่มนี้ขออนุญาตแสดงหน้าจอจากระบบ Mac OS X แทน Windows ครับ แต่เมื่อเราเริ่มใช้งานจะพบว่าหน้าตา GUI ของทุกระบบจะดูสวยงามเหมือนกันหมด และนั่นก็คือข้อดีอีกข้อของซอฟต์แวร์ RapidMiner Studio 6 ครับ หลังจากที่เราดาวน์โหลดซอฟต์แวร์เสร็จเรียบร้อยแล้วก็สามารถเริ่มใช้งาน RapidMiner Studio 6 กันได้แล้วครับ ^^!

เอกสิทธิ์ พัชรวงศ์ศักดา http://www.dataminingtrend.com

รูปที่ 1-1 เว็บไซต์ rapidminer.com

รูปที่ 1-2 ลงทะเบียนเพื่อดาวน์โหลดซอฟต์แวร์

คู่มือการวิเคราะห์ข้อมูลด้วย RapidMiner Studio 6

Page 5: อการเคราะอลวย RapidMiner Studio 6 1 · อการเคราะอลวย RapidMiner Studio 6 1 ในบทผมจะแนะใกการเคราะอลวย=

จากรูปที่ 1-4 ได้เลยครับ!

!!!!!!เมื่อคลิกที่เมนูดังกล่าวแล้วจะพบกับหน้าจอเริ่มการใช้งานซอฟต์แวร์ดังในรูปที่ 1-5 ซึ่งประกอบด้วยเมนูต่างๆ ดังนี้!

• New Process เมนูนี้ใช้สำหรับการสร้างโพรเซส (process) ใหม่ ขั้นตอนการทำงานของ RapidMiner Studio เราจะเรียกว่าโพรเซส ซึ่งประกอบด้วยการนำโอเปอเรเตอร์ (operator) ต่างมาเชื่อมต่อกัน!

• Open เมนูนี้ใช้สำหรับการเลือกไฟล์ โพรเซส ที่ได้สร้างไว้แล้วกลับมาใช้งานใหม่อีกครั้ง!

• Application Wizard เมนูนี้ใช้สำหรับเปิด โพรเซส ที่ RapidMiner Studio เตรียมไว้ให้!

• Tutorials เมนูนี้ใช้เปิดระบบการสอนที่ RapidMiner Studio เตรียมไว้ให้"

บทที่ 1 แนะนำการใช้งาน RapidMiner Studio 6

!5

2. เริ่มต้นใช้งาน RapidMiner Studio 6"เมื่อเราดาวน์โหลดซอฟต์แวร์มาได้แล้ว การใช้งานให้คลิกที่ไอคอน หลังจากนั้นหน้าต่าง Welcome ของซอฟต์แวร์ RapidMiner Studio 6 จะแสดงขึ้นมาในรูปที่ 1-3!

!!!!!!!!!ในตอนเริ่มต้นใช้งานซอฟต์แวร์จะถามว่าเราจะใช้ RapidMiner Studio ด้วยไลเซนต์แบบไหน ซึ่งมี 2 แบบ คือ Starter และ Professional โดยแบบแรกจะใช้งานได้ฟรีไม่ต้องเสียค่าใช้จ่ายแต่จะมีข้อจำกัดในการดึงข้อมูลจากฐานข้อมูล แต่แบบหลังจะต้องเสียค่าใช้จ่าย สำหรับในหนังสือเล่มนี้ผมจะใช้แบบ Starter ครับซึ่งมีฟีเจอร์เหมือนกันกับระบบ Professional ครับ ดังนั้นเลือก Continue using ‘Starter’ ด้านซ้าย!

!

รูปที่ 1-3 หน้าต่างเริ่มต้นของ RapidMiner Studio 6

รูปที่ 1-4 หน้าต่าง Welcome ของ RapidMiner Studio 6 ให้คลิกที่เมนู Continue using ‘Starter’

1

2

3

4

เอกสิทธิ์ พัชรวงศ์ศักดา http://www.dataminingtrend.com

Page 6: อการเคราะอลวย RapidMiner Studio 6 1 · อการเคราะอลวย RapidMiner Studio 6 1 ในบทผมจะแนะใกการเคราะอลวย=

1-6 ซึ่งสามารถแบ่งเป็นส่วนต่างๆ ได้ 5 ส่วนดังนี้!

• Operators ส่วนนี้จะเก็บโอเปอเรตอร์ในการใช้งานต่างๆ ไว้เป็นกลุ่มๆ ตามหน้าที่ที่คล้ายคลึงกัน เช่น โอเปอเรเตอร์สำหรับการอ่านข้อมูลจากไฟล์ประเภท CSV จะอยู่ในหมวด Import และหมวดย่อย Data นอกจากนี้ในส่วนของโอเปอเรเตอร์นี้ยังมีส่วนสำหรับใช้ในการค้นหาชื่อของโอเปอเรเตอร์ต่างๆ ได้ ซึ่งจะแสดงตัวอย่างให้ดูในหัวข้อ “ตัวอย่างการสร้างโมเดล Decision Tree”"

• Repositories ส่วนนี้จะใช้ในการจัดการไฟล์ต่างๆ หลักการของ RapidMiner Studio นี้จะเก็บไฟล์ข้อมูลหรือโพรเซสต่างๆ ไว้ในโฟลเดอร์เพื่อความสะดวกในการเรียกใช้งานครั้งถัดไป โฟลเดอร์ที่ใช้เก็บไฟล์เหล่านี้จะเรียกว่าเป็น repository"

• Process ส่วนนี้เป็นอีกส่วนที่สำคัญของ RapidMiner Studio เพราะหลักการทำงานของซอฟต์แวร์นี้คือการนำโอเปอเรเตอร์ต่างๆ มาประกอบกันให้เป็นโพรเซสขึ้นมา รายละเอียดดูได้จากหัวข้อ “ตัวอย่างการสร้างโมเดล Decision Tree”!

• Parameters ส่วนนี้จะเป็นส่วนที่แสดงพารามิเตอร์ (parameter) ที่เกี่ยวข้องกับแต่ละโอเปอเรเตอร์ เช่น โอเปอเรเตอร์ Read CSV สำหรับอ่านไฟล์ CSV จะมีพารามิเตอร์ที่เกี่ยวข้อง เช่น ตำแหน่งของไฟล์ CSV เป็นต้น!

• Help ส่วนนี้จะเป็นส่วนที่แสดงข้อความช่วยเหลือหรือรายละเอียดของโอเปอเรเตอร์ที่เลือกใช้งานอยู่ ซึ่งประกอบด้วยรายละเอียดเบื้องต้น ความหมายของแต่ละพารามิเตอร์ เป็นต้น!

!!!!!!!!!!!!!3. องค์ประกอบของ RapidMiner Studio 6"

เมื่อเราคลิกที่เมนู New Process แล้วจะเข้าสู่หน้าจอการออกแบบ (design perspective) ของซอฟต์แวร์ RapidMiner Studio 6 ดังในรูปที่

!6

เอกสิทธิ์ พัชรวงศ์ศักดา http://www.dataminingtrend.com

รูปที่ 1-5 หน้าต่างเริ่มต้นการใช้งานของ RapidMiner Studio 6

1

2

3

4

1

2

3

4

5

คู่มือการวิเคราะห์ข้อมูลด้วย RapidMiner Studio 6

Page 7: อการเคราะอลวย RapidMiner Studio 6 1 · อการเคราะอลวย RapidMiner Studio 6 1 ในบทผมจะแนะใกการเคราะอลวย=

บทที่ 1 แนะนำการใช้งาน RapidMiner Studio 6

!7

เอกสิทธิ์ พัชรวงศ์ศักดา http://www.dataminingtrend.com

1

2

3

4

5

รูปที่ 1-6 แสดงองค์ประกอบต่างๆ ของ RapidMiner Studio 6

http://dataminingtrend.com

Page 8: อการเคราะอลวย RapidMiner Studio 6 1 · อการเคราะอลวย RapidMiner Studio 6 1 ในบทผมจะแนะใกการเคราะอลวย=

ส่วนทางด้านขวามือจะเป็นเมนูสำหรับเปลี่ยนหน้าจอ (perspective) ลักษณะต่างๆ (รูปที่ 1-7) ซึ่งแต่ละเมนูทำหน้าที่ดังนี้!

!!

!!

• แสดงหน้าจอกลับไปที่หน้าจอเริ่มต้น (Home) เช่น ในรูปที่ 1-5!

• แสดงหน้าจอการออกแบบ (design perspective) เช่น ในรูปที่ 1-6!

• แสดงหน้าจอผลลัพธ์การทำงาน (results perspective)!

• แสดงหน้าจอตัวอย่างที่กำหนดไว้ (wizard perspective)!

มาถึงตอนนี้เราก็ได้รู้จักองค์ประกอบต่างๆ ของซอฟต์แวร์ RapidMiner Studio 6 กันไปบ้างแล้วนะครับ ผมจะพยายามแทรกคำอธิบายของส่วนต่างๆ เพิ่มเติมเข้าไปในตอนที่เราใช้งานจริงๆ ครับ ถัดไปเราจะมาเริ่มใช้งาน RapidMiner Studio 6 เพื่อสร้างโมเดลด้วยเทคนิค Decision Tree กันแล้วครับ พร้อมหรือยังครับ ;)

!8

นอกจากทั้ง 5 ส่วนใหญ่ๆ ที่ได้อธิบายไปแล้วยังมีส่วนเมนูด้านบนเพิ่มเติมดังนี้!

• เมนูสำหรับการสร้างโพรเซสใหม่!

• เมนูสำหรับการโหลดไฟล์ต่างๆ จาก repository"

• เมนูสำหรับการบันทึกโพรเซส"

• เมนูสำหรับบันทึกโพรเซสเป็นชื่อใหม่!

• เมนูสำหรับพิมพ์โพรเซสออกทางเครื่องพิมพ์หรือบันทึกเป็นไฟล์ รูปภาพ!

• เมนูสำหรับการทำ Undo!

• เมนูสำหรับการทำ Redo!

• เมนูสำหรับสั่งให้โพรเซสทำงาน (run process)!

• เมนูสำหรับหยุดการทำงานโพรเซสชั่วคราว (pause)!

• เมนูสำหรับยกเลิกการทำงานโพรเซส (stop)!

• เมนูสำหรับการเรียกดู tutorial!

เอกสิทธิ์ พัชรวงศ์ศักดา http://www.dataminingtrend.com

1 2 3 4

1

2

3

4

รูปที่ 1-7 เมนูสำหรับเปลี่ยนหน้าจอ

คู่มือการวิเคราะห์ข้อมูลด้วย RapidMiner Studio 6

Page 9: อการเคราะอลวย RapidMiner Studio 6 1 · อการเคราะอลวย RapidMiner Studio 6 1 ในบทผมจะแนะใกการเคราะอลวย=

!!! ลากโอเปอเรเตอร์ Read CSV มาวางในส่วน Main Process ดังแสดงในรูปที่ 1-9 เมื่อไปคลิกที่โอเปอเรเตอร์นี้จะเห็นว่ามีขอบสีส้มแสดงที่กรอบซึ่งหมายความว่าโอเปอเรเตอร์นี้ถูกเลือกอยู่และส่วนของพารามิเตอร์ที่อยู่ทางด้านขวาจะเปลี่ยนไปแสดงพารามิเตอร์ที่เกี่ยวข้องกับโอเปอเรเตอร์ Read CSV

บทที่ 1 แนะนำการใช้งาน RapidMiner Studio 6

!9

4. ตัวอย่างการสร้างโมเดล Decision Tree"

ในหัวข้อนี้ผมจะแนะนำการใช้งาน RapidMiner Studio 6 เบื้องต้นเพื่อสร้างโมเดลการจำแนกประเภทข้อมูล (classification) โดยใช้เทคนิคที่เรียกว่า Decision Tree ครับ เทคนิคนี้เป็นที่นิยมใช้เนื่องจากโมเดลที่สร้างได้สามารถแปลความหมายออกมาได้ง่ายกว่าโมเดลอื่นๆ ผมจะอธิบายไปทีละขั้นตอนและถ้าส่วนไหนมีความรู้เพิ่มเติมที่ควรทราบผมก็จะอธิบายเพิ่มในส่วน “ข้อมูลเพิ่มเติม (More Information)” ครับ เรามาเริ่มกันเลยดีกว่านะครับ!

เปิดหน้าจอการออกแบบและเลือกโอเปอเรเตอร์ชื่อว่า Read CSV ที่ใช้สำหรับการอ่านไฟล์ประเภท CSV (Comma Separated Values) ซึ่งคือไฟล์ที่มีเครื่องหมาย comma คั่นระหว่างแอตทริบิวต์ (ดูความหมายของแอตทริบิวต์และตัวอย่างได้ที่ ข้อมูลเพิ่มเติม 1-1) โอเปอเรเตอร์นี้อยู่ในหมวด Import และ Data ดังในรูปที่ 1-8!

เอกสิทธิ์ พัชรวงศ์ศักดา http://www.dataminingtrend.com

1

รูปที่ 1-8 เลือกโอเปอเรเตอร์ Read CSV สำหรับอ่านไฟล์ประเภท CSV

ข้อสังเกตุ (Hint)บางครั้งเราจะพบว่าชื่อของโอเปอเรเตอร์เป็นสีเขียวแทนที่จะเป็นสีดำเพราะว่าโอเปอเรเตอร์นั้นมีการใช้งานบ่อยๆ

2

รูปที่ 1-9 ลากโอเปอเรเตอร์ Read CSV มาวางในส่วน Main Process

3

Page 10: อการเคราะอลวย RapidMiner Studio 6 1 · อการเคราะอลวย RapidMiner Studio 6 1 ในบทผมจะแนะใกการเคราะอลวย=

เมื่อเลือกไฟล์และกดปุ่ม Next แล้วจะเข้าสู่ขั้นตอนถัดไปซึ่งจะแสดง option ต่างๆ ให้เราเลือกเช่น ถ้าต้องการใช้ไฟล์ที่มีภาษาไทยจะต้องเปลี่ยน File Encoding ให้เป็นประเภท UTF-8 (เราจะดูรายละเอียดการนำข้อมูลเข้าในบทที่ 2 เรื่องการเตรียมข้อมูล) แต่ในบทนี้เราจะใช้ค่าเดิมของ File Encoding แต่จะเปลี่ยนส่วน Column Separator ให้เป็น Comma “,” แทน ดังในรูปที่ 1-11 หลังจากนั้นกดปุ่ม Next เพื่อไปขั้นถัดไป

!10

คลิกที่ปุ่ม Import Configuration Wizard … (ดังในรูปที่ 1-9) เพื่อทำการอ่านไฟล์ CSV เข้ามาใช้งานใน RapidMiner Studio 6 หลังจากคลิกที่ปุ่มแล้วจะต้องเลือกไฟล์ CSV ที่จะใช้งานดังในรูปที่ 1-10 (ดาวน์โหลดไฟล์ของบทนี้ได้ที่ http://dataminingtrend.com/2014/rapidminer-studio-6/chapter1/ และดูรายละเอียดของข้อมูลชุดนี้จาก ข้อมูลเพิ่มเติม 1-3) !

!!!!!!!!!!!!

เอกสิทธิ์ พัชรวงศ์ศักดา http://www.dataminingtrend.com

3 4

รูปที่ 1-10 เลือกไฟล์ประเภท CSV ที่ต้องการใช้งาน

รูปที่ 1-11 เลือกใช้ตัวคั่นเป็นเครื่องหมายคอมม่า (comma)

คู่มือการวิเคราะห์ข้อมูลด้วย RapidMiner Studio 6

Page 11: อการเคราะอลวย RapidMiner Studio 6 1 · อการเคราะอลวย RapidMiner Studio 6 1 ในบทผมจะแนะใกการเคราะอลวย=

!11

ข้อมูลเพิ่มติม 1-1 เรื่องของแอตทริบิวต์ในหัวข้อนี้จะแนะนำคำศัพท์เกี่ยวกับข้อมูลที่นำเข้ามาใช้งานใน RapidMiner Studio 6 โดยปกติแล้วข้อมูลที่เรามักจะนำมาวิเคราะห์จะอยู่ในรูปแบบของตารางดังในรูปด้านล่างนี้!

!!!!!ในแต่ละคอลัมน์ของตารางนี้จะเรียกว่า แอตทริบิวต์ (attribute) และแต่ละแถวของตารางจะเรียกว่า ตัวอย่าง (example) เราสามารถแบ่งแยกแอตทริบิวต์ออกตามหน้าที่การใช้งานได้เป็น 2 แบบหลักคือ!

1. แอตทริบิวต์ทั่วไป (attribute) เป็นแอตทริบิวต์ปกติที่จะใช้ในการสร้างโมเดลหรือเรียกว่าเป็น ฟีเจอร์ (feature) หรือตัวแปรต้น (independent variable)!

2. ลาเบล (label) แบบนี้จะเป็นแอตทริบิวต์ขนิดพิเศษที่มักจะใช้แสดงคำตอบของสิ่งที่เราต้องการจะสร้างโมเดลมาทำนาย หรือ เรียกว่า คลาส (class) หรือตัวแปรตาม (dependent variable)

outlook humidity windy playsunny high FALSE nosunny high TRUE no

overcast high FALSE yesrainy high FALSE yes

แอตทริบิวต์ทั่วไป ลาเบล

ในขั้นตอนนี้เราสามารถเลือกได้ว่าจะให้แถวแรกเป็นชื่อของแอตทริบิวต์ หรือไม่โดยการคลิกที่ Name ที่อยู่ในคอลัมน์ Annotation ดังในรูปที่ 1-12 ซึ่งโดยปกติแล้วก็จะถูกเลือกไว้อยู่แล้ว ดังนั้นในขั้นตอนนี้สามารถกดปุ่ม Next ต่อไปได้เลย

5

รูปที่ 1-12 แสดงขั้นตอนการเลือกแถวแรกให้เป็นชื่อแอตทริบิวต์

บทที่ 1 แนะนำการใช้งาน RapidMiner Studio 6เอกสิทธิ์ พัชรวงศ์ศักดา http://www.dataminingtrend.com

Page 12: อการเคราะอลวย RapidMiner Studio 6 1 · อการเคราะอลวย RapidMiner Studio 6 1 ในบทผมจะแนะใกการเคราะอลวย=

!12

ถัดมาจะเป็นส่วนของการกำหนดประเภทของข้อมูลที่อยู่ในแต่ละแอตทริบิวต์และประเภทของแต่ละแอตทริบิวต์ ดังแสดงในรูปที่ 1-13 โดย 3 แถวแรกจะเป็นตัวกำหนดค่าต่างๆ ดังนี้!

1. แถวแรกของตารางจะเป็นชื่อของแอตทริบิวต์ ซึ่งเราสามารถพิมพ์เพื่อเปลี่ยนชื่อได้!

2. แถวที่สองแสดงประเภทของข้อมูลที่เก็บอยู่ในแต่ละแอตทริบิวต์ เช่น real สำหรับตัวเลข หรือ polynominal สำหรับค่านอมินอล (nominal) ที่มีค่าที่แตกต่างกันตั้งแต่ 2 ค่าขึ้นไป!

3. แถวที่สามแสดงประเภทของแอตทริบิวต์ ซึ่งส่วนใหญ่จะเป็น แอตทริบิวต์และลาเบล (ดูรายละเอียดได้จาก ข้อมูลเพิ่มเติม 1-1)!

ในตัวอย่างนี้เราจะกำหนดให้แอตทริบิวต์ play เป็นประเภทลาเบลเพื่อใช้เป็นคลาสคำตอบที่โมเดล Decision Tree ของเราต้องการทำนาย หลังจากนั้นกดปุ่ม Finish ก็จะกลับสู่หน้าจอการออกแบบอีกครั้ง!

สำหรับการสร้างโมเดล Decision Tree ทำได้โดยการเลือกโอเปอเรเตอร์ Decision Tree จากส่วนของ Operators เราสามารถหาโอเปอเรเตอร์นี้ได้โดยการพิมพ์คำว่า Decision Tree ในส่วนของการค้นหา (search) และกดปุ่ม Enter หลังจากนั้นโปเปอเรเตอร์ Decision Tree จะแสดงดังในรูปที่ 1-14 หรือจะเลือกจากหมวด Modeling > Classification and Regression > Tree Induction ก็ได้ครับ!

ลากโอเปอเรเตอร์ Decision Tree มาวางในส่วนของ Main Process และลากเส้นเชื่อมจากพอร์ตที่ชื่อว่า out (ซึ่งย่อมาจากคำว่า output) ของโอเปอเรเตอร์ Read CSV ไปยังพอร์ตที่ชื่อว่า tra (ย่อมาจากคำว่า training) ของ Decision Tree เพื่อเป็นการส่งข้อมูลไปสร้างโมเดลดังในรูปที่ 1-15

เอกสิทธิ์ พัชรวงศ์ศักดา http://www.dataminingtrend.com

6

รูปที่ 1-13 แสดงขั้นตอนการเลือกประเภทของแอตทริบิวต์7

รูปที่ 1-14 แสดงโอเปอเรเตอร์ Decision Tree

8

คู่มือการวิเคราะห์ข้อมูลด้วย RapidMiner Studio 6

12

3

http://dataminingtrend.com

1

2

3

Page 13: อการเคราะอลวย RapidMiner Studio 6 1 · อการเคราะอลวย RapidMiner Studio 6 1 ในบทผมจะแนะใกการเคราะอลวย=

!!!!!!!!! หลังจากนั้นลากเส้นเชื่อมจากพอร์ต mod (ย่อมาจาก model) และพอร์ต exa (ย่อมาจาก example) ของโอเปอเรเตอร์ Decsion Tree ไปยังพอร์ต res (ย่อมาจาก result) ทั้งสองพอร์ตของ Main Process เพื่อไปแสดงในส่วนของหน้าจอผลลัพธ์โดยพอร์ต mod จะทำส่งโมเดล Decision Tree ที่สร้างได้ออกไปแสดงในรูปต้นไม้ และพอร์ exa จะส่งข้อมูลจากไฟล์ CSV ไปแสดงในรูปแบบตาราง (ดูรายละเอียดเกี่ยวกับโอเปอเรเตอร์ของ RapidMiner Studio 6 ได้จากข้อมูลเพิ่มเติม 1-2)!

กดปุ่ม เพื่อเริ่มต้นการทำงานของโพรเซสนี้ ผลที่ได้จะแสดงในหน้าจอผลลัพธ์การทำงาน ดังในรูปที่ 1-16 ถึง 1-18

บทที่ 1 แนะนำการใช้งาน RapidMiner Studio 6

!13

เอกสิทธิ์ พัชรวงศ์ศักดา http://www.dataminingtrend.com

รูปที่ 1-15 การเชื่อมต่อระหว่างโอเปอเรเตอร์ Read CSV และ Decision Tree

8

9

9

10

ข้อมูลเพิ่มเติม 1-2 เรื่องของโอเปอเรเตอร์ใน RapidMiner Studio 6"

ในซอฟต์แวร์ RapidMiner Studio 6 จะใช้หลักการของการสร้างโพรเซสเป็นหลัก โดยในขั้นตอนการสร้างโพรเซสนั้นคือการนำโอเปอเรเตอร์หลายๆ ตัวมาเชื่อมต่อกัน ดังนั้นในหัวข้อนี้จะแนะนำให้ท่านผู้อ่านรู้จักกับโอเปอเรเตอร์ของ RapidMiner Studio ดังนี้ครับ!

!!

!• ส่วนบนสุดของโอเปอเรเตอร์คือชื่อของโอเปอเรเตอร์!

• พอร์ตที่อยู่ทางด้านซ้ายจะเป็น พอร์ตอินพุท (input port) สำหรับรับข้อมูลจากโอเปอเรเตอร์อื่นๆ พอร์ตนี้อาจจะมีมากกว่า 1 พอร์ตได้!

• พอร์ตที่อยู่ทางด้านขวาจะเป็น พอร์ตเอาท์พุท (output port) สำหรับส่งข้อมูลไปยังโอเปอเรเตอร์อื่นๆ พอร์ตนี้อาจจะมีมากกว่า 1 พอร์ตได้!

• ชื่อของแต่ละพอร์ตจะเป็นอักษร 3 ตัวแรกของชื่อพอร์ต เช่น out ย่อมาจาก output

http://dataminingtrend.com

Page 14: อการเคราะอลวย RapidMiner Studio 6 1 · อการเคราะอลวย RapidMiner Studio 6 1 ในบทผมจะแนะใกการเคราะอลวย=

!!!!!!!!!!เมื่อโพรเซสทำงานเสร็จสิ้นจะเปลี่ยนมายังหน้าจอผลลัพธ์การทำงาน (ดังในรูปที่ 1-16) ซึ่งผลที่ได้จากโพเซสที่เราสร้างจะแสดง 3 แท็บ (tab) คือ !

• Result Overview แสดงรายการผลลัพธ์การทำงานที่ผ่านมา"

• ExampleSet (Read CSV) แสดงตารางข้อมูลที่มาจากไฟล์โดยใช้โอเปอเรเตอร์ Read CSV"

• Tree (Decision Tree) แสดงโมเดล Decision Tree ที่สร้างได้จากโอเปอเรเตอร์ Decision Tree ในรูปแบบภาพ"

!14

เอกสิทธิ์ พัชรวงศ์ศักดา http://www.dataminingtrend.com

ข้อมูลเพิ่มเติม 1-2 (ต่อ)"

• สัญลักษณ์วงกลมที่ด้านซ้ายล่างจะแสดงสถานะของโอเปอเรเตอร์ โดยจะมี 3 สี คือ !

• สีแดง แสดงสถานะว่าโอเปอเรเตอร์เกิดปัญหาหรือยังไม่สามารถทำงานได้"

• สีเหลือง แสดงสถานะว่าโอเปอเรเตอร์ได้พร้อมที่จะทำงานไม่มีปัญหาเกิดขึ้น"

• สีเขียว แสดงสถานะว่าโอเปอเรเตอร์นั้นได้ทำงานเสร็จเรียบร้อยแล้ว"

• โดยปกติกรอบของโอเปอเรเตอร์จะเป็นสีดำ แต่ถ้ากรอบเป็นสีส้มแสดงว่าโอเปอเรเตอร์นั้นได้ถูกเลือกอยู่

จากรูปที่ 1-16 จะแสดงตารางข้อมูลที่อ่านมาจากไฟล์ CSV และใช้ในการสร้างโมเดล Decision Tree นอกจากนี้ในหน้าจอนี้ยังมีอีกหลายส่วนซึ่งจะอธิบายอย่างละเอียดในบทที่ 2 การเตรียมข้อมูล แต่ในบทนี้จะขออธิบายส่วนสำคัญหลักๆ 4 ส่วนดังนี้ครับ!

• แสดงจำนวนตัวอย่างและแอตทริบิวต์ที่ปรากฏในข้อมูลซึ่งในไฟล์ตัวอย่างนี้มีจำนวน 14 ตัวอย่าง 1 แอตทริบิวต์ลาเบลและ 4 แอตทริบิวต์ทั่วไป"

• ส่วนการกรองข้อมูล (filter) ซึ่งมีให้เลือกได้ว่าจะดูข้อมูลทั้งหมด หรือข้อมูลที่มีความผิดพลาดอยู่ เป็นต้น!

• ในส่วนของตารางนี้เราสามารถคลิกที่ชื่อแอตทริบิวต์เพื่อทำการเรียงลำดับข้อมูลได้ โดยตารางข้อมูลจะแบ่งแอตทริบิวต์ออกเป็น 2 แบบ คือ!

• แอตทริบิวต์ที่เป็นลาเบลแสดงด้วยคอลัมน์สีเขียว!

• แอตทริบิวต์ทั่วไปแสดงด้วยคอลัมน์ที่เป็นสีเทา !

• แสดงค่าสรุปทางสถิติของแอตทริบิวต์ต่างๆ เมื่อคลิกที่ไอคอนนี้แล้วหน้าจอจะเปลี่ยนไปแสดงดังในรูปที่ 1-17 ซึ่งแสดงค่าทางสถิติของข้อมูลที่อยู่ในแต่ละแอตทริบิวต์ โดยจะแสดงชื่อ ประเภทของข้อมูลที่เก็บอยู่ กราฟแสดงค่าความถี่ของค่าข้อมูลในแต่ละแอตทริบิวต์ (รายละเอียดติดตามได้ในบทที่ 2 การเตรียมข้อมูล)!

!!

1

2

3

4

คู่มือการวิเคราะห์ข้อมูลด้วย RapidMiner Studio 6

Page 15: อการเคราะอลวย RapidMiner Studio 6 1 · อการเคราะอลวย RapidMiner Studio 6 1 ในบทผมจะแนะใกการเคราะอลวย=

บทที่ 1 แนะนำการใช้งาน RapidMiner Studio 6

!15

เอกสิทธิ์ พัชรวงศ์ศักดา http://www.dataminingtrend.com

รูปที่ 1-16 แสดงข้อมูลที่นำมาใช้ในหน้าจอแสดงผลลัพธ์การทำงาน

ลาเบล แอตทริบิวต์ทั่วไป

1

42

3

http://dataminingtrend.com

Page 16: อการเคราะอลวย RapidMiner Studio 6 1 · อการเคราะอลวย RapidMiner Studio 6 1 ในบทผมจะแนะใกการเคราะอลวย=

!16

เอกสิทธิ์ พัชรวงศ์ศักดา http://www.dataminingtrend.com

รูปที่ 1-17 แสดงค่าทางสถิติของแต่ละแอตทริบิวต์ในหน้าจอแสดงผลลัพธ์การทำงาน

http://dataminingtrend.com

คู่มือการวิเคราะห์ข้อมูลด้วย RapidMiner Studio 6

Page 17: อการเคราะอลวย RapidMiner Studio 6 1 · อการเคราะอลวย RapidMiner Studio 6 1 ในบทผมจะแนะใกการเคราะอลวย=

บทที่ 1 แนะนำการใช้งาน RapidMiner Studio 6

!17

เมื่อทำการคลิกที่แท็บ Tree (Decision Tree) โมเดลของ Decision Tree ที่สร้างได้จะปรากฏขึ้นมาดังแสดงในรูปที่ 1-18 โดยในแท็บนี้ส่วนสำคัญที่ขออธิบาย 3 ส่วนดังนี้ครับ!

• ในโมเดล Decision Tree จะมีโหนดต่างๆ อยู่ 2 ประเภทคือ !

• โหนดที่เป็นแอตทริบิวต์แสดงด้วยรูปสี่เหลี่ยมที่มีมุมโค้ง!

• โหนดลาเบลแสดงด้วยรูปสี่เหลี่ยมที่มีกราฟแท่งแสดงสีต่างๆ อยู่ด้วย ในตัวอย่างนี้มี 2 ลาเบล คือ Yes และ No ถ้าโมเดลตอบว่าเป็น Yes จะมีกราฟสีแดงปรากฏอยู่และ No จะมีกราฟสีนำ้เงินปรากฏอยู่ด้วย!

• ส่วนของ Mode จะใช้สำหรับปรับโหมดของการใช้งานเมาส์ ซึ่งมี 2 โหมด คือ!

• Transform mode โดยโหมดนี้เป็นการใช้เมาส์ในการเลื่อนตำแหน่งของ Decision Tree ทั้งต้น"

• Picking mode โดยโหมดนี้เป็นการใช้เมาส์เพื่อทำการลากโหนดที่ต้องการเพื่อขยายให้ Decision Tree ดูได้ง่ายขึ้น!

• ส่วนของการบันทึกโมเดลออกเป็นรูปภาพ โดยสามารถเลือกได้ว่าจะบันทึกเป็นไฟล์รูปภาพประเภทไหน เช่น PNG หรือ PDF ดังแสดงในรูปที่ 1-19 และโมเดลที่บันทึกได้ในรูปที่ 1-20

เอกสิทธิ์ พัชรวงศ์ศักดา http://www.dataminingtrend.com

ข้อสังเกตุ (Hint)ในโมเดล Decision Tree จะพบว่ามีโหนดที่เป็นคำตอบหรือลาเบลซึ่งมีกราฟแท่งสีต่างๆ ปรากฏอยู่ตามแต่ละลาเบล ความสูงของกราฟแท่งนี้แสดงจำนวนตัวอย่างในข้อมูลที่มีเงื่อนไขตามกิ่งของ Decision Tree เช่น จำนวนตัวอย่างที่แอตทริบิวต์ Overlook มีค่าเป็น Overcast และแอตทริบิวต์ Play เป็น Yes มีเยอะสังเกตุได้จากความสูงของกราฟแท่งหนากว่าโหนดที่เป็นลาเบลอื่นๆ นอกจากนี้เราสามารถดูจำนวนตัวอย่างได้โดยการนำเมาส์ไปวางที่โหนดลาเบล

ข้อมูลเพิ่มเติม 1-3 ข้อมูล weather "

ในบทนี้เราได้ลองสร้างโมเดล Decision Tree ด้วยซอฟต์แวร์ RapidMiner Studio 6 มาจนสำเร็จแล้วครับ ก่อนที่จะจบบทนี้ผมขอแนะนำรายละเอียดของข้อมูลไฟล์ CSV ให้ท่านผู้อ่านได้ทราบสักเล็กน้อยครับ ไฟล์ตัวอย่าง CSV นี้เป็นข้อมูลมาตรฐานที่ดาวน์โหลดมาจากเว็บไซต์ UCI Machine Learning Repository (http://archive.ics.uci.edu/ml/) ซึ่งมีชื่อว่า weather ครับ ข้อมูลชุดนี้เกิดจากการเก็บข้อมูลสภาพภูมิอากาศในแต่ละวันและแอตทริบิวต์สุดท้ายคือในวันนั้นมีการจัดแข่งขันเบสบอลหรือไม่ ฉะนั้นแอตทริบิวต์ที่เป็นลาเบลจะมีอยู่ 2 ค่า คือ Yes และ No

Page 18: อการเคราะอลวย RapidMiner Studio 6 1 · อการเคราะอลวย RapidMiner Studio 6 1 ในบทผมจะแนะใกการเคราะอลวย=

!18

เอกสิทธิ์ พัชรวงศ์ศักดา http://www.dataminingtrend.com

รูปที่ 1-18 แสดงโมเดล Decision Treeในหน้าจอแสดงผลลัพธ์การทำงาน

http://dataminingtrend.com

12

3

คู่มือการวิเคราะห์ข้อมูลด้วย RapidMiner Studio 6

Page 19: อการเคราะอลวย RapidMiner Studio 6 1 · อการเคราะอลวย RapidMiner Studio 6 1 ในบทผมจะแนะใกการเคราะอลวย=

บทที่ 1 แนะนำการใช้งาน RapidMiner Studio 6

!19

เอกสิทธิ์ พัชรวงศ์ศักดา http://www.dataminingtrend.com

รูปที่ 1-19 บันทึกโมเดล Decision Tree เป็นไฟล์ภาพประเภทต่างๆ

รูปที่ 1-20 โมเดล Decision Tree ที่บันทึกได้

5. เอกสารอ้างอิง"• Foster Provost and Tom Fawcett, Data Science for

Business What you need to know about data mining and data-analytic thinking, O'Reilly Media, July 2013!

• Rapid-I, RapidMiner 5.0 Manual, 2010!!ท่านผู้สนใจสามารถติดตามหลักสูตรอบรมการวิเคราะห์ข้อมูลด้วยดาต้า ไมน์นิงได้ที่ http://dataminingtrend.com!!หมายเหตุ"บทความนี้ยินดีให้แจกจ่ายหรือส่งต่อได้แต่ขอสงวนลิขสิทธิ์ ตาม พ.ร.บ. ลิขสิทธิ์ พ.ศ. 2537 ห้ามลอกเลียนแบบไม่ว่าส่วนหนึ่งส่วนใดของหนังสือ/เอกสารเล่มนี้ นอกจากจะได้รับอนุญาติเป็นลายลักษณ์อักษร!!

เอกสิทธิ์ พัชรวงศ์ศักดา!หสม. ดาต้า คิวบ์!

[email protected]!http://facebook.com/datacube.th!http://www.dataminingtrend.com

Page 20: อการเคราะอลวย RapidMiner Studio 6 1 · อการเคราะอลวย RapidMiner Studio 6 1 ในบทผมจะแนะใกการเคราะอลวย=

คู่มือการวิเคราะห์ข้อมูลด้วย

RapidMiner Studio 6

1