28
249 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน บทที่ 11 การประมวลผลการวิเคราะหขอมูลแบบออนไลน วัตถุประสงค ทําความเขาใจเกี่ยวกับความตองการในการประมวลผลการวิเคราะหขอมูลแบบออนไลน ศึกษาเกี่ยวกับนิยามและกฎตางๆของการประมวลผลการวิเคราะหขอมูลแบบออนไลน ศึกษาเกี่ยวกับคุณลักษณะและฟงกชันการทํางานของการประมวลผลการวิเคราะหขอมูลออนไลน ศึกษาเกี่ยวกับการวิเคราะหขอมูลที่กระทําจากการประมวลผลการวิเคราะหขอมูลแบบออนไลน ศึกษาเกี่ยวกับโมเดลตางๆและสถาปตยกรรมของโมเดลสําหรับสรางระบบการประมวลผลการ วิเคราะหขอมูลแบบออนไลน เนื้อหาของบทเรียน เนื้อหาในบทนี้จะประกอบดวย ความตองการในการประมวลผลการวิเคราะหขอมูลแบบออนไลน นิยามและกฎตางๆของ OLAP ฟงกชันและคุณลักษณะหลักของ OLAP โมเดลตางๆของ OLAP ปจจัยที่ตอง พิจารณาในการสรางระบบ OLAP กิจกรรมการเรียนการสอน อธิบายพรอมยกตัวอยางประกอบ ศึกษาจากเอกสารประกอบการสอน ฝกปฏิบัติการตามที่มอบหมาย ทําแบบฝกหัดทายบท อุปกรณที่ใชในการเรียน-การสอน เอกสารประกอบการสอน เครื่องคอมพิวเตอร เครื่องฉายภาพสไลด การวัดและประเมินผล การตอบคําถามระหวางการเรียน-การสอน การทําแบบฝกหัดยอยทายบท การตรวจงานตามที่มอบหมาย

บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

249 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน

บทที่ 11 การประมวลผลการวิเคราะหขอมูลแบบออนไลน

วัตถุประสงค

ทําความเขาใจเกี่ยวกับความตองการในการประมวลผลการวิเคราะหขอมูลแบบออนไลน

ศึกษาเก่ียวกับนิยามและกฎตางๆของการประมวลผลการวิเคราะหขอมูลแบบออนไลน

ศึกษาเก่ียวกับคุณลักษณะและฟงกชันการทํางานของการประมวลผลการวิเคราะหขอมูลออนไลน

ศึกษาเก่ียวกับการวิเคราะหขอมูลที่กระทําจากการประมวลผลการวิเคราะหขอมูลแบบออนไลน

ศึกษาเกี่ยวกับโมเดลตางๆและสถาปตยกรรมของโมเดลสําหรับสรางระบบการประมวลผลการ

วิเคราะหขอมูลแบบออนไลน

เนื้อหาของบทเรียน

เนื้อหาในบทนี้จะประกอบดวย ความตองการในการประมวลผลการวิเคราะหขอมูลแบบออนไลน

นิยามและกฎตางๆของ OLAP ฟงกชันและคุณลักษณะหลักของ OLAP โมเดลตางๆของ OLAP ปจจัยที่ตอง

พิจารณาในการสรางระบบ OLAP

กิจกรรมการเรียนการสอน

อธิบายพรอมยกตัวอยางประกอบ

ศึกษาจากเอกสารประกอบการสอน

ฝกปฏิบัติการตามท่ีมอบหมาย

ทําแบบฝกหัดทายบท

อุปกรณที่ใชในการเรียน-การสอน

เอกสารประกอบการสอน

เครื่องคอมพิวเตอร

เครื่องฉายภาพสไลด

การวัดและประเมินผล

การตอบคําถามระหวางการเรียน-การสอน

การทําแบบฝกหัดยอยทายบท

การตรวจงานตามที่มอบหมาย

Page 2: บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

250 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน

จากบทกอนๆหนา เราจะทราบถึงฟงกชันการทํางานหลักของคลังขอมูลจะประกอบดวย 3 ฟงกชัน

หลักๆ คือ (1) การไดมาซึ่งขอมูล (Data acquisition) (2) การจัดเก็บขอมูล (Data storage) และ (3) การ

เขาถึงหรือการสงผานขอมูล (Information access/delivery) โดยในบทนี้จะกลาวถึงการใชการประมวลผล

การวิเคราะหขอมูลแบบออนไลน (OnLine Analytical Processing, OLAP) ที่เปรียบเสมือนยานพาหนะที่ใช

ในการเขาถึง/สงผานขอมูลไปยังผูใชงาน และจะกลาวถึงคุณลักษณะและฟงกชันการทํางานตางๆ รูปแบบการ

แสดงผล และโมเดลตางๆรวมถึงสถาปตยกรรมของ OLAP ที่จะทําใหเราทราบวาเราควรจะใชโมเดลใดให

เหมาะสมกับสภาวะแวดลอมที่เราเปนอยูมากที่สุด แตกอนที่เราจะทําการศึกษารายละเอียดตางๆของระบบ

OLAP เราควรที่จะเขาใจถึงความตองการในการวิเคราะหแบบออนไลนและความสามารถของ OLAP ในการ

ตอบสนองความตองการเหลานั้นเปนอันดับแรก ซึ่งจะสามารถอธิบายไดดังนี ้

ความตองการในการประมวลผลการวิเคราะหขอมูลแบบออนไลน ในการสรางคลังขอมูลที่สนับสนุนการดําเนินธุรกิจในแตละวัน คลังขอมูลที่เราสรางขึ้นควรที่จะตองมี

ความสามารถในการวิเคราะหขอมูลที่มีความซับซอนไดในเวลาอันรวดเร็ว โดยในปจจุบันการวิเคราะหขอมูลจะ

มีความซับซอนมากขึ้นและการวิเคราะหแบบทั่วไปไมสามารถตอบสนองตอความตองการของผูใชที่มากขึ้นได

อยางครบถวน ลองพิจารณาตัวอยางความตองการของผูใชที่เกี่ยวเนื่องกับธุรกิจคาปลีกขนาดใหญที่ทําการ

พิจารณาขอมูลการขายสินคา ซึ่งโดยปกติของขอมูลการขายสินคาจะเกี่ยวเนื่องกับมิติทางธุรกิจหลายมิติ

ดวยกัน อาทิเชน วันที่มีการขายสินคา รายการสินคาที่ถูกขาย ชองทางการขายสินคา สาขา เขตหรือภูมิภาคที่

มีการขายสินคา โปรโมชั่นตางๆ และอื่นๆ ซึ่งจากมิติที่มีความหลากหลายทําใหผูที่ตองทําการวิเคราะหขอมูล

มักจะไมทําการวิเคราะหขอมูลเพียงแคมิติเดียวแตจะทําการวิเคราะหขอมูลในหลายๆมิติ เชน จํานวนชิ้นสินคา

A ที่ถูกขายในรานตางๆในเมืองเอดิสัน รัฐนิวเจอซี่ยเปนอยางไรบาง หรือรายได/ผลกําไรที่ไดจากการขายสินคา

X ใน 3 เดือนหลังสุด โดยแบงเปนผลกําไรในแตละเดือน ซึ่งรายไดนั้นจะเปนรายไดจากการขายสินคาในเขต

south central โดยทําการแบงผลกําไรตามโปรโมชั่นตางๆ และทายสุดจะตองการขอมูลในเชิงเปรียบเทียบผล

กําไรกับรายการสินคาเดียวกันในรุน(เวอรชั่น)กอนหนา จากคิวรีดังกลาวเราจะเห็นวาการวิเคราะหขอมูลนั้น

ไมไดหยุดเพียงแคการประมวลคิวรีที่เกี่ยวของกับหลายมิติเพียงคิวรีเดียวเทานั้น แตผูใชยังคงถามถึงการ

เปรียบเทียบยอดขายของสินคาเวอรชั่นกอนหนาและรายการสินคา X เทียบกับมิติอื่นๆดวย ซึ่งจากความ

ตองการดังกลาว เราจําเปนที่จะตองทําการหมุนหรือปรับเปลี่ยนขอมูลในแกนคอลัมนและแถวของขอมูล เพื่อ

ทําการแสดงผลลัพธตามที่ผูใชตองการ

จากตัวอยางขางตน เราจะเห็นวาขอมูลที่ตองทําการวิเคราะหนั้นคอนขางมีความซับซอน ดังนั้น ใน

การที่จะวิเคราะหขอมูลไดอยางมีประสิทธิภาพ ผูใชมักตองการวิธีการที่งายสําหรับดําเนินการวิเคราะหขอมูลที่

มีความซับซอนที่เกี่ยวของกับขอมูลทางธุรกิจหลายมิติดวยกัน ผูใชจะตองการเครื่องมือที่จะสามารถ

ปรับเปลี่ยนมุมมองของขอมูลไดหลายมุมมอง และมีความยืดหยุนในการเขาถึงขอมูลอีกดวย โดยในการใชงาน

คลังขอมูลของนักวิเคราะหมักจะตองการวิเคราะหขอมูลหลายๆมิติ และไลไปตามลําดับชั้นตางๆของแอทริบิว

Page 3: บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

251 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน

ในแตละมิติ รวมถึงตองการที่จะไดรับผลรับในหลายๆรูปแบบอีกดวย เชน ตาราง กราฟและชารต ตางๆ ดังนั้น

ถาระบบคลังขอมูลไมมีความสามารถในการวิเคราะหขอมูลหลายๆมิติหรือหลายๆมุมมอง เราจะสามารถกลาว

ไดวาคลังขอมูลที่สรางขึ้นนั้นยังไมสมบูรณ ซึ่งเราจะตองทําการพัฒนาคลังขอมูลตอไป

ในการวิเคราะหขอมูลครั้งหนึ่งๆจะสามารถทําการวิเคราะหโดยการกําหนดคิวรีที่ตองการ จากนั้นสั่ง

ใหระบบคลังขอมูลทําการประมวลผล แลวทําการรอผลลัพธที่จะแสดงทางหนาจอ ซึ่งในบางคิวรีอาจไดผลลัพธ

แบบทันที เนื่องจากทําการยอยขอมูลหรือรวมขอมูลจากผลลัพธของคิวรีกอนหนา การทํางานในลักษณะนี้จะ

ชวยใหเกิดการคํานวณที่รวดเร็ว ลองพิจารณาตัวอยางของการวิเคราะหขอมูลครั้งหนึ่งๆดังแสดงในรูปที่ 11-1

ที่จะเปนการประมวลผลหลายๆคิวรีเรียงตามลําดับ โดยคิวรีเหลานั้นจะมีความเกี่ยวเนื่องของขอมูลกันอยู ซึ่ง

ในการประมวลผลคิวรีเหลานี้จะตองการระบบที่ทําการประมวลผลที่รวดเร็ว ยืดหยุนและสนับสนุนการทํางาน

ที่ซับซอนและการคํานวณที่มีประสิทธิภาพ โดยในการคํานวณหรือประมวลผลครั้งหนึ่งจะประกอบไปดวย

การสรางผลสรุปของขอมูลและรวบยอดขอมูลเหลานั้นตามลําดับชัน้ของขอมูลในมิติตางๆ

การเจาะลึกไปตามลําดับชั้นของขอมูลในแตละมิต ิ

การคํานวณพ้ืนฐาน เชน การคํานวณผลกําไรโดยการนํายอดขายลบดวยตนทุน เปนตน

การใชสมการทางคณิศาสตรดําเนินการกับตัวชี้วัดตางๆ

การหาคาเฉลี่ยและเปอรเซ็นตของการเติบโตในแงมุมตางๆ

การวิเคราะหแนวโนมตางๆโดยใชหลักทางสถิต ิ

จากที่กลาวมาขางตนเราจะทราบถึงความตองการของผูใชในการประมวลคิวรีตางๆที่ซึ่งสามารถ

แบงเปน 3 ขอหลักๆดวยกันคือ 1) ระบบที่ใชสงผานขอมูลจะตองมีความสามารถในการแสดงผลลัพธได

หลายๆมิติในหลายๆมุมมอง 2) ระบบที่ใชสงผานขอมูลจะตองสามารถรองรับวิธีการวิเคราะหขอมูลหลายๆมิติ

และลําดับชั้นของขอมูลตางๆไดหลายวิธี และ 3) ระบบที่ใชสงผานขอมูลจะตองสามารถประมวลผลคิวรีที่

ซับซอนไดอยางรวดเร็ว จากความตองการทั้ง 3 ขอ ถาเราใชเทคโนโลยีที่มีในปจจุบันเชน การใช SQL query

ในการเรียกใชขอมูลจากฐานขอมูล วิธีการนี้จะตองทําการอานขอมูลคอนขางมากเชนการอานขอมูลทั้งตาราง

การทํา multiple join การ grouping และการเรียงลําดับขอมูล ซึ่งจากการทํางานดังกลาวจะใชเวลาคอนขาง

นานมาก

Page 4: บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

252 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน

รูปที่ 11-1 การประมวลผลคิวรีครั้งหนึ่งๆของผูใชงาน

นอกจากการใชภาษา SQL แลว เรายังสามารถแสดงผลของการวิเคราะหหนึ่งๆในรูปแบบสเปรดชีทได

แตอยางไรก็ตาม สเปรดชีทสามารถทําการแสดงผลไดเพียง 2 มิติเทานั้น คือ ในแกนคอลัมน และแถวของ

ขอมูล ซึ่งจากขอจํากัดดังกลาว จึงไดมีผูคิดคนวิธีการแกปญหาการแสดงผลขอมูลใหอยูในรูปแบบของ 3 มิติ

นั่นคือ แกนคอลัมน แถว และเพจของขอมูล ตัวอยางเชน ขอมูลแตละแถวจะแสดงถึงแตละรายการสินคา

ขอมูลแตละคอลัมนจะแสดงถึงรานคาหรือสาขาหนึ่งๆ และเพจหนึ่งๆจะแสดงขอมูลแกนเวลา โดยเราสามารถ

เลือกไดวาขอมูลหนึ่งเพจหมายถึงขอมูลในเดือนหนึ่งๆ เปนตน โดยในปจจุบัน สเปรดชีทใหมๆไดมีการพัฒนา

ใหสามารถแสดงผลไดหลายมิติมากขึ้น โดยถึงแมวาสเปรดชีทจะมีการพัฒนาอยางตอเนื่องแตสเปรดชีทก็ยังคง

ยุงยาก ซึ่งถาเราตองการที่จะทําการวิเคราะหขอมูล 4 มติิ โดยที่แตละมิติจะมีขอมูล 5 ระดับในแตละลําดับชั้น

จากนั้นลองทําการสรางการวิเคราะหขอมูลที่อยูในรูปแบบของสเปรดชีทและทําการแสดงผลในหลายๆมุมมอง

เราจะเห็นวาการวิเคราะหแบบเจาะลึกและแบบผลสรุปของขอมูลสามารถทําไดคอนขางยากอีกดวย

การใช OLAP ในการวิเคราะหขอมูล จากขางตนที่เราจะทราบวาเครื่องมือทั่วๆไปเชน SQL และสเปรดชีทไมสามารถตอบสนองความ

ตองการของผูใชไดอยางครบถวน ดังนั้น ในบทนี้เราจะทําการศึกษาเกี่ยวกับการใชระบบ OLAP ในการ

วิเคราะหขอมูลหลายๆมิติ โดยเมื่อระบบคลังขอมูลมีการใชระบบ OLAP ในการวิเคราะหขอมูล จะทําใหระบบ

คลังขอมูลมีความสามารถดังตอไปนี ้

สามารถมีการจัดระเบียบตัวชี้วัดตางๆใหสอดคลองกับมิติตางๆได

สนับสนุนการวิเคราะหขอมูลในหลายๆแงมุม

มีความสามารถในการวิเคราะหขอมูลแบบเจาะลึกและแบบผลสรุปในแตละมิตทิางธุรกิจ

Page 5: บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

253 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน

สามารถนําสูตรคํานวณทางคณิตศาสตรมาประยุกตใชในการคํานวณตางๆได

สามารถทํางานไดรวดเร็ว

เปนสวนเติมเต็มของระบบการวิเคราะหขอมูลอื่นๆ เชน การทําเหมืองขอมูล (Data mining)

สามารถเพิ่มความเขาใจเกี่ยวกับผลลัพธโดยการแสดงผลโดยใชกราฟและชารตตางๆ

สามารถทํางานบนเว็บได

สามารถทํางานแบบโตตอบทันทีได

จากประโยชนของการประยุกตใชระบบ OLAP ขางตน ระบบ OLAP จะมีจุดแข็งอยางหนึ่งในการ

ทํางานดังแสดงในรูปที่ 11-2 ที่จะแสดงถึงการวิเคราะหขอมูลแบบตอเนื่อง โดยการวิเคราหขอมูลจะเริ่มจาก

การวิเคราะหขอมูลที่คอนขางจะเปนผลสรุป นั่นคือ ยอดขายทั้งหมดของแตละรายการสินคา จากนั้นผูใชอาจ

ทําการเจาะลึกลงไปตามรายละเอียดตามป โดยการแยกยอดขายสินคาออกตามปหนึ่งๆ หรือเราสามารถ

ปรับเปลี่ยนมุมมองของการวิเคราะหได โดยทําการเปลี่ยนปมาเปนแถว และรายการสินคามาเปนคอลัมนเพื่อ

ทําการเรียกดูผลสรุปของขอมูลที่งายขึ้นได ซึ่งจากความสามารถในการทํางานดังกลาวจะชวยใหระบบ

คลังขอมูลสามารถวิเคราะหขอมูลตามที่ผูใชตองการภายในเวลาอันรวดเร็วได

รูปที่ 11-2 ตัวอยางการใชงาน OLAP ครั้งหนึ่งๆ

Page 6: บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

254 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน

นิยามและกฎตางๆของOLAP ระบบ OLAP ตั้งอยูบนพื้นฐานของการวิเคราะหขอมูลหลายมิติไดถูกคิดคนขึ้นโดย Dr. E.F. Codd ใน

ป 1993 ซึ่ง ณ เวลานั้น Dr. Codd ไดทําการนิยามวา“ระบบ OLAP (OnLine Analytical Processing)

นั้นเปนซอรฟแวรชนิดหนึ่งที่ทําใหนักวิเคราะห ผูจัดการ และผูบริหารสามารถเขาถึงขอมูลไดอยางรวดเร็ว

โดยในการเขาถึงขอมูลจะสามารถเขาถึงไดหลายแงมุม โดยขอมูลที่ถูกแสดงผลใหกับผูใชจะเกิดจากแปลง

ขอมูลดิบไปเปนขอมูลในมิติตางๆที่อยูในรูปแบบที่ผูใชสามารถเขาใจได” โดยนอกเหนือจากการนิยาม

ขางตนแลว Dr. Codd ยังไดกําหนดกฎตางๆเกี่ยวกับระบบ OLAP ทั้งสิ้น 12 ขอ โดยกฎเหลานั้น

เปรียบเสมือนกับคูมือในการสรางและใชงานระบบ OLAP โดยกฎทั้ง 12 ขอจะมีรายละเอียดคราวๆดังนี้

1. Multidimensional conceptual view: ระบบ OLAP จะตองมีความสามารถในการสรางโมเดล

ขอมูลในหลายๆมิติที่มีความสามารถในการวิเคราะหและใชงานงาย โดยโมเดลขอมูลหลายมิติที่สราง

ขึ้นจะตองสอดคลองกับสิ่งที่ผูใชอยากรูในการแกปญหาทางธุรกิจ

2. Transparency: ในการสรางระบบ OLAP เราจะตองทําใหผูใชสามารถเห็นสวนประกอบตางๆของ

ระบบได เชน เทคโนโลยีตางๆ พื้นที่สําหรับจัดเก็บขอมูล สถาปตยกรรมการคํานวณ และแหลงขอมูล

เปนตน การเปดเผยขอมูลเหลานี้จะชวยเพิ่มขีดความสามารถใหแกผูใชใหสามารถใชระบบคลังขอมูล

ไดดีข้ึน

3. Acessibility: ระบบ OLAP จะตองทําใหผูใชสามารถเขาถึงขอมูลที่ตองการไดเทานั้น

4. Consistent reporting performance: ระบบ OLAP ควรที่จะตองมีการแจงใหผูใชไดรับรู

เกี่ยวกับเวลาในการประมวลผล หรือการใชทรัพยากรของเครื่องมือทําการประมวลผลคิวรีตางๆ

5. Client/server architecture: ระบบ OLAP ควรที่จะตั้งอยูบนพื้นฐานของสถาปตยกรรม client-

server ที่จะทําใหระบบมีประสิทธิภาพการทํางานที่ดี มีความยืดหยุน มีความสามารถในการปรับตัว

และสามารถทํางานรวมกับระบบอ่ืนๆได

6. Generic dimensionality: เราตองทําใหแนใจวาทุกๆมิติของขอมูลจะมีความสามารถในการ

ดําเนินการตางๆ รวมถึงโครงสรางพื้นฐานและเทคนิคในการเขาถึงขอมูลที่เหมือนกัน

7. Dynamic sparse matrix handling: ควรจะมีการนํา physical schema มาใชทําการสราง

โมเดลในการวิเคราะหขอมูล โดย schema ที่นํามาใชจะสามารถใชหนวยความจําและการเขาถึง

ขอมูลไดอยางมีประสิทธิภาพ เชน การคํานวณตางๆกับขอมูลโดยตรง การใช B-tree ในการจัดเก็บ

ขอมูล การใชแฮช และการรวมเทคนิคตางๆเขาดวยกัน

8. Multiuser support: ระบบ OLAP จะตองสามารถใหบริการแกผูใชหลายๆคนไดพรอมๆกัน โดย

ผูใชหลายๆรายอาจจะเรียกใชขอมูลที่เหมือนกันพรอมๆกันก็เปนได

9. Unrestricted cross-dimensional operations: ระบบ OLAP จะตองมีความสามารถที่จะทํา

การรูจําลําดับชั้นของขอมูลในมิติทางธุรกิจตางๆ และสามารถทําการเรียกดูขอมูลแบบเจาะลึกและ

แบบผลสรุปทั้งในมิติหนึ่งๆหรือหลายๆมิติไดอยางอัตโนมัติ

Page 7: บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

255 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน

10. Intuitive data manipulation: ระบบ OLAP จะตองมีความสามารถที่จะดําเนินการวิเคราะห

ขอมูลในแงมุมตางๆได เชน การวิเคราะหขอมูลแบบเจาะลึกไปตามคอลัมนหรือแถวของขอมูล

สามารถทําการซูมเขา-ออกได โดยการใช point-and-click และ drag-and-drop ไดในเซลล (Cell)

ตางๆของโมเดล

11. Flexible reporting: ระบบ OLAP จะตองมีความสามารถที่จะทําใหผูใชสามารถปรับเปลี่ยนขอมูล

ในคอลัมนและแถวที่จะงายตอการวิเคราะหตางๆ

12. Unlimited dimensions and aggregation levels: ระบบ OLAP จะตองไมจํากัดจํานวนมิติ

และลําดับชั้นในการวิเคราะหขอมูล รวมถึงการแสดงผลดวยเชนกัน

จากกฎทั้งหมดขางตน เราจะทราบถึงความตองการในการวิเคราะหขอมูลในหลายๆมิติ และ

ความสามารถของ OLAP ในการตอบสนองความตองการเหลานั้น ซึ่งกฎที่กลาวมาทั้งหมดขางตนจะชวยบง

บอกถึงลักษณะพื้นฐานของ OLAP ได กลาวคือ ระบบ OLAP จะทําใหผูใชสามารถทําการวิเคราะหหรือเรียกดู

ขอมูลไดหลายมิติ และสามารถประมวลผลคิวรีที่มีความซับซอนแบบเรงดวนได นอกจากนั้นระบบ OLAP ยัง

ควรที่จะมีความสามารถในการวิเคราะหขอมูลแบบเจาะลึกเพื่อใหไดรายละเอียดของขอมูลมากขึ้น รวมถึงการ

วิเคราะหขอมูลแบบผลสรุปที่เปนการรวบยอดขอมูลตัวชี้วัดตางๆที่เกี่ยวเนื่องกับมิติทางธุรกิจหนึ่งๆหรือหลาย

มิติได ทายสุด คือ ระบบ OLAP จะมีความสามารถในการคํานวณและเปรียบเทียบขอมูลที่ซับซอน และแสดง

ผลลัพธเหลานั้นในรูปแบบของชารตและกราฟตางๆได

ฟงกชันและคุณลักษณะหลักของ OLAP ในการประยุกตใช OLAP ที่เปนระบบหรือเครื่องมือสําหรับการเขาถึง/สงผานขอมูลนั้นจะชวยเพิ่มขีด

ความสามารถในการเขาถึงขอมูล และจะทําใหผูใชสามารถเขาถึงขอมูลไดงายขึ้น โดยระบบ OLAP จะมี

คุณลักษณะตางๆมากมายดังแสดงในดังรูปที่ 11-3 ซึ่งจากรูปจะแสดงเกี่ยวกับคุณลักษณะของ OLAP ที่จะ

ประกอบไปดวย (1) คุณลักษณะพื้นฐานที่ประกอบไปดวยการวิเคราะหมิติตางๆ การวิเคราะหขอมูลแบบ

เจาะลึก (drill down) และการวิเคราะหขอมูลแบบสรุป (roll up) รวมถึงการวิเคราะหขอมูลเพียงบางสวน

และการปรับเปลี่ยนมุมมองของผลลัพธ (slicing and dicing) และ (2) คุณลักษณะพิเศษที่จะเปนคุณลักษณะ

ที่แอบแฝงอยูภายใตฟงกชันการทํางานตางๆ

Page 8: บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

256 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน

รูปที่ 11-3 คุณลักษณะของ OLAP

การวิเคราะหขอมูลมิติตางๆ การวิเคราะหขอมูลหลายๆมิติจะเปนการแสดงถึงขีดความสามารถของ OLAP ที่จะทําใหเราสามารถ

วิเคราะหขอมูลไดอยางมีประสิทธิภาพ เพื่อใหเห็นภาพของการประยุกตใช OLAP กับการวิเคราะหมิติตางๆ

ลองพิจารณา star schema ในรูปที่ 11-4 ที่เปนขอมูลการขายหรือยอดขายสินคาที่ประกอบไปดวยมิติทาง

ธุรกิจ 3 มิติซึ่งก็คือ มิติรายการสินคา มิติแกนเวลา และมิติสาขา/หางรานของบริษัทที่มีการประกอบการ จาก

ทั้ง 3 มิติเราสามารถแสดงการเชื่อมโยงและความสัมพันธระหวางมิติโดยใชลูกบาศก (cube) ดังรูป โดยจากรูป

มิติรายการสินคาจะอยูที่แกน X มิติแกนเวลาจะอยูที่แกน Y และมิติสาขา/หางรานจะอยูที่แกน Z โดยคาที่

แสดงในแตละแกนก็จะเปนคาในที่เปนตัวชี้วัดที่สัมพันธกับแตละแอทริบิวของแตละมิติ เชน ขอมูลเดือนจะเปน

แอทริบิวหนึ่งในมิติแกนเวลา ซึ่งเราสามารถเรียกดูยอดขายโดยตรงของแตละเดือนได แตเมื่อไรก็ตามที่เรา

เลือกรายการสินคารายการหนึ่งๆจากมิติรายการสินคา เดือนหนึ่งๆจากมิติแกนเวลา และเขตพื้นที่หนึ่งๆจาก

มิติสาขา/หางราน ตัวอยางเชน เลือกรายการสินคาเสื้อคลุม เดือนมกราคม พื้นที่รัฐนิวยอรก จะทําใหผูใช

สามารถเรียกดูขอมูลยอดขายเสื้อคลุมของเดือนมกราคมซึ่งถูกขายในรัฐนิวยอรก โดยผลลัพธที่ไดเกิดจากการ

อินเทอรเซกชันกันระหวางเสนเชื่อมของแตละมิติ เปนตน

Page 9: บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

257 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน

รูปที่ 11-4 ตัวอยาง star schema และ cube

จากการเลือกขอมูลในแตละมิติขางตน ถาเราตองการแสดงผลลัพธยอดขายสินคาจากขอมูลที่ทําการ

เลือกจากทั้ง 3 มิติขางตน (เสื้อคลุม เดือนมกราคม และรัฐนิวยอรก) ในรูปแบบสเปรดชีต เราจะสามารถนํา

ขอมูลรายการสินคาไปแสดงผลในแตละคอลัมน ขอมูลแตละเดือนไปแสดงผลในแตละแถว และขอมูลแตละ

สาขา/หางรานไปแสดงผลในแตละหนา (page) ของสเปรดชีต เปนตน ซึ่งตัวอยางของขอมูลหนาหนึ่งๆที่

ประกอบไปดวยยอดขายสินคาทุกรายการ ที่ถูกขายในแตละเดือน และถูกขายในรัฐนิวยอรก จะสามารถแสดง

ผลไดดังรูปที่ 11-5 โดยจากรูปจะเปนเหมือนกับการตัดสวนของขอมูลออกจากลูกบาศก (slice of the cube)

โดยจะทําการตัดสวนของขอมูลในสวนของรัฐนิวยอรกออกจากมิติสาขา/หางราน (ตัวสวนของแกน Z) โดย

ขอมูลในแกน X และ Y ยังอยูครบถวน ซึ่งจากการตัดสวนของขอมูลจากลูกบาศกจะทําใหเราสามารถเรียกดู

ขอมูลเฉพาะสวนไดหลายสวนดวยกัน โดยในการเรียกดูขอมูลในแตละสวนจะสอดคลองกับคิวรีที่ถูกกําหนด

จากผูใช ซึ่งผลลัพธที่ไดจะถูกแสดงผลบนหนาจอที่ประกอบไปดวย 3 มิตินั่นคือ แถวของขอมูล คอลัมนของ

ขอมูล และเพจ (page) ของขอมูล ตามลําดับ

Page 10: บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

258 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน

รูปที่ 11-5 การแสดงผลในหนาหนึ่งในรูปแบบสเปรดชีตของขอมูล 3 มติิ

ลองพิจารณาตัวอยางคิวรีดังตอไปนี้ ซึ่งเปนตัวอยางของการแบงสวนของขอมูลเพื่อเรียกดูขอมูลใน

แงมุมตางๆ ดังนี้

คิวรี: จงแสดงยอดขายทั้งหมดของทุกรายการสินคาในชวง 5 ปที่ผานมาที่ขายไดในทุกสาขาของ

บริษัท (ณ ปจจุบัน ป 2012)

ผลลัพธที่ได:

แถวของขอมูลที่เกิดข้ึนในป 2007, 2008, 2009, 2010, 2011

คอลัมนของขอมูลที่ประกอบไปดวยยอดขายทั้งหมดของทุกรายการสินคา

เพจหนึ่งสาขาตอหนึ่งหนา

คิวรี: จงแสดงผลลัพธการเปรียบเทียบยอดขายของทุกสาขาโดยทําการเปรียบเทียบยอดขายของแต

ละรายการสินคาที่ถูกขายในระหวางป 2010 และ 2011

ผลลัพธที่ได:

แถวของขอมูลในชวงป 2010 และ 2011 ที่เปนเปอรเซ็นตการเพิ่มขึ้นหรือลดลงของยอดขาย

สินคา

คอลัมนหนึ่งคอลัมนจะแสดงถึงแตละรายการสินคา (จํานวนคอลัมนที่ถูกแสดงเปนผลลัพธ

จะเทากับจํานวนรายการสินคาทั้งหมดของบริษัท)

เพจหนึ่งหนาที่แสดงทุกสาขา

Page 11: บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

259 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน

คิวรี: จงแสดงผลลัพธการเปรียบเทียบยอดขายของทุกสาขาโดยทําการเปรียบเทียบยอดขายของแต

ละรายการสินคาที่ถูกขายแบบลดราคาในระหวางป 2010 และ 2011

ผลลัพธที่ได:

แถวของขอมูลในชวงป 2010 และ 2011 ที่เปนเปอรเซ็นตการเพิ่มขึ้นหรือลดลงของยอดขาย

สินคา

คอลัมนหนึ่งคอลัมนจะแสดงถึงแตละรายการสินคา (จะแสดงเฉพาะรายการสินคาที่ถูกขาย

แบบลดราคา)

เพจหนึ่งหนาที่แสดงทุกสาขา

คิวรี: จงแสดงผลลัพธการเปรียบเทียบยอดขายของแตละสาขาโดยทําการเปรียบเทียบยอดขายของแต

ละรายการสินคาที่ถูกขายแบบลดราคาในระหวางป 2010 และ 2011

ผลลัพธที่ได:

แถวของขอมูลในชวงป 2010 และ 2011 ที่เปนเปอรเซ็นตการเพิ่มขึ้นหรือลดลงของยอดขาย

สินคา

คอลัมนหนึ่งคอลัมนจะแสดงถึงแตละรายการสินคา (จะแสดงเฉพาะรายการสินคาที่ถูกขาย

แบบลดราคา)

เพจหนึ่งสาขาตอหนึ่งหนา

คิวรี: จงแสดงผลลัพธที่เปนผลลัพธของคิวรีกอนหนา โดยทําการปรับเปลี่ยนการแสดงผลระหวางแถว

และคอลัมน (เปลี่ยนจากแถวเปนคอลัมนและเปลี่ยนจากคอลัมนเปนแถว)

ผลลัพธที่ได:

แถวของขอมูลซึ่งแตละแถวจะแสดงถึงแตละรายการสินคาที่มีการขายลดราคา

คอลัมนจะเปนป 2010 และ 2011 ที่เปนเปอรเซ็นตการเพิ่มขึ้นหรือลดลงของยอดขาย

สินคา

เพจหนึ่งสาขาตอหนึ่งหนา

คิวรี: จงแสดงผลลัพธที่เปนผลลัพธของคิวรีกอนหนา โดยทําการปรับเปลี่ยนการแสดงผลระหวางแถว

และหนา (เปลี่ยนจากแถวเปนหนาและเปลี่ยนจากหนาเปนแถว)

Page 12: บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

260 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน

ผลลัพธที่ได:

แถวของขอมูลโดยที่หนึ่งแถวจะแสดงขอมูลหนึ่งสาขา

คอลัมนจะเปนป 2010 และ 2011 ที่เปนเปอรเซ็นตการเพิ่มขึ้นหรือลดลงของยอดขาย

สินคา

เพจหนึ่งรายการสินคาตอหนึ่งหนา ซึ่งจะเปนหนาของรายการสินคาที่มีการขายลดราคา

จากตัวอยางคิวรีขางตนที่ทําการประมวลผลกับ star schema ที่ประกอบไปดวยขอมูลทางธุรกิจ 3

มิติจะสามารถวิเคราะหเกี่ยวกับการขายสินคาที่เกี่ยวของกับมิติแกนเวลา มิติรายการสินคา และมิติสาขาที่มี

การขายสินคา โดยความสัมพันธระหวางมิติตางๆจะสามารถแสดงไดผานทางเสนเชื่อมของมิติตางๆ ซึ่งจาก

ความสัมพันธดังกลาว เมื่อทําการประมวลผลคิวรีจากผูใชจะทําใหผลลัพธที่ไดจะถูกแสดงผลผานคอลัมน แถว

และเพจของลูกบาศก (cube) ที่ประกอบไปดวยมิติทางธุรกิจ 3 มิติดวยกัน แตเมื่อไรก็ตามที่ star schema มี

มิติเพ่ิมขึ้นจากเดิม อาทิเชน เพิ่มข้ึนจาก 3 มิติเปน 4 มิติ จะทําใหเราไมสามารถแสดงผลลัพธของการเชื่อมโยง

ขอมูลผานลูกบาศก 3 มิติได ดังนั้นเมื่อ star schema มีมิติทางธุรกิจมากกวา 3 มิติ เราควรจะใช

"Hypercubes" ในการแสดงความเชื่อมโยงความสัมพันธระหวางมิต ิซึ่งจะสามารถอธิบายไดดังนี ้

“Hypercubes” คืออะไร? เพื่อที่จะอธิบายเกี่ยวกับ “hypercubes” เราจะทําการอธิบายโดยใชตัวอยาง เพื่อใหเขาใจไดโดยงาย

ถาเราทําการพิจารณา 2 มิติทางธุรกิจ คือ มิติรายการสินคา และมิติแกนเวลาที่เกี่ยวของกับตัวชี้วัดตางๆ ซึ่ง

จากขอมูลทั้งหมด คาของขอมูลในแตละสวนจะถูกแสดงทางดานขวาของรูปที่ 11-6 โดยขอมูลในแกนเวลาจะ

ประกอบไปดวยรายชื่อเดือนเริ่มตั้งแตเดือนมกราคมไปจนถึงเดือนธันวาคม ขอมูลรายการสินคาจะประกอบไป

ดวย “Hats”, “Coats”, “Jackets”, “Dresses”, “Shirt” และ “Slacks” ตามลําดับ ในสวนของขอมูลที่

เปนตัวชี้วัดจะประกอบไปดวย เชน (1) ตนทุนคงที่ (Fixed cost) (2) ตนทุนผันแปร (Variable cost) (3)

ยอดขายทางออม (indirect sale) (4) ยอดขายโดยตรง (direct sale) และ (5) อัตรากําไร (Profit margin)

ตามลําดับ โดยจากรูปเราจะเห็นวาขอมูลจะถูกเก็บตามลําดับชั้นของขอมูลในแตละมิติและถูกเรียงอยูใน

เสนตรงตามมติิแกนเวลา มิติรายการสินคา และตัวชี้วัด โดยในแตละเสนเราสามารถเลื่อนขึ้น-ลงภายในเสนได

และสามารถทําไดอยางเปนอิสระตอกันดวย ซึ่งการเลื่อนขึ้น-ลงเปรียบเสมือนกับการเรียกดูขอมูลแตละสวนที่

เราตองการ โดยการแสดงผลในลักษณะเสนตรงดังกลาวเราจะเรียกวา “Multidimensional domain

structure (MDS)” นอกจากนั้นในรูปที่ 11-6 ยังแสดงถึงการแสดงผลขอมูลในรูปแบบตาราง โดยจากรูปจะ

เปนการแสดงขอมูลใน 1 เพจ ซึ่งเปนเพจของสินคา “coats” ที่ถูกขายในเดือนตางๆ (แกน X) โดยเทียบกับ

ตัวชี้วัดตางๆ (แกน Y) ถาเราตองการที่จะเรียกดูขอมูลของรายการสินคาอื่นๆ เราจะตองทําการสรางเพจใหม

สําหรับรายการสินคานั้นๆ นอกจากการแสดงผลในรูปตารางแลวยังแสดงใหเห็นถึงการใชลูกบาศกในการ

แสดงผลขอมูลทั้ง 3 เสน ซึ่งจากรูปแกน Y คือการสินคา แกน X คือ ตัวชี้วัด และแกน Z คือ ขอมูลแตละเดือน

ซึ่งถาเราตองการที่จะเรียกดูขอมูลของรายการสินคา “coat” ในทุกๆเดือนกับทุกๆมาตรวัด เราจะตองทําการ

Page 13: บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

261 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน

หาจุดของขอมูลในลูกบาศกที่เกี่ยวของกับรายการสินคา “coat” เปนตน ซึ่งจากรูปจะแสดงถึงขอมูลเพจ

หนึ่งๆที่เกิดจากการตัดทอนขอมูลรายการสินคาทั้งหมดใหเหลือเพียงหนึ่งรายการสินคาเทานั้น

รูปที่ 11-6 การแสดงผลในรูปแบบของแถว คอลัมนและเพจ

จากขอมูล 2 มิติทางธุรกิจและ 1 กลุมตัวชี้วัด เราสามารถเปรียบไดเปนการมีขอมูล 3 มิติที่ซึ่งสามารถ

แสดงผลใหอยูในรูปของลูกบาศกได แตเมื่อไหรก็ตามที่จํานวนมิติเพิ่มขึ้น เชน ทําการเพิ่มมิติสาขาหางรานซึ่ง

เปนมิติทางธุรกิจ จะทําใหเรามีขอมูลทั้งหมด 4 มิติที่ประกอบไปดวย 3 มิติทางธุรกิจ และ 1 กลุมตัวชี้วัด ซึ่ง

เราจะไมสามารถใชลูกบาศกในการแสดงผลได ดังนั้นในการแสดงผลเราควรที่จะใช MDS diagram โดยการ

วาดเสนตรงทั้งหมด 4 เสน (ดังแสดงในรูปที ่11-7) ซึ่งจากรูปเราจะสมมติวาเสนตรงเหลานั้นเปนลูกบาศกของ

ขอมูลหลายมิติ (Hypercubes) หลังจากที่เราทําการสราง hypercubes ที่อยูในรูปเสนตรงแลว เราจะ

สามารถทําการแสดงผลบนหนาจอของผูใชไดอยางไร? ซึ่งการแสดงผลในหนาจอของผูใชเราจะสามารถแสดง

ผลไดในรูปแบบของแถว คอลัมน และเพจของขอมูลเทานั้น ลองพิจารณารูปที่ 11-8 ที่ประกอบไปดวยขอมูล3

มิติทางธุรกิจและ 1 กลุมตัวชี้วัด ซึ่งในการแสดงผลเราจะกําหนดใหแกนแถวของขอมูลแสดงขอมูลมิติแกนเวลา

คอลัมนจะแสดงขอมูลที่เกิดจากการรวมระหวางมิติรายการสินคาและตัวชี้วัดตางๆ และทายสุดคือเพจจะแสดง

ขอมูลที่ตั้งของสาขาตางๆที่อยูในมิติสาขาหางราน ซึ่งจากตัวอยางมิติสาขาจะประกอบไปดวยสาขาที่ตั้งอยูใน

รัฐนิวยอรก ซานโจเซ และดัลลัส ตามลําดับ โดยในการแสดงผลจะแสดงผลเพียงแคเพจของสาขาที่อยูในรัฐ

นิวยอรกเทานั้น

Page 14: บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

262 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน

รูปที่ 11-7 MDS สําหรับการวิเคราะหขอมูล 4 มิต ิ

รูปที่ 11-8 ตัวอยาง MDS สําหรับขอมูล 4 มติิ

นอกเหนือจากขอมูล 4 มิติแลว MDS ยังสามารถแสดงผลขอมูลที่มีมากกวา 4 มิติได ลองพิจารณาอีก

ตัวอยางหนึ่งที่ประกอบไปดวยขอมูลทั้งสิ้น 6 มิติ ดังแสดงในรูปที่ 11-9 ที่ประกอบไปดวย 5 มิติทางธุรกิจ

ไดแก มิติขอมูลลูกคา (Demographics) มิติขอมูลโปรโมชั่น มิติที่อยูของสาขาตางๆ มิติแกนเวลา และมิติ

Page 15: บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

263 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน

รายการสินคา และ 1 กลุมตัวชี้วัด โดยจากขอมูลดังกลาว เราจะแสดงผลของการวิเคราะหขอมูลในรูปแบบ

ของตารางขอมูลได โดยนําขอมูลรายการสินคาและตัวชี้วัดรวมกันเปนขอมูลในคอลัมนหนึ่งๆ นําขอมูลสาขา

ตางๆรวมกับขอมูลแกนเวลาเปนแถวหนึ่งๆ และนําขอมูลลูกคารวมกับขอมูลโปรโมชั่นเปนเพจหนึ่งๆ โดยการ

แสดงผลในรูปแบบตารางจะแสดงดังรูปที่ 11-10

รูปที่ 11-9 ตัวอยาง MDS สําหรับขอมูล 6 มิต ิ

รูปที่ 11-10 ตัวอยางขอมูลเพจหนึ่งที่แสดงขอมูลทั้ง 6 มิต ิ

จากที่กลาวมาทั้งหมดขางตน เราจะสามารถสรุปเกี่ยวกับ “Hypercubes” ได 2 แงมุมคือ ในการ

อธิบายเกี่ยวกับโมเดลของขอมูลในระบบ OLAP ที่มีมากวา 3 มิติ เราจะสามารถใช Multidimensional

Page 16: บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

264 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน

domain structure (MDS) ในการแสดงโครงสรางตางๆของขอมูล และการแสดงผลขอมูลบนหนาจอของผูใช

ซึ่งโดยสวนใหญจะทําการแสดงผลขอมูลในรูปแบบของ แถว คอลัมน และเพจของขอมูล ซึ่งจะเปนการ

แสดงผลขอมูลที่อยูในรูปแบบของตาราง โดยเราสามารถแสดงผลขอมูลที่มีมากกวาหรือเทากับ 3 มิติใหอยูใน

รูปแบบของตารางได โดยหลังจากที่เราเขาใจถึงโมเดลขอมูล โครงสรางขอมูล การแสดงผลขอมูลแลว เราควร

ที่จะตองศึกษาถึงการดําเนินการวิเคราะหขอมูลในระบบ OLAP ที่จะมีตัวดําเนินการหลายชนิดดวยกันเชน

การวิเคราะหแบบเจาะลึก การวิเคราะหขอมูลที่เปนผลสรุป การวิเคราะหขอมูลเพียงบางสวน และการ

ปรับเปลี่ยนมุมมองของขอมูลในการวิเคราะห โดยรายละเอียดของแตละวิธีการวิเคราะหขอมูลจะสามารถ

อธิบายไดดังนี ้

การวิเคราะหแบบเจาะลึกและการสรางผลสรุปของขอมูล (Drill down and roll up) ในการที่จะทําความเขาใจเกี่ยวกับการวิเคราะหแบบเจาะลึกและการสรางผลสรุปของขอมูล ลอง

พิจารณาตัวอยางในรูปที่ 11-4 ที่แสดงถึง STAR schema ที่ประกอบไปดวย 3 มิติทางธุรกิจ นั่นคือ (1) มิติ

รายการสินคาที่ประกอบไปดวย ชื่อรายการสินคา ชนิดสินคา หมวดหมูสินคา สายการผลิตสินคา และแผนก

ของสินคา ตามลําดับ (2) มิติแกนเวลา และ (3) มิติสาขาตางๆ ซึ่งจากขอมูลทั้งสามมิติ เราจะเห็นวาขอมูล

แอทริบิวตางๆในแตละมิติจะถูกจัดเก็บอยูในรูปแบบของลําดับชั้น (Hierachical sequence) ที่มีความ

เกี่ยวเนื่องกัน ซึ่งจากการจัดเก็บขอมูลดังกลาวจะทําใหระบบ OLAP สามารถทําการวิเคราะหขอมูลแบบ

เจาะลึก และสามารถทําการสรางผลสรุปของขอมูลได โดยในการที่จะทําความเขาใจเกี่ยวกับการวิเคราะห

ขอมูลทั้งสองแบบ ลองพิจารณารูปที่ 11-11 ที่จะแสดงเกี่ยวกับความสามารถในการเรียกดูขอมูลที่มีความ

ละเอียดตางกันไลไปตามลําดับชั้น ซึ่งจากรูปจะเปนขอมูลยอดขายในหนึ่งเดือนท่ีเกิดขึ้นในสาขาหนึ่งๆ โดยทาง

ซายมือสุดจะเปนลําดับชั้นความละเอียดของขอมูลมิติรายการสินคาที่จะไลจากขอมูลที่มีความละเอียดนอยไป

จนถึงขอมูลที่มีความละเอียดสูงสุด โดยแตขอมูลในแตละระดับจะมียอดขายแนบอยูดวย เชน ยอดขายสินคา

ในแผนกหนึ่งเปนจํานวน 300,000$ ยอดขายสินคาในหมวดหมูสินคาหนึ่งๆเปนจํานวน 15,000$ และ

ยอดขายสินคารายการหนึ่งๆเปนจํานวน 1,200$ เปนตน ซึ่งจากขอมูลดังกลาว จะทําใหผูใชสามารถเลือกดู

ขอมูลตามแตละระดับได โดยถาผูใชทําการเลือกดูขอมูลยอดขายในหมวดหมูสินคาหนึ่ง แลวทําการเปลี่ยนไป

เลือกดูขอมูลที่มีความละเอียดมากขึ้นนั่นคือ ขอมูลยอดขายในประเภทสินคาหนึ่ง เราจะเรียกวาเปนการ

วิเคราะหขอมูลแบบเจาะลึก แตถาผูใชทําการเลือกดูขอมูลยอดขายในหมวดหมูสินคาหนึ่ง แลวขยับขึ้นไปดู

ขอมูลทีม่ีความละเอียดนอยลง ซึ่งก็คือ ยอดขายของสายการผลิตสินคาหนึ่งๆ เราจะเรียกวาเปนการวิเคราะห

ขอมูลแบบผลสรุป นอกจากการวิเคราะหทั้งสองแบบแลว ในรูปยังแสดงถึงการวิเคราะหขอมูลแบบเจาะลึก

และผลสรุปขามมิติอีกดวย ซึ่งจะเปนการวิเคราะหแบบเจาะลึกหลายๆมิติพรอมๆกัน หรือไมพรอมกันก็ได เชน

ผูใชอาจทําการเลือกดูขอมูลยอดขายสินคาในหมวดหมูหนึ่งๆ ที่เกิดขึ้นในเดือนหนึ่งๆ ตอมาอาจจะเปลี่ยนเปน

ยอดขายสินคาแตละรายการสินคาในแตละไตรมาสก็เปนได ซึ่งการเรียกดูนี้จะเปนการเจาะลึกลงไป

รายละเอียดของมิติรายการสินคา และเปนการเรียกดูผลสรุปในมิติแกนเวลา ซึ่งจากที่กลาวมาทั้งหมดระบบ

OLAP จะสามารถวิเคราะหขอมูลไดหลายรูปแบบทั้งแบบขามมิติ และไมขามมิต ิ

Page 17: บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

265 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน

แตอยางไรก็ดีจากการวิเคราะหขอมูลทั้งแบบเจาะลึกและผลสรุป เราจะทําการแสดงผลไดอยางไร

ลองพิจารณารูปที่ 11-6 อีกครั้งหนึ่งที่จะแสดงถึงการแสดงผลขอมูลในรูปแบบของตาราง ซึ่งจากรูปจะแสดง

ขอมูลรายการสินคาในแตละคอลัมน แสดงขอมูลเดือนตางๆในแตละแถวขอมูล และแสดงสาขาหนึ่งๆในแตละ

เพจ แตถาจากรูป เราทําการวิเคราะหแบบผลสรุปโดยทําการเปลี่ยนการเรียกดูขอมูลจากแตละรายการสินคา

ไปเปนหมวดหมูสินคา เราจะสามารถแสดงไดดังรูปที่ 11-12 ซึ่งจะทําการเปลี่ยนขอมูลรายการสินคาที่แสดงใน

แตละคอลัมนไปเปนหมวดหมูของสินคาแทน โดยขอมูลที่แสดงในแตละแถวและแตละเพจยังคงเดิม แต

เมื่อไหรก็ตามที่เราตองการเปลี่ยนการเรียกดูขอมูลที่แกนของสาขาดวย โดยปรับระดับใหมีความละเอียดมาก

ขึ้นจากเดิมเปนแตละรัฐหรือเปนแตละเมือง เราจะสามารถแสดงผลขอมูลเดือนในแตละแถวขอมูลได

เหมือนเดิม แสดงขอมูลแตละหมวดหมูสินคาในแตละคอลัมน และทําการปรับเปลี่ยนเพจจากแตละรัฐเปนแต

ละเมืองแทน ตามลําดับ

รูปที่ 11-11 การวิเคราะหแบบเจาะลึกและการสรางผลสรุปของขอมูล

รูปที่ 11-12 การแสดงผลสรุปของขอมูลใน 3 มิต ิ

Page 18: บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

266 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน

การวิเคราะหขอมูลเพียงบางสวนและการปรับเปลี่ยนมุมมองของขอมูล (Slice and dice) ในการที่จะทําความเขาใจเกี่ยวกับการวิเคราะหขอมูลเพียงบางสวนและการปรับเปลี่ยนมุมมองของ

ขอมูล ลองพิจารณาตัวอยางในรูปที่ 11-5 ที่เปนการแสดงขอมูลเดือนตางๆในแถวตางๆ รายการสินคาใน

คอลัมนตางๆ และสาขาในเพจตางๆ โดยแตละเพจจะแสดงยอดขายทุกเดือนและรายการสินคาในสาขาหนึ่งๆ

ซึ่งจากรูปจะเปนยอดขายสินคาของสาขาในรัฐนิวยอรก ซึ่งเพจหนึ่งๆจะเปนการแสดงผลขอมูลเพียงบางสวน

(Slice) ที่แสดงขอมูลเพียง 2 มิติเทานั้น ซึ่งจากการเลือกดูขอมูลเพียงบางสวน ลองพิจารณาถึงการปรับเปลี่ยน

มุมมองของขอมูลดังแสดงในรูปที่ 11-13 ที่ซึ่งรูปทางซายมือจะแสดงขอมูลดังแสดงในรูปที่ 11-5 รูปตรงกลาง

จะเปลี่ยนการหมุนแกนของขอมูล โดยจะเปนการเปลี่ยนรายการสินคาจากการแสดงผลในคอลัมนเปนการ

แสดงผลในเพจ การแสดงผลขอมูลสาขาจากเพจไปเปนแถว และขอมูลเดือนจากแถวไปเปนคอลัมน โดยจาก

รูปจะเปนการแสดงผลยอดขายของรายการสินคา “Hats” ในเดือนตางๆที่ขายไดในสาขาตางๆ และทายสุดรูป

ทางขวามือจะเปนการหมุนแกนของขอมูลโดยทําการแสดงผลขอมูลเดือนตางๆในแตละเพจ แตละรายการ

สินคาในแถวตางๆ และสาขาตางๆในคอลัมน โดยจะเปนการแสดงผลขอมูลยอดขายรายการสินคาตางๆที่ขาย

ไดในสาขาตางๆในเดือนมกราคม ซึ่งจากความสามารถในการเลือกขอมูลเพียงบางสวนและการปรับเปลี่ยน

มุมมองของขอมูลจะทําใหผูใชสามารถมองขอมูลไดหลายๆมุม และสามารถทําความเขาใจกับขอมูลเหลานั้นได

งายขึ้น

รูปที่ 11-13 การวิเคราะหขอมูลเพียงบางสวนและการปรับเปลี่ยนมุมมองขอมูล

Page 19: บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

267 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน

การใชงานและประโยชนของ OLAP หลังจากทําการพิจารณาเกี่ยวกับคุณลักษณะตางๆของ OLAP แลว เราจะทราบถึงประโยชนของ

OLAP ที่สามารถทําการวิเคราะหขอมูลในมิติตางๆที่มีความซับซอนได โดยเราสามารถสรุปประโยชนของการ

ใชระบบ OLAP ไดดังนี้

การเพ่ิมผลผลิต/ประสิทธิภาพในการทํางานของผูจัดการ และนักวิเคราะหเชิงธุรกิจ

ระบบ OLAP มีความยืดหยุนที่จะทําใหผูใชสามารถทําการสั่งประมวลผลคิวรีตางๆไดดวยตนเองโดย

ไมตองการความชวยเหลือจากฝายไอทีแตอยางใด

เมื่อทําการรวมระบบ OLAP ไวเปนสวนหนึ่งของคลังขอมูลจะทําใหการสรางระบบเปนไปอยาง

รวดเร็ว

ระบบคลังขอมูลสามารถทํางานไดอยางรวดเร็วโดยไมมีงานคั่งคาง

สามารถลดเวลาที่ใชในการประมวลผลคิวรีตางๆ และลดการใชแบนดวิดทของเครือขาย

โมเดลตางๆของ OLAP ในการสราง OLAP เราจะสามารถเลือกวิธีในการจัดเก็บขอมูลไดหลายวิธี เชน

ROLAP (Relational OnLine Analytical Processing) ที่เปนระบบ OLAP ที่สรางขึ้นโดยใช

relational database

MOLAP (Multidimensional OnLine Analytical Processing) ที่เปนระบบ OLAP ที่สรางขึ้นโดย

ใช multidimensional database

HOLAP (Hybrid OnLine Analytical Processing) จะเปนระบบที่นําขอดีและคุณลักษณะเดนตางๆ

ของ ROLAP และ MOLAP มารวมกัน

DOLAP (Desktop OnLine Analytical Processing) จะเปนระบบที่พัฒนามาจาก ROLAP ที่มี

ความสามารถที่จะทําใหผูใชสามารถพกพาระบบ OLAP ไปใชงานในที่ตางๆได โดย DOLAP จะทํา

การสรางขอมูลที่มีหลายมิติแลวทําการสงขอมูลเหลานั้นไปยังเครื่องของผูใช (desktop) ที่มีการติดตั้ง

ซอรฟแวร DOLAP สําหรับใชงานไวแลว

Database OLAP จะเปนระบบจัดการฐานขอมูลแบบ relational database management

system (RDBMS) ที่ถูกสรางหรือกําหนดใหสนับสนุนการทํางานของ OLAP และเอื้อตอการคํานวณ

ตางๆของ OLAP ดวย

Web OLAP จะเปนระบบ OLAP ที่สามารถใชงานผานเว็บเบราเซอรได

จากวิธีการจัดเก็บขอมูลทั้งหมดขางตน ROLAP และ MOLAP จะเปนโมเดลพื้นฐานของการสราง

ระบบ OLAP โดยทีร่ะบบ MOLAP จะเปนระบบที่เหมาะกับการนําไปใชมากที่สุดเนื่องจากมีการจัดเก็บขอมูล

Page 20: บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

268 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน

ในหลายมิติ ซึ่งจะชวยใหผูใชสามารถมองหรือเรียกใชขอมูลไดหลายมุมมอง แตในขณะที่ ROLAP จะเปน

ระบบที่ใช RDBMS ในการจัดเก็บขอมูล ซึ่งจะให OLAP ที่สรางขึ้นนั้นมีคุณสมบัติตามคุณสมบัติพื้นฐานของ

RDBMS เทานั้น เพื่อใหเขาใจถึงความแตกตางระหวาง ROLAP และ MOLAP มากขึ้น ลองพิจารณารูปที่ 11-

14 ที่จะแสดงการเปรียบเทียบกันระหวางสถาปตยกรรมของ MOLAP และ ROLAP ที่มีความแตกตางกัน คือ

ในระบบ MOLAP จะมีการใชเซิรฟเวอรตางหากสําหรับติดตั้งระบบ OLAP ที่มีการจัดเก็บขอมูลโดยใช

MDBMS ที่จะเก็บขอมูลอยูในรูปแบบของลูกบาศกหลายมิติ (Multidimensional cubes) ซึ่งจาก

สถาปตยกรรมดังกลาว จะทําใหเราตองทําการสรางกระบวนการในการสกัดและรวบรวมขอมูลจากฐานขอมูล

ของคลังขอมูลที่ใช RDBMS จากนั้นทําการสรางลูกบาศกหลายมิติแลวทําการเก็บใวใน MDBMS ที่อยูใน

เซิรฟเวอรที่เราแยกการทํางานไวแลว แตในสวนของระบบ ROLAP จะทําการติดตั้งระบบ OLAP ไวในแตละ

เครื่องของผูใชและจะไมมีการสรางลูกบาศกหลายมิติ ซึ่งในการแสดงผลจะทําการเรียกขอมูลจาก RDBMS

แลวทําการแสดงผลใหมีความคลายคลึงกับลูกบาศกหลายมิติ โดยในการแสดงผลในลักษณะดังกลาวจะตองใช

การประมวลผลเพิ่มเติม

รูปที่ 11-14 ตัวอยางสถาปตยกรรมของ MOLAP และ ROLAP

โมเดล MOLAP จะเปน OLAP โมเดลที่ทําการเก็บขอมูลไวใน “multidimensional database” ซึ่งโครงสรางการ

จัดเก็บขอมูลเปนแบบอะเรยหลายมิติ (multidimensional array) ตัวอยางเชน ในการจัดเก็บขอมูลยอดขาย

สินคา A เปนจํานวน 500 ชิ้น ที่ถูกขายในเดือนมกราคมป 2012 (2012/01) และขายไดในสาขาที่ชื่อวา

Store-1 ซึ่งขอมูลรายการขายทั้ง 500 ชิ้นนี้จะถูกเก็บอยูในอะเรยที่มีคาเปน (Product A, 2012/01/, Store-

S1) เมื่อเราทําการจัดเก็บขอมูลคาๆตางไวในอะเรย เราจะสามารถนําขอมูลเหลานี้มารวมกัน เพื่อระบุถึงขอมูล

Page 21: บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

269 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน

ที่เปนตัวชี้วัดได (จํานวนชิ้นสินคาที่ขายได) แตอยางไรก็ดี ไมใชวาทุกคาที่นํามารวมกันของแอทริบิวตางๆจะมี

ขอมูลที่เปนตัวชี้วัดเสมอไป ในบางขอมูลอาจจะไมมีตัวชี้วัดเลยก็เปนได ตัวอยางเชน ถาหางรานคาไมเปด

ใหบริการวันอาทิตย จะทําใหขอมูลยอดขายสินคาทุกชนิด ทุกสาขา ในทุกๆวันอาทิตยจะมีคาเปน 0 หรือ

NULL เปนตน

การจัดเก็บขอมูลลงใน multidimensional database ของ OLAP จะเปนอีกฐานขอมูลหนึ่งที่แยก

ออกมาจากฐานขอมูลของคลังขอมูล เมื่อเราทําการพิจารณาสถาปตยกรรมดังแสดงในรูปที่ 11-15 จะทําให

เห็นภาพคราวๆของการทํางานของ MOLAP ที่สามารถแบงสถาปตยกรรมของ MOLAP ไดเปน 3 ลําดับชั้น

คือ (1) Data layer—ฐานขอมูลของคลังขอมูล (2) application layer—สวนที่ใชจัดเก็บขอมูลในรูปแบบ

หลายๆมิติ ซึ่งในสวนนี้จะประกอบไปดวยลูกบาศกตางๆที่มีการคํานวณและสรางไวแลว โดยลูกบาศกเหลานี้

จะถูกเก็บไวใน multidimensional database และ (3) Presentation layer—จะเปนสวนที่ใชในการ

เชื่อมตอกับผูใชงาน ตามลําดับ

รูปที่ 11-15 สถาปตยกรรมของโมเดล MOLAP

โมเดล ROLAP (ROLAP model) ในโมเดล ROLAP จะทําการเก็บขอมูลในรูปแบบของแถวและคอลัมนเหมือนกับ relational data

model แตเมื่อไรก็ตามที่ตองทําการแสดงผลใหกับผูใช จะทําการแสดงผลขอมูลในลักษณะของมิติเชิงธุรกิจ

ตางๆหลายมิติ ซึ่งจะตองทําการแปลงขอมูลที่อยูในรูปแบบของแถวและคอลัมนกอน โดยในโมเดล ROLAP จะ

มีการจัดเก็บขอมูลที่เปนเมตาดาตาสําหรับใชในการเชื่อมโยง (แปลง) ขอมูลที่อยูในรูปแบบของแถวและ

คอลัมนไปยังมิติเชิงธุรกิจตางๆ เมตาดาตาเหลานี้ยังมีสวนชวยในการทําการรวบรวม (aggregations) และการ

ทําผลสรุปของขอมูล (summrizations) ดวย โดยที่เมตาดาตาเหลานี้อาจถูกเก็บไวในฐานขอมูลแบบ

relational database หรือแบบอ่ืนๆก็ได

Page 22: บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

270 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน

ลองพิจารณารูปที่ 11-16 เพื่อศึกษาถึงสถาปตยกรรมของโมเดล ROLAP ที่ประกอบไปดวย 3 layer

คือ (1) Data layer—ฐานขอมูลของคลังขอมูล (2) Application layer—ลําดับตรงกลางที่ทําการเชื่อมตอ

ระหวางฐานขอมูลกับผูใชงาน และจะเปนลําดับชั้นที่ทําการแปลงขอมูลจากแถวและคอลัมนใหเปนขอมูลในมิติ

ตางๆแบบทันทวงที และ (3) Presentation layer—ที่เปนสวนที่แสดงผลลัพธใหกับผูใช โดยจะทําการ

แสดงผลในรูปแบบของมิติตางๆทางธุรกิจ ซึ่งเมื่อไรก็ตามที่ผูใชตองการวิเคราะหขอมูลที่มีความซับซอนที่

สอดคลองกับมิติเชิงธุรกิจ คิวรีเหลานั้นจะถูกเปลี่ยนไปเปน SQL คิวรีที่มีความซับซอน เพื่อใชในการคนหา

ขอมูลในฐานขอมูลโดยตรง

รูปที่ 11-16 สถาปตยกรรมของโมเดล ROLAP

จากขางตนเราจะทราบเกี่ยวกับความแตกตางระหวางขั้นตอนการทํางานและสถาปตยกรรมระหวาง

MOLAP และ ROLAP ซึ่งจากทั้งสองโมเดลขางตนเราควรที่จะเลือกโมเดลใด?—ระหวางโมเดลที่มีการจัดเก็บ

ขอมูลแบบ relational หรือ multidimensional เพื่อชวยในการประมวลผลการวิเคราะหขอมูลตางๆแบบ

ออนไลน ในการเลือกโมเดลสําหรับการประมวลผลนั้นจะขึ้นอยูกับ 2 ปจจัยหลักดวยกันคือ (1) ความซับซอน

ของคิวรีที่ผูใชเปนผูกําหนด และ (2) ความสําคัญของประสิทธิภาพของการประมวลผลคิวรีวาสําคัญตอผูใช

มากนอยเพียงใด โดยประสิทธิภาพของการประมวลคิวรีของทั้งสองโมเดลจะแตกตางกันคอนขางมากดังแสดง

ในรูปที่ 11-17 ซึ่งจากรูปเราจะเห็นวา MOLAP สามารถประมวลผลคิวรีไดที่มีความซับซอนมากในเวลาที่นอย

กวา ROLAP คอนขางมาก ดังนั้น เพื่อใหเราสามารถเลือกโมเดลสําหรับการประมวลผลไดอยางถูกตอง ลอง

พิจารณาความแตกตางระหวางโมเดล MOLAP และ ROLAP ดังแสดงในรูปที่ 11-18 ที่จะแสดงถึงความ

แตกตาง 3 แงมุมดวยกันคือ (1) การจัดเก็บขอมูล (2) เทคนิคหรือเทคโนโลยีที่ซอนอยูในแตละโมเดล และ (3)

ฟงกชันและคุณลักษณะตางๆ

Page 23: บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

271 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน

รูปที่ 11-17 การเปรียบเทียบประสิทธิภาพการประมวลผลคิวรีและหวางโมเดล MOLAP และ ROLAP

รูปที่ 11-16 การเปรียบเทียบความแตกตางระหวางโมเดล MOLAP และ ROLAP ในแงมุมตางๆ

ปจจัยที่ตองพิจารณาในการสรางระบบ OLAP กอนที่เราจะทําการสรางระบบ OLAP เราจะตองพิจารณาถึงปจจัยตางๆของระบบที่เราจะทําการ

สรางขึ้น ถาเราทําการสรางระบบ OLAP โดยใชโมเดล MOLAP ที่ใช MDDBMS ในการจัดเก็บขอมูล เรา

จะตองพิจารณา 2 ปจจัยหลักๆดวยกัน คือ (1) โมเดล MOLAP นั้นยังไมมีมาตราฐานที่แนนอน ซึ่งแตละผูขาย

จะทําการสรางเครื่องมือสําหรับ MOLAP โดยทําการออกแบบอินเทอรเฟซตามแตที่พวกเขาตองการและอยาก

ใหเปน และ (2) ความสามารถในการยอหรือขยายได (Scalability) ซึ่งโดยสวนใหญแลวระบบ OLAP มักจะ

Page 24: บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

272 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน

ทํางานไดดีกับการเรียกดูหรือวิเคราะหขอมูลที่ เปนผลสรุป แตเมื่อไรก็ตามที่ตองทําการวิเคราะหที่มี

รายละเอียดสูง ซึ่งมีปริมาณขอมูลคอนขางมากจะทําใหประสิทธิภาพของระบบ OLAP ลดลง

ในการประมวลผลขอมูลที่ถูกนอรมอลไลซจะทําใหมีการประมวลผลเพิ่มขึ้น เมื่อเราทําการประมวลผล

คิวรีที่มีความซับซอนคอนขางมาก ดังนั้น เพื่อที่จะหลีกเลี่ยงหรือลดการประมวลผลเราควรจะใช STAR

schema ในการจัดเก็บขอมูลมิติตางๆ ซึ่งในบางเครื่องมือสําหรับ ROLAP จะเก็บขอมูลมิติตางๆไวใน STAR

schema ที่ถูกประมวลไวกอนหนาแลว

จากปจจัยขางตน เราสามารถดัดแปลงสถาปตยกรรมพื้นฐานของโมเดล MOLAP และ ROLAP เพื่อ

เพิ่มประสิทธิภาพในการประมวลผล โดยเราจะมีทางเลือกของสถาปตยกรรม 4 ทางเลือกดวยกัน ดังแสดงใน

รูปที่ 11-19 ซึ่งจากรูปทางฝงซายสุด 2 สถาปตยกรรมแรกจะเปนสถาปตยกรรมพื้นฐานของโมเดล MOLAP

และ ROLAP แตในสวนสถาปตยกรรมที่ 3 จะมีการนําดาตามารทเขามาชวยในการวิเคราะหขอมูลที่มี

รายละเอียดสูง และในสถาปตยกรรมที่ 4 จะคอนขางเหมือนกับสถาปตยกรรมที่ 3 แตจะมีการเพิ่ม OLAP

server เพื่อชวยในการประมวลผลหรือดําเนินการในการวิเคราะหขอมูลที่มีความแตกตางกัน

รูปที่ 11-17 ทางเลือกของสถาปตยกรรม OLAP

เมื่อเราทราบถึงทางเลือกของสถาปตยกรรมที่สนับสนุนการทํางานที่มีประสิทธิภาพ ขั้นตอนตอไปเรา

ควรที่จะตองศึกษาเกี่ยวกับทางเลือกในการสรางฟงกชันตางๆของ OLAP ซึ่งเราจะตองทําการศึกษาเกี่ยวกับ

องคประกอบตางๆดังนี้

Page 25: บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

273 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน

การออกแบบและเตรียมขอมูล ขอมูลในระบบ OLAP จะมาจากขอมูลในคลังขอมูลที่เราสรางขึ้น ถาเราตองการที่จะสรางระบบ

OLAP โดยใชโมเดล MOLAP เราจะตองทําการสราง multidimensional database แยกจากฐานขอมูลของ

คลังขอมูลเพื่อใชในการจัดเก็บชอมูลในรูปแบบของลูกบาศกมิติตางๆ แตถาเราเลือกที่จะทําการสรางระบบ

OLAP โดยใชโมเดล ROLAP เราจะไมตองทําการสรางฐานขอมูลใหมแตอยางใด แตขอมูลจากฐานขอมูลของ

คลังขอมูลจะถูกสงมายังระบบ OLAP เพื่อทําการสรางลูกบาศกเพื่อการวิเคราะหตางๆทันที ซึ่งจากการทํางาน

ทั้งสองระบบเราจะเห็นวาระบบ OLAP จะมีการประมวลผลเพื่อสรางเปนลูกบาศกมิติตางที่ใชสําหรับการ

วิเคราะหในแงมุมตางๆ ดังนั้นกอนที่เราจะทําการสรางลูกบาศกมิติตางๆ เราควรที่จะตองทําการศึกษา

คุณลักษณะของขอมูลในระบบ OLAP ซึ่งมีคุณลักษณะดังตอไปนี้

ระบบ OLAP จะทําการใชและจัดเก็บขอมูลนอยกวาระบบคลังขอมูล

ขอมูลในระบบ OLAP มักจะเปนขอมูลที่เปนผลสรุป จะมีขอมูลที่มีรายละเอียดสูงอยูไมมากนัก

ขอมูลในระบบ OLAP จะมีความยืดหยุนในการประมวลผลและวิเคราะหตางๆ เนื่องจากขอมูลเหลานี้

มีปริมาณนอย

ขอมูลในระบบ OLAP มีแนวโนมที่จะถูกแบงตามการดําเนินงานของแตละแผนก

ในการจัดเตรียมขอมูลระบบ OLAP จะเปนการจัดเตรียมขอมูลของผูใชเฉพาะกลุมหรือ เฉพาะแผนก

เชน แผนกการตลาด เปนตน โดยที่เมื่อเราไดกลุมของผูใชแลวเราจะทําการออกแบบขอมูลใหตรงกับการ

ดําเนินงานของแตละกลุมดังนี้

Define subset จะเปนการเลือกขอมูลเพียงสวนที่แผนกการตลาดสนใจ

Summarize จะเปนการสรุปและรวมขอมูลที่ตรงกับความตองการของแผนกการตลาด ตัวอยางเชน

ทําการสรุปรายการสินคาพรอมกับหมวดหมูของสินคาตามที่แผนกการตลาดไดกําหนดไว ซึ่งใน

บางครั้งแผนกการตลาดและแผนกบัญชีจะมีการแบงหมวดหมูสินคาโดยวิธีที่แตกตางกัน

Denormalize จะเปนการดีนอรมอลไลซขอมูลที่ผูใชตองการ โดยทําการรวมขอมูลจาก relational

tables ตางๆเขาดวยกัน เชน ถาแผนกการตลาดตองการรวมตาราง A และ B เขาดวยกัน แตแผนก

การเงินตองการรวมตาราง B และ C เขาดวยกัน เราจะทําการรวมตาราง A และ B เขาดวยกัน

สําหรับ OLAP สําหรับแผนกการตลาด

Calculate and derive จะเปนการคํานวณคาตางๆของตัวชี้วัดใหตรงกับความตองการของกลุมผูใช

เปาหมายใหมากท่ีสุด

Index จะเปนการเลือกแอทริบิวที่เหมาะสมสําหรับการสรางดัชนีสําหรับแผนกการตลาด

จากขั้นตอนการเตรียมขอมูลขางตนจะทําใหระบบ OLAP นั้นมีขอมูลที่เปนผลสรุปหลายระดับ และมี

ขอมูลที่เปนรายละเอียดเล็กนอย โดยขอมูลที่ถูกจัดเก็บอยูใน MOLAP หรือขอมูลที่เปนผลลัพธจากการ

Page 26: บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

274 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน

ประมวลผลของระบบ ROLAP จะมีลักษณะตางๆดังรูปที่ 11-20 ที่จะประกอบไปดวยขอมูล 4 ลักษณะดวยกัน

คือ (1) Static summary data (2) Dynamic summary data (3) Permanent detailed data และ (4)

Transient detailed data ตามลําดับ

รูปที่ 11-18 ลักษณะของขอมูลใน OLAP

การดูแลและจัดการสิ่งตางๆใน OLAP ดวยเหตุที่ระบบ OLAP นั้นเปนสวนประกอบหนึ่งของระบบคลังขอมูลที่ใชสําหรับการสงผานขอมูลไป

ยังผูใช ดังนั้น การจัดการตางๆของระบบ OLAP จะเปนสวนหนึ่งของการจัดการของระบบคลังขอมูลดวย

เชนกัน โดยในการจัดการสิ่งตางๆของระบบ OLAP เราจะตองพิจารณาถึงปจจัยตางๆ ดังตอไปนี ้

ความคาดหวังกับขอมูลที่สามารถเรียกใชงานไดและวิธีการในการเรียกใชงานขอมูลเหลานั้น

การเลือกมิติทางธุรกิจที่ถูกตองและเหมาะสม

วิธีการสําหรับเคลื่อนยาย/ถายโอนขอมูลจากคลังขอมูลเขาสูระบบ OLAP (ในกรณีของ MOLAP)

การเลือกวิธีการในการรวบรวมขอมูล การสรางผลสรุปของขอมูล และการคํานวณขอมูลตางๆไว

ลวงหนา

การพัฒนาระบบ OLAP โดยใชซอรฟแวรตางๆที่วางอยูตามทองตลาด

ขนาดของ multidimensional database

การจัดการกับความเบาบางของขอมูลที่อาจเกิดข้ึนกับโครงสรางที่เปนแบบ multidimension

การเรียกดูขอมูลแบบเจาะลึกไปยังขอมูลที่มีรายละเอียดสูงสุด

Page 27: บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

275 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน

การเรียกดูขอมูลแบบเจาะลึกที่เปนขอมูลที่ตองเปนการติดตอขามแผนก

มาตราการในการเขาถึงขอมลูและรักษาความปลอดภัย

การสํารองและกูคืนขอมูล

ประสิทธิภาพการทํางานของระบบ OLAP กอนที่จะพิจารณาถึงประสิทธิภาพของการประมวลผลในระบบ OLAP เราจะตองเขาใจกอนวา ระบบ

คลังขอมูลที่มีระบบ OLAP เปนสวนประกอบจะมีการเคลื่อนยายการประมวลผลคิวรีมายังระบบ OLAP ซึ่งจะ

ทําใหระบบคลังขอมูลหลักนั้นมีการทํางานที่ลดลง โดยคิวรีที่มักจะถูกประมวลผลที่ระบบ OLAP มักจะเปนคิว

รีที่มีความซับซอนและเต็มไปดวยการคํานวณตางๆ ซึ่งจากการประมวลผลคิวรีที่มีความซับซอนจะทําใหเวลาที่

ผูใชเขาใชงานแตละครั้งจะคอนขางยาวนานดวยเชนกัน

ระบบ OLAP มักถูกสรางขึ้นเพื่อทําการประมวลผลคิวรีที่ความซับซอน ซึ่งในการคํานวณและ

ประมวลผลคิวรีตางๆในระบบ OLAP จะสามารถทํางานไดเร็วกวาเนื่องจากระบบ OLAP มีการรวบยอดขอมูล

และทําการคํานวณขอมูลในแงมุมตางๆไวลวงหนาแลวทําการเก็บไวใน multidimensional database ใน

รูปแบบของลูกบาศกหลายมิติ (Hypercubes) โดยการเก็บขอมูลที่เปนผลสรุปดังกลาวจะชวยลดการใชพื้นที่

ในการจัดเก็บขอมูลใน multidimensional database ได ในการประมวลผลคิวรี จะทําการประมวลผลคิวรี

ที่เหมาะสมหรือเก่ียวของกับลูกบาศกหลายมิติที่เราทําการสรางไว

เพื่อใหเขาใจถึงประสิทธิภาพของการทํางานของระบบ OLAP ลองพิจารณาตัวอยางดังตอไปนี้ที่ระบบ

คลังขอมูลจะประกอบไปดวยมิติตางธุรกิจ 3 มิติดวยกัน ซึ่งจากมิติตางๆ ระบบ OLAP จะสามารถทําการ

คํานวณและรวบยอดขอมูลไดดังนี้

ขอมูลที่มีความละเอียดสูงทั้ง 3 มิติจะถูกเก็บไวในอะเรย 3 มิต ิ

ขอมูลที่เกี่ยวของกับมิติที่ 1 และมิติที่ 2 จะถูกเก็บไวในอะเรย 2 มิต ิ

ขอมูลที่เกี่ยวของกับมิติที่ 2 และมิติที่ 3 จะถูกเก็บไวในอะเรย 2 มิต ิ

ขอมูลที่เปนผลสรุปของมิติที่ 1 จะถูกเก็บไวในอะเรย 1 มิต ิ

ขอมูลที่เปนผลสรุปของมิติที่ 2 จะถูกเก็บไวในอะเรย 1 มิต ิ

ขอมูลที่เปนผลสรุปของมิติที่ 3 จะถูกเก็บไวในอะเรย 1 มิต ิ

จากการคํานวณและรวบยอดขอมูลไวกอนหนาจะชวยใหระบบ OLAP สามารถประมวลคิวรีที่เปนการ

วิเคราะหผลสรุปของขอมูลไดอยางรวดเร็ว แตอยางไรก็ดี การใชระบบ OLAP ก็นํามาซึ่งคาใชจายและยังมี

ขอเสียตรงที่การอัพเดทขอมูลในระบบ OLAP จะไมสามารถทําไดทันทีหรือทําไดในแตละวันเนื่องจากการถาย

โอนขอมูลสําหรับทําการคํานวณลวงหนาและการถายโอนขอมูลที่เปนลูกบาศกหลายมิติใชเวลาคอนขางมาก

ซึ่งระบบ OLAP สวนใหญจะทําการอัพเดทขอมูลเพียงเดือนละครั้งเทานั้น

Page 28: บทที่ 11 การประมวลผลการวิเคราะห ... · 2014-11-25 · บทที่ 11 การประมวลผลการวิเคราะห

276 การออกแบบคลังขอมูล (Data warehouse design) โดย อ.ดร. โกเมศ อัมพวัน

ขั้นตอนการสราง OLAP ในการสรางระบบ OLAP เราจะตองทราบถึงคุณลักษณะและฟงกชันการทํางานของ OLAP เรา

จะตองทราบถึงความสําคัญ และปจจัยตางๆที่เกี่ยวของกับ OLAP เมื่อเราทราบเกี่ยวกับสิ่งเหลานี้ทั้งหมดแลว

เราจึงทําการลงมือสรางระบบ OLAP ซึ่งจะประกอบไปดวยขั้นตอนคราวๆดังตอไปนี้ โดยที่แตละขั้นตอนจะมี

ขั้นตอนยอยๆอีกเปนจํานวนมาก แตเราจะทําการพิจารณาถึงขั้นตอนการทํางานหลักๆ ดังนี้

ทําการสรางแบบจําลองมิติตางๆ (Dimensional modeling)

ทําการออกแบบและสราง MDDB

ทําการเลือกขอมูลที่จะทําการเคลื่อนยายเขาไปยังระบบ OLAP

ทําการสรางฟงกชันสําหรับเลือกหรือสกัดขอมูลสําหรับระบบ OLAP

ทําการสรางฟงกชันการถายโอนขอมูลเขาสูระบบ OLAP

ทําการสรางฟงกชันสําหรับการรวบยอดขอมูลและการคํานวณตางๆ

ทําการสรางแอพลิเคชันที่ใชติดตอกับเซิรฟเวอรของ OLAP

จัดเตรียมการอบรมผูใช

จากขั้นตอนการทํางานทั้งหมดขางตน ขั้นตอนการสรางระบบ OLAP ก็จะมีความคลายคลึงกับการ

สรางระบบคลังขอมูล แตจะแตกตางกันที่มุมมองของขอมูลที่เราตองทําการสนใจ รูปแบบของการแสดงผล

ลัพธ และรูปแบบของฐานขอมูลที่ใช (ในกรณีท่ีทําการสรางระบบ MOLAP) เปนตน

คําถามทายบท 1. จงอธิบายเกี่ยวกับการวิเคราะหขอมูลหลายมิต ิ

2. จงอธิบายเกี่ยวกับนิยามของระบบ OLAP ที่ถูกนิยามโดย Dr. Codd

3. Hypercubes และ MDS คืออะไร ใชทําอะไร มีประโยชนอยางไร

4. การดําเนินการ (operation) ของระบบ OLAP มีอะไรบาง แลวแตละการดําเนินการมีการทํางาน

อยางไร

5. จงอธิบายเกี่ยวกับการออกแบบสถาปตยกรรมของระบบ OLAP ที่มี 4 ทางเลือก

6. การวิเคราะหแบบเจาะลึก แบบผลสรุป แบบบางสวน และการปรับเปลี่ยนมุมมองของขอมูลเปน

อยางไร จงอธิบายและยกตัวอยางประกอบ

7. ขอแตกตางระหวาง MOLAP และ ROLAP มีอะไรบาง จงอธิบาย

8. ปจจัยทีต่องพิจารณาในการสรางระบบ OLAP มีอะไรบาง

9. การสรางระบบ OLAP ประกอบไปดวยขั้นตอนอะไรบาง