Page 1

Data Warehousing บทที 3 วงจรพัฒนาคลังข้ อมูล (The Data Warehouse Life Cycle)

LOGO

YOUR SITE HERE


Contents

1. วงจรพัฒนาคลังข้ อมูล (Data Warehouse Life Cycle) 2. การเก็บข้ อมูลทีผู้ใช้ ต้องการสํ าหรับการออกแบบคลังข้ อมูล 3. การวิเคราะห์ ความต้ องการของผู้ใช้

YOUR SITE HERE


วงจรพัฒนาคลังข้ อมูล (Data Warehouse Life Cycle)

YOUR SITE HERE


วงจรพัฒนาคลังข้ อมูล (Data Warehouse Life Cycle) วงจรการพัฒนาคลังข้ อมูล (Data Warehouse Life Cycle) มี 5 ขันตอนหลักๆ ดังนี

1. Design (การออกแบบ)

ขันตอนนีเกิดจากความต้ องการในการวิเคราะห์ ข้อมูล เพือประกอบการตัดสิ นใจ และมีข้อมูลเป็ นจํานวนมาก กิจกรรมในขันตอนนี มีดงั นี - การรวบรวมข้ อมูล และศึกษากิจกรรมขององค์ กร - เตรียมและศึกษา Tools ทีนํามาใช้ ในการพัฒนาคลังข้ อมูล - ทําการออกแบบคลังข้ อมูลโดยใช้ Star-Schema เป็ นการออกแบบในรู ปแบบ ของ Dimensional data models ซึงการออกแบบในขันตอนนี จะออกแบบทังทีเป็ น Logical และ Physical เพือเตรียมทํา Prototype YOUR SITE HERE


วงจรพัฒนาคลังข้ อมูล (Data Warehouse Life Cycle) 2. Prototype (สร้ างต้ นแบบ) หลังจากทีทําการออกแบบคลังข้ อมูลเสร็จ ก็จะทําการสร้ างต้ นแบบของ คลังข้ อมูล (Prototype) เพือให้ ผใ้ ู ช้ และผู้ทีเกียวข้ องทดลองใช้ ก่อน ว่ าตรงตามที ต้ องการหรือไม่ ** เป็ นการสร้ างเพียงบางส่ วนก่ อน ยังไม่ สมบูรณ์ เมือสร้ างแล้ ว ให้ ผใ้ ู ช้ และผู้ทีเกียวข้ องทดลองใช้ ถ้ ายังไม่ เป็ นตามทีต้ องการ ก็จะ ย้ อนกลับมาทําการออกแบบใหม่ อกี ครัง แต่ ถ้า Prototype นันตรงตามความ ต้ องการแล้ ว ก็จะพัฒนา Prototype นัน เพือนําไปใช้ งานจริงต่ อไป

YOUR SITE HERE


วงจรพัฒนาคลังข้ อมูล (Data Warehouse Life Cycle) 3. Deploy (การติดตังและนําไปใช้ งาน) เป็ นการนํา Prototype ทีได้ มาพัฒนาต่ อจนเสร็จ เพือนําไปใช้ งานจริง นอกจากการพัฒนาคลังข้ อมูลจนเสร็จแล้ ว ยังต้ องมีกจิ กรรมอืนๆ อีก ดังนี - ทําการติดตังระบบ หรือคลังข้ อมูลทีพัฒนาเสร็จแล้ ว - Training คือ ทําการฝึ กอบรมวิธีการใช้ ให้ กบั ผู้ใช้ - ทําเอกสารคู่มือการใช้ งาน

YOUR SITE HERE


วงจรพัฒนาคลังข้ อมูล (Data Warehouse Life Cycle) 4. Operation (การดําเนินการ) เมือทําการพัฒนา และติดตังคลังข้ อมูลเสร็จ ก็นําคลังข้ อมูลทีได้ มาดําเนินการ ทํางานจริง โดยรวมไปถึงการบํารุ งรักษา (Maintenance) สิ งต่ างๆ ดังนี - คลังข้ อมูล และ Data mart - ดูแลเรืองการเข้ าใช้ ข้อมูลในคลังข้ อมูล (ในลักษณะ Client-Server) - ดูแลจัดการเรือง ETL

YOUR SITE HERE


วงจรพัฒนาคลังข้ อมูล (Data Warehouse Life Cycle) 5. Enhancement (การทําให้ ดขี น) ึ เป็ นการพัฒนาเพิมเติม เพือให้ ระบบหรือคลังข้ อมูลทีมีอยู่นัน ทํางานได้ ดขี ึน โดยทัวไป สิ งทีจะพัฒนาให้ ดขี ึน มีดงั นี - Technological - การจัดการกระบวนการต่ างๆ (Process management) เช่ น ลําดับการเข้ าใช้ ข้ อมูลในคลังข้ อมูล, ทําให้ มีการทํางานเร็วขึน เป็ นต้ น ** ซึงในขันตอนนี อาจจะมีการย้ อนกลับไปทําการ Design ใหม่ อกี ครัง ใน กรณีทีมีความต้ องการทางธุรกิจทีเปลียนแปลงไป

YOUR SITE HERE


วงจรพัฒนาคลังข้ อมูล (Data Warehouse Life Cycle)

YOUR SITE HERE


การเก็บข้ อมูลทีผู้ใช้ ต้องการสํ าหรับการออกแบบคลังข้ อมูล 1. เก็บรวบรวมข้ อมูลจากผู้ใช้ งานในระบบ (Requirement Gathering) 2. เก็บรวบรวมแหล่ งข้ อมูล (Source Driven Gathering)

YOUR SITE HERE


1. Requirement Gathering  เป้าหมายของการเก็บรวบรวมข้ อมูล – ใครคือผู้ใช้ ระบบ  ความต้ องการของผู้ใช้ มกั จะครอบคลุมหัวข้ อต่ างๆ ดังนี - Who : บุคคล กลุ่ม หรือ องค์ กรทีผู้ใช้ ของระบบให้ ความสนใจทีจะทราบข้ อมูล - What : หน้ าที (Functions) ทีผู้ใช้ ของระบบพยายามทีจะวิเคราะห์ - When : ช่ วงเวลาใดของข้ อมูล ทีผู้ใช้ ของระบบสนใจ - Where : กระบวนการในองค์ กรทีผู้ใช้ ระบบให้ ความสนใจเกิดขึนทีใด - Why : ทําไมผู้ใช้ ของระบบถึงให้ ความสนใจกับข้ อมูลในหัวข้ อนันๆ - How : สามารถวัด หรือประเมินค่ าข้ อมูลในแต่ ละหัวข้ อ (Subject) นันได้ อย่ างไร YOUR SITE HERE


1. Requirement Gathering  Advantage   

ได้ ข้อมูลทีตรงกับความต้ องการของผู้ใช้ งาน เหมาะสํ าหรับการออกแบบ Data Mart ใช้ เวลาในการรวบรวมข้ อมูลสั นกว่ า การเก็บรวบรวมข้ อมูลจากแหล่ งต่ างๆ

 Disadvantage 

ข้ อมูลทีผู้ใช้ ต้องการ อาจจะไม่ เคยได้ รับการจัดเก็บไว้ ในฐานข้ อมูลปฏิบัติการ ประจําวัน (OLTP database)

YOUR SITE HERE


2. Source Driven Gathering  ทําได้ โดย การวิเคราะห์ ข้อมูลทีจัดเก็บในฐานข้ อมูลปฏิบัตกิ าร ประจําวัน (OLTP database)  

การวิเคราะห์ ER-diagram การเลือกมิติข้อมูลทีน่ าสนใจ

 Advantage   

ช่ วยลดความซําซ้ อนของข้ อมูลในแง่ ของมิติของข้ อมูล เหมาะสํ าหรับการออกแบบคลังข้ อมูลในลักษณะ Full scale ทําให้ ทราบว่ าข้ อมูลเริมต้ นทีอยู่ในระบบฐานข้ อมูลปฏิบัติการประจําวันมี อะไรบ้ าง YOUR SITE HERE


2. Source Driven Gathering  Disadvantage มักใช้ เวลามาก และในการเก็บรวบรวมข้ อมูลจากแหล่ งข้ อมูลเพียงวิธีการเดียว อาจทําให้ ...  ไม่ ครอบคลุมข้ อมูลทีผู้ใช้ ต้องการ  ข้ อมูลทีได้ จากการรวบรวมไม่ ตรงตามความต้ องการของผู้ใช้ อย่ างแท้ จริ ง

YOUR SITE HERE


การวิเคราะห์ ความต้ องการของผู้ใช้ (Requirement Analysis) การวิเคราะห์ ความต้ องการของผู้ใช้ ต่อข้ อมูลทีควรจัดเก็บไว้ ใน คลังข้ อมูล คือ การนําข้ อมูลความต้ องการของผู้ใช้ ทรวบรวมมา ี ได้ มาทําการวิเคราะห์ เพือออกแบบ  ตาราง (Fact)  ตาราง Dimension  เกณฑ์ (Measure) ซึงอาจทําได้ 3 แนวทาง ดังนี YOUR SITE HERE


การวิเคราะห์ ความต้ องการของผู้ใช้ (Requirement Analysis) 1. Data-source oriented approach 

เป็ นการวิเคราะห์ ความต้ องการของผู้ใช้ จากการเก็บรวบรวม แหล่งข้ อมูล (Source Driven Gathering) ลําดับของข้ อมูลทีได้ จากการวิเคราะห์ ความต้ องการของผู้ใช้ มี ลักษณะดังนี - ตาราง Dimension - เกณฑ์ (Measure) - ตาราง Fact YOUR SITE HERE


Data-source oriented approach Measure

OLTP

Database

Dimension

Fact YOUR SITE HERE


การวิเคราะห์ ความต้ องการของผู้ใช้ (Requirement Analysis) 2. Query oriented approach 

เป็ นการวิเคราะห์ ความต้ องการของผู้ใช้ จากรายงาน หรือแบบสอบถาม (Query) เฉพาะกิจทีผู้ใช้ มกั นํามาใช้ เพือประกอบการตัดสิ นใจในแต่ ละหัวข้ อ (Subject) แนวทางนีเกิดจากการนําข้ อมูลจากการรวบรวมข้ อมูลจากผู้ใช้ งานในระบบ (Requirement Gathering) มาวิเคราะห์ ลําดับของข้ อมูลทีได้ จากการวิเคราะห์ ความต้ องการของผู้ใช้ มีลักษณะดังนี - ตาราง Dimension - เกณฑ์ (Measure) - ตาราง Fact YOUR SITE HERE


Query oriented approach Measure

Fact

อยากรู ?  What? --ยอดรวม  In context of --ของการขาย  Criteria 1, Criteria 2 --chocolate, เดือนตุลาคม Dimension

YOUR SITE HERE


การวิเคราะห์ ความต้ องการของผู้ใช้ (Requirement Analysis) 3. Business oriented approach 

เป็ นการวิเคราะห์ ข้อมูลจากกระบวนการทํางานในองค์ กร Ex การลงทะเบียน ลําดับของข้ อมูลทีได้ จากการวิเคราะห์ ความต้ องการของผู้ใช้ มี ลักษณะดังนี - ตาราง Dimension - เกณฑ์ (Measure) - ตาราง Fact YOUR SITE HERE


Business oriented approach Dimension

Fact Measure

YOUR SITE HERE


การวิเคราะห์ ความต้ องการของผู้ใช้ (Requirement Analysis) ตาราง Fact ทีได้ มาจากการวิเคราะห์ โดยแนวทางนี อาจเป็ นตารางที เก็บข้ อมูล ดังต่ อไปนี

 แทนข้ อมูลการติดต่ อธุรกิจ (business transaction) หรือเหตุการณ์ ทีเกิดขึนใน องค์ กร (business event) ตัวอย่ างเช่ น ตาราง Fact ทีชือว่ า Sale เป็ นตารางทีเก็บ ข้ อมูลว่ า สิ นค้ าใดถูกขายไป ทีร้ าน สาขาใด เมือไหร่ ใครเป็ นผู้ซือ ยอดการซือ Etc. YOUR SITE HERE


การวิเคราะห์ ความต้ องการของผู้ใช้ (Requirement Analysis)  แทนข้ อมูลเกียวกับสถานะ (State) ของสิ งต่ างๆ ทีเกียวข้ องกับองค์ กร ตัวอย่ างเช่ น ตาราง Fact ทีชือว่ า Inventory State เป็ นตารางทีเก็บสถานะของ การเก็บรักษาสิ นค้ า สิ นค้ าใดทีได้ รับการจัดเก็บ จัดเก็บไว้ ทไหน ี จํานวนทีจัดเก็บในแต่ ละช่ วงเวลาทีมีการจดบันทึกข้ อมูล Etc.

YOUR SITE HERE


การวิเคราะห์ ความต้ องการของผู้ใช้ (Requirement Analysis)  แทนข้ อมูลเกียวกับการเปลียนแปลง (change) ของสถานะ (State) ของ สิ งต่ างๆ ทีเกียวข้ องกับองค์ กร ตัวอย่ างเช่ น ตาราง Fact ทีชือว่ า Inventory change เป็ นตารางที เก็บข้ อมูลเกียวกับการเคลือนย้ ายการจัดเก็บจากโกดังหนึงไปยังอีก โกดังหนึง เป็ นต้ น

YOUR SITE HERE


Thank You!

Do you have any question ?

LOGO

YOUR SITE HERE

Data Warehouse Life Cycle  

วงจรการพัฒนาคลังข้อมูล

Read more
Read more
Similar to
Popular now
Just for you