Data Warehouse คืออะไร
คลังข้อมูล (data warehouse) คือ ฐานข้อมูลขนาดยักษ์ ที่รวบรวมฐานข้อมูลจากหลายแหล่งหลายช่วงเวลา
คลังข้อมูลแตกต่างจากฐานข้อมูลอย่างไร?
โดยปกติแล้ว ฐานข้อมูลในองค์กรทั่วไปจะมีลักษณะที่ค่อนข้างทันต่อเหตุการณ์ เช่น ฐานข้อมูลพนักงานก็จะเก็บเฉพาะพนักงานในปัจจุบัน จะไม่สนใจข้อมูลพนักงานเก่า ๆ ในอดีต ซึ่งอาจจะมีข้อมูลอะไรบางอย่าง ที่มีประโยชน์สำหรับผู้บริหาร ในการวิเคราะห์ประสิทธิภาพและคุณลักษณะต่าง ๆ ขององค์กร. นอกจากนี้ ฐานข้อมูลแต่ละอันมักถูกออกแบบมาใช้เก็บข้อมูลเฉพาะด้าน จึงมีข้อมูลเฉพาะบางส่วนขององค์กรเท่านั้น ฉะนั้นคลังข้อมูลจึงถูกออกแบบมา เพื่อรวบรวมข้อมูลในทุกส่วนของทั้งบริษัท ทั้งเก่าและใหม่ไว้ด้วยกัน ไม่มีการลบทิ้งข้อมูลเก่า ๆ ที่ไม่จริงในปัจจุบัน
โดยสรุปคือ
- คลังข้อมูล ใช้เพื่อการวิเคราะห์ (ข้อมูลทั้งอดีตและปัจจุบัน)
- ฐานข้อมูล ใช้เพื่อทำการประมวลผล (เฉพาะข้อมูลปัจจุบัน)
คุณสมบัติคลังข้อมูล
คุณสมบัติของระบบฐานข้อมูลคลังข้อมูล ที่แตกต่างจากฐานข้อมูลทั่วๆ ไป ประกอบด้วย
1. Subject Oriented
2. Integrated
3. Time-variant
4. Non-volatile
1. Subject Oriented
คลังข้อมูลจะต้องถูกสร้างจากหัวข้อหลักทางธุรกิจที่เน้นเนื้อหาที่สนใจ เช่น ลูกค้า (Customer) ผลิตภัณฑ์ (product) ยอดขาย (sales) ใบกำกับภาษีลูกค้า (customer invoicing) การควบคุมสต็อก (stock control) และ การขายผลิตภัณฑ์ (product sales) สิ่งเหล่านี้แสดงให้เห็นถึงความต้องการการจัดเก็บเพื่อใช้ในการสนับสนุน
การตัดสินใจ การวิเคราะห์ และดาต้ามายนิง (data mining)
2. Integrated
ข้อมูลที่นำมาใช้ประกอบการตัดสินใจเป็นได้ทั้งข้อมูลจากแหล่งข้อมูลภายในและจากแหล่งข้อมูลภายนอก การจัดเก็บข้อมูลอยู่ในรูปแบบแตกต่างกัน (Different formats) หรือมาจากความแตกต่างของแพล็ตฟอร์ม แต่นำมาสร้างเป็นฐานข้อมูลที่สอดคล้องเป็นหนึ่งเดียว
3. Time-variant
ข้อมูลในฐานข้อมูลปฏิบัติการมุ่งเน้นความเป็นปัจจุบัน และต้องปรับปรุงให้ทันสมัยอยู่ตลอดเวลา แต่ข้อมูลในคลังข้อมูลจะเป็นข้อมูลที่มีช่วงอายุในระยะเวลาหนึ่ง อาจมีระยะเวลาตั้งแต่ 5-10 ปี ทั้งนี้ขึ้นกับความเหมาะสมเป็นหลัก การนำข้อมูลย้อนหลังที่เก็บรวบรวมไว้ก็เพื่อนำมาทำการวิเคราะห์เปรียบเทียบ หาแนวโน้มและใช้พยากรณ์ทางธุรกิจ
4. Non-volatile
ข้อมูลในคลังข้อมูลนั้นจะมีความแตกต่างจากฐานข้อมูลที่ใช้งานอยู่ประจำวัน ฐานข้อมูลประจำวันจะมีการเพิ่ม ลบ หรือปรับปรุงอยู่ตลอดเวลา ขณะที่คลังข้อมูลมีจุดประสงค์เพื่อให้ยูสเซอร์เข้าถึงข้อมูลเพื่อเรียกใช้งานเท่านั้น การปรับปรุงข้อมูลในคลังข้อมูลถือเป็นเรื่องใหญ่มากเพราะรูปแบบการจัดเก็บข้อมูลในคลังข้อมูลมุ่งเน้น
ประสิทธิภาพด้านการเรียกใช้ข้อมูลที่มีความรวดเร็วสูงเห็นหลักสำคัญมากกว่าการพิจารณาความซ้ำซ้อนในฐานข้อมูล
Reference Website
คุณสมบัติคลังข้อมูล
ประสิทธิภาพด้านการเรียกใช้ข้อมูลที่มีความรวดเร็วสูงเห็นหลักสำคัญมากกว่าการพิจารณาความซ้ำซ้อนในฐานข้อมูล
ไม่มีความคิดเห็น:
แสดงความคิดเห็น