34
1 دا ام خ ه ن ب هار داده ا ب ن ا ر گد ه ر ر کت ر : د ظ ن ر ي ر ي ن ا رق ه( چ ي ف صط م وسط : ت

به نام خدا انبار داده ها

Embed Size (px)

DESCRIPTION

به نام خدا انبار داده ها. زير نظر : دکتر رهگذر توسط :مصطفي چهرقاني. انبار داده ها. نياز به انبار داده ها : شکاف بين اطلاعات وجود ابزارهاي عملياتي ولي عدم وجود ابزارهاي پردازشي ويژگيهاي انبار داده : موضوع گرا یکپارچه متغیر بازمان غیر فرار. معماریهای انبار داده. معماری دولایه - PowerPoint PPT Presentation

Citation preview

Page 1: به نام خدا انبار داده ها

1

خدا نام به

ها داده انبار

رهگذر : دکتر نظر زير

چهرقاني : مصطفي توسط

Page 2: به نام خدا انبار داده ها

2

ها داده انبار ها داده انبار به : نياز

اطالعات بين شکاف ابزارهاي وجود عدم ولي عملياتي ابزارهاي وجود

پردازشي داده انبار : ويژگيهاي

گرا موضوعیکپارچه بازمان متغیر فرار غیر

Page 3: به نام خدا انبار داده ها

3

داده انبار معماریهای

دوالیه معماری دولين معماری

الیه سه معماری

Page 4: به نام خدا انبار داده ها

4

دوالیه معماری

: مراحل شوند مي گرفته بانکها و فايلها از ها داده شوند می یکپارچه شودن لود از قبل مختلف منابع های داده گيري تصميم از پشتيباني براي داده انبار و کاوي OLAPداده

: توزيع از پشتيباني عدم مشکل

Page 5: به نام خدا انبار داده ها

5

دوالیه معماری

Page 6: به نام خدا انبار داده ها

6

دولين معماری ها داده و عملياتي سيستمهايenterprise data warehouse Data martها

Page 7: به نام خدا انبار داده ها

7

دولين معماری

Page 8: به نام خدا انبار داده ها

8

الیه سه معماری عملياتي هاي (Operational)داده( توافق مورد های ( Reconciledداده

نشده جزئیتاریخی نشده نرمالجامع باکیفیت

( شده مشتق های ( Derived dataدادهOperation meta data meta data EDW Data mart mata data

Page 9: به نام خدا انبار داده ها

9

الیه سه معماری

Page 10: به نام خدا انبار داده ها

10

تطبیق فرآیند

مورد های داده به عملیاتی های داده تبدیلتوافق

: مراحلcapture ) ( گرفتن

مبدا بانکهای و فایلها از ها داده استخراج بانک کارنامه فایل از استفاده

scrub ) سازی ) (cleansing )پاک مبدأ های داده کیفیت افزایش الگو تطبیق از استفاده

Page 11: به نام خدا انبار داده ها

11

تطبیق فرآیند ادامهTransform) شکل ) تغییر

فرمت به عملیاتی های داده فرمت از ) EDWتبدیل بعد( captureاعمال

هدفscrub داده مقادیر در خطاها تصحیح کردناز هدف حالیکه در داده Transformationهاست تبدیل

فرمت به است EDWها

lode and index) ایندکس ) و بارگذاری در شده انتخاب های داده کردن ایجاد EDWبار و

نیاز مورد ایندکسهای ايندکس از bitmapاستفاده

Page 12: به نام خدا انبار داده ها

12

توابع Transformationانواع رکورد سطح در توابع

selection وjoin وaggregation وnormalization

فیلد سطح در توابع فیلدی تک فیلدی چند

Page 13: به نام خدا انبار داده ها

13

مورد های داده تولید ابزارهای توافق

: انواع کنند می کنترل را ها داده کیفیت که ابزارهایی

Analyze پاک برای هایی توصیه و سنجد می را ها داده کیفیت

می تبدیل و استخراج از قبل ها داده سازماندهی و سازیدهد

WizRules قوانين استخراج و رکوردها همه جستجوي ميکنند ارضا را قوانين که رکوردهايي کردن مشخص

دهند می انجام را داده تبدیل عمل که ابزارهایی دهند می انجام را داده پاکسازی عمل که ابزارهایی

Page 14: به نام خدا انبار داده ها

14

داده تبدیل ابزارهای : اصلي کارهاي

استخراج تبدیل ایندکس و بارگذاری

فایلهای از گر توصیف فایل یک یا شما یک ورودی بعنوان آنهاکنند می دریافت را تبدیل قوانین ونیز مقصد و مبداء

یا و الگوریتم ، فرمول صورت به ] معموال تبدیل قوانین هستند Lock up جداول

کنند می تولید را تبدیل عمل اجرای برای الزم کد ابزارها این

Page 15: به نام خدا انبار داده ها

15

ها داده سازی پاک ابزارهای

: اصلي کارهاي ها داده کیفیت تحلیل ها داده سازی پاک ها پدیده بین ارتباطات و قوانین کشف

: ابزارها اين جمله ازIntegrity

Page 16: به نام خدا انبار داده ها

16

شده مشتق اليه

فواید و : data martاهداف گیری تصمیم های برنامه برای آسان استفاده ساختن فراهم کاربران های جو و پرس برای کم پاسخ زمان سازی فراهم خاص های گروه به ها داده بندی سته د های برنامه و تصادفی های جو و پرس از data mining پشتیبانی

مشخصاتdata mart باید شده خالصه های داده هم و شده جرئی های داده هم

باشند موجود پخششوند مختلف سرورهای روی ها داده باشد ای ستاره شمای صورت به ] ترجیحا داده جدول

Page 17: به نام خدا انبار داده ها

17

های داده تحلیل و جو و پرس هاي ابزاردر شده data martو data warehouseذخیره

جوهای و پرس و گیری گزارش ابزارهای تجاری

ابزارهایOLAP ابزارهایData mining ابزارهایData visualization

Page 18: به نام خدا انبار داده ها

18

Data miningابزارهای

OLAP .... و ؟ هل متأ یا است بیشتر مجرد افراد برای مان در هزینه

Data mining حقایق از ای مجموعه یا الگوها دنبال

اهدافData mining Explanatory

ها پیشامد و شرایط علت توضیحConfirmatory

نظریه رد یا یید تأExploratory

نشده بینی پیش ارتباطات برای ها داده تحلیل

Page 19: به نام خدا انبار داده ها

19

IQL

نوع داراي و تابعي زبان مرتب زوج از {x,y,z}پشتيباني ليست از [x,y,z]پشتيباني

پيشوندي توابع ,)=>( ,)=<( ,)>( ,)<( ,)=!( ,)=( ,)/( ,)*( ,)-( ,)+(and, or, not, if

ميانوندي توابع)++( , )--(

از استفاده با جديد lambda abstractionsتوابعlambda {x,y,z} ((*) ((+) x y) z)

Page 20: به نام خدا انبار داده ها

20

IOL ادامه let v = q1 in q2

let v = ((+) 200 500) in ((*) v v) union : R ++ S duplicate elimination: distinct )R( setUnion R S Ξ distinct )R ++ S( difference : R – S projection : ]}x,z{ | }x,y,z{ >- R[

Page 21: به نام خدا انبار داده ها

21

IOLادامه Cartesian product :

[{x1,y1,z1,x2,y2,z2,x3} | {x1,y1,z1} <- R; {x2,y2,z2} <- S; {x3} <- T]

Joins [{x1,y1,z1,x2,y2,z2} | {x1,y1,z1} <- R; {x2,y2,z2} <- S; (=) y1 y2]

Grouping and Aggregation Operations count R sort R distinct R

Page 22: به نام خدا انبار داده ها

22

IOLادامه Grouping and Aggregation Operations

max [y | {x,y,z} <- R] min [y | {x,y,z} <- R] sum [z | {x,y,z} <- R] avg [z | {x,y,z} <- R] group [{x,{y,z}} | {x,y,z} <- R] gc agFun xs

groups xs on their first component apply agFun to the second component

map f xs applies f to each member of xs

Page 23: به نام خدا انبار داده ها

23

از AutoMedدر IQLاستفاده

: اصلي کليد قيد اعمال مثال(=) (count (distinct [n | {s,n} <- <<Student,name>>])) (count

<<Student>>) Name : field Student : table

Page 24: به نام خدا انبار داده ها

24

مسير از transformationمثالي

Page 25: به نام خدا انبار داده ها

25

مسير از مثالي ادامهtransformation

TS1,S2 = addNode (dept,{“Maths”,“CompSci”}); addNode (person, [x| x mathematician] ++ [x| x compScientist]); addNode (avgDeptSalary, {avg [s| (m,s)«_, mathematician, salary»]} ++ {avg [s| (c,s)«_, compScientist, salary»]}); addEdge («_, dept, person», [( “Maths”, x)| x mathematician] ++ [(“CompSci”, x) | x compScientist]); addEdge («_, person, salary», «_, mathematician,salary» ++ «_,

compScientist, salary»); addEdge («_, dept, avgDeptSalary», {( “Maths”, avg [s| (m,s) «_,

mathematician, salary»]),

Page 26: به نام خدا انبار داده ها

26

مسير از مثالي ادامهtransformation

(“CompSci”, avg [s| (c,s)«_, compScientist, salary»])}); delEdge («_, mathematician, salary», [(p, s)| (d, p) «_, dept, person»;

(p’, s) «_, person, salary»; d = “Maths”; p = p’]);

delEdge («_, compScientist, salary», [(p, s)| (d, p) «_, dept, person»; (p’, s) «_, person, salary»;

d = “CompSci”; p = p’}); delNode (mathematician, [p| (d, p) «_, dept, person»; d = “Maths”]); delNode («compScientist», [p| (d, p) «_, dept, person»; d =

“CompSci”]);

Page 27: به نام خدا انبار داده ها

27

Incremental view maintenance Di : set of base relations ΔDi : bags inserted into Di ⌂Di : bags deleted from Di V : materialized view ΔV : bags inserted into V ⌂V : bags deleted from V Vnew = (V ++ ΔV) -- ⌂V

شرطMinimality : ΔV C V ΔV∩ ⌂V = Ø

Page 28: به نام خدا انبار داده ها

28

Incremental viewادامه maintenance

Page 29: به نام خدا انبار داده ها

29

Incremental viewادامه maintenance

Page 30: به نام خدا انبار داده ها

30

ها : مقاله ليست Research Issues in Data Warehousing Modeling Multidimensional Databases Improving Data Warehouse and Business Info

rmation Quality Aspects of Data Modeling and Query Processi

ng for Complex Multidimensional Data

Page 31: به نام خدا انبار داده ها

31

ها : مقاله ليست Data Warehouse Data Policy Tracing Data Lineage Using Schema

Transformation Pathways Using AutoMed Metadata in Data

Warehousing Environments A System Prototype for Warehouse View

Maintenance

Page 32: به نام خدا انبار داده ها

32

ها : مقاله ليست Incremental view maintenance and data

lineage tracing in heterogeneous database environments

A Tutorial on the IQL Query Language Practical Lineage Tracing in Data

Warehouses A Framework for supporting data integration

using the materialized and virtual approaches

Page 33: به نام خدا انبار داده ها

33

ها : مقاله ليست A logical approach to multidimensional

databases Bitmap Index Design and Evaluation …

Page 34: به نام خدا انبار داده ها

34

؟ سوال