79
ی ی ا ی ف را غ ج عات لا طی ا مها ت س سی اول ل ص ف

Amirkabir University of Technology - فصل اول سیستمهای ...ceit.aut.ac.ir/.../Repoerts/BscThesis.Taheri.docx · Web viewگونه ای سیستم تصویر استوانه

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

فصل اول سیستم های اطالعات جغرافیایی

تعریف سیستم اطالعات جغرافیایی.1.1

هاي كامپيوتري دانست كه براي ذخيره را سيستمGISتوان در يك تعريف پايه و عمومي مي ه,ا عالوه ب,ر ذخ,يره وت,ر اين سيس,تمروند. در تعري,ف کام,,لو بازيابي اطالعات جغرافيايي بكار مي

بازيابي اطالعات جغرافيايي بايد قادر به شاخص دهي اطالع,,ات مك,,اني و انج,,ام پ,,رس و ج,,و ب,,رروي آنها نيز باشند.

در طبقه بن,,دی زمینه ه,,ای مطالع,,اتی و تحقیق,,اتی ن,,یز سیس,,تم اطالع,,ات جغرافی,,ایی زیرمجموعه سیستم های اطالعاتی قرار گرفته است. این تعاریف و طبقه بندی ها به این معناس,,ت که سیستم اطالعات جغرافیایی از جنس سیستم های اطالع,,اتی اس,,ت ک,,ه ب,,ه ص,,ورت خ,,اص ب,,ر داده های مکانی و جغرافیایی متمرک,,ز ش,,ده اس,,ت و تالش آن ب,,ر این ق,,رار گرفت,,ه ک,,ه مجموع,,ه امکانات و قابلیت هایی در اختیار کاربر نهایی قرار ده,,د ک,,ه ک,,ار ب,,ا اطالع,,ات مک,,انی را س,,اده تر،

سریع تر و دقیق تر سازد. از نگاهی دیگر، سیستم اطالعات جغرافیایی را می توان فصل مشترک چهار علم م,,دیریت

بانک های اطالعاتی، کارتوگرافی نقشه، دورسنجی و طراحی به کمک کامپیوتر دانست.

1-1شکل

چهارچوب ادراکی سیستم های اطالعات جغرافیایی.1.2

سیس,,,تم اطالع,,,ات جغرافی,,,ایی زیرمجم,,,وعه ای از سیس,,,تم های اطالع,,,اتی اس,,,ت. در سیستم های اطالعاتی دو جریان اص,,لی وج,ود دارد. یکی جری,,ان داده و دیگ,ر پردازش ه,ا. جری,,ان داده ها متأثر از نوع داده های موجود در آن سیستم اطالعاتی اس,,ت و پردازش ه,,ایی انجام ش,,ونده بر داده ها متأثر از روابط میان داده ها می باشد. از این روی، ما برای درک ی,,ک سیس,,تم اطالع,,ات

جغرافیایی، بررسی خود را به دو جنبه مهم آن ها سازماندهی داده ه,,ا و رواب,,ط داده ه,,ا معط,,وفمی کنیم.

ساختار و سازمان داده ها.1.1.1

در يك سيستم اطالعات جغرافيايي با دو طبيعت مختلف از داده ها روبرو هستيم :هاي مكانيداده.1هاي غيرمكاني يا توصيفي داده.2

-هاي اطالعات جغرافيايي با ديگ,,ر سيس,,تمهاي مكاني كه مهمترين وجه تمايز سيستمداده هاي اطالعاتي هستند، نشان دهنده شكل و م,,وقعيت اش,,ياي جغرافي,,ايي موج,,ود در سيس,,تم مي

ه,,اي رايج ك,,اراكتري و ع,,ددي هس,,تند ك,,ه ب,,رايهاي غيرمكاني يا توصيفي هم,,ان دادهباشند. داده ي جغرافي,,اييتوصيف ويژگيها و خصوصيات يك شيء مانند نام، رنگ و ساير مشخصاتي ك,,ه جنب,,ه

هاي مك,,اني الح,,اق ش,,ده وها به دادهگيرند. به عبارت ديگر اين دادهندارند، مورد استفاده قرار ميكنند.آنها را توصيف مي

روابط ميان داده هاي مكاني.1.1.2

ه,,اي اطالع,,اتي اس,,ت ك,,ه در مدلس,,ازي و پ,,ردازشهاي سيستمروابط مكاني يكي از جنبهگيرد. ها مورد توجه قرار ميداده

اين روابط به دو دسته زير تقسيم مي شوند :

:اي روابط غير عددي هندس,ي ك,,ه بي,,ان كنن,ده خصوص,يات پيوس,تهتوپولوژيكال مانند همسايگي دوشيء، اشتراك دو شيء و... مي باشد.

:اي نظ,,ير فاص,,له روابط عددي هندسي ك,,ه خصوص,,يات غيرپيوس,,تهپروكسيمال دوشيء، محيط و يا مساحت يك شيء را بيان مي كند.

هاي نمايش داده هاي مكانيقالب.1.3

هاي مكاني را مي توان به دو صورت نمايش داد :داده

( برداريvector)( تصويريraster)

ي جغرافيايي در دو ق,,الب ب,رداري و تص,ويري نم,ايش داده نمايش يك ناحيه5-2در شكل -ب نم,,ايش اين ناحي,,ه در5-2دهد. شكل -الف ناحيه جغرافيايي را نشان مي5-2شده است. شكل

باشد.-ج نمايش اين ناحيه در قالب تصويري مي5-2قالب برداري و شكل

يك ناحيه 2-1شکل نمايش 3-1شکل جغرافيايي

برداري نمايش 4-1شکل

تصويري

اي از اشياي مجزا و گسسته در نظ,,ر گرفت,,هها به عنوان مجموعهدر نمايش برداري، داده ه,,اي مك,,انيهاي مكاني براي انجام انواع تجزيه و تحلي,,لشوند و بنابراين اين قالب نمايشي دادهمي

شوند كه عبارتند از :بسيار مناسب است. اشياء در اين ساختار به سه نوع تقسيم مي

Point(Node)اشيايي كه در سيس,تم جغرافي,ايي ب,,ه ص,ورت ي,,ك نقط,,ه ظ,اهر مي :- شوند. به عنوان مثال از نمايش موقعيت داروخانه ها در يك سيستم اطالعات جغرافيايي ش,,هري

توان نام برد.ميLine (Arc)ش,,وند مانن,,د : اشيايي كه به شكل خطوطي راست يا منحني ظ,,اهر مي

آهن و...مسير رودخانه ها، خيابان ها، راهPolygon(Area)براي نمايش اشياي بس,,يط و داراي مس,,احت در س,,اختار ب,,رداري :

ي يك درياچه، شهر، جنگل و...شود، مانند حوزهاستفاده مي

ه,,ا نم,,ايش دادهاما در نمايش تصويري عناصر جغرافيايي به صورت مجموعه اي از پيكسل-ي دادهشود. هر الي,,هاي استفاده ميهاي مختلف دادههاي سلولي در اليهشود و معموال از شبكهمي

ه,,ايه,,ا در سيس,,تم نم,,ودار س,,اختارداده5دهد. در ش,,كل اي خواص مختلفي از اشياء را نشان مياست.اطالعات جغرافيايي نمايش داده شده

هاي اطالعات جغرافياييها در سيستمنمودار ساختار داده 5-1شکل

ه,,اشود، بخش ديگ,,ري از اطالع,,ات غيرمك,,اني را ف,,راداده ديده مي5همانطور كه در شكل هاي موج,,ودهاي اصلي سيستم نيستند بلكه اطالعاتي در مورد دادهها دادهدهند. فرادادهتشكيل مي

ي ع,ددي م,ورد اس,تفاده در ه,ر بع,د از مختص,ات. ب,ه عن,وان مث,ال ب,ازه1كننددر سيستم تهيه مي ه,,ايه,,اي جغرافي,,ايي از مهم,,ترين ف,,رادادهجغرافيايي و همچنين مقياس نم,,ايش اش,,كال و نقش,,ه

شوند.محسوب مي GISهاي سيستم نمایش برداری اشیا جغرافیایی مس,تقل از کیفیت و وض,وح تص,ویر ورودی اس,ت. ب,ه این معنا که اطالعاتی که در یک نمایش برداری قرار دارند را می توان در هر اندازه ای نمایش داد. اما نمایش تصویری تابعی از کیفیت و ضوح تصویر است. به این معنا که چگالی تص,,ویر در ه,,ر واح,,د نمایانگر کیفیت تصویر و اندازه پیکسل یا کوچکترین جز قابل تشخیص است. این کیفیت مت,,أثر از

عوامل سخت افزاری مانند قدرت دوربین یا اسکنر است.

کیفیت و وضوح نمایش برداری و تصویری و قابلیت بزرگنمایی6-1شکل

1 Metadata: data about data

امکانات و قابلیت های سیستم اطالعات جغرافیایی.1.4

با توضیحاتی که در قسمت قبل داده شد، امید است خواننده درک کلی ای از ی,,ک سیس,,تم اطالعات جغرافیایی با توجه به نوع داده ه,,ای آن و رواب,,ط و عملگره,,ای تعری,,ف ش,,ونده ب,,ر روی آن ها بدست آورده باشد. با این مقدمه به سراغ تشریح قابلیت های م,,ورد انتظ,,ار از ی,,ک سیس,,تم

اطالعات جغرافیایی می رویم.

پشتیبانی از سیستم های مختصات جغرافیایی گوناگون.1.4.1

توصیف موقعیت و شکل دقیق اشیا نیازمند چارچوبی برای تعریف دنی,,ای واقعی ی,ا هم,,ان زمین است. یک دستگاه مختصات جغرافیایی ب,,رای انتس,اب م,وقعیت جغرافی,ایی ب,,ه اش,یا بک,ار می رود. دس,,تگاه مختص,,,ات جه,,,انی ت,,,رکیب ش,,ده از ع,,رض و ط,,ول جغرافی,,,ایی یکی از این دستگاه هاست. دستگاه دیگر دستگاه مخص,,ات ک,,ارتزین ی,,ا مس,,طح اس,,ت ک,,ه از هم,,ان دس,,تگاه مختص,,ات جه,,انی مش,,تق ش,,ده اس,,ت. نقش,,ه ها اش,,یای روی زمین را ب,,ا اس,,تفاده از ش,,بکه های شطرنجی که با اندازه هایی )مانند طول و عرض جغرافی,,ایی( برچس,,ب گ,,ذاری ش,,ده اند، نم,,ایش

داده هاي مكاني از من,ابع مختل,ف و در سيس,تمهاي مختص,ات گون,اگون تولي,,د و ذخ,يرهمی دهند. مي شوند. از آنجايي كه زمين شكل كروي دارد, يكي از راههاي رويت كامل آن, تهيه نقشه كروي كره جغرافيايي از زمين است كه كليه ان,دازه ه,ا ب,,ه ي,,ك نس,بت كوچ,ك ميش,وند، و ليكن رواب,ط هندسي نظير زاويه, مساحت و نسبت فواصل ثابت باقي ميماند. با انتقال سطح كروي، روي ي,,ك سطح مستوي و تهيه نقش,,ه مس,,طح، ميت,,وان روي ي,,ك ب,,رگ نقش,,ه تم,,امي س,,طح ك,,ره زمين را مش,,اهده نم,,ود و براح,,تي فواص,,ل را ان,,دازه گيري ك,,رد. اطالع,,ات مک,,انی از من,,ابع مختلفی تهی,,ه می شوند و ممکن است دارای سیستم مختصات جغرافیایی یکسان نباشند. از این رو یک سیستم اطالعات جغرافی,,ایی بای,,د ق,,ابلیت پش,,تیبانی از سیس,,تم های مختص,,ات جغرافی,,ایی گون,,اگون و در صورت امکان تبدیل آن هابه یکدیگر را داشته باشد. ) با خط,,ای قاب,,ل چشم پوش,,ی( در ادام,,ه این

ب,,ا توج,,هUTMمطلب به تعریف سیستم مختصات جغرافیایی جهانی یا قطبی و سیستم مختصات به کاربرد آن در ایران می پردازیم.

1مختصات جغرافیایی قطبی

سیستمی است برای مشخص ساختن موقعیت کمانی هر یک از نقاط س,,طح زمین ک,,ه از دو مقدار زاویه ای یا قوسی به نام "طول جغرافیایی" و "عرض جغرافیایی" ت,,رکیب یافت,,ه اس,,ت. ب,,رای بی,,ان مختص,,ات جغرافی,,ایی از دو دای,,ره عظیم,,ه بن,,ام دای,,ره اس,,توا و نص,,ف النهاری ک,,ه از رصدخانه گرینویچ می گذرد، به عنوان مبنا های مختصات اس,,تفاده می ش,,ود. مختص,,ات جغرافی,,ایی

قط,,ع ک,,رده اس,ت عب,,ارت اس,,ت ازB که نصف النهار آن دایره اس,,توا در نقط,,ه Mنقطه ای مانند محل تالقی نص,,ف النهارA عرض جغرافیایی که BM به عنوان طول جغرافیایی وقوس ABقوس

مبدا و خط استوا است.

1 Geographic coordinate

2طول جغرافیایی

طول جغرافیایی هر نقطه از سطح زمین عبارت اس,,ت از قطع,,ه قوس,,ی اس,,ت از دای,,ره اس,,توا ک,,ه بین نص,,ف النهار مب,,دأ و نص,,ف النهار م,,ار ب,,ر نقط,,ه مزب,,ور ق,,رار گرفت,,ه باش,,د. ط,,ول جغرافیایی هر نقطه متناسب با واقع شدن آن نقطه در خاور یا باختر نص,,ف النهار مب,,دأ ب,,ه ط,,ول

درج,,ه اس,,ت. پرواض,,ح اس,,ت180خاوری یا باختری تقسیم می شود که اندازه هر کدام ص,,فر ت,,ا کلی,,ه نق,,اطی ک,,ه روی ی,,ک نص,,ف النهار واق,,ع ش,,ده اند، هم ط,,ول ب,,وده و از آنج,,ایی ک,,ه تم,,ام نصف النهارها در نقطه قطب به یکدیگر برخورد می کند، لذا مسافت میان آ نها متناس,,ب ب,,ا ع,,رض جغرافیایی نقاط مختلف، متفاوت است. بدین ترتیب که مسافت یک درج,,ه در روی دای,,ره اس,,توا

درج,ه براب,ر70 کیلوم,تر و در ع,رض 78.48 درجه براب,ر 45 کیلومتر و در عرض 111.32برابر 1 درج,,ه ط,,ول جغرافی,,ایی مع,,ادل 15 کیلومتر و در قطب معادل صفر است. چون هر 38.187

ساعت است از این رو با در دست داش,تن اختالف می,,ان زم,,ان محلی و زم,,ان متوس,ط گرین,,ویچمی توان طول جغرافیایی هر نقطه از سطح زمین را تعیین نمود.

2عرض جغرافیایی

بطور کلی عرض جغرافیایی، عب,,ارت اس,,ت از زاویه ای ک,,ه رأس آن در مرک,,ز ک,,ره زمین واقع شده و پاره قوسی از دایره نصف النهار مار بر نقطه مورد نظر را در حد فاصل نقطه مزبور

درج,ه اس,ت. دایره ه,,ایی ک,ه ب,,ه م,,وازات دای,ره90و خط استوا برابر صفر و در قطب ها معادل استوا روی کره زمین رسم می شوند ، مدارهای عرض جغرافیایی نام دارند و در واقع هر کدام از آن ه,,ا مک,,ان هندس,,ی نق,,اط هم ع,,رض جغرافی,,ایی هس,,تند. ب,,ه ط,,ور متوس,,ط ه,,ر درج,,ه ع,,رض

مایل است.69 کیلومتر یا 111.042جغرافیایی معادل

3 سیستم تصویر مرکاتوری

گونه ای سیس,,تم تص,,ویر اس,,توانه ای ک,,ه ب,,رای تهی,,ه نقش,,ه جهان نم,,ا بک,,ار می رود. در اینGerhardسیستم که نخستین بار به وسیله Mercator ب,رای نقش,ه جهان نم,,ا بک,ار1569 در س,ال

گرفته شده است. نصف النهارها به صورت خط های راست و عمودی و متساوی الفاصله و مدارها نیز بشکل خط های مستفیم و مختلف الفاصله ) که هر چ,,ه از اس,,توا دور ش,,ویم ب,,ه فاص,,له می,,ان آن ها افزوده می شود.( تصویر می گردد. این سیستم در پیرامون خط استوا که محل تم,,اس ک,,ره زمین با استوانه تصویر است دارای دقت کافی بوده و هر چه از آن دور شویم از دقت آن از نظر

60 درجه ک,,ه در م,,دار 1*1شکل و مساحت کاسته می شود. بطوریکه مثال قطعه زمینی به ابعاد درجه عرض جغرافیایی واقع شده اس,,ت هم از نظ,,ر پهن,,ا و هم از نظ,,ر درازا ب,,ه دوبراب,,ر ان,,دازه حقیقی و چهار برابر مساحت واقعی تصویر گردیده است. به همین دلی,,ل قاعدت,,د از این سیس,,تم

2 Longitude

2 Latitude

3 Mercator’s Projection

درج,,ه اس,تفاده نمی ش,ود. یکی از م,وارد اس,تعمال این سیس,,تم80برای تصویر مناطق باالتر از تهیه چارت های دریانوردی و هواشناسی است.

1شبکه بندی یو.تی.ام

درجه ش,,مالی80شبکه بندی نقشه ای خاصی که مخصوص مناطق واقع در میان مدارهای درج,,ه جن,,وبی اس,,ت و در واق,,ع مکم,,ل سیس,,تم تص,,ویر مرک,,اتور ب,,وده و اس,اس آن ایج,,اد80و

شبکه های قائم الزاویه صد کیلومتری در شمال و جنوب خط استوا است.

قابلیت ورود و پذیرش داده ها.1.4.2

یکی از مواد اصلی هر پایگاه داده ای، داده های آن اس,,ت و اساس,,ا ن,,وع داده، حجم داده و س,,اختارهای تعری,,ف و اس,,تفاده از آن در معم,,اری پایگ,,اه داده اث,,ر بس,,زایی دارد. س,,امانه های اطالعات جغرافیایی نیز از این قانون مستثنی نیستند. با توجه ب,,ه م,,اهیت اطالع,ات جغرافی,,ایی و نحوه تولید آن، داده یکی از مهم ترین قسمت های یک سامانه اطالعات جغرافی,,ایی اس,,ت. ب,,ر این

اساس ما به قسمت های زیر می پردازیم. باید قابلیت پذیرش و ورود داده ها را داشته باشد. از آنجایی که من,,ابعGISیک نرم افزار

تولید کننده اطالعات جغرافیایی منابعی متنوع هستند و این اطالعات گ,,اه در ح,,الت خ,,ام توس,,ط کامپیوتر قابل استفاده نیستند، باید به طریقی این داده ها را وارد کامپیوتر و به ط,,ور خ,,اص وارد

کرد تا قابل استفاده گردد. برای جلوگیری از پراکندگی و گستردگی غیرقابل کنترلGISنرم افزار مطالب، مباحث تفصیلی در مورد روش های تولید و پذیرش داده ه,,ای جغرافی,,ایی در بخش بع,,دی

آمده است.

پشتيباني از ساختار توپولوژيك داده ها.1.4.3

به مفهومی می توان توپولوژی را دانشی دانست که ب,,ه مطالع,,ه پیوس,,تگی می پ,,ردازد. ب,,ا آغ,,از از پیوس,,تگی فض,,ا ی,,ا ش,,کل، ب,,ه س,,مت تعمیم ح,,رکت می کن,,د و س,,پس از روی قی,,اس و شبیه سازی خ,,ود را ب,ه درکت ت,ازه ای از مفه,,وم پیوس,تگی می رس,اند و در نتبج,ه از تص,,وری ک,ه

درباره فضای عادی در ذهن خود داریم، به کلی دور می شود. متخصص توپولوژی، به ویژگی های چیزهایی )که هن,,وز آن ه,,ا را ب,,ه مفه,,وم هندس,,ی تعب,,یر می کنیم( عالقه مند است که به اندازه کافی پایدار باشند. یعنی ویژگی هایی که ضمن تغی,,یر ش,,کل

چیز با کش دادن و به هم فشردن ان تغییر نکند. تنها تغییر شکلهایی در توپولوژی مجاز است که پیوستگی شیئ را از بین نبرد و آنچه را از هم جداست به هم نپیوندد. برای درک بهتر موضوع مفتولی را در نظر بگیرید که ب,,ه ش,,کل دای,,ره در آمده است و دو انتهای آن به هم متصل است. می توان این مفتول را بدون پ,,اره کردن ب,,ه ی,,ک مربع یا مثلث تبدیل کرد. حال فرض کنید روی این مفتول نقاطی را نشانه و نامگ,,ذاری ک,,رده ایم. در تبدیل اشیاء به یکدیگر این نشانه ها ثابت می مانند و توالی آنها نیز حفظ می شود. حال اگر به

1 UTM Grid

جای مفتول از یک سیم الستیکی استفاده کنیم، باز هم نشانه ها هستند و توالی خود را حف,,ظ میکنند. حتی اگر با کشیدن سیم الستیکی، فاصله آنها را از هم بیشتر کنیم.

در توپولوژی به چنین ویژگی هایی عالقه مندیم. ویژگی هایی که عل,,یرغم تغی,,یر ش,,کل ث,,ابت باقی می مانند. این تعریف و ارائه ذهنیتی از توپولوژی در ریاضیات است. با درک دقیق تر مفه,,وم توپولوژی، معنای آن را در جغرافیا ن,,یز درک می ک,,نیم. در جغرافی,,ا نقش,ه هایی ب,,ه ن,ام نقش,ه های توپولوژیک وجود دارند که در آن اندازه و موقعیت واقعی چندضلعی ها م,,دنظر نیس,,ت. بلک,,ه مهم ارتباط ها، همسایگی ها و دیگر روابط چندضلعی ها در کنار یکدیگر است. ب,,ا این مقدم,,ه ب,,ه س,راغ

می رویم.GISتعریف توپولوژی و روابط مکانی در در حوزه سیستم اطالعات جغرافیایی، توپولوژي به معناي اتصال و داشتن رواب,,ط مك,,اني

امك,,ان تعري,,ف رواب,,طGISباشد. يكي از قابليتهاي اشياي مختلف موجود در سيستم با يكديگر مي سيس,,تمGISباشد. بكارگيري يك ساختار توپولوژيكي در مكاني ميان اشياي مختلف جغرافيايي مي

ها و جوابگويي به پرسش,,ها را دارا ش,,ود.سازد تا قابليت انجام بسياري از تجزيه و تحليلرا قادر مي به عنوان مثال، براي تعيين بهترين مسير بين دو نقطه, از رواب,,ط توپولوژي,,ك بين راهه,,ا اس,,تفاده

شود.شده و بهترين مسير انتخاب مي

هاي مكانيمثالي از يك ساختار توپولوژيك داده 7-1شکل

تبادل اطالعات با دیگر نرم افزارها.1.4.4

سيس,,تم اطالع,,ات جغرافي,,ايي، عالوه ب,,ر دري,,افت داده، در فرمته,,اي متن,,وع و از من,,ابع ه,,اي مختل,,ف ب,,هاطالعاتي مختلف, بايد بتوان,,د اطالع,,ات موج,,ود در پايگ,,اه داده خ,,ود را در ف,,رمت

خروجي بفرستد. با توجه به اينكه براي انجام بعضي پردازشها, نرم افزاره,,اي خاص,,ي وج,,ود دارد,GISبايد بتواند اطالعات مورد نياز آن نرم افزارها را با فرمت قابل قبول نرم اف,,زار تولي,,د كن,,د و

سپس بعد از انجام پردازش مورد نياز، اطالعات را دريافت و به فرمت قاب,,ل پ,ذيرش ب,راي خ,ودتبديل كند. در اين تبادل داده, مي بايست حداقل اطالعات ممكن از دست برود.

روش های تولید اطالعات جغرافیایی.1.5

با توجه به اینکه فرمت و شکل اطالعات جغرافیایی در حالت ابتدایی چگونه اس,,ت، روش متفاوت است. به عنوان مثال ی,,ک نقش,,ه ک,,ه ب,,ر رویGISها و ابزارهای ورود آن ها به نرم افزار

تولید می شود، می تواند ب,هGPS شود، اما داده هایی که توسط 1کاغذ رسم شده است باید رقمی صورت مستقیم وارد کامپیوتر شود. در زیر روش های کلی تولی,,د اطالع,ات جغرافی,,ایی و راه ه,ای

پذیرش آن ها را توضیح می دهیم. وارد کردن داده به معن,,ای وارد ک,,ردن اطالع,,ات منب,,ع ب,,ه ص,,ورت قاب,,ل اس,,تفاده توس,,ط نرم افزار است و انتقال درست آن متضمن ایجاد یک پایگاه داده دقیق است. معموال حجم زی,,ادی

صرف وارد کردن اطالعات آن و ب,,روز ک,,ردن می ش,,ودGISاز زمان و هزینه تولید و نگهداری یک درصد تخمین زده می شود. روش ها یا منابع تولی,,د داده ی جغرافی,,ایی80 تا 60که این نسبت بین

در حالت کلی به چهار دسته زیر تقسیم می شود.

رقمی سازی دستی و و اسکن کردن نقشه های آنالوگورود اطالعات به صورت مستقیم به کامپیوتروارد کردن عکس های هوایی و ماهواره ایانتقال اطالعات از منابع موجود کامپیوتری

رقمی سازی دستی و اسکن کردن نقشه های آنالوگ.1.5.1

تصویر هایی ب,,ا رن,,گ ی,,ا تن خاکس,,تری پیوس,ته، مانن,د ی,ک عکس را تص,ویرهای آن,,الوگ ی,,ا مانستی می نامند. از سوی دیگر، یک گروه از سلول های کوچک تقسیم شده با مق,,دارهای ع,,ددی صحیح از شدت میانگین را که نشان دهنده شدت مرب,,وط ب,,ه مرک,,ز س,,لول اس,,ت، تص,,ویر رقمی نامی,,ده می ش,,ود. تقس,,یم بندی مک,,انی ب,,ه گ,,روهی از س,,لول ها را نمونه گ,,یری می گوین,,د و تب,,دیل

تصویرهای آنالوگ به داده های تصویری رقمی را کوانتش می نامند. یک سلول تقسیم شده منفرد را پیکسل ی,,ا ج,,ز تص,,ویری می گوین,,د. ش,,کل س,,لول معم,,وال برای سهولت استفاده در کامپیوتر به صورت مربع است، اگرچه به صورت مثل,,ثی و شش ض,,لعی نیز در نظر گرفته می ش,,ود. ی,,ک تص,,ویر رقمی دارای مختص,,اتی از ش,ماره ی جزه,,ای تص,,ویری و شماره ردیف است که به طور معمول از چپ به راست برای ش,,ماره ج,,ز تص,,ویری و از ب,,اال ب,,ه

پایین برای شماره ردیف حساب می شود. مهم ترین عامل در نمونه گیری، اندازه جزء تص,,ویری ی,,ا فرک,,انس ی,,ا ف,,راوانی نمونه گ,,یری است. اگر اندازه جز تصویری بزرگ یا فرکانس نمونه گیری کم باشد ظاهر تصویر بد خواهد ش,,د، در حالی که در حالت عکس حجم داده های خیلی زیاد خواهد بود. بنابراین نمونه گیری باید به دقت

انجام شود.

1 Digitize

قضیه نمونه گیری شانون برای مش,,خص ک,,ردن ح,,الت مطل,,وب نمونه گ,,یری در زی,,ر آم,,دهاست:

"اگر نمونه گیری با نصف فراوانی ماکزیمم در فرکانس موج آنالوگ اولی,,ه ص,,ورت پ,,ذیرد،هیچ اطالعاتی از دست نخواهد رفت."

رقمی سازی به فرآیند تبدیل اطالعات آنالوگ مانند نقشه ها به اطالع,,ات رقمی ک,,ه قاب,,ل استفاده توسط کامپیوتر است گفته می شود. رقمی سازی می تواند دستی، نیمه اتوماتیک و تم,,ام

اتوماتیک باشد. ک,,امپیوتر ب,,ا اس,,تفاده از م,,یز1رقمی س,,ازی دس,,تی روش,,ی اس,,ت ک,,ه در آن ی,,ک ک,,ارور

رقمی س,,ازی ی,,ا ص,,فحه ک,,امپیوتر ب,,ه تب,,دیل اطالع,,ات آن,,الوگ ب,,ه دیجیت,,ال می پ,,ردازد. ی,,ک م,,یز رقمی سازی دارای یک شبکه ری,,ز اس,,ت ک,,ه در آن تعبی,,ه ش,,ده اس,,ت. این ش,,بکه مانن,,د دس,,تگاه

ک,ه ش,بیه2پاکمخصات کارتزین است. روند کار به این صورت است که کارور با استفاده از یک موس است، اطالعات را به صورت نقطه و خط و چندض,,لعی وارد می کن,,د. ب,,ا اس,,تفاده از مح,,ل ضربه ای که پاک وارد می کند و ب,,ا توج,,ه ب,,ه مب,,دأیی ک,ه ب,,رای این م,,یز ک,,ار تع,یین ش,ده اس,ت،

می توان محل اشیا را مشخص کرد. دو حالت برای وارد کردن اطالعات وجود دارد.

نقطه ایجریانی

وضوح و کیفیت نقشه بستگی به این دو حالت دارد. در حالت نقطه ای کارور تنها نقاطی از یک شکل را که برای نم,ایش آن ش,کل، حی,اتی ب,ه نظر می آید را وارد می کند. در این حالت کارور باید نکاتی در مورد اینک,,ه در اش,,یا مختل,,ف نق,,اط

حیاتی نمایش، کدام هستند، بداند. در حالت جریانی، دستگاه به صورت خودکار با توجه به فاصله یا زم,,ان طی ش,,ده نس,,بت به ایجاد نقطه قبلی، نقطه جدیدی ایجاد می کند. دراین حالت ممکن است وضوح و کیفیت در ح,,د

باالیی قرار گیرد. در مقابل رقمی سازی با استفاده از میز رقمی ساز، می ت,,وان از ک,,امپیوتر ن,,یز ب,,ه عن,,وان

ن,یز4 گفته می شود و تع,دادی آن را س,رباال3میز رقمی سازی استفاده کرد. به این روش برصفحه

1 Operator

2 Puck

3 On-Screen

4 Head-up وارد کردن8-1شکل

اطالعات مکانی بهصورت جریانی

وارد کردن9-1شکل اطالعات مکانی به

صورت نقطه ای

می گویند. چرا که بر خالف رقمی سازی با میز رقمی ساز که سر به سمت پایین متمایل است، در این حالت سر کارور به مقابل می نگرد. رقمی سازی برصفحه برای ایجاد الیه های مختلف بر روی نقشه هایی که اسکن شده اند، یا ویرایش و افزودن اطالعات به نقشه های دیجیتالی که با استفاده از روش قبلی ایجاد شده اند به کار می رود. در حالت رقمی سازی سرپایین منب,,ع ی,,ک کاغ,,ذ اس,,ت در حالی که در رقمی سازی سرباال منبع ی,,ک فای,,ل ک,,ه از اس,,کن ک,,ردن نقش,,ه ها ایج,,اد ش,,ده ی,,ا

خروجی رقمی سازی سرپایین است، استفاده می شود. وی,,رایش نقش,,ه های دیجیت,,الی ش,,امل برط,,رف ک,,ردن خطاه,,ای ورود داده، وارد ک,,ردن

اطالعات از قلم افتاده و ایجاد توپولوژی است.

تعیین مختصات جغرافیایی تصویر رقمی شده

مختصات کارتزین یک میز رقمی ساز یا ی,ک ص,فحه ک,,امپیوتر مس,طح بای,,د ب,ه مشخص,ات جغرافیایی استفاده شود. برای این منظور از نقاط کنترلی استفاده می کنند. همچنین باید مقیاس نقشه مشخص باشد. در این روش چند نقطه کنترلی که مختصات جغرافیایی آن ها کامال مشخص است را به عنوان نقاط کنترلی می شناسانند. مختصات نقاط دیگر با توجه به این نقاط کنترلی و همچنین مقیاس تعیین می گردد. بهتر است ب,,رای دفع,,ات مختل,,ف دیجیت,,الی ک,,ردن ی,,ک نقش,,ه از

نقاط کنترلی یکسان استفاده شود. کمینه تعداد این نقاط دیجیتالی چهارتاست.

میز رقمی ساز10-1شکل

1ورود مستقیم داده .1.5.2

2سیستم موقعیت یاب جهانی

مجموعه ای از سخت افزار و نرم افزار است ک,,هGPSسیستم موقعیت یاب جهانی یا همان برای تعیین موقعیت دقیق نقاط روی س,,طح زمین ط,,راحی ش,,ده اس,,ت. این ک,,ار ب,,ا اس,,تفاده از

1 Direct data entry

2 Global Positioning System(GPS)

سیگنال های دریافت شده از ماهواره ها ممکن است. اطالعات مکان ها و سایر ص,فات آن ه,,ا قاب,,ل ها می توانند نق,,اط انف,,رادی، خص,,وط و من,,اطق را در ه,,ر ت,,رکیبGPS هستند. GISارسال به یک

جمع آوری کنند. به عالوه و مهم تر اینکه ب,,ا اس,,تفاده ازGISممکن برای یک پروژه نقشه برداری یا GPS)می توان مجموعه ای پیچیده تر از داده جغرافیایی ) یعنی داده هایی عالوه بر م,,وقعیت نقط,,ه

را به صورت اب,,زاریGPSتعریف کرد و به صورت دقیق و کارا آن را محاسبه کرد. این ویژگی ها، همچ,,نین اب,,زاری م,,ؤثر ب,,رایGPSک,,ارا ب,,رای جمع آوری داده ه,,ای جغرافی,,ایی درآورده اس,,ت.

جمع آوری اطالعات نقاط کنترلی اس,,ت ک,,ه ب,,رای مرجع جغرافی,,ایی کردن اطالع,,ات ناش,,ناخته ک,,ه عبارتند از مرجع جغرافی,,اییGPSدارای نقاط مشخص نیستند، به شمار می رود. کاربردهای دیگر

با اندازه گیری فاصله میان ماهواره هایی ک,,ه در م,,دار زمینGPS . 2، موقعیت یابی و هدایت1کردن،x به محاسبه GPSمی چرخند و یک دریافت کننده y و z می پردازد. تجهیزات GPSبه ص,,ورت های

زیر قابل دسترس است:

بسته های کوچک دستیبسته های جاسازی شده در اتومبیلروی موبایلدر کشتی ها و هواپیماها

GPSدستگاه

، متشکل از سه بخش است. دریافت کننده، آنتن و برآین,,دهGPSدستگاه سخت افزاری یک 3داده

برآینده داده یک ک,,امپیوتر دس,,تی اس,,ت ک,,ه دربردارن,,ده نرم اف,,زاری ب,,رای هم,,اهنگ کردن جمع آوری سیگنال و حافظه، دستکاری فایل ها و ارسال و دریافت فایل به یک کامپیوتر اس,,ت. در برخی دستگاه ها، این قسمت با قسمت دیگری از دستگاه ترکیب شده اس,,ت. نرم اف,,زار دس,,تگاه

که درون این کامپیوتر دستی کار گذاشته شده است دارای چهار عملکرد اولیه است:

4آمادگی

پیش پردازش تصحیح اطالعات خام دریافت شدهنمایش و ویرایش اطالعات اطالعات6و صادرکردن5تبدیل

1 Georeferencing

2 Navigation

3 Data collector

4 Preplanning

5 Convert

آم,,ادگی ش,,امل مش,,خص ک,,ردن دسترس,,ی ب,,ه ماهوراه ه,,ا در زم,,ان و مک,,ان مش,,خص است)تعداد و شدت ماهواره های در دسترس( و نیز آماده کردن دیکش,,نری)مجموع,,ه اطالع,,ات و

مأموریت جمع آوری آن ها را دارد( GPSصفاتی که پیش پ,,ردازش تص,,حیح عب,,ارت اس,,ت از مقایس,,ه اطالع,,ات دری,,افت ش,,ده از م,,وقعیت ماهواره ها با فایلی که دربردارنده این اطالعات است که به ص,,ورت بس,,یار م,,ؤثری ب,,ه اس,,تخراج

اطالعات درست کمک می کند. ویرایش و نمایش اطالعات ش,امل عم,,ل می,,انگین گیری از اطالع,ات نقط,,ه، وص,,ل ک,ردن

و ان,دازه گیری فواص,ل و من,اطق و در نه,ایت1نقاط برای ایج,اد خط,وط و من,اطق، هموارس,ازینمایش بر روی صفحه کامپیوتر است.

کار ویرایش اولیه و ابتدایی را به عهده دارد و عمده کارهای ویرایشGPSبرنامه ویرایش انجام می شود.GISدر

تب,,دیل داده و ص,ادر ک,,ردن ش,امل توان,,ایی تب,,دیل اطالع,ات ک,روی مانن,,د ط,ول و ع,رض جغرافیایی به اطالعات تحت مختصات دیگر است. همچنین نرم افزار باید قابلیت تب,,دیل اطالع,,ات

را داشته باشد. GIS و CADDبه فرمت قابل استفاده توسط

2ماهواره ها

موقعیت و فاصله شناخته شده هر ماهواره ی قابل مش,,اهده، ب,,رای تع,,یین مح,,ل دری,,افت کننده استفاده می شود. وقتی ما فاصله از یک ماهوراه را می دانیم نقاطی ک,,ه ممکن اس,,ت روی آن قرار داشته باشیم یک کره به شعاع فاصله دانسته و مرکزیت آن ماهواره است. هنگ,,امی ک,,ه فاصله از دو ماهواره را بدانیم بر روی دایره ای که از تقاطع دو کره حاصل می ش,,ود ق,,رار داریم. در صورتی که فاصله از سه ماهواره را بدانیم محل تالقی این سه ک,ره، دو نقط,,ه اس,ت. یکی از این دو نقطه درون جو باالتر از سطح زمین یا پ,,ایین ت,,ر از س,,طح زمین ق,,رار می گ,,یرد و ب,,ا کن,,ار گذاشتن این نقطه که روی سطح زمین قرار ندارد یک نقطه باقی می ماند که همان محل دریافت کننده است. اگر تعداد ماهواره ها بیشتر شود، مهر تأییدی ب,,ر م,,وقعیت محاس,,به ش,,ده اس,,ت. در عمل اگر تعداد ماهواره بیشتر باشد بهتر است. عمال چه,,ار م,,اهواره ب,,رای تع,,یین دقی,,ق و دور از

ابهام یک موقعیت کافی است. ش,,وند. اینGPSاجس,,ام زی,,ادی ممکن اس,,ت م,,انع از انتش,,ار س,,یگنال های ماهواره ه,,ای

سیگنال ها قابلیت عبور از ساختمان ها، فلزات و کو ه ها و درختان را ندارند. برگ ه,,ا می توانن,,د این ام,,واج را ض,,عیف و غیرقاب,,ل اس,,تفاده کنن,,د. ممکن اس,,ت ب,,رخی نق,,اط تحت پوش,,ش خ,,وبی از

ماهواره ها باشند اما وجود این موانع دریافت سیگنال را با مشکل مواجه سازد.

6 Export

1 Smooth

2 Satellites

مایلی از سطح10900 دو بار در روز به دور زمین می چرخد. در فاصله GPSیک ماهواره ماهواره در ه,,ر زم,,ان قاب,,ل21 وجود دارد. GPS ماهواره برای تأمین خدمات 24زمین. همواره

ماهواره در نظر گرفته شده اند. 21 ماهواره برای پشتیبانی از این 3دسترس است و م,اهواره قاب,,ل مش,اهده ش,دن هس,تند. کوه ه,ا،6 ت,ا 5برای اغلب نقاط روی ک,,ره زمین ت,,ا از این ماهواره ه,,ا را غ,,یر قاب,,ل دس,ترس س,ازند و2درختان، ساختمان ها ممکن است ی,,ک ی,,ا

گاهی نیز ممکن است ماهواره از مدار خارج شود. به این ترتیب گاهی ممکن است منطق,,ه تحت 4 ماهواره قرار گیرد. اما به طور معم,,ول ب,,رای اغلب نق,,اط زمین مش,,اهده 1 یا حتی 2پوشش

ماهواره ممکن است.

عکس های هوایی و ماهواره ای )دور سنجی(.1.5.3

ای و عکس های هوایی و سایر داده ه,,ایی اس,,ت شامل تصاویر ماهواره1داده های تصویری که از طریق سنجش از راه دور به دست می آید. این داده ها، داده های رقمی هستند ک,,ه طی ی,,ک فرآیند نمونه گیری و کوانتش انرژی الکترومغناطیسی توسط یک سنجنده آشکارس,,ازی می ش,وند.

داده تصویری در قالب رستر ذخیره می شود. قسمت های زیر ممکن است در یک داده تصویری وجود داشته باشد.

زمین های زارعیانواع خاکدریاچه ها و حوزه رودخانه ها و سایر مناطق آبیانواع مختلف حوزه های زمین شناسی

نمونه ای از یک عکس ماهواره ای11-1شکل

سنجش از دور

سنجش از دور به عنوان تکنولوژی و علمی تعریف می شود که بوسیله آن می ت,,وان ب,,دون تماس مستقیم مشخصه های یک شی یا پدیده را تعیین، اندازه گیری یا تجزیه و تحلیل نم,,ود. منب,,ع

1 Image data

داده های سنجش از دور معموال تابش الکترومغناطیسی است که از یک پدیده یا شی بازتابانده ی,,ا گسیل می شود. با این حال هر واسطه دیگری نظیر میدان گرانشی یا مغناطیسی را نیز می ت,,وان در سنجش از دور مورد استفاده قرار داد. وسیله ای که تابش الکترومغناطیسی بازتابیده یا گسیل شده از یک شی یا پدی,,ده را آشکارس,,ازی می کن,,د، س,,نجنده نامی,,ده می ش,,ود. وس,,یله ن,,اقلی ک,,ه سنجنده را حمل می کند، سکو نام دارد. معم,,وال هواپیماه,,ا ی,,ا ماهواره ه,,ا ب,,ه عن,,وان س,,کو م,,ورد

استفاده قرار می گیرند.

گردآوری داده ها در سنجش از دور12-1شکل

تکیه دورسنجی بر نوری است که اشیای تحت مطالعه از خود ساطع می کنند. با توج,,ه ب,,ه انرزی الکترومغناطیسی که ه,,ر ی,,ک از پوش,,ش ه,,ای گی,,اهی و حوزه ه,,ای زمین شناس,,ی از خ,,ود

ساطع می کنند، تنوع آن ها از یکدیگر قابل تشخیص است. دورسنجی توسط ماهواره ها تنها منبعی است که با استفاده از آن می توانیم نوع پوشش

گیاهی یا نوع زمین، تغییرات آن پوشش طی زمان و جمعیت و تراکم و ... را تشخیص دهیم. ماهواره قادر به ارائه نقشه به صورت کام,,ل، ب,,ا هزین,,ه مناس,,ب، و قاب,,ل تک,,رار درح,,وزه زمان و مکان هستند و این پدیده های طبیعی را قابل بررسی و تحلیل می کند و عملیات بررس,,ی

شرایط و وضعیت مناطق می تواند در حوزه های بزرگ مکانی انجام شود. ماهواره همچنین می تواند به عنوان یک منبع مهم برای تولید مدل ها و پاالیش ها آن ها به

کار رود. در هنگام استفاده از تصاویر ماهواره ای، برقراری ارتباط واقعی میان تصویر و اج,,زای آن با آنچه که در سطح زمین وجود دارد، ممکن اس,,ت ک,,ار پیچی,,ده ای باش,,د. این پیچی,,دگی ناش,,ی از

1 م,,تر ت,,ا 10تغییر اندازه هر پیکسل بر روی تصویر ماهواره ای است. این ان,,دازه می توان,,د بین کیلومتر متغیر باشد. به شکل زیر توجه کنید. در شکل زی,,ر در ه,,ر ی,,ک از م,,دخل ه,,ای مش,,بک ها، بیش از یک نوع پدیده ط,بیعی ق,رار دارد. در این ح,الت از می,,ان مس,احت هایی ک,ه در آن م,دخل وجود دارد، مساحتی را که بیش از همه است به عنوان پدیده گیاهی آن مدخل انتخ,,اب می کنن,,د.

با این کار اگر ان,,دازه م,,دخل بیش از ان,,دازه ب,,زرگ باش,,د، ممکن اس,,ت داده ه,,ای از بین برون,,د. بنابراین با توجه به تنوع منطقه ای که از آن عکسبرداری شده است. باید اندازه مدخل را انتخ,,اب کرد. بنابراین متدهای دورسنجی زمانی کارا خواهد بود که مساحت پدیده ط,,بیعی بیش از ان,,دازه

پیکسل باشد.

12 تعیین پوشش مناطق در عکس ماهواره ای شکل 13-1شکل

عکس های هوایی و تفسیر آن ها

اس,,تفاده از عکس ه,,ای ه,,وایی و تفس,,یر آن ه,,ا ب,,ا اس,,تفاده از تکنیک ه,,ای موج,,ود ک,,اربرد بیشتری از عکس های ماهواره ای در کاربردهای زیست محیطی دارد. این کاربرد گسترده تر ریش,,ه

متر( که توسط1در دسترسی بیشتر و نیز قدرت تهیه عکس هایی با وضوح باال )حتی در مقیاس هیچ حسگر دیگری قابل دسترس نیست، دارد.

تحلیل کیفی یک تحلیل توصیفی است و تکیه بر تفسیر تصویر دارد. تحلی,ل تص,ویر توس,ط یک فرد به نام تحلیلگر انجام می شود و از آن جایی که این تفسیر توسط انسان انجام می شود، از انسانی به انسان دیگر با توجه به مهارت و تجربه آن فرد متغیر است. نتایج تحلی,,ل و تفس,,یر ی,,ک عکس هوایی عالوه بر تجربه و مهارت فرد تحلیلگ,,ر ب,,ه اطالع,,ات وی از منطق,,ه تحت مطالع,,ه و

تنوع پدیده های آن و نیز کیفیت و وضوح عکس، بستگی دارد.

.ترکیب عکس و تفسیرهای آن می تواند تولید کننده حجم زیادی از اطالعات باش,,د بدون اینک,,ه ب,,رای اس,تخراج این اطالع,ات نی,,ازی ب,,ه دسترس,ی مس,,تقیم باش,,د. ) از ویژگی ه,,ای

دورسنجی(.خیابان ها، دریاچه ها و ساختمان ها به وضوح در عکس پدیدار هستندویژگی های دیگر مانند بافت های گیاهی، جنس خاک و پدیده های زمین شناس,,ی ب,,ه

سادگی قابل شناخت نیستند و بستگی به مهارت و تجربه تحلیلگر دارند.اطالعاتی ک,,ه از تفس,,یر بدس,,ت می آی,,د ب,,رای طبقه بن,,دی پدی,,ده های منطق,,ه تحت

مطالعه و نیز ویرایش اطالعات قبلی استفاده می شود.

تفسیر یک عکس هوایی14-1شکل

ارسال اطالعات از منابع رقمی موجود .1.5.4

در حال وق,,وع اس,,ت. پیش ازGISهم اکنون تغییری در نحوه جمع آوری اطالعات برای یک این اس,,,تخراج اطالع,,,ات از من,,,ابع آن,,,الوگ ی,,,ا اس,,,تفاده از ورود مس,,,تقیم داده ام,,,ری رایج در فراهم آوردن اطالعات و داده های یک پایگاه داده جغرافیایی ب,,ود. ام,,ا ب,,ا گس,,ترش اطالع,,اتی ک,,ه هم اکنون وجود دارند استفاده از داده های رقمی موجود که توسط سازمان هایی نگهداری می شود

در حال تبدیل به یکی از روش های فراهم کردن اطالعات است. این سازمان ها معم,,وال س,,ازمان های دول,,تی مانن,,د س,,ازمان نقش,,ه برداری هس,,تند ک,,ه این اطالع,,ات را در دس,,ترس ک,,اربران ق,,رار می دهن,,د. همچ,,نین در س,,طح جه,,ان ن,,یز موسس,,ات و سازمان هایی وجود دارند که اطالعا جغرافیایی را در اختیار کاربران قرار می دهند. مس,,ئله اص,,لی در م,,ورد این روش فراهم ک,,ردن اطالع,,ات، ع,,دم وج,,ود اس,,تانداردی ب,,رای فایل ه,,ای نگهدارن,,ده اطالعات جغرافیایی است. به این معنا که هر سازمان با توجه به نوع کاربرد، نوع ایجاد اطالع,,ات و تنوع پدیده ها در منطقه تحت پوشش خ,,ود از ق,,الب دلخ,,واه و خ,,ود ط,,راحی ش,,ده ای اس,,تفاده

می کنند که ممکن است قابل یکسان سازی و یکپارچه سازی با اطالعات دیگر سازمان ها نباشد. سازمان نقشه برداری ایاالت متحده، از جمله نختسین سازمان هایی است که ب,,رای ایج,,اد یک قالب استاندارد برای تهیه اطالعات جغرافیایی قدم برداشته است و همه اطالعات خود را نیز

تحت همین قالب ارائه می دهد.

روش های ذخیره و بازیابی اطالعات جغرافیایی.1.6

جستجو در یک پایگاه داده نیازمند پش,,تیبانی در س,طح ف,,یزیکی اس,ت. این مطلب همانن,,د فضایی هم ص,,دق می کن,,د. پرس,,ش های معم,,ول در ی,,کپایگاه داده هایپایگاه داده های سنتی، در

پایگاه داده فضایی، پرسش نقطه ای) همه مناطقی که شامل یک نقطه خ,,اص اس,,ت( و پرس,,شمنطقه ای )همه مناطقی که با یک محدوده خاص همپوشانی دارند( است.

1.6.مقدمه.1.6.1

در پی پیشرفت فراوان در کاربردهای کامپیوتری که ب,ه داده ه,ای چن,د بع,دی تکی,,ه دارن,د، جامعه پایگاه داده توجه فراوانی به مدیریت داده ه,ای فض,ایی نش,ان داده اس,ت. ب,ا وج,ود اینک,ه

نشأت می گیرد ام,,اCADانگیزه اصلی توجه به داده های چند بعدی از علوم جغرافیایی و مکانیکی هم اکنون کاربرد داده های چند بعدی به رباتیک، درک دی,,داری، راه,,بری خودک,,ار، حف,,اظت محی,,ط

که در این گس,,تره1زیست و تصویربرداری پزشکی گسترش پیدا کرده است. معنای لغت فضاییVLSIبه کار می رود، به گستردگی کاربردهای آن است. در CADو کارتوگرافی، این لغت معم,,وال

معم,,وال ب,,ه ش,کلCADبه داده های در سطح دو بعدی ی,,ا دوبع,,دی دوالی,,ه اش,اره دارد. داده ه,,ای مستطیل ی,,ا چندبع,,دی هایی در راس,,تای محوره,,ای مختص,,ات اس,,ت. در ک,,ارتوگرافی ن,,یز معم,,وال داده ها به صورت دو بعدی هستند، با این تفاوت ک,,ه بی نظمی در س,,طح اش,,کال بس,,یار بیش,,تر از

است. عملگرهای معمول در این حوزه معموال اشتراک یا تع,,یین فاص,,له می,,ان دوCADاشکال در مکانیکی معموال داده های سه بعدی هستند. این داده ها معم,,وال در قالب ه,,ایCADشى است. در

گوناگون نمایش داده می شود. این مجمل شامل روش های دستیابی چندبعدی برای پشتیبانی از پایگ,,اه داده ه,,ای فض,,ایی

نگ,,اه کلی از تن,,وع روش ه,,ای موج,,ود دس,,تیابی چندبع,,دی نش,,ان می ده,,د. ه,,دف،1است. شکل بررسی همه این روش ها نیست. بلکه تنها به سرکردگان هر دسته می پردازیم.

سازمان و ساختار داده های فضایی.1.6.2

برای اینکه دید بهتری از ملزومات یک پایگاه داده فضایی به دست بیاورید، م,,ا نخس,,ت ب,,هبررسی برخی ویژگی های داده های فضایی می پردازیم.

نخست اینکه یک شی داده فضایی می تواند از چند نقطه یا چندین هزار چندض,,لعی ک,,ه ب,,ه طور دلخواه در فضا پخش شده اند تشکیل شده است. به صورت معمول ذخیره چنین اشیایی در

یک جدول رابطه ای با چندتایی هایی هم اندازه ممکن نیست. دوم اینکه داده های فضایی معم,,وال داده ه,,ای پوی,,ایی هس,,تند. درج و ح,,ذف داده منج,,ر ب,,ه بروزرسانی مج,,دد س,,اختار داده می ش,,ود و از این رو س,,اختمان داده ای ک,,ه ب,,ه ک,,ار می رود بای,,د انعطاف پذیری الزم در برابر پویایی را بدون اینکه بر منطقه ی وسیعی از داده ها اثر بگذارد داشته

باشد.

1 Spatial

نمایش تاریخی ساختمان های ذخیره و بازیابی اطالعات فضایی15-1شکل

سوم اینکه پایگاه داده های فضایی دائما در حال رشد هس,,تند. ب,,ه عن,,وان مث,,ال نقش,,ه های جغرافی,,ایی چن,,د گیگاب,,ایت حافظ,,ه مص,,رف می کنن,,د. جمع بن,,دی ویژگی ه,,ای دوم و س,وم، عام,,ل

اساسی در پردازش کاراست. چهارم اینکه با وجود پیشنهادهای فراوانی که در سال های گذش,,ته ش,,ده اس,,ت، ام,,ا هن,,وز ج,,بر اس,,تاندارد ب,,رای داده ه,,ای فض,,ایی تعری,,ف نش,,ده اس,,ت. این ب,,دان معناس,,ت ک,,ه مجموع,,ه عملگرهای استاندارد برای کاوش در داده های فضایی وجود ن,,دارد. مجموع,,ه عملگره,,ا ب,,ه دامن,,ه کاربرد مورد نظر بستگی دارد. با این حال برخی عملگرها مانند اشتراک در بیشتر کاربردها وجود

دارند. در واقع بخشی از عملگرها در میان همه کاربردها یافت می شوند. پنجم اینکه بسیاری از عملگرهای فضایی عملگرهای بسته نیستند. به عنوان مثال اشتراک دو چند ضلعی می توان چند نقطه، چند خط یا چند ضلعی های ناسازگار باش,,د. این وی,,ژگی زم,,انی

مهم است که تعدادی از این عملگرها به صورت متوالی به کار گرفته شوند. ششم اینکه با آنکه هزینه های محاسباتی پایگاه داده های تحلیلی از ی,,ک ک,,اربرد ب,,ه ک,,اربرد دیگر متفاوت است اما به هر حال این هزینه نسبت به پایگاه داده های رابطه ای بسیار زیاد است.

ی,,ک رده مهم از عملگره,,ای هندس,,ی ک,,ه نیازمن,,د پش,,تیبانی در س,,طح ف,,یزیکی اس,,ت، عملگرهای کاوش یا جست و جو هستند. بازیابی و بروز رسانی داده ه,,ای فض,,ایی تنه,,ا ب,,ر مبن,,ای داده های حرفی و رقمی صورت نمی پذیرد. بلکه به موقعیت مکانی اش,یا ن,,یز مرب,وط اس,ت. ی,ک درخواست بازیابی در یک پایگاه داده فضایی اغلب نیازمند اجرای سریع جستجوهای هندسی مانند درخواست های نقطه و منطقه است. ه,,ر دو درخواس,ت خ,ود نیازمن,,د دسترس,ی س,ریع ب,,ه ش,ی

داده هایی هستند که مکان مشخصی از فضا را اشغال می کنند. برای پش,,تیبانی از چ,,نین درخواس,ت هایی، در وهل,,ه اول نیازمن,,د روش ه,,ای دس,تیابی چن,,د بعدی هستیم. مهم ترین مسئله در طراحی چنین روش هایی نبود ترتیب پوش,,ا می,,ان اشیاس,,ت ک,,ه نزدیکی و مجاورت آن ها را نشان دهد. به دیگر سخن، هیچ نگاشتی از محیط های دو یا چند بعدی به محیط یک بعدی وجود ندارد ک,,ه در آن دو ش,,ی ای ک,,ه ب,,ه هم نزدی,,ک هس,,تند در آن ت,,رتیب هم

نزدیک به هم تشخیص داده شوند. این مسئله طراحی روش های دستیابی کارا در دامنه فضایی را نسبت به پایگ,,اه داده ه,,ای سنتی که در آن روش های کارا و معروف بسیاری وجود دارند و ک,,ارایی آن ب,,ه هم,,ه اثب,,ات ش,,ده است، بسیار سخت تر می نمایاند. نمونه ای از روش دستیابی تک بعدی ) که گاه ب,,ا ن,,ام ت,,ک کلی,,دی

است. ی,,ک روش مع,,روف ب,,رایB-treeهم خوانده می شود، گرچه این نام غلط انداز است( روش کاوش های چندبعدی، اجرای عملیات ک,,اوش ت,,ک بع,,دی در راس,,تای ه,,ر ی,,ک از ابع,,اد و در نه,,ایت تجمیع نتایج تک تک آن هاست. متأسفانه این روش بسیار ناکارآمد است. با توجه به اینکه ه,,ر بع,,د به تنهایی مورد بررسی قرار می گیرد، به صورت ب,,القوه در مع,,رض این خط,,ر ق,,رار داریم ک,,ه ب,,ا محدود کردن نتایج جستجو در یک بعد، مانع از تولید جواب های درست که ح,,ایز ش,,رایط در ابع,,اد دیگر هستند، شویم. در حالت کلی روش آسان و واضحی برای گس,,ترش روش ه,,ای تک بع,,دی ب,,ه

روش های چندبعدی وجود ندارد. ب,,ا توج,,ه ب,,ه ویژگی ه,,ای داده ه,,ای فض,,ایی روش ه,,ای دس,,تیابی چندبع,,دی بای,,د ملزوم,,ات

گوناگونی را فراهم کنند. زنجیره تغییر داده را داشته باشد. از درج و حذف درمرتباپویایی: پایگاه داده باید .1

پایگاه داده به هر ترتیب. مدیریت حافظه های جانبی: علی رغم رشد حافظه ها، معموال نگهداری همه پایگ,,اه.2

داده روی حافظه اصلی ممکن نیست و بنابراین روش های دستیاب چندبعدی باید قابلیت م,,دیریتحافظه جانبی به صورت یکپارچه را داشته باشند.

طیف وسیع از عملگرها: روش های دستیاب نباید تنها یک عمل مانند بازیابی را م,,د.3نظر قرار دهند. در پیاده سازی روش های دستیاب باید به تنوع عملگرها توجه کرد.

مستقل از ترتیب ورود داده: روش های دستیاب چندبع,,دی بای,,د ک,,ارایی خ,,ود را در.4 مقابل داده های اریب حفظ کنند و عملکرد آن ها باید مستقل از ترتیب ورود داده باش,,د. این نکت,,ه

بخصوص برای داده هایی که در راستای ابعاد گوناگون توزیع یکسانی ندارند، مهم است. سادگی: روش های دستیاب چندبعدی با استثناهای زیاد کار رفع خطاها را س,,خت تر.5

می کنند و بنابراین به اندازه کافی قابل اعتماد نیستند. قابلیت گسترش: روش های دستیاب چندبعد باید به راحتی قابلیت تطبیق پذیری ب,,ا.6

رشد حجم پایگاه داده را داشته باشند.

ک,,ارایی زم,,انی: جس,,تجوهای فض,,ایی بای,,د س,,ریع باش,,د. ی,,ک ه,,دف مهم ط,,راحی.7 هاست. نخست هم,,ه روش ه,,ای دس,,تیابb-treeروش های دستیاب چندبعدی رسیدن به مشخصه ی

چندبعدی باید تضمین کنند که مستقل از ترتیب ورود داده و برای هر توزیع از داده ه,ا در فض,ا، در بدترین حالت تابع هزینه کاوش از نوع لگاریتمی باشد. و دوم این ت,,ابع در ه,,ر تع,,داد از ابع,,اد بای,,د

تضمین شده باشد. صرفه جویی در حافظه: حجمی که یک شاخص اشغال می کن,,د بای,,د در مقایس,,ه ب,,ا.8

کل حجم داده حجم کمی باشد تا سودمندی حافظه تأمین شود. همزمانی و بازیافت: در پایگاه داده ه,,ای ام,,روزین ک,,ه چن,,دین ک,,اربر در ه,,ر زم,,ان.9

مش,,غول اس,,تفاده از پایگ,,اه داده هس,,تند، روش ه,,ای دس,,تیاب بای,,د ت,,أمین کنن,,ده دسترس,,ی های همزمان توسط کاربران باشد بدون اینکه در زمان واکنش و نیز حافظه مصرفی تغییر محسوسی

به وجود آید. تأثیر کم: افزودن روش های دستیاب چندبعدی باید حداقل تغی,,یر را در ی,,ک پایگ,,اده.10

داده فعال داشته باشند.

تعاریف و درخواست ها.1.6.3

ما در ابتدا به تعریف عبارت روش های دستیاب چندبعدی پرداختیم تا رده بزرگ روش ه,,ای دستیابی که کاوش در پایگاه داده های فضایی را پشتیبانی می کنند را معرفی کنیم. در این رده م,,ا میان روش های دستیاب نقطه ای و منطقه ای تمایز قای,,ل می ش,,ویم. روش ه,,ای دس,,تیاب نقطه ای برای پایگاه داده های فضایی که در آن ها درخواست های نقطه ای وج,,ود دارن,,د، ک,,اربرد دارن,,د. این نقطه ها چندتایی مرتب هستند اما ح,,وزه جغرافی,,ایی ندارن,,د. روش ه,,ای دس,,تیاب منطقه ای ب,,رای اشیایی مانند چند ضلعی ها و چندبعدی ها به کار می روند. این رده از روش های دس,,تیاب منطقه ای

در مدارک دیگر با نام شاخص فضایی به کار برده می شوند. بع,,دی اقلیدس,,ی ی,,ا ی,,ک زی,,رdما به صورت کلی فرض می کنیم که هم,,ه اش,,یا در محی,,ط

مجموعه ممکن از آن هستند. در این مقاله این فض,,ا ب,,ا ن,,ام جه,,ان ی,,ا فض,,ای اص,,لی ن,,یز نامی,,ده dمی شود. هر نقطه ای که در پایگاه داده فضایی ذخیره می شود، موقعیتی یکتا در جهان داد که با

عدد در مختصات آن جهان نمایش داده می شود. بدون توجه به تفاوت اساسی که میان نقطه ب,,ه عنوان یک شی و نقطه به عنوان یک محل از جهان ما هر دو را نقطه می ن,,امیم. ه,,ر نقط,,ه در در

فضا می تواند توسط چند شی نقطه ای اشغال شود و اطالعات آن در پایگاه داده ذخیره شود. را ذکر کنیم. برای ی,,ک جه,,ان ی,,ک بع,,دیمقسمالزم است پیش از ادامه مطالب تعریف

چند صفحه ای یک نقطه است که جهان را به دو قسمت تقسیم می کند. برای یک جه,,ان دو بع,,دی مقسم یک خط است که آن جهان را به دو قسمت تقسیم می کن,,د. ب,,رای ی,,ک جه,,ان س,,ه بع,,دیی مقسم یک صفحه است که آن جهان را به دو قسمت تقس,,یم می کن,,د. ب,,ه همین ت,,رتیب ب,,رای ه,,ر

بعدی را به دوd بعدی تصور می شود که آن جهان d-1 بعد، چند صفحه ای به صورت یک dجهان با قسمت که با یکدیگر هیچ اشتراکی ندارند، افراز می کند.

در یک پایگاه داده فضایی تنها اشکال جغرافیایی وجود ندارند. بلک,,ه داده ه,,ای دیگ,,ری ن,,یزوجود دارند که به آن شکل جغرافیایی مربوطند و آن را توصیف می کنند.

هنگامی که اندازه مدخل شاخص ها با یکدیگر برابر است، کارایی آن ش,اخص ب,,اال می رود. یک راه برای اینکه اندازه مدخل ها را مساوی ک,نیم این اس,ت ک,,ه پیش از درج آن ه,ا در ش,اخص، آن ها را ب,,ا ی,,ک ش,کل م,,رتب و س,اده ج,,ایگزین ک,,نیم. این ش,,کل می توان,,د کوچک,,ترین مس,,تطیل

باشد. اگرچه در این جا از کوچکترین مستطیل سخن گفته می ش,,ود ام,,ا منظ,,ور انتخ,,اب1محیطی بعد است. که به صورت dبازه های محدود در راستای هر یک از

Ii(o) = [li, ui] (li, ui

∈ E1)

ام است.iبیان می شود و بیانگر محدوده در بعد با استفاده از کوچکترین مستطیل محیطی شکل جستجو ممکن است تغی,,یر کن,,د. ف,,رض کنید که شاخص بر اساس اطالعات ک.م.م شکل گرفته است. در این صورت و با فرض اینکه از مدخل شاخص به داده ی اصلی یک اشاره گر وجود داشته باش,,د، ب,,رای ایج,,اد مجموع,,ه ج,,واب دو روش وجود دارد. در حالت اول اشاره گرها را به عنوان مجموعه جواب برگ,,ردانیم. ) یع,,نی ب,,رای جستجو تنها به اطالعات شاخص اعتماد کنیم.( این مجموعه جواب تع,,داد زی,,ادی کاندی,,دا در خ,,ود دارد. باید توجه داشت که در مورد اطالعات فضایی، برخالف اطالعات ح,,رف-ع,,ددی، ب,,ار اص,,لی روش های بازیابی در خواندن از حافظه جانبی نیست. بلک,,ه پ,,ردازش اطالع,,ات فض,,ایی ن,,یز خ,,ود سهم عمده ای در زمان کل پردازش دارد. بنابراین بهتر است، تا حد ممکن تعداد اعضای مجموعه

می کنیم. یعنی پس از گذر از ص,افی اولی,,ه2را کم کنیم. برای این منظور این مجموعه را پاالیش با بار کردن اطالعات شی ای که اشاره گر به آن اشاره دارد، به بررسی اشیا بپردازیم و مجموع,,ه جواب درست تر را به کاربر بدهیم. این صافی ثانویه، اطالعات خود را از حافظه جانبی می خواند.

پردازش دومرحله ای اطالعات فضایی16-1شکل

1 Minimum bounding rectangle

2 Refinement

تاکنون از واژه کارایی، بسیار استفاده کردیم. بدون آنکه تعریف دقیقی از آن ارائ,,ه دهیم. در مورد کارایی حافظه این تعریف بسیار ساده است.: حداقل کردن فضای اش,,غال ش,,ده )تع,,داد

بایت ها( توسط شاخص برای کارایی زمان، موقعیت چندان واض,ح نیس,ت. زم,انی ک,ه ص,رف پاس,خگویی ب,ه ی,,ک درخواست می شود، بدون شک تابعی از خود آن درخواست است. اما در اندازه گیری های مرب,,وط به یک پایگاه داده مولفه های دیگری غیر از امور مربوط به ک,اربر را در نظ,,ر می گیرن,,د. چگ,,ونگی

سخت افزار و دیگر عوامل داخلی از مولفه های اثرگ,,ذار1پیاده سازی و جزئیات آن، سودمندسازیبر کارایی و سرعت پاسخگویی نرم افزار است.

یکی از مولفه ه,,ایی ک,,ه در بس,,یاری از مس,,تندات مرب,,وط ب,,ه ش,,اخص بندی ب,,ه آن تأکی,,د می شود، تعداد دفعات مراجعه به حافظه جانبی برای خواندن اطالعات است. نت,,ایج تحقیق,,ات در مورد روش های شاخص بندی اطالعات تک بع,,دی نش,,ان می ده,,د ک,,ه زم,,انی ک,,ه ص,,رف ب,,ارکردن اطالعات از حافظه می شود، نسبت به زمان پردازش اطالعات در پردازنده، بسیار بیش,,تر اس,,ت. اما این نتیجه در مورد اطالعات چندبعدی صدق نمی کند. به این معنا که با توجه به تع,,دد ابع,,اد در این اطالعات مانند بارکردن اطالعات زمان زیادی صرف می شود و این نکته ای است ک,,ه بای,,د در پیاده سازی داده های چندبع,دی ب,,ه آن توج,ه داش,ت. در کاربرده,ایی ک,ه اش,یا، ش,کل های پیچی,ده فضایی دارند،گذر دادن آن ها از صافی دوم، باعث کاهش زمان صرف شده در پردازنده می ش,,ود و از این رو در کارایی اثر می گذارد. در عین حال تعداد مراجعه به حافظه همچن,,ان مولف,,ه مهم و

اثرگذاری است. هم,,ان طور ک,,ه پیش از این ن,,یز ذک,,ر ش,,د، در مقاب,,ل پایگ,,اه داده ه,,ای رابطه ای ک,,ه ک,,امال استاندارد شده اند، برای پایگاه داده های فضایی ن,ه ج,بر اس,تانداری هس,ت و ن,,ه زب,,ان اس,تاندارد کاوش های فضایی. مجموعه عملگرها تا حد زیادی تابع دامنه کاربرد است. با این ح,,ال تع,,دادی از

پرکاربردترند. کاوش ها و پرسش ها معموال با یک زب,,ان ک,,ه گسترش,,ی از2عملگرها مانند اشتراکSQLتعری,ف ش,ده3 اس بیان می شوند و در آن برای نمایش اش,یا و اش,کال جغرافی,,ایی ن,,وع داده

است. نوع داده هایی که ممکن است تعدادی عملگر مخصوص به خود داشته باشند. نتیجه اعم,,الیک عملگر معموال خود متشکل از چند نوع داده است.

در ادامه، به ارائه تعریفی رسمی از پرکاربردترین عملگرهای پایگاه داده فضایی داریم. : تطبیق دقیق اشیا1پرسش

هستیم که o' به دنبال همه اشیا مانند oبا داشتن یک هندسه مانند EMQ (o') = { o| o'.G = o.G}

: پرسش نقطه ای 2پرسش ک,,ه ش,,امل این نقط,,هo بعدی همه اشیایی مانند dبا داشتن یک نقطه در فضای اقلیدسی

می شوند.

1 Utilization

2 Intersection

3 Data type

PQ (p) = { o| p ¿

o.G = p}

پرسش نقطه ای می توان,,د ی,ک زیرمجموع,ه از بس,یاری از ان,,واع پرس,ش مانن,د اش,تراک،پرسش پنجره ای و پرسش احاطه باشد.

1: پرسش پنجره3پرسش

بازه dبا داشتن Id = [l1, u1] ×[l2, u2] ×… × [ld, ud]

هدف یافتن همه اشیایی است که حداقل یک نقطه مشترک با این پنجره داشته باشند.

WQ (p) = { o| Id ¿

o.G ≠ 0} یکی از مح,,دویت های این پرس,,ش ال,,زام ب,,ه ت,,وازی اض,,الع پنج,,ره ب,,ا محوره,,ای دس,,تگاه مختصات است. صورت کلی ت,,ر این پرس,ش، پرس,ش منطقه ای اس,,ت ک,ه این مح,,دودیت را ن,,یز

ندارد.

1 Window

پرسش نقطه ای17-1شکل

پرسش پنجره18-1شکل

: پرسش اشتراک یا همپوشانی4پرسش اس,,ت ک,,ه ح,,داقل ی,,کo' هدف یافتن همه هندسه هایی مانن,,د oبا داشتن یک هندسه مانند

' داشته باشند.oنقطه مشترک با

IQ (p) = { o| o'.G ¿

o.G ≠ 0}

پرسش اشتراک19-1شکل

1: پرسش احاطه5پرسش

' را در ب,,رo' ه,,دف ی,,افتن هم,,ه هندس,,ه هایی اس,,ت ک,,ه تم,,ام oبا داشتن یک هندسه مانند بگیرند.

EQ (p) = { o| o'.G ¿

o.G ≠ o'.G}2: پرسش دربرداشتن6پرسش

' باش,,ند. ب,,هo' هدف یافتن همه هندس,,ه هایی اس,,ت ک,,ه درون oبا داشتن یک هندسه مانند ' آن ها را دربرگرفته باشد.oعبارتی

CQ (p) = { o| o'.G ¿

o.G ≠ o.G} یکدیگر هس,,تند. این دو پرس,,ش در واق,,ع ح,,الت3پرسش های احاطه و دربرداشتن، دوگان

خاصی از اشتراک هستند که در آن ها پاسخ به یکی از عوامل اشتراک محدود شده است.4: پرسش همسایگی7پرسش

1 Enclosure

2 Containment

3 Dual

4 adjacency

' باشند.o' هدف یافتن همه هندسه هایی است که همسایه oبا داشتن یک هندسه مانند

AQ (o') = { o| o'.G ¿

o.G ≠ 0 and o'.G◦ ¿

o.G◦ = 0 } درون شکل است. این عبارت معادل آن است ک,,ه دو ش,,کل تنه,,ا◦ Gدر این جا، مقصود از

در محیط خود با یکدیگر مشترک هستند و به عبارتی همسایه محسوب می شوند.: پرسش نزدیکترین همسایه8پرسش

' هدف یافتن هم,,ه هندس,ه هایی اس,ت ک,,ه کم,,ترین فاص,له ت,اoبا داشتن یک هندسه مانند ' را داشته باشد. oهندسه

NNQ(o') = {o| ∀

o'' : dist (o'.G, o.G) ¿

dist (o'.G, o''.G)} فاصله ی بین دو شیء فضایی معموال با فاصله ی نزدیکترین نقاط آن ها با یکدیگر س,,نجیده

می شود. معمول ترین تابع محاسبه فاصله، تابع اقلیدسی یا تابع مانهاتان است.: الحاق فضایی9پرسش

، هدف یافتن همه زوج ها بهθ از اشیاء فضایی و نیز یک گزاره S و Rبا داشتن دو مجموعه شکل

(o, o') ∈

R×S مقدار درست را اختیار کند.θ (o.G, o'.G)به طوری که گزاره

R θ S = {(o,o') | o ∈

R and o' ∈

S and θ (o.G, o'.G)} می توان,,دθکمی آشنایی با پایگاه داده های فضایی و عملگرهای آن ها به ما می فهمان,,د ک,,ه

عبارت های زیادی باشد. نگاه دقیق تر به توابع و عملگر های فضایی این نکته را روشن می کند ک,,ه عملگ,,ر اش,,تراک می تواند نقش مهمی در اجرای دیگر عملگر ها داشته باشد. به عنوان مثال می توان برای اعم,,الی مانند دربرداشتن، احاطه و همسایگی، با استفاده از عملگر اشتراک، اشیا را از صافی اولیه عبور

داد تا عمل اصلی بر روی تعداد کمتری از اشیاء اجرا شود و باعث افزایش کارایی شود.

ساختارهای مقیم در حافظه.1.6.4

روش های نخستین ش,,اخص بندی از حافظ,,ه ج,,انبی اس,,تفاده نمی کردن,,د و از این رو ب,,رای داده های حجیم مناسب نیستند. در این قسمت ما نگ,,اه کلی ب,,ه این روش ه,,ا خ,,واهیم داش,,ت. ب,,ا وجود اینکه این روش ها ب,,رای ش,,اخص بندی اطالع,,ات مناس,,ب نیس,,تند ام,,ا این درک س,,اختار این روش ها برای روش هایی که در آینده آن ها را معرفی خواهیم کرد، الزم است. برای اینکه س,,اختار هر یک از این روش ها درست تر بیان شود ما از یک مجموعه داده استفاده می کنیم و در مورد هریک از روش ها این مجموعه را به عنوان مجموعه ی آزمون تحت آن روش، شاخص بندی می کنیم.

10 نقط,,ه و 10 نم,,ایش داده ش,,ده اس,,ت. در این مجموع,,ه 20این مجموع,,ه در ش,,کل چندض,,لعی وج,,ود دارد ک,,ه ب,,ه ص,,ورت تص,,ادفی در فض,,ای ح,,الت پخش ش,,ده اند. ب,,رای نم,,ایش چندضلعی ها، معموال از مرکز ثقل آن ها که به صورت یک نقطه نمایش داده می شود یا کوچکترین مستطیل محیطی استفاده می کنیم. نکته ای که در این ج,,ا قاب,,ل ط,,رح اس,,ت، ک,,ارایی کوچک,,ترین

مستطیل محیطی است که با توجه به اینکه مساحت شکل اصلی با مساحت مستطیل چه مق,,دارتفاوت دارد قابل اندازه گیری است. هر قدر میزان این تفاوت کم تر باشد این روش کاراتر است.

مجموعه داده فضایی برای اجرای مثال20-1شکل

k-dدرخت

درخت ه,,ایk-dیکی از نخس,,تین روش ه,,ای ش,,اخص بندی چندبع,,دی اس,,ت.درخت ه,,ای بعدی، جهان را دائما بهd بعدی در جهان d-1جستجوی دودویی است که با استفاده از مقسم های

بعد باشد. به عنوان مثال ب,,رایdتقسیم می کنند. جهت این مقسم ها می تواند در راستای یکی از d=3 مقسم های تقسیم کننده می توانند صفحاتی عمود بر هر یک از راستا های x,y و یا zباشد. ه,,ر

یک از مقسم های تقسیم کنن,,ده بای,د ش,امل ح,داقل ی,,ک داده ی نقطه ای باش,ند. این نقط,,ه ب,,رای نمایش آن مقسم در درخت به کار می رود. گره های میانی، یک یا دو فرزند دارند. مقدار گره ه,,ای میانی مانند راهنما و جهت ده عمل می کند. روش جستجو و درج مشخص اس,,ت. ح,,ذف ی,,ک گ,,ره میانی، تا حدودی کار پیچیده ای به نظر می آید و ممکن است به سازماندهی مجدد زیردرخ,,تی ک,,ه

ریشه ی آن حذف شده است، منجر شود. ب,,رای مث,,ال ماس,,ت. از آن ج,,ایی ک,,ه این درخت تنه,,اk-d نش,,ان دهنده ی درخت 21ش,,کل

توانایی ذخیره ی نقاط را دارد، ناگزیریم اشکال را با نقطه ی مرکز ثقل آن ها نمایش دهیم.

k-d درخت 21-1شکل

حساسیت آن ها به ترتیب ورود داده هاست. مش,,کل دیگ,,رk-dیکی از مشکالت درخت های آن پخش نقاط در همه درخت )گره های میانی و برگ ها( است. ب,,رای رف,,ع این مش,,کل، در س,,ال

ش,,ناخته1 س,,ازگارk-d ارائ,,ه ش,,د ک,,ه ب,,ه ن,,ام درخت ه,,ای k-d نسخه ای دیگر از درخت ه,,ای 1979 می شود. این مشکل با استفاده از مقسم هایی که از نقاط عب,,ور نمی کنن,,د، رف,,ع ش,,ده اس,,ت. در درخت های سازگار سعی بر آن است که مقسم تقسیم کننده ای که در دو طرف آن تعداد مساوی از نقاط قرار دارند، فضا را بشکنیم. به این ت,,رتیب همه ی نق,,اط در برگ ه,,ا ذخ,,یره می ش,,وند. در

نیازی نیست که مقسم حتما از یک نقطه عبور کند و الزام,,ا نی,,ازی نیس,,ت ک,,هk-dدرخت سازگار جهت آن مخالف جهت مقسم پدر باشد. تقسیم فضا تا زمانی ادامه می یابد که تعداد نقاط در ه,,ر

یک از زیرفضا ها به تعداد از پیش مشخص شده ای برسد.

k-d درخت سازگار 22-1شکل

درخت چهارتایی

دارن,,د. ب,,اk-dدرخت چهارتایی و گونه های متنوع آن ش,,باهت بس,,یار زی,,ادی ب,,ا درخت ه,,ای اینکه درخت چهارتایی معموال برای اشکال و نقاط دوبعدی به کار گرفته می شوند، اما نوع اص,,لی

1 Adaptive

، درخت ه,,ای چهارت,,ایی ن,,یز ب,,رایk-d طراحی شده ب,,ود. مانن,,د درخت ه,,ای dآن برای بعد دلخواه تقسیم فضا از چندصفحه های موازی با محورهای مختصات استفاده می کنند، اما تفاوت عم,,ده ای که میان این دو درخت وج,,ود دارد، این اس,,ت ک,,ه درخت ه,,ای چهارت,,ایی، درخت دودویی نیس,,تند.

فرزند است ک,,ه در م,,ورد دو بع,,د تع,,داد 2d هر گره داخلی یک درخت چهارتایی، دارای dبرای بعد =,, 22فرزندان برابر با است و به همین دلیل این درخت ها را درخت چهارت,,ایی می نامن,,د. ه,,ر4

گره داخلی متناظر با یک زیرفضاست که به صورت مرتب تقسیم شده اند. با اینکه نی,,ازی نیس,,ت تقسیم شود، اما در اغلب موارد زیرفضاها هم اندازه هس,,تند. 2dکه هر فضا به صورت مساوی به

شناخته می شوند.NE1, NW2, SE3, SW4 ، چهار مستطیل به وجود می آید که با نام های d=2برای تجزیه به زیرفضاها آن قدر ادامه می یابد تا تعداد اش,,یا داخ,,ل زیرفض,,ا کم,,تر از مق,,دار مشخص,,ی

باشد. به این ترتیب درجایی که جمعیت نقاط بیشتر است عمق درخت بیشتر می شود.

درخت چهار تایی نقطه ای 23-1شکل

1 North west

2 North east

3 South east

4 South west

درخت چهارتایی ناحیه ای24-1شکل

جستجو در یک درخت چهارتایی مانند جستجو در یک جستجو در یک درخت دودویی اس,,ت. تقلی,,ل می یاب,,د. در واق,,ع ب,,ه یکی از زیردرخت ه,,ا ه,,دایت4/1در هر مرحله از جس,,تجو، فض,,ا ب,,ه

می شود. پیمایش درخت آن قدر ادام,,ه می یاب,,د ت,,ا ب,ه ب,,رگی ک,,ه ح,اوی نقط,,ه م,,ورد نظ,,ر اس,ت 1برسیم. برای جستجوی نقطه ای این اتفاق یکبار می افتد در حالی که برای جتسجوی مح,,دوده ای

این روند به ازای تعداد نقاط تکرار می شود. فینکل و بنتلی نخستین گ,,ونه ی درخت ه,,ای چهارت,,ایی را ارائ,,ه کردن,,د ک,,ه ب,,ا درج پی درپی نقاط به وجود می آمد و درخت چهارتایی نقطه ای نام دارد. برای درج هر نقطه ابتدا در درخت ب,,ه دنبال آن نقطه می گردیم. در صورتی که نقطه پیدا نشد، در همان مح,,ل آن نقط,,ه درج می ش,,ود. حذف ی,,ک نقط,,ه از درخت منج,,ر ب,,ه س,,ازماندهی مج,,دد زیردرخ,,تی اس,,ت ک,,ه از آن زی,,ر درخت منشعب می شود. یک راه برای سازماندهی مجدد، درج دوباره همه نقاط آن زیردرخت است. یک

معرفی ش,,د ک,,ه درخت1984گونه معروف دیگر از درخت های چهارتایی، توسط صامت در سال چهارتایی ناحیه ای نام دارد. در این گونه، نقاط به جای اینکه روی مقسم های تقس,,یم کنن,,ده ق,,رار

داشته باشند، در داخل نواحی )زیرفضاها( قرار دارند.

روش های دستیاب نقطه ای.1.6.5

روش هایی که در قسمت قبل معرفی شد، همگی با فرض اج,,را ش,,دن در حافظ,,ه اص,,لی طراحی شده بودند، بدون اینک,ه م,,دیریت ح,افظه ی ج,انبی را ب,ه عه,ده بگیرن,د. ب,,ا وج,ود رش,د حافظه ه,,ای اص,,لی، این حافظه ه,,ا نمی توانن,,د پاس,,خگوی حجم ب,,االی داده ه,,ای ش,,اخص بندی ی,,ا

درخت ها باشند. بویژه اگر آن داده از نوع داده های فضایی باشد. یکی از راه هایی ک,,ه ممکن اس,,ت ب,,ه ذهن ه,,ر کس,,ی خط,,ور کن,,د، اس,,تفاده از روش ه,,ای حافظه ی اصلی در حافظه ی جانبی است. اما کارایی این روش ها بسیار پایین اس,,ت، چراک,,ه هیچ کنترلی بر دفعات و چگونگی مراجعه سیستم عامل به حافظه وجود ندارد. روش ه,,ایی ک,,ه در این

1 Range search

قسمت و قسمت بعدی معرفی می شوند، خود شامل مالحظاتی در باب م,,دیریت حافظ,,ه ج,,انبی هس,,تند. عملی,,ات آن ه,,ا بس,,یار هماهن,,گ ب,,ا سیس,,تم عام,,ل اس,,ت و از این رو توان,,ایی بهینگی را

داراست. همان طور که پیش از این گفته شد، در ابتدا به معرفی روش های دستیابی نقاط خ,,واهیم پرداخت. عموما نقاط در پایگاه داده در یک باکت که متناظر با ی,,ک ص,,فحه ی حافظ,,ه اس,,ت و در فضا نیز نزدیک به هم قرار دارند، سازماندهی می شود. زیرفضاهایی که در آن نقاط ق,,رار دارن,,د، به نام منطقه ی داده، منطقه ی باکت یا به صورت ساده تر منطق,,ه خوان,,ده می ش,,ود. این ن,,ام در

نیز استفاده می شود. با اینکه هیچ الزامی برای منظم ب,,ودن این اش,,کال نیس,,ت2ابعاد بیشتر از ام,,ا اغلب منطق,,ه مس,,تطیل ش,,کل اس,,ت. این من,,اطق از طری,,ق درخت ه,,ا ی,,ا تواب,,ع دسترس,,ی

قابل دسترسی هستند. 1مستقیم به عنوان نمونه ای از روش های دستیاب نقطه ای به معرفی فایل مشبک خواهیم پرداخت.

قرار می گیرد.2از نظر ساختار، فایل مشبک در رده دسترسی های درهم سازی با اینکه هیچ ترتیب پوشایی از اشیای چندبعدی که نزدیکی آن ها را نشان دهد، وجود ندارد. اما تالش های زیادی برای به وجود آوردن توابع دسترس,,ی مس,,تقیم ک,,ه متض,,من ن,,زدیکی ح,,دودی باشد، وجود ندارد. هدف همه این تالش ها این است که اش,,یایی ک,,ه نزدی,,ک یک,,دیگر ق,,رار دارن,,د، برای ذخیره سازی نیز نزدیک یکدیگر ق,,رار گیرن,,د و در ص,,فحات یکس,,ان ح,,افظه ی ج,,انبی ذخ,,یره

شوند. ما بحث خود را با روش های دسترسی مستقیم قابل گسترش آغاز می کنیم.

فایل مشبک

با اینکه هیچ ترتیب پوشایی از اشیای چندبعدی که نزدیکی آن ها را نشان دهد، وجود ندارد. اما تالش های زیادی برای به وجود آوردن توابع دسترس,,ی مس,,تقیم ک,,ه متض,,من ن,,زدیکی ح,,دودی باشد، وجود ندارد. هدف همه این تالش ها این است که اش,,یایی ک,,ه نزدی,,ک یک,,دیگر ق,,رار دارن,,د، برای ذخیره سازی نیز نزدیک یکدیگر ق,,رار گیرن,,د و در ص,,فحات یکس,,ان ح,,افظه ی ج,,انبی ذخ,,یره

شوند. بعدی متعام,,د تقس,,یم می کن,,د. ش,,بکه حاص,,ل هم,,انdفایل مشبک صفحه را به خانه های

دایرکتوری است. از آن جایی که این خانه ها الزاما با یکدیگر مساوی نیستند، س,,لول های ب,,ه وج,,ود آمده هم اندازه و هم شکل نیستند. یک دایرکتوری مشبک شامل چندین خانه یا سلول است که ه,,ر یک به یک باکت اشاره می کنند. هر باکت بر روی ی,,ک ص,,فحه از دیس,,ک ذخ,,یره ش,,ده اس,,ت. ه,,ر سلول از دایرکتوری مختص به یک ب,,اکت اس,,ت ام,,ا ی,,ک ب,,اکت می توان,,د چن,,دین س,,لول همس,,ایه دایرکتوری را دربر داشته باشد. از آن جایی که دایرکتوری می توان,,د بس,,یار ب,,زرگ ش,,ود، از هم,,ان ابتدا روی حافظه ی جانبی ذخیره می شود. برای تضمین اینکه هر جس,,تجو ح,,داکثر نی,,از ب,,ه دوب,,ار

y و xدسترسی به حافظه جانبی دارد، آرایه ای در حافظه ی اصلی نگهداری می شود. این آرایه ب,,ا آدرس دهی می شود. ب,,ا در دس,,ت داش,تن مختص,,ات نقطه ی جس,,تجو و ب,,ا اس,تفاده از این آرای,,ه، سلولی که دریچه ی جستجو است، مشخص می ش,,ود. ب,,ا مراجع,,ه ب,,ه دایرکت,,وری و ی,,افتن س,,لول

1 hash

2 Hash

مورد نظر، آدرس صفحه ای که نقطه در آن قرار دارد ب,,ه دس,,ت می آی,,د. ب,,ه این ت,,رتیب ب,,ا دوب,,اردسترسی به حافظه نقطه )در صورت وجود( پیدا می شود.

در درون دایرکت,,وری نم,,ایش داده ش,,ده اند، تنه,,ا ب,,رای فهم به,,تر25نقاطی که در ش,,کل شکل هستند و به ص,,ورت واقعی در آن ج,,ا ذخ,,یره نش,,ده اند. در گوش,,ه س,,مت چپ پ,,ایین، چه,,ار

مدخل دایرکتوری به یک ص,,فحه اش,,اره4سلول به یک باکت اشاره می کنند که نشان می دهد از شده است. مسئله ای که در این جا تعریف می شود، رشد فوق خطی اندازه فض,,ای اش,,غال ش,,ده

می توان,,دc5توسط دایرکتوری است که با افزایش داده ها اتفاق می افتد. به عن,,وان مث,,ال نقطه ی در یکی از باکت های همسایه خود قرار بگیرد تا حجم حافظه ای که اشغال می شود، ک,,اهش یاب,,د.

روش های مختلف ادغام وجود دارند تا به سودمندسازی حافظه کمک کنند. برای پاسخگویی به کاوش تطبیق دقیق نقطه ای مراحل زیر پیموده می شود.

با استفاده از مختصات نقطه، سلولی که حاوی آدرس صفحه داده مورد نظر اس,,ت، پی,,دا می شود. اگر سلول مورد نظر در حافظه اصلی قرار نداشت، یکبار مراجعه ب,,ه ح,,افظه ی ج,,انبی نیاز است. به هر حال با خواندن این سلول، آدرس صفحه داده پیدا می شود. این ص,,فحه داده ب,,ه حافظه ی اصلی بار می شود تا برای یافتن نقطه مورد جستجو قرار گ,,یرد. ب,,ه این ت,,رتیب ح,,داکثر دوبار دسترسی به حافظه صورت می گیرد. برای جس,,تجوی تط,,بیق مح,,دوده ای در م,,رحله ی اول همه سلول هایی که با شکل مورد نظر همپوشانی دارند، پیدا می ش,,وند. پس از ح,,ذف س,,لول های تکراری، به ازاء هر سلول باقی مانده یکبار دسترسی به حافظه صورت می گیرد ت,,ا ب,,ا ب,,ار ک,,ردن

صفحه ی مورد نظر به جستجوی نقاط بپردازیم. برای درج یک نقطه، ابتدا یک جستجوی تط,,بیق دقی,,ق نقطه ای ب,,رای ی,,افتن س,,لول م,,ورد

که نقطه می بایست در آن جا درج شود، صورت می گیرد. اگر فض,,ای ص,,فحهviنظر و صفحه داده داده باری درج آن نقطه کافی است که درج ص,,ورت می گ,,یرد. ام,,ا اگ,,ر فض,,ای ک,,افی ب,,رای درج وجود نداشت باید میان دو حالت تمایز قایل شویم. تمایز میان این دو ح,,الت از تع,,داد س,,لول های

اشاره کننده به آن صفحه داده ناشی می شود.

فایل مشبک25-1شکل

تعداد سلول های اشاره کننده به صفحه داده زیاد باشد:.1a.بررسی شود آیا می توان حالتی را یافت ک,,ه در آن ب,,ا تخص,,یص ی,,ک ص,,فحه داده ی

vj را به صفحه ی vi از میزان سلول های اشاره کننده کاست و بار داده های صفحه ی vjجدید مانند

منتقل کرد. به این ترتیب از فضای ایجاد شده برای درج نقطه ی جدید استفاده می شود.b.اگر این امر ممکن نباشد، باید دایرکتوری را مجددا مشبک کرد. یعنی با ی,,افتن ی,,ک

مقسم س,,لول های جدی,,دی ایج,,اد می ش,,وند. )تع,,داد س,,لول ها بیش,,تر و مح,,دوده ی آن ه,,ا کوچک,,تر می شود.( با اختصاص صفحات جدید داده، فضای قبلی یک سلول به سلول های کوچکتری تقس,,یم می شود و هم,ان داده ه,,ایی ک,,ه پیش از این روی ی,,ک ص,فحه بودن,,د، ب,,ا توج,,ه ب,ه توزیع ش,ان ب,ه صفحات جدید منتقل می شوند. فضای ایجاد شده برای درج نقطه داده ه,,ای جدی,,د ب,,ه ک,,ار گرفت,,ه

می شود.

تعداد سلول های اشاره کننده به صفحه یکی باشد. راه حل این مورد مانند قسمت.2b است.1 مورد

باید توجه داشت، در حالتی که مقسم جدیدی برای تقسیم دایرکتوری استفاده ش,,ود، درج نیست. بلکه ممکن است سلول های دیگر دایرکتوری نیز برای تغییر اش,,اره گرها،1یک عمل محلیبررسی شوند.

حذف داده نیز یک عمل محلی نیس,,ت. چراک,,ه ممکن اس,,ت ب,,ا ح,,ذف نق,,اط ص,,فحه داده مربوطه بسیار خالی شود و برای صرفه جویی در حافظ,,ه الزم باش,,د ت,,ا چن,,د ص,,فحه داده ب,,ا هم

ک,,ل2ادغام شوند. عمل ادغام بستگی به روش پیاده سازی دارد و ممکن است منجر به ب,,ازپویشدایرکتوری شود.

روش های دسترسی منطقه ای.1.6.6

اس,,ت ک,,ه ب,,ر پای,,ه مفه,,وم3Rاز جمل,,ه مهم ت,,رین روش ه,,ای دسترس,,ی منطقه ای درخت مناطق همپوش,,ا ش,,کل گرفت,,ه اس,,ت. در این قس,,مت، ابت,,دا مفه,,وم من,,اطق همپوش,,ا را توض,,یح

را معرفی می کنیم.Rمی دهیم و سپس درخت نكت,,ه كلي,,دي در م,,ورد من,,اطق همپوش,,ا، اين اس,,ت ك,,ه ب,,ه باكت ه,,اي داده اج,,ازه دهيم دربردارنده مناطقي باشند كه با يكديگر همپوشاني دارند. با اين روش ما مي توانيم يك ش,,ي داده را به یک باكت نسبت دهيم و از تقسيم آن ميان نواحي مختل,,ف اجتن,,اب ك,,نيم. ام,,ا اين گس,,ترش منجر به همپوشاني و اشتراك باكت ها مي شود. الگوريتم هاي جستجو همچن,,ان ب,,دون تغي,,ير ب,,اقي مي مانند. تنها تفاوتي كه حاصل از اين همپوشاني است اين است كه تعداد مسيرهاي جستجو ك,,ه بايد دنبال شوند، افزايش مي يابد. حتي ي,,ك جس,,تجوي نقطه اي ممكن اس,,ت نيازمن,,د جس,,تجو در چندين مسير باشد. براي پرسش هاي منطقه اي و ناحيه اي نيز تع,,داد مس,,يرهاي جس,,تجو اف,,زايش مي يابد. با اینكه كاركرد حف,,ظ مي ش,,ود، ام,,ا كارآم,,دي ب,,ه ش,,دت تحت ت,,أثير ق,,رار مي گ,,يرد. اين مسئله زماني بغرنج مي ش,,ود ك,,ه داده ه,,اي ك,,ه در درخت درج مي ش,,وند، ب,,زرگ باش,,ند. )ب,,زرگ نسبي، نسبت به ك,,ل فض,,اي موج,,ود( ه,,ر درج ي,,ك ش,,ي داده مي توانن,,د همپوش,,اني و ب,,ه تب,,ع آن متوسط تعداد مسيرهاي جستجو را افزايش دهد. در نه,,ايت ممكن اس,,ت اين رون,,د عمال ش,,اخص بندي را بي فايده سازد. چراكه عمال ممكن است بيش,,تر مس,,يرهايي درخت پيم,,وده ش,,ود. يكي از

اتفاق مي افتد. روش هاي زي,,ادي ب,,راي ك,,اهش اين پدي,,دهr-treeنمونه هاي عملي اين خرابكاري در پيشنهاد شده است. من جمله روشي براي كاهش ميزان همپوشاني مناطق.

مسئله ديگر در مورد مناطق همپوشا، ابهامي است كه در حين درج بوجود مي آيد. اگر م,,ا يك شي داده جديد به درخت اضافه كنيم بر اساس اصول مناطق همپوشا مي ت,,وانيم ه,,ر منطق,,ه دلخواه را به اندازه كافي بزرگ كنيم تا شامل داده جديد شود. براي افزايش كارايي چندين روش پيشنهاد شده است. به عنوان مثال ما مي توانيم تالش ك,,نيم ت,,ا زيرفض,,ايي را بي,,ابيم ك,,ه كم,,ترين

1 Local operation

2 Rescan

3 Rectangle Tree

همپوشاني را داشته باشد. يا منطقه اي كه براي دربرداشتن شي جديد نيازمن,,د كم,,ترين گس,ترش باشد. براي كاهش زمان محاسبه زيرفاي بهينه هيوريستيك هايي پيش,,نهاد ش,,ده اس,,ت. وق,,تي ي,,ك زيرفضا بايد شكسته شود نيز تالش بر اين است شكستگي ب,,ه ص,,ورتي انج,,ام ش,,ود ك,,ه كم,,ترين

همپوشاني را داشته باشد.

Rدرخت

، در واق,,ع ي,,ك سلس,,لهR مع,,رفی ش,,د. ه,,ر درخت 1984 توسط گاتمن در سال Rدرخت متن,,اظر ب,,ا ص,,فحهR بعدي های درون هم قرار گرفت,,ه اس,,ت. ه,,ر گ,,ره از ي,,ك درخت dمراتب از

نمايانگر هر گره است( اگ,,رv نمايش داده مي شود. )Id(v) بعدي كه به شكل dحافظه است و يك v يك گره داخلي باشد، آنگاه Id(v) يك dبع,,دي ش,,امل كوچك,,ترين مس,,تطيل محيطي دربردارن,,ده

كوچكترين مستطيل شي داده ه,,اييId(v) يك گره برگ باشد. vهمه فرزندان آن رأس است و اگر اشاره كننده ب,,ه كوچك,,ترينRذخيره شده در آن محل است. قابل توجه است كه گره هاي درخت

مستطيل محيطي دربردارنده شي هستند و اطالعات دقيق در مورد شكل شي را بايد با مراجع,,ه عبارت است از:Rبه حافظه بدست آورد. ويژگي هايي مهم درخت

هر گره شاملm تا M مدخل است. مگر آنكه آن گره ريشه باشد. ح,,د پ,,ايين mاز خراب شدن درخت و سودمندي حافظه اطمينان ايجاد مي كند. هرگاه تعداد فرزندان ي,,ك گ,,ره ب,,ه

برسد، آن گره بايد حذف شود و فرزندان آن در ميان گره هاي ديگ,,ر پخش ش,,وند. ح,,دmكمتر از تضمين مي كند كه هر گره برگ مترادف تنها يك صفحه از حافظه است.Mباالي

.گره ريشه حداقل دو فرزند دارد مگر اينكه برگ باشد درختR.يك درخت موازانه شده است يعني همه برگ ها در يك سطح قرار دارن,,د

تعداد ركوردهاست. N است كه logm(N) حداكثر Rارتفاع درخت

آزم,,ونv اس,,ت ب,,راي جس,,تجو در ه,,ر گ,,ره B-tree مانن,,د جس,,تجو در Rجستجو بر درخت به عمل مي آيد. پس از آن هم,,ه فرزن,,دان آن گ,,رهIsاشتراك مساحت آن گره با سطح مورد نظر

داراي زيرفض,,اهايR را دارن,,د مالق,,ات مي ش,,وند. ب,,ا توج,,ه ب,,ه اينك,,ه درخت Id(v)ك,,ه ش,,رط همپوشاست ممكن است تعداد زيادي زيرفضا به عن,,وان مح,,ل برخ,,ورد در نظ,,ر گرفت,,ه ش,,ود. در

نش,,ان دهن,,ده اج,,راي20بدترين حالت ممكن است همه گره هاي يك درخت مالقات شود. ش,,كل ri نشان دهن,,ده كوچك,,ترين مس,,تطيل محيطي ب,,راي چندض,,لعي mi است. Rيك مثال براي درخت

كوچك,,ترين مس,,تطيل محيطي ذخ,,يره مي ش,,ود. نمي توان,,د ي,,كRاست. از آنجايي ك,,ه در درخت مسئله جستجو را به صورت كامل حل كند. مگر آنكه اشكال و كوچك,,ترين مس,,تطيل محيطي ب,,ر

در اختيار قرار مي ده,د تنه,ا ح,الت كاندي,,داRهم منطبق باشند و گرنه مجموعه جوابي كه درخت دارند و براي بدست آوردن ج,واب واقعي باي,,د تس,,ت ص,ورت گ,يرد. اين قس,مت ك,ه ش,امل ي,,كدسترسي بيشتر به حافظه و بار محاسباتي بيشتر است در محاسبات گاتمن لحاظ نشده است.

را در درخت درجId(o) باي,,د كوچك,,ترين مس,,تطيل محيطي oبراي افزودن ي,,ك ش,,ي مانن,,د كنيم. بر خالف جستجو تنها يك مسير پيموده مي شود. در هر سطح گ,,رهي را ب,,راي ادام,,ه مس,,ير درج، انتخاب مي كنيم كه اگر شي جديد در آن درج شود نيازمند كم,,ترين م,,يزان گس,,ترش باش,,د. اگر چند گره توانايي برآوردن اين شرط را داشته باشند گاتمن پيشنهاد مي كن,,د ك,,ه گ,,رهي ك,,ه از

همه كوچكتر است انتخاب شود. بنابراين هر شي تنها در يك مح,,ل نگه,,داري مي ش,,ود. وق,,تي ب,,ه گره برگ رسيديم سعي مي كنيم تا شي را درج كنيم و اگر اين درج منجر ب,,ه شكس,,ت آن گ,,ره و

تبديل به دو گره شود بايد تغييرات ايجاد شده در سطح درخت به سمت ريشه منتشر شود. براي حذف ابتدا با جستجوي آن شي محل ذخيره شي را مي يابيم اگ,,ر آن ش,,ي در درخت

)يعني تع,,داد اش,,يا كم,,تر از ح,,د مج,,از1يافت شد آن را حذف مي كنيم. اگر حذف منجر به زيرريز شود( شد، بايد همه اشياي موجود در آن ب,,رگ در ي,,ك گ,ره م,,وقت ذخ,,يره ش,وند. آن ب,,رگ ب,,رگ حذف شود و درخت دوباره سازماندهي شود و سپس همه اشياي موجود در گ,,ره م,,وقت دوب,,اره

درج شوند.

1 Under-flow

فصل دوم: پایگاه داده های تحلیلی

2.

مقدمه.2.1

س,,ازمان ها انج,,ام می ش,,ود، حجم ب,,االیی ازدر تراکنش ه,,ایی ک,,ه هم,,ه روزه در ادارات و ذخ,,یره می ش,,وند.1اطالع,,ات تولی,,د می گ,,ردد. این اطالع,,ات معم,,وال در سیس,,تم های تراکنشی

سیس,,تم های تراکنش,,ی، ب,,ر مبن,,ای س,,ازگاری داده ه,,ا، بروزرس,,انی س,,ریع و ک,,ارا، دسترس,,ی های همزمان و امن، احتمال شکست کم و حفظ سرعت اجرای درخواست ها در حجم باالی ت,,راکنش، استوار است. سرچشمه سیستم های تراکنشی پایگاه داده ه,,ای رابطه ای هس,تند. ام,,ا سیس,تم های تراکنشی حتی در حالت بهینه ب,رای م,دیران و تحلیل گ,ران سیس,تم هایی ک,ه نیازمن,د جمع بن,دی و خالصه سازی اطالعات، مقایسه سریع در میدان های فضا و زمان، ترکیب میلیون ها رخداد، کش,,ف الگوها و دیگر اعم,,ال پیچی,,ده ب,,رای پش,,تیانی از تص,,میم گیری های اس,تراتژیک، هس,تند، نامناس,ب می نماید. از آن جایی که سیستم های تراکنشی به منظ,,ور پش,,تیبانی از پردازش ه,,ای تص,,میم گیری طراحی نشده اند، نوع جدی,,دی از سیس,,تم ها ک,,ه این نی,,از را ب,,رآورده کنن,,د، س,,اخته ش,,ده اند. این سیس,,تم ها، سیس,,تم های تحلیلگ,,ر نامی,,ده می ش,,وند و در ص,,نعت تحت عن,,وان راهکاره,,ای ه,,وش

در این سیستم ها، مخزن داده ها به عنوان یکی از اجزای اص,,لی م,,د نظ,,ر قرار می گیرند.2تجاری قرار دارد و سیستم برای تسهیل تحلیل ه,,ای پیچی,,ده و جمع بن,,دی ه,,زاران رخ,,داد، ط,,راحی ش,,ده است. هم اکنون پرکاربردترین راهکار هوش تجاری، سیستم های تحلیلگر برخط هستند که توان,,ایی

زیادی در پاسخگویی به نیازهای تعاملی دارند.

سیستم های تصمیم یار.2.2

تقس,,یم4 و تص,,میم یار3کاربردهای پایگاه داده به صورت عمده ب,,ه دو دس,,ته تراکنش پ,,رداز می شوند. تراکنش پردازها سیستم هایی هستند که اطالعاتی در م,,ورد تراکنش ه,,ا مانن,,د اطالع,,ات فروش برای یک شرکت یا اطالعات ثبت نام برای یک دانشگاه را ذخیره می کنند. تراکنش پردازها امروزه به صورت گسترده مورد استفاده قرار می گیرند و رشد صنعت ب,,ا اس,,تفاده از این پایگ,,اه داده ها، شتاب گرفته است. سیستم های تصمیم یار به کسب اطالعات در سطحی باالتر از جزییات ذخیره شده در سیستم های تراکنش پرداز، می پردازند. سیستم های تصمیم یار ب,,ه ی,,ک م,,دیر کم,,ک می کنند تا بداند کدام کاال را در یک فروشگاه بای,,د ب,,ه ف,,روش برس,,اند ی,,ا ک,,دام بای,,د در بیش,,ترین

مقیاس در کارخانه تولید شود.

1 Transactional Systems

2 Business Intelligence Solutions

3 Transaction-Processing

4 Decision-Support

به عنوان مثال، پایگاه داده ش,,رکت ها، معم,,وال ممل,,و از اطالع,,اتی در م,,ورد تراکنش ه,,ا و مشتری هاست. حجم این اطالعات برای شرکت های بزرگ ممکن است به صدها گیگابایت یا حتی ترابایت برسد. اطالعات تراکنشی معموال شامل نام و شناسه مش,,تری، ک,,االی خری,,داری ش,,ده و قیمت آن و زمان خرید است. همچنین اطالعاتی در مورد جزیی,,ات ک,,اال، مانن,,د کارخان,,ه س,,ازنده، رنگ، مدل و اندازه آن نیز در پایگاه داده وجود دارد. حتی اطالعات مشتری مانن,,د ن,,ام و شناس,,ه مشتری، میزان و زمان خریدهای پیشین وی نیز ممکن است در پایگ,,اه داده وج,,ود داش,,ته باش,,د. چنین پایگاه داده ب,,زرگی مانن,,د در واق,,ع گنجی پنهان ش,ده اس,ت ک,,ه ب,,ا بک,,ارگیری درس,,ت آن در

تصمیم گیری های تجاری، سود سرشاری نصیب شرکت می شود. برای مثال یک شرکت اتومبیل سازی با بررسی اطالعات خ,,ود ب,,ه این نتیج,,ه می رس,,د ک,,ه بیشتر اتومبیل های کوچک توسط خانم های مجرد خریداری شده است. بر این اساس این کمپ,,انی برای عرضه این کاالی خود، هدف را خانم های مجرد قرار می دهد و تبلیغات خود را معط,,وف این قشر از جامعه می کند بی آنکه برای جذب مش,,تریان از طبقه ای دیگ,,ر از جامع,,ه ه,,زینه ای ص,,رف

کند. مدیریت اطالعات در یک کاربرد تصمیم یار با معضالتی روبروست.

با اینکه بیشتر پرسش های یک کاربرد تصمیم یار با زبانSQL،قاب,,ل نوش,,تن اس,,ت اما نوشتن برخی دیگر بس,,یار دش,,وار و پ,,اره ای تقریب,,ا غ,,یرممکن اس,,ت. ب,,رای رف,,ع این مش,,کل

SQL.های گسترش یافته با گسترش و افزودن پاره ای دستورات و ساختار ایجاد شدمنابع اطالعاتی شرکت ها ) با توجه به کاربرد ی,,ا پراکن,,دگی جغرافی,,ایی( متف,,اوت و

استفاده کردند. در این مخازن داده ه,,ا3گوناگون است. برای این منظور شرکت ها از مخازن دادهبه صورت یکپارچه و تحت قالب و معنای یکسان ذخیره می شد.

تعریف پایگاه داده تحلیلی.2.3

يدر اين تحقيق اصطالح »پايگاه داده تحليلي« به ج,,اي »مخ,,زن داده« ب,,ه عن,,وان ترجم,,هDataي مفهومي كلمه Warehouseبکار رفته است. اين اص,,طالح در مقاب,,ل اص,,طالح پايگ,,اه داده

روز و ج,,اري جهتهاي بههاي داده عملياتي یا تراکنشی شامل دادهشود. پايگاهعملياتي تعريف مي ه,,ا هس,,تند در حاليک,,ه پايگ,,اه داده تحليليي دادهي ثبت، اص,,الح و مش,,اهدهانجام عمليات روزان,,ه

باشد. ها ميگيريها و تجزيه و تحليلهايي براي انجام تصميمشامل داده اي ارايه داد، يك پايگ,,اه داده تحليلي مجموع,,ه1992 در سال Inmonمطابق با تعريفي که

[ :Inm92روند]يار بکار ميهاي تصميمها با خواص زير است که براي کمک به سيستماز داده

( مبتني بر موضوعSubject-Oriented.)( يکپارچهIntegrated.)( مبتني بر بازه هاي زماني متفاوتTime Variant.)( غير فرارNonvolatile.)

3 Data warehouse

های یک پایگ,,اه داده تحلیلی، از من,,ابع گون,,اگون ک,,ه در بس,,یاریمطابق با این تعریف، داده ش,,ود و پس از عملی,,ات پاکس,,ازی وآوری میاوق,,ات هم,,ان پایگ,,اه داده عملی,,اتی هس,,تند، جم,,ع

ذخ,,یرهیکپارچه سازی بر اساس ویژگی زمان طبقه بندی شده و در یک پایگاه داده فقط خوان,,دنی شوند. در ادامه مطالب به بررسی تک تک ویژگیهای یک پایگاه داده تحلیلی به ص,ورت مش,,روحمی

خواهیم پرداخت.

2.2.1.2.2.2.3.مبتنی بر موضوع.2.3.1

هاي خود راهر پايگاه داده تحليلي حول موضوع خاصي سازمان مي يابد و فعاليتها وپردازش براي مدل كردن و تحليل داده ه,,اي مرتب,,ط ب,,ا آن موض,,وع متمرك,,ز مي نماي,,د و ب,,ا كن,,ار گذاش,,تن داده هايي كه براي تصميم گيري مفيد و موثر نباشند, يك دي,,دگاه دقي,,ق, س,,اده و متمرك,,ز ب,,ر روي

گرایی یک پایگاه داده تحلیلی مت,,أثر از ک,,اربردموضوع اصلي ايجاد مي كند. به این ترتیب، موضوع آن در دیدگاه کاربر نهایی است و عملیات ایج,,اد پایگ,,اه داده تحلیلی ب,,ر مبن,,ای موض,,وع خ,,اص ب,,ا

ابزار یکپارچه سازی و پاکسازی آن میسر میشود.

یکپارچگی و یکپارچه سازی.2.3.2

طور که در تعریف پایگاه داده تحلیلی ن,,یز اش,,اره ش,,د، من,,ابع ایج,,اد ی,,ک پایگ,,اه دادههمان ه,,اتحلیلی معموال پایگاه دادههای عملی,,اتی هس,,تند ک,,ه ممکن اس,,ت نح,,وه ذخ,,یره اطالع,,ات در آن

ه,,ای ح,,اوی داده ی,,ا رکورده,,ای ح,,اویمتفاوت باشد. عالوه ب,,ر آن ممکن اس,,ت اطالع,,ات از فای,,ل آوری مجموعه ازهای مبدأ، منجر به جمعتراکنش برخط نیز تهیه شود. تنوع منابع تولید کننده داده

ها ب,,ا یک,,دیگر متف,,اوتها میشود که اگرچه در معنا یکسان هستند، اما قالب ارائه و نمایش آنداده ش,,ود ت,,ا این مجموع,,هها انجام میسازی بر روی دادهاست. از این رو عملیات پاکسازی و پکپارچه

هاههای مرتبط و بامعنا تبدیل کند. برای درک مسئله تفاوت دادداده ناسازگار و متفاوت را به دادهدر منابع، مثال زیر را در نظر بگیرید.

جدوالی در دو پایگاه داده عملیاتی متفاوت دارنده اطالعات کارمن,,دان ی,,ک ش,,رکت اس,,ت ش,,ود. اگرچ,,ه این فیل,,د نم,,ایش داده میM و F و در دیگ,,ری ب,,ا 1 و 0که فیلد جنسیت در یکی ب,,ا

دارای معنای یکسان هستند اما برای قرار گرفتن در پایگ,,اه داده تحلیلی در کن,,ار یک,,دیگر بای,,د درقالبی استاندارد و یکسان ارائه شوند.

نمایش اطالعات با معنای یکسان اما تحت قالبهای متف,,اوت تنه,,ا یکی از مص,,ادیق اعم,,الروشهای پاکسازی و یکپارچهسازی است. پاکسازی و یکپارچه سازی در مواردی دیگر چون

سازگارسازی قوانین نامگذاریگیرییکسان سازی واحدهای اندازه یکسان سازی کدهای رمزگذاری

از منابع گوناگون ب,,ه ص,,ورت س,,ازگار و پاي,,دار درباید اعمال شود تا مجموعه داده حاصل كنار يكديگر قرار گيرند و يكپارچگي پايگاه داده تحليلي را تضمين نمايند.

های زمانی متفاوتمبتنی بر بازه.2.3.3

ترین مشخصات یک پایگاه داده تحلیلی که موجب تفاوت اساسی آن با پایگ,,اه دادهاز مهم طور کههای کاربران نهایی است. همانها و ارزیابیعملیاتی شده است، اهمیت بعد زمان در پرسش

ه,,ایی ب,,ودها و پرسشیار و نوع درخواستهای تحلیلی مولود کاربردهای تصمیمگفته شد، پایگاه داده ه,,ایشد. بررسی عوامل و حقایق مربوط به موضوع در زمانکه در این رده از کاربردها مطرح می

-محدوده و بازههای این دسته کاربردهاست. ترین پرسشی اساسیها از جملهنمتفاوت و مقایسه آ ت,,ر از سيس,,تم هايهاي ذخيره شده در پايگاه هاي داده تحليلي نیز، به مراتب وس,,يعي زماني داده

شوند و با مقادير جاريروز ذخيره مي هاي داده عملياتي, داده هاي بهعملياتي رايج است. در پايگاه ه,,اي زم,,انيها در بازهخود مورد بررسي قرار مي گيرند در حاليكه در پايگاه هاي داده تحليلي، داده

ه,,ايشوند و اطالعات از منظ,,ر س,,وابق زم,,اني و دورهايي ذخيره ميمتفاوت و به صورت تاريخچه گيرند. هر ساختار كليدي در پايگ,,اه داده تحليلي, ب,,ه ط,,ور ص,,ريح ي,,ابايگاني مورد بررسي قرار مي

ضمني, شامل عنصر زمان است در حاليكه كلي,,دهاي داده ه,,اي عملي,,اتي مي توانن,,د ش,,امل زم,,انباشند يا نباشند.

غیرفرار.2.3.4

ش,,وند وش,,وند، وی,,رایش میه,,ا ب,,ه ص,,ورت مک,,رر درج میه,,ای عملی,,اتی دادهدر پایگاه داده ممکن است حذف گردن,د. ام,ا در م,,ورد پایگ,,اه داده تحلیلی ب,,ه این ص,ورت نیس,ت. پس از تهی,ه

ش,,وند. ام,,ا اینها وارد پایگاه داده تحلیلی میها، دادهسازی آنها از منابع و پاکسازی و یکپارچهداده ه,,ایگیرند و ویرایش معمول در محی,,طها به صورت فقط خواندنی در اختیار کاربران قرار میداده

ه,,ای موج,,ود در پایگ,,اه دادهه,,ا موض,,وعیت ن,,دارد. اگرچ,,ه دادهعملیاتی در م,,ورد این پایگ,,اه داده های عملیاتی اس,,ت. در بخش .... درشود اما بروزرسانی آن متفاوت از محیطتحلیلی نیز بروز می

مورد بروزرسانی پایگاه داده تحلیلی بیشتر صحبت شده است.

های تحلیلی برخطپردازش.2.4

وظيفه اصلي و مهمترين کاربرد پايگاه هاي داده تحليلي انجام پردازش ه,,اي تحليلي برخ,,ط ه,,ای تراکنش,,ی برخ,,ط اس,,ت[. در مقابل پردازش تحلیلی برخط، پردازشSho97باشد] ميOLAPيا

ه,ای تراکنش,ی برخ,ط،پ,ذیرد. منظ,ور از پ,ردازشهای تراکنشی یا عملیاتی صورت میکه در محیط ه,,ایانجام عملیات روزانه مانند اعمال روزمره انجام شونده در سیستم بانکی اس,,ت ک,,ه ب,,ا داده

های تحلیلی برخ,,ط، عملی,,ات ب,,رکه در پردازشبروز، جاری و با جزییات زیاد سروکار دارد. در حالی- عبارت است از مجموعهOLAPشود. های موضوعی، یکپارچه و سرجمع شده انجام میروی داده ي چندبع,,دي ب,,اه,,اي مبت,,ني ب,,ر ي,,ک ش,,يوهافزارها که براي اکتشاف و تحليل سريع دادهاي از نرم

-گیری را سریع و آسان می تصمیمOLAP[., Sho97شود]سازي استفاده ميچندين سطح از مجموع-سازی است که در پایگ,,اه داده تحلیلی انج,,ام میگیری در پی عملیات مجموعکند. سرعت تصمیم

زمان محاسبه کاهش يافته و پاسخگويي به پ,,رس و جوه,,اي سازیپذیرد. با انجام عملیات مجموعپذير خواهد بود.ي تحليلي به سرعت امکانپيچيده

هاي دفتري و کارهاي کاغ,,ذي مرب,,وط ب,,ه دادهي پردازش وظيفهOLTPهاي كاربردي برنامه گ,,يرد. اين وظ,,ايفهاي بانكي كه هر روز در يك سازمان ص,,ورت ميكنند، مثال تراكنشرا خودكار مي

ه,,ا ني,,از ب,,ههاي كوتاه، اتمي و منفرد هستند. ت,,راكنشيافته، تكراري و تشكيل شده از تراكنشساخت کنن,,د ك,,هخوانن,,د ي,,ا ب,,ه هنگ,,ام ميي دقيق و به روز دارند و در يک لحظه چن,,د ده رك,,ورد را ميداده

ي عملي,,اتي معم,,وال درش,,وند. حجم داده در پايگ,,اه دادهمعموال توسط كليدهاي اوليه دس,,تيابي مي ي صدها مگابايت تا چندين گيگا بايت است. صحت و قابل ترميم بودن پايگ,,اه داده ام,,ريمحدوده

-ضروري و حياتي است و حداكثر كردن توان عملياتي يك معيار كلي,,دي ب,,راي س,,نجش ك,,ارايي مي-توان نتيجه گرفت که پايگاه داده براي كاربردهاي عملياتي معلوم و حداقل ك,ردن ت,,داخلباشد. مي

هاي همزماني، طراحي شده است. گيري است. داده هاي تاريخي خالصهدر مقابل، پايگاه داده تحليلي براي حمايت از تصميم

شده و تركيبي، مهمتر از ركوردهاي دقيق و منفرد اس,,ت. از آنج,,ا ك,,ه پايگ,,اه داده تحليلي ش,,امل ان,,د وش,,دهي عملي,,اتي ب,,ه م,,رور زم,,ان جم,,ع آوريهاي تركيبي است که از چندين پايگ,,اه دادهداده

ي پايگاه دادههاي عملياتي حجيم هستند؛ اندازهمعموال چندين برابر پايگاه داده هاي تحليلي معموال ش,,ود. ب,,ار ك,,اري معم,,وال متمرک,,ز ب,,ر پ,,رسبين صدها گيگا بايت تا چندين تراب,,ايت تخمين زده مي

وجوهاي زياد است. پرس وجوهاي خاص و پيچيده اي ك,,ه ميليونه,,ا رك,,ورد را دس,,تيابي مي كن,,د و تعداد زيادي پويش كامل و الحاق و مجموع سازي دارد. توان عملياتي پ,,رس وج,,و و زم,,ان پاس,,خ

آن، مهمتر از توان عملياتي تراكنش است.

پpppppppردازشتحليلي برخppppppط )

OLAP)

پpppردازش تpppراكنشبرخط

(OLTP)

معيار ارزيابي

ك,,,,,,اربران فن,,,,,,اوريكاركنان دانشاطالعات

كاربران

پش,,,,,,تيباني ازگيريتصميم

عمليات روزانه وي,,رايشهاو ديد داده

عملکرد

ط,,راحي پايگ,,اهكاربرد-گراموضوع-گراداده

ت,,,,,,,,,,,اريخي، چندبع,,,دي, يكپارچ,,,ه، خالصه شده, س,,رجمع

شده

جاري, به روز, باجزئيات,رابطه اي,منفرد

داده

عمليات تحليليخاص منظوره

كاربردعمليات تكرارشونده

پ,,,,,,,,,,,,,ويشسراسري وگسترده

خوان,,,,,,دن/نوش,,,,,,تن, انديس گ,,,,,ذاري/درهم س,,,,,ازي

دسترسي

برروي كليد اصلي پرس وجوه,,,اي

پيچيده تراكنش ه,,,اي س,,,اده و

كوتاهواحد كاري

ميليون ه,,,,,,,,,اركورد

تعداد ركورده,,ايدهها ركوردمورد دسترسي

تعداد كاربرانهزاران كاربرصدها كاربر گيگاب,,,,,,,,ايت-

ترابايت ان,,,,دازه پايگ,,,,اهمگابايت- گيگابايت

داده ب,,,,,,,,,,,,,,,ازده

پرس وجو, پاسخمعيار سنجشبازده تراكنش

مقایسه پردازش تحلیلی و پردازش تراکنشی1-2جدول

- با توجه به معیارهای ارزیابی ذکر شده اس,,ت. تف,,اوتOLTP و OLAPدر جدول باال تفاوت -ه,ای تص,میمهای پایگاه داده یعنی سیستم عمدتا ناشی از دو کاربرد سیستمOLTP و OLAPهایی

OLAPطور که در جدول نیز قابل مشاهده است، کاربران های تراکنشی است. همانیار و سیستم ایکارکنان دانش هستند. منظور از کارکنان دانش، کسانی هستند که به دنبال یافتن الگو و نتیج,,ه

ه,,ای مرتب,,طگ,,یریاند که از این نتایج ی,,ا الگوه,,ا در جهت تص,,میماز اطالعات موجود در پایگاه داده ه,,ا کاربران فناوری اطالعات هس,,تند ک,,ه از این پ,,ردازشOLTPکنند. در مقابل کاربران استفاده می

باش,ند. س,ایر معیاره,ایه,ا در مقی,,اس ح,داکثر چن,,د ده رک,ورد میها ی,ا تغی,,یر آنبرای ثبت تراکنش ه,,ای تحلیلی و تراکنش,,ی قاب,,ل توجی,,هها با درنظر داشتن تفاوت کاربرد پردازشارزیابی و مقدار آن

هستند. ان,,د، تنظيم ش,,دهOLTPهاي داده عملياتي دقيقا براي حمايت از بار كاري از آنجا كه پايگاه

براي آنها كارايي غير قابل قبولي خواهد داش,,ت. همچ,,نينOLAPاجراي پرس وجوهاي پيچيده ي يه,,اي دادهه,,ايي داش,,ته باش,,د ك,,ه در پايگ,,اهحمايت از تص,,ميم گ,,يري ممكن اس,,ت ني,,از ب,,ه داده

ه,,اي ت,,اريخيبي,,ني ك,,ردن ني,,از ب,,ه دادهعملي,,اتي رايج وج,,ود ندارن,,د؛ مثال درك رون,,د ك,,ار و پيش كنن,,د.ه,,اي ج,,اري سيس,,تم را ذخ,,يره ميي عملي,,اتي فق,,ط دادههاي دادهدانيم پايگاهدرصورتيکه مي

گيري معموال نياز به تركيب كردن داده از منابع غيرهمگون دارد كه ممكن اس,,تحمايت از تصميم ي عملياتي، شامل منابع خارجي مثل منبع اطالعات ب,,ازار ب,,ورس باش,,د.عالوه بر چند پايگاه داده

ه,,ايها، كدها و ف,,رمتهايي با كيفيت متفاوت باشند يا از آرايهمنابع مختلف ممكن است داراي داده ي چن,,دناسازگار استفاده كنند كه بايد تص,,حيح و س,,ازگار ش,,وند. در نه,,ايت، حم,,ايت از م,,دل داده

نياز به سازماندهي خاصي از داده، روشهاي دس,,تيابي و روش,,هايOLAPبعدي و عمليات ويژه ي ان,,د، ف,,راهم س,,اخته ش,,دهOLTP هاي تجاري که ب,,راي DBMSپياده سازي دارد كه عموما توسط

شود. به اين داليل، پايگاه داده تحليلي به طور جداگانه، از پايگاه داده ي عملياتي پياده س,,ازينميشود.مي

داده های چندبعدی.2.5

ص,,فات مختل,ف اس,ت.1بسیاری از پردازش ها و تحلیل ه,,ای آم,,اری مس,تلزم گروه ک,,ردن مث,,الی را در نظ,,ر بگیری,,د ک,,ه در آن ی,,ک فروش,,گاه درص,,دد اس,,ت بدان,,د چ,,ه ان,,واعی از لب,,اس پرطرفدارترند تا بر اساس آن اقدام به عرضه کند. اجازه دهید لباس ها را با نام، رن,,گ و س,,ایز از یکدیگر متمایز کنیم. همچنین فرض کنید ما یک جدول ب,,ه ن,,ام ج,,دول اطالع,ات ف,روش داریم ک,,ه دارای چهار ستون نام، رنگ، سایز و میزان فروش است که نشان می ده,,د ه,,ر لب,,اس در س,ایز و رنگ معلوم چه میزان فروش داشته اس,,ت. رن,,گ می توان,,د س,,ه مق,,دار س,,یاه، س,,فید و قرم,,ز را

اختیار کند و سایز دارنده مقادیر بزرگ، کوچک و متوسط است. با توجه به موضوع مورد بررسی در یک پردازش تحلیلی بر خط، برخی صفات بی,,انگر ی,,ک

هستند. این ان,,دازه ها دارای مق,دار هس,,تند و می توانن,,د جمع بن,دی ش,وند. در مث,,ال ب,,اال،2اندازه میزان فروش یک اندازه است. همه یا ب,رخی ص,فات دیگ,ر، بع,د نامی,ده می ش,وند. این ابع,اد ب,ر اندازه اثرگذارند و اندازه در راستای این ابعاد قابل جمع بندی یا جزیی شدن می باشد. در مثال باال سایز، رنگ و نام ابعاد هستند. در تعریفی دیگر اندازه یک عدد است که به یک تابع از ی,,ک ی,,ا چن,,د

که مقادیر هر بعد م,,اهیتیمقدار ) تحت ابعاد مختلف ( نسبت داده می شود. با در نظر گرفتن این ت,,وان گفت ک,,ه ان,,دازه در اینه,,ا از کمیت دیگ,,ری وابس,,ته نیس,,ت، میمستقل دارند؛یعنی مقدار آن

سیستم کمیتی وابسته است. اندازه تابعی از چند بعد است. نامی,,ده می ش,,ود. معم,,وال موض,,وع3داده هppای چندبعppدیابع,,اد و ان,,دازه ها در کن,,ار هم

پردازش های تحلیلی برخط یک داده چندبعدی است. برای تحلیل، تحلیلگر مایل است داده ها را درقالب جدولی مانند جدول زیر ببیند.

جدول متقاطع26-2شکل

این جدول نشان دهنده میزان کل فروش تحت ترکیبات مختلف مقادبر ن,,ام و رن,,گ اس,,ت. بعد سایز در گوشه باال سمت چپ مقدار "تمام" را اختیار کرده اس,,ت ک,,ه نش,,ان می ده,,د در این

1 to group

2 measure

3 Multidimensional Data

این جدولصورت گرفته است. 1جدول سایز بعد مورد بررسی نیست و در راستای آن جمع بندی یاد می شود. در حالت کلی، جدول3 است که از آن به جدول چرخنده2مثالی از یک جدول متقاطع

، سازنده سطرها و مقادیر صفت دیگ,,ر،Aمتقاطع جدولی است که در آن مقادیر یک صفت،مانند ( نم,,ایش دادai,bj، سازنده ستون های آن جدول هستند. هر خانه این جدول را می توان ب,,ا )Bمانند

است. اگر در جدول اصلی، سطری با مق,,ادیرB مقداری از صفت bj و Aمقداری از صفت aiکه ai وbj ( وجود داشت و این سطر تنها سطر موجود برای این مقادیر بود، میزان فروش در خان,,ه

ai,bjشود. اما اگر آن س,,طر یکی ب,,ود، بای,,د م,,یزان ف,,روش ب,,رای هم,,ه آن( جدول متقاطع ثبت می ( ثبت شود. ai,bjسطرها جمع شود و حاصل آن در خانه )

جدول متقاطع، تنها دو بعد از ابع,,اد اثرگ,,ذار را نم,,ایش می ده,,د. در ح,,الی ک,,ه در مس,,ائل واقعی تعداد ابعاد معموال بیش از دو بعد است. ص,,ورت کلی ت,,ر ی,,ک ج,,دول متق,,اطع، مکعب داده

. 4-بعد اثرگذار استnاست. مکعب داده دربردارنده

مکعب داده27-2شکل

سه بعد مؤثر در تحلیل در قالب یک مکعب نمایش داده شده است. هر یک 2-2در شکل از وجوه این مکعب د واقع جدولی متقاطع است که در راستای بعد غایب، جمع بندی شده است.

1 Aggregation

2 Cross-Table

3 Pivot Table

nشاید نام مکعب، به جهت کاربرد آن در فضای سه بعدی، برای نشان دادن یک شکل محدود در فضای 4 از نام ابرمکعب استفاده می کنند. اما در3بعدی، اندکی نامأنوس به نظر آید. در برخی منابع در ابعاد بیش از

بعد استفاده خواهیم کرد.3 یا بیش از 3سراسر این سند، ما از نام مکعب برای اشاره به

گفته می ش,,ود.1به تغییر ابعاد نمایش داده شده در جدول متقاطع یا مکعب داده، چرخش بدین سبب که این عمل مانند آن است که مکعب را بچرخانیم و از منظ,,ری دیگ,,ر ) ک,ه نمایانن,ده ابعادی دیگر است( بنگ,,ریم. این عم,,ل، توس,ط سیس,,تم های ت,,راکنش برخ,,ط قاب,,ل انج,,ام اس,ت.

عالوه بر عمل چرخش دارای کارکردهای دیگر نیز هستند که در اینجا به برخیOLAPسیستم های از آن ها اشاره می شود.

فرض کنید، تحلیلگر می خواهد جدول متقاطع با ابعاد رنگ و نام را داشته باش,,د، در ح,,الی که در آن جدول، سایز به جای مقدار "تمام" مقدار "بزرگ" را ب,,ه خ,ود اختص,اص داده باش,د. ب,,ه این عمل برش گفته می شود. چرا که مانند آن است ک,,ه مکعب را در راس,,تای وج,,ه رن,,گ-ن,,ام از

زده باش,,یم. اگ,,ر ب,,رش در مق,,دار بیش از ی,,ک بع,,د باش,,د، آن را تک,,ه2محل مقدار "بزرگ" برش می گویند.3کردن

ابعاد می توانند سلسله مراتب داشته باشند. به عنوان مثال، بعد پرکاربرد زمان را در نظربیاورید. زمان می توانند تحت سلسله مراتب روز، ماه، فصل و سال بیان شود.

سلسله مراتب بعد زمان و بعد مکان28-2شکل

حرکت در راستای سلسله مراتب است. حرکت درOLAPاز دیگر کارکردهای یک سیستم می گویند.drill-down و از سطح کلی تر به جزئی تر را roll-upسطح جزئی تر به سمت کلیت را

ساختار پايگاه داده تحليلي.2.6

س,,ازی ی,,ک پایگ,,اه دادههای چندبع,,دی ب,,رای پی,,ادهمنظور از ساختار داده، مدل کردن داده اي استاندارد يا توسعه يافت,,ه رابطهDBMSپايگاه داده تحليلي ممكن است بر روي تحلیلی است.

1 Pivot

2 Slice

3 Dice

ش,,ود. اين ش,,ناخته ميROLAP1 رابط,,ه اي و ي,,ا OLAPپياده سازي شود كه با نام سرويس دهنده اس,,ت و آنه,,ا ب,,ااي ذخ,,يره ش,دهي رابط,,هكنن,,د ك,,ه داده در پايگ,,اه دادهدهندگان ف,,رض ميسرويس

ي چن,,د بع,,دي و و روشهاي خاص دستيابي ق,,ادر ش,وند ک,ه م,,دل دادهSQLهاي استفاده از توسعه چند بعديOLAPعمليات آن را به طور كارا پياده سازي نمايند. در مقابل آنها، سرويس دهندگان

چن,,د بع,,دي را ب,,ه ط,,ور مس,,تقيم در س,,اختمانداده ي، سرويس دهندگاني هستند كه MOLAP2يا را ب,,ر روي آن پي,اده س,ازي مي كنن,,د. گ,اه ن,یز از ت,,رکیبOLAPهاي خاص ذخ,يره نم,,وده و داده شود. گفته میHOLAP3شود که به آن گرا استفاده میای و شیرابطههای روش

برای پیاده س,,ازی م,,دل چندبع,,دی دادهMOLAPهمان طور که گفته شد در سرویس دهنده چگون,,ه م,,دل چندبع,,دیROLAPاز ساختمان داده های خاص استفاده می شود. اما س,,رویس دهنده

داده را پیاده سازی می کند؟ ERپایگاه داده های رابطه ای برای پردازش های تراکنشی بسیار مناسب است. نموداره,,ای

و روابط آن ها بکار می رود، حالت متقارن دارند. به این معنا که هر جدول4که برای نمایش نهادها دارای ارزشی یکس,,ان ب,,ا دیگ,,ر جدول هاس,,ت. عالوه ب,,ر این ب,,ا توج,,ه ب,,ه رواب,,ط می,,ان ج,,دول ها، می توان پاسخ پرس,,ش ها تراکنش,,ی را بدس,,ت آورد. ام,,ا پرس,ش های تحلیلی معم,,وال دربردارن,,ده تعداد زیادی جدول است که روابطی چند نیز میان آن ها برقرار است. تعدد ج,,دول ها و رواب,,ط در پردازش های تراکنشی سبب می شود، اجرای پرسش های پردازشی بسیار زمان بر باشد. بن,,ابراين

- براي ط,راحي پايگ,,اه داده تحليلي مناس,ب نميERتوان نتيجه گرفت که استفاده از نمودارهاي مي کن,,د بطوريک,,ه فهم آنه,,ا، بس,,يار پيچي,,ده عم,,ل ميباشد زيرا اين مدل براي پاسخگويي به پرس,,ش

براي کاربران دشوار است. و5در مدل ک,,ردن پایگ,,اه داده تحلیلی دو ن,,وع ج,,دول اهمیت زی,,ادی دارد. ج,,دوال حقیقت

جدوال بعد. پايگ,,اه داده تحليلي براس,,اس ن,,وع ارتب,,اط ج,,دول حق,ايق ب,,ا ج,,داول بع,,د ب,,ه اش,,كالاي، شماي دانه برفي و صورت فلکي.شوند که عبارتند از شماي ستارهمختلفي مدل مي

شمای ستاره ای از این رو ستاره ای نامیده می شود، که یک جدول حقیقت در مرک,,ز م,,دل این م,,دل نامتق,,ارنERقرار دارد و جدوال بعد، گرداگرد آن قرار گرفته اند. ب,,ر خالف نموداره,,ای

است. ب,,ه این معن,ا ک,,ه ارزش ج,,دول حقیقت بیش از ج,,داول بع,د اس,ت. ج,,دول حقیقت ش,املکلیدهای خارجی به جداول بعد است.

1 Relational OLAP

2 Multidimensional OLAP

3 Hybrid OLAP

4 Entity

5 Fact Table

مدل ستاره ای29-2شکل

مدل مطرح دیگر در زمینه مدلسازی داده ه,,ای چندبع,,دی، م,,دل دان,,ه ب,,رفی اس,,ت. م,,دل دانه برفی اساسا مانند مدل ستاره ای نامتقارن است. یک جدول حقیقت در مرکز مدل ق,,رار دارد و جداول بعد در اطراف آن قرار گرفته اند. تفاوت مدل دانه برفی و م,,دل س,,تاره ای در تعری,,ف ی,,ا عدم تعریف سلسله مراتب برای ابعاد است. در واقع در مدل دانه ب,,رفی ه,,ر بع,,د می توان,,د دارای

سلسله مراتبی باشد که نمایش آن سلسله مراتب شکل دانه برف را الهام می کند.

مدل دانه برفی30-2شکل

روشی دیگر مدلسازی داده های چندبعدی، روش ص,,ورت فلکی اس,,ت. ن,,ام ص,,ورت فلکی یادآور مجموعه ای از ستاره هاست. در این مدل نیز به همین صورت است. از کنار هم ق,,رار دادن چند مدل ستاره ای یک م,,دل ص,,ورت فلکی ایج,,اد می ش,,ود. م,,دل ص,,ورت فلکی ب,,رای داده ه,,ایی

مناسب است که حقایق مختلف دارای جداول بعد مشترک باشند.

مدل صورت فلکی31-2شکل

فصل سوم: پایگاه داده های تحلیلی جغرافیاییتوابع مجموع سازی جغرافیایی