36
ادرس فره درای نکات مطرح شدر مبنید ها ب این اس« ابیره و بازی آموزش ذخیعات اط» یه ته شده است. جعه نماینک زیر مران آموزش به لی در مورد ای بیشترعاترای کسب اط ب یدfaradars.org/fvsft106 آموزش ذخیره وابی بازیعات اطfaradars.org/fvsft106 ﻓﺮادرسFaraDars.org

آموزش ذخیره و بازیابی اطلاعات - درس پنجم

Embed Size (px)

Citation preview

Page 1: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

این اسالید ها بر مبنای نکات مطرح شده در فرادرس

« اطالعاتآموزش ذخیره و بازیابی »

.شده استتهیه

یدبرای کسب اطالعات بیشتر در مورد این آموزش به لینک زیر مراجعه نمایfaradars.org/fvsft106

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

فرادرس

FaraDars.org

Page 2: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

:مدرس

فرشید شیرافکن

دانشگاه تهران دکتری دانشجوی (بیو انفورماتیک: دکتری( )کامپیوتر نرم افزار: کارشناسی و کارشناسی ارشد )

ذخیره و بازیابی اطالعاتساختار پایل: درس پنجم

2

فرادرس

FaraDars.org

Page 3: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

3

به آنها مورد نظر است كه براي رسيدنصرفه جویي در حافظه و سرعت عملياتي در هر سيستم فایل دو هدف

:ذخيره و بازیابي در نظر گرفت هاي سيستمباید جنبه هاي زیر را در طراحي

حداقل بودن افزونگي -1

دستيابي سریع -2

بهنگام سازيعمليات سهولت در -3

سيستمنگهداري سهولت -4

باالاطمينان قابليت -5

. داردرسيدن به این اهداف در یك سيستم فایل به ساختاري كه آن سيستم ایجاد مي كند بستگي

. شناخت ساختارهاي فایل اهميت خاص خود را داردبنابراین

فرادرس

FaraDars.org

Page 4: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

4

(بي نظم)پایل -1

ترتيبي -2

ترتيبي شاخص دار -3

چند شاخصي -4

مستقيم -5

ايچند حلقه -6

...ودرختي -7

انواع ساختار های فایل

فرادرس

FaraDars.org

Page 5: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

5

( R)اندازه ركورد -1

()زمان واكشي یك ركورد از فایل -2

()زمان بازیابي ركورد بعدي -3

زمان بهنگام سازي از طریق درج یك ركورد -4

زمان بهنگام سازي از طریق ایجاد تغيير در یك ركورد-5

()زمان خواندن تمام فایل -6

( )زمان سازماندهي مجدد فایل -7

FT

NT

)( IT

)( UT

XT

YT

: وندبرای ارزیابی ساختارهای مختلف فایل، ضوابط زیر بررسی می ش

فرادرس

FaraDars.org

Page 6: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

6

. بهنگام سازي، حذف و سازماندهي مجدد، درج

.استبهنگام سازي حالت خاصي از حذفعمل

ایدل و واكشي، بازیابي ركورد بعدي، درج ركورد جدیدد، بهنگدام سدازي، خوانددن تمدام ف)انجام عمليات ششگانه

. جر مي شوددر محيط فيزیكي منمكان یابي، خواندن فيزیكي و نوشتن فيزیكي ، به سه عمل (سازماندهي مجدد

عملیات تغییر دهنده محیط فیزیکی

فرادرس

FaraDars.org

Page 7: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

7

:فایل متراکم -1.تمام ركوردهایش مشخص باشندفيلدهاي مقادیر همه تمام

:فایل غیر متراکم-2.نيستدر برخي از ركوردها موجود فيلدها از مقادیر بعضي از برخي

انواع فایل

حافظده جده نتيهنگامي فایل غيرمتراكم مي شود كه ركوردها طول ثابت و قالب ثابت مكاني داشته باشدند و در

. هرز ایجاد مي شود

. داریم(Missing information)نهست اطالع در فایل غيرمتراكم،

فرادرس

FaraDars.org

Page 8: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

8

.باشندشده ذخيره از یكبار در محيط فيزیكي بيش فيلدهاي آن كه مقادیر بعضي از فایلي

.رداستفاده كفشرده سازی تكنيكهاي اي استفاده كرد یا از چندحلقه مثالً از ساختار . افزونگي طبيعي را باید كاهش داد

فایل با افزونگی

انواع افزونگی (Technical Redundancy)افزونگی تکنیکی -1

.سازي جهت ایجاد یك شيوه دستيابي كاراتر براي فایل ذخيره در محيط فيلد مقادیر یك بعضي از تكرار .فایل شاخص تكرار خواهند شددر یك فایل، شاخص ایجاد مي كنيم، مقادیر آن از فيلدي وقتي كه روي مثال

(Natural Redundancy)افزونگی طبیعی -2

. تعدادي از نمونه ركوردها وجود داردفيلدي در مقدار مشخص از یك .اندوجود نام یك درس در ركورد تمامي دانشجویان كه آن درس را گرفته ،دانشجویاندر فایل ثبت نام مثال

فرادرس

FaraDars.org

Page 9: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

9

.مي شودطول ركوردها متغير و هم افزونگي طبيعي تشدید هم شرایطي كه یك روش كاهش افزونگي در

تکنیک فشرده سازی ماتریس بیتی

180 181 182 183 184

94110 0 0 0 1 1

94111 0 1 0 1 0

94112 0 0 0 0 1

. از مجموعه اي محدود انتخاب شده باشندفيلد هنگامي كاربرد دارد كه صفت چند مقداري داشته باشيم و همچنين مقادیر

. بيت حافظه نياز استnذخيره سازي تمام این صفات به براي

فرادرس

FaraDars.org

Page 10: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

10

واكشي ركورد دلخواه-1

بازیابي ركورد بعدي-2

بهنگام سازي از طریق درج-3

از طریق تغيير محتواي ركوردبهنگام سازي -4

خواندن تمام فایل -5

سازماندهي مجدد -6

شرح اصول عملیات ششگانه

فرادرس

FaraDars.org

Page 11: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

11

. به عنوان آرگومان جستجو داده مي شودركورد فيلد هايیكي از مقدار

:عملاین الزمه

فایلكردن در جستجو •

به بالک حاوي ركورد مورد نظر دستيابي •

بالکخواندن•

د و ترتيبي، تعدادي بالک به طور پي درپي خوانده مي شود تا به بالک مورد نظر برسيروش دسترسدر

. آدرس بالک بدست آمده و بالک مستقيماً خوانده مي شودمستقيم، روش در

واکشی رکورد دلخواه

فرادرس

FaraDars.org

Page 12: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

12

(Single request)ساده-1

.150درخواست واكشي ركورد با شماره دانشجویي

(Range request )طیفی-2

. 200تا 100دانشجویيدرخواست واكشي مشخصات دانشجویان از شماره

(Functional request)محاسباتی-3

. است، وقتي كه خود معدل در فایل ذخيره نشده خواست بازیابي معدلدر

(Boolean request)بولی-4

.مي آیدبه دست AND,ORدرخواستي كه پاسخ به آن توسط عملگرهاي

( Composite request)مرکب-5

.داده مي شودفيلد حالت خاصي از درخواست بولي كه در آن مقدار چند

روشهای تنظیم درخواست واکشی

فرادرس

FaraDars.org

Page 13: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

13

. ازیابي شودبر اساس یك نظم خاص مورد نظر پردازشگر فایل، بعد از ركورد فعلي باید بكه ركوردي : منطقيبعدي ركورد

.براي بازیابي ركورد بعدي، نشانوند جستجو را نمي دهدكاربر

بازیابی رکورد بعدی

: به یكي از سه صورت زیر استموقعيت ركورد بعدي نسبت به ركورد فعلي

.همجوار فيزیكي باشند-1

.از ركورد فعلي به بعدي اشاره گر وجود داشته باشد-2

(بازیابي ركورد بعدي ممكن نيست) .هيچ ارتباطي بين آنها نباشد-3

فرادرس

FaraDars.org

Page 14: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

14

درج رکورد

.یافتن و خواندن بالكي كه ركورد باید در آن درج شود-1

جا دادن ركورد در بالک -2

بازنویسي بالک-3

(مانند تنظيم اشاره گر ها) عمليات پس از درج در بعضي ساختارها –4

فرادرس

FaraDars.org

Page 15: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

15

واكشي ركورد بهنگام در آمدني-1

ایجاد نسخه جدید در بافر-2

(درجابهنگام سازي در )قبليبازنویسي نسخه جدید در جاي -3

تنظيم ارتباط ساختاري بين ركورد با ركوردهاي دیگر فایل-4

محتوای رکوردتغییر

فرادرس

FaraDars.org

Page 16: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

16

(inplace)درجا-1

. ركورد بهنگام درآمده، در محل قبلي اش نوشته مي شود

. چون ممكن است طول ركورد بعد از بهنگام سازي تغيير كند،همواره بهنگام سازي درجا ممكن نمي باشد

(outplace)برون از جا -2

درج در محدل قبلدي« حدذف شدده » ركورد بهنگام درآمده در جایي دیگر نوشته مي شود و نسخه قدیم با نشدانگر

.مي شود

انواع بهنگام سازی

فرادرس

FaraDars.org

Page 17: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

17

شدر اگر فایدل داراي افزونگدي باشدد، بهنگدام سدازي بایدد منتباشد، چون در غير اینصورت (propagating update)شونده

. بوجود مي آید(inconsistent)پدیده ناسازگاري

فرادرس

FaraDars.org

Page 18: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

18

. باید فایل را خواند، ...صورت درخواست كاربر، سازماندهي مجدد، كپي گرفتن و در

. باشدمي (serial)و یا سریال (sequential)خواندن به صورت پي در پي نحوه

حالت پي درپي، بالكها به ترتيب از ابتدا تا انتهاي فایل پشت سرهم خوانده مي شوند و در

.، عمل خواندن انجام مي شود(معموالً كليد)فيلد ها حالت سریال، بر اساس نظم صعودي یكي از در

. اگر دسترسي به ركورد بعدي ممكن نباشد، نمي توان فایل را سریال خواند

.ي خواهد بوداگر ركوردها در محيط فيزیكي به طور سریال ذخيره شده باشند، آنگاه نتيجه خواندن پي در پي و سریال یك

خواندن تمام فایل

فرادرس

FaraDars.org

Page 19: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

19

.همه دالیل سازماندهي مجدد، لزوماً در همه ساختار ها مطرح نمي باشند

مجدد سازماندهی

:دالیل

احياء نظم ساختاري آغازین-1

خارج كردن حافظه هاي هرز -2

اصالح استراتژي دستيابي -3

:عمليات

خواندن تمام فایل -1

بالک بندي مجدد ركوردها ضمن خارج كردن ركوردهاي حذف شدني-2

(در صورت وجود)بازسازي ساختار مربوط به استراتژي دستيابي -3

فرادرس

FaraDars.org

Page 20: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

20

: شودالک در همان دور جاري دیسك بازنویسي اگر ب

rTRW 2

rTRW

4

زمان بازنویسی

:یك دور را از دست مي دهدسيستم ، اگر عمليات در بافر به موقع انجام نگيرد

فرادرس

FaraDars.org

Page 21: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

21

پایلفایل با ساختار

فرادرس

FaraDars.org

Page 22: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

22

.اشندمرتب نمي بفيلدي این فایل براساس مقادیر هيچ ركوردهاي

.دنمي شونایجاد فایل، ركوردها بخش بندي براي

. این ساختار استراتژي دستيابي وجود ندارددر

(بی نظم)فایل با ساختار پایل

23123 ageAliNameID ,,

.استغيرثابت مكان ، قالب ركورد

.استمتغير ركورد، طول

. مكان فيلدها در ركوردهاي مختلف، متفاوت است

.اطالع نهست فيلدي وجود ندارد و باعث صرفه جویي در حافظه مي شودبراي

. در هر ركورد اسم و مقدار فيلد براي همه فيلد ها باید ذخيره شود كه باعث افزونگي خواهد شد

فرادرس

FaraDars.org

Page 23: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

23

.فایل براي بایگاني ایجاد شوداساسا در محيطهایي كه داده ها نظم پذیر نمي باشند و -1

(بي نظمي امنيت را باال مي برد.) كه امنيت داده ها مورد نظر باشدهایي محيطدر -2

.مبنایي براي درک و طراحي ساختارهاي بهتر-3

ساختار پایلموارد استفاده

فرادرس

FaraDars.org

Page 24: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

24

رکورداندازه متوسط

)2(' VAaR

a` : یك ركوردفيلد هاي متوسط تعدادA : فيلد متوسط حافظه الزم براي ذخيره اسمV : فيلد متوسط حافظه الزم براي ذخيره مقدار

. شوددر نظر گرفته مي( كاما)جداساز و یك بایت براي عالمت ( =)انتساب یك بایت براي عالمت ، Rمحاسبه در

23123 ageAliNameID ,,

فرادرس

FaraDars.org

Page 25: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

25

3براي ركدورد فيلد ها بایت و متوسط تعداد 8فيلد در یك فایل پایل متوسط حافظة الزم براي ذخيره سازي اسم

ركوردها به شدكل زیدر باشدد، طدول متوسدط هر یك از و فضاي مقداري 4در صورتي كه تعداد ركوردها .مي باشد

ركورد كدام است؟

154

5101530

V

)2(' VAaR

75)2158(3 R

مثال

فرادرس

FaraDars.org

Page 26: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

26

:بررسي نصف ركوردها

t

RnT

F

.2

t

BbT

F

.2

واکشی رکورد

:یا نصف بالكها

فرادرس

FaraDars.org

Page 27: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

27

بازیابی رکورد بعدی

. ساختاري بين ركورد فعلي و بعدي وجود نداردارتباط

FN TT

.در ساختار پایل، سيستم در عمل بازیابي ركورد بعدي بسيار ناكارا مي باشد

فرادرس

FaraDars.org

Page 28: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

28

. فایل بدون نظم است، بنابراین درج در انتها صورت مي گيردچون

بعد از انتقال ركورد جدید از ناحيه كاري بده بدالکو شده ، خوانده آخر در زمان بالک

:مي كنيمبازنویسي در بافر، بالک را در زمان موجود

ttbrs

RWT

RWttI TbrsT

ttI brST 3

درج

فرادرس

FaraDars.org

Page 29: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

29

سدخه مورد نظر واكشي شده و نشانگر حذف شده در قسمت پيشوندي آن قرار گرفتده و بعدد از ایجداد نركورد :جدید، نسخه قدیم بازنویسي شده و نسخه جدید به انتهاي فایل درج مي شود

IRWFUTTTT

.كه در بافر انجام مي شود، در ارزیابي دخالت نمي دهيم چون زمان آنها بسيار كم استعملياتي

:كافي است كه نسخه جدید را در انتهاي فایل درج نكنيم . حذف، حالت خاصي از بهنگام سازي است

RWFU TTTdelete

بهنگام سازی

فرادرس

FaraDars.org

Page 30: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

30

باشد، زمان حذف چند ميلي ثانيه خواهد بود ؟ 2000و تعداد دور دیسك در دقيقه اگردر یك فایل پایل

msrpm

r 302000

60000600002

msTrTT dNd 333032

msTN 3

مثال

فرادرس

FaraDars.org

Page 31: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

31

: خواندن پي درپي فایل زمان

t

RnT

SEQX

.نمي باشدعمليبعديركوردبازیابيچونخواندسریالصورتبهنمي توانراپایلفایل

خواندن تمام فایل

FX TTSEQ

.2

t

BbT

SEQX

فرادرس

FaraDars.org

Page 32: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

32

زمان خواندن كل فایل پایلي به صورت ترتيبي با مشخصات زیر چند ثانيه خواهد بود؟

(بایت در ثانيه 4000=بایت ، نرخ انتقال 2000و اندازه هر بالک 100=تعداد بالكها )

مثال

504000

2000100

t

BbT

SEQX

فرادرس

FaraDars.org

Page 33: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

33

. خارج كردن حافظه هاي هرز ناشي از عمل حذف، باید فایل را بطور متناوب سازماندهي مجدد كردبراي

. باید كل فایل را خوانده و سپس فایل را با حذف ركوردهاي حذف شدني بازنویسي كردابتدا

t

Rdon

t

RonT

Y

)()(

o: تعداد ركوردهاي درج شده از لود اوليه تا لحظه سازماندهي مجددd: اندنشانگر حذف شده خورده ركوردهایي است كه تعداد

.، آنگاه زمان خواندن كل فایل با زمان بازنویسي برابر خواهد بود(d=0)اگر ركورد حذف شده نداشته باشيم

.ساختار پایل از نظر احياء وضع ساختاري اوليه، نيازي به سازماندهي مجدد ندارد: تذكر

سازماندهی مجدد

فرادرس

FaraDars.org

Page 34: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

34

پارامترهای زمانی ساختار پایل

فرادرس

FaraDars.org

Page 35: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

35

پایان فصل پنجم فرادرس

FaraDars.org

Page 36: آموزش ذخیره و بازیابی اطلاعات - درس پنجم

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

این اسالید ها بر مبنای نکات مطرح شده در فرادرس

« اطالعاتآموزش ذخیره و بازیابی »

.شده استتهیه

یدبرای کسب اطالعات بیشتر در مورد این آموزش به لینک زیر مراجعه نمایfaradars.org/fvsft106

بازیابی و آموزش ذخیره

اطالعات

faradars.org/fvsft106

فرادرس

FaraDars.org