35
ﺗﺤﻠﯿﻞ ﺑﺎ روﯾﮑﺮد ﯾﺎدﮔﯿﺮيژرف ﺑﺮ ﺑﺴﺘﺮ ﮐﻼ نداده داﻧﺸﮕﺎه ﺻﻨﻌﺘﯽ ﺷﺮﯾﻒ، ﺗﻬﺮان ﻣﺤﻤﺪ ﺧﺎﻟﻮﺋﯽ ﺟﻠﺴﻪ اول اراﺋﻪ ﻋﻠﻤﯽ ﺗﺤﻠﯿﻞ ﺑﺎ روﯾﮑﺮد ﯾﺎدﮔﯿﺮيژرف ﺑﺮ ﺑﺴﺘﺮ ﮐ ﻼنداده2 ﺗﻠﮕﺮام: @dataset اﯾـﻤـﯿـﻞ: [email protected] ﻣﺤﻤﺪ ﺧﺎﻟﻮﺋﯽ17 آذر1395

تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

Embed Size (px)

Citation preview

Page 1: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

ن دادهتحلیل با رویکرد یادگیري ژرف بر بستر کالدانشگاه صنعتی شریف، تهران

2الن دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کخالوئی محمد

dataset@: تلگرام [email protected]: ایـمـیـل

محمد خالوئی1395آذر 17

Page 2: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

دیدکلی از ارائه

کلیات مبانی بحث کالن داده•

آماده سازي ذهنی درخصوص بحث تحلیل•

کلیات مبانی بحث یادگیري ژرف•

TensorFlowچالش هاي استفاده از رویکرد یادگیري ژرف در بسترهاي کالن داده بخصوص در •

3 دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کالنخالوئی محمد

Page 3: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

خالوئی محمد

یکرد جلسه اول ارائه علمی تحلیل با رویادگیري ژرف بر بستر کالن داده

4

کمی دقیق تر

به زندگیاطرفـمان

...بنـگریم

http://www.tekshow.com/posts/820

Page 4: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

مقیاس تولید داده

1992 :100GB در روز

1997 :100GB در ساعت

2002 :100GB در ثانیه

2018 :50000GB در ثانیه

5 دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کالنخالوئی محمد

http://www.gereports.com/post/110073426843/big-data-infographic/

Page 5: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

تعریف مختصر از کالن داده

6 دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کالنخالوئی محمد

.داده هاي تولیدي جهان، براي دوسال اخیر هست% 90•

)30به توان 10= کوئینتیلیون 2.5( 2.500000000000000000تولید حدود •

)Blue-ray(ري -میلیون دیسک بلو 10چیزي معادل پرکردن •

تقریبا معادل ارتفاع چهار عدد از برج ایفل•

http://www.vcloudnews.com/wp-content/uploads/2015/04/big-data-infographic1.png

Page 6: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

تعریف مختصر از کالن داده

7الن دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کخالوئی محمد

کالن داده

تنوعVariety

تنوعVariety

سرعتVelocity

سرعتVelocity

حجمVolume

حجمVolume

کالن داده

تنوعvariety

تنوعvariety

سرعتvelocity

سرعتvelocity

حجمVolume

حجمVolume

صحتveracity

صحتveracity

Page 7: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

چرا بحث کالن داده مطرح شده

تغییر و تحول هستهمه چیز دائما در حال •

را نخواهیم لیتوانایی مدیریت و توان محاسبات تحلیطبق تعاریف؛ بدین نتیجه رسیدیم که •داشت

ملیون شعب در نقاط دنیا20همانند مدیریت یک مغازه ساده و اکنون مدیریت یک مغازه ساده با بیش از •

!خیلی فرق میکند •

هستندبدون ساختارداده هاي تولید شده % 90• که شامل داده هاي توئیت، عکس، فیلم، الگ، تاریخچه کاري و فعالیت و...

راهکارهاي جدید= چالش هاي جدید

8 دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کالنخالوئی محمد

Page 8: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

!!!تجزیه و تحلیل براي چی

9 دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کالنخالوئی محمد

منابع داده اي

فعالیت ها•

گفتگوها•کلمات•صوت•شبکه اجتماعی•الگ•تصاویر•ویدیو•سنسور•

...و•

حجمحجم

صحتصحت

تنوعتنوع

سرعتسرعت

تحلیل کالن داده

متن کاويتحلیل معناییتحلیل ویدیوتشخیص چهرهتحلیل صوتتحلیل حرکات و رفتارو...

Page 9: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

نمونه اي از ثبت تراکنش ها

10 دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کالنخالوئی محمد

Page 10: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

اپراتورها در تهرانپوشش دهی نمونه

11 دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کالنخالوئی محمد

https://opensignal.com

Page 11: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

محدوده فضاي اطراف دانشگاهاپراتورها در پوشش دهی

12 دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کالنخالوئی محمد

https://opensignal.com

Page 12: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

...در همه ابعادمثال

مخابرات•

حمل و نقل•

کنترل ترافیک•

وضعیت آب و هوا•

کشف تقلب •

بانک و موسسات مالی•اعتبارسنجی مشتریان

شبکه اجتماعی•

•...

13 دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کالنخالوئی محمد

Page 13: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

Twitterنمونه اي از تحلیل داده هاي

14 دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کالنخالوئی محمد

Page 14: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

Twitterبرخی از فعالیت هاي مربوط به داده هاي

توئیت براي مختصات هاي مربوط به ایران ثبت شده 7000تقریبا 1396آذر 15در • چیز دیگري استآمار واقعی اما!

مجموعه اي از داده هاست ترکیبایده جالب تر بحث •

آن را میتوان با رویکرد یادگیري ژرف صورت پذیرفتداده هاي متنی تحلیل •

خالصه اي از نمونه تحلیل هاي بصري• www.mapd.com/demos/tweetmaphttps://

oSan Francisco, California USA

15 دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کالنخالوئی محمد

Page 15: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

گذر کوچکی بر پشت پرده این پردازش ها

16 دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کالنخالوئی محمد

Page 16: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

)1391سال (چشم انداز کالن داده

17 دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کالنخالوئی محمد

Page 17: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

)نسخه سوم -1395سال (چشم انداز کالن داده

18 دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کالنخالوئی محمد

Page 18: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

فناوري هاي کالن داده

کالسترهاي پردازش و ذخیره سازي داده•رایانش ابريابر خصوصی

پردازش و ذخیره سازي توزیع شده•HDFSMapRduceSpark

بانک هاي اطالعاتی •NoSqlNewSqlgraph DB…

19 دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کالنخالوئی محمد

امنیت داده در عین حفظ کارایی•CryptDB

بازبینی و تمیز کردن داده ها•Wrangler

تجمیع داده ها؛ نگرشی جدید•

سامانه هاي تحلیل اطالعات•الگوریم هاي سریع

فشرده سازي اطالعات

ابزارهاي یادگیري ماشین

خالصه سازها

Page 19: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

کلیات نقشه راهکار در فضاي کالن داده

20 دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کالنخالوئی محمد

Page 20: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

ابزارهاي پرمخاطب کالن داده

21 دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کالنخالوئی محمد

https://flink.apache.org/http://hadoop.apache.org/ http://spark.apache.org/

Page 21: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

:به کمک ابزارهایی همچون• Tableau

Qlik

kibana

ChartJs

Raw

Dygraphs

بصري سازي داده ها

22 دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کالنخالوئی محمد

Page 22: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

خالوئی محمد

یکرد جلسه اول ارائه علمی تحلیل با رویادگیري ژرف بر بستر کالن داده

23

یادگیري ژرفDeep Learning

http://www.euclidean.com/deep-learning-and-value-investing

Page 23: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

تعریف مختصر از یادگیري ژرف

نام هاي مشابه• ساختار یادگیري ژرف)Deep Structure learning(

یادگیري سلسله مراتبی)Hierarchical learning(

یادگیري ماشینیکی از شاخه هاي •

روي مجموعه اي از الگوریتم ها که • انتزاع سطح باال از دادهمیخواهند یک

چندین الیه پردازشیبوسیله

ساختار پیچیده یا ترکیب تبدیالت غیرخطیبا

24 دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کالنخالوئی محمد

Page 24: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

تعریف مختصر از یادگیري ژرف

درواقع یادگیري عمیق• روش هاي یادگیري ماشیناز یک خانواده گسترده ي

بازنمایی ویژگیبر مبناي

تنوع نوع مشاهدات ما محسوب میشود: بازنمایی ویژگی منظور از • در مثال عکس:

o شدت روشناییکه شامل وکتوریه بازنمایی میتواند ویژگی ها را در قالب یک

o مجموعه اي از لبه هایا بصورت خیلی انتزاع سطح باالتر به شکل

o ناحیه اي که شامل یک شیءیا بصورت خیلی کلی تر به صورت

25 دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کالنخالوئی محمد

Page 25: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

تعریف مختصر از یادگیري ژرف

:یکی از نوید ها و وعده هاي یادگیري ژرف•جایگزین کردن روشی براي انتخاب ویژگی، به جاي روش هاي دستی

با الگوریتم هاي موثر و کارا یادگیري ویژگی بدون نظارت و نیمه نظارت

و استخراج ویژگی سلسله مراتبی

26 دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کالنخالوئی محمد

Hand-crafted feature

http://www.kiv.zcu.cz/studies/predmety/uir/NS/Neocognitron/en/hierarch-det.html

Page 26: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

انواع مختلف شبکه هاي ژرف

تنوع• شبکه هاي عصبی ژرف)Deep Neural Networks( شبکه هاي عصبی کانولوشن ژرف)Convolutional Deep Neural Network( شبکه هاي باور ژرف)Deep Belief Networks( شبکه هاي عصبی بازگشتی)Recurrent Neural Networks(

براي حوزه هاي مختلف•بینایی ماشینتشخیص گفتار هوشمندپردازش زبان طبیعیتشخیص صدابایوانفورماتیک

27 دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کالنخالوئی محمد

Page 27: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

نمونه یک شبکه عصبی ژرف

28 دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کالنخالوئی محمد

Page 28: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

ابزارهاي پرمخاطب حوزه یادگیري ژرف

29الن دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کخالوئی محمد

http:// tensorflow.org http://torch.ch http://caffe.berkeleyvision.org

http://deeplearning.net/software/theano http://scikit-learn.org

Page 29: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

!کدام ابزار بهتر هست؟

نرخ رشد پیشرفت براي یادگیري ژرف•

30 دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کالنخالوئی محمد

https://twitter.com/fchollet/status/776455778274250752

Page 30: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

TensorFlow

31 دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کالنخالوئی محمد

توسعه داده شده Google Brain در گروه •

یادگیري ماشین گوگل کتابخانه•

در پروژه هاي بزرگ شرکت گوگل از جمله• سرویسSpeech Recognition

سرویسGmail

سرویسGoogle photo

منتشر کرد متن بازبصورت 2015در نوامبر سال •

Page 31: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

TensorFlowمقدمات کار با

•Node که عملیات یاopr یاoperation نامبرده میشود هر عملیات شامل صفر یا بیشترTensor که در آن یک سري محاسبات انجام می پذیرد

•Tensorیک آرایه چندبعدي

•Graph بصورت گراف محاسباتی(درواقع یک توصیف از محاسبات(

•Session عملیات گراف را درDevice هایی همچونCPU وGPU براي پردازش قرار و شرایط اجرا را فراهم میکند.

32 دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کالنخالوئی محمد

https://www.tensorflow.org

Page 32: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

TensorFlowگوشه اي از اجرا در

import tensorflow as tf

matrix1 = tf.constant([[3.0,3.0]])

matrix2 = tf.constant([[2.0,2.0]])

product = tf.matmul(matrix1,matrix2)

sess = tf.Session()

result = sess.run(product)

print(result)

sess.close()

33 دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کالنخالوئی محمد

matrix1 matrix2

product

Page 33: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

خالوئی محمد

یکرد جلسه اول ارائه علمی تحلیل با رویادگیري ژرف بر بستر کالن داده

34

یمتحلیل عظ

Page 34: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

رورویکرد هاي تحلیل در کالن داده و چالش هاي پیش

35 دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کالنخالوئی محمد

:به قضیه می توان نگاه کردچند جنبه تقریبا از • چالش مدیریت کردن پردازش

چالش نوع شیوه الگوریتم بررسی و محاسبات

شبکهچالش بحث تنظیم وزن هاي پارامترهاي

...

10X reduction in training time34% lower error rate

https://databricks.com/blog/2016/01/25/deep-learning-with-apache-spark-and-tensorflow.html

Page 35: تحلیل با رویکرد یادگیری ژرف بر بستر کلانداده

ن دادهتحلیل با رویکرد یادگیري ژرف بر بستر کالتهرانشریف، صنعتی دانشگاه

36الن دادهجلسه اول ارائه علمی تحلیل با رویکرد یادگیري ژرف بر بستر کخالوئی محمد

dataset@: تلگرام [email protected]: ایـمـیـل

محمد خالوئی1395آذر

باتشکر از توجهتان

»سوره انشراح) 6(إن� مع العسر يسرا ) 5(فإن� مع العسر يسرا «| اگر سنگی پیشرو نباشد هیچگاه صدای دلنشین آب را نخواهی شنید