Upload
others
View
3
Download
0
Embed Size (px)
Citation preview
Data Science Bootcamp הוא מסלול ייחודי המכשיר אקדמאים מצטיינים כמדעני נתונים.
תפקידו של מדען הנתונים הינו ביצוע מחקרי מידע מעמיקים, קביעת שיטות עבודה מומלצות לאיסוף נתונים, והפעלה של אלגוריתמים שונים של מידול ולמידת מכונה על הנתונים על מנת להפיק תובנות
עסקיות לארגון.
מדען הנתונים צריך להחזיק בסל כישורים רב-תחומי, להבין בתוכנות, שפות פיתוח שונות ובתחומים בכל ומעמיק רב ידע מספק זה מסלול נתונים. וכריית סטטיסטיקה מכונה, למידת כמו מתקדמים בניית ,Python, Machine Learning, Data Mining, SQL, Big Data הנדרשים, התחומים אלגוריתמים ומודלים לעבודה עם הנתונים, שימוש בטכנולוגיות חדשות בתחום, ניתוח נתונים מבוזר,
שימוש בשירותי ענן ועוד.
המסלול כולל תרגול Hands-On רב, והידע הנרכש ישמש ליישום פתרונות עבור סוגים שונים של בעיות עסקיות מהתעשייה.
תוכנית Experis Academy מובילה בהסבה והכשרה למקצועות ההייטק. התוכנית מאתרת למידה הכוללת ואינטנסיבית מעמיקה הכשרה להם ומספקת פוטנציאל בעלי אקדמאים
יומיומית במודל Bootcamp, במשך מספר חודשים.
,Java & C#, BI בתחומי פיתוח לתפקידי המכשירים מסלולים מספר בתוכנית C/C++ & Python, Full Stack, Data Analysis ו-Data Science. בסיום המסלול נקלטים בוגרי התוכנית לתפקיד ראשון אצל לקוחותינו. במשך עשור של עשייה, הכשרנו מעל אלף אנשי הייטק שהשתלבו בהצלחה בתעשייה. התוכנית נבחרה על ידי רשות החדשנות למיזם
סיירות התכנות.
Data Science Bootcamp
MODULE 1: INTRODUCTION – 1 DAY
• Course outline
• What is data science and what does a data
scientist do?
• The data science pipeline
• The data science eco-system
MODULE 2: PROGRAMMING WITH PYTHON – 10 DAYS
• The python shell
• IDEs (PyCharm, Jupyter Notebook)
• Variables and data types
• Conditions and loops
• Functions
• Modules and packages
• Lists, Sets, Dictionaries and Tuples
• List comprehensions
• Debugging
• Python standard library
MODULE 3: ADVANCED PYTHON PROGRAMMING – 5 DAYS
• Lambda expressions
• Error handling
• Working with files
• Object-Oriented Programming
• Operator overloading
• Inheritance and polymorphism
• Iterators and generators
• Regular expressions
MODULE 4: NUMPY – 5 DAYS
• The numPy library
• Multi-dimensional arrays
• Indexing, slicing, operations on arrays
• Structured arrays
• Polynomials
• Calculus
• Linear algebra
• Eigenvalues and eigenvectors
• SVD
MODULE 5:GETTING AND VISUALIZING DATA – 5 DAYS
• Using pandas for loading, examining,
and manipulating data
• Working with JSON and CSV files
• Getting data from the internet (web scraping)
• Visualization with matplotlib library
MODULE 6: RELATIONAL DATABASES – 3 DAYS
• Introduction to SQL
• Retrieving data
• Updating, inserting and deleting data
• Views
MODULE 7:NON-RELATIONAL DATABASES – 2 DAYS
• NoSQL databases
• MongoDB
MODULE 8: STATISTICS AND PROBABILITY – 3 DAYS
• Central tendencies: mean, median and mode
• Variation and standard deviation
• Covariance and correlation
• Common data distributions
• Statistical hypothesis testing (t-test, z-test)
• Confidence intervals
Syllabus Outline / 700 hours
MODULE 9:DATA PREPARATION – 3 DAYS
• Types of data (structured vs. unstructured)
• Cleaning and normalizing data
• Dimensionality reduction
• Principal Component Analysis (PCA)
• Feature extraction and selection
• Key Performance Indicator (KPI)
MODULE 10: INTRODUCTION TO MACHINE LEARNING – 1 DAY
• Types of ML systems
• Supervised vs. unsupervised learning
• Main ML algorithms
• Overfitting and underfitting
• Cross validation
• Introduction and demo of scikit-learn
MODULE 11:REGRESSION – 2 DAYS
• Linear regression
• Polynomial regression
• Logistic regression
MODULE 12: CLASSIFICATION – 4 DAYS
• K-Nearest-Neighbors
• Decision Trees
• Nave Bayes
• Support Vector Machines (SVM)
• Ensemble methods (AdaBoost, XGBoost,
Bagging)
• Random Forests
MODULE 13:CLUSTERING – 3 DAYS
• Introduction to clustering
• K-means clustering
• Hierarchical clustering (dendograms)
• db-scan
MODULE 14: REINFORCEMENT LEARNING – 3 DAYS
• Markov Decision Process
• Temporal difference learning
• Q-learning
MODULE 15:TEXT MINING AND TEXT ANALYTICS – 3 DAYS
• Introduction to NLP
• The NLTK library
• Word vector representations
• Classifying documents
MODULE 16:DATA MINING USE CASES – 1 DAY
• Recommendation systems
MODULE 17:NEURAL NETWORKS AND DEEP LEARNING – 5 DAYS
• Introduction and history background
• Perceptrons, NN
• Feed-forward neural networks
• Backpropagation
• Using TensorFlow to train neural
networks
• Auto encoders
• Convolutional neural networks (CNNs)
• Recurrent neural networks (RNNs)
MODULE 18:BIG DATA – 5 DAYS
• Introduction to big data
• Apache Hadoop
• Map-Reduce algorithm
• Spark, SparkPy and SparkML
FINAL PROJECT – 5 DAYS
טלפון: 03-5686400
[email protected] דוא"ל:
90, תל אביב יגאל אלון
BIData AnalysisData Science
C/C++&PythonJava & C#Full Stack
QA & Automationהגנת סייבר
מסלולי התוכנית