10
ACTUARIAT & DATA SCIENCE Catalogue de formations R Avril 2017

ACTUARIAT - Showroomshowroom-actuariat.sia-partners.com/formations/SiaPartners_Data... · Découverte du Big data & Data Science buzz Les termes Big Data, Data Science et transformation

  • Upload
    tranbao

  • View
    227

  • Download
    1

Embed Size (px)

Citation preview

Page 1: ACTUARIAT - Showroomshowroom-actuariat.sia-partners.com/formations/SiaPartners_Data... · Découverte du Big data & Data Science buzz Les termes Big Data, Data Science et transformation

ACTUARIAT & DATA SCIENCE

Catalogue de formations R

Avril 2017

Page 2: ACTUARIAT - Showroomshowroom-actuariat.sia-partners.com/formations/SiaPartners_Data... · Découverte du Big data & Data Science buzz Les termes Big Data, Data Science et transformation

Découverte du Big data & Data Science Les termes Big Data, Data Science et transformation digitale sont aujourd’hui devenus des « buzz

words » cités à longueur d’article pour désigner les récents impacts du numérique sur nos sociétés. Ces termes recoupent pourtant des réalités concrètes en termes de technologies, d’applications et de paradigme qui demandent à être explicitées. Une connaissance de ces notions apparaît d’autant plus primordiale que l’assurance constitue l’une des industries les plus impactées.

Concepts & Enjeux Emergence et contexte actuel Big Data ou Data Science ? Un nouvel écosystème Comment se positionne l’industrie de l’assurance ?

Durée 2 sessions de 3 heures

1 journée

600 € (HT) / participant

Forfait groupe : nous contacter

Budget

Lieu de formation Site Sia Partners (PARIS)

Site de l’entreprise (PARIS ou Province)

Prérequis

Pas de prérequis

Informations [email protected]

06.82.41.48.43

Programme

by

est un organisme de forma-tion agréé depuis 2008 sous le numéro 11754407775.A ce titre, les budgets engagés sur ces formations sont imputables sur le budget de formation permanent de l’entreprise.

Objectifs Acquérir une culture générale sur les

sujets Big Data & Data Science

Identifier les enjeux et impacts dans l’industrie de l’assurance

NOUS CONNAITRE NOTRE SHOWROOM |

Big Data &

Data Science

La donnée au cœur d’un nouveau paradigme Quelles nouvelles sources de données ? Quels nouveaux types de données ? Quels impacts sur la gestion de la donnée ?

De nouveaux modèles pour exploiter cette donnée Pourquoi et comment faire de la prédiction ?

Approche classique Rappel des modèles de place Avantages & Limites Use cases assurance

Approche Machine Learning Principes & algorithmes Avantages & Limites Use cases assurance

Une exploitation des résultats par la visualisation Communiquer par la Data Visualisation Quelles visualisations pour quelles données ? L’apport des nouvelles technologies de visualisation Use cases assurance

Vers des Intelligences Artificielles autonomes Contexte actuel & Perspectives Du Machine Learning au Deep Learning Quelles applications en assurance ?

Une approche pratique et opérationnelle

Une initiation à travers des use cases en assurance

Des exercices pratiques illustrant les principaux concepts

Des intervenants Actuaires et Data Scientists

Page 3: ACTUARIAT - Showroomshowroom-actuariat.sia-partners.com/formations/SiaPartners_Data... · Découverte du Big data & Data Science buzz Les termes Big Data, Data Science et transformation

Les fondamentaux de la programmation R Le logiciel R s’est imposé comme la solution de référence dans le domaine du data science. Ce statut est illustré par la création en 2015 du R consortium regroupant Google, Microsoft et ORACLE qui se sont engagés à assurer le support et promouvoir la distribution de ce logiciel open source. Maitriser la programmation R est devenu incontournable pour tout opérationnel confronté aux problématiques de données, de modélisation et de visualisation.

Découverte de l’écosystème R

Variables et opérateurs

Objets

Fonctions

Boucles et vectorisation

Interface de développement Environnement des packages Concepts & Principes du langage R

Types & Caractéristiques des variables Opérateurs de base Manipuler les variables

Types & Caractéristiques des objets Manipuler les objets Importer & Exporter des objets

Fonctions de base Créer des fonctions

Boucles & Conditions Fonctions vectorielles

Best practices Optimiser son code Structurer son projet Conventions de naming

Durée 2 sessions de 4 heures

2 demi-journées ou 1 journée complète

1 000 (HT) / participant

Forfait groupe : nous consulter

Budget

Lieu de formation Site Sia Partners (PARIS)

Site de l’entreprise (PARIS ou Province)

Prérequis

Notions de programmation

1 PC par participant (possibilité de prêt)

Connexion internet sur site

Informations [email protected]

06.82.41.48.43

Programme

Notre approche de la formation

Des formateurs qui sont d’abord des opérationnels

Chaque thème du programme est validé par un cas pratique. Chaque participant dispose d’une session R pour cet exercice.

Les formations sont dispensées par les actuaires et data scientists de Sia Partners.

Ces intervenants font un usage quotidien et avancé du langage R dans le cadre de leurs projets actuariels et data science.

by

est organisme de formation agréé depuis 2008 sous le numéro 11754407775. A ce titre, les budgets engagés sur ces formations sont imputables sur le budget de formation permanent de l’entreprise.

La pratique au cœur de notre démarche

Objectifs

Assimiler les bases de la programmation R

Acquérir une autonomie dans le développement de projets R

Initiation

NOUS CONNAITRE NOTRE SHOWROOM |

Page 4: ACTUARIAT - Showroomshowroom-actuariat.sia-partners.com/formations/SiaPartners_Data... · Découverte du Big data & Data Science buzz Les termes Big Data, Data Science et transformation

Les projets Data Science impliquent souvent la manipulation de données volumineuses tant du point de vue du nombre d’observations que du nombre de variables. La syntaxe de base de R apparait peu adaptée à la manipulation de ce type de données. Le package data.table propose une syntaxe ergonomique inspirée du SQL, ainsi qu’un traitement optimisé des ressources mémoire dans le cadre de données massives sous R.

Introduction au package data.table

Opérations élémentaires

Groupes

Mises à jour par référence

Jointures

Benchmark R vs data.table Syntaxe R vs data.table

Lecture/Import de fichiers externes Filtres sur les lignes Sélections sur les colonnes Concaténation de plusieurs tables

Requêtes par groupe avec by Variables internes : .SD, .BY, .N, .I, .GRP Requêtes multi-colonnes avec .SDcols

Ajout/Suppression de colonnes Copie par référence Autres mises à jour

Indexation Jointures implicites & Jointures avancées

Opérations avancées

Reshaping (structure long/wide) Chaining

Durée 2 sessions de 4 heures

2 demi-journées ou 1 journée complète

1 000 € (HT) / participant

Forfait groupe : nous consulter

Budget

Lieu de formation Site Sia Partners (PARIS)

Site de l’entreprise (PARIS ou Province)

Prérequis

Initiation programmation R

1 PC par participant (possibilité de prêt)

Connexion internet sur site

Informations [email protected]

06.82.41.48.43

Programme

Notre approche de la formation

Des formateurs qui sont d’abord des opérationnels

Chaque thème du programme est validé par un cas pratique. Chaque participant dispose d’une session R pour cet exercice.

Les formations sont dispensées par les actuaires et data scientists de Sia Partners.

Ces intervenants font un usage quotidien du logiciel R dans le cadre de leur travaux impliquant des données massives.

est organisme de formation agréé depuis 2008 sous le numéro 11754407775. A ce titre, les budgets engagés sur ces formations sont imputables sur le budget de formation permanent de l’entreprise.

La pratique au cœur de notre démarche

Objectifs Maitriser la syntaxe data.table

Maitriser les opérations élémentaires

Appréhender les problématiques d’optimisation de temps de traitement

Data processing by

Manipuler des donnée massives avec R data.table

NOUS CONNAITRE NOTRE SHOWROOM |

Page 5: ACTUARIAT - Showroomshowroom-actuariat.sia-partners.com/formations/SiaPartners_Data... · Découverte du Big data & Data Science buzz Les termes Big Data, Data Science et transformation

Modélisation prédictive avec R La modélisation prédictive constitue l’une des principales composantes du Data Science. Ce domaine se caractérise par son exigence en termes de compétences techniques (comprendre les modèles) et de compétences informatiques (mettre en œuvre les modèles). R permet d’appliquer l’ensemble des modèles de place (modèles économétriques et machine learning) à travers un ensemble de packages dédiés qui seront présentés lors de cette formation.

Modèles économétriques

Algorithmes Machine Learning

Modèles de place : GLM / GAM Principes / Avantages / Limites / Applications

Application sous R : Packages et fonctions dédiés Optimisation temps de calcul et traitement des

problématiques de mémoire RAM.

Analyse des résultats et optimisation des modèles : Analyse des résidus et métriques d’adéquation Sélection de variables Traitement non-monotonie et convexité Traitement des interactions

Durée 4 sessions de 4 heures

2 journées complètes (continues ou non)

1 200 € (HT) / participant / jour

Forfait groupe : nous consulter

Budget

Lieu de formation Site Sia Partners (PARIS)

Site de l’entreprise (PARIS ou Province)

Prérequis Initiation programmation R

Connaissances statistiques

1 PC par participant (possibilité de prêt)

Connexion internet sur site

Informations [email protected]

06.82.41.48.43

Programme

Notre approche de la formation

Des formateurs qui sont d’abord des opérationnels

Chaque thème du programme est validé par un cas pratique. Chaque participant dispose d’une session R pour cet exercice.

Les formations sont dispensées par les actuaires et data scientists de Sia Partners.

Ces intervenants font partie de l’équipe Data Science en charge du développement et de l’implémentation des modèles prédictifs chez nos client.

est organisme de formation agréé depuis 2008 sous le numéro 11754407775. A ce titre, les budgets engagés sur ces formations sont imputables sur le budget de formation permanent de l’entreprise.

La pratique au cœur de notre démarche

Objectifs

Maitriser les fondements théoriques des différents modèles

Mettre en œuvre les modèles sous R

Tester et Optimiser les modèles

Data modeling

Algorithmes de place : CART / Random Forest / SVM / GBM / Neural

network Principes / Avantages / Limites / Applications

Application sous R : Packages et fonctions dédiés Parallelisation des calculs

Analyse des résultats et optimisation des modèles : Analyse des résidus et métriques d’adéquation Sélection des variables (métriques d’importance

et d’interaction) Cross validation (LOOCV / LPCV / K-Fold)

by

NOUS CONNAITRE NOTRE SHOWROOM |

Page 6: ACTUARIAT - Showroomshowroom-actuariat.sia-partners.com/formations/SiaPartners_Data... · Découverte du Big data & Data Science buzz Les termes Big Data, Data Science et transformation

Visualisation avec ggplot2 La complexité des données et algorithmes mis en œuvre dans un projet Data Science se traduit sou-vent par un manque de lisibilité des résultats empêchant leur exploitation opérationnelle. La data visuali-sation constitue dès lors une phase clé du projet visant à présenter les résultats de manière intelligible pour l’ensemble des acteurs afin d’obtenir un outil d’aide à la décision opérationnel. R dispose de capaci-tés avancées de visualisation à travers un écosystème dont le package « ggplot 2 » constitue le pivot.

Syntaxe graphique

Thèmes graphiques

Cartographie

Mapping des données & Attributs Fonctions géométriques Fonctions statistiques Fonctions d’échelle Fonctions facet (multiplots)

Thèmes de base Axes / Quadrillage / Labels / Titre Création de thèmes personnalisés

Import et manipulation de shapefiles Mapping des données Intégration avec googleMap

Best practices Principes de la communication visuelle Quelle visualisation pour quelles données ? Export haute définition des graphiques

Durée 2 sessions de 4 heures

2 demi-journées ou 1 journée complète

1 200 € (HT) / participant

Forfait groupe : nous consulter

Budget

Lieu de formation Site Sia Partners (PARIS)

Site de l’entreprise (PARIS ou Province)

Prérequis Initiation programmation R

1 PC par participant (possibilité de prêt)

Connexion internet sur site

Informations [email protected]

06.82.41.48.43

Programme

Notre approche de la formation

Des formateurs qui sont d’abord des opérationnels

Chaque thème du programme est validé par un cas pratique. Chaque participant dispose d’une session R pour cet exercice.

Les formations sont dispensées par les actuaires et data scientists de Sia Partners.

Ces intervenants font un usage quotidien et avancé des capa-cités de visualisation de R dans le cadre du développement de POC et outils d’aide à la décision.

est organisme de formation agréé depuis 2008 sous le numéro 11754407775. A ce titre, les budgets engagés sur ces formations sont imputables sur le budget de formation permanent de l’entreprise.

La pratique au cœur de notre démarche

Objectifs

Acquérir une maîtrise opérationnelle du package ggplot2

Assimiler les Best Practices de la communication visuelle

Data Visualisation

Visualisation dynamique

Intégration de fonctions zoom / filtre / pop-up Création de graphiques animés Intégration au sein de documents R Markdown

by

NOUS CONNAITRE NOTRE SHOWROOM |

Page 7: ACTUARIAT - Showroomshowroom-actuariat.sia-partners.com/formations/SiaPartners_Data... · Découverte du Big data & Data Science buzz Les termes Big Data, Data Science et transformation

La restitution de projets Data Science sous forme d’applications interactives constitue une excellente approche pour permettre à l’ensemble des acteurs de s’approprier les travaux de manière didactique, intelligible et ergonomique. A cette fin, R Shiny permet de combiner l’interactivité des technologies web avec la puissance du langage R. Ce package, devenu indispensable en data visualisation et dashboarding, permet aussi de packager des analyses statistiques en applications dynamiques et interactives.

Environnement d’une application Fonctionnement global Interface serveur / utilisateur

Syntaxe et Implémentation Types & Caractéristiques Widgets avancés et packages tiers

Structuration du code Importer & Exporter des objets Contraintes et règles d’implémentation

Design élémentaire d’une interface Personnalisation avancée (HTML & CSS)

Expressions réactives Injection de JavaScript

Lancement local ou via Github Déploiement sur serveur shiny Déploiement sur shinyapps.io

2 sessions de 4 heures

2 demi-journées ou 1 journée complète

1 200 € (HT) / participant

Forfait groupe : nous consulter

de formation Site Sia Partners (PARIS)

Site de l’entreprise (PARIS ou Province)

Initiation programmation R

1 PC par participant (possibilité de prêt)

Connexion internet sur site

[email protected]

06.82.41.48.43

Programme

Notre approche de la formation

Chaque thème du programme est validé par un cas pratique. Chaque participant dispose d’une session R pour cet exercice.

Les formations sont dispensées par les actuaires et data scientists de Sia Partners.

Les intervenants sont en charge du développement et de l’im-plémentation des outils R Shiny chez nos clients.

est organisme de formation agréé depuis 2008 sous le numéro 11754407775. A ce titre, les budgets engagés sur ces formations sont imputables sur le budget de formation permanent de l’entreprise.

La pratique au cœur de notre démarche

Assimiler les fondamentaux de la conception d’applications RShiny

Acquérir une autonomie dans le développement de projets R Shiny

Principaux Inputs / Outputs

Instructions serveur

Interface utilisateur

Applications avancées

Déploiement

Architecture d’une application shiny

Des formateurs qui sont d’abord des opérationnels

Data Visualisation by

NOUS CONNAITRE NOTRE SHOWROOM |

Page 8: ACTUARIAT - Showroomshowroom-actuariat.sia-partners.com/formations/SiaPartners_Data... · Découverte du Big data & Data Science buzz Les termes Big Data, Data Science et transformation

L’accès à la donnée constitue souvent une barrière opérationnelle forte dans le cadre de projets Data Science. L’acquisition de la donnée présente dès lors un enjeu stratégique pour le succès de tels projets. L’open data et les API constituent de nouvelles sources de données pertinentes mais soumises aux con-traintes imposées par le data provider (format, granularité, règles d’utilisation,…). Le web scraping présente un meilleur potentiel en permettant la collecte automatique et massive de données internet via des web robots.

Structure HTML Style CSS & xpath Exploration avec chrome devtools

Package Rvest Scraping et navigation Traitement des extractions HTML

Package RCurl Requêtes GET/POST Gérer les sessions & cookies

Gérer les erreurs serveurs Traiter les formats de sortie (json, xml..)

Scraping d’articles de presse (statique) Scraping des données SRA (formulaire)

2 sessions de 4 heures

2 demi-journées ou 1 journée complète

1 500 € / participant

Forfait groupe : nous consulter

de formation Site Sia Partners (PARIS)

Site de l’entreprise (PARIS ou Province)

Initiation programmation R

1 PC par participant (possibilité de prêt)

Connexion internet sur site

[email protected]

06.82.41.48.43

Programme

Notre approche de la formation

Des formateurs qui sont d’abord des opérationnels

Chaque thème du programme est validé par un cas pratique. Chaque participant dispose d’une session R pour cet exercice.

Les formations sont dispensées par les actuaires et data scientists de Sia Partners.

Les intervenants font partie de l’équipe Data Capture qui déve-loppe et implémente ce type de solution chez nos clients.

est organisme de formation agréé depuis 2008 sous le numéro 11754407775. A ce titre, les budgets engagés sur ces formations sont imputables sur le budget de formation permanent de l’entreprise.

La pratique au cœur de notre démarche

Assimiler les fondamentaux du scraping sur R

Acquérir une autonomie dans la récolte de données sur internet

Scraping de page statique

Scraping de formulaire

Requêtage avancé

Cas pratiques

Architecture d’une page web

Data Capture by

NOUS CONNAITRE NOTRE SHOWROOM |

Page 9: ACTUARIAT - Showroomshowroom-actuariat.sia-partners.com/formations/SiaPartners_Data... · Découverte du Big data & Data Science buzz Les termes Big Data, Data Science et transformation

Natural Langage Processing sous R Le Natural Language Processing (NLP) couvre les techniques et algorithmes visant à comprendre le sens d’un texte pour des applications telles que la traduction, l’analyse de sentiments, la détection de relations ou la segmentation en différents sujets. Le langage R offre de nombreux outils permettant la manipulation de données textuelles et leur exploitation au sein de modèles prédictifs de NLP.

Manipulation de texte brut & corpus

Manipulations R : Expressions régulières Parsing et transformation de texte Comptage de mots, N-gramme

Concepts fondamentaux : Tokenization & vectorisation Lemmatisation & racinisation POS (Part-of-Speech) tagging Gestion des « stopwords »

Outils dédiés sous R : Manipulation de chaines de caractères avec stringr Modélisation avec coreNLP

Durée 2 sessions de 4 heures

2 demi-journées ou 1 journée complète

1 200 € / participant

Forfait groupe : nous consulter

Budget

Lieu de formation Site Sia Partners (PARIS)

Site de l’entreprise (PARIS ou Province)

Prérequis

Maitrise avancée de R

Connaissance modélisation prédictive

1 PC par participant (possibilité de prêt)

Connexion internet sur site

Informations [email protected]

06.82.41.48.43

Programme

Notre approche de la formation

Des formateurs qui sont d’abord des opérationnels

Chaque thème du programme est validé par un cas pratique. Chaque participant dispose d’une session R pour cet exercice.

Les formations sont dispensées par les actuaires et data scientists de Sia Partners.

Ces intervenants font partie de l’équipe Data Science en charge du développement et de l’implémentation des modèles NLP chez nos client.

by

est organisme de formation agréé depuis 2008 sous le numéro 11754407775. A ce titre, les budgets engagés sur ces formations sont imputables sur le budget de formation permanent de l’entreprise.

La pratique au cœur de notre démarche

Objectifs

Manipuler des données textuelles

Développer des modèles NLP sous R

NOUS CONNAITRE NOTRE SHOWROOM |

Algorithmes & Applications

Algorithmes de place : Approche par Bag of Words et N-gramme Modélisation par Support Vector Machine Avantage / Limite des algorithmes

Applications sous R : Analyse de sentiment Classification de texte Capacités & Limites du NLP

Data modeling

Page 10: ACTUARIAT - Showroomshowroom-actuariat.sia-partners.com/formations/SiaPartners_Data... · Découverte du Big data & Data Science buzz Les termes Big Data, Data Science et transformation

VOS CONTACTS

Sia Partners est devenu en quinze ans le leader des cabinets de conseil français indépendants. Cofondé en 1999 par Matthieu Courtecuisse, Sia Partners

compte 700 consultants pour un chiffre d’affaires de 115 millions d’euros. Le Groupe est présent dans treize pays, les Etats-Unis représentant le deuxième

marché. Sia Partners est reconnu pour son expertise pointue dans l’énergie, les banques, l’assurance, les télécoms et le transport. Sia Partners accompagne

ses clients dans la gestion des nouveaux défis de demain. Nous intervenons essentiellement pour de grands groupes européens et mondiaux dans l’appui

opérationnel et la gestion de la transformation, dans l’analyse stratégique des changements réglementaires et des nouvelles opportunités de marché

ainsi que dans l’innovation technologique. En France, notre portefeuille de clients est constitué de 50% d’entreprises du CAC40 et de grandes entreprises

publiques.

À PROPOS DE SIA PARTNERS

Pierre-Antoine Merle

Senior Manager

Tel : +33 6 82 41 48 43

[email protected]

Michaël Donio

Directeur Actuariat

Tel : + 33 7 63 30 22 70

[email protected]

Suivez nous sur LinkedIn et Twitter @SiaPartnersPour plus d’informations, visitez : www.sia-partners.com

Abu DhabiPO Box 54605West Tower #605Abu Dhabi Mall - UAET. +971 4 443 1613

AmsterdamBarbara Strozzilaan 1011083 HN Amsterdam - NetherlandsT. +31 20 240 22 05

Brussels Av Henri Jasparlaan, 1281060 Brussels - BelgiumT. +32 2 213 82 85

Casablanca14, avenue Mers Sultan20500 Casablanca - MoroccoT. +212 522 49 24 80

Charlotte401 N. Tryon Street, 10th FloorCharlotte, NC 28202 - USAT. +1 646 496 0160

DohaPO Box 27774 DohaTornado Tower #2238West Bay - QatarT. +974 4429 2524

DubaiPO Box 502665Shatha Tower office #2115Dubai Media CityDubai - UAET. +971 4 443 1613Hong Kong 23/F, The Southland Building, 48 Connaught Road CentralCentral - Hong KongT. +852 2157 2717

London 2nd Floor, 4 EastcheapLondon EC3M 1AE - United KingdomT. +44 20 7933 9333

Luxembourg7 rue Robert StumperL-2557 Luxembourg

Lyon3 rue du Président Carnot69002 Lyon - FranceT. +33 1 42 77 76 17

Milan Via Gioberti 820123 Milano - ItalyT. +39 02 89 09 39 45

Montreal 2000 McGill College, Suite 600,Montreal QC H3A 3H3 - CanadaT. +1 514 926-2626

New York111 Broadway, Suite 1403New York, NY 10005 - USAT. +1 646 496 0160

Paris 12 rue Magellan75008 Paris - France

T. +33 1 42 77 76 17

RiyadhPO Box 502665Shatha Tower office #2115Dubai Media CityDubai - UAET. +971 4 443 1613

Rome Via Quattro Fontane 11600184 Roma - ItalyT. +39 06 48 28 506

Singapore 3 Pickering street #02-38048660 SingaporeT. +65 6635 3433

TokyoLevel 20 Marunouchi Trust Tower-Main1-8-3 Marunouchi, Chiyoda-kuTokyo 100-0005 JapanT. +81 3 5288 5101