Catalogue Formations

  • View
    35

  • Download
    0

Embed Size (px)

Text of Catalogue Formations

  • Olivier Decourt SARL

    Contenu des cours

    2010

    Nous contacter par email :

    formation@od-datamining.com

    Visitez notre site : http://www.od-datamining.com/

    Statistiques Data Mining

    SAS 9 & Spad 7

  • Sommaire

    Tarifs et conditions ........................................................................................... 3

    Formations statistiques ..................................................................................... 4

    [AASTAT] Statistique descriptive avec SAS......................................................... 5

    [ANADON] Analyse des donnes sous SAS ......................................................... 6

    [ANOVA] Analyse de la variance ........................................................................ 7

    [BOOT] Le bootstrap, thorie et pratique........................................................... 8

    [GENMOD] Modle linaire gnralis................................................................ 9

    [IMPUTER] Traitement de la non-rponse, calage & imputation ........................ 10

    [MIXED] Analyse de la variance et modles mixtes ........................................... 11

    [NEWSTAT9] Nouveauts de SAS/STAT en version 9........................................ 12

    [ODSGRAPH9] ODS GRAPHICS........................................................................ 13

    [PLS] La rgression PLS .................................................................................. 14

    [REG] Techniques de rgression...................................................................... 15

    [REGQUALI] Rgression sur variables qualitatives ............................................ 16

    [REGQUANTI] Rgression sur variables quantitatives........................................ 17

    [STATD] De la description la dcision : initiation SAS/STAT ......................... 18

    [SURVIE] Analyse de survie et conomtrie des dures .................................... 19

    Formations au DataMining .............................................................................. 20

    [DM] Qu'est-ce que le Data Mining ? ............................................................... 21

    [SCORING] Panorama et comparaison des mthodes de scoring ....................... 22

    [RN] Les rseaux de neurones ........................................................................ 23

    [ARBRES] Les arbres de dcision..................................................................... 24

    [SEM4] SAS Enterprise Miner version 4 ............................................................ 25

    [SEM5] SAS Enterprise Miner version 5 et 6 ..................................................... 26

  • Tarifs et conditions

    Groupes de 1 8 personnes

    Nous proposons un tarif unique en intra-entreprise, quel que soit le niveau du cours : 1 150 HT par jour de formation. Ce tarif est applicable tout groupe de huit personnes maximum. Il inclut limpression et lacheminement de supports de cours pour chaque participant.

    Des formations sur mesure

    Les contenus de cours qui sont dtaills dans les pages suivantes ne sont pas limitatifs. Il ne sagit que des contenus standard. Ceux-ci peuvent tre adapts vos besoins, quil sagisse de la modification dun contenu existant ou de la cration dun nouveau cours. Ces modifications nentranent aucune modification des tarifs ci-dessus.

    Cours en province

    Les frais de dplacement et dhbergement sur place du formateur seront facturs en sus sur prsentation de justificatifs.

  • Formations statistiques

  • [AASTAT] Statistique descriptive avec SAS

    Ce stage est destin aux personnes dsireuses de (re)dcouvrir les principes de la statistique exploratoire. La mise en uvre de ces techniques se fait autour des procdures de SAS/GRAPH et SAS/STAT.

    Ce cours est une bonne prparation aux formations de modlisation (REGQUANTI, REGQUALI, GENMOD) ainsi qu lanalyse de la variance (ANOVA).

    Dure : 2 jours

    DECRIRE LES DONNEES PAR DES GRAPHIQUES

    o Graphiques univaris (btons et diagrammes circulaires) avec la procdure GCHART

    o Graphiques bivaris (nuages de points et botes moustaches) avec les procdures GPLOT et BOXPLOT

    o Graphiques de rpartition dune variable avec les procdures UNIVARIATE et KDE

    INDICATEURS STATISTIQUES USUELS

    o Rappels sur les dfinitions des moyennes, mdianes, variances, etc. o Calcul de statistiques descriptives avec la procdure MEANS o Calcul de statistiques plus pousses avec la procdure UNIVARIATE

    RECHERCHE DE LIAISONS ENTRE VARIABLES

    o Tableaux de frquences, chi-2 avec la procdure FREQ o Corrlations linaires avec la procdure CORR o Non-linarit des liaisons et transformation quanti/quali :lutilit dun

    format

    TESTS STATISTIQUES

    o Principe dun test statistique o Test dadquation une loi avec la procdure UNIVARIATE o Test du chi-2 et quantits drives avec la procdure FREQ o Test de comparaison de moyennes et de proportions avec la procdure

    TTEST

    INTRODUCTION A LA MODELISATION

    o Principe dun modle statistique o Rgression linaire avec la procdure GLM : premiers rsultats o Vrification des hypothses du modle : de limportance dune bonne

    analyse exploratoire o Tableau synthtique des modles disponibles dans le module SAS/STAT

  • [ANADON] Analyse des donnes sous SAS

    Ce stage est destin aux chargs d'tudes qui dsirent voir ou revoir les principes de l'analyse de donnes la franaise (ACM, AFC, ACP) et surtout leur utilisation travers SAS. On y aborde galement la classification, avec SAS et SAS Enterprise Miner.

    Dure : 2 jours

    L'ANALYSE EN COMPOSANTES PRINCIPALES (ACP)

    o Syntaxe de la proc PRINCOMP o Choix du nombre d'axes factoriels o Nuages des individus et des variables o Cercle des corrlations

    L'ANALYSE DES CORRESPONDANCES MULTIPLES (ACM)

    o Cration d'un tableau disjonctif complet o Syntaxe de la proc CORRESP o Choix du nombre d'axes factoriels o Nuages des individus et des variables o Individus et variables supplmentaires

    TYPOLOGIES

    o Classification ascendante hirarchique avec la proc CLUSTER o Nues dynamiques avec la proc FASTCLUS o Mthode mixte de Wong o Description des classes o Modliser lappartenance aux classes pour raffecter

    L'ANALYSE DES DONNEES SOUS SAS ENTERPRISE MINER

    o Le nud PRINCOMP o Les cartes de Kohonen o La rduction de dimension avec le nud SOM/KOHONEN o Les nues dynamiques avec le nud CLUSTERING

  • [ANOVA] Analyse de la variance

    Avec des bases statistiques (description univarie : moyenne, variance, quantiles), ce stage propose de dcouvrir des outils puissants : l'analyse de la variance et les tests statistiques d'galit de moyennes.

    Dure : 2 jours

    LANALYSE DE LA VARIANCE ET LE MODELE LINEAIRE GENERAL

    o Hypothses du modle linaire gnral o Validation des hypothses o Dcomposition de la variance et tests affrents o L analyse de la dviance et les MLG

    LES TESTS DE COMPARAISONS DE MOYENNES

    o Tests simultans o Test un groupe de rfrence : test de Dunnett o Contrastes o Moyennes ajustes ou non

    LETUDE DES DONNEES REPETEES ET CORRELEES

    o Cas de mise en uvre o Dans le cadre du modle linaire gnral o Dans le cadre du modle linaire gnralis

  • [BOOT] Le bootstrap, thorie et pratique

    Ce cours propose de comprendre les concepts du bootstrap et du jackknife, et de permettre leur mise en oeuvre dans les processus d'tude et de modlisation. La connaissance de la programmation SAS et du macro-langage est requise.

    Dure : 1 jour

    QUELQUES DEFINITIONS

    o Mthode de Monte-Carlo o Echantillonnage et rchantillonnage o Plug-in

    LE BOOTSTRAP POUR LA CONSTRUCTION DINTERVALLES DE CONFIANCE

    o Bootstrap T o Bootstrap percentile o Bootstrap BCa

    LE BOOTSTRAP POUR LES PROBLEMES DE CLASSIFICATION

    o Bootstrap .632 o Bagging o Boosting

    MISE EN UVRE SOUS SAS

    o Bootstrap o Bagging o Boosting

  • [GENMOD] Modle linaire gnralis

    Les modles prsents ici font de la rgression linaire et de la rgression logistique des cas particuliers. Les Modles Linaires Gnraliss (MLG) se proposent d'tudier les variables dont la normalit est prise en dfaut (cots, frquences d'vnements, ...) et proposent des outils puissants.

    Dure : 2 jours

    PRINCIPES DE LA REGRESSION

    o Vocabulaire et concepts o La rgression linaire o La rgression logistique o Leurs points communs

    MODELE LINEAIRE GENERALISE

    o Loi de Y o Fonction de lien o Qualit du modle o Analyse de la dviance o Analyse des rsidus et autres vrifications o Syntaxe de la procdure GENMOD de SAS

    EXEMPLES DE MODELES LINEAIRES GENERALISES

    o Rgression de Poisson o Rgression binomiale ngative o Rgression Gamma o Donnes rptes ou corrles : les GEE

  • [IMPUTER] Traitement de la non-rponse, calage & imputation

    Les rsultats dune enqute sont souvent entachs de non-rponse : des individus nont, partiellement ou totalement, pas rpondu aux questions qui leur taient poses. Cette formation oriente vers la pratique sous SAS des techniques de redressement usuelle permet, en une journe, de balayer les diffrents types de non rponse et les solutions que lon peut y apporter.

    Dure : 1 jour

    NON REPONSE TOTALE : CALAGE

    o Le problme initial o Pourquoi modifier les poids o Quelles variables de calage ? o Le calage sur marges : thorie o Le calage sur marges : pratique avec la macro %CALMAR

    NON REPONSE PARTIELLE : IMPUTATION

    o Imputation par la moyenne o Imputation par rgression o Imputation par hotdeck o Imputation par rsidus simuls o Imputation par plus proches v