25
Copyright © 2012, SAS Institute Inc. All rights reserved. SIMULATIONEN UND MATHEMATISCHE PROGRAMMIERUNG MIT SAS DR. GERHARD SVOLBA COMPETENCE CENTER ANALYTICS GREIFSWALD, 3. MÄRZ 2016 Die Vortragsfolien sind bereits online! Google: gerhard sas samples Credits to Rick Wicklin, SAS Cary, NC

Die Vortragsfolien sind bereits online! Google: gerhard ... · dem R Open Source Project. Copyright © 2012, SAS Institute Inc. All rights reserved. TIPP #4 MACHEN SIE SICH MIT SAS®IML

Embed Size (px)

Citation preview

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

SIMULATIONEN UND

MATHEMATISCHE PROGRAMMIERUNG MIT SAS

DR GERHARD SVOLBA

COMPETENCE CENTER ANALYTICS

GREIFSWALD 3 MAumlRZ 2016

Die Vortragsfolien sind bereits online

Google gerhard sas samples

Credits to Rick Wicklin SAS Cary NC

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

EINLEITUNG DAS ERWARTET SIE IN MEINEM VORTRAG

bull Grundidee von Simulationen

bull 10 Tipps und Tricks fuumlr Simulationen mit SAS

bull Simulationsmoumlglichkeiten in SAS

bull Zufallszahlen Verteilungen und Analysemoumlglichkeiten

bull Mathematische Programmierung mit der SASreg IML Software

bull Optimierung Ihrer Simulationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

SIMULATIONEN GRUND-IDEE

bull Die Simulation ist eine Vorgehensweise zur Analyse von Systemen

die fuumlr die theoretische oder formelmaumlszligige Behandlung zu komplex

sind Bei der Simulation werden Experimente an einem Modell

durchgefuumlhrt um Erkenntnisse uumlber das reale System zu gewinnen

bull Analytisch unloumlsbare Probleme

bull Theoretisch loumlsbare Probleme die aber einen hohen

Komplexitaumltsgrad aufweisen

bull Nachbildung von komplexen Prozessen

bull Analyse von Spiel- und Investitionsstrategien

httpsdewikipediaorgwikiSimulation

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

SIMULATIONS-

BEISPIELE

SIMULATION VON hellip

bull Schadensverteilungen und Schadensereignissen

bull Auswirkungen von Investitionsstrategien

bull Produktionsprozessen in Fertigungsunternehmen um Engpaumlsse in

der Produktion aufzudecken

bull Kundennetzwerken und deren Interaktion im

Telekommunikationsbereich

bull Waumlhlerverhalten

bull Wetter und Klima auf der Erde

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 1VERWENDEN SIE SAS FUumlR

SIMULATIONS-STUDIEN

bull SAS Datastep fuumlr die Simulation von Daten aus univariaten und unkorrelierten

multivariaten Verteilungen

bull SASregIML fuumlr die Simulation von Daten aus vielen Verteilungen zB

korrelierten multivariaten Verteilungen Definition neuer Funktionen fuumlr das

Erzeugen von Verteilungen die in SAS nicht vorhanden sind

bull SASregSTAT und SASregETS Procedures (SIMNORMAL SIM2D COPULA) zur

Simulation von Daten mit speziellen Eigenschaften

bull Simulationsmoumlglichkeiten in SAS die in diesem Vortrag nicht behandelt werden

bull SAS Simulation Studio (OR) fuumlr die Simulation von diskreten Ereignissen

bull Proc MCMC (STAT) Markov-Chain Monte Carlo Procedure zum Schaumltzen Bayesianischer Modelle

bull Proc Risk und SAS Risk Management zur Simulation von Risiko Parametern

bull Proc Model (ETS) Monte Carlo Simulation von Zeitreihenmodellen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 1

BEISPIEL SIMULATION DER KONSEQUENZ

SCHLECHTER DATENQUALITAumlT AUF DIE

MODELLGUumlTE

bull Verschachtelte

Datastep Schleifen

bull Datenmanagement

Anweisungen

bull Analytic

Procedures

bull Aggregationen

Auswertungen

Kombination

unterschiedlicher SAS Tools

(SASregEnterprise Miner

Datastep Code

Macro Code

Auswertungen)

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 2VERWENDEN SIE DIE bdquoNEUENldquo GENERATOREN

FUumlR ZUFALLSZAHLEN

Allgemeines Template fuumlr die Simulation univariater Daten in

einem SAS Datastep

Simulationsparameter

als Macro Variable(n)

Kein SET-Statement

Daten werden erst erzeugt

Zufallszahlen-Generator zur

Erzeugung der Daten

Do-Loop fuumlr die Iterationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 2VERWENDEN SIE DIE bdquoNEUENldquo GENERATOREN

FUumlR ZUFALLSZAHLEN

bull Die bdquoaltenldquo Zufallszahlengeneratoren in SAS Base (RANUNI RANNOR

RANPOI hellip) verwenden einen aumllteren Algorithmus aus den 1970ern

(genauso wie PROBxxx xxxINV)

bull Kein Problem bei kleinen Samples (1000 hellip)

bull Der Mersenne-Twister Algorithmus hat den Vorteil einen extrem langen

Periode (bdquoWann wiederholt sich die Sequenzldquo)

bull Dieser Algorithmus ist in der RAND Funktion in SAS im Einsatz (seit SAS 9)

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 2 BEISPIELE FUumlR DIE bdquoRANDldquo FUNKTION

SAS Datastep

SAS IML

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 3 VERMEIDEN SIE MACRO-LOOPS

Fuumlr jeden Durchlauf

ein eigener Datastep

Einzelberechnung der

Ergebnisse

Append der

Ergebnisse

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 3 VERMEIDEN SIE MACRO-LOOPS

Verschachtelter

Do-Loop

Analyse BY

Simulation

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Codevergleich Berechnung und Haumlufigkeitsgewichtung aller

moumlglichen Ereignis-Kombination einer Projektliste

SAS Datastep SAS IML

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

bull SAS hat auch eine Matrixsprache (SAS IML Software) PROC IML

bull Diese ist voll in das SAS System integriert

bull Verwenden von SAS Datasets Ausgeben von Ergebnissen nach SAS

bull SAS Funktionen SAS Formate hellip

bull SAS IML bietet Matrizen Matrixmultiplikationen Vektoren Skalare

Teilmatrizen Indizes

bull SASregIML bietet auch eine Integration zwischen SAS und

dem R Open Source Project

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Beispiele

bull A+B matrix addition

bull AB matrix multiplication

bull AB element-wise multiplication

bull A[52] Element aus der

5 Zeile 2 Spalte

bull A[13210]

die ersten drei Spalten fuumlr die

2 bis 10 Zeile

bull W = INV(T(x)x)

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Verwendet den Mean

Vektor und die Cov-Matrix

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Ergebnisse des Programm-Codes

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

bull Die RAND Funktion im Datastep ist sehr maumlchtig fuumlr die Simulation von

Daten fuumlr univariate Verteilungen

bull SAS IML ist das Werkzeug der Wahl fuumlr die Simulation von korrelierten Daten

von multivariaten Verteilungen

bull SAS IML beinhaumllt viele built-in Funktionen fuumlr die Simulation unterschiedlicher

univariater und multivariater Verteilungen

bull SAS IML unterstuumltzt auch die Matrix-Berechnungen um Datensamples von

weniger haumlufig verwendeten Verteilungen zu ziehen

bull Hinweis fuumlr den Spezialfall der multivariaten Normalverteilung bietet auch

SAS STAT mit der SIMNORMAL Procedure eine Simulationsmoumlglichkeit

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

In einem Call Center werden die Anrufe in 3 Gruppen

geteilt 50 sind einfache Anfragen 20 sind

spezialisierte Anfragen und 30 sind bdquoharte Faumllleldquo

Die Erfahrungswerte bzgl der Bearbeitsdauer sind in

folgender Tabelle dargestellt

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

bull Rick Wicklin beschreibt in seinem SGF2015 Paper wie Daten aus komplexen

Verteilungen simuliert werden koumlnnen auch wenn diese im Basis-Set der 20

Verteilungen fuumlr RAND Funktion nicht enthalten sind

bull Loumlschen von bestimmten Wertebereichen einer Verteilungen ergibt eine Truncated

Distribution

bull Verschiebung und Skalierung von Zufallsvariablen innerhalb der gleichen

Verteilungsfamilie

bull Anwendung von Transformation um eine Verteilung in eine andere zu transformieren

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 7

BESCHLEUNIGEN SIE IHRE SIMULATIONS-

LAumlUFE DURCH UNTERDRUumlCKUNG VON

OUTPUT

bull Bei der Simulations-Iteration sind wir typischerweise an den erzeugte Daten

im SAS Dataset und weniger an den Ergebnissen im Output-Fenster oder

den Graphiken interessiert

bull Optionen wie NOPRINT oder PLOTS=NONE koumlnnen hier hilfreich sein

bull Weiters

bull Erstellung der Graphiken abschalten ODS GRAPHICS OFF

bull Uumlber ODS alle Ergebnisse unterdruumlcken ODS EXCLUDE ALL

bull Den Tree-View im Results-Fenster nicht befuumlllen ODS RESULTS OFF

bull Die Notes im Log unterdruumlcken OPTIONS NONOTES

bull Rick Wicklin praumlsentiert in seinem Paper bdquoTen Tips for Simulating Data with

SASregrdquo folgende beiden Macros

macro ODSOff() call prior to BY-

group processing

ods graphics off

ods exclude all

ods results off

options nonotes

mend

macro ODSOn() call after BY-group

processing

ods graphics on

ods exclude none

ods results on

options notes

mend

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 8PLANEN SIE IHRE SIMULATIONS-STUDIE

BEVOR SIE STARTEN

bull Starten Sie den Testlauf (Programmverifikation) mit 2-5 Iterationen

bull Starten Sei den Performancetest (Laufzeitermittlung) mit 100 ndash 1000 Iterationen

bull Stellen Sie sicher dass sie ihr Programm vor dem bdquoSubmitldquo speichern

Damit sie notfalls die Session ohne Verluste vollstaumlndig abbrechen koumlnnen

bull Starten Sie mit einem bdquogrobenldquo Grid und verfeinern Sie dort wo Sie mehr Details

benoumltigen

bull ein 20x20 Grid benoumltigt die vierfache Laufzeit eines 10x10 Grids

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 9

NUTZEN SIE DAS WISSEN AUS SAS BLOGS

LITERATUR VON SAS PRESS SAS GLOBAL

FORUMS PAPERS

Do-Loop Blog von Rick Wicklin httpblogssascomcontentiml

Buumlcher von Rick Wicklin

httpsupportsascompublishingauthorswicklinhtml

SASreg for Monte Carlo Studies A Guide

for Quantitative ResearchersXitao Fan PhD

Akos Felsovalyi MS

Stephen A Sivo PhD

Sean C Keenan PhD httpsupportsascompublishingauthorsfelsovalyihtml

httpsupportsascomresourcespapersproceedings15SAS1387-2015pdf

Paper SAS1387-2015 Ten Tips for Simulating Data with

SASreg Rick Wicklin

httpsupportsascomeventssas

globalforumpreviousonlinehtml

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 10

ERWARTEN SIE MEHR NEUES BUCH IN SAS

PRESS bdquoMY FAVOURITE BUSINESS ANALYSES

WITH SASldquo MIT ZWEI SIMLUATIONS-STUDIEN

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

ZUSAMMENFASSUNG

Gerhard Svolba

Analytic Solution Architect

SAS-Austria

Gerhardsvolbasascom

httpwwwsascommunityorgwikiGerhard_Svolba

LinkedIn ndash XING ndash PictureBlog

Data Quality for Analytics Using SAS

SAS Press 2012httpwwwsascommunityorgwikiData_Quality_for_Analytics

Data Preparation for Analytics Using SAS

SAS Press 2006httpwwwsascommunityorgwikiData_Preparation_for_Analytics

Kontaktinformationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

EINLEITUNG DAS ERWARTET SIE IN MEINEM VORTRAG

bull Grundidee von Simulationen

bull 10 Tipps und Tricks fuumlr Simulationen mit SAS

bull Simulationsmoumlglichkeiten in SAS

bull Zufallszahlen Verteilungen und Analysemoumlglichkeiten

bull Mathematische Programmierung mit der SASreg IML Software

bull Optimierung Ihrer Simulationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

SIMULATIONEN GRUND-IDEE

bull Die Simulation ist eine Vorgehensweise zur Analyse von Systemen

die fuumlr die theoretische oder formelmaumlszligige Behandlung zu komplex

sind Bei der Simulation werden Experimente an einem Modell

durchgefuumlhrt um Erkenntnisse uumlber das reale System zu gewinnen

bull Analytisch unloumlsbare Probleme

bull Theoretisch loumlsbare Probleme die aber einen hohen

Komplexitaumltsgrad aufweisen

bull Nachbildung von komplexen Prozessen

bull Analyse von Spiel- und Investitionsstrategien

httpsdewikipediaorgwikiSimulation

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

SIMULATIONS-

BEISPIELE

SIMULATION VON hellip

bull Schadensverteilungen und Schadensereignissen

bull Auswirkungen von Investitionsstrategien

bull Produktionsprozessen in Fertigungsunternehmen um Engpaumlsse in

der Produktion aufzudecken

bull Kundennetzwerken und deren Interaktion im

Telekommunikationsbereich

bull Waumlhlerverhalten

bull Wetter und Klima auf der Erde

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 1VERWENDEN SIE SAS FUumlR

SIMULATIONS-STUDIEN

bull SAS Datastep fuumlr die Simulation von Daten aus univariaten und unkorrelierten

multivariaten Verteilungen

bull SASregIML fuumlr die Simulation von Daten aus vielen Verteilungen zB

korrelierten multivariaten Verteilungen Definition neuer Funktionen fuumlr das

Erzeugen von Verteilungen die in SAS nicht vorhanden sind

bull SASregSTAT und SASregETS Procedures (SIMNORMAL SIM2D COPULA) zur

Simulation von Daten mit speziellen Eigenschaften

bull Simulationsmoumlglichkeiten in SAS die in diesem Vortrag nicht behandelt werden

bull SAS Simulation Studio (OR) fuumlr die Simulation von diskreten Ereignissen

bull Proc MCMC (STAT) Markov-Chain Monte Carlo Procedure zum Schaumltzen Bayesianischer Modelle

bull Proc Risk und SAS Risk Management zur Simulation von Risiko Parametern

bull Proc Model (ETS) Monte Carlo Simulation von Zeitreihenmodellen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 1

BEISPIEL SIMULATION DER KONSEQUENZ

SCHLECHTER DATENQUALITAumlT AUF DIE

MODELLGUumlTE

bull Verschachtelte

Datastep Schleifen

bull Datenmanagement

Anweisungen

bull Analytic

Procedures

bull Aggregationen

Auswertungen

Kombination

unterschiedlicher SAS Tools

(SASregEnterprise Miner

Datastep Code

Macro Code

Auswertungen)

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 2VERWENDEN SIE DIE bdquoNEUENldquo GENERATOREN

FUumlR ZUFALLSZAHLEN

Allgemeines Template fuumlr die Simulation univariater Daten in

einem SAS Datastep

Simulationsparameter

als Macro Variable(n)

Kein SET-Statement

Daten werden erst erzeugt

Zufallszahlen-Generator zur

Erzeugung der Daten

Do-Loop fuumlr die Iterationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 2VERWENDEN SIE DIE bdquoNEUENldquo GENERATOREN

FUumlR ZUFALLSZAHLEN

bull Die bdquoaltenldquo Zufallszahlengeneratoren in SAS Base (RANUNI RANNOR

RANPOI hellip) verwenden einen aumllteren Algorithmus aus den 1970ern

(genauso wie PROBxxx xxxINV)

bull Kein Problem bei kleinen Samples (1000 hellip)

bull Der Mersenne-Twister Algorithmus hat den Vorteil einen extrem langen

Periode (bdquoWann wiederholt sich die Sequenzldquo)

bull Dieser Algorithmus ist in der RAND Funktion in SAS im Einsatz (seit SAS 9)

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 2 BEISPIELE FUumlR DIE bdquoRANDldquo FUNKTION

SAS Datastep

SAS IML

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 3 VERMEIDEN SIE MACRO-LOOPS

Fuumlr jeden Durchlauf

ein eigener Datastep

Einzelberechnung der

Ergebnisse

Append der

Ergebnisse

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 3 VERMEIDEN SIE MACRO-LOOPS

Verschachtelter

Do-Loop

Analyse BY

Simulation

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Codevergleich Berechnung und Haumlufigkeitsgewichtung aller

moumlglichen Ereignis-Kombination einer Projektliste

SAS Datastep SAS IML

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

bull SAS hat auch eine Matrixsprache (SAS IML Software) PROC IML

bull Diese ist voll in das SAS System integriert

bull Verwenden von SAS Datasets Ausgeben von Ergebnissen nach SAS

bull SAS Funktionen SAS Formate hellip

bull SAS IML bietet Matrizen Matrixmultiplikationen Vektoren Skalare

Teilmatrizen Indizes

bull SASregIML bietet auch eine Integration zwischen SAS und

dem R Open Source Project

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Beispiele

bull A+B matrix addition

bull AB matrix multiplication

bull AB element-wise multiplication

bull A[52] Element aus der

5 Zeile 2 Spalte

bull A[13210]

die ersten drei Spalten fuumlr die

2 bis 10 Zeile

bull W = INV(T(x)x)

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Verwendet den Mean

Vektor und die Cov-Matrix

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Ergebnisse des Programm-Codes

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

bull Die RAND Funktion im Datastep ist sehr maumlchtig fuumlr die Simulation von

Daten fuumlr univariate Verteilungen

bull SAS IML ist das Werkzeug der Wahl fuumlr die Simulation von korrelierten Daten

von multivariaten Verteilungen

bull SAS IML beinhaumllt viele built-in Funktionen fuumlr die Simulation unterschiedlicher

univariater und multivariater Verteilungen

bull SAS IML unterstuumltzt auch die Matrix-Berechnungen um Datensamples von

weniger haumlufig verwendeten Verteilungen zu ziehen

bull Hinweis fuumlr den Spezialfall der multivariaten Normalverteilung bietet auch

SAS STAT mit der SIMNORMAL Procedure eine Simulationsmoumlglichkeit

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

In einem Call Center werden die Anrufe in 3 Gruppen

geteilt 50 sind einfache Anfragen 20 sind

spezialisierte Anfragen und 30 sind bdquoharte Faumllleldquo

Die Erfahrungswerte bzgl der Bearbeitsdauer sind in

folgender Tabelle dargestellt

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

bull Rick Wicklin beschreibt in seinem SGF2015 Paper wie Daten aus komplexen

Verteilungen simuliert werden koumlnnen auch wenn diese im Basis-Set der 20

Verteilungen fuumlr RAND Funktion nicht enthalten sind

bull Loumlschen von bestimmten Wertebereichen einer Verteilungen ergibt eine Truncated

Distribution

bull Verschiebung und Skalierung von Zufallsvariablen innerhalb der gleichen

Verteilungsfamilie

bull Anwendung von Transformation um eine Verteilung in eine andere zu transformieren

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 7

BESCHLEUNIGEN SIE IHRE SIMULATIONS-

LAumlUFE DURCH UNTERDRUumlCKUNG VON

OUTPUT

bull Bei der Simulations-Iteration sind wir typischerweise an den erzeugte Daten

im SAS Dataset und weniger an den Ergebnissen im Output-Fenster oder

den Graphiken interessiert

bull Optionen wie NOPRINT oder PLOTS=NONE koumlnnen hier hilfreich sein

bull Weiters

bull Erstellung der Graphiken abschalten ODS GRAPHICS OFF

bull Uumlber ODS alle Ergebnisse unterdruumlcken ODS EXCLUDE ALL

bull Den Tree-View im Results-Fenster nicht befuumlllen ODS RESULTS OFF

bull Die Notes im Log unterdruumlcken OPTIONS NONOTES

bull Rick Wicklin praumlsentiert in seinem Paper bdquoTen Tips for Simulating Data with

SASregrdquo folgende beiden Macros

macro ODSOff() call prior to BY-

group processing

ods graphics off

ods exclude all

ods results off

options nonotes

mend

macro ODSOn() call after BY-group

processing

ods graphics on

ods exclude none

ods results on

options notes

mend

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 8PLANEN SIE IHRE SIMULATIONS-STUDIE

BEVOR SIE STARTEN

bull Starten Sie den Testlauf (Programmverifikation) mit 2-5 Iterationen

bull Starten Sei den Performancetest (Laufzeitermittlung) mit 100 ndash 1000 Iterationen

bull Stellen Sie sicher dass sie ihr Programm vor dem bdquoSubmitldquo speichern

Damit sie notfalls die Session ohne Verluste vollstaumlndig abbrechen koumlnnen

bull Starten Sie mit einem bdquogrobenldquo Grid und verfeinern Sie dort wo Sie mehr Details

benoumltigen

bull ein 20x20 Grid benoumltigt die vierfache Laufzeit eines 10x10 Grids

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 9

NUTZEN SIE DAS WISSEN AUS SAS BLOGS

LITERATUR VON SAS PRESS SAS GLOBAL

FORUMS PAPERS

Do-Loop Blog von Rick Wicklin httpblogssascomcontentiml

Buumlcher von Rick Wicklin

httpsupportsascompublishingauthorswicklinhtml

SASreg for Monte Carlo Studies A Guide

for Quantitative ResearchersXitao Fan PhD

Akos Felsovalyi MS

Stephen A Sivo PhD

Sean C Keenan PhD httpsupportsascompublishingauthorsfelsovalyihtml

httpsupportsascomresourcespapersproceedings15SAS1387-2015pdf

Paper SAS1387-2015 Ten Tips for Simulating Data with

SASreg Rick Wicklin

httpsupportsascomeventssas

globalforumpreviousonlinehtml

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 10

ERWARTEN SIE MEHR NEUES BUCH IN SAS

PRESS bdquoMY FAVOURITE BUSINESS ANALYSES

WITH SASldquo MIT ZWEI SIMLUATIONS-STUDIEN

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

ZUSAMMENFASSUNG

Gerhard Svolba

Analytic Solution Architect

SAS-Austria

Gerhardsvolbasascom

httpwwwsascommunityorgwikiGerhard_Svolba

LinkedIn ndash XING ndash PictureBlog

Data Quality for Analytics Using SAS

SAS Press 2012httpwwwsascommunityorgwikiData_Quality_for_Analytics

Data Preparation for Analytics Using SAS

SAS Press 2006httpwwwsascommunityorgwikiData_Preparation_for_Analytics

Kontaktinformationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

SIMULATIONEN GRUND-IDEE

bull Die Simulation ist eine Vorgehensweise zur Analyse von Systemen

die fuumlr die theoretische oder formelmaumlszligige Behandlung zu komplex

sind Bei der Simulation werden Experimente an einem Modell

durchgefuumlhrt um Erkenntnisse uumlber das reale System zu gewinnen

bull Analytisch unloumlsbare Probleme

bull Theoretisch loumlsbare Probleme die aber einen hohen

Komplexitaumltsgrad aufweisen

bull Nachbildung von komplexen Prozessen

bull Analyse von Spiel- und Investitionsstrategien

httpsdewikipediaorgwikiSimulation

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

SIMULATIONS-

BEISPIELE

SIMULATION VON hellip

bull Schadensverteilungen und Schadensereignissen

bull Auswirkungen von Investitionsstrategien

bull Produktionsprozessen in Fertigungsunternehmen um Engpaumlsse in

der Produktion aufzudecken

bull Kundennetzwerken und deren Interaktion im

Telekommunikationsbereich

bull Waumlhlerverhalten

bull Wetter und Klima auf der Erde

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 1VERWENDEN SIE SAS FUumlR

SIMULATIONS-STUDIEN

bull SAS Datastep fuumlr die Simulation von Daten aus univariaten und unkorrelierten

multivariaten Verteilungen

bull SASregIML fuumlr die Simulation von Daten aus vielen Verteilungen zB

korrelierten multivariaten Verteilungen Definition neuer Funktionen fuumlr das

Erzeugen von Verteilungen die in SAS nicht vorhanden sind

bull SASregSTAT und SASregETS Procedures (SIMNORMAL SIM2D COPULA) zur

Simulation von Daten mit speziellen Eigenschaften

bull Simulationsmoumlglichkeiten in SAS die in diesem Vortrag nicht behandelt werden

bull SAS Simulation Studio (OR) fuumlr die Simulation von diskreten Ereignissen

bull Proc MCMC (STAT) Markov-Chain Monte Carlo Procedure zum Schaumltzen Bayesianischer Modelle

bull Proc Risk und SAS Risk Management zur Simulation von Risiko Parametern

bull Proc Model (ETS) Monte Carlo Simulation von Zeitreihenmodellen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 1

BEISPIEL SIMULATION DER KONSEQUENZ

SCHLECHTER DATENQUALITAumlT AUF DIE

MODELLGUumlTE

bull Verschachtelte

Datastep Schleifen

bull Datenmanagement

Anweisungen

bull Analytic

Procedures

bull Aggregationen

Auswertungen

Kombination

unterschiedlicher SAS Tools

(SASregEnterprise Miner

Datastep Code

Macro Code

Auswertungen)

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 2VERWENDEN SIE DIE bdquoNEUENldquo GENERATOREN

FUumlR ZUFALLSZAHLEN

Allgemeines Template fuumlr die Simulation univariater Daten in

einem SAS Datastep

Simulationsparameter

als Macro Variable(n)

Kein SET-Statement

Daten werden erst erzeugt

Zufallszahlen-Generator zur

Erzeugung der Daten

Do-Loop fuumlr die Iterationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 2VERWENDEN SIE DIE bdquoNEUENldquo GENERATOREN

FUumlR ZUFALLSZAHLEN

bull Die bdquoaltenldquo Zufallszahlengeneratoren in SAS Base (RANUNI RANNOR

RANPOI hellip) verwenden einen aumllteren Algorithmus aus den 1970ern

(genauso wie PROBxxx xxxINV)

bull Kein Problem bei kleinen Samples (1000 hellip)

bull Der Mersenne-Twister Algorithmus hat den Vorteil einen extrem langen

Periode (bdquoWann wiederholt sich die Sequenzldquo)

bull Dieser Algorithmus ist in der RAND Funktion in SAS im Einsatz (seit SAS 9)

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 2 BEISPIELE FUumlR DIE bdquoRANDldquo FUNKTION

SAS Datastep

SAS IML

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 3 VERMEIDEN SIE MACRO-LOOPS

Fuumlr jeden Durchlauf

ein eigener Datastep

Einzelberechnung der

Ergebnisse

Append der

Ergebnisse

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 3 VERMEIDEN SIE MACRO-LOOPS

Verschachtelter

Do-Loop

Analyse BY

Simulation

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Codevergleich Berechnung und Haumlufigkeitsgewichtung aller

moumlglichen Ereignis-Kombination einer Projektliste

SAS Datastep SAS IML

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

bull SAS hat auch eine Matrixsprache (SAS IML Software) PROC IML

bull Diese ist voll in das SAS System integriert

bull Verwenden von SAS Datasets Ausgeben von Ergebnissen nach SAS

bull SAS Funktionen SAS Formate hellip

bull SAS IML bietet Matrizen Matrixmultiplikationen Vektoren Skalare

Teilmatrizen Indizes

bull SASregIML bietet auch eine Integration zwischen SAS und

dem R Open Source Project

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Beispiele

bull A+B matrix addition

bull AB matrix multiplication

bull AB element-wise multiplication

bull A[52] Element aus der

5 Zeile 2 Spalte

bull A[13210]

die ersten drei Spalten fuumlr die

2 bis 10 Zeile

bull W = INV(T(x)x)

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Verwendet den Mean

Vektor und die Cov-Matrix

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Ergebnisse des Programm-Codes

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

bull Die RAND Funktion im Datastep ist sehr maumlchtig fuumlr die Simulation von

Daten fuumlr univariate Verteilungen

bull SAS IML ist das Werkzeug der Wahl fuumlr die Simulation von korrelierten Daten

von multivariaten Verteilungen

bull SAS IML beinhaumllt viele built-in Funktionen fuumlr die Simulation unterschiedlicher

univariater und multivariater Verteilungen

bull SAS IML unterstuumltzt auch die Matrix-Berechnungen um Datensamples von

weniger haumlufig verwendeten Verteilungen zu ziehen

bull Hinweis fuumlr den Spezialfall der multivariaten Normalverteilung bietet auch

SAS STAT mit der SIMNORMAL Procedure eine Simulationsmoumlglichkeit

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

In einem Call Center werden die Anrufe in 3 Gruppen

geteilt 50 sind einfache Anfragen 20 sind

spezialisierte Anfragen und 30 sind bdquoharte Faumllleldquo

Die Erfahrungswerte bzgl der Bearbeitsdauer sind in

folgender Tabelle dargestellt

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

bull Rick Wicklin beschreibt in seinem SGF2015 Paper wie Daten aus komplexen

Verteilungen simuliert werden koumlnnen auch wenn diese im Basis-Set der 20

Verteilungen fuumlr RAND Funktion nicht enthalten sind

bull Loumlschen von bestimmten Wertebereichen einer Verteilungen ergibt eine Truncated

Distribution

bull Verschiebung und Skalierung von Zufallsvariablen innerhalb der gleichen

Verteilungsfamilie

bull Anwendung von Transformation um eine Verteilung in eine andere zu transformieren

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 7

BESCHLEUNIGEN SIE IHRE SIMULATIONS-

LAumlUFE DURCH UNTERDRUumlCKUNG VON

OUTPUT

bull Bei der Simulations-Iteration sind wir typischerweise an den erzeugte Daten

im SAS Dataset und weniger an den Ergebnissen im Output-Fenster oder

den Graphiken interessiert

bull Optionen wie NOPRINT oder PLOTS=NONE koumlnnen hier hilfreich sein

bull Weiters

bull Erstellung der Graphiken abschalten ODS GRAPHICS OFF

bull Uumlber ODS alle Ergebnisse unterdruumlcken ODS EXCLUDE ALL

bull Den Tree-View im Results-Fenster nicht befuumlllen ODS RESULTS OFF

bull Die Notes im Log unterdruumlcken OPTIONS NONOTES

bull Rick Wicklin praumlsentiert in seinem Paper bdquoTen Tips for Simulating Data with

SASregrdquo folgende beiden Macros

macro ODSOff() call prior to BY-

group processing

ods graphics off

ods exclude all

ods results off

options nonotes

mend

macro ODSOn() call after BY-group

processing

ods graphics on

ods exclude none

ods results on

options notes

mend

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 8PLANEN SIE IHRE SIMULATIONS-STUDIE

BEVOR SIE STARTEN

bull Starten Sie den Testlauf (Programmverifikation) mit 2-5 Iterationen

bull Starten Sei den Performancetest (Laufzeitermittlung) mit 100 ndash 1000 Iterationen

bull Stellen Sie sicher dass sie ihr Programm vor dem bdquoSubmitldquo speichern

Damit sie notfalls die Session ohne Verluste vollstaumlndig abbrechen koumlnnen

bull Starten Sie mit einem bdquogrobenldquo Grid und verfeinern Sie dort wo Sie mehr Details

benoumltigen

bull ein 20x20 Grid benoumltigt die vierfache Laufzeit eines 10x10 Grids

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 9

NUTZEN SIE DAS WISSEN AUS SAS BLOGS

LITERATUR VON SAS PRESS SAS GLOBAL

FORUMS PAPERS

Do-Loop Blog von Rick Wicklin httpblogssascomcontentiml

Buumlcher von Rick Wicklin

httpsupportsascompublishingauthorswicklinhtml

SASreg for Monte Carlo Studies A Guide

for Quantitative ResearchersXitao Fan PhD

Akos Felsovalyi MS

Stephen A Sivo PhD

Sean C Keenan PhD httpsupportsascompublishingauthorsfelsovalyihtml

httpsupportsascomresourcespapersproceedings15SAS1387-2015pdf

Paper SAS1387-2015 Ten Tips for Simulating Data with

SASreg Rick Wicklin

httpsupportsascomeventssas

globalforumpreviousonlinehtml

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 10

ERWARTEN SIE MEHR NEUES BUCH IN SAS

PRESS bdquoMY FAVOURITE BUSINESS ANALYSES

WITH SASldquo MIT ZWEI SIMLUATIONS-STUDIEN

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

ZUSAMMENFASSUNG

Gerhard Svolba

Analytic Solution Architect

SAS-Austria

Gerhardsvolbasascom

httpwwwsascommunityorgwikiGerhard_Svolba

LinkedIn ndash XING ndash PictureBlog

Data Quality for Analytics Using SAS

SAS Press 2012httpwwwsascommunityorgwikiData_Quality_for_Analytics

Data Preparation for Analytics Using SAS

SAS Press 2006httpwwwsascommunityorgwikiData_Preparation_for_Analytics

Kontaktinformationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

SIMULATIONS-

BEISPIELE

SIMULATION VON hellip

bull Schadensverteilungen und Schadensereignissen

bull Auswirkungen von Investitionsstrategien

bull Produktionsprozessen in Fertigungsunternehmen um Engpaumlsse in

der Produktion aufzudecken

bull Kundennetzwerken und deren Interaktion im

Telekommunikationsbereich

bull Waumlhlerverhalten

bull Wetter und Klima auf der Erde

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 1VERWENDEN SIE SAS FUumlR

SIMULATIONS-STUDIEN

bull SAS Datastep fuumlr die Simulation von Daten aus univariaten und unkorrelierten

multivariaten Verteilungen

bull SASregIML fuumlr die Simulation von Daten aus vielen Verteilungen zB

korrelierten multivariaten Verteilungen Definition neuer Funktionen fuumlr das

Erzeugen von Verteilungen die in SAS nicht vorhanden sind

bull SASregSTAT und SASregETS Procedures (SIMNORMAL SIM2D COPULA) zur

Simulation von Daten mit speziellen Eigenschaften

bull Simulationsmoumlglichkeiten in SAS die in diesem Vortrag nicht behandelt werden

bull SAS Simulation Studio (OR) fuumlr die Simulation von diskreten Ereignissen

bull Proc MCMC (STAT) Markov-Chain Monte Carlo Procedure zum Schaumltzen Bayesianischer Modelle

bull Proc Risk und SAS Risk Management zur Simulation von Risiko Parametern

bull Proc Model (ETS) Monte Carlo Simulation von Zeitreihenmodellen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 1

BEISPIEL SIMULATION DER KONSEQUENZ

SCHLECHTER DATENQUALITAumlT AUF DIE

MODELLGUumlTE

bull Verschachtelte

Datastep Schleifen

bull Datenmanagement

Anweisungen

bull Analytic

Procedures

bull Aggregationen

Auswertungen

Kombination

unterschiedlicher SAS Tools

(SASregEnterprise Miner

Datastep Code

Macro Code

Auswertungen)

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 2VERWENDEN SIE DIE bdquoNEUENldquo GENERATOREN

FUumlR ZUFALLSZAHLEN

Allgemeines Template fuumlr die Simulation univariater Daten in

einem SAS Datastep

Simulationsparameter

als Macro Variable(n)

Kein SET-Statement

Daten werden erst erzeugt

Zufallszahlen-Generator zur

Erzeugung der Daten

Do-Loop fuumlr die Iterationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 2VERWENDEN SIE DIE bdquoNEUENldquo GENERATOREN

FUumlR ZUFALLSZAHLEN

bull Die bdquoaltenldquo Zufallszahlengeneratoren in SAS Base (RANUNI RANNOR

RANPOI hellip) verwenden einen aumllteren Algorithmus aus den 1970ern

(genauso wie PROBxxx xxxINV)

bull Kein Problem bei kleinen Samples (1000 hellip)

bull Der Mersenne-Twister Algorithmus hat den Vorteil einen extrem langen

Periode (bdquoWann wiederholt sich die Sequenzldquo)

bull Dieser Algorithmus ist in der RAND Funktion in SAS im Einsatz (seit SAS 9)

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 2 BEISPIELE FUumlR DIE bdquoRANDldquo FUNKTION

SAS Datastep

SAS IML

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 3 VERMEIDEN SIE MACRO-LOOPS

Fuumlr jeden Durchlauf

ein eigener Datastep

Einzelberechnung der

Ergebnisse

Append der

Ergebnisse

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 3 VERMEIDEN SIE MACRO-LOOPS

Verschachtelter

Do-Loop

Analyse BY

Simulation

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Codevergleich Berechnung und Haumlufigkeitsgewichtung aller

moumlglichen Ereignis-Kombination einer Projektliste

SAS Datastep SAS IML

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

bull SAS hat auch eine Matrixsprache (SAS IML Software) PROC IML

bull Diese ist voll in das SAS System integriert

bull Verwenden von SAS Datasets Ausgeben von Ergebnissen nach SAS

bull SAS Funktionen SAS Formate hellip

bull SAS IML bietet Matrizen Matrixmultiplikationen Vektoren Skalare

Teilmatrizen Indizes

bull SASregIML bietet auch eine Integration zwischen SAS und

dem R Open Source Project

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Beispiele

bull A+B matrix addition

bull AB matrix multiplication

bull AB element-wise multiplication

bull A[52] Element aus der

5 Zeile 2 Spalte

bull A[13210]

die ersten drei Spalten fuumlr die

2 bis 10 Zeile

bull W = INV(T(x)x)

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Verwendet den Mean

Vektor und die Cov-Matrix

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Ergebnisse des Programm-Codes

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

bull Die RAND Funktion im Datastep ist sehr maumlchtig fuumlr die Simulation von

Daten fuumlr univariate Verteilungen

bull SAS IML ist das Werkzeug der Wahl fuumlr die Simulation von korrelierten Daten

von multivariaten Verteilungen

bull SAS IML beinhaumllt viele built-in Funktionen fuumlr die Simulation unterschiedlicher

univariater und multivariater Verteilungen

bull SAS IML unterstuumltzt auch die Matrix-Berechnungen um Datensamples von

weniger haumlufig verwendeten Verteilungen zu ziehen

bull Hinweis fuumlr den Spezialfall der multivariaten Normalverteilung bietet auch

SAS STAT mit der SIMNORMAL Procedure eine Simulationsmoumlglichkeit

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

In einem Call Center werden die Anrufe in 3 Gruppen

geteilt 50 sind einfache Anfragen 20 sind

spezialisierte Anfragen und 30 sind bdquoharte Faumllleldquo

Die Erfahrungswerte bzgl der Bearbeitsdauer sind in

folgender Tabelle dargestellt

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

bull Rick Wicklin beschreibt in seinem SGF2015 Paper wie Daten aus komplexen

Verteilungen simuliert werden koumlnnen auch wenn diese im Basis-Set der 20

Verteilungen fuumlr RAND Funktion nicht enthalten sind

bull Loumlschen von bestimmten Wertebereichen einer Verteilungen ergibt eine Truncated

Distribution

bull Verschiebung und Skalierung von Zufallsvariablen innerhalb der gleichen

Verteilungsfamilie

bull Anwendung von Transformation um eine Verteilung in eine andere zu transformieren

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 7

BESCHLEUNIGEN SIE IHRE SIMULATIONS-

LAumlUFE DURCH UNTERDRUumlCKUNG VON

OUTPUT

bull Bei der Simulations-Iteration sind wir typischerweise an den erzeugte Daten

im SAS Dataset und weniger an den Ergebnissen im Output-Fenster oder

den Graphiken interessiert

bull Optionen wie NOPRINT oder PLOTS=NONE koumlnnen hier hilfreich sein

bull Weiters

bull Erstellung der Graphiken abschalten ODS GRAPHICS OFF

bull Uumlber ODS alle Ergebnisse unterdruumlcken ODS EXCLUDE ALL

bull Den Tree-View im Results-Fenster nicht befuumlllen ODS RESULTS OFF

bull Die Notes im Log unterdruumlcken OPTIONS NONOTES

bull Rick Wicklin praumlsentiert in seinem Paper bdquoTen Tips for Simulating Data with

SASregrdquo folgende beiden Macros

macro ODSOff() call prior to BY-

group processing

ods graphics off

ods exclude all

ods results off

options nonotes

mend

macro ODSOn() call after BY-group

processing

ods graphics on

ods exclude none

ods results on

options notes

mend

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 8PLANEN SIE IHRE SIMULATIONS-STUDIE

BEVOR SIE STARTEN

bull Starten Sie den Testlauf (Programmverifikation) mit 2-5 Iterationen

bull Starten Sei den Performancetest (Laufzeitermittlung) mit 100 ndash 1000 Iterationen

bull Stellen Sie sicher dass sie ihr Programm vor dem bdquoSubmitldquo speichern

Damit sie notfalls die Session ohne Verluste vollstaumlndig abbrechen koumlnnen

bull Starten Sie mit einem bdquogrobenldquo Grid und verfeinern Sie dort wo Sie mehr Details

benoumltigen

bull ein 20x20 Grid benoumltigt die vierfache Laufzeit eines 10x10 Grids

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 9

NUTZEN SIE DAS WISSEN AUS SAS BLOGS

LITERATUR VON SAS PRESS SAS GLOBAL

FORUMS PAPERS

Do-Loop Blog von Rick Wicklin httpblogssascomcontentiml

Buumlcher von Rick Wicklin

httpsupportsascompublishingauthorswicklinhtml

SASreg for Monte Carlo Studies A Guide

for Quantitative ResearchersXitao Fan PhD

Akos Felsovalyi MS

Stephen A Sivo PhD

Sean C Keenan PhD httpsupportsascompublishingauthorsfelsovalyihtml

httpsupportsascomresourcespapersproceedings15SAS1387-2015pdf

Paper SAS1387-2015 Ten Tips for Simulating Data with

SASreg Rick Wicklin

httpsupportsascomeventssas

globalforumpreviousonlinehtml

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 10

ERWARTEN SIE MEHR NEUES BUCH IN SAS

PRESS bdquoMY FAVOURITE BUSINESS ANALYSES

WITH SASldquo MIT ZWEI SIMLUATIONS-STUDIEN

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

ZUSAMMENFASSUNG

Gerhard Svolba

Analytic Solution Architect

SAS-Austria

Gerhardsvolbasascom

httpwwwsascommunityorgwikiGerhard_Svolba

LinkedIn ndash XING ndash PictureBlog

Data Quality for Analytics Using SAS

SAS Press 2012httpwwwsascommunityorgwikiData_Quality_for_Analytics

Data Preparation for Analytics Using SAS

SAS Press 2006httpwwwsascommunityorgwikiData_Preparation_for_Analytics

Kontaktinformationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 1VERWENDEN SIE SAS FUumlR

SIMULATIONS-STUDIEN

bull SAS Datastep fuumlr die Simulation von Daten aus univariaten und unkorrelierten

multivariaten Verteilungen

bull SASregIML fuumlr die Simulation von Daten aus vielen Verteilungen zB

korrelierten multivariaten Verteilungen Definition neuer Funktionen fuumlr das

Erzeugen von Verteilungen die in SAS nicht vorhanden sind

bull SASregSTAT und SASregETS Procedures (SIMNORMAL SIM2D COPULA) zur

Simulation von Daten mit speziellen Eigenschaften

bull Simulationsmoumlglichkeiten in SAS die in diesem Vortrag nicht behandelt werden

bull SAS Simulation Studio (OR) fuumlr die Simulation von diskreten Ereignissen

bull Proc MCMC (STAT) Markov-Chain Monte Carlo Procedure zum Schaumltzen Bayesianischer Modelle

bull Proc Risk und SAS Risk Management zur Simulation von Risiko Parametern

bull Proc Model (ETS) Monte Carlo Simulation von Zeitreihenmodellen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 1

BEISPIEL SIMULATION DER KONSEQUENZ

SCHLECHTER DATENQUALITAumlT AUF DIE

MODELLGUumlTE

bull Verschachtelte

Datastep Schleifen

bull Datenmanagement

Anweisungen

bull Analytic

Procedures

bull Aggregationen

Auswertungen

Kombination

unterschiedlicher SAS Tools

(SASregEnterprise Miner

Datastep Code

Macro Code

Auswertungen)

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 2VERWENDEN SIE DIE bdquoNEUENldquo GENERATOREN

FUumlR ZUFALLSZAHLEN

Allgemeines Template fuumlr die Simulation univariater Daten in

einem SAS Datastep

Simulationsparameter

als Macro Variable(n)

Kein SET-Statement

Daten werden erst erzeugt

Zufallszahlen-Generator zur

Erzeugung der Daten

Do-Loop fuumlr die Iterationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 2VERWENDEN SIE DIE bdquoNEUENldquo GENERATOREN

FUumlR ZUFALLSZAHLEN

bull Die bdquoaltenldquo Zufallszahlengeneratoren in SAS Base (RANUNI RANNOR

RANPOI hellip) verwenden einen aumllteren Algorithmus aus den 1970ern

(genauso wie PROBxxx xxxINV)

bull Kein Problem bei kleinen Samples (1000 hellip)

bull Der Mersenne-Twister Algorithmus hat den Vorteil einen extrem langen

Periode (bdquoWann wiederholt sich die Sequenzldquo)

bull Dieser Algorithmus ist in der RAND Funktion in SAS im Einsatz (seit SAS 9)

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 2 BEISPIELE FUumlR DIE bdquoRANDldquo FUNKTION

SAS Datastep

SAS IML

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 3 VERMEIDEN SIE MACRO-LOOPS

Fuumlr jeden Durchlauf

ein eigener Datastep

Einzelberechnung der

Ergebnisse

Append der

Ergebnisse

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 3 VERMEIDEN SIE MACRO-LOOPS

Verschachtelter

Do-Loop

Analyse BY

Simulation

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Codevergleich Berechnung und Haumlufigkeitsgewichtung aller

moumlglichen Ereignis-Kombination einer Projektliste

SAS Datastep SAS IML

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

bull SAS hat auch eine Matrixsprache (SAS IML Software) PROC IML

bull Diese ist voll in das SAS System integriert

bull Verwenden von SAS Datasets Ausgeben von Ergebnissen nach SAS

bull SAS Funktionen SAS Formate hellip

bull SAS IML bietet Matrizen Matrixmultiplikationen Vektoren Skalare

Teilmatrizen Indizes

bull SASregIML bietet auch eine Integration zwischen SAS und

dem R Open Source Project

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Beispiele

bull A+B matrix addition

bull AB matrix multiplication

bull AB element-wise multiplication

bull A[52] Element aus der

5 Zeile 2 Spalte

bull A[13210]

die ersten drei Spalten fuumlr die

2 bis 10 Zeile

bull W = INV(T(x)x)

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Verwendet den Mean

Vektor und die Cov-Matrix

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Ergebnisse des Programm-Codes

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

bull Die RAND Funktion im Datastep ist sehr maumlchtig fuumlr die Simulation von

Daten fuumlr univariate Verteilungen

bull SAS IML ist das Werkzeug der Wahl fuumlr die Simulation von korrelierten Daten

von multivariaten Verteilungen

bull SAS IML beinhaumllt viele built-in Funktionen fuumlr die Simulation unterschiedlicher

univariater und multivariater Verteilungen

bull SAS IML unterstuumltzt auch die Matrix-Berechnungen um Datensamples von

weniger haumlufig verwendeten Verteilungen zu ziehen

bull Hinweis fuumlr den Spezialfall der multivariaten Normalverteilung bietet auch

SAS STAT mit der SIMNORMAL Procedure eine Simulationsmoumlglichkeit

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

In einem Call Center werden die Anrufe in 3 Gruppen

geteilt 50 sind einfache Anfragen 20 sind

spezialisierte Anfragen und 30 sind bdquoharte Faumllleldquo

Die Erfahrungswerte bzgl der Bearbeitsdauer sind in

folgender Tabelle dargestellt

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

bull Rick Wicklin beschreibt in seinem SGF2015 Paper wie Daten aus komplexen

Verteilungen simuliert werden koumlnnen auch wenn diese im Basis-Set der 20

Verteilungen fuumlr RAND Funktion nicht enthalten sind

bull Loumlschen von bestimmten Wertebereichen einer Verteilungen ergibt eine Truncated

Distribution

bull Verschiebung und Skalierung von Zufallsvariablen innerhalb der gleichen

Verteilungsfamilie

bull Anwendung von Transformation um eine Verteilung in eine andere zu transformieren

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 7

BESCHLEUNIGEN SIE IHRE SIMULATIONS-

LAumlUFE DURCH UNTERDRUumlCKUNG VON

OUTPUT

bull Bei der Simulations-Iteration sind wir typischerweise an den erzeugte Daten

im SAS Dataset und weniger an den Ergebnissen im Output-Fenster oder

den Graphiken interessiert

bull Optionen wie NOPRINT oder PLOTS=NONE koumlnnen hier hilfreich sein

bull Weiters

bull Erstellung der Graphiken abschalten ODS GRAPHICS OFF

bull Uumlber ODS alle Ergebnisse unterdruumlcken ODS EXCLUDE ALL

bull Den Tree-View im Results-Fenster nicht befuumlllen ODS RESULTS OFF

bull Die Notes im Log unterdruumlcken OPTIONS NONOTES

bull Rick Wicklin praumlsentiert in seinem Paper bdquoTen Tips for Simulating Data with

SASregrdquo folgende beiden Macros

macro ODSOff() call prior to BY-

group processing

ods graphics off

ods exclude all

ods results off

options nonotes

mend

macro ODSOn() call after BY-group

processing

ods graphics on

ods exclude none

ods results on

options notes

mend

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 8PLANEN SIE IHRE SIMULATIONS-STUDIE

BEVOR SIE STARTEN

bull Starten Sie den Testlauf (Programmverifikation) mit 2-5 Iterationen

bull Starten Sei den Performancetest (Laufzeitermittlung) mit 100 ndash 1000 Iterationen

bull Stellen Sie sicher dass sie ihr Programm vor dem bdquoSubmitldquo speichern

Damit sie notfalls die Session ohne Verluste vollstaumlndig abbrechen koumlnnen

bull Starten Sie mit einem bdquogrobenldquo Grid und verfeinern Sie dort wo Sie mehr Details

benoumltigen

bull ein 20x20 Grid benoumltigt die vierfache Laufzeit eines 10x10 Grids

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 9

NUTZEN SIE DAS WISSEN AUS SAS BLOGS

LITERATUR VON SAS PRESS SAS GLOBAL

FORUMS PAPERS

Do-Loop Blog von Rick Wicklin httpblogssascomcontentiml

Buumlcher von Rick Wicklin

httpsupportsascompublishingauthorswicklinhtml

SASreg for Monte Carlo Studies A Guide

for Quantitative ResearchersXitao Fan PhD

Akos Felsovalyi MS

Stephen A Sivo PhD

Sean C Keenan PhD httpsupportsascompublishingauthorsfelsovalyihtml

httpsupportsascomresourcespapersproceedings15SAS1387-2015pdf

Paper SAS1387-2015 Ten Tips for Simulating Data with

SASreg Rick Wicklin

httpsupportsascomeventssas

globalforumpreviousonlinehtml

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 10

ERWARTEN SIE MEHR NEUES BUCH IN SAS

PRESS bdquoMY FAVOURITE BUSINESS ANALYSES

WITH SASldquo MIT ZWEI SIMLUATIONS-STUDIEN

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

ZUSAMMENFASSUNG

Gerhard Svolba

Analytic Solution Architect

SAS-Austria

Gerhardsvolbasascom

httpwwwsascommunityorgwikiGerhard_Svolba

LinkedIn ndash XING ndash PictureBlog

Data Quality for Analytics Using SAS

SAS Press 2012httpwwwsascommunityorgwikiData_Quality_for_Analytics

Data Preparation for Analytics Using SAS

SAS Press 2006httpwwwsascommunityorgwikiData_Preparation_for_Analytics

Kontaktinformationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 1

BEISPIEL SIMULATION DER KONSEQUENZ

SCHLECHTER DATENQUALITAumlT AUF DIE

MODELLGUumlTE

bull Verschachtelte

Datastep Schleifen

bull Datenmanagement

Anweisungen

bull Analytic

Procedures

bull Aggregationen

Auswertungen

Kombination

unterschiedlicher SAS Tools

(SASregEnterprise Miner

Datastep Code

Macro Code

Auswertungen)

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 2VERWENDEN SIE DIE bdquoNEUENldquo GENERATOREN

FUumlR ZUFALLSZAHLEN

Allgemeines Template fuumlr die Simulation univariater Daten in

einem SAS Datastep

Simulationsparameter

als Macro Variable(n)

Kein SET-Statement

Daten werden erst erzeugt

Zufallszahlen-Generator zur

Erzeugung der Daten

Do-Loop fuumlr die Iterationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 2VERWENDEN SIE DIE bdquoNEUENldquo GENERATOREN

FUumlR ZUFALLSZAHLEN

bull Die bdquoaltenldquo Zufallszahlengeneratoren in SAS Base (RANUNI RANNOR

RANPOI hellip) verwenden einen aumllteren Algorithmus aus den 1970ern

(genauso wie PROBxxx xxxINV)

bull Kein Problem bei kleinen Samples (1000 hellip)

bull Der Mersenne-Twister Algorithmus hat den Vorteil einen extrem langen

Periode (bdquoWann wiederholt sich die Sequenzldquo)

bull Dieser Algorithmus ist in der RAND Funktion in SAS im Einsatz (seit SAS 9)

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 2 BEISPIELE FUumlR DIE bdquoRANDldquo FUNKTION

SAS Datastep

SAS IML

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 3 VERMEIDEN SIE MACRO-LOOPS

Fuumlr jeden Durchlauf

ein eigener Datastep

Einzelberechnung der

Ergebnisse

Append der

Ergebnisse

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 3 VERMEIDEN SIE MACRO-LOOPS

Verschachtelter

Do-Loop

Analyse BY

Simulation

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Codevergleich Berechnung und Haumlufigkeitsgewichtung aller

moumlglichen Ereignis-Kombination einer Projektliste

SAS Datastep SAS IML

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

bull SAS hat auch eine Matrixsprache (SAS IML Software) PROC IML

bull Diese ist voll in das SAS System integriert

bull Verwenden von SAS Datasets Ausgeben von Ergebnissen nach SAS

bull SAS Funktionen SAS Formate hellip

bull SAS IML bietet Matrizen Matrixmultiplikationen Vektoren Skalare

Teilmatrizen Indizes

bull SASregIML bietet auch eine Integration zwischen SAS und

dem R Open Source Project

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Beispiele

bull A+B matrix addition

bull AB matrix multiplication

bull AB element-wise multiplication

bull A[52] Element aus der

5 Zeile 2 Spalte

bull A[13210]

die ersten drei Spalten fuumlr die

2 bis 10 Zeile

bull W = INV(T(x)x)

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Verwendet den Mean

Vektor und die Cov-Matrix

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Ergebnisse des Programm-Codes

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

bull Die RAND Funktion im Datastep ist sehr maumlchtig fuumlr die Simulation von

Daten fuumlr univariate Verteilungen

bull SAS IML ist das Werkzeug der Wahl fuumlr die Simulation von korrelierten Daten

von multivariaten Verteilungen

bull SAS IML beinhaumllt viele built-in Funktionen fuumlr die Simulation unterschiedlicher

univariater und multivariater Verteilungen

bull SAS IML unterstuumltzt auch die Matrix-Berechnungen um Datensamples von

weniger haumlufig verwendeten Verteilungen zu ziehen

bull Hinweis fuumlr den Spezialfall der multivariaten Normalverteilung bietet auch

SAS STAT mit der SIMNORMAL Procedure eine Simulationsmoumlglichkeit

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

In einem Call Center werden die Anrufe in 3 Gruppen

geteilt 50 sind einfache Anfragen 20 sind

spezialisierte Anfragen und 30 sind bdquoharte Faumllleldquo

Die Erfahrungswerte bzgl der Bearbeitsdauer sind in

folgender Tabelle dargestellt

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

bull Rick Wicklin beschreibt in seinem SGF2015 Paper wie Daten aus komplexen

Verteilungen simuliert werden koumlnnen auch wenn diese im Basis-Set der 20

Verteilungen fuumlr RAND Funktion nicht enthalten sind

bull Loumlschen von bestimmten Wertebereichen einer Verteilungen ergibt eine Truncated

Distribution

bull Verschiebung und Skalierung von Zufallsvariablen innerhalb der gleichen

Verteilungsfamilie

bull Anwendung von Transformation um eine Verteilung in eine andere zu transformieren

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 7

BESCHLEUNIGEN SIE IHRE SIMULATIONS-

LAumlUFE DURCH UNTERDRUumlCKUNG VON

OUTPUT

bull Bei der Simulations-Iteration sind wir typischerweise an den erzeugte Daten

im SAS Dataset und weniger an den Ergebnissen im Output-Fenster oder

den Graphiken interessiert

bull Optionen wie NOPRINT oder PLOTS=NONE koumlnnen hier hilfreich sein

bull Weiters

bull Erstellung der Graphiken abschalten ODS GRAPHICS OFF

bull Uumlber ODS alle Ergebnisse unterdruumlcken ODS EXCLUDE ALL

bull Den Tree-View im Results-Fenster nicht befuumlllen ODS RESULTS OFF

bull Die Notes im Log unterdruumlcken OPTIONS NONOTES

bull Rick Wicklin praumlsentiert in seinem Paper bdquoTen Tips for Simulating Data with

SASregrdquo folgende beiden Macros

macro ODSOff() call prior to BY-

group processing

ods graphics off

ods exclude all

ods results off

options nonotes

mend

macro ODSOn() call after BY-group

processing

ods graphics on

ods exclude none

ods results on

options notes

mend

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 8PLANEN SIE IHRE SIMULATIONS-STUDIE

BEVOR SIE STARTEN

bull Starten Sie den Testlauf (Programmverifikation) mit 2-5 Iterationen

bull Starten Sei den Performancetest (Laufzeitermittlung) mit 100 ndash 1000 Iterationen

bull Stellen Sie sicher dass sie ihr Programm vor dem bdquoSubmitldquo speichern

Damit sie notfalls die Session ohne Verluste vollstaumlndig abbrechen koumlnnen

bull Starten Sie mit einem bdquogrobenldquo Grid und verfeinern Sie dort wo Sie mehr Details

benoumltigen

bull ein 20x20 Grid benoumltigt die vierfache Laufzeit eines 10x10 Grids

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 9

NUTZEN SIE DAS WISSEN AUS SAS BLOGS

LITERATUR VON SAS PRESS SAS GLOBAL

FORUMS PAPERS

Do-Loop Blog von Rick Wicklin httpblogssascomcontentiml

Buumlcher von Rick Wicklin

httpsupportsascompublishingauthorswicklinhtml

SASreg for Monte Carlo Studies A Guide

for Quantitative ResearchersXitao Fan PhD

Akos Felsovalyi MS

Stephen A Sivo PhD

Sean C Keenan PhD httpsupportsascompublishingauthorsfelsovalyihtml

httpsupportsascomresourcespapersproceedings15SAS1387-2015pdf

Paper SAS1387-2015 Ten Tips for Simulating Data with

SASreg Rick Wicklin

httpsupportsascomeventssas

globalforumpreviousonlinehtml

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 10

ERWARTEN SIE MEHR NEUES BUCH IN SAS

PRESS bdquoMY FAVOURITE BUSINESS ANALYSES

WITH SASldquo MIT ZWEI SIMLUATIONS-STUDIEN

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

ZUSAMMENFASSUNG

Gerhard Svolba

Analytic Solution Architect

SAS-Austria

Gerhardsvolbasascom

httpwwwsascommunityorgwikiGerhard_Svolba

LinkedIn ndash XING ndash PictureBlog

Data Quality for Analytics Using SAS

SAS Press 2012httpwwwsascommunityorgwikiData_Quality_for_Analytics

Data Preparation for Analytics Using SAS

SAS Press 2006httpwwwsascommunityorgwikiData_Preparation_for_Analytics

Kontaktinformationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 2VERWENDEN SIE DIE bdquoNEUENldquo GENERATOREN

FUumlR ZUFALLSZAHLEN

Allgemeines Template fuumlr die Simulation univariater Daten in

einem SAS Datastep

Simulationsparameter

als Macro Variable(n)

Kein SET-Statement

Daten werden erst erzeugt

Zufallszahlen-Generator zur

Erzeugung der Daten

Do-Loop fuumlr die Iterationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 2VERWENDEN SIE DIE bdquoNEUENldquo GENERATOREN

FUumlR ZUFALLSZAHLEN

bull Die bdquoaltenldquo Zufallszahlengeneratoren in SAS Base (RANUNI RANNOR

RANPOI hellip) verwenden einen aumllteren Algorithmus aus den 1970ern

(genauso wie PROBxxx xxxINV)

bull Kein Problem bei kleinen Samples (1000 hellip)

bull Der Mersenne-Twister Algorithmus hat den Vorteil einen extrem langen

Periode (bdquoWann wiederholt sich die Sequenzldquo)

bull Dieser Algorithmus ist in der RAND Funktion in SAS im Einsatz (seit SAS 9)

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 2 BEISPIELE FUumlR DIE bdquoRANDldquo FUNKTION

SAS Datastep

SAS IML

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 3 VERMEIDEN SIE MACRO-LOOPS

Fuumlr jeden Durchlauf

ein eigener Datastep

Einzelberechnung der

Ergebnisse

Append der

Ergebnisse

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 3 VERMEIDEN SIE MACRO-LOOPS

Verschachtelter

Do-Loop

Analyse BY

Simulation

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Codevergleich Berechnung und Haumlufigkeitsgewichtung aller

moumlglichen Ereignis-Kombination einer Projektliste

SAS Datastep SAS IML

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

bull SAS hat auch eine Matrixsprache (SAS IML Software) PROC IML

bull Diese ist voll in das SAS System integriert

bull Verwenden von SAS Datasets Ausgeben von Ergebnissen nach SAS

bull SAS Funktionen SAS Formate hellip

bull SAS IML bietet Matrizen Matrixmultiplikationen Vektoren Skalare

Teilmatrizen Indizes

bull SASregIML bietet auch eine Integration zwischen SAS und

dem R Open Source Project

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Beispiele

bull A+B matrix addition

bull AB matrix multiplication

bull AB element-wise multiplication

bull A[52] Element aus der

5 Zeile 2 Spalte

bull A[13210]

die ersten drei Spalten fuumlr die

2 bis 10 Zeile

bull W = INV(T(x)x)

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Verwendet den Mean

Vektor und die Cov-Matrix

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Ergebnisse des Programm-Codes

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

bull Die RAND Funktion im Datastep ist sehr maumlchtig fuumlr die Simulation von

Daten fuumlr univariate Verteilungen

bull SAS IML ist das Werkzeug der Wahl fuumlr die Simulation von korrelierten Daten

von multivariaten Verteilungen

bull SAS IML beinhaumllt viele built-in Funktionen fuumlr die Simulation unterschiedlicher

univariater und multivariater Verteilungen

bull SAS IML unterstuumltzt auch die Matrix-Berechnungen um Datensamples von

weniger haumlufig verwendeten Verteilungen zu ziehen

bull Hinweis fuumlr den Spezialfall der multivariaten Normalverteilung bietet auch

SAS STAT mit der SIMNORMAL Procedure eine Simulationsmoumlglichkeit

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

In einem Call Center werden die Anrufe in 3 Gruppen

geteilt 50 sind einfache Anfragen 20 sind

spezialisierte Anfragen und 30 sind bdquoharte Faumllleldquo

Die Erfahrungswerte bzgl der Bearbeitsdauer sind in

folgender Tabelle dargestellt

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

bull Rick Wicklin beschreibt in seinem SGF2015 Paper wie Daten aus komplexen

Verteilungen simuliert werden koumlnnen auch wenn diese im Basis-Set der 20

Verteilungen fuumlr RAND Funktion nicht enthalten sind

bull Loumlschen von bestimmten Wertebereichen einer Verteilungen ergibt eine Truncated

Distribution

bull Verschiebung und Skalierung von Zufallsvariablen innerhalb der gleichen

Verteilungsfamilie

bull Anwendung von Transformation um eine Verteilung in eine andere zu transformieren

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 7

BESCHLEUNIGEN SIE IHRE SIMULATIONS-

LAumlUFE DURCH UNTERDRUumlCKUNG VON

OUTPUT

bull Bei der Simulations-Iteration sind wir typischerweise an den erzeugte Daten

im SAS Dataset und weniger an den Ergebnissen im Output-Fenster oder

den Graphiken interessiert

bull Optionen wie NOPRINT oder PLOTS=NONE koumlnnen hier hilfreich sein

bull Weiters

bull Erstellung der Graphiken abschalten ODS GRAPHICS OFF

bull Uumlber ODS alle Ergebnisse unterdruumlcken ODS EXCLUDE ALL

bull Den Tree-View im Results-Fenster nicht befuumlllen ODS RESULTS OFF

bull Die Notes im Log unterdruumlcken OPTIONS NONOTES

bull Rick Wicklin praumlsentiert in seinem Paper bdquoTen Tips for Simulating Data with

SASregrdquo folgende beiden Macros

macro ODSOff() call prior to BY-

group processing

ods graphics off

ods exclude all

ods results off

options nonotes

mend

macro ODSOn() call after BY-group

processing

ods graphics on

ods exclude none

ods results on

options notes

mend

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 8PLANEN SIE IHRE SIMULATIONS-STUDIE

BEVOR SIE STARTEN

bull Starten Sie den Testlauf (Programmverifikation) mit 2-5 Iterationen

bull Starten Sei den Performancetest (Laufzeitermittlung) mit 100 ndash 1000 Iterationen

bull Stellen Sie sicher dass sie ihr Programm vor dem bdquoSubmitldquo speichern

Damit sie notfalls die Session ohne Verluste vollstaumlndig abbrechen koumlnnen

bull Starten Sie mit einem bdquogrobenldquo Grid und verfeinern Sie dort wo Sie mehr Details

benoumltigen

bull ein 20x20 Grid benoumltigt die vierfache Laufzeit eines 10x10 Grids

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 9

NUTZEN SIE DAS WISSEN AUS SAS BLOGS

LITERATUR VON SAS PRESS SAS GLOBAL

FORUMS PAPERS

Do-Loop Blog von Rick Wicklin httpblogssascomcontentiml

Buumlcher von Rick Wicklin

httpsupportsascompublishingauthorswicklinhtml

SASreg for Monte Carlo Studies A Guide

for Quantitative ResearchersXitao Fan PhD

Akos Felsovalyi MS

Stephen A Sivo PhD

Sean C Keenan PhD httpsupportsascompublishingauthorsfelsovalyihtml

httpsupportsascomresourcespapersproceedings15SAS1387-2015pdf

Paper SAS1387-2015 Ten Tips for Simulating Data with

SASreg Rick Wicklin

httpsupportsascomeventssas

globalforumpreviousonlinehtml

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 10

ERWARTEN SIE MEHR NEUES BUCH IN SAS

PRESS bdquoMY FAVOURITE BUSINESS ANALYSES

WITH SASldquo MIT ZWEI SIMLUATIONS-STUDIEN

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

ZUSAMMENFASSUNG

Gerhard Svolba

Analytic Solution Architect

SAS-Austria

Gerhardsvolbasascom

httpwwwsascommunityorgwikiGerhard_Svolba

LinkedIn ndash XING ndash PictureBlog

Data Quality for Analytics Using SAS

SAS Press 2012httpwwwsascommunityorgwikiData_Quality_for_Analytics

Data Preparation for Analytics Using SAS

SAS Press 2006httpwwwsascommunityorgwikiData_Preparation_for_Analytics

Kontaktinformationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 2VERWENDEN SIE DIE bdquoNEUENldquo GENERATOREN

FUumlR ZUFALLSZAHLEN

bull Die bdquoaltenldquo Zufallszahlengeneratoren in SAS Base (RANUNI RANNOR

RANPOI hellip) verwenden einen aumllteren Algorithmus aus den 1970ern

(genauso wie PROBxxx xxxINV)

bull Kein Problem bei kleinen Samples (1000 hellip)

bull Der Mersenne-Twister Algorithmus hat den Vorteil einen extrem langen

Periode (bdquoWann wiederholt sich die Sequenzldquo)

bull Dieser Algorithmus ist in der RAND Funktion in SAS im Einsatz (seit SAS 9)

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 2 BEISPIELE FUumlR DIE bdquoRANDldquo FUNKTION

SAS Datastep

SAS IML

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 3 VERMEIDEN SIE MACRO-LOOPS

Fuumlr jeden Durchlauf

ein eigener Datastep

Einzelberechnung der

Ergebnisse

Append der

Ergebnisse

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 3 VERMEIDEN SIE MACRO-LOOPS

Verschachtelter

Do-Loop

Analyse BY

Simulation

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Codevergleich Berechnung und Haumlufigkeitsgewichtung aller

moumlglichen Ereignis-Kombination einer Projektliste

SAS Datastep SAS IML

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

bull SAS hat auch eine Matrixsprache (SAS IML Software) PROC IML

bull Diese ist voll in das SAS System integriert

bull Verwenden von SAS Datasets Ausgeben von Ergebnissen nach SAS

bull SAS Funktionen SAS Formate hellip

bull SAS IML bietet Matrizen Matrixmultiplikationen Vektoren Skalare

Teilmatrizen Indizes

bull SASregIML bietet auch eine Integration zwischen SAS und

dem R Open Source Project

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Beispiele

bull A+B matrix addition

bull AB matrix multiplication

bull AB element-wise multiplication

bull A[52] Element aus der

5 Zeile 2 Spalte

bull A[13210]

die ersten drei Spalten fuumlr die

2 bis 10 Zeile

bull W = INV(T(x)x)

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Verwendet den Mean

Vektor und die Cov-Matrix

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Ergebnisse des Programm-Codes

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

bull Die RAND Funktion im Datastep ist sehr maumlchtig fuumlr die Simulation von

Daten fuumlr univariate Verteilungen

bull SAS IML ist das Werkzeug der Wahl fuumlr die Simulation von korrelierten Daten

von multivariaten Verteilungen

bull SAS IML beinhaumllt viele built-in Funktionen fuumlr die Simulation unterschiedlicher

univariater und multivariater Verteilungen

bull SAS IML unterstuumltzt auch die Matrix-Berechnungen um Datensamples von

weniger haumlufig verwendeten Verteilungen zu ziehen

bull Hinweis fuumlr den Spezialfall der multivariaten Normalverteilung bietet auch

SAS STAT mit der SIMNORMAL Procedure eine Simulationsmoumlglichkeit

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

In einem Call Center werden die Anrufe in 3 Gruppen

geteilt 50 sind einfache Anfragen 20 sind

spezialisierte Anfragen und 30 sind bdquoharte Faumllleldquo

Die Erfahrungswerte bzgl der Bearbeitsdauer sind in

folgender Tabelle dargestellt

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

bull Rick Wicklin beschreibt in seinem SGF2015 Paper wie Daten aus komplexen

Verteilungen simuliert werden koumlnnen auch wenn diese im Basis-Set der 20

Verteilungen fuumlr RAND Funktion nicht enthalten sind

bull Loumlschen von bestimmten Wertebereichen einer Verteilungen ergibt eine Truncated

Distribution

bull Verschiebung und Skalierung von Zufallsvariablen innerhalb der gleichen

Verteilungsfamilie

bull Anwendung von Transformation um eine Verteilung in eine andere zu transformieren

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 7

BESCHLEUNIGEN SIE IHRE SIMULATIONS-

LAumlUFE DURCH UNTERDRUumlCKUNG VON

OUTPUT

bull Bei der Simulations-Iteration sind wir typischerweise an den erzeugte Daten

im SAS Dataset und weniger an den Ergebnissen im Output-Fenster oder

den Graphiken interessiert

bull Optionen wie NOPRINT oder PLOTS=NONE koumlnnen hier hilfreich sein

bull Weiters

bull Erstellung der Graphiken abschalten ODS GRAPHICS OFF

bull Uumlber ODS alle Ergebnisse unterdruumlcken ODS EXCLUDE ALL

bull Den Tree-View im Results-Fenster nicht befuumlllen ODS RESULTS OFF

bull Die Notes im Log unterdruumlcken OPTIONS NONOTES

bull Rick Wicklin praumlsentiert in seinem Paper bdquoTen Tips for Simulating Data with

SASregrdquo folgende beiden Macros

macro ODSOff() call prior to BY-

group processing

ods graphics off

ods exclude all

ods results off

options nonotes

mend

macro ODSOn() call after BY-group

processing

ods graphics on

ods exclude none

ods results on

options notes

mend

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 8PLANEN SIE IHRE SIMULATIONS-STUDIE

BEVOR SIE STARTEN

bull Starten Sie den Testlauf (Programmverifikation) mit 2-5 Iterationen

bull Starten Sei den Performancetest (Laufzeitermittlung) mit 100 ndash 1000 Iterationen

bull Stellen Sie sicher dass sie ihr Programm vor dem bdquoSubmitldquo speichern

Damit sie notfalls die Session ohne Verluste vollstaumlndig abbrechen koumlnnen

bull Starten Sie mit einem bdquogrobenldquo Grid und verfeinern Sie dort wo Sie mehr Details

benoumltigen

bull ein 20x20 Grid benoumltigt die vierfache Laufzeit eines 10x10 Grids

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 9

NUTZEN SIE DAS WISSEN AUS SAS BLOGS

LITERATUR VON SAS PRESS SAS GLOBAL

FORUMS PAPERS

Do-Loop Blog von Rick Wicklin httpblogssascomcontentiml

Buumlcher von Rick Wicklin

httpsupportsascompublishingauthorswicklinhtml

SASreg for Monte Carlo Studies A Guide

for Quantitative ResearchersXitao Fan PhD

Akos Felsovalyi MS

Stephen A Sivo PhD

Sean C Keenan PhD httpsupportsascompublishingauthorsfelsovalyihtml

httpsupportsascomresourcespapersproceedings15SAS1387-2015pdf

Paper SAS1387-2015 Ten Tips for Simulating Data with

SASreg Rick Wicklin

httpsupportsascomeventssas

globalforumpreviousonlinehtml

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 10

ERWARTEN SIE MEHR NEUES BUCH IN SAS

PRESS bdquoMY FAVOURITE BUSINESS ANALYSES

WITH SASldquo MIT ZWEI SIMLUATIONS-STUDIEN

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

ZUSAMMENFASSUNG

Gerhard Svolba

Analytic Solution Architect

SAS-Austria

Gerhardsvolbasascom

httpwwwsascommunityorgwikiGerhard_Svolba

LinkedIn ndash XING ndash PictureBlog

Data Quality for Analytics Using SAS

SAS Press 2012httpwwwsascommunityorgwikiData_Quality_for_Analytics

Data Preparation for Analytics Using SAS

SAS Press 2006httpwwwsascommunityorgwikiData_Preparation_for_Analytics

Kontaktinformationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 2 BEISPIELE FUumlR DIE bdquoRANDldquo FUNKTION

SAS Datastep

SAS IML

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 3 VERMEIDEN SIE MACRO-LOOPS

Fuumlr jeden Durchlauf

ein eigener Datastep

Einzelberechnung der

Ergebnisse

Append der

Ergebnisse

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 3 VERMEIDEN SIE MACRO-LOOPS

Verschachtelter

Do-Loop

Analyse BY

Simulation

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Codevergleich Berechnung und Haumlufigkeitsgewichtung aller

moumlglichen Ereignis-Kombination einer Projektliste

SAS Datastep SAS IML

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

bull SAS hat auch eine Matrixsprache (SAS IML Software) PROC IML

bull Diese ist voll in das SAS System integriert

bull Verwenden von SAS Datasets Ausgeben von Ergebnissen nach SAS

bull SAS Funktionen SAS Formate hellip

bull SAS IML bietet Matrizen Matrixmultiplikationen Vektoren Skalare

Teilmatrizen Indizes

bull SASregIML bietet auch eine Integration zwischen SAS und

dem R Open Source Project

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Beispiele

bull A+B matrix addition

bull AB matrix multiplication

bull AB element-wise multiplication

bull A[52] Element aus der

5 Zeile 2 Spalte

bull A[13210]

die ersten drei Spalten fuumlr die

2 bis 10 Zeile

bull W = INV(T(x)x)

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Verwendet den Mean

Vektor und die Cov-Matrix

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Ergebnisse des Programm-Codes

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

bull Die RAND Funktion im Datastep ist sehr maumlchtig fuumlr die Simulation von

Daten fuumlr univariate Verteilungen

bull SAS IML ist das Werkzeug der Wahl fuumlr die Simulation von korrelierten Daten

von multivariaten Verteilungen

bull SAS IML beinhaumllt viele built-in Funktionen fuumlr die Simulation unterschiedlicher

univariater und multivariater Verteilungen

bull SAS IML unterstuumltzt auch die Matrix-Berechnungen um Datensamples von

weniger haumlufig verwendeten Verteilungen zu ziehen

bull Hinweis fuumlr den Spezialfall der multivariaten Normalverteilung bietet auch

SAS STAT mit der SIMNORMAL Procedure eine Simulationsmoumlglichkeit

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

In einem Call Center werden die Anrufe in 3 Gruppen

geteilt 50 sind einfache Anfragen 20 sind

spezialisierte Anfragen und 30 sind bdquoharte Faumllleldquo

Die Erfahrungswerte bzgl der Bearbeitsdauer sind in

folgender Tabelle dargestellt

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

bull Rick Wicklin beschreibt in seinem SGF2015 Paper wie Daten aus komplexen

Verteilungen simuliert werden koumlnnen auch wenn diese im Basis-Set der 20

Verteilungen fuumlr RAND Funktion nicht enthalten sind

bull Loumlschen von bestimmten Wertebereichen einer Verteilungen ergibt eine Truncated

Distribution

bull Verschiebung und Skalierung von Zufallsvariablen innerhalb der gleichen

Verteilungsfamilie

bull Anwendung von Transformation um eine Verteilung in eine andere zu transformieren

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 7

BESCHLEUNIGEN SIE IHRE SIMULATIONS-

LAumlUFE DURCH UNTERDRUumlCKUNG VON

OUTPUT

bull Bei der Simulations-Iteration sind wir typischerweise an den erzeugte Daten

im SAS Dataset und weniger an den Ergebnissen im Output-Fenster oder

den Graphiken interessiert

bull Optionen wie NOPRINT oder PLOTS=NONE koumlnnen hier hilfreich sein

bull Weiters

bull Erstellung der Graphiken abschalten ODS GRAPHICS OFF

bull Uumlber ODS alle Ergebnisse unterdruumlcken ODS EXCLUDE ALL

bull Den Tree-View im Results-Fenster nicht befuumlllen ODS RESULTS OFF

bull Die Notes im Log unterdruumlcken OPTIONS NONOTES

bull Rick Wicklin praumlsentiert in seinem Paper bdquoTen Tips for Simulating Data with

SASregrdquo folgende beiden Macros

macro ODSOff() call prior to BY-

group processing

ods graphics off

ods exclude all

ods results off

options nonotes

mend

macro ODSOn() call after BY-group

processing

ods graphics on

ods exclude none

ods results on

options notes

mend

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 8PLANEN SIE IHRE SIMULATIONS-STUDIE

BEVOR SIE STARTEN

bull Starten Sie den Testlauf (Programmverifikation) mit 2-5 Iterationen

bull Starten Sei den Performancetest (Laufzeitermittlung) mit 100 ndash 1000 Iterationen

bull Stellen Sie sicher dass sie ihr Programm vor dem bdquoSubmitldquo speichern

Damit sie notfalls die Session ohne Verluste vollstaumlndig abbrechen koumlnnen

bull Starten Sie mit einem bdquogrobenldquo Grid und verfeinern Sie dort wo Sie mehr Details

benoumltigen

bull ein 20x20 Grid benoumltigt die vierfache Laufzeit eines 10x10 Grids

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 9

NUTZEN SIE DAS WISSEN AUS SAS BLOGS

LITERATUR VON SAS PRESS SAS GLOBAL

FORUMS PAPERS

Do-Loop Blog von Rick Wicklin httpblogssascomcontentiml

Buumlcher von Rick Wicklin

httpsupportsascompublishingauthorswicklinhtml

SASreg for Monte Carlo Studies A Guide

for Quantitative ResearchersXitao Fan PhD

Akos Felsovalyi MS

Stephen A Sivo PhD

Sean C Keenan PhD httpsupportsascompublishingauthorsfelsovalyihtml

httpsupportsascomresourcespapersproceedings15SAS1387-2015pdf

Paper SAS1387-2015 Ten Tips for Simulating Data with

SASreg Rick Wicklin

httpsupportsascomeventssas

globalforumpreviousonlinehtml

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 10

ERWARTEN SIE MEHR NEUES BUCH IN SAS

PRESS bdquoMY FAVOURITE BUSINESS ANALYSES

WITH SASldquo MIT ZWEI SIMLUATIONS-STUDIEN

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

ZUSAMMENFASSUNG

Gerhard Svolba

Analytic Solution Architect

SAS-Austria

Gerhardsvolbasascom

httpwwwsascommunityorgwikiGerhard_Svolba

LinkedIn ndash XING ndash PictureBlog

Data Quality for Analytics Using SAS

SAS Press 2012httpwwwsascommunityorgwikiData_Quality_for_Analytics

Data Preparation for Analytics Using SAS

SAS Press 2006httpwwwsascommunityorgwikiData_Preparation_for_Analytics

Kontaktinformationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 3 VERMEIDEN SIE MACRO-LOOPS

Fuumlr jeden Durchlauf

ein eigener Datastep

Einzelberechnung der

Ergebnisse

Append der

Ergebnisse

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 3 VERMEIDEN SIE MACRO-LOOPS

Verschachtelter

Do-Loop

Analyse BY

Simulation

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Codevergleich Berechnung und Haumlufigkeitsgewichtung aller

moumlglichen Ereignis-Kombination einer Projektliste

SAS Datastep SAS IML

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

bull SAS hat auch eine Matrixsprache (SAS IML Software) PROC IML

bull Diese ist voll in das SAS System integriert

bull Verwenden von SAS Datasets Ausgeben von Ergebnissen nach SAS

bull SAS Funktionen SAS Formate hellip

bull SAS IML bietet Matrizen Matrixmultiplikationen Vektoren Skalare

Teilmatrizen Indizes

bull SASregIML bietet auch eine Integration zwischen SAS und

dem R Open Source Project

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Beispiele

bull A+B matrix addition

bull AB matrix multiplication

bull AB element-wise multiplication

bull A[52] Element aus der

5 Zeile 2 Spalte

bull A[13210]

die ersten drei Spalten fuumlr die

2 bis 10 Zeile

bull W = INV(T(x)x)

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Verwendet den Mean

Vektor und die Cov-Matrix

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Ergebnisse des Programm-Codes

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

bull Die RAND Funktion im Datastep ist sehr maumlchtig fuumlr die Simulation von

Daten fuumlr univariate Verteilungen

bull SAS IML ist das Werkzeug der Wahl fuumlr die Simulation von korrelierten Daten

von multivariaten Verteilungen

bull SAS IML beinhaumllt viele built-in Funktionen fuumlr die Simulation unterschiedlicher

univariater und multivariater Verteilungen

bull SAS IML unterstuumltzt auch die Matrix-Berechnungen um Datensamples von

weniger haumlufig verwendeten Verteilungen zu ziehen

bull Hinweis fuumlr den Spezialfall der multivariaten Normalverteilung bietet auch

SAS STAT mit der SIMNORMAL Procedure eine Simulationsmoumlglichkeit

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

In einem Call Center werden die Anrufe in 3 Gruppen

geteilt 50 sind einfache Anfragen 20 sind

spezialisierte Anfragen und 30 sind bdquoharte Faumllleldquo

Die Erfahrungswerte bzgl der Bearbeitsdauer sind in

folgender Tabelle dargestellt

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

bull Rick Wicklin beschreibt in seinem SGF2015 Paper wie Daten aus komplexen

Verteilungen simuliert werden koumlnnen auch wenn diese im Basis-Set der 20

Verteilungen fuumlr RAND Funktion nicht enthalten sind

bull Loumlschen von bestimmten Wertebereichen einer Verteilungen ergibt eine Truncated

Distribution

bull Verschiebung und Skalierung von Zufallsvariablen innerhalb der gleichen

Verteilungsfamilie

bull Anwendung von Transformation um eine Verteilung in eine andere zu transformieren

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 7

BESCHLEUNIGEN SIE IHRE SIMULATIONS-

LAumlUFE DURCH UNTERDRUumlCKUNG VON

OUTPUT

bull Bei der Simulations-Iteration sind wir typischerweise an den erzeugte Daten

im SAS Dataset und weniger an den Ergebnissen im Output-Fenster oder

den Graphiken interessiert

bull Optionen wie NOPRINT oder PLOTS=NONE koumlnnen hier hilfreich sein

bull Weiters

bull Erstellung der Graphiken abschalten ODS GRAPHICS OFF

bull Uumlber ODS alle Ergebnisse unterdruumlcken ODS EXCLUDE ALL

bull Den Tree-View im Results-Fenster nicht befuumlllen ODS RESULTS OFF

bull Die Notes im Log unterdruumlcken OPTIONS NONOTES

bull Rick Wicklin praumlsentiert in seinem Paper bdquoTen Tips for Simulating Data with

SASregrdquo folgende beiden Macros

macro ODSOff() call prior to BY-

group processing

ods graphics off

ods exclude all

ods results off

options nonotes

mend

macro ODSOn() call after BY-group

processing

ods graphics on

ods exclude none

ods results on

options notes

mend

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 8PLANEN SIE IHRE SIMULATIONS-STUDIE

BEVOR SIE STARTEN

bull Starten Sie den Testlauf (Programmverifikation) mit 2-5 Iterationen

bull Starten Sei den Performancetest (Laufzeitermittlung) mit 100 ndash 1000 Iterationen

bull Stellen Sie sicher dass sie ihr Programm vor dem bdquoSubmitldquo speichern

Damit sie notfalls die Session ohne Verluste vollstaumlndig abbrechen koumlnnen

bull Starten Sie mit einem bdquogrobenldquo Grid und verfeinern Sie dort wo Sie mehr Details

benoumltigen

bull ein 20x20 Grid benoumltigt die vierfache Laufzeit eines 10x10 Grids

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 9

NUTZEN SIE DAS WISSEN AUS SAS BLOGS

LITERATUR VON SAS PRESS SAS GLOBAL

FORUMS PAPERS

Do-Loop Blog von Rick Wicklin httpblogssascomcontentiml

Buumlcher von Rick Wicklin

httpsupportsascompublishingauthorswicklinhtml

SASreg for Monte Carlo Studies A Guide

for Quantitative ResearchersXitao Fan PhD

Akos Felsovalyi MS

Stephen A Sivo PhD

Sean C Keenan PhD httpsupportsascompublishingauthorsfelsovalyihtml

httpsupportsascomresourcespapersproceedings15SAS1387-2015pdf

Paper SAS1387-2015 Ten Tips for Simulating Data with

SASreg Rick Wicklin

httpsupportsascomeventssas

globalforumpreviousonlinehtml

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 10

ERWARTEN SIE MEHR NEUES BUCH IN SAS

PRESS bdquoMY FAVOURITE BUSINESS ANALYSES

WITH SASldquo MIT ZWEI SIMLUATIONS-STUDIEN

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

ZUSAMMENFASSUNG

Gerhard Svolba

Analytic Solution Architect

SAS-Austria

Gerhardsvolbasascom

httpwwwsascommunityorgwikiGerhard_Svolba

LinkedIn ndash XING ndash PictureBlog

Data Quality for Analytics Using SAS

SAS Press 2012httpwwwsascommunityorgwikiData_Quality_for_Analytics

Data Preparation for Analytics Using SAS

SAS Press 2006httpwwwsascommunityorgwikiData_Preparation_for_Analytics

Kontaktinformationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 3 VERMEIDEN SIE MACRO-LOOPS

Verschachtelter

Do-Loop

Analyse BY

Simulation

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Codevergleich Berechnung und Haumlufigkeitsgewichtung aller

moumlglichen Ereignis-Kombination einer Projektliste

SAS Datastep SAS IML

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

bull SAS hat auch eine Matrixsprache (SAS IML Software) PROC IML

bull Diese ist voll in das SAS System integriert

bull Verwenden von SAS Datasets Ausgeben von Ergebnissen nach SAS

bull SAS Funktionen SAS Formate hellip

bull SAS IML bietet Matrizen Matrixmultiplikationen Vektoren Skalare

Teilmatrizen Indizes

bull SASregIML bietet auch eine Integration zwischen SAS und

dem R Open Source Project

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Beispiele

bull A+B matrix addition

bull AB matrix multiplication

bull AB element-wise multiplication

bull A[52] Element aus der

5 Zeile 2 Spalte

bull A[13210]

die ersten drei Spalten fuumlr die

2 bis 10 Zeile

bull W = INV(T(x)x)

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Verwendet den Mean

Vektor und die Cov-Matrix

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Ergebnisse des Programm-Codes

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

bull Die RAND Funktion im Datastep ist sehr maumlchtig fuumlr die Simulation von

Daten fuumlr univariate Verteilungen

bull SAS IML ist das Werkzeug der Wahl fuumlr die Simulation von korrelierten Daten

von multivariaten Verteilungen

bull SAS IML beinhaumllt viele built-in Funktionen fuumlr die Simulation unterschiedlicher

univariater und multivariater Verteilungen

bull SAS IML unterstuumltzt auch die Matrix-Berechnungen um Datensamples von

weniger haumlufig verwendeten Verteilungen zu ziehen

bull Hinweis fuumlr den Spezialfall der multivariaten Normalverteilung bietet auch

SAS STAT mit der SIMNORMAL Procedure eine Simulationsmoumlglichkeit

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

In einem Call Center werden die Anrufe in 3 Gruppen

geteilt 50 sind einfache Anfragen 20 sind

spezialisierte Anfragen und 30 sind bdquoharte Faumllleldquo

Die Erfahrungswerte bzgl der Bearbeitsdauer sind in

folgender Tabelle dargestellt

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

bull Rick Wicklin beschreibt in seinem SGF2015 Paper wie Daten aus komplexen

Verteilungen simuliert werden koumlnnen auch wenn diese im Basis-Set der 20

Verteilungen fuumlr RAND Funktion nicht enthalten sind

bull Loumlschen von bestimmten Wertebereichen einer Verteilungen ergibt eine Truncated

Distribution

bull Verschiebung und Skalierung von Zufallsvariablen innerhalb der gleichen

Verteilungsfamilie

bull Anwendung von Transformation um eine Verteilung in eine andere zu transformieren

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 7

BESCHLEUNIGEN SIE IHRE SIMULATIONS-

LAumlUFE DURCH UNTERDRUumlCKUNG VON

OUTPUT

bull Bei der Simulations-Iteration sind wir typischerweise an den erzeugte Daten

im SAS Dataset und weniger an den Ergebnissen im Output-Fenster oder

den Graphiken interessiert

bull Optionen wie NOPRINT oder PLOTS=NONE koumlnnen hier hilfreich sein

bull Weiters

bull Erstellung der Graphiken abschalten ODS GRAPHICS OFF

bull Uumlber ODS alle Ergebnisse unterdruumlcken ODS EXCLUDE ALL

bull Den Tree-View im Results-Fenster nicht befuumlllen ODS RESULTS OFF

bull Die Notes im Log unterdruumlcken OPTIONS NONOTES

bull Rick Wicklin praumlsentiert in seinem Paper bdquoTen Tips for Simulating Data with

SASregrdquo folgende beiden Macros

macro ODSOff() call prior to BY-

group processing

ods graphics off

ods exclude all

ods results off

options nonotes

mend

macro ODSOn() call after BY-group

processing

ods graphics on

ods exclude none

ods results on

options notes

mend

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 8PLANEN SIE IHRE SIMULATIONS-STUDIE

BEVOR SIE STARTEN

bull Starten Sie den Testlauf (Programmverifikation) mit 2-5 Iterationen

bull Starten Sei den Performancetest (Laufzeitermittlung) mit 100 ndash 1000 Iterationen

bull Stellen Sie sicher dass sie ihr Programm vor dem bdquoSubmitldquo speichern

Damit sie notfalls die Session ohne Verluste vollstaumlndig abbrechen koumlnnen

bull Starten Sie mit einem bdquogrobenldquo Grid und verfeinern Sie dort wo Sie mehr Details

benoumltigen

bull ein 20x20 Grid benoumltigt die vierfache Laufzeit eines 10x10 Grids

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 9

NUTZEN SIE DAS WISSEN AUS SAS BLOGS

LITERATUR VON SAS PRESS SAS GLOBAL

FORUMS PAPERS

Do-Loop Blog von Rick Wicklin httpblogssascomcontentiml

Buumlcher von Rick Wicklin

httpsupportsascompublishingauthorswicklinhtml

SASreg for Monte Carlo Studies A Guide

for Quantitative ResearchersXitao Fan PhD

Akos Felsovalyi MS

Stephen A Sivo PhD

Sean C Keenan PhD httpsupportsascompublishingauthorsfelsovalyihtml

httpsupportsascomresourcespapersproceedings15SAS1387-2015pdf

Paper SAS1387-2015 Ten Tips for Simulating Data with

SASreg Rick Wicklin

httpsupportsascomeventssas

globalforumpreviousonlinehtml

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 10

ERWARTEN SIE MEHR NEUES BUCH IN SAS

PRESS bdquoMY FAVOURITE BUSINESS ANALYSES

WITH SASldquo MIT ZWEI SIMLUATIONS-STUDIEN

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

ZUSAMMENFASSUNG

Gerhard Svolba

Analytic Solution Architect

SAS-Austria

Gerhardsvolbasascom

httpwwwsascommunityorgwikiGerhard_Svolba

LinkedIn ndash XING ndash PictureBlog

Data Quality for Analytics Using SAS

SAS Press 2012httpwwwsascommunityorgwikiData_Quality_for_Analytics

Data Preparation for Analytics Using SAS

SAS Press 2006httpwwwsascommunityorgwikiData_Preparation_for_Analytics

Kontaktinformationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Codevergleich Berechnung und Haumlufigkeitsgewichtung aller

moumlglichen Ereignis-Kombination einer Projektliste

SAS Datastep SAS IML

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

bull SAS hat auch eine Matrixsprache (SAS IML Software) PROC IML

bull Diese ist voll in das SAS System integriert

bull Verwenden von SAS Datasets Ausgeben von Ergebnissen nach SAS

bull SAS Funktionen SAS Formate hellip

bull SAS IML bietet Matrizen Matrixmultiplikationen Vektoren Skalare

Teilmatrizen Indizes

bull SASregIML bietet auch eine Integration zwischen SAS und

dem R Open Source Project

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Beispiele

bull A+B matrix addition

bull AB matrix multiplication

bull AB element-wise multiplication

bull A[52] Element aus der

5 Zeile 2 Spalte

bull A[13210]

die ersten drei Spalten fuumlr die

2 bis 10 Zeile

bull W = INV(T(x)x)

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Verwendet den Mean

Vektor und die Cov-Matrix

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Ergebnisse des Programm-Codes

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

bull Die RAND Funktion im Datastep ist sehr maumlchtig fuumlr die Simulation von

Daten fuumlr univariate Verteilungen

bull SAS IML ist das Werkzeug der Wahl fuumlr die Simulation von korrelierten Daten

von multivariaten Verteilungen

bull SAS IML beinhaumllt viele built-in Funktionen fuumlr die Simulation unterschiedlicher

univariater und multivariater Verteilungen

bull SAS IML unterstuumltzt auch die Matrix-Berechnungen um Datensamples von

weniger haumlufig verwendeten Verteilungen zu ziehen

bull Hinweis fuumlr den Spezialfall der multivariaten Normalverteilung bietet auch

SAS STAT mit der SIMNORMAL Procedure eine Simulationsmoumlglichkeit

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

In einem Call Center werden die Anrufe in 3 Gruppen

geteilt 50 sind einfache Anfragen 20 sind

spezialisierte Anfragen und 30 sind bdquoharte Faumllleldquo

Die Erfahrungswerte bzgl der Bearbeitsdauer sind in

folgender Tabelle dargestellt

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

bull Rick Wicklin beschreibt in seinem SGF2015 Paper wie Daten aus komplexen

Verteilungen simuliert werden koumlnnen auch wenn diese im Basis-Set der 20

Verteilungen fuumlr RAND Funktion nicht enthalten sind

bull Loumlschen von bestimmten Wertebereichen einer Verteilungen ergibt eine Truncated

Distribution

bull Verschiebung und Skalierung von Zufallsvariablen innerhalb der gleichen

Verteilungsfamilie

bull Anwendung von Transformation um eine Verteilung in eine andere zu transformieren

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 7

BESCHLEUNIGEN SIE IHRE SIMULATIONS-

LAumlUFE DURCH UNTERDRUumlCKUNG VON

OUTPUT

bull Bei der Simulations-Iteration sind wir typischerweise an den erzeugte Daten

im SAS Dataset und weniger an den Ergebnissen im Output-Fenster oder

den Graphiken interessiert

bull Optionen wie NOPRINT oder PLOTS=NONE koumlnnen hier hilfreich sein

bull Weiters

bull Erstellung der Graphiken abschalten ODS GRAPHICS OFF

bull Uumlber ODS alle Ergebnisse unterdruumlcken ODS EXCLUDE ALL

bull Den Tree-View im Results-Fenster nicht befuumlllen ODS RESULTS OFF

bull Die Notes im Log unterdruumlcken OPTIONS NONOTES

bull Rick Wicklin praumlsentiert in seinem Paper bdquoTen Tips for Simulating Data with

SASregrdquo folgende beiden Macros

macro ODSOff() call prior to BY-

group processing

ods graphics off

ods exclude all

ods results off

options nonotes

mend

macro ODSOn() call after BY-group

processing

ods graphics on

ods exclude none

ods results on

options notes

mend

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 8PLANEN SIE IHRE SIMULATIONS-STUDIE

BEVOR SIE STARTEN

bull Starten Sie den Testlauf (Programmverifikation) mit 2-5 Iterationen

bull Starten Sei den Performancetest (Laufzeitermittlung) mit 100 ndash 1000 Iterationen

bull Stellen Sie sicher dass sie ihr Programm vor dem bdquoSubmitldquo speichern

Damit sie notfalls die Session ohne Verluste vollstaumlndig abbrechen koumlnnen

bull Starten Sie mit einem bdquogrobenldquo Grid und verfeinern Sie dort wo Sie mehr Details

benoumltigen

bull ein 20x20 Grid benoumltigt die vierfache Laufzeit eines 10x10 Grids

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 9

NUTZEN SIE DAS WISSEN AUS SAS BLOGS

LITERATUR VON SAS PRESS SAS GLOBAL

FORUMS PAPERS

Do-Loop Blog von Rick Wicklin httpblogssascomcontentiml

Buumlcher von Rick Wicklin

httpsupportsascompublishingauthorswicklinhtml

SASreg for Monte Carlo Studies A Guide

for Quantitative ResearchersXitao Fan PhD

Akos Felsovalyi MS

Stephen A Sivo PhD

Sean C Keenan PhD httpsupportsascompublishingauthorsfelsovalyihtml

httpsupportsascomresourcespapersproceedings15SAS1387-2015pdf

Paper SAS1387-2015 Ten Tips for Simulating Data with

SASreg Rick Wicklin

httpsupportsascomeventssas

globalforumpreviousonlinehtml

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 10

ERWARTEN SIE MEHR NEUES BUCH IN SAS

PRESS bdquoMY FAVOURITE BUSINESS ANALYSES

WITH SASldquo MIT ZWEI SIMLUATIONS-STUDIEN

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

ZUSAMMENFASSUNG

Gerhard Svolba

Analytic Solution Architect

SAS-Austria

Gerhardsvolbasascom

httpwwwsascommunityorgwikiGerhard_Svolba

LinkedIn ndash XING ndash PictureBlog

Data Quality for Analytics Using SAS

SAS Press 2012httpwwwsascommunityorgwikiData_Quality_for_Analytics

Data Preparation for Analytics Using SAS

SAS Press 2006httpwwwsascommunityorgwikiData_Preparation_for_Analytics

Kontaktinformationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

bull SAS hat auch eine Matrixsprache (SAS IML Software) PROC IML

bull Diese ist voll in das SAS System integriert

bull Verwenden von SAS Datasets Ausgeben von Ergebnissen nach SAS

bull SAS Funktionen SAS Formate hellip

bull SAS IML bietet Matrizen Matrixmultiplikationen Vektoren Skalare

Teilmatrizen Indizes

bull SASregIML bietet auch eine Integration zwischen SAS und

dem R Open Source Project

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Beispiele

bull A+B matrix addition

bull AB matrix multiplication

bull AB element-wise multiplication

bull A[52] Element aus der

5 Zeile 2 Spalte

bull A[13210]

die ersten drei Spalten fuumlr die

2 bis 10 Zeile

bull W = INV(T(x)x)

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Verwendet den Mean

Vektor und die Cov-Matrix

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Ergebnisse des Programm-Codes

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

bull Die RAND Funktion im Datastep ist sehr maumlchtig fuumlr die Simulation von

Daten fuumlr univariate Verteilungen

bull SAS IML ist das Werkzeug der Wahl fuumlr die Simulation von korrelierten Daten

von multivariaten Verteilungen

bull SAS IML beinhaumllt viele built-in Funktionen fuumlr die Simulation unterschiedlicher

univariater und multivariater Verteilungen

bull SAS IML unterstuumltzt auch die Matrix-Berechnungen um Datensamples von

weniger haumlufig verwendeten Verteilungen zu ziehen

bull Hinweis fuumlr den Spezialfall der multivariaten Normalverteilung bietet auch

SAS STAT mit der SIMNORMAL Procedure eine Simulationsmoumlglichkeit

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

In einem Call Center werden die Anrufe in 3 Gruppen

geteilt 50 sind einfache Anfragen 20 sind

spezialisierte Anfragen und 30 sind bdquoharte Faumllleldquo

Die Erfahrungswerte bzgl der Bearbeitsdauer sind in

folgender Tabelle dargestellt

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

bull Rick Wicklin beschreibt in seinem SGF2015 Paper wie Daten aus komplexen

Verteilungen simuliert werden koumlnnen auch wenn diese im Basis-Set der 20

Verteilungen fuumlr RAND Funktion nicht enthalten sind

bull Loumlschen von bestimmten Wertebereichen einer Verteilungen ergibt eine Truncated

Distribution

bull Verschiebung und Skalierung von Zufallsvariablen innerhalb der gleichen

Verteilungsfamilie

bull Anwendung von Transformation um eine Verteilung in eine andere zu transformieren

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 7

BESCHLEUNIGEN SIE IHRE SIMULATIONS-

LAumlUFE DURCH UNTERDRUumlCKUNG VON

OUTPUT

bull Bei der Simulations-Iteration sind wir typischerweise an den erzeugte Daten

im SAS Dataset und weniger an den Ergebnissen im Output-Fenster oder

den Graphiken interessiert

bull Optionen wie NOPRINT oder PLOTS=NONE koumlnnen hier hilfreich sein

bull Weiters

bull Erstellung der Graphiken abschalten ODS GRAPHICS OFF

bull Uumlber ODS alle Ergebnisse unterdruumlcken ODS EXCLUDE ALL

bull Den Tree-View im Results-Fenster nicht befuumlllen ODS RESULTS OFF

bull Die Notes im Log unterdruumlcken OPTIONS NONOTES

bull Rick Wicklin praumlsentiert in seinem Paper bdquoTen Tips for Simulating Data with

SASregrdquo folgende beiden Macros

macro ODSOff() call prior to BY-

group processing

ods graphics off

ods exclude all

ods results off

options nonotes

mend

macro ODSOn() call after BY-group

processing

ods graphics on

ods exclude none

ods results on

options notes

mend

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 8PLANEN SIE IHRE SIMULATIONS-STUDIE

BEVOR SIE STARTEN

bull Starten Sie den Testlauf (Programmverifikation) mit 2-5 Iterationen

bull Starten Sei den Performancetest (Laufzeitermittlung) mit 100 ndash 1000 Iterationen

bull Stellen Sie sicher dass sie ihr Programm vor dem bdquoSubmitldquo speichern

Damit sie notfalls die Session ohne Verluste vollstaumlndig abbrechen koumlnnen

bull Starten Sie mit einem bdquogrobenldquo Grid und verfeinern Sie dort wo Sie mehr Details

benoumltigen

bull ein 20x20 Grid benoumltigt die vierfache Laufzeit eines 10x10 Grids

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 9

NUTZEN SIE DAS WISSEN AUS SAS BLOGS

LITERATUR VON SAS PRESS SAS GLOBAL

FORUMS PAPERS

Do-Loop Blog von Rick Wicklin httpblogssascomcontentiml

Buumlcher von Rick Wicklin

httpsupportsascompublishingauthorswicklinhtml

SASreg for Monte Carlo Studies A Guide

for Quantitative ResearchersXitao Fan PhD

Akos Felsovalyi MS

Stephen A Sivo PhD

Sean C Keenan PhD httpsupportsascompublishingauthorsfelsovalyihtml

httpsupportsascomresourcespapersproceedings15SAS1387-2015pdf

Paper SAS1387-2015 Ten Tips for Simulating Data with

SASreg Rick Wicklin

httpsupportsascomeventssas

globalforumpreviousonlinehtml

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 10

ERWARTEN SIE MEHR NEUES BUCH IN SAS

PRESS bdquoMY FAVOURITE BUSINESS ANALYSES

WITH SASldquo MIT ZWEI SIMLUATIONS-STUDIEN

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

ZUSAMMENFASSUNG

Gerhard Svolba

Analytic Solution Architect

SAS-Austria

Gerhardsvolbasascom

httpwwwsascommunityorgwikiGerhard_Svolba

LinkedIn ndash XING ndash PictureBlog

Data Quality for Analytics Using SAS

SAS Press 2012httpwwwsascommunityorgwikiData_Quality_for_Analytics

Data Preparation for Analytics Using SAS

SAS Press 2006httpwwwsascommunityorgwikiData_Preparation_for_Analytics

Kontaktinformationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Beispiele

bull A+B matrix addition

bull AB matrix multiplication

bull AB element-wise multiplication

bull A[52] Element aus der

5 Zeile 2 Spalte

bull A[13210]

die ersten drei Spalten fuumlr die

2 bis 10 Zeile

bull W = INV(T(x)x)

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Verwendet den Mean

Vektor und die Cov-Matrix

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Ergebnisse des Programm-Codes

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

bull Die RAND Funktion im Datastep ist sehr maumlchtig fuumlr die Simulation von

Daten fuumlr univariate Verteilungen

bull SAS IML ist das Werkzeug der Wahl fuumlr die Simulation von korrelierten Daten

von multivariaten Verteilungen

bull SAS IML beinhaumllt viele built-in Funktionen fuumlr die Simulation unterschiedlicher

univariater und multivariater Verteilungen

bull SAS IML unterstuumltzt auch die Matrix-Berechnungen um Datensamples von

weniger haumlufig verwendeten Verteilungen zu ziehen

bull Hinweis fuumlr den Spezialfall der multivariaten Normalverteilung bietet auch

SAS STAT mit der SIMNORMAL Procedure eine Simulationsmoumlglichkeit

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

In einem Call Center werden die Anrufe in 3 Gruppen

geteilt 50 sind einfache Anfragen 20 sind

spezialisierte Anfragen und 30 sind bdquoharte Faumllleldquo

Die Erfahrungswerte bzgl der Bearbeitsdauer sind in

folgender Tabelle dargestellt

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

bull Rick Wicklin beschreibt in seinem SGF2015 Paper wie Daten aus komplexen

Verteilungen simuliert werden koumlnnen auch wenn diese im Basis-Set der 20

Verteilungen fuumlr RAND Funktion nicht enthalten sind

bull Loumlschen von bestimmten Wertebereichen einer Verteilungen ergibt eine Truncated

Distribution

bull Verschiebung und Skalierung von Zufallsvariablen innerhalb der gleichen

Verteilungsfamilie

bull Anwendung von Transformation um eine Verteilung in eine andere zu transformieren

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 7

BESCHLEUNIGEN SIE IHRE SIMULATIONS-

LAumlUFE DURCH UNTERDRUumlCKUNG VON

OUTPUT

bull Bei der Simulations-Iteration sind wir typischerweise an den erzeugte Daten

im SAS Dataset und weniger an den Ergebnissen im Output-Fenster oder

den Graphiken interessiert

bull Optionen wie NOPRINT oder PLOTS=NONE koumlnnen hier hilfreich sein

bull Weiters

bull Erstellung der Graphiken abschalten ODS GRAPHICS OFF

bull Uumlber ODS alle Ergebnisse unterdruumlcken ODS EXCLUDE ALL

bull Den Tree-View im Results-Fenster nicht befuumlllen ODS RESULTS OFF

bull Die Notes im Log unterdruumlcken OPTIONS NONOTES

bull Rick Wicklin praumlsentiert in seinem Paper bdquoTen Tips for Simulating Data with

SASregrdquo folgende beiden Macros

macro ODSOff() call prior to BY-

group processing

ods graphics off

ods exclude all

ods results off

options nonotes

mend

macro ODSOn() call after BY-group

processing

ods graphics on

ods exclude none

ods results on

options notes

mend

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 8PLANEN SIE IHRE SIMULATIONS-STUDIE

BEVOR SIE STARTEN

bull Starten Sie den Testlauf (Programmverifikation) mit 2-5 Iterationen

bull Starten Sei den Performancetest (Laufzeitermittlung) mit 100 ndash 1000 Iterationen

bull Stellen Sie sicher dass sie ihr Programm vor dem bdquoSubmitldquo speichern

Damit sie notfalls die Session ohne Verluste vollstaumlndig abbrechen koumlnnen

bull Starten Sie mit einem bdquogrobenldquo Grid und verfeinern Sie dort wo Sie mehr Details

benoumltigen

bull ein 20x20 Grid benoumltigt die vierfache Laufzeit eines 10x10 Grids

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 9

NUTZEN SIE DAS WISSEN AUS SAS BLOGS

LITERATUR VON SAS PRESS SAS GLOBAL

FORUMS PAPERS

Do-Loop Blog von Rick Wicklin httpblogssascomcontentiml

Buumlcher von Rick Wicklin

httpsupportsascompublishingauthorswicklinhtml

SASreg for Monte Carlo Studies A Guide

for Quantitative ResearchersXitao Fan PhD

Akos Felsovalyi MS

Stephen A Sivo PhD

Sean C Keenan PhD httpsupportsascompublishingauthorsfelsovalyihtml

httpsupportsascomresourcespapersproceedings15SAS1387-2015pdf

Paper SAS1387-2015 Ten Tips for Simulating Data with

SASreg Rick Wicklin

httpsupportsascomeventssas

globalforumpreviousonlinehtml

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 10

ERWARTEN SIE MEHR NEUES BUCH IN SAS

PRESS bdquoMY FAVOURITE BUSINESS ANALYSES

WITH SASldquo MIT ZWEI SIMLUATIONS-STUDIEN

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

ZUSAMMENFASSUNG

Gerhard Svolba

Analytic Solution Architect

SAS-Austria

Gerhardsvolbasascom

httpwwwsascommunityorgwikiGerhard_Svolba

LinkedIn ndash XING ndash PictureBlog

Data Quality for Analytics Using SAS

SAS Press 2012httpwwwsascommunityorgwikiData_Quality_for_Analytics

Data Preparation for Analytics Using SAS

SAS Press 2006httpwwwsascommunityorgwikiData_Preparation_for_Analytics

Kontaktinformationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 4 MACHEN SIE SICH MIT SASregIML VERTRAUT

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Verwendet den Mean

Vektor und die Cov-Matrix

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Ergebnisse des Programm-Codes

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

bull Die RAND Funktion im Datastep ist sehr maumlchtig fuumlr die Simulation von

Daten fuumlr univariate Verteilungen

bull SAS IML ist das Werkzeug der Wahl fuumlr die Simulation von korrelierten Daten

von multivariaten Verteilungen

bull SAS IML beinhaumllt viele built-in Funktionen fuumlr die Simulation unterschiedlicher

univariater und multivariater Verteilungen

bull SAS IML unterstuumltzt auch die Matrix-Berechnungen um Datensamples von

weniger haumlufig verwendeten Verteilungen zu ziehen

bull Hinweis fuumlr den Spezialfall der multivariaten Normalverteilung bietet auch

SAS STAT mit der SIMNORMAL Procedure eine Simulationsmoumlglichkeit

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

In einem Call Center werden die Anrufe in 3 Gruppen

geteilt 50 sind einfache Anfragen 20 sind

spezialisierte Anfragen und 30 sind bdquoharte Faumllleldquo

Die Erfahrungswerte bzgl der Bearbeitsdauer sind in

folgender Tabelle dargestellt

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

bull Rick Wicklin beschreibt in seinem SGF2015 Paper wie Daten aus komplexen

Verteilungen simuliert werden koumlnnen auch wenn diese im Basis-Set der 20

Verteilungen fuumlr RAND Funktion nicht enthalten sind

bull Loumlschen von bestimmten Wertebereichen einer Verteilungen ergibt eine Truncated

Distribution

bull Verschiebung und Skalierung von Zufallsvariablen innerhalb der gleichen

Verteilungsfamilie

bull Anwendung von Transformation um eine Verteilung in eine andere zu transformieren

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 7

BESCHLEUNIGEN SIE IHRE SIMULATIONS-

LAumlUFE DURCH UNTERDRUumlCKUNG VON

OUTPUT

bull Bei der Simulations-Iteration sind wir typischerweise an den erzeugte Daten

im SAS Dataset und weniger an den Ergebnissen im Output-Fenster oder

den Graphiken interessiert

bull Optionen wie NOPRINT oder PLOTS=NONE koumlnnen hier hilfreich sein

bull Weiters

bull Erstellung der Graphiken abschalten ODS GRAPHICS OFF

bull Uumlber ODS alle Ergebnisse unterdruumlcken ODS EXCLUDE ALL

bull Den Tree-View im Results-Fenster nicht befuumlllen ODS RESULTS OFF

bull Die Notes im Log unterdruumlcken OPTIONS NONOTES

bull Rick Wicklin praumlsentiert in seinem Paper bdquoTen Tips for Simulating Data with

SASregrdquo folgende beiden Macros

macro ODSOff() call prior to BY-

group processing

ods graphics off

ods exclude all

ods results off

options nonotes

mend

macro ODSOn() call after BY-group

processing

ods graphics on

ods exclude none

ods results on

options notes

mend

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 8PLANEN SIE IHRE SIMULATIONS-STUDIE

BEVOR SIE STARTEN

bull Starten Sie den Testlauf (Programmverifikation) mit 2-5 Iterationen

bull Starten Sei den Performancetest (Laufzeitermittlung) mit 100 ndash 1000 Iterationen

bull Stellen Sie sicher dass sie ihr Programm vor dem bdquoSubmitldquo speichern

Damit sie notfalls die Session ohne Verluste vollstaumlndig abbrechen koumlnnen

bull Starten Sie mit einem bdquogrobenldquo Grid und verfeinern Sie dort wo Sie mehr Details

benoumltigen

bull ein 20x20 Grid benoumltigt die vierfache Laufzeit eines 10x10 Grids

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 9

NUTZEN SIE DAS WISSEN AUS SAS BLOGS

LITERATUR VON SAS PRESS SAS GLOBAL

FORUMS PAPERS

Do-Loop Blog von Rick Wicklin httpblogssascomcontentiml

Buumlcher von Rick Wicklin

httpsupportsascompublishingauthorswicklinhtml

SASreg for Monte Carlo Studies A Guide

for Quantitative ResearchersXitao Fan PhD

Akos Felsovalyi MS

Stephen A Sivo PhD

Sean C Keenan PhD httpsupportsascompublishingauthorsfelsovalyihtml

httpsupportsascomresourcespapersproceedings15SAS1387-2015pdf

Paper SAS1387-2015 Ten Tips for Simulating Data with

SASreg Rick Wicklin

httpsupportsascomeventssas

globalforumpreviousonlinehtml

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 10

ERWARTEN SIE MEHR NEUES BUCH IN SAS

PRESS bdquoMY FAVOURITE BUSINESS ANALYSES

WITH SASldquo MIT ZWEI SIMLUATIONS-STUDIEN

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

ZUSAMMENFASSUNG

Gerhard Svolba

Analytic Solution Architect

SAS-Austria

Gerhardsvolbasascom

httpwwwsascommunityorgwikiGerhard_Svolba

LinkedIn ndash XING ndash PictureBlog

Data Quality for Analytics Using SAS

SAS Press 2012httpwwwsascommunityorgwikiData_Quality_for_Analytics

Data Preparation for Analytics Using SAS

SAS Press 2006httpwwwsascommunityorgwikiData_Preparation_for_Analytics

Kontaktinformationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Verwendet den Mean

Vektor und die Cov-Matrix

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Ergebnisse des Programm-Codes

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

bull Die RAND Funktion im Datastep ist sehr maumlchtig fuumlr die Simulation von

Daten fuumlr univariate Verteilungen

bull SAS IML ist das Werkzeug der Wahl fuumlr die Simulation von korrelierten Daten

von multivariaten Verteilungen

bull SAS IML beinhaumllt viele built-in Funktionen fuumlr die Simulation unterschiedlicher

univariater und multivariater Verteilungen

bull SAS IML unterstuumltzt auch die Matrix-Berechnungen um Datensamples von

weniger haumlufig verwendeten Verteilungen zu ziehen

bull Hinweis fuumlr den Spezialfall der multivariaten Normalverteilung bietet auch

SAS STAT mit der SIMNORMAL Procedure eine Simulationsmoumlglichkeit

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

In einem Call Center werden die Anrufe in 3 Gruppen

geteilt 50 sind einfache Anfragen 20 sind

spezialisierte Anfragen und 30 sind bdquoharte Faumllleldquo

Die Erfahrungswerte bzgl der Bearbeitsdauer sind in

folgender Tabelle dargestellt

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

bull Rick Wicklin beschreibt in seinem SGF2015 Paper wie Daten aus komplexen

Verteilungen simuliert werden koumlnnen auch wenn diese im Basis-Set der 20

Verteilungen fuumlr RAND Funktion nicht enthalten sind

bull Loumlschen von bestimmten Wertebereichen einer Verteilungen ergibt eine Truncated

Distribution

bull Verschiebung und Skalierung von Zufallsvariablen innerhalb der gleichen

Verteilungsfamilie

bull Anwendung von Transformation um eine Verteilung in eine andere zu transformieren

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 7

BESCHLEUNIGEN SIE IHRE SIMULATIONS-

LAumlUFE DURCH UNTERDRUumlCKUNG VON

OUTPUT

bull Bei der Simulations-Iteration sind wir typischerweise an den erzeugte Daten

im SAS Dataset und weniger an den Ergebnissen im Output-Fenster oder

den Graphiken interessiert

bull Optionen wie NOPRINT oder PLOTS=NONE koumlnnen hier hilfreich sein

bull Weiters

bull Erstellung der Graphiken abschalten ODS GRAPHICS OFF

bull Uumlber ODS alle Ergebnisse unterdruumlcken ODS EXCLUDE ALL

bull Den Tree-View im Results-Fenster nicht befuumlllen ODS RESULTS OFF

bull Die Notes im Log unterdruumlcken OPTIONS NONOTES

bull Rick Wicklin praumlsentiert in seinem Paper bdquoTen Tips for Simulating Data with

SASregrdquo folgende beiden Macros

macro ODSOff() call prior to BY-

group processing

ods graphics off

ods exclude all

ods results off

options nonotes

mend

macro ODSOn() call after BY-group

processing

ods graphics on

ods exclude none

ods results on

options notes

mend

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 8PLANEN SIE IHRE SIMULATIONS-STUDIE

BEVOR SIE STARTEN

bull Starten Sie den Testlauf (Programmverifikation) mit 2-5 Iterationen

bull Starten Sei den Performancetest (Laufzeitermittlung) mit 100 ndash 1000 Iterationen

bull Stellen Sie sicher dass sie ihr Programm vor dem bdquoSubmitldquo speichern

Damit sie notfalls die Session ohne Verluste vollstaumlndig abbrechen koumlnnen

bull Starten Sie mit einem bdquogrobenldquo Grid und verfeinern Sie dort wo Sie mehr Details

benoumltigen

bull ein 20x20 Grid benoumltigt die vierfache Laufzeit eines 10x10 Grids

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 9

NUTZEN SIE DAS WISSEN AUS SAS BLOGS

LITERATUR VON SAS PRESS SAS GLOBAL

FORUMS PAPERS

Do-Loop Blog von Rick Wicklin httpblogssascomcontentiml

Buumlcher von Rick Wicklin

httpsupportsascompublishingauthorswicklinhtml

SASreg for Monte Carlo Studies A Guide

for Quantitative ResearchersXitao Fan PhD

Akos Felsovalyi MS

Stephen A Sivo PhD

Sean C Keenan PhD httpsupportsascompublishingauthorsfelsovalyihtml

httpsupportsascomresourcespapersproceedings15SAS1387-2015pdf

Paper SAS1387-2015 Ten Tips for Simulating Data with

SASreg Rick Wicklin

httpsupportsascomeventssas

globalforumpreviousonlinehtml

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 10

ERWARTEN SIE MEHR NEUES BUCH IN SAS

PRESS bdquoMY FAVOURITE BUSINESS ANALYSES

WITH SASldquo MIT ZWEI SIMLUATIONS-STUDIEN

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

ZUSAMMENFASSUNG

Gerhard Svolba

Analytic Solution Architect

SAS-Austria

Gerhardsvolbasascom

httpwwwsascommunityorgwikiGerhard_Svolba

LinkedIn ndash XING ndash PictureBlog

Data Quality for Analytics Using SAS

SAS Press 2012httpwwwsascommunityorgwikiData_Quality_for_Analytics

Data Preparation for Analytics Using SAS

SAS Press 2006httpwwwsascommunityorgwikiData_Preparation_for_Analytics

Kontaktinformationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

Ergebnisse des Programm-Codes

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

bull Die RAND Funktion im Datastep ist sehr maumlchtig fuumlr die Simulation von

Daten fuumlr univariate Verteilungen

bull SAS IML ist das Werkzeug der Wahl fuumlr die Simulation von korrelierten Daten

von multivariaten Verteilungen

bull SAS IML beinhaumllt viele built-in Funktionen fuumlr die Simulation unterschiedlicher

univariater und multivariater Verteilungen

bull SAS IML unterstuumltzt auch die Matrix-Berechnungen um Datensamples von

weniger haumlufig verwendeten Verteilungen zu ziehen

bull Hinweis fuumlr den Spezialfall der multivariaten Normalverteilung bietet auch

SAS STAT mit der SIMNORMAL Procedure eine Simulationsmoumlglichkeit

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

In einem Call Center werden die Anrufe in 3 Gruppen

geteilt 50 sind einfache Anfragen 20 sind

spezialisierte Anfragen und 30 sind bdquoharte Faumllleldquo

Die Erfahrungswerte bzgl der Bearbeitsdauer sind in

folgender Tabelle dargestellt

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

bull Rick Wicklin beschreibt in seinem SGF2015 Paper wie Daten aus komplexen

Verteilungen simuliert werden koumlnnen auch wenn diese im Basis-Set der 20

Verteilungen fuumlr RAND Funktion nicht enthalten sind

bull Loumlschen von bestimmten Wertebereichen einer Verteilungen ergibt eine Truncated

Distribution

bull Verschiebung und Skalierung von Zufallsvariablen innerhalb der gleichen

Verteilungsfamilie

bull Anwendung von Transformation um eine Verteilung in eine andere zu transformieren

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 7

BESCHLEUNIGEN SIE IHRE SIMULATIONS-

LAumlUFE DURCH UNTERDRUumlCKUNG VON

OUTPUT

bull Bei der Simulations-Iteration sind wir typischerweise an den erzeugte Daten

im SAS Dataset und weniger an den Ergebnissen im Output-Fenster oder

den Graphiken interessiert

bull Optionen wie NOPRINT oder PLOTS=NONE koumlnnen hier hilfreich sein

bull Weiters

bull Erstellung der Graphiken abschalten ODS GRAPHICS OFF

bull Uumlber ODS alle Ergebnisse unterdruumlcken ODS EXCLUDE ALL

bull Den Tree-View im Results-Fenster nicht befuumlllen ODS RESULTS OFF

bull Die Notes im Log unterdruumlcken OPTIONS NONOTES

bull Rick Wicklin praumlsentiert in seinem Paper bdquoTen Tips for Simulating Data with

SASregrdquo folgende beiden Macros

macro ODSOff() call prior to BY-

group processing

ods graphics off

ods exclude all

ods results off

options nonotes

mend

macro ODSOn() call after BY-group

processing

ods graphics on

ods exclude none

ods results on

options notes

mend

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 8PLANEN SIE IHRE SIMULATIONS-STUDIE

BEVOR SIE STARTEN

bull Starten Sie den Testlauf (Programmverifikation) mit 2-5 Iterationen

bull Starten Sei den Performancetest (Laufzeitermittlung) mit 100 ndash 1000 Iterationen

bull Stellen Sie sicher dass sie ihr Programm vor dem bdquoSubmitldquo speichern

Damit sie notfalls die Session ohne Verluste vollstaumlndig abbrechen koumlnnen

bull Starten Sie mit einem bdquogrobenldquo Grid und verfeinern Sie dort wo Sie mehr Details

benoumltigen

bull ein 20x20 Grid benoumltigt die vierfache Laufzeit eines 10x10 Grids

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 9

NUTZEN SIE DAS WISSEN AUS SAS BLOGS

LITERATUR VON SAS PRESS SAS GLOBAL

FORUMS PAPERS

Do-Loop Blog von Rick Wicklin httpblogssascomcontentiml

Buumlcher von Rick Wicklin

httpsupportsascompublishingauthorswicklinhtml

SASreg for Monte Carlo Studies A Guide

for Quantitative ResearchersXitao Fan PhD

Akos Felsovalyi MS

Stephen A Sivo PhD

Sean C Keenan PhD httpsupportsascompublishingauthorsfelsovalyihtml

httpsupportsascomresourcespapersproceedings15SAS1387-2015pdf

Paper SAS1387-2015 Ten Tips for Simulating Data with

SASreg Rick Wicklin

httpsupportsascomeventssas

globalforumpreviousonlinehtml

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 10

ERWARTEN SIE MEHR NEUES BUCH IN SAS

PRESS bdquoMY FAVOURITE BUSINESS ANALYSES

WITH SASldquo MIT ZWEI SIMLUATIONS-STUDIEN

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

ZUSAMMENFASSUNG

Gerhard Svolba

Analytic Solution Architect

SAS-Austria

Gerhardsvolbasascom

httpwwwsascommunityorgwikiGerhard_Svolba

LinkedIn ndash XING ndash PictureBlog

Data Quality for Analytics Using SAS

SAS Press 2012httpwwwsascommunityorgwikiData_Quality_for_Analytics

Data Preparation for Analytics Using SAS

SAS Press 2006httpwwwsascommunityorgwikiData_Preparation_for_Analytics

Kontaktinformationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 5SO SIMULIEREN SIE DATEN AUS EINER

MULTIVARIATEN VERTEILUNG

bull Die RAND Funktion im Datastep ist sehr maumlchtig fuumlr die Simulation von

Daten fuumlr univariate Verteilungen

bull SAS IML ist das Werkzeug der Wahl fuumlr die Simulation von korrelierten Daten

von multivariaten Verteilungen

bull SAS IML beinhaumllt viele built-in Funktionen fuumlr die Simulation unterschiedlicher

univariater und multivariater Verteilungen

bull SAS IML unterstuumltzt auch die Matrix-Berechnungen um Datensamples von

weniger haumlufig verwendeten Verteilungen zu ziehen

bull Hinweis fuumlr den Spezialfall der multivariaten Normalverteilung bietet auch

SAS STAT mit der SIMNORMAL Procedure eine Simulationsmoumlglichkeit

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

In einem Call Center werden die Anrufe in 3 Gruppen

geteilt 50 sind einfache Anfragen 20 sind

spezialisierte Anfragen und 30 sind bdquoharte Faumllleldquo

Die Erfahrungswerte bzgl der Bearbeitsdauer sind in

folgender Tabelle dargestellt

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

bull Rick Wicklin beschreibt in seinem SGF2015 Paper wie Daten aus komplexen

Verteilungen simuliert werden koumlnnen auch wenn diese im Basis-Set der 20

Verteilungen fuumlr RAND Funktion nicht enthalten sind

bull Loumlschen von bestimmten Wertebereichen einer Verteilungen ergibt eine Truncated

Distribution

bull Verschiebung und Skalierung von Zufallsvariablen innerhalb der gleichen

Verteilungsfamilie

bull Anwendung von Transformation um eine Verteilung in eine andere zu transformieren

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 7

BESCHLEUNIGEN SIE IHRE SIMULATIONS-

LAumlUFE DURCH UNTERDRUumlCKUNG VON

OUTPUT

bull Bei der Simulations-Iteration sind wir typischerweise an den erzeugte Daten

im SAS Dataset und weniger an den Ergebnissen im Output-Fenster oder

den Graphiken interessiert

bull Optionen wie NOPRINT oder PLOTS=NONE koumlnnen hier hilfreich sein

bull Weiters

bull Erstellung der Graphiken abschalten ODS GRAPHICS OFF

bull Uumlber ODS alle Ergebnisse unterdruumlcken ODS EXCLUDE ALL

bull Den Tree-View im Results-Fenster nicht befuumlllen ODS RESULTS OFF

bull Die Notes im Log unterdruumlcken OPTIONS NONOTES

bull Rick Wicklin praumlsentiert in seinem Paper bdquoTen Tips for Simulating Data with

SASregrdquo folgende beiden Macros

macro ODSOff() call prior to BY-

group processing

ods graphics off

ods exclude all

ods results off

options nonotes

mend

macro ODSOn() call after BY-group

processing

ods graphics on

ods exclude none

ods results on

options notes

mend

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 8PLANEN SIE IHRE SIMULATIONS-STUDIE

BEVOR SIE STARTEN

bull Starten Sie den Testlauf (Programmverifikation) mit 2-5 Iterationen

bull Starten Sei den Performancetest (Laufzeitermittlung) mit 100 ndash 1000 Iterationen

bull Stellen Sie sicher dass sie ihr Programm vor dem bdquoSubmitldquo speichern

Damit sie notfalls die Session ohne Verluste vollstaumlndig abbrechen koumlnnen

bull Starten Sie mit einem bdquogrobenldquo Grid und verfeinern Sie dort wo Sie mehr Details

benoumltigen

bull ein 20x20 Grid benoumltigt die vierfache Laufzeit eines 10x10 Grids

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 9

NUTZEN SIE DAS WISSEN AUS SAS BLOGS

LITERATUR VON SAS PRESS SAS GLOBAL

FORUMS PAPERS

Do-Loop Blog von Rick Wicklin httpblogssascomcontentiml

Buumlcher von Rick Wicklin

httpsupportsascompublishingauthorswicklinhtml

SASreg for Monte Carlo Studies A Guide

for Quantitative ResearchersXitao Fan PhD

Akos Felsovalyi MS

Stephen A Sivo PhD

Sean C Keenan PhD httpsupportsascompublishingauthorsfelsovalyihtml

httpsupportsascomresourcespapersproceedings15SAS1387-2015pdf

Paper SAS1387-2015 Ten Tips for Simulating Data with

SASreg Rick Wicklin

httpsupportsascomeventssas

globalforumpreviousonlinehtml

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 10

ERWARTEN SIE MEHR NEUES BUCH IN SAS

PRESS bdquoMY FAVOURITE BUSINESS ANALYSES

WITH SASldquo MIT ZWEI SIMLUATIONS-STUDIEN

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

ZUSAMMENFASSUNG

Gerhard Svolba

Analytic Solution Architect

SAS-Austria

Gerhardsvolbasascom

httpwwwsascommunityorgwikiGerhard_Svolba

LinkedIn ndash XING ndash PictureBlog

Data Quality for Analytics Using SAS

SAS Press 2012httpwwwsascommunityorgwikiData_Quality_for_Analytics

Data Preparation for Analytics Using SAS

SAS Press 2006httpwwwsascommunityorgwikiData_Preparation_for_Analytics

Kontaktinformationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

In einem Call Center werden die Anrufe in 3 Gruppen

geteilt 50 sind einfache Anfragen 20 sind

spezialisierte Anfragen und 30 sind bdquoharte Faumllleldquo

Die Erfahrungswerte bzgl der Bearbeitsdauer sind in

folgender Tabelle dargestellt

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

bull Rick Wicklin beschreibt in seinem SGF2015 Paper wie Daten aus komplexen

Verteilungen simuliert werden koumlnnen auch wenn diese im Basis-Set der 20

Verteilungen fuumlr RAND Funktion nicht enthalten sind

bull Loumlschen von bestimmten Wertebereichen einer Verteilungen ergibt eine Truncated

Distribution

bull Verschiebung und Skalierung von Zufallsvariablen innerhalb der gleichen

Verteilungsfamilie

bull Anwendung von Transformation um eine Verteilung in eine andere zu transformieren

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 7

BESCHLEUNIGEN SIE IHRE SIMULATIONS-

LAumlUFE DURCH UNTERDRUumlCKUNG VON

OUTPUT

bull Bei der Simulations-Iteration sind wir typischerweise an den erzeugte Daten

im SAS Dataset und weniger an den Ergebnissen im Output-Fenster oder

den Graphiken interessiert

bull Optionen wie NOPRINT oder PLOTS=NONE koumlnnen hier hilfreich sein

bull Weiters

bull Erstellung der Graphiken abschalten ODS GRAPHICS OFF

bull Uumlber ODS alle Ergebnisse unterdruumlcken ODS EXCLUDE ALL

bull Den Tree-View im Results-Fenster nicht befuumlllen ODS RESULTS OFF

bull Die Notes im Log unterdruumlcken OPTIONS NONOTES

bull Rick Wicklin praumlsentiert in seinem Paper bdquoTen Tips for Simulating Data with

SASregrdquo folgende beiden Macros

macro ODSOff() call prior to BY-

group processing

ods graphics off

ods exclude all

ods results off

options nonotes

mend

macro ODSOn() call after BY-group

processing

ods graphics on

ods exclude none

ods results on

options notes

mend

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 8PLANEN SIE IHRE SIMULATIONS-STUDIE

BEVOR SIE STARTEN

bull Starten Sie den Testlauf (Programmverifikation) mit 2-5 Iterationen

bull Starten Sei den Performancetest (Laufzeitermittlung) mit 100 ndash 1000 Iterationen

bull Stellen Sie sicher dass sie ihr Programm vor dem bdquoSubmitldquo speichern

Damit sie notfalls die Session ohne Verluste vollstaumlndig abbrechen koumlnnen

bull Starten Sie mit einem bdquogrobenldquo Grid und verfeinern Sie dort wo Sie mehr Details

benoumltigen

bull ein 20x20 Grid benoumltigt die vierfache Laufzeit eines 10x10 Grids

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 9

NUTZEN SIE DAS WISSEN AUS SAS BLOGS

LITERATUR VON SAS PRESS SAS GLOBAL

FORUMS PAPERS

Do-Loop Blog von Rick Wicklin httpblogssascomcontentiml

Buumlcher von Rick Wicklin

httpsupportsascompublishingauthorswicklinhtml

SASreg for Monte Carlo Studies A Guide

for Quantitative ResearchersXitao Fan PhD

Akos Felsovalyi MS

Stephen A Sivo PhD

Sean C Keenan PhD httpsupportsascompublishingauthorsfelsovalyihtml

httpsupportsascomresourcespapersproceedings15SAS1387-2015pdf

Paper SAS1387-2015 Ten Tips for Simulating Data with

SASreg Rick Wicklin

httpsupportsascomeventssas

globalforumpreviousonlinehtml

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 10

ERWARTEN SIE MEHR NEUES BUCH IN SAS

PRESS bdquoMY FAVOURITE BUSINESS ANALYSES

WITH SASldquo MIT ZWEI SIMLUATIONS-STUDIEN

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

ZUSAMMENFASSUNG

Gerhard Svolba

Analytic Solution Architect

SAS-Austria

Gerhardsvolbasascom

httpwwwsascommunityorgwikiGerhard_Svolba

LinkedIn ndash XING ndash PictureBlog

Data Quality for Analytics Using SAS

SAS Press 2012httpwwwsascommunityorgwikiData_Quality_for_Analytics

Data Preparation for Analytics Using SAS

SAS Press 2006httpwwwsascommunityorgwikiData_Preparation_for_Analytics

Kontaktinformationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 6SIMULIERE DATEN AUS EINER KOMBINATION

VON VERTEILUNGEN

bull Rick Wicklin beschreibt in seinem SGF2015 Paper wie Daten aus komplexen

Verteilungen simuliert werden koumlnnen auch wenn diese im Basis-Set der 20

Verteilungen fuumlr RAND Funktion nicht enthalten sind

bull Loumlschen von bestimmten Wertebereichen einer Verteilungen ergibt eine Truncated

Distribution

bull Verschiebung und Skalierung von Zufallsvariablen innerhalb der gleichen

Verteilungsfamilie

bull Anwendung von Transformation um eine Verteilung in eine andere zu transformieren

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 7

BESCHLEUNIGEN SIE IHRE SIMULATIONS-

LAumlUFE DURCH UNTERDRUumlCKUNG VON

OUTPUT

bull Bei der Simulations-Iteration sind wir typischerweise an den erzeugte Daten

im SAS Dataset und weniger an den Ergebnissen im Output-Fenster oder

den Graphiken interessiert

bull Optionen wie NOPRINT oder PLOTS=NONE koumlnnen hier hilfreich sein

bull Weiters

bull Erstellung der Graphiken abschalten ODS GRAPHICS OFF

bull Uumlber ODS alle Ergebnisse unterdruumlcken ODS EXCLUDE ALL

bull Den Tree-View im Results-Fenster nicht befuumlllen ODS RESULTS OFF

bull Die Notes im Log unterdruumlcken OPTIONS NONOTES

bull Rick Wicklin praumlsentiert in seinem Paper bdquoTen Tips for Simulating Data with

SASregrdquo folgende beiden Macros

macro ODSOff() call prior to BY-

group processing

ods graphics off

ods exclude all

ods results off

options nonotes

mend

macro ODSOn() call after BY-group

processing

ods graphics on

ods exclude none

ods results on

options notes

mend

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 8PLANEN SIE IHRE SIMULATIONS-STUDIE

BEVOR SIE STARTEN

bull Starten Sie den Testlauf (Programmverifikation) mit 2-5 Iterationen

bull Starten Sei den Performancetest (Laufzeitermittlung) mit 100 ndash 1000 Iterationen

bull Stellen Sie sicher dass sie ihr Programm vor dem bdquoSubmitldquo speichern

Damit sie notfalls die Session ohne Verluste vollstaumlndig abbrechen koumlnnen

bull Starten Sie mit einem bdquogrobenldquo Grid und verfeinern Sie dort wo Sie mehr Details

benoumltigen

bull ein 20x20 Grid benoumltigt die vierfache Laufzeit eines 10x10 Grids

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 9

NUTZEN SIE DAS WISSEN AUS SAS BLOGS

LITERATUR VON SAS PRESS SAS GLOBAL

FORUMS PAPERS

Do-Loop Blog von Rick Wicklin httpblogssascomcontentiml

Buumlcher von Rick Wicklin

httpsupportsascompublishingauthorswicklinhtml

SASreg for Monte Carlo Studies A Guide

for Quantitative ResearchersXitao Fan PhD

Akos Felsovalyi MS

Stephen A Sivo PhD

Sean C Keenan PhD httpsupportsascompublishingauthorsfelsovalyihtml

httpsupportsascomresourcespapersproceedings15SAS1387-2015pdf

Paper SAS1387-2015 Ten Tips for Simulating Data with

SASreg Rick Wicklin

httpsupportsascomeventssas

globalforumpreviousonlinehtml

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 10

ERWARTEN SIE MEHR NEUES BUCH IN SAS

PRESS bdquoMY FAVOURITE BUSINESS ANALYSES

WITH SASldquo MIT ZWEI SIMLUATIONS-STUDIEN

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

ZUSAMMENFASSUNG

Gerhard Svolba

Analytic Solution Architect

SAS-Austria

Gerhardsvolbasascom

httpwwwsascommunityorgwikiGerhard_Svolba

LinkedIn ndash XING ndash PictureBlog

Data Quality for Analytics Using SAS

SAS Press 2012httpwwwsascommunityorgwikiData_Quality_for_Analytics

Data Preparation for Analytics Using SAS

SAS Press 2006httpwwwsascommunityorgwikiData_Preparation_for_Analytics

Kontaktinformationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 7

BESCHLEUNIGEN SIE IHRE SIMULATIONS-

LAumlUFE DURCH UNTERDRUumlCKUNG VON

OUTPUT

bull Bei der Simulations-Iteration sind wir typischerweise an den erzeugte Daten

im SAS Dataset und weniger an den Ergebnissen im Output-Fenster oder

den Graphiken interessiert

bull Optionen wie NOPRINT oder PLOTS=NONE koumlnnen hier hilfreich sein

bull Weiters

bull Erstellung der Graphiken abschalten ODS GRAPHICS OFF

bull Uumlber ODS alle Ergebnisse unterdruumlcken ODS EXCLUDE ALL

bull Den Tree-View im Results-Fenster nicht befuumlllen ODS RESULTS OFF

bull Die Notes im Log unterdruumlcken OPTIONS NONOTES

bull Rick Wicklin praumlsentiert in seinem Paper bdquoTen Tips for Simulating Data with

SASregrdquo folgende beiden Macros

macro ODSOff() call prior to BY-

group processing

ods graphics off

ods exclude all

ods results off

options nonotes

mend

macro ODSOn() call after BY-group

processing

ods graphics on

ods exclude none

ods results on

options notes

mend

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 8PLANEN SIE IHRE SIMULATIONS-STUDIE

BEVOR SIE STARTEN

bull Starten Sie den Testlauf (Programmverifikation) mit 2-5 Iterationen

bull Starten Sei den Performancetest (Laufzeitermittlung) mit 100 ndash 1000 Iterationen

bull Stellen Sie sicher dass sie ihr Programm vor dem bdquoSubmitldquo speichern

Damit sie notfalls die Session ohne Verluste vollstaumlndig abbrechen koumlnnen

bull Starten Sie mit einem bdquogrobenldquo Grid und verfeinern Sie dort wo Sie mehr Details

benoumltigen

bull ein 20x20 Grid benoumltigt die vierfache Laufzeit eines 10x10 Grids

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 9

NUTZEN SIE DAS WISSEN AUS SAS BLOGS

LITERATUR VON SAS PRESS SAS GLOBAL

FORUMS PAPERS

Do-Loop Blog von Rick Wicklin httpblogssascomcontentiml

Buumlcher von Rick Wicklin

httpsupportsascompublishingauthorswicklinhtml

SASreg for Monte Carlo Studies A Guide

for Quantitative ResearchersXitao Fan PhD

Akos Felsovalyi MS

Stephen A Sivo PhD

Sean C Keenan PhD httpsupportsascompublishingauthorsfelsovalyihtml

httpsupportsascomresourcespapersproceedings15SAS1387-2015pdf

Paper SAS1387-2015 Ten Tips for Simulating Data with

SASreg Rick Wicklin

httpsupportsascomeventssas

globalforumpreviousonlinehtml

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 10

ERWARTEN SIE MEHR NEUES BUCH IN SAS

PRESS bdquoMY FAVOURITE BUSINESS ANALYSES

WITH SASldquo MIT ZWEI SIMLUATIONS-STUDIEN

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

ZUSAMMENFASSUNG

Gerhard Svolba

Analytic Solution Architect

SAS-Austria

Gerhardsvolbasascom

httpwwwsascommunityorgwikiGerhard_Svolba

LinkedIn ndash XING ndash PictureBlog

Data Quality for Analytics Using SAS

SAS Press 2012httpwwwsascommunityorgwikiData_Quality_for_Analytics

Data Preparation for Analytics Using SAS

SAS Press 2006httpwwwsascommunityorgwikiData_Preparation_for_Analytics

Kontaktinformationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 8PLANEN SIE IHRE SIMULATIONS-STUDIE

BEVOR SIE STARTEN

bull Starten Sie den Testlauf (Programmverifikation) mit 2-5 Iterationen

bull Starten Sei den Performancetest (Laufzeitermittlung) mit 100 ndash 1000 Iterationen

bull Stellen Sie sicher dass sie ihr Programm vor dem bdquoSubmitldquo speichern

Damit sie notfalls die Session ohne Verluste vollstaumlndig abbrechen koumlnnen

bull Starten Sie mit einem bdquogrobenldquo Grid und verfeinern Sie dort wo Sie mehr Details

benoumltigen

bull ein 20x20 Grid benoumltigt die vierfache Laufzeit eines 10x10 Grids

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 9

NUTZEN SIE DAS WISSEN AUS SAS BLOGS

LITERATUR VON SAS PRESS SAS GLOBAL

FORUMS PAPERS

Do-Loop Blog von Rick Wicklin httpblogssascomcontentiml

Buumlcher von Rick Wicklin

httpsupportsascompublishingauthorswicklinhtml

SASreg for Monte Carlo Studies A Guide

for Quantitative ResearchersXitao Fan PhD

Akos Felsovalyi MS

Stephen A Sivo PhD

Sean C Keenan PhD httpsupportsascompublishingauthorsfelsovalyihtml

httpsupportsascomresourcespapersproceedings15SAS1387-2015pdf

Paper SAS1387-2015 Ten Tips for Simulating Data with

SASreg Rick Wicklin

httpsupportsascomeventssas

globalforumpreviousonlinehtml

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 10

ERWARTEN SIE MEHR NEUES BUCH IN SAS

PRESS bdquoMY FAVOURITE BUSINESS ANALYSES

WITH SASldquo MIT ZWEI SIMLUATIONS-STUDIEN

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

ZUSAMMENFASSUNG

Gerhard Svolba

Analytic Solution Architect

SAS-Austria

Gerhardsvolbasascom

httpwwwsascommunityorgwikiGerhard_Svolba

LinkedIn ndash XING ndash PictureBlog

Data Quality for Analytics Using SAS

SAS Press 2012httpwwwsascommunityorgwikiData_Quality_for_Analytics

Data Preparation for Analytics Using SAS

SAS Press 2006httpwwwsascommunityorgwikiData_Preparation_for_Analytics

Kontaktinformationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 9

NUTZEN SIE DAS WISSEN AUS SAS BLOGS

LITERATUR VON SAS PRESS SAS GLOBAL

FORUMS PAPERS

Do-Loop Blog von Rick Wicklin httpblogssascomcontentiml

Buumlcher von Rick Wicklin

httpsupportsascompublishingauthorswicklinhtml

SASreg for Monte Carlo Studies A Guide

for Quantitative ResearchersXitao Fan PhD

Akos Felsovalyi MS

Stephen A Sivo PhD

Sean C Keenan PhD httpsupportsascompublishingauthorsfelsovalyihtml

httpsupportsascomresourcespapersproceedings15SAS1387-2015pdf

Paper SAS1387-2015 Ten Tips for Simulating Data with

SASreg Rick Wicklin

httpsupportsascomeventssas

globalforumpreviousonlinehtml

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 10

ERWARTEN SIE MEHR NEUES BUCH IN SAS

PRESS bdquoMY FAVOURITE BUSINESS ANALYSES

WITH SASldquo MIT ZWEI SIMLUATIONS-STUDIEN

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

ZUSAMMENFASSUNG

Gerhard Svolba

Analytic Solution Architect

SAS-Austria

Gerhardsvolbasascom

httpwwwsascommunityorgwikiGerhard_Svolba

LinkedIn ndash XING ndash PictureBlog

Data Quality for Analytics Using SAS

SAS Press 2012httpwwwsascommunityorgwikiData_Quality_for_Analytics

Data Preparation for Analytics Using SAS

SAS Press 2006httpwwwsascommunityorgwikiData_Preparation_for_Analytics

Kontaktinformationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

TIPP 10

ERWARTEN SIE MEHR NEUES BUCH IN SAS

PRESS bdquoMY FAVOURITE BUSINESS ANALYSES

WITH SASldquo MIT ZWEI SIMLUATIONS-STUDIEN

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

ZUSAMMENFASSUNG

Gerhard Svolba

Analytic Solution Architect

SAS-Austria

Gerhardsvolbasascom

httpwwwsascommunityorgwikiGerhard_Svolba

LinkedIn ndash XING ndash PictureBlog

Data Quality for Analytics Using SAS

SAS Press 2012httpwwwsascommunityorgwikiData_Quality_for_Analytics

Data Preparation for Analytics Using SAS

SAS Press 2006httpwwwsascommunityorgwikiData_Preparation_for_Analytics

Kontaktinformationen

Copyr i g ht copy 2012 SAS Ins t i tu t e Inc A l l r ights reser ve d

ZUSAMMENFASSUNG

Gerhard Svolba

Analytic Solution Architect

SAS-Austria

Gerhardsvolbasascom

httpwwwsascommunityorgwikiGerhard_Svolba

LinkedIn ndash XING ndash PictureBlog

Data Quality for Analytics Using SAS

SAS Press 2012httpwwwsascommunityorgwikiData_Quality_for_Analytics

Data Preparation for Analytics Using SAS

SAS Press 2006httpwwwsascommunityorgwikiData_Preparation_for_Analytics

Kontaktinformationen