Upload
others
View
4
Download
0
Embed Size (px)
Citation preview
INTRODUZIONE AL
SOFTWARE R
Maria Simona Andreano
Universitas Mercatorum Introduzione al software R
Attenzione! Questo materiale didattico è per uso personale dello studente ed è
coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche
parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.
633)
Pag. 2 di 14
Indice
1 PRESENTAZIONE DI R .................................................................. 3
2 INSTALLARE R ................................................................................ 6
3 R-STUDIO .......................................................................................... 8
4 I PACCHETTI .................................................................................. 10
BIBLIOGRAFIA ................................................................................. 14
Universitas Mercatorum Introduzione al software R
Attenzione! Questo materiale didattico è per uso personale dello studente ed è
coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche
parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.
633)
Pag. 3 di 14
1 PRESENTAZIONE DI R
Dare una presentazione di R in poche pagine è impossibile e
d’altro canto poco utile. Esistono in circolazione molteplici manuali,
ricchi di esempi e approfondimenti, che possono soddisfare
ampiamente qualsiasi esigenza e curiosità degli studenti e degli
utilizzatori.
In queste pagine vedremo soltanto alcuni accenni di base su R,
fornendo indicazioni di testi e – sopratutto – siti web, dove trovare
molti materiali utili.
Intanto diamo una definizione molto sommaria di R:
“R è un ambiente di elaborazione che consente di manipolare
dati, eseguire calcoli e procedure complesse nonchè rappresentare
graficamente i risultati”.
R è un linguaggio di programmazione object oriented, ovvero
tutte le operazioni vengono svolte su e tramite oggetti e a loro volta ne
generano altri.
Il vantaggio di R, che ne ha fatto uno dei principali software
utilizzati in ambito statistico, è il fatto di essere completamente
gratuito. Se teniamo presente dei costi elevati di altri software, quali
STATA, SPSS, SAS, etc. si comprende immediamente come mai R si è
diffuso in maniera così estesa.
R può essere scaricato dal sito internet
http://www.r- project.org/
Universitas Mercatorum Introduzione al software R
Attenzione! Questo materiale didattico è per uso personale dello studente ed è
coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche
parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.
633)
Pag. 4 di 14
R è un progetto Open Source conforme per la maggior parte ad
S, un linguaggio ed un sistema sviluppati da John Chambers e da suoi
collaboratori negli anni ′80 presso i Laboratori Bell.
Il linguaggio S venne successivamente concesso dalla Bell in
esclusiva alla Insightful Corporation che ne ha fatto un software noto
con il nome di S-PLUS.
Solo successivamente, grazie anche alla diffusione di internet, è
nato il progetto “Open Source di R”.
R nasce quindi come un ambiente statistico di ottima qualità,
sviluppato in modo da consentire sempre la compatibilità con S-
PLUS. Può inoltre implementare moduli creati da altri linguaggi
come il C , il C++, il Fortran.
Inizialmente è stato sviluppato da R. Ihaka and R. Gentleman
(Univ. di Auckland (NZ)) e, attualmente, da una comunità
Universitas Mercatorum Introduzione al software R
Attenzione! Questo materiale didattico è per uso personale dello studente ed è
coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche
parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.
633)
Pag. 5 di 14
internazionale di ricercatori e sviluppatori in ambito accademico e
industriale
Ad ottobre 2014 il TIOBE (Programming Community Index)
posiziona R al 15º posto. La sua popolarità è dovuta anche all'ampia
disponibilità di moduli distribuiti con la licenza GPL e organizzati in
un apposito sito chiamato CRAN (Comprehensive R Archive
Network).
Più che un software, R è un “ambiente”, perchè è costruito
attorno al linguaggio di programmazione a partire dagli oggetti.
Esistono numerosi testi di base, che possono essere utile per
iniziare a lavorare con R. Di seguito ne presentiamo solo alcuni:
•W. Venables e D.M. Smith, An Introduction to R
http://cran.rproject.org/doc/manuals/R-intro.pdf, 2004.
•J. Maindonald, Using R for Data Analysis and Graphics
http://wwwmaths.anu.edu.au/¡johnm, 2000.
•S. M. Iacus e G. Masarotto, Laboratorio di statistica con R
McGraw–Hill, Milano, 2003.
Per quanto riguarda libri e manuali specifici sul linguaggio e
riguardanti lo sviluppo dei Package abbiamo invece:
•R Development Core Team, R Language Definition
http://cran.rproject.org/doc/manuals/R-def.pdf
•R Development Core Team, Writing R extensions
http://cran.rproject.org/doc/manuals/R-exts.pdf
In rete sono inoltre disponibili numerose dispense per i primi
passi in R:
•In particolare, nel sito http://cran.r-project.org/, andare nella
sezione “Contributed” e poi in “Other languages”, per trovare una
serie di dispense in italiano.
Universitas Mercatorum Introduzione al software R
Attenzione! Questo materiale didattico è per uso personale dello studente ed è
coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche
parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.
633)
Pag. 6 di 14
2 INSTALLARE R
La versione piu` recente di R può essere scaricata dalla pagina:
http://cran.r-project.org/bin/windows/base/
R è disponibile nelle versioni Windows, Mac e Linux.
Dal sito si ritrovano dettagliate spiegazioni sul download e la
distribuzione del programma.
Una volta installato e avviato il programma R, apparirà una
finestra (consolle) con il simbolo di prompt
>
che indica che l’ambiente è pronto per ricevere delle istruzioni.
Universitas Mercatorum Introduzione al software R
Attenzione! Questo materiale didattico è per uso personale dello studente ed è
coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche
parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.
633)
Pag. 7 di 14
Rispetto ad altri programmi (SPSS, ecc.), R fornisce un output
molto essenziale.
R non è un programma con menu per svolgere le varie funzioni,
ma è un linguaggio di programmazione. Pertanto sarà necessario
scrivere i comandi che si vogliono eseguire.
E’ un ambiente interattivo, ossia i comandi producono una
risposta immediata, che da luogo a degli oggetti che possono essere
salvati con un nome e richimati successivamente.
R è case sensitive: Ossia il comando "Mean" è diverso da
"mean"
ATTENZIONE!
In R un’analisi è fatta attraverso una serie di passi, con
risultati intermedi che sono immagazzinati in oggetti. Se
erronemente si da uno stesso nome a due oggetti differenti, il secondo
andrà a sovrascrivere quanto salvato precedentemente.
Universitas Mercatorum Introduzione al software R
Attenzione! Questo materiale didattico è per uso personale dello studente ed è
coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche
parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.
633)
Pag. 8 di 14
3 R-STUDIO
R è un linguaggio fornito con un'interfaccia a riga di comando, ma
sono disponibili diverse interfacce grafiche che consentono di
integrare R con diversi pacchetti, tra cui R Studio.
L'uso di R tramite R-Studio facilita molto l'esecuzione dei programmi,
la visualizzazione dei grafici, la ricerca dei pacchetti da inserire.
All’interno di R-Studio si ritrova una sezione dedicata
esclusivamente al “classico” R. Contemporanemante sono però aperte
altre finestre, che rendono l’uso di R più facile. Sopratutto per avere
degli help, visualizzare i grafici e i contenuti di spceifici pacchetti.
I comandi da eseguire possono essere scritti direttamente nel
prompt dopo il simbolo >
In R-Studio possiamo però aprire un programma già scritto (da
noi o da qualche altro utilizzatore) e possiamo richiamare i comandi
direttamente dalla finestra in alto a sinistra.Questi possono essere
"mandati" sul prompt di R in esecuzione.
Una volta concluso il comando si digita il tasto di “Invio”:
Universitas Mercatorum Introduzione al software R
Attenzione! Questo materiale didattico è per uso personale dello studente ed è
coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche
parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.
633)
Pag. 9 di 14
Se il comando è completo, comparirà una nuova riga di
comando con il simbolo di prompt.
Altrimenti comparirà una nuova riga di comando con il simbolo
+ che sta a significare che il comando deve essere completato.
•Per richiamare i comandi già inseriti, basta usare i tasti ↑ e ↓
per scorrere in avanti e indietro e richiamarli.
Universitas Mercatorum Introduzione al software R
Attenzione! Questo materiale didattico è per uso personale dello studente ed è
coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche
parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.
633)
Pag. 10 di 14
4 I PACCHETTI
Le funzioni di R sono organizzate in pacchetti, i più importanti
dei quali sono già disponibili quando si accede al programma.
Probabilmente tali pacchetti sono l’aspetto più interessante e
innovativo di R. I pacchetti racchiudono funzioni e procedure su
alcuni argomenti specifici e sono sviluppati da ricercatori, che li
mettono a disposizione della comunità scientifica. Ovviamente, prima
di venir distribuiti, vengono verificati, controllati e rielaborati.
Dal sito di R è possibile scaricare molti pacchetti diversi, che
vengono continuamente aggiornati e ampliati.
E' possibile trovare il pacchetto del tema che interessa, facendo
una ricerca tramite il sito R Site search:
http://finzi.psych.upenn.edu/search.html
Se si conosce il nome del pacchetto, si può installarlo
direttamente dalla finestra di R-Studio:
Universitas Mercatorum Introduzione al software R
Attenzione! Questo materiale didattico è per uso personale dello studente ed è
coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche
parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.
633)
Pag. 11 di 14
Una volta scaricati i pacchetti, questi sono "dentro" R, ma non
sono sempre attivi.
All'occorrenza devono essere richiamati dal programma. Per
fare ciò è necessario spuntare il pacchetto d'interesse dalla lista
disponibile.
Per avere informazioni su un pacchetto si può usare il comando:
> help(package = "nomepacchetto")
Universitas Mercatorum Introduzione al software R
Attenzione! Questo materiale didattico è per uso personale dello studente ed è
coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche
parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.
633)
Pag. 12 di 14
Conoscendo il nome del paccheto, per "attivarlo" su R, si può
utilizzare direttamente il comando:
> library(nomepacchetto)
Oppure il comando:
> require(nomepacchetto)
Ogni pacchetto è accompagnato da una dispensa che spiega i
comandi e presenta esempi.
Direttamente dalla pagina web dove si scarica R, abbiamo
informazioni su questa “comunità” allargata di R, che porta alla
realizzazione di nuovi pacchetti.
Universitas Mercatorum Introduzione al software R
Attenzione! Questo materiale didattico è per uso personale dello studente ed è
coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche
parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.
633)
Pag. 13 di 14
Il CRAN di R è proprio questa comunità:
Benchè sia utile avere un testo di riferimento per imparare ad
utilizzare R, sicuramente il vero modo di impratichirsi con tale
software è la sua utilizzazione.
Partendo dai blog e dalle pagine “search” è possibile iniziare
per piccoli passi con R.
Si fa presente che con gli help dei pacchetti, spesso si trova il
riferimento a delle dispense di riferimento, che permettono anche di
scaricare alcuni dati, in maniera da eseguire le elaborazioni suggeriti
nella dispensa stessa.
Universitas Mercatorum Introduzione al software R
Attenzione! Questo materiale didattico è per uso personale dello studente ed è
coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche
parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.
633)
Pag. 14 di 14
BIBLIOGRAFIA
Iacus e Masarotto: Laboratorio di statistica con R, McGraw-Hill