14
INTRODUZIONE AL SOFTWARE R Maria Simona Andreano

INTRODUZIONE AL SOFTWARE R

  • Upload
    others

  • View
    4

  • Download
    0

Embed Size (px)

Citation preview

Page 1: INTRODUZIONE AL SOFTWARE R

INTRODUZIONE AL

SOFTWARE R

Maria Simona Andreano

Page 2: INTRODUZIONE AL SOFTWARE R

Universitas Mercatorum Introduzione al software R

Attenzione! Questo materiale didattico è per uso personale dello studente ed è

coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche

parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.

633)

Pag. 2 di 14

Indice

1 PRESENTAZIONE DI R .................................................................. 3

2 INSTALLARE R ................................................................................ 6

3 R-STUDIO .......................................................................................... 8

4 I PACCHETTI .................................................................................. 10

BIBLIOGRAFIA ................................................................................. 14

Page 3: INTRODUZIONE AL SOFTWARE R

Universitas Mercatorum Introduzione al software R

Attenzione! Questo materiale didattico è per uso personale dello studente ed è

coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche

parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.

633)

Pag. 3 di 14

1 PRESENTAZIONE DI R

Dare una presentazione di R in poche pagine è impossibile e

d’altro canto poco utile. Esistono in circolazione molteplici manuali,

ricchi di esempi e approfondimenti, che possono soddisfare

ampiamente qualsiasi esigenza e curiosità degli studenti e degli

utilizzatori.

In queste pagine vedremo soltanto alcuni accenni di base su R,

fornendo indicazioni di testi e – sopratutto – siti web, dove trovare

molti materiali utili.

Intanto diamo una definizione molto sommaria di R:

“R è un ambiente di elaborazione che consente di manipolare

dati, eseguire calcoli e procedure complesse nonchè rappresentare

graficamente i risultati”.

R è un linguaggio di programmazione object oriented, ovvero

tutte le operazioni vengono svolte su e tramite oggetti e a loro volta ne

generano altri.

Il vantaggio di R, che ne ha fatto uno dei principali software

utilizzati in ambito statistico, è il fatto di essere completamente

gratuito. Se teniamo presente dei costi elevati di altri software, quali

STATA, SPSS, SAS, etc. si comprende immediamente come mai R si è

diffuso in maniera così estesa.

R può essere scaricato dal sito internet

http://www.r- project.org/

Page 4: INTRODUZIONE AL SOFTWARE R

Universitas Mercatorum Introduzione al software R

Attenzione! Questo materiale didattico è per uso personale dello studente ed è

coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche

parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.

633)

Pag. 4 di 14

R è un progetto Open Source conforme per la maggior parte ad

S, un linguaggio ed un sistema sviluppati da John Chambers e da suoi

collaboratori negli anni ′80 presso i Laboratori Bell.

Il linguaggio S venne successivamente concesso dalla Bell in

esclusiva alla Insightful Corporation che ne ha fatto un software noto

con il nome di S-PLUS.

Solo successivamente, grazie anche alla diffusione di internet, è

nato il progetto “Open Source di R”.

R nasce quindi come un ambiente statistico di ottima qualità,

sviluppato in modo da consentire sempre la compatibilità con S-

PLUS. Può inoltre implementare moduli creati da altri linguaggi

come il C , il C++, il Fortran.

Inizialmente è stato sviluppato da R. Ihaka and R. Gentleman

(Univ. di Auckland (NZ)) e, attualmente, da una comunità

Page 5: INTRODUZIONE AL SOFTWARE R

Universitas Mercatorum Introduzione al software R

Attenzione! Questo materiale didattico è per uso personale dello studente ed è

coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche

parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.

633)

Pag. 5 di 14

internazionale di ricercatori e sviluppatori in ambito accademico e

industriale

Ad ottobre 2014 il TIOBE (Programming Community Index)

posiziona R al 15º posto. La sua popolarità è dovuta anche all'ampia

disponibilità di moduli distribuiti con la licenza GPL e organizzati in

un apposito sito chiamato CRAN (Comprehensive R Archive

Network).

Più che un software, R è un “ambiente”, perchè è costruito

attorno al linguaggio di programmazione a partire dagli oggetti.

Esistono numerosi testi di base, che possono essere utile per

iniziare a lavorare con R. Di seguito ne presentiamo solo alcuni:

•W. Venables e D.M. Smith, An Introduction to R

http://cran.rproject.org/doc/manuals/R-intro.pdf, 2004.

•J. Maindonald, Using R for Data Analysis and Graphics

http://wwwmaths.anu.edu.au/¡johnm, 2000.

•S. M. Iacus e G. Masarotto, Laboratorio di statistica con R

McGraw–Hill, Milano, 2003.

Per quanto riguarda libri e manuali specifici sul linguaggio e

riguardanti lo sviluppo dei Package abbiamo invece:

•R Development Core Team, R Language Definition

http://cran.rproject.org/doc/manuals/R-def.pdf

•R Development Core Team, Writing R extensions

http://cran.rproject.org/doc/manuals/R-exts.pdf

In rete sono inoltre disponibili numerose dispense per i primi

passi in R:

•In particolare, nel sito http://cran.r-project.org/, andare nella

sezione “Contributed” e poi in “Other languages”, per trovare una

serie di dispense in italiano.

Page 6: INTRODUZIONE AL SOFTWARE R

Universitas Mercatorum Introduzione al software R

Attenzione! Questo materiale didattico è per uso personale dello studente ed è

coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche

parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.

633)

Pag. 6 di 14

2 INSTALLARE R

La versione piu` recente di R può essere scaricata dalla pagina:

http://cran.r-project.org/bin/windows/base/

R è disponibile nelle versioni Windows, Mac e Linux.

Dal sito si ritrovano dettagliate spiegazioni sul download e la

distribuzione del programma.

Una volta installato e avviato il programma R, apparirà una

finestra (consolle) con il simbolo di prompt

>

che indica che l’ambiente è pronto per ricevere delle istruzioni.

Page 7: INTRODUZIONE AL SOFTWARE R

Universitas Mercatorum Introduzione al software R

Attenzione! Questo materiale didattico è per uso personale dello studente ed è

coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche

parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.

633)

Pag. 7 di 14

Rispetto ad altri programmi (SPSS, ecc.), R fornisce un output

molto essenziale.

R non è un programma con menu per svolgere le varie funzioni,

ma è un linguaggio di programmazione. Pertanto sarà necessario

scrivere i comandi che si vogliono eseguire.

E’ un ambiente interattivo, ossia i comandi producono una

risposta immediata, che da luogo a degli oggetti che possono essere

salvati con un nome e richimati successivamente.

R è case sensitive: Ossia il comando "Mean" è diverso da

"mean"

ATTENZIONE!

In R un’analisi è fatta attraverso una serie di passi, con

risultati intermedi che sono immagazzinati in oggetti. Se

erronemente si da uno stesso nome a due oggetti differenti, il secondo

andrà a sovrascrivere quanto salvato precedentemente.

Page 8: INTRODUZIONE AL SOFTWARE R

Universitas Mercatorum Introduzione al software R

Attenzione! Questo materiale didattico è per uso personale dello studente ed è

coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche

parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.

633)

Pag. 8 di 14

3 R-STUDIO

R è un linguaggio fornito con un'interfaccia a riga di comando, ma

sono disponibili diverse interfacce grafiche che consentono di

integrare R con diversi pacchetti, tra cui R Studio.

L'uso di R tramite R-Studio facilita molto l'esecuzione dei programmi,

la visualizzazione dei grafici, la ricerca dei pacchetti da inserire.

All’interno di R-Studio si ritrova una sezione dedicata

esclusivamente al “classico” R. Contemporanemante sono però aperte

altre finestre, che rendono l’uso di R più facile. Sopratutto per avere

degli help, visualizzare i grafici e i contenuti di spceifici pacchetti.

I comandi da eseguire possono essere scritti direttamente nel

prompt dopo il simbolo >

In R-Studio possiamo però aprire un programma già scritto (da

noi o da qualche altro utilizzatore) e possiamo richiamare i comandi

direttamente dalla finestra in alto a sinistra.Questi possono essere

"mandati" sul prompt di R in esecuzione.

Una volta concluso il comando si digita il tasto di “Invio”:

Page 9: INTRODUZIONE AL SOFTWARE R

Universitas Mercatorum Introduzione al software R

Attenzione! Questo materiale didattico è per uso personale dello studente ed è

coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche

parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.

633)

Pag. 9 di 14

Se il comando è completo, comparirà una nuova riga di

comando con il simbolo di prompt.

Altrimenti comparirà una nuova riga di comando con il simbolo

+ che sta a significare che il comando deve essere completato.

•Per richiamare i comandi già inseriti, basta usare i tasti ↑ e ↓

per scorrere in avanti e indietro e richiamarli.

Page 10: INTRODUZIONE AL SOFTWARE R

Universitas Mercatorum Introduzione al software R

Attenzione! Questo materiale didattico è per uso personale dello studente ed è

coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche

parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.

633)

Pag. 10 di 14

4 I PACCHETTI

Le funzioni di R sono organizzate in pacchetti, i più importanti

dei quali sono già disponibili quando si accede al programma.

Probabilmente tali pacchetti sono l’aspetto più interessante e

innovativo di R. I pacchetti racchiudono funzioni e procedure su

alcuni argomenti specifici e sono sviluppati da ricercatori, che li

mettono a disposizione della comunità scientifica. Ovviamente, prima

di venir distribuiti, vengono verificati, controllati e rielaborati.

Dal sito di R è possibile scaricare molti pacchetti diversi, che

vengono continuamente aggiornati e ampliati.

E' possibile trovare il pacchetto del tema che interessa, facendo

una ricerca tramite il sito R Site search:

http://finzi.psych.upenn.edu/search.html

Se si conosce il nome del pacchetto, si può installarlo

direttamente dalla finestra di R-Studio:

Page 11: INTRODUZIONE AL SOFTWARE R

Universitas Mercatorum Introduzione al software R

Attenzione! Questo materiale didattico è per uso personale dello studente ed è

coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche

parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.

633)

Pag. 11 di 14

Una volta scaricati i pacchetti, questi sono "dentro" R, ma non

sono sempre attivi.

All'occorrenza devono essere richiamati dal programma. Per

fare ciò è necessario spuntare il pacchetto d'interesse dalla lista

disponibile.

Per avere informazioni su un pacchetto si può usare il comando:

> help(package = "nomepacchetto")

Page 12: INTRODUZIONE AL SOFTWARE R

Universitas Mercatorum Introduzione al software R

Attenzione! Questo materiale didattico è per uso personale dello studente ed è

coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche

parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.

633)

Pag. 12 di 14

Conoscendo il nome del paccheto, per "attivarlo" su R, si può

utilizzare direttamente il comando:

> library(nomepacchetto)

Oppure il comando:

> require(nomepacchetto)

Ogni pacchetto è accompagnato da una dispensa che spiega i

comandi e presenta esempi.

Direttamente dalla pagina web dove si scarica R, abbiamo

informazioni su questa “comunità” allargata di R, che porta alla

realizzazione di nuovi pacchetti.

Page 13: INTRODUZIONE AL SOFTWARE R

Universitas Mercatorum Introduzione al software R

Attenzione! Questo materiale didattico è per uso personale dello studente ed è

coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche

parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.

633)

Pag. 13 di 14

Il CRAN di R è proprio questa comunità:

Benchè sia utile avere un testo di riferimento per imparare ad

utilizzare R, sicuramente il vero modo di impratichirsi con tale

software è la sua utilizzazione.

Partendo dai blog e dalle pagine “search” è possibile iniziare

per piccoli passi con R.

Si fa presente che con gli help dei pacchetti, spesso si trova il

riferimento a delle dispense di riferimento, che permettono anche di

scaricare alcuni dati, in maniera da eseguire le elaborazioni suggeriti

nella dispensa stessa.

Page 14: INTRODUZIONE AL SOFTWARE R

Universitas Mercatorum Introduzione al software R

Attenzione! Questo materiale didattico è per uso personale dello studente ed è

coperto da copyright. Ne è severamente vietata la riproduzione o il riutilizzo anche

parziale, ai sensi e per gli effetti della legge sul diritto d’autore (L. 22.04.1941/n.

633)

Pag. 14 di 14

BIBLIOGRAFIA

Iacus e Masarotto: Laboratorio di statistica con R, McGraw-Hill