282
Εισαγωγή στην R Πρόχειρες Σημειώσεις Κωνσταντίνος Φωκιανός & Χαράλαμπος Χαραλάμπους Τμήμα Μαθηματικών & Στατιστικής Πανεπιστήμιο Κύπρου 1η ΄Εκδοση : Φεβρουάριος 2008 2η ΄Εκδοση : Ιανουάριος 2010

Εισαγωγήστην R ΠρόχειρεςΣηµειώσεις · PDF file3.4 ΤυχαίοιΑριθµοί . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 ... µπορεί

  • Upload
    vunhi

  • View
    221

  • Download
    3

Embed Size (px)

Citation preview

  • R

    & &

    1 : 20082 : 2010

  • c. .

    2

  • R 11

    1 R 13

    1.1 . . . . . . . . . . . . . . . . . . . . . . . 141.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

    2 21

    2.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232.3 (Arrays) . . . . . . . . . . . . . . . 272.4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282.5 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292.6 (Data Frames) . . . . . . . . . . . . . . . . . . 31

    3 R 37

    3.1 . . . . . . . . . . . . . . 373.2 . . . . . . . . . . . . . . . . . . 413.3 . . . . . . . . . . . . . . . . . . . . . 433.4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 433.5 . . . . . . . . . . . . . . . . . . . . . . 45

    4 47

    4.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 474.2 . . . . . . . . . . . . . . . . . . . . . . . . . 494.3 . . . . . . . . . . . . . . . 514.4 . . . . . . . . . . . . . . . . . 524.5 . . . . . . . . . . . . . . . . 57

    3

  • 5 R 59

    5.1 . . . . . . . . . . . . . . . 595.2 . . . . . . . . . . . . . 605.3 . . . . . . . . . . . . . . . . . . . . . . . . 63

    6 67

    6.1 . . . . . . . . . . . . . . . 676.2 . . . . . . . . . . . . . . . . . . . . . . . 706.3 . . . . . . . . . . . . . . . 726.4 Monte Carlo . . . . . . . . . . . . . . . . . . . . . . . 756.5 Buffon . . . . . . . . . . . . . . . . . . . . . . . . . . . 776.6 . . . . . . . . . . . . . . . . . . . 78

    7 83

    7.1 . . . . . . . . . . . . . . . . . . . . . . . . 837.2 . . . . . . . . . . . . . . . . . 867.3 . . . . . . . . . . . . . . . . . 897.4 . . . . . . . . . . . . 917.5 . . . . . . . . . . . . . . . . . . . . . 937.6 . . . . . . . . . . . . . . . . . . . 957.7 . . . . . . . . . . . . . . . . . . . . . . . . . . . 987.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100

    8 109

    8.1 R . . . . . . . . . . . . . . . . . . . . . . . 1098.2 . . . . . . . . . . . . . . . . . 110

    9 125

    9.1 . . . . . . . . . . . . . 1259.2 . . . . . . . . . . . . . . . . . . . . . . . . . 132

    10 135

    10.1 . . . . . . . . . . . . . . . . . . . . . . . 13510.2 . . . . . . . . . . . . . . . . . . . . . . . 13610.3 R . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13610.4 Probit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140

    c. .

    4

  • 11 147

    11.1 Jackknife . . . . . . . . . . . . . . . . . . . . . . . . . . . 14711.2 Bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . 15111.3 . . . . . . . . . . . . . . . . . . . 15311.4 . . . . . . . . . . . . . . . . . . . . . . 155

    12 159

    R 163

    13 165

    13.1 Trellis . . . . . . . . . . . . . . . . . . . . . . . . . . . 165

    14 Newton-Raphson 173

    14.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173

    15 181

    15.1 . . . . . . . . . . . . . . . . . . . . . 181

    16 - 185

    16.1 . . . . . . . . . . . . . . . . . . . . . . . 18516.2 - . . . . . . . . . . . . . . . . . . 186

    17Poisson 191

    17.1Poisson . . . . . . . . . . . . . . . . . . . . . . . . . 19117.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193

    18 199

    18.1 . . . . . . . . . . . . . . . . . 20018.2 Splines . . . . . . . . . . . . . . . . . . . . . . . . . . 20218.3 . . . . . . . . . . . . . . . 203

    19 207

    19.1 . . . . . . . . . . . . . . . . . . . . . . . . . 20719.2 . . . . . . . . . . . . . . . . . . . . . . . . . . 20819.3 . . . . . . . . . . . . . . 20819.4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209

    c. .

    5

  • 20 219

    20.1 . . . . . . . . . . . . . . . . . . . . 21920.2 . . . . . . . . . . . . . . . . . . . . . . . . . 227

    21 R 233

    21.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23321.2 . . . . . . . . . . . . . . . . . . 23721.3 K-means (MacQueen) . . . . . . . . . . . . . . . . . . 24621.4Partitioning Around Medoids (PAM) . . . . . . . . . . . . . . . . . 24821.5Self Organizing Maps (SOM) . . . . . . . . . . . . . . . . . . . . . . 25021.6Fuzzy Analysis Clustering (Fanny) . . . . . . . . . . . . . . . . . . 25321.7 . . . . . . . . . . . . . . . . . . . 257 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 264

    22 265

    22.1 . . . . . . . . . . . . . . . . . . . . . . . . . 26522.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 266

    23 E-M 273

    23.1 . . . . . . . . . . . . . . . . . . . . . . . . 27423.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . 27723.3 . . . . . . . . . . . . . . . 280

    c. .

    6

  • 2

    R - . , - , Poisson , , , . - R NewtonRaphson EM. .

    , 2010

  • c. .

    8

  • 1

    - R . R - http://www.r-project.org/ (packages) - . , R - . . - .

    . 15 R, 6 - 710 . 11 - . . .

    . - - . , , -

  • , . -, 2, 3 ... R :

    1. Richard A. Becker, John M. Chambers, and Allan R. Wilks. The New SLanguage. Chapman & Hall, London, 1988.

    2. John M. Chambers and Trevor J. Hastie. Statistical Models in S. Chap-man & Hall, London, 1992.

    3. William N. Venables and Brian D. Ripley. Modern Applied Statistics withS. Fourth Edition. Springer, New York, 2002.

    4. William N. Venables and Brian D. Ripley. S Programming. Springer, NewYork, 2000.

    5. Frank E. Harrell. Regression Modeling Strategies, with Applications toLinear Models, Survival Analysis and Logistic Regression.

    6. John Fox. An R and S-Plus Companion to Applied Regression. SagePublications, Thousand Oaks, CA, USA, 2002.

    7. Julian J. Faraway. Linear Models with R. Chapman & Hall/CRC, BocaRaton, FL, 2004.

    - R.

    , , , , . , .

    , 2008

    c. .

    10

  • I

    R

    11

  • 1

    R

    R. R , . - http://www.r-project.org/ . , R Linux, Mac OS Windows.

    , R . . R (functions) .

    ,

    R.

    R .

    R.

    13

  • 1.1

    R. , .

    x

  • x

  • 5 10 15 20

    510

    1520

    25

    x

    y

    0 5 10 15 20

    4

    2

    02

    4

    Residuals vs Fitted

    Fitted Values

    Res

    idua

    ls

    2 1 0 1 2

    4

    2

    02

    4

    Residuals QQ Plot

    Theoretical Quantiles

    Sam

    ple

    Qua

    ntile

    s

    1.2: .

    R: 3- -.

    x

  • Contour of f

    3 2 1 0 1 2 3

    3

    2

    1

    01

    23

    Contour of f

    Higher Resolution

    3 2 1 0 1 2 3

    3

    2

    10

    12

    3

    Contour of fa

    3 2 1 0 1 2 3

    3

    2

    1

    01

    23

    1.3: ().

    x

    y

    f

    Perspective of f

    x

    y

    fa

    Perspective of fa

    3 1 1 2 3

    3

    1

    12

    3

    High image of f

    x

    y

    3 1 1 2 3

    3

    1

    12

    3

    High image of fa

    x

    y

    1.4: ().

    c. .

    17

  • 1.2

    R S . . , C Fortran - . . , , ... .

    R , .

    > sqrt

    function(x)

    x^0.5

    > sqrt(2)

    [1] 1.414214

    log

    function(x, base = 2.71828182845905)

    {

    y log(10)

    [1] 2.302585

    R . - x X . .

    c. .

    18

  • > plot(fdeaths)

    > mean(fdeaths)

    [1] 560.6806

    . ..

    > 2+5

    [1] 7

    > 3*6.8

    [1] 20.4

    > 12.6/6

    [1] 2.1

    - letters

    [1] "a" "b" "c" "d" "e" "f" "g" "h" "i" "j" "k" "l" "m" "n" "o"

    [16] "p" "q" "r" "s" "t" "u" "v" "w" "x" "y" "z"

    > letters[3]

    [1] "c"

    > letters[-3]

    [1] "a" "b" "d" "e" "f" "g" "h" "i" "j" "k" "l" "m" "n" "o" "p"

    [16] "q" "r" "s" "t" "u" "v" "w" "x" "y" "z"

    ,

    > j j

  • > letters[j -3.6

    [1] -3.6

    > "Munich"

    [1] "Munich"

    > c(T, F, T)

    [1] T F T

    > c(-2, pi, 2)

    [1] -2.000000 3.141593 2.000000

    > c(T, pi, F)

    [1] 1.000000 3.141593 0.000000

    > c(T, pi, "Munich")

    [1] "TRUE" "3.14159265358979" "Munich"

    > mode(c(T, pi, "Munich"))

    [1] "character"

    c. .

    20

  • 2

    . - R. R :

    (vector)

    (matrix)

    (array)

    (list)

    (factor)

    (time series)

    (data frame).

    , .

    2.1

    . . -

    21

  • . c. ,

    > x x

    [1] 1 3 4 5

    > length(x)

    [1] 4

    > mode(x)

    [1] "numeric"

    > names(x)

    NULL

    > y y

    [1] 2 3 1 -6

    , -, , rep. re