16
Python을 활용한 데이터분석 권병천

Python을 활용한 데이터 분석

Embed Size (px)

Citation preview

Page 1: Python을 활용한 데이터 분석

Python을활용한데이터분석

권병천

Page 2: Python을 활용한 데이터 분석

목차

조사연구부서의데이터분석환경

향상된데이터분석환경

Python 소개

Python을활용한데이터처리실례

Python을활용한계량경제분석실례

Python 학습및활용을위한가이드라인

Page 3: Python을 활용한 데이터 분석

조사연구부서의데이터분석환경

적시성 다양성 확장성

Page 4: Python을 활용한 데이터 분석

향상된데이터분석환경

• 단순반복작업에대한자동화

• 고성능계산환경을활용

• 대용량데이터를간단히가공하고처리

적시성 다양성 확장성

Page 5: Python을 활용한 데이터 분석

Python 소개• Python 은오픈소스스크립트언어• 1991년개발된언어로범용, 고급프로그래밍언어• 다양한용도(웹개발, 그래픽인터페이스, 스크립트, 계산과학등)로널리활용

• Python is Now the Most Popular Introductory Teaching Language at Top U.S. Universities

TIOBE Index for November 2014 PYPL PopularitY of Programming Language index

Page 6: Python을 활용한 데이터 분석

Python 소개• Java, C# 등범용프로그래밍언어에비해높은생산성(코딩량기준약 90% 감소)

-높은수준의데이터구조(ex: DataFrame)나함수(ex: Numpy, Scikit)를제공

• 직관적이고유연한구조로초보자들이활용하기쉬움

-변수선언, 제어문작성시복잡하게요구되는사항이없음

• 다른언어/시스템간유연한확장구조

• 5만개가넘는확장패키지제공(R언어의경우 9천개)

처리속도 오류허용 안정성

Page 7: Python을 활용한 데이터 분석

Python vs R• 통계분석용언어로는우위를가리기어려움

• R은통계학자들이모여만든분석용언어

• Python은전산개발자가만든범용전산언어

• 최근들어두언어의차이는희석됨

• 그러나,-반복처리작업-코드재사용-데이터분석모형의시스템화

에있어서는 Python이유리

Page 8: Python을 활용한 데이터 분석

언어를굳이알필요가있을까?

Page 9: Python을 활용한 데이터 분석

Python을활용한데이터처리실례CASE 1) 여러엑셀파일통합을위한반복작업

Page 10: Python을 활용한 데이터 분석

Python을활용한데이터처리실례

Page 11: Python을 활용한 데이터 분석

Python을활용한데이터처리실례CASE 2) 여러엑셀파일의일부를복사하여붙여넣기, 사칙연산등집계

CASE 3) 인터넷에흩어져있는자료를자동수집

Page 12: Python을 활용한 데이터 분석

Python을활용한계량모형분석실례

Page 13: Python을 활용한 데이터 분석

Python을활용한계량모형분석실례

• 계산과학(Numerical Programming)

• 그래픽(Graphics)

• 통계(Statistics)

• 네트워크분석(Network Analysis)

• 병렬처리(Parallel Processing)

Page 14: Python을 활용한 데이터 분석

Python을활용한계량모형분석실례• 항상소득가설(Permanent Income Model)

Page 15: Python을 활용한 데이터 분석

Python을활용한계량모형분석실례• 인종분리모형(Schelling’s Segregation Model)

Page 16: Python을 활용한 데이터 분석

• Python은전산비전공자가배우기가장쉬운언어• 다양한서적과무료동영상강의

• 그러나, 가장효과적인방법은?

Python학습및활용에대한제안