Upload
byeungchun-kwon
View
461
Download
25
Embed Size (px)
Citation preview
Python을활용한데이터분석
권병천
목차
조사연구부서의데이터분석환경
향상된데이터분석환경
Python 소개
Python을활용한데이터처리실례
Python을활용한계량경제분석실례
Python 학습및활용을위한가이드라인
조사연구부서의데이터분석환경
적시성 다양성 확장성
향상된데이터분석환경
• 단순반복작업에대한자동화
• 고성능계산환경을활용
• 대용량데이터를간단히가공하고처리
적시성 다양성 확장성
Python 소개• Python 은오픈소스스크립트언어• 1991년개발된언어로범용, 고급프로그래밍언어• 다양한용도(웹개발, 그래픽인터페이스, 스크립트, 계산과학등)로널리활용
• Python is Now the Most Popular Introductory Teaching Language at Top U.S. Universities
TIOBE Index for November 2014 PYPL PopularitY of Programming Language index
Python 소개• Java, C# 등범용프로그래밍언어에비해높은생산성(코딩량기준약 90% 감소)
-높은수준의데이터구조(ex: DataFrame)나함수(ex: Numpy, Scikit)를제공
• 직관적이고유연한구조로초보자들이활용하기쉬움
-변수선언, 제어문작성시복잡하게요구되는사항이없음
• 다른언어/시스템간유연한확장구조
• 5만개가넘는확장패키지제공(R언어의경우 9천개)
처리속도 오류허용 안정성
Python vs R• 통계분석용언어로는우위를가리기어려움
• R은통계학자들이모여만든분석용언어
• Python은전산개발자가만든범용전산언어
• 최근들어두언어의차이는희석됨
• 그러나,-반복처리작업-코드재사용-데이터분석모형의시스템화
에있어서는 Python이유리
언어를굳이알필요가있을까?
Python을활용한데이터처리실례
Python을활용한데이터처리실례CASE 2) 여러엑셀파일의일부를복사하여붙여넣기, 사칙연산등집계
CASE 3) 인터넷에흩어져있는자료를자동수집
Python을활용한계량모형분석실례
Python을활용한계량모형분석실례
• 계산과학(Numerical Programming)
• 그래픽(Graphics)
• 통계(Statistics)
• 네트워크분석(Network Analysis)
• 병렬처리(Parallel Processing)
Python을활용한계량모형분석실례• 항상소득가설(Permanent Income Model)
Python을활용한계량모형분석실례• 인종분리모형(Schelling’s Segregation Model)
• Python은전산비전공자가배우기가장쉬운언어• 다양한서적과무료동영상강의
• 그러나, 가장효과적인방법은?
Python학습및활용에대한제안