47
서울대학교 데이터사이언스대학원 교과목 개요(안) 2019년 9월 서 울 대 학 교

서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

  • Upload
    others

  • View
    3

  • Download
    1

Embed Size (px)

Citation preview

Page 1: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

서울대학교

데이터사이언스대학원

교과목 개요(안)

2019년 9월

서 울 대 학 교

Page 2: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및
Page 3: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 1 -

□ 데이터사이언스대학원 신설 및 기존 교과목

교 과 목 명 교과목번호

전 공 필 수

데이터사이언스를 위한 프로그래밍 기초 신설

데이터사이언스를 위한 통계 기초 신설

데이터사이언스 캡스톤 프로젝트 신설

전 공 선 택

데이터 기반 혁신과 창업 신설

빅데이터 및 지식 관리 시스템 신설

머신러닝 및 딥러닝 기초 신설

확장형 병렬 프로그램 신설

데이터사이언스를 위한 빅데이터 시스템 신설

머신러닝 기반 음성인식 및 합성 신설

영상 빅데이터 분석 방법론 신설

텍스트 및 자연어 빅데이터 분석 방법론 신설

최적화 기법과 데이터 분석에의 응용 신설

심층강화학습을 이용한 빅데이터 응용 신설

탐색적 자료분석과 데이터 시각화 신설

데이터사이언스를 위한 통계 모형 신설

응용 데이터분석 신설

다수준 위계 회귀모형 신설

시공간 자료분석과 GIS 신설

데이터사이언스를 위한 학습이론 신설

데이터사이언스를 위한 통계심화 신설

디지털 인문학 신설

인문사회연구를 위한 빅데이터학 신설

보건의료 빅데이터 분석 신설

신경과학 컴퓨터모델링 신설

의료 데이터사이언스 프로젝트 신설

사회과학을 위한 데이터사이언스 신설

사회과학을 위한 네트워크 분석 신설

사회과학을 위한 텍스트분석 신설

Page 4: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 2 -

※ 대학원 개원 후 개설 교과목은 변동될 수 있음.

교 과 목 명 교과목번호

공공자료 빅데이터 마이닝 신설

소셜네트워크 분석 신설

고급 계산생물학 신설

도시 수권 정보공학 신설

스마트시티 설계 신설

역학, 제어 및 로보틱스 특강 신설

블록체인 신설

데이터사이언스 특강 신설

의생명 온톨로지 개론 기존

의학지식 표현 및 추론 기존

의학 통계 추론 기존

의료 데이터사이언스의 이해와 실습 1 기존

의료 데이터사이언스의 이해와 실습 2 신청중

생체정보공학 기존

고급자료분석 및 실습 기존

데이터마이닝 및 실습 기존

베이즈통계 및 실습 기존

생존자료분석 및 실습 기존

시계열분석 및 실습 기존

통계계산 기존

Page 5: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 3 -

❍ 데이터사이언스를 위한 프로그래밍 기초(Programming Foundations for Data Science)

교과목 번호명칭

국문 데이터사이언스를 위한 프로그래밍 기초 학점-강의시간-실습시간

(부여예정) 영문 Programming Foundations for Data Science 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매학기 강의담당교수교과구분 전공필수 개설학기 성적부여 A~F 수강정원 40

[국문 교과목 개요]

본 강좌는 프로그래밍 언어를 처음 접하는 대학원생을 위한 교과목으로 컴퓨터에 대한 일반

적인 기초개념 등을 설명하고 이와 같은 기초 지식을 바탕으로 Python 프로그래밍 언어를 사

용하는 방법을 습득한다. 수업 후반에는 Web scraping 및 machine learning classifier 구현

등 다양한 실습을 통해 데이터사이언스를 직접 경험해본다.

Ÿ 파이썬 기초 문법

Ÿ 문자열 및 정규표현식

Ÿ 데이터 타입 (list, dictionary, tuple)

Ÿ Pythonic code (list comprehension, enumerate, zip)

Ÿ 객체지향 프로그래밍

Ÿ 파일 입출력

Ÿ 모듈 및 패키지 사용법 (numpy, matplot)

Ÿ 웹 크롤링

Ÿ 분류 알고리즘 실습 (KNN, Linear regression, Decision tree, Random forest)

Ÿ Python을 통한 big data handling 실습 I: numpy 실습

[영문 교과목 개요]

This course targets graduate students who are relatively not familiar with programming. In

this course, students will learn the foundations of the computer and learn how to write

code in Python. At the end of the class, students will experience the data science through

various exercises such as Web crawling and Machine learning classifier implementation.

Ÿ Python basics

Ÿ String and regular expression

Ÿ Data type (list, dictionary, tuple)

Ÿ Pythonic code (list comprehension, enumerate, zip)

Ÿ Object Oriented Programming (OOP)

Ÿ File I/O

Ÿ Module and Packages (numpy, matplot)

Ÿ Web crawling

Ÿ Classifier algorithms exercises (KNN, Linear regression, Decision tree, Random forest)

Ÿ Big data handling with python exercise I: practicing Python numpy framework

Page 6: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 4 -

❍ 데이터사이언스를 위한 통계 기초 (Statistical Foundation for Data Science)

교과목 번호명칭

국문 데이터사이언스를 위한 통계 기초 학점-강의시간-실습시간

(부여예정) 영문 Statistical Foundation for Data Science 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매학기 강의담당교수교과구분 전공필수 개설학기 성적부여 A~F 수강정원 40

[국문 교과목 개요]

This course introduces various basic statistical methods and supporting probabilistic

and statistical theory that are fundamental to analyze data and extract insight from

the analysis results. Also, students will learn how each statistical method is applied to

real data in various application areas.

Ÿ Probability, Random variable, Probability distribution, Stochastic process

Ÿ Descriptive Statistics, Inferential Statistics, Statistical tests

Ÿ Sampling, Design of Experiment

Ÿ Matrix Algebra

Ÿ Linear models, Analysis of variance

Ÿ Nonparametric Statistics

Ÿ Discrete Data analysis

Ÿ Bayesian Methods

[영문 교과목 개요]

This course introduces various basic statistical methods and supporting probabilistic

and statistical theory that are fundamental to analyze data and extract insight from

the analysis results. Also, students will learn how each statistical method is applied to

real data in various application areas.

Ÿ Probability, Random variable, Probability distribution, Stochastic process

Ÿ Descriptive Statistics, Inferential Statistics, Statistical tests

Ÿ Sampling, Design of Experiment

Ÿ Matrix Algebra

Ÿ Linear models, Analysis of variance

Ÿ Nonparametric Statistics

Ÿ Discrete Data analysis

Ÿ Bayesian Methods

Page 7: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 5 -

❍ 데이터사이언스 캡스톤 프로젝트(Data Science Capstone Project)

교과목 번호명칭

국문 데이터사이언스 캡스톤 프로젝트 학점-강의시간-실습시간

(부여예정) 영문 Data Science Capstone Project 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매학기 강의담당교수

교과구분 전공필수 개설학기 성적부여 A~F 수강정원 40

[국문 교과목 개요]

본 과목에서는 데이터 분석 알고리즘, 시스템, 응용 등 다양한 분야의 문제들을 이해하고

기존 기술의 제약점을 해결하는 캡스톤 프로젝트를 진행한다. 이를 통해, 여러 과목에서 학

습한 이론을 실제 문제에 적용할 수 있는 응용 능력 및 문제 해결 능력 향상을 기대한다.

Ÿ 데이터 분석 기법 개발 프로젝트

Ÿ 데이터 기반 응용 프로젝트

Ÿ 빅데이터 응용 프로젝트

Ÿ 기계학습 응용 프로젝트

Ÿ 빅데이터 시스템 개발 프로젝트

[영문 교과목 개요]

This course focuses on capstone projects to understand problems in data analysis

algorithms, systems, and applications, and to address the limitations of current

technologies. Students are expected to develop skills for problem solving and applying

theories to real world problems.

Ÿ Project for developement of data analysis technique

Ÿ Project for data-driven application

Ÿ Project for big data application

Ÿ Project for machine learning application

Ÿ Project for big data system development

Page 8: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 6 -

❍ 데이터 기반 혁신과 창업 (Data-Driven Innovations and Entrepreneurship)

교과목 번호명칭

국문 데이터 기반 혁신과 창업 학점-강의시간-실습시간

(부여예정) 영문 Data-Driven Innovations and Entrepreneurship 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매년 강의담당교수

교과구분 전공선택 개설학기 성적부여 A~F 수강정원 40

[국문 교과목 개요]

데이터 기반의 파괴적 디지털 혁신은 지능 소프트웨어 서비스를 기반으로 한 신산업의 출

현과 이에 대항해 생존을 추구하는 기존 산업의 탈바꿈으로 이어지고 있다. 또한 혁신의 사

이클이 빨라지면서 전통적 산학연 협력이 퇴색하고 캠퍼스 벤처 창업과 대기업의 벤처 기

업 인수가 빈번해지고 있다. 이 과목은 데이터 기반의 과학 기술, 비즈니스 혁신 아키텍처

와 창업의 요건 및 성장 전략을 가르치며 시험 외에도 비즈니스 플랜 발표를 하게 된다.

Ÿ 기술생명주기, 파괴적 및 점진적 혁신, 혁신가의 딜레마, Chasm과 벤처 기업 성공 기회

Ÿ 빅데이터, 인공지능, 디지털 서비스 선순환 아키텍처와 B2B, B2C 성공 사례

Ÿ 실리콘 밸리 혁신 에코 시스템과 중국, 독일의 디지털 혁신 시스템 비교

Ÿ 데이터 기반 혁신 기업 비즈니스 플랜 만들기, 벤처 캐피털과 창업 기업의 가치 산정

Ÿ 창업 기업 성장과 변화하는 창업가의 역할

Ÿ 성공 창업가와 벤처 캐피털리스트와의 대화

[영문 교과목 개요]

Data-driven disruptive innovation leads to the emergence of various new intelligent

service industries as well as digital transformation of existing industry for survival. On

the other hand, with the increasing speed of innovation, university startups and big

company’s acquisition of such startups replace traditional industry-academia

collaboration. This course teaches data-driven science, technology, and business

innovation architecture, as well as the growth strategy of successful startups. Students

finish this course with their own business contest.

Ÿ Technology life cycle, disruptive and incremental innovation, innovator’s dilemma,

Chasm, success opportunities of startups.

Ÿ Virtuous cycle of big data, AI, and digital service, and B2B, B2C success cases

Ÿ Silicon valley digital innovation ecosystem and comparison with China and Germany

Ÿ Data-driven innovation business plan writing, venture capital, and valuation of

startups.

Ÿ Growth of startups and changing roles of founders

Ÿ Conversation with successful startup founders and venture capitalists

Page 9: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 7 -

❍ 빅데이터 및 지식 관리 시스템 (Big Data and Knowledge Management System)

교과목 번호명칭

국문 빅데이터 및 지식 관리 시스템 학점-강의시간-실습시간

(부여예정) 영문 Big Data and Knowledge Management System 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매년 강의담당교수

교과구분 전공 선택 개설학기 성적부여 A~F 수강정원 40

[국문 교과목 개요]

다양한 종류의 빅데이터, 지식의 모델링과 관리 기법을 데이터 기반 서비스 생명 주기 관점

에서 다룬다. 병렬 분산 클라우드 컴퓨팅 환경에서 최신의 빅데이터 수집, 저장, 분산, 처리

기술을 학습하고 실세계의 데이터 기반 응용 프로젝트를 완성하도록 한다.

Ÿ 데이터 모델링 및 관리 시스템의 역사적 발전

Ÿ 정형 데이터 관리와 관계형 데이터 모델

Ÿ 관계형 데이터 저장과 메타 데이터 관리, 질의 처리.

Ÿ 트랜잭션 및 데이터베이스 회복 관리

Ÿ 시공간 데이터, 그래프 데이터, 반정형 데이터, 비정형 데이터, 지식 구조체 관리

Ÿ 클라우드 환경에서의 병렬 분산 빅데이터 시스템과 복합 분석 및 기계 학습

Ÿ 빅데이터 및 모델 생명 주기 관리

[영문 교과목 개요]

This course deals with modeling and management of various types of big data and

knowledge from the data-driven service life cycle perspective. Students learn modern

technologies of ingestion, storage, distribution, and processing of big data in parallel

and distributed cloud computing environment, and complete a term project on

real-world data-driven applications.

Ÿ Historical development of data models and data management systems

Ÿ Structured data management and relational data model

Ÿ Relational data storage and meta data management, and query processing

Ÿ Transaction management and database recovery management

Ÿ Spatiotemporal data, graph data, semi-structured and unstructured data, and

knowledge structures

Ÿ Parallel and distributed big data systems and complex analytics processing and

machine learning on cloud infrastructure

Ÿ Big data and model life cycle management

Page 10: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 8 -

❍ 머신러닝 및 딥러닝 기초(Introduction to Machine Learning and Deep Learning)

교과목 번호명칭

국문 머신러닝 및 딥러닝 기초 학점-강의시간-실습시간

(부여예정) 영문 Introduction to Machine Learning and Deep Learning 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매학기 강의담당교수

교과구분 전공선택 개설학기 성적부여 A~F 수강정원 60

[국문 교과목 개요]

본 교과목은 데이터사이언스 전공자를 위한 머신러닝 (machine learning) 및 딥러닝 (deep

learning)의 기초적 주제를 다룬다.

Ÿ Introduction to machine learning

Ÿ Linear models

Ÿ Optimization and Regularization

Ÿ Kernel methods (support vector machines and kernel trick)

Ÿ Deep feedforward networks

Ÿ Convolutional neural networks

Ÿ Recurrent neural networks

[선수과목] 데이터사이언스를 위한 프로그래밍 기초, 데이터사이언스를 위한 통계기초

[영문 교과목 개요]

This course covers basic topics in machine learning and deep learning for data

scientists.

Ÿ Introduction to machine learning

Ÿ Linear models

Ÿ Optimization and Regularization

Ÿ Kernel methods (support vector machines and kernel trick)

Ÿ Deep feedforward networks

Ÿ Convolutional neural networks

Ÿ Recurrent neural networks

[Pre-requisites] Foundations of Programming for Data Science, Statistical Foundations

for Data Science

Page 11: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 9 -

❍ 확장형 병렬프로그래밍(Scalable Parallel Programming)

교과목 번호명칭

국문 확장형 병렬 프로그래밍 학점-강의시간-실습시간

(부여예정) 영문 Scalable Parallel Programming 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매학기 강의담당교수

교과구분 전공선택 개설학기 성적부여 A~F 수강정원 30

[국문 교과목 개요]본 강좌는 빅데이터 처리 등을 위한 확장형 병렬프로그래밍을 다루며, 실습을 통해 실제

적용 사례를 학습한다.

Ÿ Course introduction

Ÿ Parallel programming models and basics

Ÿ Program optimization (work distribution, scheduling, locality, communication)

Ÿ GPU architecture and CUDA programming

Ÿ Cache coherence and memory consistency

Ÿ Distributed computing using Spark

Ÿ Fine-grained synchronization and lock-free programming

Ÿ Transactional memory

Ÿ Heterogeneous parallelism and hardware specialization

Ÿ Parallel deep neural network training and evaluation

[선수과목] 데이터사이언스를 위한 프로그래밍 기초

[영문 교과목 개요]This course covers scalable parallel programming for big data processing. Students will

have chances to have hands-on experience through computer labs for practical

applications

Ÿ Course introduction

Ÿ Parallel programming models and basics

Ÿ Program optimization (work distribution, scheduling, locality, communication)

Ÿ GPU architecture and CUDA programming

Ÿ Cache coherence and memory consistency

Ÿ Distributed computing using Spark

Ÿ Fine-grained synchronization and lock-free programming

Ÿ Transactional memory

Ÿ Heterogeneous parallelism and hardware specialization

Ÿ Parallel deep neural network training and evaluation

[Pre-requisite] Foundations of Programming for Data Science

Page 12: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 10 -

❍ 데이터사이언스를 위한 빅데이터 시스템(Big Data System for Data Science)

교과목 번호명칭

국문 데이터사이언스를 위한 빅데이터 시스템 학점-강의시간-실습시간

(부여예정) 영문 Big Data System for Data Science 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 강의담당교수

교과구분 전공선택 개설학기 성적부여 A~F 수강정원 40

[국문 교과목 개요]

본 강좌에서는 빅데이터를 다루기 위한 데이터 관리 기술과 시스템에 대해 배운다. 실제 분

산 빅데이터 시스템에서의 프로그래밍을 위한 이론 학습 및 실습을 진행한다. 이를 통해 대

용량 빅데이터를 빠르고 효과적으로 다루는 방법을 익힌다.

Ÿ 빅데이터 시스템 개요

Ÿ MapReduce/Hadoop 개요

Ÿ MapReduce/Hadoop을 이용한 데이터 수집 및 처리

Ÿ MapReduce/Hadoop 응용

Ÿ Spark 개요

Ÿ Spark을 이용한 데이터 수집 및 처리

Ÿ Spark 응용

Ÿ 빅데이터 시스템 사례 연구

[선수과목] 빅데이터 및 지식 관리 시스템

[영문 교과목 개요]

This course covers systems and technologies for big data management system. Students

will learn theories and practices for programming in distributed big data system.

Students are expected to handle big data in fast and efficient ways.

Ÿ Overview of Big Data System

Ÿ Overview of MapReduce/Hadoop

Ÿ Data collection and processing using MapReduce/Hadoop

Ÿ Application of MapReduce/Hadoop

Ÿ Overview of Spark

Ÿ Data collection and processing using Spark

Ÿ Application of Spark

Ÿ Case studies of Big Data System

[Pre-requisite] Big Data and Knowledge Management System

Page 13: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 11 -

❍ 머신러닝기반 음성인식 및 합성(Machine Learning-Based Speech Recognition and Synthesis)

교과목 번호명칭

국문 머신러닝기반 음성인식 및 합성 학점-강의시간-실습시간

(부여예정) 영문 Machine Learning-Based Speech Recognition and Synthesis 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매학기 강의담당교수

교과구분 전공선택 개설학기 성적부여 A~F 수강정원 30

[국문 교과목 개요]

본 교과목은 데이터사이언스 전공자를 위한 머신러닝 (machine learning) 기반 음성인식

및 음성합성 기술을 다룬다.

Ÿ Introduction to ASR (automatic speech recognition) and TTS (text-to-speech)

Ÿ Speech modeling, acoustic modeling

Ÿ Linear prediction techniques

Ÿ Cepstral analysis, spectral methods

Ÿ Filter-bank analysis, harmonic analysis

Ÿ Tacotron methods

Ÿ WaveNet, Parallel WaveNet, WaveGlow

Ÿ Practical aspects of ASR and TTS

[선수과목] 데이터사이언스를 위한 프로그래밍 기초, 데이터사이언스를 위한 기초 통계,

머신러닝 및 딥러닝 기초

[영문 교과목 개요]

This course covers basic topics in machine learning-based speech recognition and

synthesis for data scientists.

Ÿ Introduction to ASR (automatic speech recognition) and TTS (text-to-speech)

Ÿ Speech modeling, acoustic modeling

Ÿ Linear prediction techniques

Ÿ Cepstral analysis, spectral methods

Ÿ Filter-bank analysis, harmonic analysis

Ÿ Tacotron methods

Ÿ WaveNet, Parallel WaveNet, WaveGlow

Ÿ Practical aspects of ASR and TTS

[Pre-requisites] Foundations of Programming for Data Science, Statistical Foundations

for Data Science, Introduction to Machine Learning and Deep Learning

Page 14: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 12 -

❍ 영상 빅데이터 분석 방법론(Visual Data Analysis)

교과목 번호명칭

국문 영상 빅데이터 분석 방법론 학점-강의시간-실습시간

(부여예정) 영문 Visual Data Analysis 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매학기 강의담당교수

교과구분 전공선택 개설학기 성적부여 A~F 수강정원 40

[국문 교과목 개요]

본 강좌는 대학원생을 위한 교과목으로 영상 데이터를 이용한 수학적 모델링 기술 및 기계

학습 기술 등을 강의한다. 기본적인 기계 학습 기술 및 최근 유행하고 있는 딥 러닝(deep

learning) 기술이 영상 데이터에 어떻게 적용되는지 알아본다. 이론 강의뿐만 아니라 실습과

프로젝트를 통하여 영상 데이터 분석에 필요한 다양한 기술을 학습한다.

Ÿ 기초 확률 및 선형대수, 기초 통계 및 정보이론

Ÿ Supervised, unsupervised and semi-supervised learning

Ÿ Convolutional Neural Networks (CNNs) and Recurrent Neural Networks (RNNs)

Ÿ Image classification, object detection, image segmentation

Ÿ Video understanding

Ÿ Generative modeling

[선수과목] 기초수학(미적분/확률/선형대수), 프로그래밍 방법론

[영문 교과목 개요]

This course aims to facilitate understanding basic-to-advanced mathematical modeling

and machine learning techniques including deep learning. The primary target of this

course is the first- or second-year graduate students, who already have basic skills

about data science and programming. This course is composed of lectures, practices,

and projects.

Ÿ Probability and linear algebra, Statistics and information theory

Ÿ Supervised, unsupervised and semi-supervised learning

Ÿ Convolutional Neural Networks (CNNs) and Recurrent Neural Networks (RNNs)

Ÿ Image classification, object detection, image segmentation

Ÿ Video understanding

Ÿ Generative modeling

[Pre-requisite] Basic mathematics(Calculus/Probability/Linear algebra), Programming

methodology

Page 15: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 13 -

❍ 텍스트 및 자연어 빅데이터 분석 방법론(Text Analytics and Big Data)

교과목 번호명칭

국문 텍스트 및 자연어 빅데이터 분석 방법론 학점-강의시간-실습시간

(부여예정) 영문 Text Analytics and Big Data 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매학기 강의담당교수

교과구분 전공선택 개설학기 성적부여 A~F 수강정원 40[국문 교과목 개요]

본 강좌는 대학원생을 위한 데이터사이언스의 응용 교과목으로 텍스트 및 자연어로 이루어

진 빅데이터 분석 방법론을 학습한다. 딥러닝 모델의 실제 문제에 적용되는 사례들과 이를

위한 모델을 variant 들을 학습하고, 자연어 처리 분야의 최신 딥러닝 구조에 대해서도 이해

한다. 프로젝트를 통해 학습 내용을 실제 문제에 적용하고 발표한다.

Ÿ 자연어 처리 기본 이론 (tokenization, n-gram language model, 통계적 자연어 처리)

Ÿ 자연어 표현 방법 (Bag of word, TF-IDF, Word Vector Representation (Word2Vec,

Glove, ELMo)

Ÿ Topic Modeling (LSA, LDA)

Ÿ Basic Text Classification (Linear Regression, Naive Bayes, SVM, XGBoost)

Ÿ DNN, CNN을 활용한 Text Classification (Sentiment analysis)

Ÿ RNN계열 모델 (RNN, LSTM, GRU)을 활용한 Text Classification (Sentiment analysis)

Ÿ 딥러닝 최근 모델 소개 I: Transformer model, BERT (Bidirectional Encoder

Representations from Transformers)

Ÿ 딥러닝 최근 모델 소개 II: Graph Representation Learning (Graph Convolutional

Network, Graph Attention Network)

Ÿ Final Project (Text Analytics using Deep Neural Network)

[선수과목] 기초수학(미적분/확률/선형대수), 데이터구조 및 알고리즘, 프로그래밍 방법론[영문 교과목 개요]

In this course, students will learn the foundations of data science and machine learning

in natural language processing (NLP) area such as sentiment analysis and topic

modeling. To this ens, there will be a final project that students will have a chance to

apply algorithms for practical tasks.

Ÿ Basic in NLP (tokenization, n-gram language model, statistical NLP)

Ÿ Text Representation (Bag of word, TF-IDF, Word2Vec, Glove, ELMo)

Ÿ Basic Text Classification (Linear Regression, Naive Bayes, SVM, XGBoost)

Ÿ Text Classification using Deep Learning Model (DNN, CNN)

Ÿ Text Classification using Recurrent Neural Networks (RNN, LSTM, GRU)

Ÿ Recent Algorithms in Deep Learning I: (Transformer, BERT)

Ÿ Recent Algorithms in Deep Learning II: (Graph Representation Learning in NLP)

Ÿ Final Project (Text Analytics using Deep Neural Network)

[Pre-requisite] Basic mathematics(Calculus/Probability/Linear algebra), Data structure &

algorithm, Programming methodology

Page 16: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 14 -

❍ 최적화 기법과 데이터 분석에의 응용

(Optimization Technique and Its Application for Data Analysis)

교과목 번호명칭

국문 최적화 기법과 데이터 분석에의 응용 학점-강의시간-실습시간

(부여예정) 영문 Optimization Technique and Its Application for Data Analysis 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 강의담당교수

교과구분 전공선택 개설학기 성적부여 A~F 수강정원 40[국문 교과목 개요]

최적화는 여러 데이터 분석 기법을 이해하고 활용하는데 매우 중요한 기법이다. 어떤 문제

를 최적화 프레임워크로 표현하고 또한 그것을 푸는 것은 데이터 분석가가 갖춰야 할 핵심

능력이다. 본 강좌는 데이터 분석에서의 최적화와 연관된 중요 기법, 알고리즘, 응용, 사례

등을 다룬다.

Ÿ Optimization framework

Ÿ Convex sets and function

Ÿ Convex optimization

Ÿ Algorithms for optimization

Ÿ Linear programming

Ÿ Quadratic programming

Ÿ Applications in data analysis

Ÿ Case studies

[영문 교과목 개요]

Optimization is a crucial tool for many data analysis techniques. Formulating a problem

into an optimization framework, and solving it are core skills for data analysts. This

course covers important methods, algorithms, applications, and case studies of

optimization in data analysis.

Ÿ Optimization framework

Ÿ Convex sets and function

Ÿ Convex optimization

Ÿ Algorithms for optimization

Ÿ Linear programming

Ÿ Quadratic programming

Ÿ Applications in data analysis

Ÿ Case studies

Page 17: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 15 -

❍ 심층강화학습을 이용한 빅데이터 응용

(Bigdata Application Using Deep Reinforcement Learning)

교과목 번호명칭

국문 심층강화학습을 이용한 빅데이터 응용 학점-강의시간-실습시간

(부여예정) 영문 Bigdata Application Using Deep Reinforcement Learning 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 강의담당교수

교과구분 전공선택 개설학기 성적부여 A~F 수강정원 40

[국문 교과목 개요]

심층강화학습은 자율 에이전트가 환경과의 상호작용을 통한 학습을 기반으로 하는 머신러

닝의 한 연구분야 이다. 심층 강화 학습은 최근 개발된 사람을 능가하는 머신 러닝 기법을

만드는데 활용되어 왔다. 본 강좌는 심층강화학습 기법과, 관련된 빅데이터 응용을 다룬다.

Ÿ MDP

Ÿ Value function

Ÿ Policy gradient

Ÿ UCB

Ÿ Exploration vs. Exploitation

Ÿ Deep reinforcement learning

Ÿ 빅데이터 응용

[영문 교과목 개요]

Deep reinforcement learning is an important subfield of machine learning addressing the

interaction of an autonomous agent with the environment. Deep reinforcement learning

has been used to design recent machine learning methods that outperform humans. This

course covers techniques and bigdata applications of deep reinforcement learning.

Ÿ MDP

Ÿ Value function

Ÿ Policy gradient

Ÿ UCB

Ÿ Exploration vs. Exploitation

Ÿ Deep reinforcement learning

Ÿ Bigdata Application

Page 18: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 16 -

❍ 탐색적 자료분석과 데이터시각화

(Exploratory Data Analysis and Data Visualization)

교과목 번호명칭

국문 탐색적 자료분석과 데이터시각화 학점-강의시간-실습시간

(부여예정) 영문 Exploratory Data Analysis and Data Visualization 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매학기 강의담당교수

교과구분 전공선택 개설학기 성적부여 A~F 수강정원 40

[국문 교과목 개요]

본 강좌는 통계모형을 이용한 고급 자료 분석의 전 단계로 자료에 대한 충분한 이해와 인

사이트를 발견하는데 필요한 탐색적 자료 분석 방법들과 이에 도움을 주는 효과적인 시각

화 방법에 대한 이론과 응용을 배운다.

Ÿ 요약통계

Ÿ 그래프 문법 원리

Ÿ 데이터 랭글링

Ÿ 상관성 그래프 요약 (상관관계, 시계열, 인과관계)

Ÿ 다변량 자료의 시각화

Ÿ 시계열 동적 자료의 시각화

Ÿ 비정형 자료 시각화

Ÿ 인터랙티브 그래프의 이론과 응용(shiny)

[선수과목] 데이터사이언스를 위한 통계 심화

[영문 교과목 개요]

This course introduces exploratory data analysis and data visualization methods for a

rich understanding of the data and finding insights as a preliminary step before

advanced data analysis. Students will learn the grammar of graph principles, various

visualization approaches and interactive graph.

Ÿ Summary Statistics

Ÿ Grammar of Graph Principles

Ÿ Data Wrangling

Ÿ Visualization of relationships (correlation, time series, causation)

Ÿ Visualization of multi-variate data

Ÿ Time series of dynamic graph

Ÿ Visualization of unstructured data

Ÿ Interactive graph (shiny)

[Pre-requisite] Advanced Statistics for Data Science

Page 19: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 17 -

❍ 데이터사이언스를 위한 통계모형 (Statistical Models for Data Science)

교과목 번호명칭

국문 데이터과학을 위한 통계모형 학점-강의시간-실습시간

(부여예정) 영문 Statistical Models for Data Science 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매학기 강의담당교수

교과구분 전공선택 개설학기 성적부여 A~F 수강정원 40

[국문 교과목 개요]

본 강좌는 고급 자료분석을 위한 모형기반 통계분석방법론에 대해 다룬다. 자료의 특징과

분석의 목적에 따라 적합한 통계모형을 제시하고, 자료를 적합, 적합된 통계모형의 해석을

통한 인사이트제시등에 대해 다룬다.

Ÿ 선형모형, 선형혼합모형 및 추론

Ÿ 비선형 모형

Ÿ 일반화 선형모형

Ÿ 모형적합진단

Ÿ 변수선택

Ÿ 모형선택 및 검증

[선수과목] 데이터 과학을 위한 통계 심화

[영문 교과목 개요]

This course provides model-based statistical methods for advanced data analysis. Based

on the characteristics of data and analysis purpose, we learn how to find appropriate

statistical models, how to fit the model to the data and interpret fitted models for

extracting the insights.

Ÿ Linear models, Linear mixed model and inference

Ÿ Nonlinear models

Ÿ Generalized linear models

Ÿ Model diagnostics

Ÿ Variable selection

Ÿ Model selection and Model evaluation

[Pre-requisite] Advanced Statistics for Data Science

Page 20: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 18 -

❍ 응용데이터분석 (Applied Data Analysis)

교과목 번호명칭

국문 응용데이터분석 학점-강의시간-실습시간

(부여예정) 영문 Applied Statistical Learning 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매학기 강의담당교수

교과구분 전공선택 개설학기 성적부여 A~F 수강정원 40[국문 교과목 개요]

중.상급 수준의 다양한 통계적 방법론을 배우고 이들을 실제 자료에 적용하는 사례들을

배운다. 본 교과목에서 다루는 주제는 다음과 같다.

Ÿ 메타분석

Ÿ 잠재층 분석

Ÿ 성향점수 맞추기

Ÿ 결측값 대체

Ÿ 다차원 척도화

Ÿ 붓스트랩 방법

Ÿ 로버스트 회귀와 분위수 회귀

Ÿ 일반화선형모형

Ÿ 국소적회귀

Ÿ 일반화가법모형

[선수과목] 데이터사이언스를 위한 통계 심화 [영문 교과목 개요]

This course covers various intermediate and advanced statistical methods and their

applications to real data examples. The detailed topic covered in the class are:

Ÿ Meta analysis

Ÿ Latent class analysis

Ÿ Propensity score matching

Ÿ Missing imputation

Ÿ Multi-dimensional scaling

Ÿ Bootstrap method

Ÿ Robust regression and quantile regression

Ÿ Generalized linear model

Ÿ Local regression

Ÿ Generalized additive model

[Pre-requisite] Advanced Statistics for Data Science

Page 21: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 19 -

❍ 다수준 위계 회귀모형

(Multilevel and Hierarchical Regression Model)

교과목 번호명칭

국문 다수준 위계 회귀모형 학점-강의시간-실습시간

(부여예정) 영문 Multilevel and Hierachical Regression Model 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매학기 강의담당교수

교과구분 전공선택 개설학기 성적부여 A~F 수강정원 40

[국문 교과목 개요]

다수준 위계모형은 사회과학과 생명과학에서 특히 많이 사용되는 정교한 통계모형중 하나

이다. 이러한 모형은 특히 데이터가 군집을 이룰 때 군집안의 자료들간의 관련성이 군집 밖

의 자료들보다 강한다는 사실을 고려한 분석방법이다. 이 과목에서는 사회과학, 보건분야의

연구자가 통계소프트웨어(R과 Stan)을 사용하여 수업시간에 배운 내용을 다양한 응용사례

를 적용할 수 있도록 한다.

Ÿ 일반화 선형모형

Ÿ 다수준 위계모형

Ÿ 모형선택

Ÿ 베이즈통계와 몬테카를로 마코프체인

Ÿ 모형진단

[선수과목] 데이터과학을 위한 통계심화

[영문 교과목 개요]

Multilevel and hierarchical models are among the most broadly applied sophisticated

statistical models, especially in the social and biological sciences. They apply to

situations in which the data cluster naturally into groups of units that are more related

to each other than they are the rest of the data, and where relationships between

variables are different for each individual or group of individuals. The course will involve

the practical application of the ideas and their implementation through statistical

software (R and Stan) to make them accessible to social and public health scientists.

Ÿ Generalized linear mixed models

Ÿ Multilevel and hierarchical models

Ÿ Model selection

Ÿ Bayesian Statistics & MCMC

Ÿ Model diagnostics

[Pre-requisite] Advanced Statistics for Data Science

Page 22: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 20 -

❍ 시공간자료분석과 GIS (Spatio-temporal data analysis and GIS)

교과목 번호명칭

국문 시공간자료분석과 GIS 학점-강의시간-실습시간

(부여예정) 영문 Spatio-temporal data analysis and GIS 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매학기 강의담당교수

교과구분 전공선택 개설학기 성적부여 A~F 수강정원 40

[국문 교과목 개요]

본 강좌에서는 공간상에 관측되는 자료, 시공간으로 관측되는 자료의 GIS를 통한 시각화 및

시공간자료를 분석하는데 사용되는 통계방법론에 대해 다룬다.

Ÿ GIS 시스템과 공간자료 시각화

Ÿ 공간자료의 특징에 따른 요약통계 및 가설검정

Ÿ 공간 및 시공간 자료의 베리오그램 및 공분산 모형

Ÿ 공분산 모형 추정

Ÿ 공간자료예측을 위한 크리깅

[선수과목] 데이터 과학을 위한 통계 심화

[영문 교과목 개요]

This course introduces visualization of spatial data or spatio-temporal data using GIS 

system and statistical methods for analyzing spatial data, time series data and

spatio-temporal data.

Ÿ GIS system and visualization of spatial data

Ÿ Descriptive statistics and hypothesis tests for spatial data

Ÿ Variogram and covariance models for spatial data and spatio-temproal data

Ÿ Inference for variogram and covariance models

Ÿ Kriging methods for spatial and spatio-temporal prediction

[Pre-requisite] Advanced Statistics for Data Science

Page 23: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 21 -

❍ 데이터사이언스를 위한 학습이론 (Learning Theory for Data Science)

교과목 번호명칭

국문 데이터과학을 위한 학습이론 학점-강의시간-실습시간

(부여예정) 영문 Learning Theory for Data Science 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매학기 강의담당교수

교과구분 전공선택 개설학기 성적부여 A~F 수강정원 40

[국문 교과목 개요]

본 강좌에서는 다양한 통계학습방법의 이론을 배운다. 본 교과목에서 다음의 내용을 배운

다.

Ÿ 분포함수 추정 이론

Ÿ 비모수 회귀, 비모수 분류 이론

Ÿ 군집 분석 이론

Ÿ Concentration of measure

Ÿ 미니맥스 이론

Ÿ 희소 회귀 이론

Ÿ 그래피컬 모형 이론

Ÿ Causal inference

Ÿ 비모수 베이즈 이론

[선수과목] 데이터 과학을 위한 통계 심화, 데이터 과학을 위한 통계 모형

[영문 교과목 개요]

This course covers theory of various statistical learning. The topics below are covered.

Ÿ Density estimation

Ÿ Nonparametric regression and classification

Ÿ Cluster analysis

Ÿ Concentration of measure

Ÿ Minimax theory

Ÿ Regularization and sparse regression

Ÿ Graphical model

Ÿ Causal inference

Ÿ Nonparametric Bayesian methods

[Pre-requisite] Advanced Statistics for Data Science, Statistical Models for Data Science.

Page 24: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 22 -

❍ 데이터사이언스를 위한 통계 심화 (Advanced Statistics for Data Science)

교과목 번호명칭

국문 데이터사이언스를 위한 통계 심화 학점-강의시간-실습시간

(부여예정) 영문 Advanced Statistics for Data Science 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매학기 강의담당교수

교과구분 전공선택 개설학기 성적부여 A~F 수강정원 40[국문 교과목 개요]

본 강좌는 통계 추론에 관한 다양한 주제를 소개하는 한학기 과정이다. 본 강좌에서 점추

정, 가설검정, 구간추정과 점근이론과 수리통계의 기본적인 주제를 다룬다. 또한 비모수 함

수추정, 재표본추출, 그래프 모형과 같은 고급 방법론에 대해 알아보고 학생들은 이론적

개념과 통계적 방법에 관한 균형적인 시각을 가질 수 있도록 한다.

Ÿ 확률이론

Ÿ 확률부등식

Ÿ 점추정

Ÿ 최대우도량의 점근이론

Ÿ 가설검정

Ÿ 재표본추출

Ÿ 비모수 함수추정

Ÿ 분류

Ÿ 인과추론

Ÿ 그래프 모형

[선수과목] 데이터사이언스를 위한 통계기초[영문 교과목 개요]

This is a one-semester course introducing various topics in statistical inference. We

cover fundamental topics in mathematical statistics such as point estimation, hypothesis

testing, interval estimation and asymptotic theory. We also cover advanced and useful

including nonparametric function estimation, resampling and graphical models. This

course will seek balance between theoretical concepts and statistical tools.

Ÿ Probability theory

Ÿ Concentration inequality

Ÿ Point estimation

Ÿ Asymptotics of MLE

Ÿ Hypothesis testing

Ÿ Resampling

Ÿ Nonparametric function estimation

Ÿ Classification

Ÿ Causal inference

Ÿ Graphical models

[Prerequisite] Statistical Foundation for Data Science

Page 25: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 23 -

❍ 오믹스 기반 생명정보학 (Omics-based bioinformatics) 3-3-0

교과목 번호명칭

국문 오믹스 기반 생명정보학 학점-강의시간-실습시간

(부여예정) 영문 Omics-based bioinformatics 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 1년 강의담당교수 황대희

교과구분 전공선택 개설학기 1학기 성적부여 A~F 수강정원 60

[국문 교과목 개요]

본 강좌는 대학원생을 위한 생명정보학 기초 교과목으로 (1) 생명 시스템 종류(단일분자, 분

자컴플렉스, 소기관, 세포, 조직, 장기, 순환체계 등), 구조 및 특성, (2) 오믹스 (유전체, 단백

체, 대사체 등) 기술, (3) 데이터 표준화, 노멀라이제이션 및 시각화, (4) 특정 조건 특이적

유전자 동정, 그룹화, 및 기능농축분석, (5) 생체네트워크 종류, 모델링 및 분석, (6) 주요 조

절 인자, 생체경로, 네트워크 모듈 동정 등 오믹스 기반 생명정보학 기법들을 학습한다. 학

습한 기법들을 실제 생명 문제에 적용된 사례를 강의하고, 이들 기법들을 적용할 수 있는

텀프로젝트 과제를 부여한다. 이 텀프로젝트에 대해, 생물학적 문제를 정의, 이 문제에 대한

적합한 시스템을 결정, 이 시스템에 대해서 생산된 오믹스 데이터를 공개 오믹스 데이터베

이스로부터 확보, 상기된 방법들을 적용하여 조절인자/생체경로/네트워크 모듈 기반 주어진

문제에 대한 답을 제공했는가를 평가한다.

[선수과목] 데이터사이언스을 위한 통계 기초

[영문 교과목 개요]

This course teaches fundamental methodologies in omics-based bioinformatics or

systems biology including (1) Type, structure, and characteristics of biological systems

(single molecules, molecular complexes, organelles, cells, tissues, organs, circulation

systems, etc.), (2) omics (genomics, transcriptomics, epigenomics, proteomics,

metabolomics, etc.) technologies, (3) standard data formats for exchange and storage

and data normalization and visualization, (4) Identification of genes/proteins/metabolites

predominantly expressed in a particular condition (e.g., diseases, stresses, and infections),

clustering, and functional enrichment analysis, (5) Types of biological networks and

network modeling and analysis, and (6) Identification of key regulators, pathways, or

network modules governing a given phenotype. Case studies where these

methodologies are applied to real biological questions will be introduced. A term

project will be given as a final exam. In this term project, a biological question should

be defined, a relevant biological system should be determined, omics data sets

generated from the system should be obtained from public omics databases, and the

aforementioned methodologies should be applied to the data sets to answer the given

question in terms of key regulators, pathways, or network modules.

[Pre-requisite] Statistical Foundations for Data Science

Page 26: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 24 -

❍ 디지털 인문학 (Digital Humanities)

교과목 번호명칭

국문 디지털 인문학 학점-강의시간-실습시간

(부여예정) 영문 Digital Humanities 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매년 강의담당교수교과구분 전공선택 개설학기 성적부여 A~F 수강정원 20

[국문 교과목 개요]

디지털 기술의 혁신은 인간 사회와 문화에 대한 연구에 어떠한 영향을 미치고 있는가?

21세기에는 인문학자들이 다루는 자료가 한편으로는 대량으로 전산화 되고 있고 다른

한편으로는 본 디지털 형태로 생성되어 데이터사이언스와의 접목이 화두로 떠오르고 있다.

역사, 문학, 철학, 미술, 지역학 등 분야의 전공자들은 데이터를 어떠한 방식으로 다루어

왔고 최근에는 어떠한 방법론이 주목 받는가? 인문학에서 다루는 다양한 데이터를 기계가

처리 가능하게 정리하고 텍스트 분석, GIS, 네트워크 분석, 문화 분석학, 그리고 인공지능

등을 활용하여 여러 방식으로 접근해 보는 실습을 한다. 또한, 인문학의 관점에서

데이터사이언스에 대하여 성찰해 보는 시간을 가진다.

Ÿ 전산 인문학(humanities computing)과 디지털 인문학(digital humanities)의 구분

Ÿ 북미 학계의 성향

Ÿ 유럽 학계의 성향

Ÿ 동아시아 학계의 성향

Ÿ 디지털 한국학의 기원과 현황, 그리고 인문콘텐츠학

Ÿ 소셜 컴퓨팅, 언론정보학, 그리고 디지털 인문학

Ÿ 레프 마노비치의 문화 분석학(cultural analytics)

Ÿ 네이쳐 지에 실린 디지털 미술사(digital art history) 논문

Ÿ 성공적인 사례로 인정되는 연구를 소개하고 토론을 통해 비판

(예) 한문, 영문학, 아랍어 자료의 텍스트 분석, 여러 나라 역사인물사전의 네트워크 분석,

인스타그램 사진이 보여주는 글로벌 도시들의 특성과 공통점, 합성사진이 보여주는 인종 및

젠더 이미지, 등등

[영문 교과목 개요]

TBA

Page 27: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 25 -

❍ 인문사회연구를 위한 빅데이터학 (Big Data Studies)

교과목 번호명칭

국문 인문사회연구를 위한 빅데이터학 학점-강의시간-실습시간

(부여예정) 영문 Big Data Studies for Humanities and Social Sciences 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매년 강의담당교수

교과구분 전공선택 개설학기 성적부여 A~F 수강정원 20

[국문 교과목 개요]

21세기 사회에서는 인문학 연구에 필요한 자료가 문서 형태로 존재하지 않는다. 초기

디지털 시대를 대표하는 하드디스크나 플로피디스크에 저장되어 있는 문서 파일의 형태로

존재 한다는 보장도 없다. 2020년 현재 인류는 매일 페타바이트 단위로 측정해야 하는

엄청난 양의 데이터를 생산하고 있고 이러한 데이터는 운동장 크기만한 대형건물에

수십만개의 SSD 디스크에 집합체 형태로 저장되고 아카이빙 된다.

빅데이터를 주로 3V 혹은 5V라는 속성으로 정의를 내리는데 바로 양(volume), 가변성이나

복잡성(variability 혹은 complexity), 속도(velocity), 정확성(veracity), 그리고 가치(value)이다.

빅데이터는 기본적으로 방대하고 복잡하며 변화를 보여준다. 데이터사이언스는 이러한

빅데이터를 신뢰 있게 분석하여 가치가 있는 결과를 도출해 내는데 목적이 있다고 볼 수

있다.

그러나 인문학의 관점에서 보면 빅데이터란 인류를 연구하는 패러다임을 바꾸는 기술이다.

인간인 관찰자가 부재한 상태에서 기록이 생성되고 개체가 아니라 네트워크 형태로

존재하는 클라우드 형태로 데이터가 저장된다. 데이터가 워낙 방대하고 법적인 문제로 많은

부분을 알고리즘이 지우거나 검열한다. 또한, 데이터가 정지된 상태가 아니라 급속도로,

구체적으로 말하면 밀리세컨드 단위로 만들어지고 수정되고 삭제된다. 빅데이터가 인간

사회와 문화에 시사하는 바는 무엇인가?

Ÿ 빅데이터란? 빅데이터학이란?

Ÿ 초기 디지털 시대에 있었던 여러 가지 예측과 논란

Ÿ 세계의 메이저 데이터센터의 위치와 구조

Ÿ 데이터센터에서 근무하는 엔지니어를 인터뷰

Ÿ 들뢰즈, 델란다 등 빅데이터를 이해하는데 도움이 되는 철학을 소개하고 토론

Ÿ 실리콘밸리 중심의 세계관에서 벗어나 있는 중국과 러시아의 사례를 소개

[영문 교과목 개요]

TBA

Page 28: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 26 -

❍ 보건의료 빅데이터 분석 (Big Data Analytics in Healthcare)

교과목 번호명칭

국문 보건의료 빅데이터 분석 학점-강의시간-실습시간

(부여예정) 영문 Big Data Analytics in Healthcare 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 1년 강의담당교수교과구분 전공선택 개설학기 성적부여 A~F 수강정원 40

[국문 교과목 개요]본 강좌는 보건의료분야에서 발생하는 데이터에 관심 있는 학생들을 위한 교과목으로 보건

의료분야에서 발생하는 다양한 데이터 종류(임상데이터, 건강보험청구데이터, 소셜데이터

등)와 특징을 살펴보고 이들 데이터의 분석방법에 대해 학습한 후 소규모 프로젝트를 개발

한다.

Ÿ 보건의료데이터의 종류 (공공데이터, 임상데이터, 소셜데이터) 및 특성

Ÿ 보건의료 데이터 관련 이슈(개인정보 보호, 데이터 소유권)

Ÿ 보건의료데이터 표현 (Ontology, terminology, common data models)

Ÿ Data preparation/transformation

Ÿ 보건의료 분야 핵심 데이터 분석방법(Bayesian Inference, Artificial neural network,

Association rule, Cluster analysis, Social network analysis etc)

Ÿ 활용 분야 (Event sequencing, analytical groupers, predictive modeling. risk

stratification, population health management, quality measurement, Fraud detection,

cost containment)

Ÿ 프로젝트 개발

[선수과목] 중급 통계, R

[영문 교과목 개요]This course targets graduate students who have interests in the healthcare data. In this

course, students will learn the typeas and characteristics of health big data (clinical

data, public sector data and patient-generated data) and key components of healthcare

analytics with use cases. Students will be asked to develop a research project.

Ÿ Types and characteristics of big data in healthcare

Ÿ Common representation of healthcare data (ontology, terminology, common data

model)

Ÿ Data preparation/transformation

Ÿ Key components of healthcare analytics (Bayesian Inference, Artificial neural network,

Association rule, Cluster analysis, Social network analysis etc)

Ÿ Use cases (event sequencing, analytical groupers, predictive modeling. risk

stratification, population health management, quality measurement, fraud detection,

cost containment)

Ÿ Ethics, data ownership and privacy

Ÿ Project development

[Pre-requisite] Intermediate level statistics, R

Page 29: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 27 -

❍ 신경과학 컴퓨터모델링 (Computational Neuroscience)

교과목 번호명칭

국문 신경과학 컴퓨터모델링 학점-강의시간-실습시간

(부여예정) 영문 Computational Neuroscience 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매학기 강의담당교수교과구분 전공선택 개설학기 성적부여 A~F 수강정원 40

[국문 교과목 개요]

본 강좌는 뇌신경과학의 기초이론과 이를 응용한 모델링기법을 배우는 강좌이다. 뇌에 대한

수학적 모델, 이론적인 분석, 추상화 등을 통해 발달신경과학, 신경생리학의 기초적 이해를

제공하며, 이를 통하여 질병현상에 대한 시뮬레이션 및 질병모델을 개발할 수 있는 기술과

이론을 배운다.

기말과제를 통하여 신경학적으로 흔히 발생할 수 있는 질병모델을 구축해 봄으로써 학습한

모델링 기법의 응용적 경험을 쌓을 수 있도록 지도한다.

본 과목의 강의주제는 다음과 같다.

Ÿ 뇌신경학의 해부생리학 기초 이론

Ÿ 신경세포 행동에 대한 전기생리학적 특성과 해석

Ÿ 뇌신경과학 모델링 기초정보이론

Ÿ 시각(Vision)의 생리학적 특성과 수학적 모델링

Ÿ 인지(Cognition)의 수학적 모델링

Ÿ 뇌과학분야 질병에 대한 컴퓨터 모델개발

[선수과목] 데이터사이언스를 위한 프로그래밍 기초, 데이터사이언스를 위한 통계 기초[영문 교과목 개요]

This course provides basic modeling technique which is based on the understanding of

neuron and brain behavior. Through the understanding of electrophysiological process

of neuron cells and brain, students will learn basics of neuroscience simulation

technique. The core part will be mathematical modeling of neuronal behavior,

abstraction of vision process, and decision model of cognition. Through term projects

students will understand the normal behavior and the abnormal behavior pattern of

brain and neurons.

Followings are the main topics of this course

Ÿ Basic physiology and anatomy of neuron cells

Ÿ Basic electrophysiology of neuron cells

Ÿ Basic theory of neuronal activities

Ÿ Mathematical modeling of Vision

Ÿ Basic theory of computational linguistics

Ÿ Mathematical modeling of cognition

Ÿ Development of neuronal disease processing modeling

[Pre-requisite] Programming Foundations for Data Science, Statistical Foundations for

Data Science

Page 30: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 28 -

❍ 의료 데이터사이언스 프로젝트 (Biomedical Data Science Project)

교과목 번호명칭

국문 의료 데이터사이언스 프로젝트 학점-강의시간-실습시간

(부여예정) 영문 Biomedical Data Science Project 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매학기 강의담당교수교과구분 전공선택 개설학기 성적부여 A~F 수강정원 40

[국문 교과목 개요]

본 강좌는 현장의 데이터를 이용하여 프로젝트를 진행하고, 실사용자로부터 피드백을 받는

형태로 진행되는 현장실습 강좌이다. 한 학기 동안 소그룹별 지도교수가 배정되며, 각 그룹

은 주1회(연건,분당,보라매병원)을 방문하여 병원의 지도교수로부터 과제의 진도점검과 다음

단계의 과제를 부여받는다. 본 수업은 프로젝트형 수업이기 때문에 캡스톤프로젝트와 같은

학기에 수강하지 않는 것을 권장한다.

현장 프로젝트 대상은 다음과 같으며, 추가 또는 변경될 수 있다.

Ÿ 의료빅테이터 기반 CDSS (의사결정지원시스템) 개발

Ÿ 의료영상 AI 개발

Ÿ 의학문서 자연어처리 시스템 개발

Ÿ AR (Augmented Reality)을 이용한 수술/진단보조시스템 개발

Ÿ 생체신호 해석 AI 개발

[선수과목] 데이터사이언스를 위한 프로그래밍 기초, 데이터사이언스를 위한 기초통계

[영문 교과목 개요]

The main purpose of this course is designed for students who want to use real

programmatic data and also want to get feedback from users. Through this project

students will understand main interests of clinical users. Unlike other subject this course

requires regular meeting of clinical professors of SNUH, for that students should visit

hospitals regularly. As this project has similar features of Capstone project, students can

not take this course in the same semester with regular Capstone project.

Followings are target domain for this course

Ÿ Clinical Decision Support System

Ÿ Development of medical image AI solution

Ÿ Natural Language Processing based solution

Ÿ Decision Support system using AR technique

Ÿ Decision support system based on medical signal processing

[Pre-requisite] Programming Foundations for Data Science, Statistical Foundations for

Data Science

Page 31: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 29 -

❍ 사회과학을 위한 데이터사이언스 (Introduction to Computational Social Sciences)

교과목 번호명칭

국문 사회과학을 위한 데이터사이언스 학점-강의시간-실습시간

(부여예정) 영문 Introduction to Computational Social Sciences 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매년 강의담당교수 -

교과구분 전공선택 개설학기 1학기 성적부여 A~F 수강정원 40

본 교과목은 데이터사이언스를 이용한 사회과학 연구방법론의 주요 주제를 소개하는 것을

목적으로 한다. 프로그래밍과 데이터베이스, 그리고 사회과학적 연구방법을 종합적으로 소

개하고 인과적 추론, 서베이, 공공 대용량 자료의 수집과 분석, 회귀분석, 최적화, 베이지안

분석, 자료 시각화 등의 세부주제를 탐구한다. This course will introduce theoretical and computational underpinnings of

computational social sciences. Students will acquire knowledge of programming,

database management, and social science research methodology for social science data

analysis. Various topics will be discussed in the class including causal inference, survey

methodology, data mining of public data and analysis, regression analysis, optimization,

Bayesian analysis, and data visualization.

비고: 사회과학 응용 전공선택 교과목

❍ 사회과학을 위한 네트워크 분석 (Network Analysis for Social Science)

번호명칭

국문 사회과학을 위한 네트워크 분석 학점-강의시간-실습시간

(부여예정) 영문 Network Analysis for Social Sciences 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매년 강의담당교수 -

교과구분 전공선택 개설학기 1학기 성적부여 A~F 수강정원 40

네크워크 분석은 행위자들간의 관계를 연구하는 과학적 연구방법으로 개인간, 집단간, 그

리고 국가간 연구에 왕성하게 적용되고 있다. 본 수업은 그래프이론에서 출발하여 네트워크

과학의 주요개념, 사회연결망분석의 이론과 역사, 빅데이터 네트워크 분석, 그리고 네트워크

에 대한 게임이론적 접근 등의 주제를 다룰 것이다.

Network analysis has been applied to various researches on inter-personal, inter-group,

and inter-state relations in social sciences. This class will introduce graph theory for

network analysis, key concepts in network science, major advancements in social

network analysis, network big data analysis, and a game theory approach to network.

비고: 사회과학 응용 전공선택 교과목

Page 32: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 30 -

❍ 사회과학을 위한 텍스트분석 (Computational Text Analysis Social Sciences)

번호명칭

국문 사회과학을 위한 텍스트분석 학점-강의시간-실습시간

(부여예정) 영문 Computational Text Analysis for Social Sciences 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매년 강의담당교수 -

교과구분 전공선택 개설학기 1학기 성적부여 A~F 수강정원 40

본 교과목에서는 텍스트 자료를 이용한 사회과학 방법론을 소개하고 그 응용분야를 살펴볼

것이다. 텍스트 분석을 위한 기계학습 모형과 통계모형, 자연어 처리에 대한 프로그래밍 기

초를 공부한 뒤, 데이터 저널리즘, 정치텍스트 분석, 담론분석, 감정분석 등 사회과학 주제에

대한 다양한 응용연구를 살펴볼 것이다.

This course will introduce computational text analysis for social sciences. The course will

review machine learning methods for text analysis, statistical models for text analysis,

and programming basics for natural language processing. Then, students will study

applied researches using text analytic methods in social sciences such as data journalism,

political text analysis, content/discourse analysis, and sentiment analysis.

비고: 사회과학 응용 track 3 교과목

❍ 공공자료 빅데이터 마이닝 (Data Mining for Public Big Data)

번호명칭

국문 공공자료 빅데이터 마이닝 학점-강의시간-실습시간

(부여예정) 영문 Data Mining for Public Big Data 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매년 강의담당교수 -

교과구분 전선 개설학기 1학기 성적부여 A~F 수강정원 40

본 교과목은 데이터 마이닝 기술을 이용한 공공 빅데이터 분석을 다루고자 한다. 본 교과

목은 학생들이 공공자료의 수집, 저장, 분석, 그리고 이를 바탕으로 한 예측의 전과정을 투

명하고 재현가능한 방식으로 진행하기 위한 기술적, 실무적 경험을 쌓는 것을 목적으로 한

다. 본 수업이 대상으로 하는 공공자료는 각종 행정자료, 보건자료, 지리정보자료, 인구통계

자료, 경제조사자료, 정치자료, 미디어 자료, 소셜네트워크 자료 등이다.

This course will introduce data mining technology for public big data analysis. Students

will learn the collection, storage, analysis, and predictive inference using public big data

in a transparent and reproducible manner. Through this, students will acquire technical

as well as practical knowledge and experiences for public big data analysis. Public data

for class discussion include public administrative data, public health data, geographic

information data, demographic census data, economic survey data, political data, media

data, and social network data.

비고: 사회과학 응용 track 3 교과목

Page 33: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 31 -

❍ 네트워크 이론 및 분석 (Network Theory and Analysis)

교과목 번호명칭

국문 네트워크 이론 및 분석 학점-강의시간-실습시간

(부여예정) 영문 Network Theory and Analysis 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매학기 강의담당교수교과구분 전공선택 개설학기 성적부여 A~F 수강정원 40

[국문 교과목 개요]

본 과목에서는 인간 활동에 대한 사회학적 연구와 함께 소셜 네트워크 서비스 등 네트워크

이론 및 분석에 대한 연구를 논의한다. 사회 활동 이론은 소셜 컴퓨팅 연구자들이 데이터

분석의 실질적인 의미를 파악할 수 있도록 한다. 구체적으로는 사회학적 데이터 분석 프레

임 워크를 스스로 설계하는 방법을 배우고, 독서와 토론을 토대로 데이터를 이론적으로 해

석을 하는 법을 배운다.

Ÿ 작은 세상 현상 (Small world phenomenon)

Ÿ 랜덤 그래프 (Random Graph)

Ÿ 네트워크의 동질성 (Homophily)

Ÿ 정보 전파 (Information Propagation)

Ÿ 감정 분석 (Sentiment Analysis)

Ÿ 영향 및 확산 (Influence and Diffusion)

Ÿ 팀 프로젝트

[선수과목] 기초수학(미적분/확률/선형대수), 데이터구조 및 알고리즘, 프로그래밍 방법론[영문 교과목 개요]

In this course, we are going to discuss researches of social network services, along with

sociological studies of human action. Sociological action theories will help

social-computing researchers figure out the substantive meaning of their data analysis.

Students will learn how to design a sociological data analysis framework on their own.

Students will learn how to make theoretical interpretations from data on the basis of

course reading and discussions.

Ÿ Small world phenomenon “Planetary-Scale Views on Large Instant-Messaging

Network”

Ÿ Random graphs “Collective Dynamics of Small World Networks”

Ÿ Homophily “The Spread of Obesity in a Large Social Network over 32 Years”

Ÿ Information Propagation “Differences in the Mechanics of Information Diffusion

Across Topics: Idioms, Political Hashtags, and Complex Contagion on Twitter”

Ÿ Sentiment Analysis "Twitter mood predicts the stock market"

Ÿ Influence and Diffusion "The Spread of Behavior in an Online Social Network

Experiment."

Ÿ Team project

[Pre-requisite] Basic mathematics(Calculus/Probability/Linear algebra), Data structure &

algorithm, Programming methodology

Page 34: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 32 -

❍ 고급 계산생물학 (Advanced computational biology) 3-3-0

교과목 번호명칭

국문 고급 계산생물학 학점-강의시간-실습시간

(부여예정) 영문 Advanced computational biology 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 1년 강의담당교수 백대현

교과구분 전공선택 개설학기 2학기 성적부여 A~F 수강정원 60

[국문 교과목개요]

본 강좌는 대학원생을 위한 고급 계산생물학 교과목으로 (1) DNA 염기서열 분석(서열정렬,

서열조립, 서열지도화 등), (2) 기능유전자 및 단백질기능 예측(유전자주석달기, 단백질도메

인, 구조 및 위치 예측 등), (3) 유전체브라우저 및 계통발생분석, (4) 유전자존재론(유전자존

재론 DB, 기능농축분석, 유전자셋농축분석 등), (5) 타겟 분자 예측(마이크로RNA, 전사인자

타겟 예측 등), (6) 생체네트워크 모사 등 생체 시스템에 특이적 생명정보에 대한 계산생물

학 기법들을 학습한다. 학습한 기법들을 적용할 수 있는 텀프로젝트 과제를 부여한다. 이

텀프로젝트에서는 생물학적 문제를 정의, 이 문제에 대한 적합한 생명정보 확보, 상기된 방

법들을 적용하여 문제에 대한 답을 제공했는가를 평가한다.

[선수과목] 데이터사이언스을 위한 통계 기초, 머신러닝 및 딥러닝 기초

[영문 교과목 개요]

This course teaches advanced methodologies for analyzing the data unique to biological

systems including (1) DNA sequence analysis (sequence alignment, assembly and

mapping, etc.), (2) Functional gene and protein function prediction omics (gene

annotation, protein domain, structure, and localization prediction), (3) Genome browser

and phylogenetic analysis, (4) Gene ontology (gene ontology enrichment analysis and

gene set enrichment analysis), (5) Target molecule prediction (prediction of microRNA

and transcription factor targets), and (6) Network simulation. A term project will be

given as a final exam. In this term project, a biological question should be defined, a

relevant data should be obtained from public databases, and the aforementioned

methodologies should be applied to the data to answer the given question.

[Pre-requisite] Statistical Foundations for Data Science, Introduction to Machine Learning

and Deep Learning

Page 35: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 33 -

❍ 도시 수권 정보공학 (Urban Hydrosphere Informatics)교과목 번호

명칭국문 도시 수권 정보공학 학점-강의시간-실습시간

(부여예정) 영문 Urban Hydrosphere Informatics 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 격년 강의담당교수 황진환

교과구분 전공선택 개설학기 성적부여 A~F 수강정원 30

[국문 교과목 개요]

본 강의는 인간 정주의 도시에서 물의 순환 공간인 수권 데이터를 기반으로 물 정보의 순

환을 자연계 순환, 도시 인프라 순환 및 가상순환 (Virtual Circulation)을 이해하고 이를 통

해 도시 전체의 물 순환구조를 이해한다. 또한 이를 이용하여 인간의 사회를 진단하고 도시

를 설계하고 운영하는 방법을 배운다. 주 방법론으로는 초데이터 (tera-bite단위의 수치자료)

의 data-mining기법을 활용하고 비정형데이터의 data crawling기법등의 기본 데이터사이언

스 (Data-Science) 지식을 활용한다.

Ÿ 도시수권의 정의와 현황

Ÿ 자연계 순환에서의 데이터 생성기법: 대기공간

Ÿ 자연계 순환에서의 자연데이터 생성기법: 육상공간

Ÿ 자연계 순환에서의 자연데이터 생서기법: 하천 및 연안공간

Ÿ 물의 도시인프라 순환체계 이해

Ÿ 상업 및 거래로 인한 물의 가상순환의 이해

Ÿ 도시 유역 간 물 거래량 산정

Ÿ 물 흔적을 이용한 경제사회 진단

[선수과목] 데이터사이언스를 위한 프로그래밍 기초, 데이터사이언스를 위한 통계 기초

[영문 교과목 개요]

This class is aiming to understand the water cycle structure in the urban hydrosphere,

which consists of natural water cycle, water flow through infra structure, and virtual

water circulation based on analysis of hydrospheric data of the urban human

settlement. These knowledge will be appled to the diagnosis of the urban society and

designing of the city. Along with the basic data science knowledge, data mining for the

structured data and data crawling for collecting the unstrucured data will be mainly

used as the learning tools.

Ÿ Definition and state of urban hydrosphere

Ÿ Data production in natural cycle: Atmosphere

Ÿ Data production in natural cycle: Land

Ÿ Data production in natural cycle: River, Lake, and Sea

Ÿ Water cycle in the urban infra-structure

Ÿ Virtual water circulation through trading

Ÿ Water budget between urban watersheds

Ÿ Diagnosis of urban socio-economy through water footprint

[Pre-requisite] Programming Foundations for Data Science, Statistical Foundations for

Data Science

Page 36: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 34 -

❍ 스마트시티 설계 (Design of Smart Cities)

교과목 번호명칭

국문 스마트시티 설계 학점-강의시간-실습시간

(부여예정) 영문 Design of Smart Cities 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매년 강의담당교수 김동규

교과구분 전공선택 개설학기 성적부여 A~F 수강정원 30

[국문 교과목 개요]본 강의는 스마트시티를 계획하고 설계할 수 있는 능력을 함양하는 것을 목적으로 한다. 본

강의를 통해 학생들은 도시에서 발생할 수 있는 다양한 문제들을 해결하기 위한 이론과 실

제를 공부하며, 데이터사이언스를 활용한 문제해결능력을 함양할 수 있다.

Ÿ 스마트시티의 현황 및 전망

Ÿ 의사결정을 위한 체계분석기법

Ÿ 스마트시티 설계의 문제 정의

Ÿ 스마트시티 설계를 위한 요소 기술

Ÿ 스마트시티 공간설계 기법

Ÿ 스마트시티 공간설계 사례 연구

Ÿ 스마트모빌리티시스템 이론과 실제

Ÿ 스마트모빌리티 설계 사례 연구

Ÿ 데이터사이언스를 활용한 학기 과제

[선수과목] 데이터사이언스를 위한 프로그래밍 기초, 데이터사이언스를 위한 통계 기초

[영문 교과목 개요]This lecture aims to enhance the capability for planning and designing smart cities. To

achieve this, this lecture helps students understand theories and practices to solve a

variety of problems occurred in cities and enhance the problem-solving skills using data

science.

Ÿ Current and future trends on smart cities

Ÿ System analysis approaches for decision making

Ÿ Problem definitions for designing smart cities

Ÿ Element technologies for designing smart cities

Ÿ Design methods of city spaces for smart cities

Ÿ Case studies for designing city spaces

Ÿ Theories and practices for smart mobility systems

Ÿ Case studies for designing smart mobility

Ÿ Semester assignment using data science

[Pre-requisite] Programming Foundations for Data Science, Statistical Foundations for

Data Science

Page 37: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 35 -

❍ 역학, 제어 및 로보틱스 특강 (Advanced Topics in Dynamics, Control, and

Robotics: Optimization and Machine Learning in Robotics: A Geometric Perspective)

번호

명칭

국문 역학, 제어 및 로보틱스 특강 학점-강의시간-실습시간

(부여예정) 영문

Advanced Topics in Dynamics, Control, and Robotics: Optimization and Machine Learning in Robotics: A

Geometric Perspective

3-3-0

학과(부)(전공)

데이터사이언스이수학년

개설주기강의담당

교수

교과구분 전공선택개설학기

성적부여 A~F 수강정원

[교과목 개요]Introduction: Methods from machine learning are starting to play a greater role in robotics, by enabling robots to learn from experience and to acquire skills needed to operate autonomously in unstructured environments. Some of these skills include sensorimotor capabilities such as locomotion, grasping, object recognition, manipulation, and the learning of complex tasks. Also in the context of automation, where emphasis is placed on reliability and efficiency over extended periods, machine learning methods are being used for, e.g., inspection tasks in manufacturing assembly. The aims of this course are to learn the fundamentals of machine learning in a robotics and automation context, and to examine the state-of-the-art in how machine learning algorithms are being used to enhance the operational capabilities of robots. A unique and defining feature of this course is the geometric perspective from which we approach the main concepts. While it is by now well-established that machine learning has strong connections to probability and statistics and also optimization, its connections to geometry have not been developed to the same extent. One of our aims in this course is to make more explicit the connections to geometry (particularly differential geometry) and also to mathematical optimization, both to put the theory on a firmer mathematical footing and to exploit the available tools and concepts from geometry for designing better algorithms. The course is organized as a series of lectures given by the instructor, with occasional guest lecturers invited to cover specialized topics. Course participants will serve as scribes, and at the end of the course a set of edited and refined lecture notes will be compiled.

[Pre-requisites] This course is a graduate advanced topics course, and students are expected to have previous exposure to the fundamentals of systems and control theory, and also to basic concepts in robot mechanics and control. An introductory graduate course in systems and control or equivalent, and an undergraduate course in robotics, computer vision, or equivalent, are necessary prerequisites. Students should also have studied probability and statistics as covered in an undergraduate applied mathematics course. The course also draws heavily upon methods of linear algebra, and as such courses on multidimensional systems analysis and optimization, while not required, will be helpful. All students should obtain prior permission of the instructor at the beginning of the course.

Page 38: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 36 -

❍ 블록체인 (Blockchain)

교과목 번호명칭

국문 블록체인 학점-강의시간-실습시간

(부여예정) 영문 Blockchain 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매년 강의담당교수

교과구분 전공선택 개설학기 성적부여 A~F 수강정원 40

[국문 교과목 개요]블록체인 기술은 나날이 발전하고 있고, 미래의 사회를 변화시킬 커다란 잠재력을 지니고

있다. 본 과목은 불록체인으로 인해 변화할 미래 산업과 비즈니스 환경에 대응하기 위한 지

식의 습득을 목표로 하며, 다음과 같은 세부 주제로 구성되어 있다.

Ÿ 블록체인 개요

Ÿ 블록체인 기술: P2P 네트워크, 합의 알고리즘, 전자서명, 해시 알고리즘

Ÿ 비트코인과 암호화폐 기술

Ÿ 이더리움과 스마트계약

Ÿ 퍼블릭 블록체인과 프라이빗 블록체인

Ÿ 제3세대 블록체인과 블록체인 트릴레마

Ÿ 솔리디티 및 블록체인 관련 프로그래밍

[영문 교과목 개요]Blockchain technology is evolving day by day and has great potential to change future

society. This course aims to acquire the knowledge to cope with future industry and

business environment that will be changed due to Blockchain, and consists of the

following topics.

Ÿ Blockchain overview

Ÿ Blockchain Technology: P2P Network, Consensus Algorithm, Digital Signature, Hash

Algorithm

Ÿ Bitcoin and Cryptocurrency Technology

Ÿ Ethereum and Smart Contract

Ÿ Public Blockchain vs. Prviate Blockchain

Ÿ 3rd generation Blockchain and Blockchain Trilemma

Ÿ Solidity and Blockchain Programming

Page 39: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 37 -

❍ 데이터사이언스 특강 (Special Lecture on Data Science)

교과목 번호명칭

국문 데이터사이언스 세미나 특강 학점-강의시간-실습시간

(부여예정) 영문 Seminars on Data Science 3-3-0

학과(부)(전공) 데이터사이언스 이수학년 대학원 개설주기 매년 강의담당교수

교과구분 전공 선택 개설학기 성적부여 A~F 수강정원 40

[국문 교과목 개요]다양한 분야의 데이터사이언스 전문가를 초빙하여 최근 동향과 전문기술에 대한 정보를 습

득하고 토론할 수 있는 기회를 제공한다.

[영문 교과목 개요]This course provides lectures by guest speakers on various areas of data science.

❍ 의생명 온톨로지 개론 (Biomedical Data Science Project)

교과목 번호명칭

국문 의생명 온톨로지 개론 학점-강의시간-실습시간

807.507 영문 Biomedical Data Science Project 3-3-0

학과(부)(전공) 이수학년 대학원 개설주기 매학기 강의담당교수

교과구분 개설학기 성적부여 A~F 수강정원 40

[국문 교과목개요]

의생명분야의 정보처리를 위한 온톨로지 공학의 기본 이론 및 의학 및 생명과학 분야의 온

톨로지 모델링과 활용 사례에 대해 학습한다. 다양한 온톨로지에 대한 기본 개념과 특성이

소개된다. 온톨로지 표현 언어 및 모델링 도구의 사용법에 대해 배우고 프로젝트를 통해 온

톨로지 모델링을 실습하게 된다. 또한 의생명 과학 분야의 복잡한 개념 및 관계성 표현을

위한 중요 쟁점과 온톨로지 병합 및 통합에 관한 이론들을 탐구한다.

[영문 교과목개요]

The main purpose of this course is to study the basic concept of ontology in the

biomedical science. The basic features of ontologies will be provided through the

course. Students will learn how to model a practical ontologies that are useful for the

biomedical domain applications. Through the course students will understand the usage

of ontology tools and the modeling methods. Class discussions on the complexities and

relationships of ontological entities will enrich students understanding of ontology.

Page 40: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 38 -

❍ 의학지식 표현 및 추론 (Biomedical Data Science Project)

교과목 번호명칭

국문 의학지식 표현 및 추론 학점-강의시간-실습시간

807.508 영문 Biomedical Data Science Project 3-3-0

학과(부)(전공) 이수학년 대학원 개설주기 매학기 강의담당교수

교과구분 개설학기 성적부여 A~F 수강정원 40[국문 교과목개요]

의료 의사결정지원 시스템(CDSS) 및 전문가시스템 등을 활용할 수 있도록 의학지식을 전산

언어로 표현하는 방법론에 대해서 배운다. 의사결정지원시스템의 기초이론 및 현장의 수요

를 파악하기 위한 요구분석 방법론에 대해서 학습한다. 규칙기반(Rule-based) 시스템과 사

례기반(Case-based) 시스템 등 다양한 종류의 시스템들을 비교하고 관련 이슈들을 심도 있

게 탐구한다. 논리 프로그래밍의 관점에서 지식베이스 시스템의 추론 알고리즘에 대해서도

학습한다. 학기말에 학생들은 다양한 CDSS 구현 방법에 대해서 경험할 수 있도록 기말프로

젝트가 주어진다. [영문 교과목개요]

Through the course student will learn the basic concept and the architecture of CDSS

(clinical decision support system). The basic methods for developing CDSS will be

taught, so that students will learn the advantage and key features of rule-based system,

and case-based system. The field study of those system will enrich the understanding of

CDSS. Algorithms for the development of CDSS will be suggested and discussed.

Through the final task students will have the experience of development process and

learn the pros and cons of targeted CDSS.

❍ 의학 통계 추론 (Biomedical Data Science Project)

교과목 번호명칭

국문 의학 통계 추론 학점-강의시간-실습시간

807.506 영문 Biomedical Data Science Project 3-3-0

학과(부)(전공) 이수학년 대학원 개설주기 매학기 강의담당교수

교과구분 개설학기 성적부여 A~F 수강정원 40[국문 교과목개요]

의생명분야의 임상적 의사결정을 지원할 수 있도록 정량적 분석을 통한 연구 평가 방법에

대해서 배운다. 주된 학습 내용으로는 서술적 통계학, 분산 검증을 위한 분석적 방법, 변수

간의 상관관계, 확률, 베이지언 방법을 이용한 통계적 추론 방법에 대하여 탐구한다. 모든

자료는 임상에서 얻어진 자료들을 활용하며 통계적 검증을 통한 후 실제 임상적 의미에 대

해서 분석하고 토론하여 자료분석 방법의 적용법에 대한 지식과 경험을 넓히도록 지도한다. [영문 교과목개요]

This course provides the statistical research method in order to be used in medical

decision process. The core part of study will be descriptive statistics, analytic methods

for medical data distribution model, probability, and Bayesian method for medical data

analysis. The real clinical data will be provided on the condition of IRB approval.

Through the analysis and peer group discussion student will learn the application

method and pros and cons of each analytic method.

Page 41: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 39 -

❍ 생체정보공학(Biocomputation)

교과목 번호명칭

국문 생체정보공학 학점-강의시간-실습시간

M2608.000500 영문 Biocomputation 3-3-0

학과(부)(전공) 전기정보공학부 이수학년 대학원 개설주기 매학기 강의담당교수

교과구분 전공선택 개설학기 성적부여 A~F 수강정원 40

[국문 교과목 개요]본 교과목은 생체정보공학 분야 소개 및 주요 방법론, 기본 Bioinformatics 알고리즘에 대한 이해 및 응용에 대해 학습하며, 관련 최신 연구 동향을 습득할 수 있도록 한다.

[영문 교과목 개요]Introduction to bioinformatics and computation. This class covers fundamentals of bioinformatics algorithms and various applications in addition to recent trends in related research areas.

Page 42: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 40 -

❍ 고급자료 분석 및 실습 (Datamining methods and Lab)

교과목 번호명칭

국문 고급자료 분석 및 실습 학점-강의시간-실습시간

영문 Datamining methods and Lab 3-3-0

학과(부)(전공) 통계학과 이수학년 4 개설주기 강의담당교수

교과구분 전선 개설학기 성적부여 A~F 수강정원 40

[국문 교과목개요]이 교과목의 목표는 학생들에게 다양한 최신 통계분석기법의 소개와 현재 직면하고 있는

문제를 분석하기위해 사용해야 할 올바른 통계적 모형을 선택하는 법에 대해 배운다. 학생

들은 이 과목을 통하여 (1) 적절한 분석모형의 선택 (2) 통계 프로그램을 사용하여 모형의

구현 (3) 분석모형의 결과에 대한 평가 (4) 분석결과에 대하여 공동연구자들에게 전달하는

방법에 대해서 배운다.

Ÿ 모형평가

Ÿ 선형회귀

Ÿ 평활방법

Ÿ 일반화선형 및 가법모형

Ÿ 분포 및 잠재구조

Ÿ 인과관계 추론

Ÿ 종속자료

[영문 교과목 개요]The objectives of this course are to introduce students to modern statistical methods

and to choose the right statistical models to analyze the problems they are facing.

Students will be able to (1) select appropriate statistical models, (2) use statistical

software to implement methods, (3) evaluate the results of statistical models, and (4)

communicate the result of analyses to collaborators.

Ÿ Model evaluation

Ÿ Linear regression

Ÿ Smoothing

Ÿ Generalized linear and additive models

Ÿ Distribution and Latent structure

Ÿ Causal Inference

Ÿ Dependent data

Page 43: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 41 -

❍ 데이터마이닝 및 실습 (Datamining methods and Lab)

교과목 번호명칭

국문 데이터마이닝 및 실습 학점-강의시간-실습시간

326.413 영문 Datamining methods and Lab 3-3-0

학과(부)(전공) 통계학과 이수학년 4 개설주기 강의담당교수

교과구분 전선 개설학기 성적부여 A~F 수강정원 40

[국문 교과목개요]

데이터마이닝의 기본 개념 및 방법들을 다양한 응용사례를 중심으로 배운다. 대용량자료의

분석을 위한 자료의 전처리과정(자료의 범주화, 자료의 선택)등을 배우고 회귀분석을 시작으

로 하여 로지스틱회귀, 의사결정나무, 신경망모형, 군집분석, 연관성분석 등에 대한 개요 및

컴퓨터를 이용한 모형구축 방법에 대하여 배운다. 코스 종반에 팀을 구성하여 실제 자료를

분석하여 결과를 발표한다. R, SPSS, SAS 등의 다양한 통계프로그램을 이용한다.

Ÿ 지도학습- 선형회귀분석, 정칙화 회귀분석, 모형선택과 타당성, 분류분석, 의사결정나무,

부스팅

Ÿ 비지도학습- 정보추출, 군집분석, 차원축소, 상관분석

[영문 교과목개요]

This course covers basic concepts and methodologies of data mining on various real

problems. Preprocessing procedures including categorization, sampling etc are taught

and various data mining methods including linear regression, logistic regression,

decision trees, neural networks, clustering and association are covered. also, evaluation

methods such as lift and prediction errors are taught. Finally, as a term project,

students are participated in one real project. In this course, various statistical packages

such as R, SPSS, SAS are extensively used.

Ÿ Supervised learning- Linear regression, regularized regression, model selection and

validation, classification, trees and boosting

Ÿ Unsupervised learning- Information retrieval and PageRank, Clustering, Dimension

reduction,Correlation analysis

Page 44: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 42 -

❍ 베이즈 통계 및 실습 (Bayesian Statistics and Lab)

교과목 번호명칭

국문 베이즈 통계 및 실습 학점-강의시간-실습시간

326.411 영문 Bayesian Statistics and Lab 3-3-0

학과(부)(전공) 통계학과 이수학년 4 개설주기 강의담당교수

교과구분 전선 개설학기 성적부여 A~F 수강정원 40

[국문 교과목개요]

주관적 확률, 선호도의 정량화, 베이지안 결정이론, 공액사전분포, 극한 사후분포, 베이지안

추정과 검정 이차결정이론 등을 다룬다.

Ÿ 이항분포, 포아송분포, 정규분포의 추론

Ÿ 마코프 몬테카를로 방법

Ÿ 다변량 정규분포

Ÿ 계층적 정규분포

Ÿ 선형회귀모형

Ÿ 계층적 정규 선형모형

Ÿ 선형, 일반화 선형 혼합모형

[선수과목] 수리통계 1,2

[영문 교과목개요]

This course deals with subjective probability, preferences quantification, Bayesian

decision theory, conjugate prior distribution, limit posterior distribution, Bayesian

estimation and test, and secondary decision theory.

Ÿ Inference for binomial, Poisson and normal distribution

Ÿ Markov Chain Monte Carlo Methods

Ÿ Multivariate normal distribution

Ÿ Hierarchical modeling

Ÿ Linear regression models

Ÿ Hierarchical normal regression models

Ÿ Linear and generalized mixed-effects models

[Pre-requisites] Mathematical Statistics 1,2

Page 45: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 43 -

❍ 생존자료분석 및 실습 (Survival Data Analysis and Lab)

교과목 번호명칭

국문 생존자료분석 및 실습 학점-강의시간-실습시간

326.412 영문 Survival Data Analysis and Lab 3-3-0

학과(부)(전공) 통계학과 이수학년 4 개설주기 강의담당교수

교과구분 전선 개설학기 성적부여 A~F 수강정원 40

[국문 교과목개요]

생존시간(survival time)에 관한 추정과 검정을 하거나 생존시간에 관한 회귀모형을 사용하

여 생존 시간에 영향을 미치는 위험인자를 찾아내는 통계기법을 공부한다. 개체가 생존할

확률을 나타내는 생존함수(survival function)를 추정하기 위한 생명표(life table)법과 카플란-

마이어(Kaplan-Meyer) 추정법을 소개하고 여러 처리(treatment) 그룹을 비교하기 위한 검정

법을 다룬다. 또한 회귀모형에 관한 대표적인 모형인 Cox의 비례위험모형 (proportional

hazard model)과 가속화된 회귀모형(accelerated regression model)에 관하여 공부한다.

Ÿ 중도절단

Ÿ 생존함수의 추정과 중도절단 자료

Ÿ 위험함수의 추정

Ÿ Cox의 비례위험모형

Ÿ 가속화된 회귀모형

[영문 교과목개요]

In this course, students will study the estimation and testing of survival time and be

introduced to the life table method and Kaplan-Meyer estimation to model survival

functions. Topics will include various test methods for the comparison of three or more

groups as well as regression models such as Cox proportional hazard models and

accelerated regression models for the selection of risk factors that affect survival time.

Ÿ Censoring and Truncation

Ÿ Estimation of survival function and censored data

Ÿ Estimation of the hazard function

Ÿ Cox’s proportional hazard model

Ÿ Acceleration regression model

Page 46: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 44 -

❍ 시계열분석 및 실습 (Time Series Analysis and Lab)

교과목 번호명칭

국문 시계열분석 및 실습 학점-강의시간-실습시간

326.415 영문 Time Series Analysis and Lab 3-3-0

학과(부)(전공) 통계학과 이수학년 4 개설주기 강의담당교수

교과구분 전선 개설학기 성적부여 A~F 수강정원 40

[국문 교과목개요]

시계열자료의 분석법 및 여러가지 종류의 시계열자료 분석용 패키지의 사용법에 대해 공부

한다. 주로 다루어지는 내용은 예측기법으로 많이 이용되는 이동평균법, 지수평활법 및

ARIMA모형에 의한 분석법 등이며 X-11 등과 같은 분해에 기초한 계절조정법의 기본개념들

을 다룬다.

Ÿ 시계열자료의 특성

Ÿ 추세분석

Ÿ 평활법, 이동평균, 계절조정

Ÿ 확률과정

Ÿ AR, MA, ARMA, ARIMA 모형

Ÿ 모형적합

Ÿ 예측

Ÿ 계절모형

[선수과목] 회귀분석 및 실습

[영문 교과목개요]

This course introduces the different laws and uses of various statistical packages. Topics

include the moving average, exponential smoothing, the ARIMA models and the basic

concepts of seasonal effects.

Ÿ Characteristics of Time series

Ÿ Trend analysis

Ÿ Smoothing, moving average, seasonal adjustment

Ÿ Stochastic process

Ÿ AR, MA, ARMA, ARIMA models

Ÿ Model fitting

Ÿ Forecasting

Ÿ Seasonal models

[Pre-requisites] Regression Analysis and Lab

Page 47: 서울대학교 데이터사이언스대학원 교과목 개요(안)gsds.snu.ac.kr/sites/gsds.snu.ac.kr/files/board/form/%E2%98%85%E… · Ÿ파이썬 기초 문법 Ÿ문자열 및

- 45 -

❍ 통계계산 (Computational Statistics)

교과목 번호명칭

국문 통계계산 학점-강의시간-실습시간

M1399.000100 영문 Computational Statistics 3-3-0

학과(부)(전공) 통계학과 이수학년 4 개설주기 강의담당교수

교과구분 전선 개설학기 성적부여 A~F 수강정원 40

[국문 교과목개요]

최근 수십 년간의 컴퓨터 기술의 발전으로 인해 통계분석가는 이전에는 상상할 수 없었던

복잡한 통계모형들을 사용할 수 있게 되었다. 따라서 현대의 복잡하고 다양한 통계모형들을

분석하기 위해서는 컴퓨터를 이용한 여러 가지 통계계산 방법들을 습득하는 것이 필수 불

가결한 과제가 되었다. 이 과목에서는 모수론적 통계와 베이지안 통계에 필요한 통계계산

방법들을 배우고 이를 실제 컴퓨터로 구현해 보는 것을 목표로 한다. 모수론적 통계 분석을

위해서는 우도함수를 최적화 할 때 쓰는 뉴튼 랩슨 방법을 비롯한 각종 최적화 방법들을

배운다. 베이지안 통계분석을 위해서는 깁스 표본추출, 메트로폴리스 알고리듬 등 마코프

사슬 몬테 카를로 기법을 다룬다. 이외에도 통계계산에 필요한 자료구조와 행렬계산 등 다

양한 계산 알고리즘들을 다룬다.

Ÿ 컴퓨터 연산

Ÿ 선형방정식의 직접적 해법

Ÿ 선형방정식의 반복적 해법

Ÿ 뉴튼법과 피셔 스코어링

Ÿ 수치적분: 뉴튼-코테스 구적법 및 라플라스 근사

Ÿ 몬테카를로 적분

Ÿ 마르코프 사슬 몬테카를로법

[영문 교과목개요]

This course offers basics of statistical computing methods for parametric and Bayesian

statistics. For parametric statistics, we study optimization methods such as the

Newton-Raphson method, for maximizing likelihood functions. For Bayesian statistics, we

study Markov-chain Monte Carlo methods such as Gibbs Sampling and the Metropolis

algorithm. Besides theory, we also perform real data analysis using these methods. We

also introduce data structures and matrix algorithms useful for computational statistics.

Ÿ Computer arithmetic

Ÿ Direct methods for linear systems

Ÿ Iterative methods for linear systems

Ÿ Newton’s method, Fisher scoring

Ÿ Numerical integration: Newton-Cotes quadrature, Laplace approximation

Ÿ Monte Carlo integration

Ÿ Markov chain Monte Carlo methods