39
뉴스의 미래, 뉴스 빅데이터의 혁신 한국언론진흥재단 미디어연구센터 선임연구위원 1

뉴스의 미래, 뉴스 빅데이터의 혁신

Embed Size (px)

Citation preview

뉴스의 미래, 뉴스 빅데이터의 혁신

박 대 민

한국언론진흥재단 미디어연구센터 선임연구위원

1

2

News Big Data System Design 2016 Semantic Network Analyzers for News Big Data 2016 Newspaper 26 years [link] 2015 <BigKinds> RFP [link] 2013 NewsSource Beta [link for general users] [link for analysts] 2013 UPI news source network visualization prototype program [link] 2012 News source network analysis prototype program

News Big Data Research Park, D.M., Kim, G.N., & On, B.W.(2016). Understanding the network fundamentals of the news sources associated with a specific topic. Information Sciences.

327, 32-52. PARK, D.M.(2016, January). Toward a debating machine: A news sentence network analysis algorithm based on similarity and cooccurrence. In Proceedings of

HCI Korea (pp. 491-498). Hanbit Media, Inc.. 박대민, 오세욱(2016). 방송 뉴스 빅데이터 분석의 가능성. <방송문화연구>, 28권 1호, 7-51. 박대민(2016). 뉴스 기사의 자연어처리: <뉴스소스 베타>를 중심으로. <커뮤니케이션이론>, 12권 1호, 4-52. 박대민(2015). 사실기사의 직접인용에 대한 이중의 타당성 문제의 검토: 동아일보와 한겨레신문의 4대강 추진 논란 기사에 대한 뉴스 정보원 연결망 및 인용문 분석. <한국언론학보>,

59권 5호, 121-151. 박대민, 박진우(2015). 양적 완화 정책에 대한 국내 언론 보도의 정보원 및 인용문 분석: 경제 저널리즘의 신자유주의적 경향에 대한 비판적 고찰. <한국언론학보>, 59권 1호, 37-61. 박대민, 김기남, 강남용, 서봉원, 하효지, 온병원(2014). 저널리즘 가치에 기초한 알고리즘을 이용한 뉴스의 시각화. <한국HCI학회 논문지>, 9권 2호, 5-12. 박대민(2014). 뉴스 정보원 인용에서의 폭발성과 언론의 편향성. <커뮤니케이션 이론>, 10권 1호, 295-324. 박대민(2013). 뉴스 기사의 빅데이터 분석 방법으로서 뉴스정보원연결망분석. <한국언론학보>, 57권 6호, 233-261. 박대민, 이중식, 서봉원(2016.12.). <(가제) 사용자 중심 뉴스 빅데이터 플랫폼 연구>. 서울: 한국언론진흥재단. (책임연구). 박대민, 백영민, 김선호(2015.12.). <뉴스 빅데이터 분석 시스템 연구>. 서울: 한국언론진흥재단. (책임연구). 박대민, 김선호, 양정애(2014.12.). <스마트 미디어 뉴스 혁신 전략>. 서울: 한국언론진흥재단. 박대민, 오세욱(2016.6.). 인공지능 21년: 뉴스 빅데이터로 본 인공지능의 역사. <News Big Data Analytics & Insights>, 1권 2호. 서울: 한국언론진흥재단. 박대민(2016.4.). 신문 26년: 뉴스 빅데이터로 본 신문 보도의 역사. <News Big Data Analytics & Insights>, 1권 1호. 서울: 한국언론진흥재단. 박대민. 김선호(2015.9.). 청년실업: 언론보도와 국민인식. <미디어이슈>, 1권 14호. 서울: 한국언론진흥재단. 박대민(2015.8). 망언의 네트워크: 신문뉴스 빅데이터 분석으로 본 일본 망언보도 10년사. <미디어이슈>, 1권 12호. 서울: 한국언론진흥재단.

Profile

뉴스 생태계의 변화

목차

뉴스 빅데이터의 정의

뉴스의 미래, 뉴스 빅데이터의 혁신

3

뉴스 빅데이터 분석 1: 자연어처리

뉴스 빅데이터 분석 2: 의미연결망분석

뉴스 빅데이터의 BM

뉴스 빅데이터의 목표

뉴스 생태계의 변화 : 플랫폼, UX

4

The End of Paper Platforms

허브

언론사

독자 광고주

플랫폼 기능 흡수

콘텐츠 공급자 분화 콘텐츠 사업자

UGC

네이티브 광고

박대민, 양정애, 김선호(2014). <스마트 미디어 뉴스 생태계의 혁신 전략>. 서울: 한국언론진흥재단.

5

사용자의 생산, 유통 참여

취재

편집

유통

판매

광고

부가사업

편집국

광고 사업국

CP 취재

플랫폼

판매

유통

광고

부가사업

편집

독자 사용자

박대민, 양정애, 김선호(2014). <스마트 미디어 뉴스 생태계의 혁신 전략>. 서울: 한국언론진흥재단.

6

사용자 중심 저널리즘 가치

7

Watts, D. J., & Dodds, P. S. (2007). Influentials, networks, and public opinion formation. Journal of consumer research, 34(4), 441-458. https://en.wikipedia.org/wiki/Death_of_Alan_Kurdi

박대민(2015). ‘민주주의 기술’ 은 진화하는가. < ICT인문사회융합동향>. 2015년 3호.

뉴스 빅데이터의 정의 : 메타, NLP, SNA

8

VS

Data/Robot Journalism vs. News Big Data

9

https://docs.google.com/presentation/d/1rJ1xfELWBfmoZkKFKBgN2a3B-slOjgEf8rKbgxiHL8A/edit#slide=id.g3368db5e8_115

What is News Big Data?

10

NLP SNA

Raw

Meta

뉴스 빅데이터 분석 1 : 자연어처리

11

- 형태소분석, NER - 구문분석, 의미분석 - data cleansing - 프로그램 기획 개발

- Visualization - 정보원 분석 - 인용문 분석 - 담론분석

- 구조 파악 - Transpose, Diagonal, Dichotomize - centrality

01

02

03

04

Crawling NLP, Data cleansing Semantic Network Analysis

Discourse Analysis

12

- 데이터 모델링 - 수작업, Crawler, 계약 - 자료는 충분히 많아야 함

Procedure of News Big Data Analytics

빅카인즈

Natural Language Processing of News

토큰 분리, 어간 추출, 품사 부착, 색인, 벡터화

문장 경계 인식, 구문분석, 공기어, 개체명 사전 구축(PLOT, 수치, 외국어 한글 표기), 개체명 인식

대용어 해소(대명사, 두문자어, 약어, 수치), 의미 중의성 해결(동명이인, 이명동인)

분류, 군집, 중복, 요약, 가중치, 순위화, 토픽 모델링, 이슈 트래킹, 평판분석, 감성분석, 복합논증분석,

형태소분석

구문분석

의미분석

담론분석

박대민(2016). 뉴스 기사의 자연어처리: <뉴스소스 베타>를 중심으로. <커뮤니케이션이론>, 12권 1호, 4-52.

13

14

BigKinds Pro beta(http://tools.kinds.or.kr/adam/login.do)

BigKinds Data Sample

15

reference_news_경향신문_정치_20150101_20151231

뉴스 빅데이터 분석 2 : 의미연결망분석

16

Word Cloud

형태소 단위 개념 단위

17

http://lab.newsjel.ly/visual/tagcloud/

Fundamentals of News Source Network

박대민(2013). 뉴스 기사의 빅데이터 분석 방법으로서 뉴스정보원연결망분석. <한국언론학보>, 57권 6호, 233-261.

2

1

1

2 3

1

4 5

2 3

1

4 5

18

Dynamics of News Source Network

Park, D.M., Kim, G.N., & On, B.W.(2016). Understanding the network fundamentals of the news sources associated with a specific topic. Information Sciences, 327. 32-52

19

Source-Topic Network

박대민(2015.8). 망언의 네트워크: 신문뉴스 빅데이터 분석으로 본 일본 망언보도 10년사. <미디어이슈>, 1권 12호. 서울: 한국언론진흥재단.

20

Time-series Content Analysis

박대민(2016.4.). 신문 26년: 뉴스 빅데이터 시각화로 본 신문 보도의 역사. <News Big Data Analytics & Insights>, 1권 1호. 서울: 한국언론진흥재단.

21

Time-series Content Analysis

박대민(2016.4.). 신문 26년: 뉴스 빅데이터 시각화로 본 신문 보도의 역사. <News Big Data Analytics & Insights>, 1권 1호. 서울: 한국언론진흥재단.

22

Time-series Content Analysis

박대민(2016.8.). 한류 15년: 뉴스 빅데이터로 본 한류의 시대, 케이팝의 시대. <News Big Data Analytics & Insights>, 1권 3호. 서울: 한국언론진흥재단.

23

뉴스 빅데이터의 BM : 데이터 저널리즘,

전문가 시스템, 분석도구, 데이터 기반 서비스, 플랫폼

24

Target Users & Driven Services

25

Journalists

Researchers

Analysts Startups

CPs

Users

Data Journalism for Journalists

26

황예랑(2016.1.26.). ○○일보와 △△신문의 다른 단어 사전. <한겨레21>. 1097호.

Analytics for Consultants

28

Expert Systems for Professionals

29

Data Driven Service for Startups

30

CMS for Content Providers

31

News Platforms for Users

32

https://practicalanalytics.co/

Business Model

33

Platform Business Model

34

뉴스 빅데이터의 목표 : Build Better World

35

News Media as Internet Companies

36

Media Innovative Ecosystem

37

박대민, 양정애, 김선호(2014). <스마트 미디어 뉴스 생태계의 혁신 전략>. 서울: 한국언론진흥재단.

Business for Journalism

38

Facebook was not originally created to be a company. It was built to accomplish a social mission- to make the world more open and connected.

Be open, build social value.

Mark Zuckerberg’s Letter to Investors: ‘The Hacker Way’

Q & A

39

We don’t build (news) services to make money. We make money to build better world.