7
11 특집 AI와 미디어 융합 김민성 한경닷컴 뉴스랩장 국내 AI와 미디어 융합 현황 한국적 AI저널리즘이 걱정되는 이유… 죽거나 나쁘거나 대한민국에 인공지능(AI) 담론이 본격화한 계기는 2016년(3월 9~15일) 구글 인공지능(AI) 알파고와 이세돌 9단의 대국이었다. 1,200여 대의 컴퓨터가 짜놓은 디지털 매트릭스 속 AI. 약관의 나이에 ‘입신’의 경지라는 9단에 오른 이세돌의 끈질긴 저항을 가장 진화한 기계 연산으로 무릎 꿇린 알파고를 TV 생중계로 본 이들은 포비아에 시달렸다. 미디어 영역도 공포에 사로잡혔다. 머지않아 미디어계에 닥칠 AI 저널리즘에 대한 두려움이었다. 로봇 저널리즘 혹은 챗봇이란 이름으로 부분적으로만 모습을 드러낸 미디어 (로)봇에 대한 막연한 두려움은 알파고로 본격 증폭됐다. 다행인 건 알파고 덕분에 (로)봇이 인공지능적으로 움직이는 기반이 알고리즘 1 그리고 딥러닝 2 이라는 구조를 알게 됐다. 이를 미디어에 적용하면, AI 저널리즘은 미디어 관련 알파고로 증폭된 두려움 영화 ‘매트로폴리스’ 스틸컷. 1927년 프리츠 랑 감독이 만든 최초의 장편 SF영화다. “머리와 손을 중재하는 건 마음(심장)”이라는 명대사로 유명하다. <사진 출처-매트로폴리스 스틸컷>

국내 AI와 미디어 융합 현황 한국적 AI저널리즘이 걱정되는 이유…116.125.124.10/kpf/no555/pdf/02.pdf · 기계학습을 하지만 4단계는 인간의 개입

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 국내 AI와 미디어 융합 현황 한국적 AI저널리즘이 걱정되는 이유…116.125.124.10/kpf/no555/pdf/02.pdf · 기계학습을 하지만 4단계는 인간의 개입

11

특집

AI와 미디어 융합

김민성 / 한경닷컴 뉴스랩장

국내 AI와 미디어 융합 현황

한국적 AI저널리즘이 걱정되는 이유…죽거나 나쁘거나

대한민국에 인공지능(AI) 담론이 본격화한 계기는

2016년(3월 9~15일) 구글 인공지능(AI) 알파고와

이세돌 9단의 대국이었다. 1,200여 대의 컴퓨터가

짜놓은 디지털 매트릭스 속 AI. 약관의 나이에

‘입신’의 경지라는 9단에 오른 이세돌의 끈질긴

저항을 가장 진화한 기계 연산으로 무릎 꿇린

알파고를 TV 생중계로 본 이들은 포비아에 시달렸다.

미디어 영역도 공포에 사로잡혔다. 머지않아

미디어계에 닥칠 AI 저널리즘에 대한 두려움이었다.

로봇 저널리즘 혹은 챗봇이란 이름으로 부분적으로만

모습을 드러낸 미디어 (로)봇에 대한 막연한 두려움은

알파고로 본격 증폭됐다.

다행인 건 알파고 덕분에

(로)봇이 인공지능적으로

움직이는 기반이 알고리즘1

그리고 딥러닝2이라는 구조를 알게 됐다. 이를

미디어에 적용하면, AI 저널리즘은 미디어 관련

알파고로 증폭된

두려움

영화 ‘매트로폴리스’ 스틸컷. 1927년 프리츠 랑 감독이 만든 최초의 장편 SF영화다. “머리와 손을 중재하는 건 마음(심장)”이라는 명대사로

유명하다. <사진 출처-매트로폴리스 스틸컷>

Page 2: 국내 AI와 미디어 융합 현황 한국적 AI저널리즘이 걱정되는 이유…116.125.124.10/kpf/no555/pdf/02.pdf · 기계학습을 하지만 4단계는 인간의 개입

12

신문과 방송 2017. 03

알고리즘이 생산 단계부터 인간의 잦은 개입 없이

자동화한 콘텐츠를 정기적으로 만들어내고 더 많은

생산 과정을 반복할수록 더 나은 제작 능력(혹은

결과물)을 갖춘다는 뜻이다. 로봇 저널리즘의 본질도

같다. 콘텐츠 데이터 수집부터 분석, 처리, 표출까지

알아서 진행하고 독자의 만족도까지 감안해

콘텐츠의 품질을 개선한다. 특정 알고리즘 기반의

미디어 (로)봇이 수십 년치 과거 기사를 긁어 와

이슈에 대한 가장 합리적인 대안을 제시하는 기사를

단 몇 초 만에 쓸 날이 온다는 기대 혹은 우려.

미디어 종사자들이 알파고에 질겁한 핵심이다.

다행히 현재 완전 자동화한 ‘알파고 기자’는 국내에도

해외에도 없다. 기사를 써내긴 했지만 독자 감성과

인사이트를 매만지는 수준은 아니다. 시와 소설도

창작하고 있지만 스토리 라인과 주인공, 주어,

목적어 등 특정 단어를 인간이 꼼꼼히 입력해야

알고리즘이 오류 없는 문장을 조합하는 수준이다.

두려움의 실체는 미래에 있다. 일본 인공지능 연구자인

마쓰오 유카타 도쿄대 교수3는 인공지능의 수준을

레벨1~4까지 네 단계로 분류한다. 레벨1은 단순

제어 프로그램이다. 온도 변화를 감지하는 에어컨

센서 기술 등으로 이미 일반화해 있다. 레벨2부터가

우리가 기대하는 혹은 두려워하는 영역이다. 간단한

질문에 답하는 약한 인공지능(Weak AI)이다. 애플

시리나 아마존 알렉사를 떠올리면 된다. 레벨3부터가

기계학습으로 자가 발전하는 인공지능이다.

레벨3은 인간이 입력한 데이터와 알고리즘 기반으로

기계학습을 하지만 4단계는 인간의 개입 없이 알아서

입력 값을 찾고 다시 깊이깊이 학습(딥러닝)한다.

인간의 사고와 추상을 따라잡는 강한 인공지능(Strong

AI) 4 혹은 인간 수준의 기계지능(Human Level

Machine Intelligence)이라 불리는 영역이다.

분명 미디어 (로)봇은 학습을 통해 끊임없이 자체

진화할 것이다. 스스로 독자를 찾고 알아서 추천

시스템을 구축하는 구글·페이스북·애플의

로봇 기자에서 향후 인류의 과거 분석 및 현재

진단으로 가장 효과적인 미래 해결책을 제시하는

AI 저널리즘으로 성장할 것이다. 자신과의

끊임없는 싸움으로 ‘이세돌 기자’마저 꺾는 ‘알파고

기자’ 즉, 인간에 버금가거나 인간을 뛰어넘는

강한 인공지능으로 성장하는 어떤 미래. 한국의

(언론) 미디어는 어떤 준비를 하고 있나. 본 게임을

시작도 하기 전에 여기저기서 경고음이 요란하다.

미디어의 범위는 넓다. 그중

뉴스라는 콘텐츠를 생산

유통하는 뉴스 미디어,

언론 역시 많다. 국내를 보자. 문화체육관광부에

따르면5 2017년 2월 4일 기준 국내에서 정기간행물을

정식 발행하는 곳은 1만8,812곳에 달한다. 2016년

기준 일간·주간신문이 3,391개, 인터넷신문은

6,347개에 달한다. 국내 주요 신문 및 방송,

인터넷언론이 생산하는 기사의 대다수는 포털

네이버, 카카오(다음)로 향한다. 영국 로이터

저널리즘 연구소가 발행한 <디지털 뉴스 리포트

2016>에 따르면 한국인 10명 중 6명은 포털에서

뉴스를 소비한다. 이들 포털로 흘러들어 가는 기사는

하루 약 6만 건(정식 계약 3만2,000건, 검색제휴사

2만4,000건)에 달한다.

이 가운데 알고리즘 기반 미디어 (로)봇이 생산한

기사는 극히 소수다. 절대 다수는 인간 기자가

독자와 비즈니스를 감안해 만든 콘텐츠다. 그래서

미디어 분야 AI는 아직 미약하다고 생각한다.

고작 증시 속보, 경기 결과, 지진 발생 등 단순

사실 나열인데 뭐가 걱정이냐고 한다. 하지만 이는

(큰) 오해다. 뉴스 콘텐츠는 인간이 생산했지만

국내 뉴스의 60%가 소비되는 포털 뉴스 생태계는

이전부터 알고리즘 기반의 미디어 (로)봇이기

때문이다. 네이버와 다음의 검색 결과를 떠올려

보라. 매일 보는 포털 화면 뒤에는 검색 알고리즘

맹렬히

존재 드러내는 AI

Page 3: 국내 AI와 미디어 융합 현황 한국적 AI저널리즘이 걱정되는 이유…116.125.124.10/kpf/no555/pdf/02.pdf · 기계학습을 하지만 4단계는 인간의 개입

혹은 검색 (로)봇이 밥도 먹지 않고, 잠도 자지 않고,

지치지도 않고 검색 명령에 답을 찾고 있다.

이런 소프트웨어는 눈에 보이지 않았다. 30년

넘게 유비쿼터스 이론을 지배해온 ‘보이지 않는

컴퓨팅(Invisible Computing)’ 개념이다. 그런데 이젠

맹렬히 존재를 내보이기 시작했다. 이른바 개인 추천

혹은 맞춤화란 이름으로 말이다. 네이버에서 검색한

쇼핑 목록이 내가 방문한 해외 뉴스 사이트 광고

배너에 자동 노출되고, 홈쇼핑 애플리케이션(이하

앱)에서 구매한 상품 리스트가 페이스북 개인

뉴스피드에 자동으로 따라붙는 세상이다. 해외 언론

사이트 뉴스만 몇 개 클릭해도 ‘당신이 좋아할 만한

뉴스’ 수십 개가 자동으로 엮인다.

2017년이 AI와 미디어 융합의 원년으로 평가받는

이유 중 가장 큰 배경이 여기에 있다. 백(Back) 단에

숨어 있던 미디어 (로)봇이 맹렬히 프런트(Front)

단으로 신기한 결과물을 던지면서다. 이를 AI

기반 기술이라고 드러내고 자랑하는 곳도 많다.

네이버 모바일 뉴스 메인화면에 둥지를 튼 에어스

(AiRS: AI Recommender System)처럼 말이다.

이름 그대로 AI 추천 시스템이다. 화면 속 결과로서

뿐만이 아니다. 하드웨어와도 한 몸이 됐다. 두뇌

(소프트웨어)와 신체(하드웨어)를 모두 갖춘 실물

로봇으로 그 모습을 드러내고 있다. 그간 눈에 안

보이던 것들이 더 자주, 게다가 가장 가까운 곳에

실존한다는 사실. AI를 둘러싼 기대와 공포는 해외뿐

아니라 국내에도 이렇게 동시에 커가고 있다.

아마존 AI, 알렉사는 ‘에코’에,

애플 시리는 아이폰·카플레이·

애플TV로, OK구글 6은 안드로이드폰·안드로이드

오토·구글홈으로 현실 공간에 등장했다. 음악이나

팟캐스트를 재생하고, 뉴스를 읽어주고, 시간을

알려주며 쇼핑 목록을 만들어 사용자에게 시시각각

알려준다. 스마트폰-TV-자동차-냉장고-세탁기-

조명 등도 제어한다. 4G LTE를 지나 5G로 발돋움

중인 데이터 네트워크 통신 덕에 실시간 대용량

미디어 스트리밍이 가능해졌다. 검색-음성인식-

미디어 스트리밍-추천 알고리즘 등 핵심 기술 네

박자가 골고루 맞아떨어지면서 AI 미디어 시대가

활짝 열리고 있는 것이다. 해외에서 구글, 애플,

아마존 등 IT 기업이 AI 미디어 시대의 포문을

연 것처럼 국내에서도 통신사, 검색 포털, 전자

기업이 본격 AI 미디어 시대를 열고 있는 건 그래서

필연이다.

SK텔레콤 음성인식 기기 ‘누구’가 AI를 내건 선발

주자고, KT의 ‘기가지니’가 뒤따르고 있다. 네이버와

카카오도 AI 서비스 시장에 뛰어들었다. 네이버는

AI 관련 개발 조직 J팀 산하에서 음성인식, 번역

(파파고), 자율주행차 등 다양한 서비스를 개발 중인

것으로 알려졌다. 카카오도 네이버에 대항해 ‘카카오

AI 기초체력

KT 기가지니 소개페이지 내 뉴스 콘텐츠 소개 화면 영상 캡처(위),

네이버가 모바일뉴스 메인화면에 적용한 AiRS 뉴스 예시 화면(중간),

SK텔레콤 ‘누구’ 홈페이지 내 라디오 및 뉴스 음성듣기 기능

소개(아래). <사진 출처-KT 기가지니 홈페이지, 네이버 모바일 뉴스 홈페이지, SK텔레콤 ‘누구’ 홈페이지 캡처>

Page 4: 국내 AI와 미디어 융합 현황 한국적 AI저널리즘이 걱정되는 이유…116.125.124.10/kpf/no555/pdf/02.pdf · 기계학습을 하지만 4단계는 인간의 개입

14

신문과 방송 2017. 03

브레인’을 설립했다.

네이버와 카카오는 이미 2010년 말부터 음성

검색을 비롯해 사물 인식, 음악 검색, QR코드 등을

선보였다. 당시 다음의 모델이던 걸그룹 소녀시대가

“검색어를 말해봐~” “카카오는 말을 못 알아들어”

등을 광고했다. 포털 검색사는 이미 6년 전부터

클러스터링과 자연어 인식·처리, 초기 머신러닝

기술을 바탕으로 자동 추천 기술을 음성 명령

기반으로 고도화해 왔다는 뜻이다. 이를 기반으로

네이버는 대화형 AI ‘아미카’를 탑재한 스피커

디바이스를 올 2분기에 선보일 예정이다. 음성인식

및 머신러닝 기반 AI 번역 프로그램 ‘파파고’는 이미

구글 번역과 경쟁을 벌이고 있다.

통신사는 5G 시대의 도래를 앞두고 검색 포털이나

스마트폰 제조사 등에 그간 내줬던 ‘콘텐츠 플랫폼’

강자 지위를 호시탐탐 노리고 있다. 어떤 고속 대용량

미디어 데이터도 자신들이 깔아 놓은 망을 지나간다는

자신감을 바탕으로 5G 시대에는 더 강해질 것이다.

유무선 데이터통신-IPTV-음성 기반 AI 서비스-

자체 콘텐츠-자체 디바이스 등 하드웨어·소프트

웨어 생태계를 강화하는 중이다.

검색 기업은 20년 가까이 가꾸어

놓은 검색-콘텐츠-서비스-

커뮤니티 기반의 포털 서비스를

AI 기반으로 보다 고도화하는 데 자신감을 내보이고

있다. 네이버는 국내 검색 시장 70%를 장악해 온

기업이다. 구글 검색에 점유율을 점점 뺏기고 있지만

아직 철옹성처럼 국내 소비자를 ‘로크인(Lock

in)’해 놓고 있다. 그만큼 콘텐츠 클러스터링 및

추천 서비스를 잘 다졌다는 뜻이다. 매일 사용자를

붙들어 놓는 데 가장 탁월한 콘텐츠인 뉴스뿐 아니라

영화, 음악, 동영상, 만화, 쇼핑, 간편 결제에 이르는

미디어 서비스와 사용자 데이터를 보유하고 있다.

구슬이 서 말이라도 꿰어야 보배이듯 포털 검색사는

그간 참 열심히 사용자가 좋아하는 콘텐츠를 엮어

보배로 만들어 놓았다. AI 기초 체력인 검색 능력과

양질의 콘텐츠 DB가 탄탄하다. 앞으로 열릴 AI

시대에도 과거 미디어의 영향력을 지킬 수 있는 가장

큰 자신감이다. OK구글이 시리나 알렉사를 앞선다는

평가를 받는 이유도 같다. 음성을 인식하는 구글의

자연어 처리 기술도 뛰어나지만, 지구 혹은 우주

최강 검색 엔진이 뒷단에 버티고 있기 때문이다.

게다가 지치지 않고 자가 학습하는 구글 AI들은

시간이 흐르면 흐를수록 더 강력해진다. 시간은

인간이 아닌, AI의 편일 수도 있음이 두렵기도 하다.

(미디어의 범위는 너무 넓기에) 뉴스 혹은 언론

콘텐츠로 논의를 좀 더 좁혀 보자. 국내 언론과

미디어의 콘텐츠는 통신사와 포털이 준비 중인

AI 플랫폼 속으로 알게 모르게 재흡수되고 있다.

언론사마다 어떤 플랫폼에 올라타야 할지가 다시 AI

미디어 시대의 화두가 될 가능성이 크다. 국내 언론사

디지털 서비스 내 AI 자체 경쟁력을 현재는 찾아보기

어려워서다.

YTN은 SK텔레콤 ‘누구’와 네이버 J의 음성

서비스에 뉴스 공급 계약을 체결한 것으로 알려진다.

연합뉴스TV는 KT ‘기가지니’에 음성 뉴스 서비스를

시작했다. 방식은 간단하다. 방송사가 자체 TV

정규 방송용으로 제작한 뉴스 영상 내 음성을 음성

파일 형태로 말아, 네이버와 SKT, KT에 제공하는

방식이다.

십수 년 동안 네이버와 다음 등 포털 뉴스에 텍스트

뉴스와 영상 뉴스를 제공하던 계약 형식도 유사하다.

서비스 제휴는 과거 언론사-포털 계약을 기반으로

한다. SK텔레콤은 포털 사이트 네이트를 운영해 온

SK커뮤니케이션즈를 통해, 네이버 역시 국내 최강

언론 제휴망으로 음성 뉴스를 가져온다. 카카오의

브레인도 다음 뉴스 계약 구조를 계승할 것이다.

음성 뉴스 서비스는 아직 걸음마 단계다. “주요 뉴스”

“뉴스를 읽어줘” 같은 단순 명령에 계약사가 제공한

다시 플랫폼

종속

Page 5: 국내 AI와 미디어 융합 현황 한국적 AI저널리즘이 걱정되는 이유…116.125.124.10/kpf/no555/pdf/02.pdf · 기계학습을 하지만 4단계는 인간의 개입

뉴스 음성 파일을 단순 스트리밍하는 방식이다.

YTN과 연합뉴스TV가 포문을 연 만큼, 주요 방송

뉴스를 쉼 없이 주기적으로 생산하는 지상파, 종편,

라디오 언론들이 음성 뉴스 시장에 더 활발히 진출할

것으로 보인다.

문제는 신문사 같은 텍스트 기반 언론이다. 도래한

‘동영상의 시대’에도 방송사에 밀리는 현실인데 ‘AI의

시대’ 초입부터 방송에 또 밀리기 시작했다. 영상이나

음성 뉴스를 만들 기술, 인력, 인프라 기반 투자는

여전히 부족하고, 앞으로도 불투명하다. 신문사가

방송 인프라 투자에 소극적이라기보다 신문과 방송

간 콘텐츠 철학 및 조직 문화가 오랫동안 달라서다.

다행히 신문사가 음성 뉴스를 만들지 않더라도

해결해줄 기술은 있다. TTS(Text To Speech), 즉

텍스트 음성 변환 기술이다. 누구, 기가지니, 네이버,

다음 앱 등에 탑재된 음성 인식 기술은 STT(Speech

To Text), 즉 음성을 텍스트로 변환하는 기술이다.

인간의 일상적 대화 내용에서 특정 키워드를 찾는다.

예로 “비 올 때 좋은 음악 들려줘”라는 음성 명령을

내리면, STT 엔진은 ‘비’ ‘음악’ 이라는 키워드를

추출해낸다. 두 키워드가 공동 태깅(Tagging)된

음악을 DB에서 찾는 것인데, 클러스터링한 뒤

플레이리스트 형태로 사용자에게 재생한다. TTS는

그 반대다. 텍스트를 음성으로 바꾼다. 시각장애인을

위한 TTS 기술처럼 말이다. 관건은 텍스트의 장르 및

2017년은 AI와 미디어 융합의 원년으로

평가받는다. 4G를 지나 5G로 발돋움 중인

데이터 네트워크 통신 덕에 실시간 대용량

스트리밍이 가능해졌다. 검색-음성인식-

미디어 스트리밍-추천 알고리즘 등 핵심 기술

네 박자가 맞아떨어지면서 AI 미디어 시대가

활짝 열리고 있다.

성격에 맞게, 얼마나 인간에 가깝게 잘 읽어주느냐다.

TTS 기반 음성 디바이스 서비스는 네이버가 올해

2분기, SK텔레콤이 3분기에 관련 서비스를 출시할

계획이다. 네이버는 이미 모바일 앱과 PC 웹 뉴스

서비스에 ‘본문듣기’ TTS 서비스를 제공하고 있다.

SKT는 과거 T맵 등 내비게이션 앱에서 선보인 TTS를

미디어 TTS로 고도화하는 중이다. 이들 기업은 5년

가까이 자체 TTS 개발에 꾸준히 투자해 온 것으로

알려진다. 이들이 TTS에 투자를 늘리는 이유는

텍스트 콘텐츠 DB의 광활함, 그리고 실시간성에 있다.

영상이나 음성 기반 콘텐츠를 단순 스트리밍하는 건

뉴스의 속보성을 저해한다. 저녁 시간 AI 스피커가

들려주는 주요 뉴스가 자칫 오늘 아침 녹음된

것이라면 사용자는 결코 만족하지 않을 것이다.

텍스트 기반 미디어 콘텐츠는 실시간 쏟아진다.

대표적인 게 속보 뉴스다. 국내 수백 개 언론사가

텍스트 형태로 쉴 새 없이 네이버와 다음, 네이트로

전송한다.

포털 내 뉴스 편집 인력은 하루 수만 개 뉴스 가운데

품질이 좋은 뉴스만 사용자가 소비하기 편하게

편집해 놓는다. TTS만 잘 갖춘다면 포털에서

눈으로만 소비하던 텍스트 뉴스를 음성 스피커든,

스마트폰이든, TV든, 자동차든, 집이든, 건물에서든

자유자재로 음성으로 들을 수 있다. 통신, 검색 포털

등이 TTS 개발에 열을 올리는 이유다.

최근 음성인식 개발을 총괄하는 한 대기업 프로젝트

매니저(PM)를 만났다. 뉴스 음성 서비스의 현황과

미래에 대해 이야기 나눌 기회였다. 이들 고민의

핵심은 뉴스라는 콘텐츠가 음성 AI 스피커와 얼마나

잘 어우러질지였다. 이 PM은 현재 뉴스 콘텐츠는

음성 스피커에서 인기가 없다고 잘라 말했다. 음악

재생, 오늘의 날씨, IPTV 연동, 조명 켜고 끄기,

간단한 음식 주문 같은 기능만큼의 인기가 없단다.

이유 설명이 흥미로웠다. 뉴스가 인기가 없어서가

아니라, 음성 AI 서비스의 ‘수준’ 문제라고 했다. 그는

Page 6: 국내 AI와 미디어 융합 현황 한국적 AI저널리즘이 걱정되는 이유…116.125.124.10/kpf/no555/pdf/02.pdf · 기계학습을 하지만 4단계는 인간의 개입

16

신문과 방송 2017. 03

“현재 AI 스피커는 사람으로 따지면 7세 정도 되는

듯하다”고 했다. “누가 7세 아이에게 복잡한 뉴스를

물어보겠는가”라는 반문이 이어졌다. 사람의 음성

명령(업계는 이를 ‘발화(發話)’라고 한다) 중 키워드를

뽑는 게 핵심인데, 특정 뉴스를 듣고자 하는 소비자의

요구 맥락은 단순 몇몇 키워드보다 더 복잡하다는

것이다. AI 스피커에 대고 “오늘 뉴스 중 구글과 애플의

차기 AI 개발 경쟁 구도를 심도 있게 다룬 기사를

읽어줘”라고 명령해봤자, 돌아오는 답은 “죄송하지만

잘 못 알아들었어요”뿐이라는 게 현재 AI 서비스

수준이다. 그래서 “좋은 뉴스 서비스는 AI의 나이가

더 성숙해져야 가능할 것 같다”고 했다. 뉴스 관련

TTS 기술도 복잡한 뉴스 맥락을 AI가 더 잘 이해할 때

완성도가 높아지지 않겠느냐는 예상도 곁들였다.

뉴 스는 엄 밀하게 말 해

내러티브를 갖는 텍스트, 또는

영상이지만 다른 미디어들과

명확하게 구분되는 특징이 있고 알고리즘·AI를

통한 자동 생성의 가능성을 사실상 가장 활발하게

타진하고 있는 영역이다. 텍스트 뉴스 분야에는 이미

2010년 무렵부터 자동 기사 작성 알고리즘, 또는

알고리즘을 이용한 기사 작성 플랫폼이 등장했다.7

해외 언론처럼 국내 방송사나 텍스트 기반 신문사도

불완전하더라도 AI 혹은 알고리즘 서비스 역량을

키워야 한다. 문제는 자체 검색 기술을 내재화한

국내 언론사를 찾아보기 힘들다는 점이다. 공개돼

있는 포털 검색창을 끌어와 쓰거나, 중소 검색 기술

개발사가 만든 검색 기술을 저렴한 비용으로 계약해

자사 사이트에 박아 놓은 곳이 대부분이다.

AI 시대에 가장 우려되는 점은 알고리즘이 어떤

방식으로 구성됐고, 어떻게 작동하는지조차

모른다는 사실이다. 알파고가 어떤 알고리즘과

신경망 학습으로 이세돌을 이겼는지 우리는 알지

못한다. 고도의 기술 내부를 들여다볼 수 없고,

창조자인 구글도 온전히 공개하지도 않으니 말이다.

굳이 알파고까지 갈 필요도 없다. 매일매일 국내

언론사는 네이버와 다음의 실시간 검색어 뉴스

상단을 차지하기 위해 사투를 벌이고 있다. 하지만

포털의 클러스터링 구성 알고리즘을 정확히 알지

못한다. 장님이 코끼리 만지듯 뉴스 클러스터링

상단에 올라가는 기사들의 파편적 요인을 짐작할

뿐이다.

이뿐인가. 페이스북 뉴스피드 노출 원리는 무엇인가.

왜 뉴욕타임스는, 왜 버즈피드는 한국의 중소 언론사

뉴스보다 더 자주 그리고 더 상단에 자주 뜨는가.

페이스북 내 동영상 포스팅과 실시간 생방송 콘텐츠

노출은 체감적으로도 급격히 늘어났는데, 이는 그저

우연인가. 구글·애플·페이스북·아마존(GAFA)

플랫폼이 어떤 특정인과 특정 단체, 특정 주제,

특정 형식의 콘텐츠에 얼마만큼의 가중치를 차별해

부여하는지 우리는 매일 GAFA 서비스를 숨 쉬듯

쓰지만 정확히 알지 못한다.

알고 당하는 것과 모르고 당하는

건 예나 지금이나 천지 차이다.

그렇다면 A I에 한국 언론

기업은 얼마나 대비하고 있을까. 자체 검색 서비스

역량을 보유하거나, 자체 추천 서비스 알고리즘을

개발했거나, 자체 STT 혹은 TTS 기술을 보유한

신문사나 방송사는 얼마나 되는가. 검색도, 추천

알고리즘도, 클러스터링 DB도, 영상 및 음성 콘텐츠

제작 역량도, 투자 의사도 없다면 AI의 시대는

언론사에 차라리 재앙에 가깝다. AI 서비스와

플랫폼에 사용자가 몰리면 몰릴수록, 언론사의

외부 플랫폼 종속은 더 가속화할 수밖에 없다.

특히 검색이나 추천 서비스, STT·TTS 기술력은

하루아침에 얻을 수 없다. 푼돈 투자로 서비스

만족도나 완성도를 높일 수도 없는 분야다. 이건 AI

기초 체력의 문제다.

아무도 모르는

뉴스 알고리즘

죽거나 혹은

나쁘거나

Page 7: 국내 AI와 미디어 융합 현황 한국적 AI저널리즘이 걱정되는 이유…116.125.124.10/kpf/no555/pdf/02.pdf · 기계학습을 하지만 4단계는 인간의 개입

17

다른 걱정은 AI와 미디어가 만나 AI 저널리즘으로

불릴 만한 의미 있는 신세계를 창출할 수 있을지

여부다. 저널리즘은 기본적으로 진실성과 객관성,

정확성을 추구한다. 미래적 알고리즘 기반 미디어

(로)봇의 아이러니는 과거를 추구한다는 데 있다.

과거 빅데이터를 수집, 반복 학습해야 하기

때문이다. AI가 불편부당하지 못한 과거 지식이나

이념, 오류가 섞인 데이터를 학습한다면 그 인공지능

결과물 역시 과거의 편파성을 벗어날 수 없다. AI

저널리즘이 노동비용 측면에서 이전보다 효율적일

순 있어도 과거보다 나은 공동체적 인사이트를

창출할 수 없다면 빛을 잃을 것이다.

결국 AI 저널리즘의 원재료 중

하나인 뉴스 데이터를 소유한

언론사의 각성이 중요하다.

언론사 자체적인 AI 서비스 개발을 강화하는 것

못잖게 뉴스 DB 곳간을 진실성, 객관성, 정확성

기반의 저널리즘 콘텐츠로 채워 놓아야 한다.

독이 든 나무의 과실에도 독이 밴다. 단순 트래픽

획득용으로 양산한 기사와 취재 윤리에 충실치 못한

기사 비중이 높다면 해당 언론사 뉴스 DB는 AI

저널리즘의 기본 재료로 쓰일 수 없을 뿐 아니라,

쓰여서도 안 된다.

국내 미디어 환경의 AI저널리즘은 시작부터 많은

우려점을 던지고 있다. 포털 트래픽을 노린 어뷰징

기사가 난무하고, 객관성과 진실성을 내팽개친 ‘가짜

뉴스’ 논란에 시끄럽다. 상황이 이렇다 보니 디지털

뉴스 중개자인 포털이나 기술 기업이 언론사에

오히려 저널리즘에 입각한 콘텐츠를 생산해 달라고

평가위원회 등을 꾸려 요구하는 지경이다.

AI, 가상현실(VR), 로봇, 데이터, 소셜네트워크

서비스(SNS) 등 디지털 기술은 저널리즘을 새롭게

만드는 형식이고, 그릇이다. 결코 하루아침에

구축되지 않을뿐더러, 황폐화한 토양을 마법사처럼

비옥하게 뒤바꿔줄 수도 없다. “좋은 뉴스를

찾아내는 것보다 가비지(Garbage)를 걸러내는 게

더 힘들다”고 투덜거린 한 포털 뉴스 관계자의 말은

뉴스 DB의 ‘순도’를 향한 갈증인지도 모르겠다.

수십 년간 단독, 기획, 속보 등 낱개 뉴스 콘텐츠를

만드는 데 목을 매온 뉴스룸 종사자들은 이제 나무가

아닌 숲 즉, 미디어 서비스로 눈을 돌려야 한다. AI와

미디어의 본격 융합이 국내 언론에 던지는 메시지는

‘서비스 저널리즘’이 아니겠는가. 기술이 인간의

설 자리를 빼앗아 간다는 시각보다 기술을 어떻게

인간의 전문성과 창조성을 강화하는 방안으로

사용할지가 늘 더 중요하다.

네이버 랩스(labs)8 산하 인공지능 로봇 개발조직

로보틱스팀이 제시한 로드맵 키워드9를 곱씹어본다.

첫째, 사람이 다닐 수 있는 곳은 어디든 다닐 수

있는 이동성(Mobility), 둘째, 사람과 함께 일할

수 있는 조종성(Manipulation), 셋째, 사람의

의도를 이해하고 상황에 맞는 서비스를 제공하는

지능(Intelligence) 등 이른바 ‘생활환경지능(Ambient

Intelligence)’ 3요소 말이다.

결국은

저널리즘의 질

1 컴퓨터 혹은 디지털 대상이 과업을 수해하는 방법에 대한 설명으로 명확히 정의된 한정된 개수의 규제나 명령의 집합.(Goffet, 2008. 15.).

2 여러 선형 비선형 변환 기법의 조합을 통해 높은 수준의 추상화를 시도하는 기계학습의 한 종류.

3 마쓰오 유카타(2015.12.10.), “인공지능과 딥러닝(인공지능이 불러올 산업 구조의 변화와 혁신)”, 동아엠엔비.

4 Ray Kurzweil(2001.6.8.), Are We Spiritual Machines?: Ray Kurzweil vs. the Critics of Strong A.I.

5 http://www.mcst.go.kr/web/s_open/pre/preOpenInfo. jsp?pType1=034&pType2=07

6 구글이 개발한 음성인식 AI 비서 ‘구글 어시스턴스’ 기반 서비스. 구글은 상황 인식 AI ‘구글 나우’, 그림 합성 AI ‘구글 딥드림’, 바둑

AI로 잘 알려진 ‘알파고’ 등 다양한 AI를 개발하고 있다.

7 오세욱·김수아(2016. 10. 31.), ‘디지털 저널리즘 투명성 제고를 위한 기술적 제안’ 내 인용.

8 네이버 랩스. 2017년 1월 2일 네이버 별도 법인 분사. 사용자

요구 전에 상황을 인식해 필요한 서비스를 적재적소에 제공하는

‘생활환경지능’ 기반 제품 개발을 목표로 한다.

9 http://naverlabs.com/article/4.html