17
통계연구(2016), 특별호, 112-128 온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구: 공적/사적 의료 지식에 미치는 커뮤니티 내 연결망 효과 중심으로 곽진아 1) 이원재 2) 요약 본 연구는 한국 온라인 커뮤니티 내에서 발생하는 보건/의료 이슈를 탐지하고, 커뮤니티 내 여 론 형성에 영향을 미치는 요인을 찾고자 한다. 특히 공적/사적 의료 지식에 대해 네트워크 내의 전파가 다른지 확인하고자 한다. 이를 위해 보건/의료 관련 이슈에 대한 토론이 많고, 의료기관 에 언급량이 많은 커뮤니티를 선정하여, 커뮤니티 개설 초기 (2007년 3월)부터 93개월 동안의 게시글을 수집하고, 글/댓글 네트워크를 구성하였다. 자연언어처리 기법을 통해 해당 커뮤니티에서 보건/의료 관련 메시지를 주제별로 범주화 하고, 언급량을 분석하였다. 네트워크 분석을 통해 개인의 커뮤니티 내 영향력이라 할 수 있는 구조적 위치를 측정하였다. 또한 주요 보건/의료 키워드에 대해 네트워크 환경 (커뮤니티 내 친구의 언 급)으로 인해 개인의 언급이 발생하는 지 여부를 측정하기 위해 ‘드문 사건 로지스틱 모델 (rare events logistic regression)'을 사용하였다. 분석 결과, 커뮤니티 내에서 개인이 보건/의료 관련 이슈를 언급할 때, 외부효과로 볼 수 있는 언론 보도 수는 유의미한 영향을 미치지 않았으며, 커뮤니티 내 다른 사용자의 언급이 영향이 미치는 것을 발견하였다. 특히 보건 의료 관련 주제별로 차이가 나타났는데, 일반적이고 공적인 이슈인 ‘백신, 독감, 감기, 항생제’ 와 달리 상대적으로 사적인 이슈라고 볼 수 있는 ‘모유수유’ 이 슈에서 특히 커뮤니티 내의 사회적 위세가 높은 경우 언급량이 많은 것으로 나타났다. 주요용어 : 온라인 커뮤니티, 연결망 분석, 보건 의료 1. 서론 보건/의료 이슈는 일상생활에 매우 밀접하며, 그만큼 시민들의 끊임없는 관심을 받 고 있다. 시민들이 관심을 보이는 보건/의료 이슈의 종류와 이유, 그리고 여론 확산에 영향을 끼치는 요인들을 파악할 수 있다면, 특정 질병과 관련한 의료 정책 수립에 도 움을 줄 수 있을 것이다. 보건/의료에 대한 빅데이터 연구는 주로 공공데이터 활용 방안이나 언론 보도 분 석에 국한 되어왔다. 보도 프레임을 분석하거나 (주영기 외 2011), 언론 보도 시 등장 하는 취재원 실태를 분석함으로써 질병의 프레임 형성을 지적하는 연구 (노수진 외 1) 대전광역시 유성구 대학로 291 한국과학기술원 문화기술대학원, 박사과정. E-mail: jinah.kwak @kaist.ac.kr 2) 교신저자. 대전광역시 유성구 대학로 291 한국과학기술원 문화기술대학원, 교수. E-mail: wjlee @kaist.ac.kr

온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구: … · 사회연결망(social network)은 개인이나 조직으로 이루어진 관계 구조를

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구: … · 사회연결망(social network)은 개인이나 조직으로 이루어진 관계 구조를

통계연구(2016), 특별호, 112-128

온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한

연구: 공적/사적 의료 지식에 미치는 커뮤니티 내 연결망

효과 중심으로

곽진아1) ․ 이원재2)

요약

본 연구는 한국 온라인 커뮤니티 내에서 발생하는 보건/의료 이슈를 탐지하고, 커뮤니티 내 여

론 형성에 영향을 미치는 요인을 찾고자 한다. 특히 공적/사적 의료 지식에 대해 네트워크 내의

전파가 다른지 확인하고자 한다. 이를 위해 보건/의료 관련 이슈에 대한 토론이 많고, 의료기관

에 언급량이 많은 커뮤니티를 선정하여, 커뮤니티 개설 초기 (2007년 3월)부터 93개월 동안의

게시글을 수집하고, 글/댓글 네트워크를 구성하였다.

자연언어처리 기법을 통해 해당 커뮤니티에서 보건/의료 관련 메시지를 주제별로 범주화 하고,

언급량을 분석하였다. 네트워크 분석을 통해 개인의 커뮤니티 내 영향력이라 할 수 있는 구조적

위치를 측정하였다. 또한 주요 보건/의료 키워드에 대해 네트워크 환경 (커뮤니티 내 친구의 언

급)으로 인해 개인의 언급이 발생하는 지 여부를 측정하기 위해 ‘드문 사건 로지스틱 모델 (rare

events logistic regression)'을 사용하였다.

분석 결과, 커뮤니티 내에서 개인이 보건/의료 관련 이슈를 언급할 때, 외부효과로 볼 수 있는

언론 보도 수는 유의미한 영향을 미치지 않았으며, 커뮤니티 내 다른 사용자의 언급이 영향이

미치는 것을 발견하였다. 특히 보건 의료 관련 주제별로 차이가 나타났는데, 일반적이고 공적인

이슈인 ‘백신, 독감, 감기, 항생제’ 와 달리 상대적으로 사적인 이슈라고 볼 수 있는 ‘모유수유’ 이

슈에서 특히 커뮤니티 내의 사회적 위세가 높은 경우 언급량이 많은 것으로 나타났다.

주요용어 : 온라인 커뮤니티, 연결망 분석, 보건 의료

1. 서론

보건/의료 이슈는 일상생활에 매우 밀접하며, 그만큼 시민들의 끊임없는 관심을 받

고 있다. 시민들이 관심을 보이는 보건/의료 이슈의 종류와 이유, 그리고 여론 확산에

영향을 끼치는 요인들을 파악할 수 있다면, 특정 질병과 관련한 의료 정책 수립에 도

움을 줄 수 있을 것이다.

보건/의료에 대한 빅데이터 연구는 주로 공공데이터 활용 방안이나 언론 보도 분

석에 국한 되어왔다. 보도 프레임을 분석하거나 (주영기 외 2011), 언론 보도 시 등장

하는 취재원 실태를 분석함으로써 질병의 프레임 형성을 지적하는 연구 (노수진 외

1) 대전광역시 유성구 대학로 291 한국과학기술원 문화기술대학원, 박사과정. E-mail: jinah.kwak @kaist.ac.kr

2) 교신저자. 대전광역시 유성구 대학로 291 한국과학기술원 문화기술대학원, 교수. E-mail: wjlee @kaist.ac.kr

Page 2: 온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구: … · 사회연결망(social network)은 개인이나 조직으로 이루어진 관계 구조를

온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구 113

2013) 들은 시민들의 실제 생각에 대한 직접적인 관찰, 분석을 결여하고 있다.

설문조사를 통해 시민들이 특정 의료기관을 선택하는 요인에 시설, 의료진, 접근용

이성 등이 있다는 것을 밝힌 연구 (이현숙 2013), 온라인 뉴스, 블로그, 카페 등에서

수집한 소셜 빅데이터를 바탕으로 보건복지 정책에 대한 언급 빈도를 측정하고, 보건

복지 정책의 찬반에 영향을 미치는 정책을 분석한 연구 (송태민 2014), 건강과 소셜미

디어 사용 사이의 관계를 심층 면접을 통해 밝힌 연구 (김수정 2012) 등은 보건/의료

에 대한 시민들의 실제 생각을 관찰, 분석했다는 점에서 의미가 있다. 하지만 분석이

이슈의 언급량에 그치거나, 질병 간의 차이에 대한 세분화된 분석을 수행하지 않았다

는 한계가 있다.

이 연구에서 우리는 지식이 유통되는 게시판에서 모든 이슈를 동일하게 취급하지

않고, 이슈에 참여하는 시민들의 사회적 조건에 따라 각 건강 이슈들이 다른 정도의

확산과 사회적 영향력을 갖는다는 점을 밝히고자 한다. 우리는 실제 시민들이 보건/의

료 관련 이슈에 대해 언급한 글을 수집하고, 글/댓글 정보를 이용하여 참여 시민들의

네트워크를 파악하였다. 이를 통해 질병의 성격에 따라 확산에 미치는 요인들이 달라

진다는 것을 ‘드문 사건 로지스틱 회귀 (rare event logistic regression)’를 통해 검증

한다.

2. 온라인 커뮤니티 연결망 관련 선행연구

온라인 커뮤니티는 회원제를 기반으로 사이버 공간에서 상호작용하는 집단이기 때

문에 (최순화 2000), 상호작용을 파악하기 매우 용이하다. 2000년대 들어 우리 학계에

서도, 온라인 커뮤니티 내에서의 커뮤니케이션 과정을 분석하기 위해 사회연결망 분

석을 활발히 사용하기 시작했다. 권선영, 주서현 (2013) 은 온라인 임신 질의응답 게

시판에서 주고받는 메시지 내용과 사용자의 임신 시기에 따른 내용 변화를 파악하여

2일간 1,352건의 게시글에서 동시에 출현하는 단어를 분석했다. 이진용 외 (2009) 는

온라인 중고차 커뮤니티에서 개인의 활동(게시판 이용 횟수, 오프라인 모임 참여 횟수

등) 이 실제 오프라인 매장 방문 및 구매 횟수에 미치는 영향을 분석하였다.

개인 연결망 분석을 통해 온라인 커뮤니티 사용자의 활동 (글 수, 댓글 수, 조회수

등) 을 파악하고, 이러한 활동이 미치는 커뮤니티 내의 영향력을 분석한 연구도 시도

되었다. 전영아, 강정한 (2010) 은 온라인 커뮤니티에서 사용자가 갖게 되는 사회자본

이 온라인 정치참여에 미치는 영향력을 파악하기 위해 2달간 촛불집회 당시, 커뮤니

티 사용자의 글/댓글 작성 활동을 토대로 네트워크를 분석했다. 정치적 메시지 작성

수, 댓글수, 조회수, 추천수가 촛불집회 관련 메시지 작성 여부와 댓글을 받은 수에

영향을 미치는지를 확인하였다. 이현아, 류석진 (2013) 은 ‘디씨인사이드’의 유명 갤러

리 생성 초기 구성원들의 활동 변화를 분석하여 운영진보다 일반 사용자의 역할이 점

점 커지는 것을 확인하였고, 배순한 외 (2010) 는 소프트웨어 개발 커뮤니티, 생성 초

기부터 시간 변화에 따른 글/댓글 수, 네트워크 중심성 변화에 대해 분석하여 커뮤니

티가 활성화되는 요인을 분석하였다. 이세진, 이정교 (2012) 는 온라인 여성커뮤니티

Page 3: 온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구: … · 사회연결망(social network)은 개인이나 조직으로 이루어진 관계 구조를

114 곽진아 ‧ 이원재

에서 주고받는 메시지 내용과, 사용자들의 연결망 분석을 통해 글의 내용과 정체성에

따라 댓글 수가 변화하는지, 사용자들의 연결망이 커뮤니티마다 상이한지 여부를 ‘이

지데이’, ‘마이클럽’을 대상으로 비교하였다. 이 연구들은 비슷한 관심사를 지닌 커뮤니

티 내에서의 네트워크 구조와 형성과정을 밝혔지만, 이 같은 구조적 조건이 실제 사

건/이슈에 미치는 영향을 검증하지는 않았다.

3. 연구문제

앞서 살펴본 바와 같이 일부 연구에서 연결망 분석을 통해 커뮤니티 사용자들 사

이의 활동을 분석한 연구가 수행되고 있지만, 실제로 커뮤니티 연결망 내에서의 활동

이 외생적(exogenous) 사안에 미치는 영향력을 분석한 연구는 드물다. 본 연구에서는

이들이 시도하지 않은 연결망의 내부요인과, 언론 보도 및 검색어 수와 같은 외부 요

인을 비교하고자 한다. 이 비교는 이들 내부-외부 요인들이 공적/사적 건강이슈 언급

및 확산에 미치는 영향의 정도를 비교하는 것이다. 이를 위해 대전지역 육아, 살림 온

라인 커뮤니티 한 곳을 선정하여, 커뮤니티 내에서 언급되는 건강 관련 이슈를 파악

하고, 사용자들의 연결망이 해당 이슈의 사회적 확산에 미치는 영향을 검증한다.

4. 연구방법

4.1 연구대상 및 자료수집방법

온라인 커뮤니티 네트워크 분석을 위해서는 개인 사용자의 식별이 가능해야 하며,

사용자들이 상당 기간 동안 글과 댓글을 남겨 관계 정보가 충분히 쌓여야 한다. 따라

서 우리는 보건/의료 이슈에 대한 언급 및 공유가 활발한 커뮤니티를 선정하였다.3)

분석 대상으로 선정된 온라인 카페는 대전 지역의 육아정보 커뮤니티로, 2007년 3월

생성되어 2015년 현재까지도 활발하게 운영되는 비공개 커뮤니티이다. 전체 카페 순

위 중 최고 등급을 갖고 있으며, 월 평균 500여명의 신규 회원이 꾸준히 가입하고 있

다. 분석대상이 된 게시판은 가입 후 활발한 활동을 통해 일정 등급 이상의 회원만

사용가능한 곳으로, 회원 등급 상향을 위해서 300자 이상 글 10회 이상 게시, 50회 이

상 댓글 게시 (일 1회 제한) 해야 한다. 커뮤니티 내 전체 게시판 중 가장 활발한 게

시판으로, 각종 일상생활에 대한 이야기나 상품/서비스에 대한 평가, 육아 및 살림에

대한 질문 등 다양한 주제가 논의되는 장이다. 본 연구를 위해 카페에 가입 후 승인

조건을 거쳐 해당 게시판을 분석했다.

3) 우리는 자료 수집의 대상과 방법, 분석 과정에 대해 한국과학기술원 생명윤리심의위원회로부터 IRB 승인을 받았다.

Page 4: 온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구: … · 사회연결망(social network)은 개인이나 조직으로 이루어진 관계 구조를

온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구 115

· 대상: 카페 ‘******** 수다방’

· 분석 기간: 2007.03 ~ 2014.11 (총 93개월)

· 총 글 수 : 90,602 건

· 총 댓글 수 : 847,863개

· 총 사용자 수 11,490 명

· 평균 글 길이 300자

· 평균 댓글 길이 52자

· 수집 데이터: 사용자 식별 가능 아이디, 작성 시간, 조회수, 댓글수, 댓글을 단 사용자의 정보,

댓글 작성 시간

분석 대상의 데이터를 수집하기 위해 Open API로 수집을 시도하였으나, 비공개

형태의 커뮤니티로 로그인 인증 문제로 인해 자동 수집이 어려웠다. 우리는 이를 별

도의 로그인 쿠키 유지 조치를 통해 해결하였다. Java, Python 등에서 직접 URL 로

리퀘스트를 보내 html문서를 수집하는 일반적인 크롤러의 경우, 해당 포털에서 기계

로 인식하여 ‘ip block’ 이나 ‘캡차’등을 통해 데이터 수집을 제한하고 있다. 이를 해결

하기 위해 브라우저에서 여러 가지 스크립트를 적시에 반복적으로 실행해주는 매크로

스크립트를 작성하였다.

해당 카페는 웹 표준을 따르지 않아, 별도로 추출 데이터를 확인하고, 스크립트를

생성해야 했다. 또한 추출한 데이터를 다운로드 하기 위해 변수로 저장한 정보를 파

일 형태로 다운로드 할 수 있는 스크립트 따로 생성하였다. 또한 탐색한 페이지 수가

증가할수록, 브라우저 캐시/히스토리, 메모리에 저장한 정보가 많아져서 브라우저가

다운될 수 있다. 특히 2007년부터 8년간의 데이터를 수집하였기 때문에 과도한 용량

의 문제가 발생하였다. 우리는 이를 주기적인 메모리 플러싱으로 해결하고, 플러싱 이

후 브라우저 리셋으로 인한 리디렉션을 방지하며 중복 데이터를 제외하여 수집하였

다.

4.2 분석방법

4.2.1 텍스트 분석

우리는 html 태그, 화이트 스페이스, 브라우저 특수 문자 등을 제거한 후, 자연어

처리 기법(사람들이 일상적으로 쓰는 언어를 형태소 분석 등을 통해 컴퓨터가 처리할

수 있게 하고, 이를 다시 사람이 이해할 수 있는 언어로 가공하는 과정)을 통해 수집

된 커뮤니티 자료를 정제하였다. 형태소 분석과 품사 태깅은 자연 언어 처리의 가장

기본이 되는 과정이다. 이 기술은 입력받은 텍스트를 형태소 빈도의 집합(이하

bag-of-words BOW) 으로 변환하기 위해 이용되고 있는 일이 특히 많고 BOW에

의해 텍스트는 단순한 수치 벡터가 되어 기존의 기계학습이나 통계적 기법을 적용하기

쉬워진다. 한국어는 통사적으로 교착어에 분류되며 조사, 어미가 발달하여 어절 단위

의 품사 태깅이 상대적으로 어렵다. 또한 불규칙 활용이 발달하여 원형을 복원하는

Page 5: 온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구: … · 사회연결망(social network)은 개인이나 조직으로 이루어진 관계 구조를

116 곽진아 ‧ 이원재

작업이 반드시 필요하며, 미등록어에 대해서도 이러한 작업을 수행할 수 있어야 하는

문제가 있다.

본 연구에서는 위의 조건을 모두 만족하면서도 빠른 처리 속도와 정확도, 그리고

사용자 사전 추가의 용이성 등을 갖춘 MeCab-Ko를 사용하여 형태소 분석을 실시하

였다. 영어 기반 MeCab을 한국어 특성에 맞게 개량한 MeCab-Ko는 HMM(Hidden

Markov Model)이 아닌 CRF(Conditional Random Fields)를 채용한다. 따라서 방향성

이 없어 주변의 정보를 보며 다양한 자질을 사용할 수 있고 품사 체계나 사전 변경

등의 작업에 대해 유연하면서도 저비용으로 대응할 수 있다는 장점이 있다. MeCab-

Ko의 말뭉치 학습과 사전 목록 일부는 21세기 세종계획의 성과물을 사용하였고, 일부

부호와 단위명사를 제외하고는 21세기 세종 품사 태그와 동일한 품사태그를 사용하고

있다. 이 방법은 언어와 사전 퍼스에 의존하지 않는 품사 설계로 띄어쓰기 오류를 보

정하며 빠른 처리속도를 보인다. 특히 사용자 사전 필드를 추가할 수 있어 보건/의료

관련 용어처럼 일상적이지 않은 키워드 추출에 용이하다. 본 연구에서는 보건/의료 관

련 언급빈도가 높은 연관어를 일반명사와 고유명사를 기준으로 추출하였다. 또한 텍

스트에 미등록어가 섞여 들어가게 되면 올바른 품사 태깅을 못하거나 띄어쓰기가 잘

못되어 원래의 뜻을 잃어버리는 일이 발생한다. 따라서 우리는 보건/의료 관련 주요

단어들을 사전형태로 구축하여 형태소 분석기를 갱신함으로써 올바른 형태소 분석이

이루어질 수 있도록 하였다.

4.2.2 네트워크 분석

사회연결망(social network)은 개인이나 조직으로 이루어진 관계 구조를 가리킨다.

사회연결망의 각 구성원은 친분이나 혈연, 관심사 등 공통적인 특성에 기반하여 상호

작용하며, 이 상호작용이 연결을 구성한다. 따라서 사회연결망 분석은 개체들의 속성

자체보다는 개체들이 어떻게 연결되어 있는지 그 연결 구조의 형태와 특성을 파악하

는 데에 초점을 맞춘다(김용학, 2007). 사회 구성원으로서 인간의 행위를 더 명확하게

이해하기 위해 개별단위인 인간의 속성뿐만 아니라 인간이 사회에서 다른 구성원들과

맺고 있는 관계성을 살펴보는 것이 더 효과적이기 때문이다(홍석민, 2008). 사회연결

망 분석을 통해서 커뮤니티 내에서 구성원들이 맺고 있는 관계성과 이들 사이의 상호

작용의 형태와 구조를 살펴볼 수 있다. 사회 연결망 분석에서 네트워크를 구성하는

구성원을 노드(node), 구성원간의 관계를 연결(link)이라고 하며, 각 구성원이 특정 네

트워크에서 차지하는 위치를 중심성 수치를 통해 확인할 수 있다.

본 연구에서는 커뮤니티 내에서 구성원들이 작성한 글과 댓글을 링크로 보고 연결

망을 구성하였다. 온라인 커뮤니티에서의 관계맺음을 정의하는 요소는 명확히 규정된

바 없으며, 클릭 여부 또는 조회 여부는 데이터로 수집이 되지 않기 때문에 확실한

연결을 규정짓는 행위를 댓글을 다는 행위로 보았다. 즉 댓글을 받았다는 것은 해당

개인의 게시글을 읽고 답변을 하는 행위이기 때문에 연결망의 전제로 삼았다. 이를

통해 이용자 A가 작성한 글에 이용자 B가 댓글을 남긴 경우 A와 B 간의 관계가 있

는 것으로 간주된다. 어떤 글에 댓글을 남긴다는 것은, 해당 게시글을 관심 있게 읽고

Page 6: 온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구: … · 사회연결망(social network)은 개인이나 조직으로 이루어진 관계 구조를

온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구 117

적극적으로 반응하였음을 의미한다. 이러한 관계를 기반으로 파악된 온라인 커뮤니티

의 관계는 게시글/댓글을 매개로 한 관심과 반응의 네트워크이다. 본 연구는 93개월간

의 데이터를 수집하였지만, 네트워크 구성 시 데이터의 희소성(scarcity) 문제로 인하

여 전체 시간 창 (time window)을 따라가며 네트워크 자료를 구성하지 못하고 2009

년 9월 한 달을 사용하여 네트워크를 구성했다. 따라서 이 과정에서 발생할 수 있는

인과성과 자기상관성의 문제가 생길 수 있고, 해석상 그 점을 유의하여야 한다.

네트워크 중심성은 분석 대상이 되는 개인이 소속된 네트워크 내에서 얼마나 중심

위치를 차지하고 있는지를 나타내는 지표로, 연결망 내에서 개인의 위치에 따라 많은

행동을 설명할 수 있다. 본 연구는 프리만 (Freeman, 1979)의 내/외향 연결정도 중심성

(degree centrality)과 보나시치 (Bonacich, 1987)의 위세 중심성 (eigenvector centrality)

을 사용하였다.

연결정도 중심성 (degree centrality)은 다른 노드와 연결된 링크의 수로 해당 노드

의 중심성을 나타내는 지표이다. 이는 얼마나 많은 다른 이용자와 연계되어 있는지를

측정하여 커뮤니티 내에서 해당 이용자의 중심적 위치를 파악하는 기초적인 자료가

된다 (Scott, 2000). 많은 커뮤니티 성원으로부터 댓글을 많이 받거나, 다른 성원의 글

에 댓글을 많이 쓰는 이용자일수록 커뮤니티 소통의 중심에 있다고 볼 수 있다. 본

연구는 얼마나 많은 이용자로부터 댓글을 받았는지를 내향 중심성으로, 얼마나 많은

이용자의 글에 댓글을 작성하였는지를 외향 중심성으로 각각 구분하여 측정하였다.

내/외향 중심성 수치는 전체 연결 가능한 이용자수(N-1) 중 얼마나 많은 사용자와 연

계되어 있는지를 보여준다.

위세 중심성(eigenvector centrality)은 행위자와 연결된 이웃들의 중심성을 해당

행위자의 중심성을 판단하는 데 사용하는 개념으로, 연결된 이웃들의 중심성이 모두

같지 않다는 점에서 출발한다. 연결정도 중심성이 높은 행위자와 연결된 경우, 중심

성이 낮은 행위자와 연결된 경우보다 위세 중심성 점수가 더 높게 된다. 본 연구에서

위세 중심성은 커뮤니티 내에서 관심과 반응을 많이 주고받는 이용자와 얼마나 많이

연결되어 있는지를 나타낸다.

이와 같이 본 연구는 게시글, 댓글을 모두 작성한 이용자에 대하여 데이터 분석

프로그램 R4)을 사용하여 중심성 점수를 계산하였다.

4.2.3 회귀 모델 선정

주요 보건/의료 이슈 중 2009년 9월 한 달을 기준으로 ‘드문 사건 로지스틱 모델’

을 사용하여 분석을 실행하였다. 2009년 9월은 선정된 주요 보건/의료 키워드 전반에

대한 언급이 가장 활발하고, 신종플루 사망자가 증가하는 등 보건/의료 관련 이슈가

가장 많이 언급된 달이기도 하다. 본 연구는 주요 보건/의료 키워드에 대하여, 네트워

크 환경(커뮤니티 연결망 내 친구의 언급)으로 인해 개인의 언급이 발생하는지 여부

를 측정하기 위해 '드문 사건 로지스틱 모델 (rare events logistic regression)'을 사

4) R의 네트워크 분석 패캐지 중 igraph를 사용하였다.

Page 7: 온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구: … · 사회연결망(social network)은 개인이나 조직으로 이루어진 관계 구조를

118 곽진아 ‧ 이원재

용하였다 (King and Zeng 2001). 드물게 일어나는 사건을 일반적인 로지스틱 모델로

측정할 경우, 그 확률이 저평가 (underestimate)되는 경우가 많다. 드문 사건 로지스틱

모델은 이를 보정하기 위한 것으로, 이항 종속 변수 (binary dependent variable)에서

사건 (1)의 수가 비사건 (0)에 비해 수천 배 작을 때 적용하는 모델이다. 우리 데이터

의 경우, 키워드 데이터 별 샘플 크기에 비해, 건강 이슈에 대한 글을 작성하는 경우

가 매우 작다. 예를 들어 '백신'에 대한 포스팅 여부를 측정하는 모델에서 샘플 수는

15,485인 반면, 실제 백신에 대한 게시글을 쓴 사건은 23회 관찰됐다.

분석을 위해 연결 망 내 친구가 해당 키워드를 언급한 횟수, 개인의 활동량 (글 및

댓글 작성 수, 댓글을 받은 수)을 측정하였고, 외부 요인을 파악하기 위해 언론 보도

수 및 키워드 검색수를 측정했다. 연결망 내 개인의 지위를 파악하기 위해 개인의 중

심성 지수를 변수에 추가하였다. 또한 30일에 대한 고정 효과 (time fixed effects)를

통제하였다. 이럴 경우 특정 시간 단위 (day)에 발생하는 관찰되지 않은 상이성들

(unobserved heterogeneity)이 통제되는 효과가 있다. 예를 들어 해당 이슈에 대한 온

라인 키워드 검색수, 기사 보도수는 물론 날씨와 다른 이슈들의 등장과 퇴장 같은 것

들이 통제된다. 이에 따라 본 연구는 아래와 같은 회귀식을 결정하였다 (King and

Zeng 2001, p145)

Pr

시간 t에 해당 온라인 카페 회원 개인의 키워드 언급 여부를 종속변수 y로 설정하

고, 시간 t-1에 연결망 내 다른 사용자가 해당 키워드를 언급하였는지 여부를 독립변

수 x 로 설정했다. 또한 해당 카페 회원 개인의 글, 댓글 작성수와 댓글 받은 수와 같

은 활동량과 개인의 중심성 지수, 언론 보도 및 온라인 키워드 검색수를 통제하였다.

5. 연구결과

5.1 보건/의료 관련 텍스트 분석 및 이슈 선정

5.1.1 형태소 분석 결과

형태소 분석 기법을 통해 해당 커뮤니티에서 보건/의료 관련 메시지를 얼마나 언

급하는지 분석을 시도했다. 이를 위해 분석 대상 게시판에 등장한 보건/의료 관련 용

어를 추출하고, 이를 전문가의 도움을 받아 (서울대학교 보건대학원 및 의과대학 연구

팀) 범주화하였다.

Page 8: 온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구: … · 사회연결망(social network)은 개인이나 조직으로 이루어진 관계 구조를

온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구 119

단어 빈도 단어 빈도 단어 빈도 단어 빈도 단어 빈도

1 병원 20053 31 진통 1085 61 시술 481 91 병원비 261 121 구내염 1252 약 9059 32 간호사 1027 62 초음파 469 92 천식 260 122 결막염 1243 건강 5781 33 비염 961 63 비만 431 93 감기약 255 123 가루약 1224 예약 5685 34 산부인과 953 64 외과 426 94 혈관 242 124 해열 1215 수술 5564 35 내과 953 65 내시경 422 95 구균 226 125 물리치료 1206 스트레스 5086 36 튼튼 918 66 자궁 418 96 진료비 221 126 조제 1167 치료 4818 37 환자 911 67 부인과 415 97 생리통 215 127 재채기 1158 소아과 4527 38 해열제 901 68 시력 412 98 호흡 205 128 유방암 1129 의사 3972 39 안과 890 69 알레르기 400 99 질병 205 129 약값 11110 검사 3960 40 마취 879 70 성형외과 395 100 기관지염 202 130 간병인 11111 열 3813 41 의원 870 71 약사 381 101 축농증 200 131 코감기 11012 진료 3209 42 의료 833 72 제왕절개 378 102 유선염 199 132 전염 10913 피부 3022 43 독감 792 73 엑스레이 371 103 링거 197 133 약물 10614 치과 2660 44 이비인후과 761 74 흉터 368 104 스테로이드 179 134 약발 10315 입원 2652 45 장염 739 75 배변 359 105 목감기 179 135 다래끼 10016 병 2605 46 우울증 736 76 잇몸 355 106 편두통 177 136 약품 9417 처방 2366 47 중이염 714 77 마스크 351 107 혈액 173 137 복강경 9418 검진 1766 48 통증 702 78 화상 350 108 수막염 172 138 구급차 9019 아토피 1733 49 체질 655 79 보약 349 109 의학 169 139 발암 8920 약국 1713 50 폐렴 645 80 응급 332 110 후두염 169 140 양약 8821 기침 1710 51 영양제 621 81 이빨 328 111 면역 168 141 약병 8622 한의원 1676 52 정형외과 611 82 피검사 315 112 처방전 166 142 치료비 8323 주사 1562 53 면역력 600 83 갑상선 308 113 습진 163 143 주사기 8224 항생제 1524 54 치아 598 84 혈압 290 114 신경과 161 144 뇌염 8125 피부과 1369 55 보건소 583 85 디스크 287 115 당뇨 159 145 건조증 8126 응급실 1368 56 폐 577 86 빈혈 287 116 비뇨기과 150 146 전염병 8027 예방 1322 57 고열 539 87 두드러기 287 117 요양 142 147 티눈 8028 콧물 1231 58 염증 534 88 전문의 284 118 환절기 128 148 경련 8029 산후 1197 59 두통 513 89 호흡기 273 119 간염 127 149 대소변 7830 한약 1121 60 변비 503 90 기관지 261 120 불면증 125 150 신경외과 77

<표 5.1> 분석 대상에서 언급된 보건/의료 관련 명사 상위 150건

진단 증상 진료과 과정과 절차 약 장소 비용 신체부위

등장 단어 예시

아토피비염장염

중이염화상

후두염습진

스트레스기침콧물

재채기건조증혈당

피부과산부인과

내과안과

이비인후과

정형외과

치료검사진료입원검진마취

내시경

수술항생제한약

해열제영양제보약

감기약링거

병원의사약국

한의원응급실간호가전문의

병원비진료비약값

수술비

피부치아자궁폐

잇몸이빨

갑상선

<표 5.2> 분석 대상에서 언급된 보건/의료 관련 명사 범주 구분 예시

분석 대상 커뮤니티가 위치한 대전지역의 의료기관을 추출하여, 해당 커뮤니티에

서의 의료기관 관련 언급 정도를 확인하였다. 확인을 위해 키워드를 진료 과목으로

Page 9: 온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구: … · 사회연결망(social network)은 개인이나 조직으로 이루어진 관계 구조를

120 곽진아 ‧ 이원재

선정, ‘피부과, 정형외과, 산부인과, 성형외과, 내과, 가정의학과, 비뇨기과, 이비인후

과, 재활의학과, 외과, 신경정신과, 안과, 정신건강의학과, 소아과, 마취과, 신경외과, 정신

과, 치과, 한의원, 여성병원’이 포함된 22,531건의 텍스트를 추출했다. 분석 결과, 해당

온라인 커뮤니티의 활발한 의료/보건 관련 언급을 확인하였다.

병원 횟수 위치 병원 횟수 위치 병원 횟수 위치1 선병원 966 유성구 35 서울이비인후과 28 유성구 69 엠블소아과 12 서구2 예소아과 270 유성구 36 권오균소아과 27 유성구 70 한병주 치과 12 서구3 조이소아과 118 서구 37 우리내과 27 유성구 71 박붕연내과 11 유성구4 을지병원 117 서구 38 튼튼소아과 27 서구 72 m피부과 11 서구5 **산부인과 116 유성구 39 새손병원 26 중구 73 보다안과 11 서구6 미즈여성병원 113 서구 40 예쁜아이 소아과 25 서구 74 연세내과 11 서구7 ** 연합 치과 99 유성구 41 콩세알치과 24 유성구 75 해바라기 한의원 10 유성구8 연합내과 99 유성구 42 둔산한방병원 24 서구 76 드림이비인후과 9 유성구9 이호성소아과 90 유성구 43 성모피부과 23 중구 77 밝은눈세상안과 9 유성구10 함소아한의원 77 서구 44 케임씨잉 안과 23 유성구 78 스마트이비인후과 9 유성구11 성모병원 74 중구 45 자생한방병원 22 서구 79 명한의원 9 서구12 반석내과 70 유성구 46 화모아 한의원 20 유성구 80 엠제이 피부과 9 서구13 서울여성병원 69 서구 47 반석이비인후과 19 유성구 81 이노치과 9 서구14 윤가정의학과 69 유성구 48 에이스마일 치과 18 유성구 82 성모재활의학과 8 유성구15 김은주 소아과 65 유성구 49 베스티안 18 동구 83 제중당 한의원 8 유성구16 미래여성병원 62 서구 50 닥터스 한의원 18 - 84 삼성신경외과 8 서구17 새로운부부치과 60 유성구 51 속편한내과 17 서구 85 **삼성신경과 7 유성구18 미소소아과 58 유성구 52 씨앤유피부과 17 서구 86 달라스 연합치과 7 유성구19 성세병원 57 유성구 53 우리안과 17 서구 87 맥한의원 7 유성구20 명안과 48 서구 54 이국희 산부인과 16 유성구 88 한규설한의원 7 유성구21 ** 정형외과 44 유성구 55 고운손병원 16 서구 89 곽치과 6 유성구22 민소아과 43 유성구 56 이동복소아과 15 중구 90 바른이비인후과 6 유성구23 오라클 피부과 42 서구 57 눈부신성형외과 15 유성구 91 송미령한의원 6 유성구24 닥터윤 40 유성구 58 임플란트치과 15 유성구 92 아름다운한의원 6 유성구25 박혜덕외과 38 서구 59 참사랑 정형외과 14 유성구 93 아이비치과 6 유성구26 선치과 37 중구 60 배사랑내과 14 서구 94 헤아림한의원 6 유성구27 우리들소아과 37 유성구 61 럭스피부과 13 유성구 95 호랭이한의원 6 유성구28 코코로 한의원 34 서구 62 최광순 한의원 13 유성구 96 디에르치과 6 서구29 퀸소아과 33 유성구 63 아이린 한의원 13 - 97 모태조리원 6 서구30 세이유외과 32 서구 64 도안누리소아과 12 유성구 98 리더스 치과 5 유성구31 맑은눈안과 31 서구 65 그린한의원 12 서구 99 화경한의원 5 유성구32 플랜트 치과 31 유성구 66 더웰피부과 12 서구 100 경희다솜한의원 5 서구33 이화미래내과 30 유성구 67 벨라쥬 산부인과 12 서구 101 모태소아과 5 서구34 **안과 28 유성구 68 송도외과 12 서구 102 아이누리 한의원 5 서구

<표 5.3> 분석 대상에서 언급된 의료기관 상위 102건

5.1.2 보건/의료 관련 이슈 선정

질병이나 보건 관련 사업에 대한 사람들의 인식 여부를 파악하기 위하여, 분석 대

상기간 동안 해당 키워드에 대한 언론 보도 수 및 온라인 키워드 검색 수를 파악하고

Page 10: 온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구: … · 사회연결망(social network)은 개인이나 조직으로 이루어진 관계 구조를

온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구 121

동일 기간 해당 온라인 커뮤니티 내의 키워드 언급 횟수를 비교하였다. 주요 이슈의

경우 서울대학교 보건대학원 및 의과대학 연구팀이 선정한 ‘모유수유, 플루, 백신, 감

기, 항생제’를 대상으로 하였다.

온라인 커뮤니티 내에서의 언급과 언론 보도 및 외부 언급을 비교5)한 결과, ‘백신,

신종플루, 타미플루’의 경우 언론 보도 및 온라인 키워드 검색수와 비슷한 패턴을 보

였으며, ‘모유수유, 항생제, 감기’ 의 경우 언론 보도 및 온라인 키워드 검색수와 같은

외부 패턴과 전혀 다른 언급빈도를 나타냈다.

<그림 5.1> 주요 이슈의 언론 보도 현황

<그림 5.2> 주요 이슈의 커뮤니티 언급 현황

5) 언론 보도 수는 (해당 키워드 언급 기사수/전체 기사 수)*100, 커뮤니티 언급수는 (해당 키워드 언급 횟수/해당 월 문서수)*100, 키워드 검색 수의 경우는 자체 제공 데이터를 활용했다.

Page 11: 온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구: … · 사회연결망(social network)은 개인이나 조직으로 이루어진 관계 구조를

122 곽진아 ‧ 이원재

<그림 5.3> 주요 이슈의 검색 수 현황

해당 키워드에 대해 커뮤니티 내에서 언급된 문장의 예는 다음과 같다.

키워드 빈도 내용 예

모유수유 2234•비싸다고 생각했지만 이거 사용해서 [[모유수유]] 성공하면..•전 20갤 딸 [[모유수유]]중예요 단유 어찌할까요..

신종플루 440•첫애때 [[신종플루]]걸린줄알았어요..제경험상병원서 약먹으믄 결국재발하구요•7세 3세 작년에 독감 [[신종플루]] 하나도 안맞췄어요 [[신종플루]]는 부작용

말도 많았잖아.

타미플루 168•독감확정 [[타미플루]]처방 받았어요•저도 3일꼬박앓고 [[타미플루]]오늘이 5일째였어요 그런데 애들둘다 옮았지요 •저희 아이 응급실에서 오진해서 [[타미플루]] 먹일 시기 놓치더니 결국은...

백신 349

•자궁 경부암 [[백신]] 맞으시려면 가다실로 맞으시길 바래요 유성에 12만원에 맞을수 있는..

•접종비에 [[백신]]비에다가 주사 놓아주는 비, 관리비가 포함되어있죠. •폐구균[[백신]] 신플로릭스 , 프리베나13 어떤거 맞추세요?

감기 7146•[[감기]]가... 징글징글하네요~"" 저도 감긴데...•[[감기]] 진짜 독해요~~~! 3주정도 된듯요~~~~ 지겨워!!!

항생제 1452

•제가 다니는 이비인후과는 괜찮더라구요. 중이염 걸려도 [[항생제]] 잘 안쓰고 정말 심할때만..

•이비인후과가 약을세게 쓰는거같아요 [[항생제]]처방이 많은듯해서 꺼려지네요•한의원가보세요. 한의원에서도 중의염 치료하던데요 우선 [[항생제]]를

안먹이니깐 괜찮은듯

<표 5.4> 커뮤니티 내 주요 키워드 언급 예

해당 온라인 커뮤니티 사용자들은 해당 주요 키워드에 대해서 자신의 의견을 주장

하거나, 궁금한 점에 대해 질의응답을 하고, 본인 및 가족의 질병 경험에 대하여 공유

하고 있었다. 특히 개인의 의료기관 방문 경험 및 처방 관련 의견에 대해 활발히 토

론하며, 의료기관을 추천하거나 대처 방법을 권유하는 등 체험 위주의 의견을 공유하

고 있는 것을 확인할 수 있었다.

Page 12: 온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구: … · 사회연결망(social network)은 개인이나 조직으로 이루어진 관계 구조를

온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구 123

5.2 보건/의료 관련 이슈에 대한 타인의 영향력

보건/의료 관련 이슈 언급에 미치는 연결망 내부 및 외부 요인의 영향력을 분석한

결과는 다음과 같이 나타났다.

백신  독감  감기  항생제  모유 수유

종속변수내가 ‘백신’을 언급 (t+1)

내가 ‘독감’을 언급 (t+1)

내가 ‘감기’를 언급 (t+1)

내가 ‘항생제’를 언급 (t+1)

내가 ‘모유수유’를 언급 (t+1)

자신의 글 조회수 0.625*** 0.012 0.151 1.562 0.121 0.091 0.105(t까지) (0.160) (0.101) (0.083) (1.036) (0.674) (0.708) (0.685)자기가 쓴 글 수 1.682* 1.690** 2.179*** 2.432* 0.598 0.581 0.600(t까지) (0.804) (0.562) (0.563) (1.070) (0.845) (0.881) (0.845)자기가 쓴 댓글 수 0.249*** 0.279*** 0.132* 0.202*** 0.199 0.209 0.202(t까지) (0.057) (0.067) (0.066) (0.055) (0.177) (0.181) (0.178)자기글에 달린 댓글 수 -0.011 -0.081 -0.061 0.082 0.028 0.015 0.027(t까지) (0.108) (0.091) (0.091) (0.095) (0.315) (0.325) (0.316)위세 중심성 1.145**(시간 불변) (0.365)관계수 중심성 0.029*(시간 불변) (0.011)상수 1.88E07*** 249E07*** 1.73E06*** 2.61E07*** 4.43E06*** 4.2E06*** 4.39E06***

(0.562) (1.070) (1.764) (0.799) (1.344) (1.297) (1.315)

Observations 16,031 15,485 15,713 16,445 16,358 16,358 16,358괄호안은 로버스트 표준오차;; *** p<0.001, ** p<0.01, * p<0.05시간 고정 효과 결과는 생략하였음

<표 5.5> 건강 이슈에 대한 게시판 글 올릴 확률 (t+1)을 예측하는 드문 사건 로지스틱 모델

시간고정효과를 통제한 상태에서 해당 이슈의 온라인 키워드 검색수 (이하 네이버

검색수)와 언론 보도수를 함께 모델에 포함시켜보았다. 커뮤니티 외부 효과로 볼 수

있는 네이버 검색수와 언론 보도수는 예상한대로 유의미하지 않았다.

백신, 독감, 감기, 항생제, 모유수유 각 이슈별로 드문 사건 로지스틱 모델을 따로

검증하였다. 예를 들어 첫 번째 모델의 경우 종속변수는 다음 날 (t+1) 에서 ‘백신’ 언

급 유무이다 (1 또는 0). 독립변수 ‘백신’의 경우 내가 백신에 대해 쓴 글의 조회수가

1 단위 늘어날 때마다 내가 t+1 에서 백신을 언급할 확률(odds)은 86.8% (exp(0.625)

=1.868) 증가한다. 마찬가지로 내가 백신에 대해 쓴 글의 수가 1개 증가할수록 내가

t+1에서 백신을 언급할 확률은 437% (exp(1.682=5.376) 증가하고, 내가 백신에 대해

쓴 댓글의 수가 1개 증가할수록 내가 t+1에서 백신을 언급할 확률은 28% (exp(0.249)

=1.282) 로 증가한다.

즉 30일 동안의 시간창 (time window) 안에서, 해당 이슈에 대한 자기 글이 얼마

나 조회되었는가가 다음 날 (t+1) 같은 이슈에 대한 게시글을 쓸 확률은 '백신'에서만

Page 13: 온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구: … · 사회연결망(social network)은 개인이나 조직으로 이루어진 관계 구조를

124 곽진아 ‧ 이원재

유의미하게 나타났다. 반면 백신, 독감(flue), 감기(cold), 항생제(antibiotic)에서는 공통

적으로, 이슈에 상관없이 내가 쓴 게시글 수, 내가 쓴 댓글 수가 유의미한 효과를 나

타냈다. 해당 주제에 대한 내가 쓴 게시글 수와 댓글 수는 결국 그 주제에 대한 개인

의 독립적 관심이 이후 행동에 주는 영향력을 나타낸다. 이는 온라인상에서 청중의

관심과 상관없이 일어나는 개인주의적 현상이며, 정보 전달자로서의 자기 역할에 충

실한 개인의 상을 보여준다.

이런 면에서 모유수유는 매우 특이한 양태를 보인다. 모유수유를 주제로 한 게시

판 활동을 분석해보면 위와 같은 개인 수준의 요인들이 무의미하게 나온 반면, 네트

워크 효과만 유의미하게 나타난다. 위세중심성이 1 단위 증가할 때 내가 t+1 에서 모

유수유를 언급할 확률은 214% (exp(1.145) = 3.142) 증가하고, 관계중심성이 1 단위

증가할수록 내가 t+1 에서 모유수유에 대해 언급할 확률이 3% (exp(0.029)=1.029) 증

가한다. [표 6]의 모유수유 분석 결과 각각의 열은 네트워크를 포함하지 않고 다른 모

델들과 비교한 경우와, 네트워크를 포함한 경우를 의미한다.

자료의 제약으로 인해 충분히 분석가능한 시계열 연결망들을 구성할 수 없어서 전

체 시간 범위를 포괄한 연결망을 사용하였으므로 1) 시계열 분석을 통한 인과성 추론

의 기준을 충족하지 못하고, 2) 시계열적 자기상관 (autoregressive)의 문제를 가지고

있다는 한계를 전제하고 다음과 같은 해석이 가능하다. 위세(status) 중심성은 댓글

연결망을 통해 측정하여, 나에게 댓글을 달아준 친구들의 위세가 높을수록 내 위세가

높아지는 메커니즘을 반영한다 (Bonacich 1987). 관계수 중심성은 내가 쓴 댓글과 내

가 받은 댓글의 수를 합친 것이다. 두 변수 모두 유의미한 양의 계수를 가지는데, 특

히 후자는 통제변수들과의 자기상관성에도 불구하고 여전히 유의성을 잃지 않는 것이

흥미롭다.

모유수유는 다른 건강 이슈와 달리 개인의 사적 경험과 결부된 지식이라고 할 수

있다. 앞의 네 가지 건강 이슈가 주로 대외적으로 뚜렷이 발화되는 공적 지식에 가깝

다면, 모유수유는 개인의 경험 안에서 만들어지며 암묵적이거나 개인적인 언어로 유

통되는 지식에 가깝다. 일찍이 이 두 가지 지식의 유통이 각기 다른 연결망 구조와

친화성을 가진다는 연구는 매우 잘 받아들여져 왔으나 (Uzzi and Lancaster 2003), 경

험 맥락과 접근 방법에 따라 증거가 경험적 신뢰성이 떨어진다는 비판에도 종종 직면

해왔다 (Marouf 2007). 이 같은 맥락 속에서 우리의 분석 결과는 사적 지식과 연결망

사이의 관계를 지지하는 또 다른 증거를 제시하고 있다. 사적이지만 언어로 명기된

지식(private codified knowledge)인 모유수유에 관한 게시판 포스팅은 연결망 내에서

의 친밀성 (관계수 중심성)과 위세와 유의미하게 상호 연관되어 있다.

6. 결론 및 논의

모유수유에 대한 의견 표현이 개인의 사회적 위세나 사회성이 클수록 더 활발히

개진된다는 점은 '모유 수유'가 가지고 있는 지극히 사적인 측면과 이것이 공적으로

논의되는 것 사이의 모순적 접합의 현상을 환기시킨다. 특히 모유수유의 경우, 다른

Page 14: 온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구: … · 사회연결망(social network)은 개인이나 조직으로 이루어진 관계 구조를

온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구 125

키워드와는 달리 시간(환절기, 겨울 등)이나 사회적 이슈(신종 플루, 항생제의 부작용)

의 영향을 받지 않는 지극히 개인적인 주제로써, 해당 기간에 다른 사람의 언급으로

인해 관심이 유발되어 모유수유에 대해 언급하는 것이 아니라, 커뮤니티 내의 사휘적

위세가 높은 경우 당당하게 자신의 경험담을 공유하고 의견을 나누는 것으로 볼 수

있다. 이는 일반적인 질병이나 약에 대한 지식과, 모유수유의 문제를 사람들이 다른

방식으로 이해하고 있다는 점을 뜻한다.

김혜숙 (1995) 은 어머니의 욕구, 신념과 태도를 모유수유를 성공적으로 실천하는

데 영향을 주는 주요 요인으로 분석했다. 또한 성공적인 모유수유를 위해 산후 2주일

동안이 가장 중요한 시기로써, 이 시기의 사소한 좌절이나 실수가 모유수유 정착에

장애가 되는데, 모유수유의 어려움에 부딪혔을 때 효율적으로 도와줄 수 있는 전문가

가 없어 모유수유를 쉽게 포기하게 된다고 지적한다. 박옥희 (1992) 는 모유수유 상황

의 경험에 따라 성공이 좌우되기 때문에, 첫 수유에서 전문인의 개별적 지지와 도움

의 중요성을 강조하였다. 백경선 외 (2010) 역시 성공적인 모유수유를 위해서는 그 주

체인 어머니의 육체적, 심리사회적 및 환경적인 영향이 중요하다고 강조한다. 또한 모

유수유모가 모유수유의 주관적인 경험들을 민감하게 인지한다고 지적하고 있다.

모유수유에 대해 언급한 텍스트와 독감과 백신에 대해 언급한 텍스트에서 사용된

어휘를 비교하고자 최빈출 연관어 분석방법인 TFIDF6)를 실시한 결과, 모유수유는

‘분유, 모유, 시기, 때, 마사지’ 등의 명사와 ‘끊다, 힘들다, 빠지다, 울다, 빼다, 괜찮다’

와 같이 모유수유 경험과 방법에 대한 내용이 상위 언급 단어로 사용되었으며, 독감

의 경우 ‘접종, 인플루엔자, 감기, 백신, 확진, 바이러스’ 등의 질병 관련 명사와 ‘취소

하다’ 의 동사가 상위 언급 단어로 사용되었다.

선행연구 및 최빈출 연관어 분석 결과로 볼 때 개인의 활동성이 영향을 미치는 일

반적인 건강 관련 이슈 (백신, 독감, 감기, 항생제) 와 모유수유 이슈는 구별된다. 또

한 일반인에게 모유수유 이슈는 커뮤니티 내에서 개인의 사회적 위세가 높을수록 개

인의 모유수유 경험에 대해 조언 및 논의를 하는 등 일반적인 보건/건강 이슈와 다르

게 인식하는 것을 보여준다.

비록 본 연구는 자료의 제약 (scarcity)으로 인해 충분히 분석가능한 시계열 연결

망들을 구성할 수 없어 한 달의 데이터만을 사용하였으므로, 시계열 분석을 통한 인

과성 추론의 기준을 충족하지 못하고, 시계열적 자기상관 (autoregressive)의 문제를

가지고 있다는 한계가 있다. 하지만 온라인 커뮤니티에서 나타나는 지식의 공유를 분

석하고자 사적 지식에 해당하는 모유수유와, 기타 공적 이슈의 연결망 효과가 어떻게

다르게 나타나는지를 보고자 하였고, 그 의미를 밝혀냈다는 데 의의가 있다.

6) 문서에서 핵심 단어를 추출하는 방법인 TFIDF(Term Frequency-inverse Document Frequency) 를 활용하여 연관어를 비교 분석 하였다. TFIDF는 특정 단어가 한 개의 문서 내에 나타난 빈도를 전체 문서수 중에서 특정 단어를 포함하는 문서의 빈도로 나누어 준 것을 말한다. 즉 특정 문서에는 많이 등장하나, 일반적인 문서에서는 적게 등장하는 키워드일수록 TFIDF값이 커지기 때문에, 두 개 이상의 문서에서 핵심이 되는 키워드를 추출하는 데 유용하다. TFIDF는 특히 하나의 문서에 두 개의 단어가 같은 빈도수로 출현했다고 하더라도, TFIDF 값이 클수록 해당 단어에 대한 전문성 (여러 문서에 흔하게 등장하는 것이 아니라, 소수의 문서에만 등장하는지) 여부를 분석할 수 있는 방법이다.

Page 15: 온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구: … · 사회연결망(social network)은 개인이나 조직으로 이루어진 관계 구조를

126 곽진아 ‧ 이원재

참고문헌

권선영, 주서현 (2013). 네트워크 분석을 통한 온라인 임신 Q&A 게시판의 내용적 특

성에 관한 연구. 제 20 회 한국정보관리학회 학술대회 논문집, 31-36.

김수정 (2012). 소셜 미디어 환경에서 대학생들의 건강정보 요구와 추구행태에 관한

탐험적 연구. 한국비블리아학회지, 23(4), 239-260.

김용학 (2007). 사회연결망이론: 개정판. 博英社.

김혜숙 (1995). 모유수유 전화상담 내용의 분석. 대한간호학회 17-29.

노수진, 윤영민 (2013). 우울증에 관한 언론 보도 분석. 한국언론정보학보, 5-27.

박옥희 (1992). 임신중 유방간호가 산모의 모유수유 실천에 미치는 영향, 한국간호과

학회

배순한, 서재교, & 백승의 (2010). 온라인 커뮤니티의 중심성 변화에 대한 탐색적 연

구: 사회연결망 분석을 이용하여. 지식경영연구, 11(2), 17-35.

백경선, 이수연 (2010). 모유수유모의 수유경험에 대한 연구. 질적연구, 11(2), 69-79.

송태민 (2014). 소셜빅데이터를활용한보건복지정책동향분석. 보건복지포럼, (213),

101-113.

이세진, 이정교 (2012). 온라인 여성 커뮤니티에서의 이용자 간 상호작용과 사회연결

망에 관한 연구. 사회과학연구, 38(2), 47-71.

이진용 외 (2009). 온라인 커뮤니티 활동과 사적 관계구축이 구전 및 구매행동에 미치

는 영향에 관한 연구 한국유통학회

이헌아, 류석진 (2013). 온라인 커뮤니티의 사회적 자본과 제도. 정보와사회, (27),

25-55.

이현숙 (2013). 내· 외부고객의 병원선택요인이 병원이미지에 미치는 영향. 보건행정학

회지, 23(3), 281-288.

전영아, 강정한 (2010). 사이버 커뮤니티에서 유형별 사회자본이 정치적 의견표명과

호응에 미치는 효과. 사이버커뮤니케이션 학보, 27(3), 177-226.

주영기, 유명순 (2011). 한국 언론의 신종플루 보도 연구. 한국언론학보, 55(5), 30-54.

최순화, 이상민, 박기우 (2000). 사이버 커뮤니티의 가치평가. 디지털 심포지엄, 삼성경

제연구소.

홍석민 (2008). 사회연결망을 통한 광고홍보학 연구자의 공식적 네트워크와 비공식적

네트워크의 비교분석 연구. 2008 봄철정기학술대회 소통과 융합, 그리고 축

제, 221-221.

Bonacich, P. (2007). Some unique properties of eigenvector centrality. Social Networks,

29(4), 555-564.

Freeman, L. C. (1979). Centrality in social networks conceptual clarification. Social

networks, 1(3), 215-239.

King, G., & Zeng, L. (2001). Logistic regression in rare events data. Political

analysis, 9(2), 137-163.

Naif Marouf, L. (2007). Social networks and knowledge sharing in organizations: a

Page 16: 온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구: … · 사회연결망(social network)은 개인이나 조직으로 이루어진 관계 구조를

온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구 127

case study. Journal of Knowledge Management, 11(6), 110-125.

Scott, J. (2012). Social network analysis. Sage.

Uzzi, B., & Lancaster, R. (2003). The role of relationships in interfirm knowledge

transfer and learning: The case of corporate debt markets. Management

Science, 49(4), 383-399.

Page 17: 온라인 커뮤니티에서 나타난 건강정보 전파 분석에 관한 연구: … · 사회연결망(social network)은 개인이나 조직으로 이루어진 관계 구조를

128 곽진아 ‧ 이원재

The research about diffusion of health issues on online

community: focused on the effect of social network on

public and private issues

Jin-Ah Kwak1) · Won-Jae Lee2)

Abstract

This paper find out factors which affect to public opinion about health issues on online

community in Korea. Also looking at the different diffusion patterns on public and privates

issues. We select the most famous and lots of discussion community about health issues,

then collect 93 months of data to construct post-reply network. Through the natural language

processing, we analyze the message of post and categorize health issues. By social network

analysis, we calculate the structural position of each individual. Also, using rare events logistic

regression, we measure the influence of peer effect about health issues. The results show

that there is a peer effect about the individual talk about health issues. Especially, when the

individual who is higher structural position talks a lot on private issue like breast-feeding,

whereas the public issue such as vaccine, flu an antibiotics doesn't.

Key words : online community, social network, health

1) Graduate Student, Dept. of Culture Technology, KAIST, 291 Daehak-ro, Yuseong-gu ,Daejeon 34141, Korea. E-mail: [email protected]

2) (Corresponding author) Professor, Dept. of Culture Technology, KAIST, 291 Daehak-ro, Yuseong-gu ,Daejeon 34141, Korea. E-mail: [email protected]