37
2015.04 조완섭 충북대학교 경영정보학과 대학원 비즈니스데이터융합학과 [email protected] 043-261-3636, 3258 제 10장 빅데이터 거버넌스 충북대학교

빅데이터거버넌스 - contents.kocw.netcontents.kocw.net/KOCW/document/2015/chungbuk/chowanseop/11.pdf · 조완섭([email protected]) 목차 배경 –IT 거버넌스와데이터거버넌스

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

2015.04

조완섭충북대학교 경영정보학과

대학원 비즈니스데이터융합학과

[email protected]

043-261-3636, 3258

제 10장

빅데이터 거버넌스

충북대학교

조완섭([email protected])

목차

배경

– IT 거버넌스와 데이터 거버넌스

빅데이터 거버넌스

– 필요성과 사례

빅데이터 거버넌스 프레임웍

– 빅데이터 유형

– 빅데이터 거버넌스 요소

결론

2015-07-23 2

조완섭([email protected])

IT 거버넌스

IT 거버넌스 정의– IT 활용에서 바람직한 행동을 지원하기 위하여 의사결정 및 책임소재

를 기술한 Framework(가트너)

– IT가 조직의 전략과 목표에 부합되게 운영되도록 하는 IT 관리체계

2015-07-23 3

전산실

IT거버넌스의 중점영역

비즈니스

조완섭([email protected])

IT 거버넌스 - 배경

2015-07-23

4

밀폐된 전산실일부 업무만 지원 (연산 위주)전문가가 관리 통제

오픈된 (네트워크로 연결된) 데이터 센터조직의 주요/수많은 업무가 IT에 의존수많은 사람이 인터넷, 모바일로 직접 접속ITG가 중요해짐 !전산실을 넘어 CEO (전사적) 문제 !

• 전산실 역할변화와 IT 거버넌스의 중요성

70 ~ 80년대90년대, 2000년대, 2010년대

ERP, CRM, SCM, BIe-Business, MobileRFID, Cloud, IoTBig Data, SNS….

ITG 중요 !

빅데이터

조완섭([email protected])

정수장, 파이프(HW), 규정과 매뉴얼(SW)

(빅)데이터 거버넌스

2015-07-23 5

기존데이터작고, 정형적이고, 느린 특성

정보 시스템 (HW, SW, 정보화 규정) : ITG

빅데이터크고, 비정형적이고,

빠른 특성 (3Vs)

빅데이터 거버넌스데이터 품질관리, 프라이버시, 수명관리, 메타데이터, 조직과 규정 등

HW/SW 만 잘 관리하면 (ITG)(빅)데이터는 자동으로 관리되는가 ?

조완섭([email protected])

(빅)데이터 거버넌스

(빅)데이터 거버넌스의 정의와 필요성– 전사차원에서 보유하고 있는 데이터에 대한 관리체계

– 데이터에 대한 품질과 표준, 프라이버시, 메타 데이터, 수명관리 등의관리체계를 수립하고, 관련 조직과 규정을 정립하며, 이를 자동화하는(시스템 구축) 데이터 관점에서의 IT 관리 체계

– 빅데이터의 세가지 특징(3Vs)으로 데이터 거버넌스가 더욱 중요해짐

– IT 관리체계가 데이터 관리체계를 보장하지 못함; 데이터 관리체계가완비되지 못하면 IT가 복잡, 위험해짐 (자동화+사람+규정)

(빅)데이터 거버넌스의 목적– 고품질 데이터를 확보하여 안전하고 효과적인 관리를 통해 데이터가

필요한 사람에게 적시에 공급되고, 기업의 다양한 가치 창출에 기여하는 것 (인체의 혈액)

2015-07-23 6

조완섭([email protected])

(빅)데이터 거버넌스

2015-07-23 7

Quality Privacy Lifecycle

Organization Rules

MDM Standard

Big Data

조완섭([email protected])

빅데이터 거버넌스 – 필요성과 사례

시설관리용 스마트 미터기 <– 데이터 수명관리와 암호화

2015-07-23 8

데이터분석

통합정제

엄청난데이터 생성

IT 비용 증대

사회혼란 야기프라이버시 침해

전기, 수도, 가스 smart meter

검침비용절감자원활용최적화

M2M 데이터 소스

조완섭([email protected])

마케팅 부서

빅데이터 거버넌스 – 필요성과 사례

통신업체 개인위치 정보활용 <– 데이터 암호화

2015-07-23 9

네트워크 관리팀

빅데이터 거버넌스 위원회에서 조정 !새로운 서비스로 인한 이득이평판 및 규제 리스크를 능가하는지점검한 후 결정함(안전성강화, 개인/개별부서부담 완화)

개인위치정보

개인정보보호 부서 (규제리스크)

유선 비즈니스 부서 (평판리스크)

부서간 갈등 (청주시, 경기도)

조완섭([email protected])

빅데이터 거버넌스 – 필요성과 사례

금융기관 개인정보 유출 <- 암호화, 수명관리(과거고객정보)

2015-07-23 10

빅데이터 활용으로산업경쟁력을높이면서도프라이버시를 보장하는기술/산업 육성

조완섭([email protected])

빅데이터 거버넌스 – 필요성과 사례

의료분야 <– 법적문제 발생 : 데이터 품질, 데이터 수명관리, 프라이버시

2015-07-23 11

첨단 의료기기에서 생성하는대용량 타임시리즈 데이터 분석으로증세가 나타나기 24시간 전에 예측 가능

비즈니스혁신, 그러나

데이터 통합과분석

M2M 데이터

데이터 품질문제

데이터 수명관리

프라이버시 문제

그러나 환자가 움직이면 읽을 수 없는 불안한 정보선형 혹은 회귀 분석기법으로 데이터를 보정

조완섭([email protected])

정확도가 낮음 !!

빅데이터 거버넌스 – 필요성과 사례

의료분야 <- 빅데이터 활용 데이터 품질 제고

2015-07-23 12

문제환자 집중관리재입원 비율 낮춤

퇴원환자 재입원 예측 모델(20,000명의 환자,150개의 변수)

초기자료 : 흡연(25%, y/n), 약물에 관한 단순기록

환자데이터

정확도향상 (85%)

정제 보완된 자료 : 환자의 상세한 흡연정보( 흡연기간, 빈도, 약물, 기타 관련정보 )

의사 소견서환자퇴원정보건강검진정보간호원 Note SNS등

조완섭([email protected])

빅데이터 거버넌스 – 필요성과 사례

인사분야 <– 프라이버시 문제

2015-07-23 13

채용 지원자의나이, 결혼유무, 종교, 피부색, 사진, 성적 지향성, 친구 등개인정보로 넘치고 있음

미국 : 많은 주에서 채용시 SNS 활용 금지법 제정, 통과독일 : 채용에서 Facebook 활용 금지

기업의 인사부서에는 이러한 규제를감안한 채용 규정 정립

SNS 데이터

조완섭([email protected])

빅데이터 거버넌스 – 필요성과 사례

14

- 이기종 열차의 경우센서 데이터 표준화 필요

- 철도 안전성 관련 규정에 따른빅데이터의 수명주기 관리

시설관리 (예방정비) 분야 <- 표준화와 수명관리– 철도 예방정비 => 고장감소 => 정시도착 비율증대

– 그러나 데이터 표준화와 수명주기 관리가 중요

1,000개가 넘는 기계, 전자적이벤트가 매순간 발생운영이벤트(문열림, 브래이크)경고이벤트(전압주파수, 공기압축기)오류이벤트(집전장치고장, 역변환기)

데이터 수집과통합

고장예측A-이벤트 발생 후 1시간 이내에

B-이벤트가 발생하면10분 이내 브레이크 고장 (90%)

M2M데이터

2015-07-23

분석

조완섭([email protected])

빅데이터 거버넌스 – 필요성과 사례

과학기술분야 <– 데이터 품질 (표준화)

2015-07-23 15

리스크, 재난, 의료 등 다양한 빅데이터 분야에서 복잡하고, 방대하며, 실시간으로 발생하는 데이터를 오해하거나 잘못 적용하여 오판을 일으킨다면 ?

: 빅데이터 거버넌스의 중요성

1999년 예정된 궤도보다 170km 아래에 진입, 폭발원인 : 미국-영국 과학자들이 (복잡한 수식에서)

수치 단위를 newton 대신에 pound로 사용

9개월간의 항해3억 3000만달러 손실우주산업 후퇴

화성탐사선

폭발

조완섭([email protected])

빅데이터 거버넌스 프레임웍

빅데이터 거버넌스는– 기존 데이터 거버넌스에 빅데이터 특징(3Vs)을 반영하여 확장

– 3Vs의 특징으로 빅데이터 거버넌스의 중요성이 증대

2015-07-23 16

Organi-zation

MetaData

PrivacyData

QualityBiz. ProcessIntegration

Master DataIntegration

Info. LifecycleManagement

기존데이터

거버넌스

빅데이터거버넌스

데이터가 폭증할 때보관&폐기정책문제가 더욱 중요; 비용과 규제준수 모두고려해야 함

빅데이터 분석 결과가 비즈니스최적화(지능화, 개인화) 실현; 비즈니스 이익과 규제준수 및관리비용 최적화 실현

빅데이터의 privacy 문제는더욱 심각하고 (빅브라더),품질은 훨씬 열악함

데이터과학자빅데이터 유형별Stewardship 지정,규정/법규 제정 등

다양성과복잡도 증가(데이터 종류와출처 등의 정보)

MDM과의 연계를 통하여 빅데이터 분석의Insight 가치향상; Social data + 고객 master data => 고객 성향분석의 정확도 향상 !랜트카 운행패턴을 센서 데이터로 받아서보험고객 master data 개선 !

조완섭([email protected])

빅데이터 거버넌스 프레임웍

BDG는 산업/데이터 유형/거버넌스 이슈 세가지 측면에서 관리되어야 함

2015-07-23 17

IT LogAnalysis

IT LogAnalysis

IT LogAnalysisIT Log

Analysis

IT LogAnalysis

IT LogAnalysis

IT LogAnalysisVOC

Call QualityAssurance

IT LogAnalysis

IT LogAnalysis

IT LogAnalysisInvestigate

ClaimsVehicle

TelematicsCustomer profiles

Underwriting

IT LogAnalysis

IT LogAnalysis

IT LogAnalysis

CustomerChun

Analytics

Location-based

Services

Customerprofiles

IT LogAnalysis

IT LogAnalysis

IT LogAnalysis

FacebookRoyalty Program

RFID TagsFacial

Recognition

IT LogAnalysis

IT LogAnalysis

IT LogAnalysisSmart

MetersPartsDesc.

IT LogAnalysis

IT LogAnalysis

IT LogAnalysisSentiment

AnalysisPatient

MonitoringClaims

AnalyticsGeneticTesting

ElectronicMedical Records

Organization/regulationMetadataPrivacy

Data Quality/standardBiz. Process Integration

Master Data Integration

Information Lifecycle Mgt.

Big Data Types

Web & Social

M2M & IoT TransactionData

BioMetrics

HumanGenerated

Healthcare

Utilities

Retail

Telco

Insurance

CustomerService

IT

Indust

ries

조완섭([email protected])

빅데이터 유형

웹과 소셜 미디어

– SNS(Facebook, Twitter, Blog 등)과 클릭 스트림 데이터

– 프라이버시 침해 방지 필요• 웹과 소셜 데이터를 마스터 데이터 및 비즈니스 프로세스 (예: 고

객 충성도 프로그램)와 통합하면 가치 증대; 그러나, BDG에서 규제나 판례 등을 참고하여 통합지침 마련

• 쿠키정보 (특히 제 3의 기관의 쿠키)를 사용하여 사용자를 추적하거나 그들의 웹 상호작용 정보를 개별적으로 분석하는 것에 관해서도 적절한 지침을 마련해야 함

– 웹과 소셜 미디어에 대한 메타 데이터 관리 필요• 예: 클릭 스트림 분석에서 두 사이트가 “unique visitors"라는 용어

를 서로 다르게 정의 (site1에서는 1개월 동안 유일함을, site 2에서는 1주 동안 유일함) => 통합하면 문제 발생

2015-07-23 18

민원, 블로그 분석시용어 정의 문제

조완섭([email protected])

빅데이터 유형

M2M 데이터

– 기계(센서)가 발생시키는 데이터• 속도, 온도, 압력, 플로우(flow), 염분 함유량, 소음 등 다양한 센서

가 개발되어 활용됨 (2014년 500억개 무선단말기(Ericsson))

– BDG에서는 M2M 데이터 관련 정책 수립 필요• 예를들어, 개인의 프로파일을 생성하여 프라이버시를 침해할 가능

성이 있는 위치정보와 RFID 데이터의 활용에 관한 규정 필요

• 거대한 M2M 데이터의 수명관리 정책 필요

• 습기가 많은 환경이거나 혼잡도가 지역의 경우 RFID 읽기 빈도에관한 규정 필요 (데이터 품질 관리)

• M2M 데이터에 대한 사이버 공격 대비책 : 원격감시제어시스템SCADA(Supervisory Control and Data Acquisition) 보안

2015-07-23 19

수초 만에 청주시를 관통하는 차량이동 데이터=> 실제 불가능한 데이터는 버리거나 보정 필요

조완섭([email protected])

빅데이터 유형

빅 트랜잭션 데이터

– 헬스케어 클레임, 통신 CDRs, 시설 요금 청구서 레코드 등업무상 발생하는 비즈니스 데이터• 통신사의 경우 거대한 CDRs 데이터를 축적하고 있음

• TESCO사는 매달 15억건 이상의 고객관련 데이터를 수집

• 빅 트랜잭션 데이터에도 반구조화(semi-structured) 혹은 비구조화(unstructured) 형식이 증가하고 있음

– 기존 데이터 거버넌스 확장 필요• 기존의 메타 데이터, 데이터 품질, 프라이버시, 정보 수명주기 관

리 등이 빅데이터의 3Vs로 인한 영향을 고려하여 확장

2015-07-23 20

- 범죄수사를 위해 특정 지역에서 일정기간 동안의 CDR data 활용 ?- 법원영장 ? 재난안전의 시급성 ?

조완섭([email protected])

빅데이터 유형

생체정보

– 개인의 해부학적 혹은 행동양식 특징에 근거한 개인식별이 가능한 정보• 해부학적 정보란 개인의 신체적인 특성으로부터 생성되는 데이터

로써 지문, 홍체, 망막, 얼굴, 손의 모양, 귀의 모양, 음성패턴, DNA, 특별한 경우 몸의 냄새 등이 있음

• 행동양식의 특징에 근거한 데이터로는 필기체, 키보드 타이핑 분석 등이 있음

– BDG 정립이 필요함• 기술 발전으로 다양한 생체정보가 개발, 활용되고 있음

• 비즈니스 기회인 동시에 개인 데이터의 축적 및 유지, 프라이버시침해라는 거버넌스 문제를 야기함

2015-07-23 21

축적된 생체정보가 해킹되어 사용된다면 ?웨어러블 디바이스에서 생성되는 건강 데이터가 보험회사로 가면 ?

조완섭([email protected])

빅데이터 유형

사람이 생성한 데이터

– 정보화 사회에서 사람의 일상 활동 결과로 많은 데이터가생성되고 있음• 콜센터 데이터, 음성녹음, 이메일, 문서, 조사, 전자의료기록정보,

정문차량출입기록 등

– 프라이버시 문제• 민감한 데이터도 포함되어 있음 - 예를들어, 콜센터 녹음 데이터

에 포함된 주민등록번호나 전화번호 등

– 품질관리 문제• 이들 중에는 구조화된 데이터의 품질을 높이거나 MDM과 통합되

어 활용되면 가치가 높아지는 데이터도 있음 (퇴직자 이메일)

– 수명관리 문제• 규제나 스토리지 비용을 감안하여 대규모로 축적되는 사람이 생

성한 데이터의 보유기한에 관한 정책 필요

2015-07-23 22

조완섭([email protected])

빅데이터 거버넌스 요소

조직(사람), 제도

– 데이터 거버넌스 조직에 빅데이터 관련 조직과 인력 추가• 예를들어, 데이터 거버넌스 위원회는 데이터 과학자와 같은 빅데

이터 전문가를 찾아 위원으로 임명해야 함

• 빅데이터 유형별로 관리자를 임명 (steward)

– SNS 데이터는 누가 관리 ? (고객부서)

– 센서 데이터, RFID 데이터 ? (기계 성격을 잘 아는 전문가 ?)

• 마지막으로 데이터 거버넌스 프로그램에서는 기존 관리자에게(빅데이터 활용으로 인한) 추가적인 책임을 할당해야 함

– 예를들어, 기존 고객 데이터 관리자에게 마스터 데이터 리파지토리안에서 고객의 페이스북, 트위트 계정에 대한 관리 책임을 부과함

– 빅데이터는 여러 분야에서 일하는 방식의 변화를 초래• 관련부서의 책임자가 참여하는 거버넌스 위원회 구성과 권한부여

• 빅데이터 결과가 조직에 스며들어 변화를 이끌어 내야 !

2015-07-23 23

조완섭([email protected])

사례 - 경기도 조례

‘경기도 빅데이터 활용에 관한 조례안’– 빅데이터를 활용한 지역발전 정책 수립과 시행– 빅데이터를 행정에 접목하기 위한 활용기반 구축과 실태조사– 데이터산업 생태계 조성에 필요한 빅데이터 전문인력 양성– 빅데이터 활용에 따른 개인·법인·단체의 비밀 보호 등에 관한 사항을 규정

빅데이터 위원회 구성– 정보화기획관을 빅데이터 책임관으로 지정하고 5년마다 빅데이터 활용에 관한 기

본계획을 수립·시행하도록 함– 빅데이터의 활용과 관련된 사항을 심의하기 위해 빅데이터위원회를 두고 관련 사

업추진을 위해 빅데이터센터를 설치할 수 있도록 함

지난 1월 빅데이터 관련 정책 토론회에서 남경필 도지사는– “경기도에 흩어져 있는 데이터를 한곳으로 모아 누구나 쉽게 활용할 수 있도록 개

방하겠다”라며 데이터에 기반을 둔 ▲과학적 도정구현, ▲투명한 도정, ▲데이터생태계 조성, ▲활용문화 확산 등 4대 정책목표를 밝힌 바 있다.

경기도는– 빅데이터 활용에 관한 조례 제정으로 남경필 경기도지사의 핵심공약인 ‘빅파이

(Big-Fi, Bigdata Free Information) 프로젝트’를 본격 추진할 방침이다.– 경기도 관계자는 “지난해 말부터 도민생활과 밀접한 안전, 교통, 주거 등의 분야에

서 빅데이터 시범사업을 준비하고 있다”라며 “조례 시행을 계기로 관련 사업을 본격적으로 추진할 것”이라고 말했다

2015-07-23 24

조완섭([email protected])2015-07-23 25

캘리포니아데이터거버넌스 위원회

조완섭([email protected])

변화관리

변화관리 필요성

– 빅데이터로 인한 개선모델의 도입 및 정착 과정에서 생성되는 여러 변화 요인(갈등과 저항)을 미리 파악하여 개선모델이 업무에서 구현될 수 있도록 지원하는 체계적인 활동

2015-07-23 26

관광정책 수립

현행 (수동)1년에 한번 설문조사

향후 (자동)온라인 설문조사와 SNS/블로그 분석

교통정책 수립

현행 (수동)1년에 한번 승객조사

향후 (자동, 세밀하게)월별/요일별/시간대별/정류장별 상세분석

통계청 업무 ?………………………………………………………..관습, 저항교육, 위원회 필요

조완섭([email protected])

빅데이터 거버넌스 요소

메타 데이터

– 빅데이터는 다양성으로 인해 기존의 메타 데이터보다훨씬 풍부한 메타 데이터 관리가 요구됨

2015-07-23 27

Meta data forBig Data

?Knowing what we have ?

False discoveries 방지

조완섭([email protected])

메타 데이터

기존 엔트프라이즈 메타 데이터에 빅데이터 관련 메타 데이터 통합 필요– 다양한 빅데이터 소스에 관한 정보 관리

• 어디서 생성되어, 어떤 변환, 통합과정을 거쳐 Hadoop의 어느 곳에 저장되어 관리되는가 ?

• 데이터 추출 주기는 ?

– 빅데이터 용어들을 비즈니스 사전에 등록• 예를들어, 클릭 스트림 분석에서 “unique visitor”, 매출액 (세전 ?

세후?) 등에 관한 정의를 비즈니스 사전에 추가

– Hadoop의 기술적 메타 데이터를 통합

– 데이터 흐름 관리자, 변경영향분석 관리자 등을 빅데이터환경에 적합하게 확장함

메타 데이터 표준화 준수 : 빅데이터 ?

2015-07-23 28

조완섭([email protected])

빅데이터 거버넌스 요소

프라이버시

– 민감한 데이터를 식별하고, 이를 활용하기 위한 정책 수립• “빅브라더” 방지

– 이러한 정책은 빅데이터 타입과 산업 및 나라에 따라다른 규제를 가지므로 글로벌 한 이해가 필요• 유럽과 미국은 서로 다른 입장

– 소셜 미디어와 위치정보의 사용에 관한 가이드라인을 빅데이터 거버넌스에서 제정해야 함

– 최근 각국에서 개인 프라이버시 보호법을 강화하는 추세• 빅데이터에 포함된 민감한 데이터에 관하여 기술적, 제도적 안전

장치를 마련해야 함

2015-07-23 29

빅데이터활용

프라이버시보호

HIPASS 번호,차량번호 프라이버시 다르게 관리

조완섭([email protected])

빅데이터 거버넌스 요소

데이터 품질

– 조직의 데이터에 관하여 품질 측정, 품질 개선, 품질 인증과 무결성 보장 등의 규정을 정하는 것

– 빅데이터가 중요한 의사결정에 사용될수록 품질관리가 더욱 중요한 이슈로 부각

– 빅데이터의 경우 크기와 속도 및 다양성 때문에 기존 데이터 품질과는 다른 접근이 필요함• 경우에 따라 품질 보장보다는 실시간성의 보장이 중요

• 반구조화 혹은 비구조화된 데이터의 경우 품질 보장에 한계

• 추세를 보는 경우 원시 데이터의 정확도는 어느 정도 무시할 수도

2015-07-23 30

교통카드정보 관리회사BIMS 관리회사ATMS 정보 관리회사

- 서로 다른 정류장 코드 사용- 데이터 품질관리 (버스기사탓)- 하차정보 확보방안- 10초에 청주시내 관통

빅데이터기술영역을벗어남=> 위원회

조완섭([email protected])

빅데이터 거버넌스 요소

비즈니스 프로세스 통합

– 빅데이터 분석 결과가 관련 업무개선으로 연결되어야• 보험청구 데이터의 일관성 확보 => 청구분석 업무개선 최적화

• 시추시설 센서 데이터 수명관리 => 사고시 책임소재를 가리는 핵심증거자료 (위험관리 업무)

• 페이스북 프로파일 활용을 위한 고객동의 절차 확립 => 고객충성도 프로그램 개선과 지속적 활용

• 교통데이터 분석 => 노선선정, 배차간격, 공사효과분석 등에 활용

– 1회성 반짝 효과 지양, 지속적인 개선을 통한 업무 최적화• CEO의 관심과 의지

• 내부 분석역량 강화 필수

2015-07-23 31

조완섭([email protected])

빅데이터 거버넌스 요소

빅데이터 결과가 관련 업무를 혁신시켜야 함

2015-07-23 32교통빅데이터 분석 시스템

BD거버넌스위원회 구성

교육를 통한변화동참

조완섭([email protected])

빅데이터 거버넌스 요소

마스터 데이터 통합 (풍요)

– 빅데이터를 마스터 데이터에 통합 => 가치 가치증진• 예를들어, 소매업자들은 소셜 미디어 정보를 고객 마케팅에 활용

하는 문제를 고민

• 이 경우 소셜 데이터와 고객 마스터 데이터의 통합함으로써 가치를 증진시킬 수 있음 (불특정 다수의 의견에서 고객의 의견)

– 통합 과정에서 데이터 품질이 중요함• 적절한 데이터 관리권 정책 수립

• 페이스북 상의 "Susie Smith"가 고객 마스터의 "Susan Smith"와동일인인지를 검정해서 통합

2015-07-23 33

조완섭([email protected])

빅데이터 거버넌스 요소

정보 수명주기 관리

– 규제 혹은 비즈니스 요구사항을 분석하여 데이터 종류별로 보관 및 폐기정책을 수립해야 함• IT 부서는 보수적으로 데이터 수명주기를 관리하며 이는 비용증대

는 물론 위험성을 가중시키게 됨 : 명확한 수명관리 정책 필요

• 기록유지나 전자증거(e-Discovery)를 대비하여 빅데이터의 저장소에 관한 위치정보 관리도 필요

– 운영시스템 성능보장을 위해서도 수명주기 관리가 중요• 응용의 성능을 보장하고 저장 비용을 적절한 수준으로 관리하기

위한 베스트 프렉티스, 도구, 아카이빙 및 압축 정책 등을 모색

2015-07-23 34

생성수집저장

분석가시화

활용보관폐기

정책

조완섭([email protected])

빅데이터 거버넌스 요소

데이터 소유권/관리권 명확화

– 공공 데이터는 법으로 개방 의무화, 그러나 품질이나 최신성 등의 측면에서 관리 필요

– 공공성이 있는 데이터 (교통카드)의 소유, 관리권 모호

2015-07-23 35

공공데이터(공공데이터의 제공 및 이용

활성화에 관한 법률)(

위탁관리업체 보유 데이터

공개 ?품질관리 (표준화) ?지자체 공공기관의 품질개선 노력 ?

조완섭([email protected])

결론

빅데이터가 성공하려면 ?

– 데이터 기반 조직문화 형성• 직관보다 데이터 기반의 과학적 의사결정 중시 문화가 필요

• CEO 의지가 가장 중요한 관건임

– 조직의 분석지능을 높여야 함• 빅데이터 시대에 분석지능이 높은 조직(기업, 국가)일수록 혁신

능력과 리스크관리 능력이 우수함(MIT, 3000명 CEO 조사결과)

• 조직내 데이터 과학자 양성이 중요함 (재교육 필요성)

• 작은 업무에서라도 빅데이터 분석을 시작해보자 !

– 작은 데이터부터 빅데이터까지 모두 고려• 빅/스몰 데이터 구분보다 전체를 관리하고, 분석하여 가치창출

• 각 분야별로 구축, 운영, 최적화, 가치창출이 선순환되어야 함

2015-07-23 36

조완섭([email protected])

결론

지속가능한 빅데이터가 되려면 ?

– 빅데이터의 활용과 함께 데이터 거버넌스가 구축되어야 !

2015-07-23 37

빅데이터 거버넌스는데이터의 품질보장, 프라이버시 보호, 데이터 수명관리, 전담조직과 규정정립, 데이터 소유권과 관리권 명확화 등을 통하여 빅데이터가 적시에 필요한 사람에게 제공되도록 체계를 확립하는 것

빅데이터 거버넌스가 확립되지 못하면- 품질이 낮은 데이터를 중요한 의사결정에 사용함으로써 심각한 문제를 야기- 개인 프라이버시 관련 데이터로 인해 빅브라더의 우려가 현실화- 폭증하는 데이터에 대한 메타 데이터 & 수명 관리 소홀로 인한 IT 비용 급증- 데이터 관련 문제를 전담하고 책임지는 조직과 인력이 없다면 빅데이터

효과는 일회성에 그칠 것임