30
데이터마이닝 기법을 활용한 전자저널 이용지수 개발 적용 46 전국도서관대회 연구논문 발표 연세대학교 의학도서관 임보람, 김나원

임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

Embed Size (px)

DESCRIPTION

1. 제목 : 데이터마이닝 기법을 활용한 전자저널 이용지수 개발, 적용2. 제출처 : 전국도서관대회 연구논문 공모 선정작 (2009.10)3. 작성자 : 연세대학교 의학도서관 사서 김나원, 임보람

Citation preview

Page 1: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

데이터마이닝 기법을 활용한

전자저널 이용지수 개발 및 적용

제 46회 전국도서관대회 연구논문 발표 연세대학교 의학도서관 임보람, 김나원

Page 2: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

Introduction

목차 table of contents

1. 서론 2. 선행연구 3. 전자저널의 이용수치, 인용지수간의 상관관계 4. 새로운 전자저널 이용지수 개발 5. 결론

Previous Study Usage VS Citation New Usage Index Result

Page 3: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

Data에 대한 중요성이 증대

Data mining, COUNTER 데이터에 대한 새로운 해석방식 등장

새로운 정보서비스 개발을 위한 Data의 문헌정보학적 재조명

Previous Study Usage VS Citation New Usage Index Result

연구 목적 the purpose of study

Introduction

Page 4: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

Previous Study Usage VS Citation New Usage Index Result

연구 방법 the method of study

Data mining, COUNTER 개념에 대한 문헌연구 및 사례연구

연세대학교 의학도서관 전자저널

이용수치 분석 및 통합

새로운 전자저널 이용지수 개발

Introduction

Page 5: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

대량의 데이터로부터 드러나지 않은 유용한 정보를 추출하는 과정

김성희, 이소연(2000)

대용량의 데이터로부터 의미 있는 지식을 발견하는 것

손용배(2000)

Usage VS Citation Introduction New Usage Index

데이터마이닝 Data Mining

Previous Study Result

Page 6: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

일관된 목적으로 데이터를 수집하고

일정량 이상 수집된 데이터를 분석하여

그 안의 패턴을 파악하고, 새로운 관계와 의미를 찾아내는 활동

Usage VS Citation New Usage Index Previous Study Result Introduction

데이터마이닝 Data Mining

Page 7: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

전자저널 이용통계 및 보고양식 표준을 개발하는 단체이자 표준 메타데이터

심원식(2005, 2007)

전자자원 선정 시 활용가능 다양한 채널의 이용통계 데이터 수집, 이용패턴에 대한 연구가 가능

김선태, 임석종(2007)

Usage VS Citation New Usage Index

COUNTER Counting Online Usage of NeTworked Electronic Resources

Previous Study Result Introduction

Page 8: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

가장 표준적인 전자저널 이용통계 메타데이터

현재 대부분의 벤더 및 출판사에서 제공하고 있는

이용통계 데이터 포맷

본 연구의 이용통계 데이터 통합의 기준

Usage VS Citation New Usage Index Previous Study Result Introduction

COUNTER Counting Online Usage of NeTworked Electronic Resources

Page 9: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

정보자원의 가치 기준 측정 서태섭(2005)

Impact Factor는 학술지 이용 가치에

가장 큰 영향을 미치는 요인 김희섭(2008)

전자저널 이용량과 Impact Factor의 상관관계 분석

김환민, 정재훈, 정도헌(2007)

Usage VS Citation New Usage Index

이용과 인용에 관한 연구 usage and citation

Previous Study Result Introduction

Page 10: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

Impact Factor는 독립적이고 절대적인

정보선택의 기준인가?

Previous Study Usage VS Citation New Usage Index

의문 Question

Result Introduction

Page 11: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

Previous Study Usage VS Citation New Usage Index

분석 analysis

연세대학교 의학도서

관 전자저널 7,453종의

이용수치

기관 이용자의 논문에서 참고문헌으로 사용된 저널 중 2,906종

의학분야 이용과 인용 형태 분석

Usage Citation

VS

이용 및 인용, IF별 차트 작성

Result Introduction

Page 12: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

Previous Study Usage VS Citation New Usage Index

분석 analysis

Result Introduction

이용횟수별 학술지 종수

인용횟수별 학술지 종수

Impact Factor별 학술지 종수

Page 13: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

Previous Study Usage VS Citation New Usage Index

이용수치 인용수치 Impact Factor

분석 analysis

이용 및 인용, IF의 수치가 동일한 분포를 보이지는 않는다

Result Introduction

Page 14: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

Previous Study Usage VS Citation New Usage Index

Impact Factor는

독립적이고 절대적인

정보선택의 기준인가???

Result Introduction

분석 analysis

Page 15: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

JCR 2008 5,190종 80개 주제

연세대학교 의학도서관 통합 E-J 리스트 391종

총 568종의 저널

Previous Study Usage VS Citation

연구 적용 범위 the coverage of study

중복주제 저널 177종

New Usage Index Result Introduction

Page 16: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

이용자 입장

전 학문 분야 대상인 JCR의 포괄성 문제 해결 Journal of periodontics의 이용율 / 인용지수 차이

적합문헌 판단의 새로운 기준 기존의 Impact Factor 보완

이용지수 개발의 의미 the mean of usage index

Previous Study Usage VS Citation New Usage Index Result Introduction

Page 17: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

사서의 입장

업무의 참고자료로 활용 전자저널 구독 및 갱신 여부 판단 시 참고

실질적인 이용순위 파악 및 제공 다양한 경로별 이용순위의 일괄 파악

Previous Study Usage VS Citation New Usage Index Result Introduction

이용지수 개발의 의미 the reason of usage index

Page 18: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

이용수치의 종류 the kinds of usage data

Previous Study Usage VS Citation

1. 전자저널 출판사 / DB 업체 제공 수치

2. PubMed Full text 링크 수집 수치

3. 홈페이지 E-J 리스트 수집 수치

4. 홈페이지 통합 검색창 수집 수치

New Usage Index Result Introduction

Page 19: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

1. 경로별 이용수치 통합 파일 작성

출판사 PubMed 링킹솔루션 홈페이지

통합 전자저널 리스트 파일

COUNTER 기반 칼럼 : Title, ISSN, YTD Total

Usage Data 통합 merging E-J Usage data

Previous Study Usage VS Citation New Usage Index Result Introduction

Page 20: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

2. 이용지수 추가 / 재계산

Previous Study Usage VS Citation New Usage Index Result Introduction

Usage Data 통합 merging E-J Usage data

NEJM의 PubMed 이용지수 = 1.82%

Page 21: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

2. 이용지수 추가 / 재계산

Previous Study Usage VS Citation New Usage Index Result Introduction

Usage Data 통합 merging E-J Usage data

통합 전자저널 리스트 파일

Page 22: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

3. 저널별 / Source별로 통합된 이용지수

Previous Study Usage VS Citation New Usage Index Result Introduction

Usage Data 통합 merging E-J Usage data

출판사 PubMed 링킹솔루션 홈페이지

종합 이용 지수 순위

이용 지수

순위 이용 지수

순위 이용 지수

순위 이용 지수

New England Journal of Medicine

2 3.40% 3 1.82% 1 2.78% 1 3.49% 2.87%

Plastic & Reconstructive Surgery

12 1.16% 1 1.97% 2 1.93% 3 1.66% 1.68%

Journal of Biological Chemistry

1 4.42% 6 0.95% 49 0.46% 42 0.51% 1.58%

Journal of periodontology

3 1.48% 10 1.06% 1.27%

Spine 24 0.66% 2 1.96% 8 1.02% 6 1.35% 1.25%

Page 23: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

4. 이용지수의 JCR 2008 주제별 정렬

JCR 2008 주제 리스트

주제별 종합 이용지수 파일

VLOOKUP 함수 : ISSN 기준 매칭

Previous Study Usage VS Citation

통합 E-J 리스트

New Usage Index Result Introduction

Usage Data 통합 merging E-J Usage data

Page 24: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

5. JCR 2008 주제별로 정렬된 이용지수 파일

Previous Study Usage VS Citation New Usage Index Result Introduction

Usage Data 통합 merging E-J Usage data

Abbreviated Journal Title ISSN Subject Impact Factor IF Rank 이용지수 이용지수 Rank

J ALLERGY CLIN IMMUN 0091-6749 ALLERGY 9.773 1 0.41% 1

ANN ALLERG ASTHMA IM 1081-1206 ALLERGY 2.353 3 0.19% 2

ALLERGY 0105-4538 ALLERGY 6.204 2 0.19% 3

Abbreviated Journal Title ISSN Subject Impact Factor IF Rank 이용지수 이용지수 Rank

FERTIL STERIL 0015-0282 Obstetrics & Gynecology 4.167 2 0.47% 1

AM J OBSTET GYNECOL 0002-9378 Obstetrics & Gynecology 3.453 4 0.37% 2

GYNECOL ONCOL 0090-8258 Obstetrics & Gynecology 2.919 5 0.29% 3

OBSTET GYNECOL 0029-7844 Obstetrics & Gynecology 4.397 1 0.28% 4

HUM REPROD 0268-1161 Obstetrics & Gynecology 3.773 3 0.22% 5

J REPROD MED 0024-7758 Obstetrics & Gynecology 0.745 6 0.16% 6

Page 25: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

6. Impact Factor와 이용지수의 상관관계 차트

Previous Study Usage VS Citation New Usage Index Result Introduction

Usage Data 통합 merging E-J Usage data

Dermatology Surgery

Radiology

Ophthalmology

Page 26: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

Previous Study Usage VS Citation New Usage Index Result Introduction

새로운 이용지수 제공 New Usage Index Service

계산된 이용지수의 제공 채널 고민

링킹 솔루션 - SFX 메뉴 이용자의 정보접근 채널

SFX 메뉴를 제공 채널로 선정

Page 27: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

SFX 메뉴에 종합 이용지수 순위와 JCR 주제별 순위 제공

이용자의 정보선택 참고 기준

Previous Study Usage VS Citation

새로운 이용지수 제공 New Usage Index Service

New Usage Index Result Introduction

Page 28: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

상황 situation

Previous Study Usage VS Citation New Usage Index Result

아날로그에서 디지털로

Introduction

전자자원의 중요성 증대

폭발적인 정보량

정보선택의 기준 필요

Page 29: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

Previous Study Usage VS Citation New Usage Index Result

도서관 Library

전자저널 종합 이용지수

정보선택의 또 다른 기준

전자저널 주제별 이용지수

SFX를 비롯한 다양한 채널을 통해 이용자에게 제공

Introduction

Page 30: 임보람, 김나원, 데이터마이닝 기법을 활용한 전자저널 이용지수 개발 및 적용 (전국도서관대회)

감사합니다.