21
РАСПРЕДЕЛЕНИЕ РАСПРЕДЕЛЕНИЕ БРЭДФОРДА БРЭДФОРДА И И ПОДОБНЫЕ ПОДОБНЫЕ ЕМУ ЕМУ ИНФОМЕТР ИНФОМЕТР ИЧЕСКИЕ ИЧЕСКИЕ ЗАКОНЫ ЗАКОНЫ на примере статистики использования электронных ресурсов в университетской библиотеке Владимир Владимирович Писляков нач. отдела информационных систем и электронных ресурсов библиотеки ГУ-ВШЭ, Москва http://library.hse.ru [email protected] SCIENCE ONLINE: электронные информационные ресурсы для науки и образования Турция, 2005

Владимир Владимирович Писляков

  • Upload
    saima

  • View
    45

  • Download
    0

Embed Size (px)

DESCRIPTION

РАСПРЕДЕЛЕНИЕ БРЭДФОРДА И ПОДОБНЫЕ ЕМУ ИНФОМЕТР ИЧЕСКИЕ ЗАКОНЫ на примере статистики использования электронных ресурсов в университетской библиотеке. Владимир Владимирович Писляков нач. отдела информационных систем и электронных ресурсов библиотеки ГУ-ВШЭ, Москва - PowerPoint PPT Presentation

Citation preview

Page 1: Владимир Владимирович Писляков

РАСПРЕДЕЛЕНИЕ РАСПРЕДЕЛЕНИЕ БРЭДФОРДАБРЭДФОРДА

И И ПОДОБНЫЕ ПОДОБНЫЕ ЕМУЕМУ

ИНФОМЕТРИНФОМЕТРИЧЕСКИЕ ИЧЕСКИЕ ЗАКОНЫЗАКОНЫ

на примере статистики использованияэлектронных ресурсов в университетской библиотеке

Владимир Владимирович Писляков

нач. отдела информационных системи электронных ресурсов библиотеки ГУ-ВШЭ, Москва

http://[email protected]

SCIENCE ONLINE: электронные информационные ресурсы для науки и образования Турция, 2005

Page 2: Владимир Владимирович Писляков

Academic Search PremierBusiness Source PremierHealthSourceMasterFILE PremierNewspaper Source

ABI/INFORM GlobalAcademic Research LibraryProQuest ComputingProQuest Education CompleteProQuest Psychology JournalsSocial Science Plus

Arts & Sciences IArts & Sciences IIBusiness CollectionLanguage & Literature Collection

EBSCOEBSCOhosthost::

ProQuest:ProQuest:

JSTOR:JSTOR:

Ресурсы, включенные в статистику использования-2004

ScienceDirect:ScienceDirect:Business, Management and AccountingEconomics, Econometrics and FinanceSocial Sciences

Page 3: Владимир Владимирович Писляков

Электронные журналы:статистика использования в ГУ-ВШЭ, 2004 г.

число полнотекстовых

изданий

изданий, к полным текстам которых были обращения

доля востребованных

изданий

EBSCO 11000 1105 10%

JSTOR 410 306 75%

ProQuest 3700 1452 39%

ScienceDirect 310 236 76%

всего 13400 2592 19%

Page 4: Владимир Владимирович Писляков

Электронные журналы:статистика использования в ГУ-ВШЭ, 2004 г.

открыто полнотекстовых

статей

EBSCO 6374

JSTOR 17534

ProQuest 10333

ScienceDirect 7719

всего 41960

Page 5: Владимир Владимирович Писляков

Статистика использования эл. журналов: представление

Page 6: Владимир Владимирович Писляков

Закон Брэдфорда: формулировка

Bradford S. C. Sources of information on specific subjects // Engineering. 1934. Vol. 137. P. 85–86.

Bradford S. C. Documentation. London: Crosley Lockwood, 1948 (Washington: Public Affairs Press, 1950).

429 статейв 9 журналах

499 статейв 59 журналах

404 статьив 258 журналах

Law

ani S

. M. B

radford’s Law

and the Literature of

agriculture // International Library R

eview. 1973. V

ol. 5. P

. 341–350.

Page 7: Владимир Владимирович Писляков

26 журналов — 13987 статей

139 журналов — 13975 статей

2427 журналов — 13998 статей

139 : 26 = 5,3

2427 : 139 = 17,5

3,5 33 журнала в «ядре»

Закон Брэдфорда: проверка на статистике ГУ-ВШЭ

Page 8: Владимир Владимирович Писляков

Закон Брэдфорда: проверка на статистике ГУ-ВШЭ

y = –159x3 + 2081x2 – 1461x + 2332

y'' = – 954x + 4162

y'' = 0 при x = 4,36

4,36 78 журналов в «ядре»

Page 9: Владимир Владимирович Писляков

Ядро из 78-ми журналов: анализ по базам данных

число полнотекстовых

изданий

изданий из ядраГУ-ВШЭ

изданий из ядра, читаемых только из

данного ресурса

EBSCO 11000 48 2

JSTOR 410 46 2

ProQuest 3700 46 2

ScienceDirect 310 17 17

Page 10: Владимир Владимирович Писляков

Закон Леймкулера: формулировка

Leimkuhler F. F. The Bradford Distribution // Journal of Documentation. 1967. Vol. 23. P. 197–207.

Y = A ln(1 + BN)

Y — число статей в N наиболее продуктивных журналах;A и B — некоторые коэффициенты

Для нормированных величин:

Y = ln(1 + βx) / ln(1 + β)

Y — доля от общего числа статей в доле x наиболее продуктивных журналов;β — «коэффициент концентрации»

2500

42000

0 журналы

статьи

1

1

0 доляжурналов

долястатей

кривая Леймкулера:

Page 11: Владимир Владимирович Писляков

Используем нелинейную регрессию и пытаемся, подбирая коэффициент β, приблизить наш график кривой, которая подчиняется закону Леймкулера.

Закон Леймкулера: проверка на статистике ГУ-ВШЭ

нелинейная регрессияисходные данные

β 5860

Найдем площадь под кривой Леймкулера:

S = Y(x) dx =

= [ln(1 + βx) / ln(1 + β)] dx =

= 1 + 1/β – 1/ln(β+1)

S(β) возрастающая функция и S(β0) 0,5 S(β) 1

Для нашего случаяS(5860) = 0,885.

Page 12: Владимир Владимирович Писляков

Закон Лотки: формулировка

Lotka A. J. The Frequency Distribution of Scientific Productivity // Journal of the Washington Academy of Sciences. 1926. Vol. 16. P. 317–323.

n = A / x , 2

n — количество учёных, опубликовавших x статей;A — некоторый коэффициент

В логарифмическом виде:ln n = – ln x + K

статьи

ученые

ln (статьи)

ln (ученые)

Page 13: Владимир Владимирович Писляков

Приложение закона к статистике использования электронных ресурсов: Найдем, из скольких журналов n было прочитано пользователями ровно x статей.

Закон Лотки: проверка на статистике ГУ-ВШЭ

нескорректированные данные скорректированные данные

ln (журналов)

ln (статей)

Закон Лотки выполняется, причем

= 1,7

n = A / x = A / x

1,7

Page 14: Владимир Владимирович Писляков

Закон Ципфа: формулировка

Zipf G. K. The Psycho-biology of Language. Boston: Houghton, 1935.

Zipf G. K. Human Behaviour and the Principle of Least Effort. Reading: Addison-Wesley, 1949.

r x f = const

r — порядковый номер слова (в порядке убывания частоты);f — количество употреблений слова

В обобщенном виде: ln r + ln f = const, 1

(обычно закон Ципфа плохо выполняется для верхних позиций рейтинга слов)

Page 15: Владимир Владимирович Писляков

Приложение закона к статистике использования электронных ресурсов: Найдем зависимость между рангом журнала в упорядоченном списке востребованности изданий и количеством прочитанных из него статей.

Закон Ципфа: проверка на статистике ГУ-ВШЭ

Закон Ципфа выполняется

удовлетворительно и

= 1,3

f x r 1,3 = const

ln (статей)

ln (место в рейтинге)

Page 16: Владимир Владимирович Писляков

Pareto V. Cours d’Économie Politique. Vol. 2. Lausanne: 1 Université de Lausanne, 1897.

Lorenz M. O. Methods of measuring the concentration of wealth // Publications of the American Statisical Association. 1905. Vol. 9. P. 209–219«Plot along one axis cumulated percents of the population from poorest to richest, and along the other the percent of the total wealth held by these percents» (p. 217)

Gini C. Variabilità e mutabilità // Memori di Metodologia Statistica. Vol. 1. Rome, 1912. P. 211–382.

— беднейшие 20% населения получают 7% общего национального дохода

— беднейшие 40% населения получают 18% общего национального дохода

— беднейшие 60% населения получают 32% общего национального дохода

— беднейшие 80% населения получают 52% общего национального дохода

— беднейшие 100% населения (т.е. всё население) получают 100% общего национального дохода (весь доход)

Принцип Парето, кривая Лоренца, индекс Джини

Page 17: Владимир Владимирович Писляков

Кривая Лоренца–Леймкулера

Page 18: Владимир Владимирович Писляков

Приложение закона к статистике использования электронных ресурсов: на 20% электронных журналов приходится 80% всех загрузок полнотекстовых статей

Принцип Парето: проверка на статистике ГУ-ВШЭ

процент журналов, содержащих 80% загруженных статей

EBSCO 28%JSTOR 18%

ProQuest 31%ScienceDirect 25%

EBSCO + ProQuest 27%EBSCO + ProQuest + ScienceDirect 22%

все ресурсы совокупно 14,7%

Page 19: Владимир Владимирович Писляков

Кривая Лоренца-Леймкулера и индекс Джинипо статистике ГУ-ВШЭ

% журналов

% прочитанныхстатей

SобщSобщ = 0,902 G= (Sобщ – 0,5) : 0,5

= 0,8

Page 20: Владимир Владимирович Писляков

Bookstein A. Informetric Distributions, part I: Unified Overview // Journal of the American Society for Information Science. 1990. Vol. 41. P. 368–375.

Garfield E. Bradford’s Law and Realted Statistical Patterns // Current Contents. 1980. No. 19, 12 May.

Egghe L. Type/Token-Taken Informetrics // Journal of the American Society for Information Science and Technology. 2003. Vol. 54. P. 603–610.

Egghe L., Rousseau R. A proposal to define a core of a scientific subject: A definition using concentration and fuzzy sets // Scientometrics. 2002. Vol. 54. No. 1. P. 51–62.

Burrell Q. Defining a core: Theoretical observations on the Egghe-Rousseau proposal // Scientometrics. 2003. Vol. 57. No. 1. P. 75–92.

Библиография

Page 21: Владимир Владимирович Писляков

РАСПРЕДЕЛЕНИЕ РАСПРЕДЕЛЕНИЕ БРЭДФОРДАБРЭДФОРДА

И И ПОДОБНЫЕ ПОДОБНЫЕ ЕМУЕМУ

ИНФОМЕТРИНФОМЕТРИЧЕСКИЕ ИЧЕСКИЕ ЗАКОНЫЗАКОНЫ

на примере статистики использованияэлектронных ресурсов в университетской библиотеке

Владимир Владимирович Писляков

нач. отдела информационных системи электронных ресурсов библиотеки ГУ-ВШЭ, Москва

http://[email protected]

SCIENCE ONLINE: электронные информационные ресурсы для науки и образования Турция, 2005