Upload
ringo
View
64
Download
3
Embed Size (px)
DESCRIPTION
часть проекта « Conceptions of Global Inequality in World Society ». Неравенство в мировом экспертном дискурсе. Концепция методологии проекта. Цели проекта. http://sfb882.uni-bielefeld.de/projects/Teilprojekt_C5.php.en. - PowerPoint PPT Presentation
Citation preview
http://soc.hse.ru/structanalysis/
1
Неравенство в мировом Неравенство в мировом экспертном дискурсеэкспертном дискурсе
Неравенство в мировом Неравенство в мировом экспертном дискурсеэкспертном дискурсе
часть проекта «Conceptions of Global Inequality in World Society»
Концепция методологии проекта
http://soc.hse.ru/structanalysis/
2
Цели проектаЦели проекта
Потенциальные источники данных могут быть разнообразны: официальные отчеты, сайты исследовательских организаций и
экспертов, социальные сети.
В этой презентации мы рассмотрим только возможности обработки массива данных из официальных отчетов.
http://sfb882.uni-bielefeld.de/projects/Teilprojekt_C5.php.en
The main project goal is to describe shifts in semantics of inequality in world society and to map this shift in a detailed fashion in the context of the case studies. In particular, these case studies focus on reports, statistics, and policy statements of three international organizations (World Bank, UNDP, OECD). Changes in notions of inequality, which are reflected in semantics have effects on how ‘progress’ in development is quantified, and it has a tangible effect on the projects and measures of international organizations. These semantics emerge within a cycle of communication between national and international, public and private actors concerning problems in economic and social development.
http://soc.hse.ru/structanalysis/
3
Уровни анализа и единицы исследованияУровни анализа и единицы исследования
Речевые маркеры
СтраныОрганизации
Содержатель-ные концепты
Структуры концептов
Индикаторы, индексы, рейтинги
НеравенствоНеравенство
Проявления неравенства (на разных уровнях)
Проявления неравенства (на разных уровнях)
Способы преодоления неравенства
Способы преодоления неравенства
Ожидаемый результат преодоления неравенства
Ожидаемый результат преодоления неравенства
Мировые игроки
Программы
Ценности
Экономические модели
Социальные модели
Правительства
Социальные группы Социальное
действие
http://soc.hse.ru/structanalysis/
4
Структура данных по отчетамСтруктура данных по отчетам
1 часть базы данных 2 часть базы данных
Характеристики текстов, заполняются вручную
Частотная обработка речевых маркеров текстов, готовится
автоматически
№ текстов
АвторАвторыы
ОрганОрганизацииизации
ОтраОтраслисли
ИсточниИсточники ки информаинформацииции
СтранСтраныы
… inequalinequalitiesities
GapGap InstabilitInstabilityy
JusticJusticeses
….
3124_2.txt
23 15 31 10 …
….
•Авторы, Авторы, •Организации,Организации,•ОтраслиОтрасли•Источники информации,Источники информации,•Страны Страны •… … (см. следующий слайд)(см. следующий слайд)
Частота встречаемости слов в текстеТексты – в
строках
Характеристики текстов – в столбцах
http://soc.hse.ru/structanalysis/
5
Поля 1 части базы данныхПоля 1 части базы данных
•N записиN записи•коды файловкоды файлов•название файланазвание файла•путь к файлу в базе данныхпуть к файлу в базе данных•ссылки на файл в Интернетессылки на файл в Интернете•название отчетаназвание отчета•код отчетакод отчета•тема отчетатема отчета•подтемы отчетаподтемы отчета•регион мирарегион мира•страна, которой посвящен отчет страна, которой посвящен отчет •организация - собственник отчетаорганизация - собственник отчета•организация, опубликовавшая отчеторганизация, опубликовавшая отчет•организация, проводящая исследованиеорганизация, проводящая исследование•Автор (авторы) отчета Автор (авторы) отчета •язык отчетаязык отчета•день публикациидень публикации•месяц публикациимесяц публикации•год публикации отчетагод публикации отчета•дата начала исследованийдата начала исследований•дата окончания исследованийдата окончания исследований•отрасльотрасль
•объем всего отчета, знаковобъем всего отчета, знаков•объем содержательной части отчета (без объем содержательной части отчета (без приложений), знаковприложений), знаков•объем аннотацииобъем аннотации•Источники данных, на основании которых Источники данных, на основании которых сделан вывод (собственное сделан вывод (собственное исследование, другие исследования, исследование, другие исследования, международные индексы)международные индексы)•Какие организации упоминаются в отчетеКакие организации упоминаются в отчете•Какие программы упоминаются в отчетеКакие программы упоминаются в отчете•Какие индикаторы и показатели Какие индикаторы и показатели упоминаются в отчетеупоминаются в отчете•Какие социальные группы упоминаются в Какие социальные группы упоминаются в отчетеотчете•Уровень аналитики (социальные группы, Уровень аналитики (социальные группы, региональный, межстрановой)региональный, межстрановой)•Тип отчета (описательный, Тип отчета (описательный, стратегический…)стратегический…)•……..
http://soc.hse.ru/structanalysis/
6
Порядок действий – подготовительный этап
Порядок действий – подготовительный этап
Сбор массива данных - отчетов
Перевод отчетов в формат .txt
Кодирование названий файлов
Разделение файлов:
Полные отчеты Резюме отчетов
Выделение абзацев, носящих ключевые речевые маркеры
Поиск ключевых речевых маркеров, словосочетаний и концептов
Технический этап Содержательный этап
Следующий этап -
обработка данных
http://soc.hse.ru/structanalysis/
7
Порядок действий – обработка данныхПорядок действий – обработка данных
Полные отчетыПолные отчетыРезюме отчетовРезюме отчетов Абзацы, носящих
ключевые речевые маркеры
Абзацы, носящих ключевые речевые
маркерыПодсчет частот упоминания видов неравенство, их признаков, а так же индексов, рейтингов, организаций, персон, авторов и т.п.
Дискурс-анализ структуры концептов и речевых маркеров: постановка задачи и ожидаемый результат
Выявление групп слов, окружающих ключевые речевые маркеры
Группировка текстов по сходству методом многомерного
шкалирования
Представление результатов
Структура смысловых концептов, окружающих понятие неравенства,
или заменяющих его
http://soc.hse.ru/structanalysis/
8
Порядок действий – представление результатовПорядок действий – представление результатов
Структура концептов – неравенства и других понятий По каждой стране и
ее регионамГруппы авторов и организаций, готовящих отчеты и стратегии
Структура аргументов, обосновывающих наличие неравенства и борьбу с ней
По социальным группам
По отраслям и направлениям
Группировка текстов по содержательному сходству
По стратегиям борьбы с неравенством
Выявление групп действующих организаций – игроков на территории данной страны/региона
XX
http://soc.hse.ru/structanalysis/
9
Общие статистические характеристики текстовОбщие статистические характеристики текстов
Было подготовлено к обработке 369 файлов из папок «GLIN I», «UNDP».
Количество знаков
Количество слвосочетаний
(существительное +глагол)
Количество предложений
Количество слов
Среднее количество слов в предложении
Итого: 87393934 2461679 1733704 12110813
Среднее: 236840 6671 4698 32821 10
Всего – репертуар, словарный запас отчетов - 65536 слов
некоторые результаты анализанекоторые результаты анализа
http://soc.hse.ru/structanalysis/
10
Концепт ЧастотаКоличество тектстов,
poverty 32293 304
government 31059 365
social 26971 332
national 25889 362
economic 25831 363
sector 24832 346
countries 23190 354
public 23068 363
women 19804 274
bank 18133 354
rural 15507 309
poor 15263 302
local 15007 352
state 14574 340
level 14376 354
income 14138 348
private 13892 358
resources 13835 363
access 13728 335
international 13661 366
Концепт ЧастотаКоличество тектстов,
political 12396 314
management 12110 352
financial 11648 365
society 10583 304
children 10370 264
program 9950 307
employment 9900 323
urban 9277 281
capacity 9177 352
groups 9107 331
central 9065 345
activities 9012 360
community 8993 329
institutions 8935 352
reduction 8928 323
need 8874 357
civil 8773 307
regional 8750 334
policies 8563 352
project 8477 340
Концепт ЧастотаКоличество тектстов,
indicators 8157 300
needs 8079 354
rates 7971 327
gender 7954 260
gdp 7817 285
households 7616 261
index 7604 245
projects 7414 340
youth 6694 204
governments 6555 349
hdi 5309 148
prsp 5286 139
action 5252 324
corruption 3901 197
equity 3750 270
compared 3749 320
fund 3747 335
inequality 3745 212
….
Общие статистические характеристики текстовОбщие статистические характеристики текстовнекоторые результаты анализанекоторые результаты анализа
http://soc.hse.ru/structanalysis/
11
0
5000
10000
15000
20000
25000
30000
35000
pove
rty
gove
rnme
nt socia
l
natio
nal
econ
omic
secto
r
coun
tries
publi
c
wome
n bank
rura
l
poor
local
state
level
incom
e
priva
te
reso
urce
s
acce
ss
inter
natio
nal
politic
al
mana
geme
nt
finan
cial
socie
tych
ildre
n
prog
ram
emplo
ymen
t
urba
n
capa
city
grou
ps
centr
al
activ
ities
comm
unity
institu
tions
redu
ction ne
ed civil
regio
nal
polic
ies
proje
ct
indica
tors
need
s
rates
gend
er gdp
hous
ehold
s index
proje
cts youth
gove
rnme
nts
hdi
prsp
actio
nco
rrupti
on equit
y
comp
ared fun
d
inequ
ality
0
50
100
150
200
250
300
350
400
pove
rty
gove
rnme
nt socia
l
natio
nal
econ
omic
secto
r
coun
tries
publi
c
wome
n bank
rura
l
poor
local
state
level
incom
e
priva
te
reso
urce
s
acce
ss
inter
natio
nal
politic
al
mana
geme
nt
finan
cial
socie
ty
child
ren
prog
ram
emplo
ymen
t
urba
n
capa
city
grou
ps
centr
al
activ
ities
comm
unity
institu
tions
redu
ction ne
ed civil
regio
nal
polic
ies
proje
ct
indica
tors
need
s
rates
gend
er gdp
hous
ehold
s index
proje
cts youth
gove
rnme
nts
hdi
prsp
actio
n
corru
ption equit
y
comp
ared fun
d
inequ
ality
число слов в корпусе текстов
количество текстов, в которых встречаются слова
зона равномерного распределения слов
по текстам
зона неравномерного распределения
содержательных слов по текстам
http://soc.hse.ru/structanalysis/
12
Группировка речевых маркеров*Группировка речевых маркеров*методом многомерного шкалированияметодом многомерного шкалирования
* по всем 369 текстам
Многомерный статистический анализ показывает:Речевые маркеры группируются неравномерно по корпусу текстов - по каким-то содержательным законам, которые необходимо понять в исследовании
ядро отчетов - индикаторы
http://soc.hse.ru/structanalysis/
13
Группировка текстов*Группировка текстов*методом многомерного шкалированияметодом многомерного шкалирования
* по аннотациям отчетов по 300 самых часто употребляемых слов
аннотации отчетов
группы аннотаций
оси группировок
аннотаций
Многомерный статистический анализ показывает:аннотации отчетов группируются по определенным закономерностям т нуждаются в дальнейшем исследовании
http://soc.hse.ru/structanalysis/
14
Связи концепта «неравенство»*Связи концепта «неравенство»*методом корреляций Пирсонаметодом корреляций Пирсона
* по аннотациям отчетов
inequalitygrowth
income
0,53
access
0,52
policy
0,51
poor
0,5needs
0,48
services0,47
ensure
0,46
0,71
economy
0,46
government
0,39…
capacity 0,68
…
…
levels0,60
…
health 0,61
0,580,60
Можно выстроить цепочки статистических связей между концептами – по принципу кольцевых уровней
2 уровень
1 уровень
http://soc.hse.ru/structanalysis/
15
Выявление групп речевых маркеровВыявление групп речевых маркеров
Неизменяемая часть слова
Речевой маркер
depriv Deprivation, deprivations, deprive, deprived, deprives, depriving
differen Difference, differences, different, differential, differentially, differentials, differentiation, differently, differing, differs
discriminat Discriminate, discriminated, discriminates, discriminating, discrimination, discriminative, discriminatorily, discriminatory
equal Equal, equaled, equaling, equalisation, equalise, equalities, equality, equalization, equalize, equalized, equalizer, equalizing, equalled, equalling, equally, equals
equal Inequal, inequalities, inequality, inequeality
justi Justice, justices, justifiable, justifiably, justification, justifications, justified, justifies, justify, justifying
…. ….
некоторые результаты анализанекоторые результаты анализа
На основе частотного анализа всему массиву текстов (369) были выделены 315 содержательных речевых маркеров, характеризующих неравенство:
http://soc.hse.ru/structanalysis/
16
Для анализа аннотаций была выбрана страна Египет, которую представляли 9 текстов. Они представляли разные уровни описания неравенства в стране, способов его преодоления и ожидаемых результатов
3 3 уровня неравенствауровня неравенства выражается речевыми маркерамивыражается речевыми маркерами
Между социальными группами Между социальными группами (в том числе молодежи)(в том числе молодежи)
participation allows all social groups, particularly the poor, to take part in the decision-making processes, all social groups can express their needs and problems, socioeconomic and political balance between different social groups, express their needs and interests? human development and the reduction of inequalities
Между локальными Между локальными сообществами и регионами сообществами и регионами ЕгиптаЕгипта
Decentralization, implicit local “social contracts” between authorities and citizens, helping to deepen and spread a culture of democracy, local communities’ participation in decision-making, solve the pressing problems of poverty and inequality, social inequalities between governorates, regional disparities
Экономические отрасли Экономические отрасли Египта и остальных стран (в Египта и остальных стран (в процессе глобализации)процессе глобализации)
the liberalization of the economic regime, partnerships between multiple government and community agencies, civil society, at the national and subnational levels, social contact between the state and the private sector, economic and political activities and to decision making process,
некоторые результаты анализанекоторые результаты анализаВыявление групп речевых маркеров (Египет)Выявление групп речевых маркеров (Египет)
Эти содержательные высказывания могут быть представлены более дробно, с выделением речевых маркеров (см. следующий слайд)
http://soc.hse.ru/structanalysis/
17
Сектор - Сектор - государственное государственное управлениеуправление
Слова-посредники, Слова-посредники, обеспечивающие переход обеспечивающие переход между уровнямимежду уровнями
Сектор – отраслевое Сектор – отраслевое консультированиеконсультирование
Сектор - неравенство Сектор - неравенство социальных групп, социальных групп, региональные и региональные и молодежьмолодежь
modern modern democracydemocracy
decision-making decision-making processes processes
decentralizationdecentralization
nnew “social ew “social contracts” contracts”
local levellocal level
local local communitiescommunities
decentralized planningdecentralized planning
express their needs express their needs and interestsand interests
needs and problemsneeds and problems
local development projectslocal development projects
regionally regionally balanced balanced developmentdevelopment
civil society civil society highly centralizedhighly centralized
the liberalization of the liberalization of the economic regimethe economic regime
economic and economic and political activitiespolitical activities
social inequalities social inequalities
markets, health, markets, health, education and education and employmentemployment
globalizationglobalization
social capital social capital
human capital human capital
information led information led globalizationglobalization
human development human development index (BHDI) index (BHDI)
Financial Sector Financial Sector Assessment Program Assessment Program (FSAP). (FSAP).
Financial Sector Financial Sector Reform and Reform and Strengthening (FIRST)Strengthening (FIRST)
financial restructuring o f financial restructuring o f state-owned banksstate-owned banks
young men and women young men and women between the ages of 18 to 29 between the ages of 18 to 29 years years
fragile understanding fragile understanding of citizenship and its of citizenship and its responsibilitiesresponsibilities
некоторые результаты анализанекоторые результаты анализаВыявление групп речевых маркеров (Египет)Выявление групп речевых маркеров (Египет)
http://soc.hse.ru/structanalysis/
18
Неравенство Проявление неравенства
Способы преодоления неравенства
Ожидаемый результат
преодоления неравенства
Индикаторы, программы
social groups
between governorates
regional disparities
inequality within countries
youth
poverty
highly centralized
as unemployment, poverty, Income distribution, and the level of living
socially negative consequences of adjustment problems of human development
social inequalities
Changes in inequality
lower wages
low levels of productivity
welfare
dependency on family and state
unemployment
Decentralization, decentralized planning
implicit local “social contracts”
local level
participation in decision-making
express their needs and problems
express their needs and interests
local development
liberalization of the economic regime
new social contract
social contact between the state and the private sector
information led globalization
trade openness
modernization plan
communication among young people, the Government and civil society
regionally balanced
civil society
multiple government and community agencies
globalization
establish free trade areas
modern democracy
human capital
social capital
average per capita income
human development index (BHDI)
economic growth (EG)
human development (HD)
Financial Sector Assessment Program (FSAP)
Financial Sector Reform and Strengthening (FIRST)
Financial Sector Development Policy Loan (DPL)
некоторые результаты анализанекоторые результаты анализаВыявление групп речевых маркеров (Египет)Выявление групп речевых маркеров (Египет)
Представление ключевой схемы (см. слайд 3) в виде понятий и речевых маркеров
http://soc.hse.ru/structanalysis/
19
Сектор – государственное управление (Египет)*Сектор – государственное управление (Египет)*
* построена в программах ORA, Automap
cтруктура концептов по аннотациямcтруктура концептов по аннотациям
** размер актора и сила связи соответствует частоте
Концепт «неравенство» находится на
периферии семантической сети
В центре сети находятся концепты децентрализация, развитие, местное, правительство, Египет
http://soc.hse.ru/structanalysis/
20
Сектор – государственное управление (Египет)*Сектор – государственное управление (Египет)*
cтруктура концептов по аннотациямcтруктура концептов по аннотациям
Подробно рассмотрим окружение термина «неравентство» в семантической сети
* Egypt Human Development Report 2004, Choosing Decentralization for Good Governance
http://soc.hse.ru/structanalysis/
21
Сектор – государственное управление (Египет)*Сектор – государственное управление (Египет)*
cтруктура концептов по аннотациямcтруктура концептов по аннотациям
Семантическая цепочка вокруг концепта «неравенство»
left3 left2 left1 left0 concept right0 right1 right2 right3
inequality finally is clear
decentralization
inequality finally is clear
decentralization
inequality finally is clear
decentralization
inequality finally is cleardecentralization
inequality finally is clear
decentralization
* Egypt Human Development Report 2004, Choosing Decentralization for Good Governance
http://soc.hse.ru/structanalysis/
22
Сектор – государственное управление (Египет)*Сектор – государственное управление (Египет)*
cтруктура концептов по аннотациямcтруктура концептов по аннотациям
* EGYPT, HUMAN DEVELOPMENT REPORT 2000/2001
«неравенство»
http://soc.hse.ru/structanalysis/
23
Сектор – государственное управление (Египет)*Сектор – государственное управление (Египет)*
cтруктура концептов по аннотациямcтруктура концептов по аннотациям
* EGYPT, HUMAN DEVELOPMENT REPORT 2000/2001
Семантическая цепочка вокруг концепта «неравенство»left3 left2 left1 left0 concept right0 right1 right2 right3
openness should reduce inequality between
openness should reduce inequality between
inequality across countries
inequality across countries
inequality within countries
inequality within countries
openness changes inequality
openness changes inequality
changes inequality will very much
changes inequality will very much
foster inequality labor mobility across
foster inequality labor mobility across
foster inequality labor mobility across
foster inequality labor mobility across
foster inequality labor mobility across
http://soc.hse.ru/structanalysis/
24
Промежуточные выводыПромежуточные выводы
•Концепт «неравенство» зачастую находится на периферии семантической структуры текста и его связи весьма слабы.
•Необходимо провести предварительный содержательно-концептуальный анализ текстов, и группировать их по уровню анализа, целям текстов и центральным концептам. А уже потом анализировать местоположение термина «неравенство» в структуре других концептов.
•Речевые маркеры группируются неравномерно по корпусу текстов - по каким-то содержательным законам, которые необходимо понять в исследовании.
•Ядро выводов о неравенстве в тех или иных странах составляют международные индексы и другие индикаторы.
•Можно выстроить структуру связей между концептами (в том числе и «неравенством») как по семантическим, так и по статистическим основаниям.
•Можно выявить основные факторы, влияющие на группировку отчетов (как семантические, так и другие причины).