View
811
Download
0
Category
Preview:
DESCRIPTION
Análisis de la Comunidad Científica Nacional en Ciencias de la Computación - Memoria de Título para optar a Ingeniero Civil Informático en la Universidad de Concepción, Chile. Nota máxima.
Citation preview
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Jaime A. Terán Moya
Prof. Patrocinante: Sra. Andrea Rodríguez T.
Agosto, 2007
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Contenidos
• Descripción General y Objetivos
• Métricas e Indicadores Analizados
• Fuentes de Información e Integración
• Análisis de Datos
• Conclusiones y Trabajo Futuro
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Descripción General y Objetivos
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Descripción General
• ¿Ciencias de la Computación?
• Comunidades como Redes Sociales
• ¿Por qué es importante evaluar?
• ¿Cómo hacerlo?
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Objetivos
• Definición e incorporación de información a un modelo de datos.
• Análisis y comparación de métricas.
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Redes Complejas
• Alto número de unidades dinámicas e interconectadas
• Topología Característica
• Small World Networks
• Scale Free Networks
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Contenidos
✓ Descripción General y Objetivos
• Métricas e Indicadores Analizados
• Fuentes de Información e Integración
• Análisis de Datos
• Conclusiones y Trabajo Futuro
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Métricas e Indicadores Analizados
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Dos Perspectivas
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Publicaciones
• cito a, citado por
• Temporalidad
• Medios de Publicación
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Publicaciones 2
• Referencias/Publicaciones
• H-Index
• Número de publicaciones
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Co-Autoría
• Caracterización topológica de la red
• Centralidad de nodos en la red
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Co-Autoría 2
• Topología
• Distribución de Grados de la red
• Presencia y tamaño de un componente gigante
• Ruta mínima promedio
• Coeficiente de clustering
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Co-Autoría 3
• Centralidad
• Número de Co-autores
• Cercanía (closeness)
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Co-Autoría 4
• Centralidad
• Interconexión (betweenness)
• PageRank
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Contenidos
✓ Descripción General y Objetivos
✓ Métricas e Indicadores Analizados
• Fuentes de Información e Integración
• Análisis de Datos
• Conclusiones y Trabajo Futuro
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Fuentes de Información e Integración
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
DBLP
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
DBLP
Ventajas:
• XML (390+MiB) + DTD
• Clasificación de documentos
• Información por documento
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
DBLP
Problemas:
• Referencias cruzadas
• Baja capacidad de ingreso
• Sesgo
• Identificación de personas
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Google Scholar
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Google Scholar
Ventajas:
• Resultados ordenados por relevancia
• Número de citas actualizado
• Listado ‘citado por’
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Google Scholar
Problemas:
• No API o XML
• Resultados no 100% fiables
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Web of Science
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Web of Science
Ventajas:
• Acceso vía Web Services
• Búsqueda exacta según diferentes criterios
• Relaciones ‘cita a’ y ‘citado por’ entre documentos indexados
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Web of Science
Problemas:
• Pobre en material relativo a Ciencias de la Computación
• Acceso restringido
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Modelo de Datos
idtipo_fkjournal_fktituloañodblp_keycitas_gscitas_wos
Publicación
idpublicacion_fkautor_fkposicion
Publicación_autor
idnombre
Autor
idnombre1nombre2apellido1apellido2institucion_fkdepartamento_fk
Autor_fondecyt
autor_idautor_fondecyt_fk
Autor_dblp_fondecyt
idnombrepais
Institución
idtitulotipo
Revista/Conf
idnombre
Departamento
idinstitucion_fkdepartamento_fk
Institucion_Depto
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
toDB()
¿Existe?
Rescatar ID PUBInsertar
Rescatar ID PUB
SINO
¿Autor en
cola?
¿Existe?
Rescatar ID AUTInsertar
SINO
Rescatar ID AUT
NO SI
Relacionar ID
PUB + ID AUT
¿Existe
Journ/Conf?
Rescatar ID
JOUR/CONFInsertar
Rescatar ID
JOUR/CONF
SINO
Relacionar ID
PUB + ID JOUR/
CONF
fin
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Modelo de Datos
idtipo_fkjournal_fktituloañodblp_keycitas_gscitas_wos
Publicación
idpublicacion_fkautor_fkposicion
Publicación_autor
idnombre
Autor
idnombre1nombre2apellido1apellido2institucion_fkdepartamento_fk
Autor_fondecyt
autor_idautor_fondecyt_fk
Autor_dblp_fondecyt
idnombrepais
Institución
idtitulotipo
Revista/Conf
idnombre
Departamento
idinstitucion_fkdepartamento_fk
Institucion_Depto
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Frontend PHP
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Modelo de Datos
idtipo_fkjournal_fktituloañodblp_keycitas_gscitas_wos
Publicación
idpublicacion_fkautor_fkposicion
Publicación_autor
idnombre
Autor
idnombre1nombre2apellido1apellido2institucion_fkdepartamento_fk
Autor_fondecyt
autor_idautor_fondecyt_fk
Autor_dblp_fondecyt
idnombrepais
Institución
idtitulotipo
Revista/Conf
idnombre
Departamento
idinstitucion_fkdepartamento_fk
Institucion_Depto
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Citas Web of Science
DB
XML
Publicaciones
¿Publicación
en cola?
NO
Título, Año
searchRetrieve ¿datos?
SI
ut
citingArticles
inicio
fin
SI
¿datos?
SI
NO
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
277/834
33,2 %
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Citas Google Scholar
DB
¿Publicación
en cola?
Construcción
URL
¿citas?
actualizar
inicio
fin
Publicaciones
nacionales y
autores
cURL
NO
SI
SI
NO
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Google Scholar v/s Web of Science
Comparando las Top 10:
• Top 10 WoS tienen datos en GS
• 6 previas al 2000 en WoS, 2 en GS
Sin embargo:
• WoS no considera auto-citas
• WoS sólo considera datos indexados
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Problemas
• Incompletitud y accesibilidad de relaciones
• Tamaño del grafo
• Nombres
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Contenidos
✓ Descripción General y Objetivos
✓ Métricas e Indicadores Analizados
✓ Fuentes de Información e Integración
• Análisis de Datos
• Conclusiones y Trabajo Futuro
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Análisis de Datos
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Referencias
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Métricas
• Número de Publicaciones
• H-Index en base a los datos de GS
• H-Index en base a los datos de WoS
• Número de co-autores
• Citas promedio en base a GS y el número de publicaciones
• Citas promedio en base a WoS y el número de publicaciones
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Ranking & Comparación
Rank #Pubs 1
Rank Co-A 0,791429882 1
Rank h-GS 0,889590105 0,674904654 1
Rank h-WoS 0,784187662 0,623087252 0,803371338 1
Rank avgGS 0,55462994 0,406154185 0,796117283 0,649332508 1
Rank avgWoS 0,531160828 0,391395307 0,599777774 0,874112818 0,642437539 1
Rank #Pubs Rank Co-A Rank h-GS Rank h-WoS Rank avgGS Rank avgWoS
Relación entre h-index y número de publicaciones
0
10
20
30
40
50
60
70
80
0 10 20 30 40 50 60 70 80
#Publicaciones por autor
h-i
nd
ex (
GS
)
Relación entre h-index según GS y WoS
0
10
20
30
40
50
60
70
0 10 20 30 40 50 60 70 80
h-index (GS)
h-i
nd
ex (
Wo
S)
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Publicaciones por autor
Publicaciones por autor
0
2
4
6
8
10
12
1 8 15 22 29 36 43 50 57 64 71 78 85 92 99 106 113 120 127 134 141 148
Publicaciones
Au
tore
s
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
¿Dónde publican los autores nacionales?
5
610
11
13
18
15
26
18
33
25
36
31
40
37
44
41
50
45
56
0
20
40
60
80
100
120
Top 10 Top 20 Top 30 Top 40 Top 50 Top 60 Top 70 Top 80 Top 90 Top 100
¿Dónde se publican los artículos?
En ConferenciaEn Journal
s
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
¿Dónde publican los autores nacionales?
45
5680
121
109
192
136
265
157
344
182
419
202
499
221
580
228
604
0
100
200
300
400
500
600
700
800
900
Top 100 Top 200 Top 300 Top 400 Top 500 Top 600 Top 700 Top 800 Top 900
¿Dónde se publican los artículos?
En ConferenciaEn Journal
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
27% Revistas73% Actas de Conferencias
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Evolución Temporal
0
20
40
60
80
100
120
140
2006
*20
0520
0420
0320
0220
0120
0019
9919
9819
9719
9619
9519
9419
9319
9219
9119
90
1975
-198
9
#Pubs#en Revistas#en Conferencias
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Actas de mayor publicación nacional
0
5
10
15
20
25
30
35
40
SCCC
CRIWG
SPIRE
CPM
LA-WEB
LATIN
SAC
SPIRE/CRIWG
PODS
CIARP
Actas con mayor publicación nacional
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Revistas de mayor publicación nacional
0
2
4
6
8
10
12
14
16
Theo
r. C
om
put.
Sci
.
Inf.
Pro
cess
. Le
tt.
Alg
ori
thm
ica
J. D
iscr
ete
Alg
ori
thm
s
Act
a I
nf.
CoRR
BIT
Com
pute
rs &
OR
Patt
ern R
ecognitio
n
Patt
ern R
ecognitio
nLe
tter
s
Revistas con mayor publicación nacional
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Revistas/Actas de mejor rendimiento según GS
0
5
10
15
20
25
30
35
40
45
50
POD
S
CoR
R
CPM C
P
Alg
ori
thm
ica
Inf.
Pro
cess
.Le
tt
SPIR
E/C
RIW
G
SAC
J. D
iscr
ete
Alg
ori
thm
s
Theo
r. C
om
put.
Sci
.
Revistas / Actas con mayor tasa de citas por publicación según GS
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Revistas/Actas de mejor rendimiento según WoS
0
1
2
3
4
5
6
CoR
R
POD
S
Act
a In
f.
CPM
Theo
r. C
omput.
Sci
. SW
AT
Alg
ori
thm
ica
Inf.
Pro
cess
.Le
tt
CP
SPI
RE/C
RIW
G
Revistas / Actas con mayor tasa de citas por publicación según WoS
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Investigadores por Institución
Investigadores por Institución
3%
21%
1%
30%1%
17%
6%
1%3%
14%
3%
EMPRESA
PUC
PUCV
UCHILE
UCN
UDEC
UFRO
UMAG
USACH
UTFSM
UVALPO
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Publicaciones por Institución
Publicaciones por Institución
1% 10%0%
59%
0%
9%
1%2%1%
15%2%
EMPRESA
PUC
PUCV
UCHILE
UCN
UDEC
UFRO
UMAG
USACH
UTFSM
UVALPO
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Co-Autoría
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Co-Autores por componentes
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Distribución de Grados
Distribución de grados
0
50
100
150
200
250
300
350
400
450
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Grado
Nú
mero
de n
od
os
€
y = 256,69x−2,004
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Distribución de Pesos
Distribución de pesos
0
100
200
300
400
500
600
0..1
1..2
2..3
3..4
4..5
5..6
6..7
7..8
8..9
9..10
10..11
11..12
12..13
13..14
14..15
15..16
16..17
Rango
Fre
cuen
cia
€
y = 487,44x−2,1123
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Indicadores Topológicos
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Componente Gigante
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Rankings
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
PageRank
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Contenidos
✓ Descripción General y Objetivos
✓ Métricas e Indicadores Analizados
✓ Fuentes de Información e Integración
✓ Análisis de Datos
• Conclusiones y Trabajo Futuro
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Conclusiones y Trabajo Futuro
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Conclusiones
• Estado del arte
• Interpretación de métricas
• Caracterización de la red
• Co-Autoría de Primer Grado
• Herramientas disponibles
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Trabajo Futuro
• Incorporar áreas de trabajo por investigador
• Disponibilidad de datos vía XML
• Definir nuevas perspectivas de análisis
• Definir mecanismos de comparación de comunidades a nivel macro
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
¿Preguntas?
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
Jaime A. Terán Moya
Prof. Patrocinante: Sra. Andrea Rodríguez T.
Agosto, 2007
¡Gracias!
Recommended