Upload
marcelo-alves
View
619
Download
3
Embed Size (px)
Citation preview
COLETA DE
nas mídias sociais
Marcelo alves
COLETA DE
nas mídias sociais
instrutor
• Doutorando pelo PPGCOM/UFF;• Estuda comunicação política em rede;• Sócio-diretor da Vértice Inteligência;• Pesquisador do laboratório de mídia e democracia (LAMIDE/UFF), orientado por Afonso de Albuquerque;• Publica textos no blog www.marceloalves.org
N = 532 fan-pagesA = 8.654 arestas
Rede antipetista na eleição de 2014
COLETA DE
nas mídias sociais
c
Quais objetos ou temas de
pesquisa dos alunos para
coleta de dados?
COLETA DE
nas mídias sociais
O que você vai aprender
• O básico da concepção teórica da análise de redes;• Processos de coletas de dados relacionais;• Leitura da documentação da Graph API do Facebook• Métodos de construções de queries;• Funcionamento e prática com Facepager;• Extrair dados das pesquisas dos alunos;• Tratamento e manipulação de dados relacionais;• Importar dados no Gephi.
COLETA DE
nas mídias sociais
c
CONCEITOS TEÓRICOS GERAIS
(prometo ser breve)
COLETA DE
nas mídias sociais
Lógicas da comunicação política em massa e em rede - Klinger e Svensson (2014)
COLETA DE
nas mídias sociais
Lógicas da comunicação política em massa e em rede - Klinger e Svensson (2014)
• Lógicas de rede não estão tomando o lugar da lógica de massa;• As plataformas de mídias sociais seguem outras regras do jogo;• A mídia de massa e o conteúdo jornalístico continuam sendo uma das principais fontes de informação;• As duas lógicas não são estáticas, mas estão em evolução
COLETA DE
nas mídias sociais
Sistemas midiáticos híbridos – Chadwick (2013)
• “O sistema midiático híbrido é baseado em conflito e cooperação entre lógicas novas e antigas; mas também possui considerável grau de interdependência entre estas lógicas” (Chadwick, 2013, p. 207)• Convergência midiática – ambos os sistemas estão entrelaçados • Partidos, imprensa e movimentos sociais tradicionais estão se adaptando às lógicas de rede
“Conteúdo nas plataformas de mídias sociais nem sempre é gerado pelo usuário, mas frequentemente envolve referências aos meios de massa. A mídia tradicional também busca aprender distribuições
virais como uma base de um novo modelo de negócios. Usuários de mídia diversificaram suas dietas noticiosas e começam a navegar em sistemas midiáticos híbridos. No entanto, a sobreposição não
torna as lógicas midiáticas indistinguíveis, porque são modus operandi muitos distintos. É tarefa dos estudos empíricos distinguir e medir as lógicas de massa e de rede em casos específicos” (Klinger e
Svensson, 2014, p. 12).
COLETA DE
nas mídias sociais
Repertórios digitais em redes e hibridismo organizacional (Chadwick, 2007)
Duas tendências paralelas 1) Organizações políticas tradicionais estão adotando e modificando seletivamente características de movimentos sociais;Quatro repertórios principais: (a) mobilizando formas online de ação dos cidadãos; (b) articulando ligações entre diferentes grupos; fundindo discurso políticos e subculturais e (d) aproveitando-se de redes sedimentárias.
“Há sinais crescentes de que organizações tradicionais, mais hierárquicas, menos inovadoras –como grupos de interesse e partidos – estão começando a se adaptar e adotar repertórios digitais em
rede” (Chadwick, 2007, p. 286)
2) Novas formas organizacionais que só podem existir na internet estão surgindo.“Organizações ainda mais radicais estão surgindo, como o MoveOn, que mistura repertórios ou
rapidamente troca de um conjunto de ações para outras. Quando se trata de ação coletiva potencializada pela internet, a imitação é parte da inovação. O conceito que melhor da conta deste
resultado é a hibridez organizacional”
COLETA DE
nas mídias sociais
O ciclo de informação política – Chadwick (2011)
Ciclo noticioso = período do dia previsível no qual se produzem as notícias, o tempo para selecionar, apurar, escrever, editar, compilar e apresentar material jornalístico. • Fenômeno explorado pelos autores de sociologia do jornalismo e da comunicação sobre os ciclos produtivos das redações e a noticiabilidade• Construção da notícia é um processo rigidamente controlado e envolve negociações entre a elite política e midiática
Ciclo de informação política = bricolagem entre lógicas de massa e de rede na produção de informação política.• Maior número e maior diversidade de atores• Estruturas temporais mais rápidas e complexas• Inclui participantes que tangenciam as elites políticas e midiáticas• Diversificação das fontes de informação•Deslocamento do jornalismo, ou do jornalismo liberal, como balizador da produção de informação.
COLETA DE
nas mídias sociais
O que temos até aqui?
• Uma série de mudanças tecnológicas, sociais e organizacionais na comunicação política.• As elites perdem a exclusividade do acesso e do controle de meios de criação de informação.• Diversos repertórios de expressão política surgem para além das burocracias partidárias e jornalísticas.• Tudo isso está em permanente movimento e relacionamento.
A delimitação dos corpus de pesquisa em meios de massa é bastante simples. As notícias publicadas no jornal X ou as peças publicitárias televisivas durante o período eleitoral. O objeto
é a cobertura da imprensa ou propagandas políticas oficiais.Frequentemente, os estudos mais recentes escolhem um ator e dedicam-se apenas a ele, por exemplo, a produção da Mídia Ninja. Porém, essa abordagem perde as dinâmicas relacionais
criadas em torno daquele agente e todas as negociações com os demais envolvidos.
COLETA DE
nas mídias sociais
c
Contudo, num ambiente midiático híbrido, com surgimento de blogs,
lideranças de opinião nativas digitais e uma infinidade de outros
fenômenos, Como delimitar o corpus de
pesquisa?
COLETA DE
nas mídias sociais
Esfera pública em rede (Benkler et al. 2013, p. 04) – conceito provisório
• A esfera pública em rede é uma arena alternativa para o discurso e debate público, uma arena que é menos dominada pelas grandes organizações midiáticas, menos sujeita ao controle do governo e mais aberta a participação ampla.
• A esfera pública em rede é manifesta como um ecossistema complexo de canais de comunicação que coletivamente oferecem um ambiente que conduz a expressão política e a criação de diversas formas organizacionais.
• Uma série de estudos já evidenciou que elites políticas e midiáticas continuam dominando o centro das esferas públicas em rede (Soon e Cho, 2011; Asserhofer e Maireder, 2012; Kocks, 2016 . No entanto, aceitam a abertura para ações de indivíduos não organizados.
COLETA DE
nas mídias sociais
O que são redes sociais? (WASSERMAN e FAUST, 1994)
• A diferença fundamental entre análise de redes e análise estatística é a inclusão de conceitos e de informações sobre os relacionamentos entre as unidades de análise do estudo.• Em vez de focar nos atributos das unidades individualmente, estuda as características como emergentes do processo de relacionamento social.• O conceito de redes enfatiza que cada indivíduo tem ligações com outros indivíduos;• As Redes Sociais referem-se a um conjunto de atores e as relações entre eles;• Modelar a estrutura e buscar compreender sua influência no grupo
COLETA DE
nas mídias sociais
Componentes básicos da análise de redes
cator
claços
cclusters
crede
Componente individual
Ligações entre atores
Subconjuntos identificados pela densidade
Totalidade de atores e ligações da amostra
COLETA DE
nas mídias sociais
c
O que são dados relacionais?Duas informações distintas
Atributos dos atoresArestas de saída e chegada
COLETA DE
nas mídias sociais
Métodos digitais – Richard Rogers (2004)
• A web como fonte de dados;• Virada computacional nas ciências sociais;• Rastros gerados espontaneamente• Análises de hiperlinks• Blogosferas políticas • Repercussão no Twitter• Comunidades no Facebook
COLETA DE
nas mídias sociais
Dois tipo s de redes na internet (recuero, 2009)
• Redes associativas ou de filiação – possuem ligações mais estáveis, duradouras. Gera o efeito de filiação a um grupo. Exemplo: seguir páginas e fazer amizades;
• Redes emergentes – são compostas por ligações circunstanciais, criadas a partir de ações comunicativas ad hoc. Exemplo: menções, retuítes, compartilhamentos.
COLETA DE
nas mídias sociais
c
O que são APIs?Application
programming interface
COLETA DE
nas mídias sociais
Políticas de cessão de dados da facebook graph api
• As políticas de cessão de dados de cada plataforma são documentadas nas APIs;• APIs são tanto documentos técnicos, quanto reflexos das diretrizes empresariais de fornecimento de dados;• APIs são modificadas frequentemente, de acordo com as necessidades e interesses mercadológicos das organizações;• As documentações mostram quais requisições são possíveis (queries), em qual volume (rate limit) e com quais parâmetros.
Versionamento das apis do facebook
COLETA DE
nas mídias sociais
Vamos praticar?
https://developers.facebook.com/tools/explorer/
COLETA DE
nas mídias sociais
COLETA DE
nas mídias sociais
Como construir uma query? Orientação a id
• {id} + fields = {campos}• Retorno em Javascript Object Notation (JSON)• JSON é exibido na tela e convertido para tabulação
• Construindo query no navegador• https://graph.facebook.com/v2.6/ + id / {requisição} ?access_token= {token de acesso}https://graph.facebook.com/v2.6/dilmarousseff/likes?access_token=EAACEdEose0cBAErGN0ycFbkfEzlhW8o0whxulUmELq3y0bZBVh0sxbNUtUvddkuF0vQmoz9zlUln9QG9oRypH75VEEI2HI39HlsN6rYA9vZCXWYvaVTkPRN585mUqS07AeCW9HHVOvo5wIiGDgfTtu8jNioAof51U4v1n5YQYZBr0tChVsQiblwFj6KOhkZD
Aplicativos acadêmicos
COLETA DE
nas mídias sociais
cQual ferramenta
utilizar?
COLETA DE
nas mídias sociais
Diferenças nas apis de facebook e twitter
COLETA DE
nas mídias sociais
Técnicas de amostragem em métodos digitais (rieder, 2012)
• População – volume completo de usuários e publicações de uma determinada plataforma.Geralmente, é adquirido a partir da compra do banco de dados da empresa. Estudo utilizandodados populacionais = (Freelon et al., 2016);• Amostra aleatória: forma mais utilizada para garantir representatividade dos dados digitais. Noentanto, como não se sabe a população, há uma série de problemas derivados;• Amostra por tópicos: queries por palavras-chave e hashtags. É o método mais comum no Twitter. Todavia, não funciona no Facebook desde a descontinuidade da Graph API 1.0 em 2015.• Amostrar por marcações: compilada a partir de marcadores geográficos ou linguísticos oferecidos pela API. • Amostra por atores: seleciona determinados canais para coleta de dados. Frequentemente utilizado para estudo de campanhas eleitorais, focando nos candidatos ou partidos. • Amostra por grafos: Examina relações entre uma série de agentes e faz seleções baseado no resultado. Minha dissertação e tese. • Amostra manual: utilizada para projetos qualitaitivos, geralmente são amostras de conveniência.
COLETA DE
nas mídias sociais
Adaptando os métodos para coleta relacional no Facebook (cf. BRUNS E BURGESS, 2014)
• A API do Facebook não permite a coleta de dados por palavras-chave ou por hashtags.Método mais utilizado no Twitter, esta é uma das principais razões porque o Facebook éplataforma pouco utilizada em pesquisas de métodos digitais.• No entanto, o Facebook é a plataforma mais utilizada pela elite político-midiática e peloscidadãos comuns. Não estudar o Facebook é ignorar a ferramenta de mídias sociais queconcentra maior público.• Assim, surge a questão, como realizar desenhos de pesquisa especificamente para oFacebook?• A estratégia mais comum é focar em poucos atores, como as fan-pages de candidatosdurante períodos eleitorais. Embora viável do ponto de vista metodológico, essa opçãoignora todas as dinâmicas relacionais que acontecem em torno daqueles candidatos.• É isso que pretendo captar com meus projetos.• Para tanto, aposto no método de amostragem por grafos e bola de neve.
COLETA DE
nas mídias sociais
Facepager - Till Keyling e jakob junger
• Ferramenta desenvolvida para a dissertação;• Código aberto;• Programando em Python 2.7;• Introduz boa parte dos conceitos de data mining, como query, datamunging, data storage, log de processos...• É uma interface para se comunicar com a API e fazer o trabalhopesado;• Alto grau de liberdade para os usuários operarem as requisições;• Funciona com Facebook e Twitter;
Vamos praticar?
retorno
metadados
Json key
Sistemaquery
COLETA DE
nas mídias sociais
Etapas do mapeamento de fan-pages (BRUNS, 2007; ADAM et al., 2015)
• Lista de nós-sementes;• Nós-sementes devem ser temáticos e homogêneos.• Bola de neve – crawling com 1 ou 2 graus de profundidade;• Limpeza do resultado;• Manipulação de dados – lista de nós e arestas;• Importação no Gephi;• Categorização dos atores
Como montar uma lista de sementes?
COLETA DE
nas mídias sociais
A função search
Notação: /search ? type= {user, page, event, group, place} & q={palavra+chave} & fields=
search?type=page&q=dilma+rousseff&fields=id,name,link,description,category
Fazer testes de acordo com as pesquisas dos alunos
COLETA DE
nas mídias sociais
A função user like
Notação: id ? fields = likes {aninhamento de parâmetros}
dilmarousseff?fields=likes{name, category, id, link, about}
Fazer testes de acordo com as pesquisas dos alunos
COLETA DE
nas mídias sociais
Documentação das fan-pages
Query<user>/likes?fields=name,username,about,talking_about_count,fan_count,category,link,bio,description,emails,location,new_like_count,start_info,website,id
JSON keysname
idusernamecategory
aboutbio
descriptionfan_count
talking_about_count
emails.0website
linklocation.city
location.statelocation.longitudelocation.latitude
COLETA DE
nas mídias sociais
cPrática de
mapeamento de fan-pages
COLETA DE
nas mídias sociais
TRATAMENTO DE DADOS
Filtros para limpeza de logs;Preparação das listas de nós e arestas
ArestasFunçao PROC (=PROC(B684;$A$3:$A$506;$E$3:$E$506)Criar source e target
Nós – Eliminar duplicatas
COLETA DE
nas mídias sociais
Meso level - a Documentação das publicações
Querycomments.limit(1).summary(true),likes.limit(1).summary(true),picture,story,from,to,description,source,link,created_time,message,type,id,status_type,name,story_tags,caption, reactions.limit(1).summary(true), shares
namefrom.namefrom.categoryfrom.idto.data.*.idto.data.*.namestory_tagssharedposts.dataposts.datastorylinkcaption
message_tagsmessagestatus_typetypeshares.countcreated_timeupdated_timereactions.summary.total_countlikes.summary.total_countcomments.summary.total_countshares.count
COLETA DE
nas mídias sociais
Fluxo de comuinicação entre as páginas
EndpointsLinks – referentes aos links compartilhados nas publicações. Sóregistrando quando a postagem é de tipo LINK;Caption – referente ao domónio do link;Message_tags – perfis marcados na mensagem (similar a @mention);Status_type – identificar compartilhamentos e links;Story_tags – fluxo de compartilhamentoTo – Perfis mencionadosWith_tags – Com quem estou.
COLETA DE
nas mídias sociais
c
Prática de fluxos de
publicações
COLETA DE
nas mídias sociais
ReferênciasADAM, Silke et al. Identifying and Analyzing Hyperlink Issue Networks, In: VOWE ,Gerhard, HENN, Philipp.Political Communication in the Online World (Orgs), Routledge: New York, London, p. 233-247, 2015.ALVES, Marcelo. Coleta de dados nas mídias sociais. In: SILVA, Tarcízio; STABILE, Max (orgs.), Monitoramento ePesquisa emMídias Sociais: metodologias, aplicações e inovações, Uva Limão, 2016.BENKLER, Yochai. Political Freedom part 2: Emergence of the networked public sphere. The Wealth ofNetworks: How Social Production TransformsMarkets and Freedom, 2006.BRUNS, Axel. Methodologies for mapping the political blogosphere: An exploration using the IssueCrawlerresearch tool. First Monday, v. 12, n. 5, 2007.CHADWICK, Andrew. Digital network repertoires and organizational hybridity. Political Communication, v. 24, n.3, p. 283-301, 2007.CHADWICK, Andrew. The political information cycle in a hybrid news system: The British prime minister and the“Bullygate” affair. The International Journal of Press/Politics, v. 16, n. 1, p. 3-29, 2011.CHADWICK, Andrew. The hybrid media system: Politics and power. Oxford University Press, 2013.FREELON, Deen; MCILWAIN, Charlton D.; CLARK, Meredith D. Beyond the hashtags:# Ferguson,#Blacklivesmatter, and the online struggle for offline justice. 2016.KLINGER, Ulrike; SVENSSON, Jakob. The emergence of network media logic in political communication: Atheoretical approach. Newmedia & society, v. 17, n. 8, p. 1241-1257, 2015.RECUERO, Raquel. Redes sociais na internet. Sulina, 2009.RIEDER, Bernhard. The refraction chamber: Twitter as sphere and network. First Monday, v. 17, n. 11, 2012.ROGERS, Richard. Information politics on theWeb. MIT Press, 2004.WASSERMAN, Stanley; FAUST, Katherine. Social network analysis: Methods and applications. Cambridgeuniversity press, 1994.