Upload
dangthuy
View
220
Download
0
Embed Size (px)
Citation preview
Rota hipertextual baseada em tags:
Discussão de processos de produção e leitura como sistemas complexos
no contexto da Web Semântica
LUANA TEIXEIRA DE SOUZA CRUZ
BELO HORIZONTE, 2014
CENTRO FEDERAL DE EDUCAÇÃO TECNOLÓGICA DE MINAS GERAIS
LUANA TEIXEIRA DE SOUZA CRUZ
Rota hipertextual baseada em tags:
discussão de processos de produção e leitura como sistemas complexos
no contexto da Web Semântica
BELO HORIZONTE (MG)
2014
LUANA TEIXEIRA DE SOUZA CRUZ
Rota hipertextual baseada em tags:
discussão de processos de produção e leitura como sistemas complexos
no contexto da Web Semântica
Dissertação apresentada ao Programa de Pós-
Graduação Stricto Sensu em Estudos de
Linguagens (POSLING) do Centro Federal de
Educação Tecnológica de Minas Gerais
(CEFET-MG) como requisito parcial para a
obtenção do título de Mestre em Estudos de
Linguagens.
Área de concentração: Processos Discursivos e
Tecnologia
Orientador: Prof. Dr. Vicente Aguimar
Parreiras
BELO HORIZONTE (MG)
2014
LUANA TEIXEIRA DE SOUZA CRUZ
Rota hipertextual baseada em tags: discussão de processos de produção e leitura como
sistemas complexos no contexto da Web Semântica
Dissertação apresentada ao Programa de Pós-Graduação Stricto Sensu em Estudos de Linguagens
do Centro Federal de Educação Tecnológica de Minas Gerais - CEFET-MG, em 15 de outubro
de 2014, como requisito parcial para obtenção do título de Mestre em Estudos de Linguagens,
aprovada pela Banca Examinadora constituída pelos professores:
____________________________________________________
Prof. Dr. Vicente Aguimar Parreiras.- CEFET/MG – (Orientador)
____________________________________________________
Prof. Dr. Carlos Frederico de Brito D’Andréa (UFMG)
____________________________________________________
Profª. Drª. Ana Elisa Ribeiro (CEFET-MG)
____________________________________________________
Profª. Drª. Giani David Silva (CEFET-MG - suplente)
Dedico este trabalho aos meus pais, Neide e Teixeira,
responsáveis pela minha base sólida de educação; ao meu irmão, Léo, por
ser um exemplo profissional que me motiva a progredir, e ao meu noivo
(quase marido) Marcos, pela paciência nesses anos de estudos.
AGRADECIMENTOS
Aos amigos do Cefet-MG e Estado de Minas Rafael Passos e Emerson Campos, pela
parceria nos dois anos de estudos. Vocês são parte desta trajetória!
Ao amigo João Henrique do Vale Almeida pelas trocas de horários de trabalho e
disponibilidade para entrevista em um dos estudos de caso. Você é um bom companheiro!
A Deus, fonte de energia que mantém minha fé no trabalho. “Tu és, Senhor, o meu pastor;
por isso nada em minha vida faltará!”
A todos os colegas de sala do mestrado, com carinho especial a Michel Montandon, por
dividir o orientador, as angústias e saberes. Você serviu de espelho!
Ao professor Dr. Vicente Aguimar Parreiras – mais do que um orientador, um
incentivador. Você me fez acreditar e me motivou nesta caminhada!
Aos Diários Associados pelo apoio na pesquisa, permitindo acesso aos dados necessários
ao trabalho.
Ao meu noivo (quase marido) Marcos Queiroga, pelo amor constante. Você é minha
inspiração!
À minha família, por acreditar nos meus esforços e incentivar uma vida de estudos. Amo
amar vocês!
A todos os meus amigos, com carinho especial para Frederico Emediato, Maria Dulce
Crisóstomo, Gabriela Aguiar, Natália Luciana Soares, sempre prontos para me distrair nas horas
de descanso. Vocês são eternos!
Aos professores do mestrado, em especial Prof.ª Dr.ª Giani, David Silva, Prof.ª Dr.ª Ana
Maria Nápoles Villela, Prof. Dr. Rogério Barbosa da Silva, Prof. Dr. Renato Caixeta da Silva e
Prof. Dr. Flávio Luiz Teixeira de Sousa Boaventura, pelas contribuições valiosas na preparação
para a dissertação. Vocês são grandes mestres!
Aos pareceristas e membros da banca – Prof. Dr. Carlos D’Andréa e Dr.ª. Ana Elisa
Ferreira Ribeiro, que disseram coisas certas na hora certa. Vocês deram uma luz!
RESUMO
Esta pesquisa apresenta uma discussão sobre a rota hipertextual baseada em tags e sobre
processos de produção jornalística e de leitura no contexto da Web Semântica, sob a perspectiva
da Teoria da Complexidade. Esse tópico foi investigado com o objetivo de mapear a evolução
desses processos. Os objetivos específicos foram: (1) discutir como as tags mudaram as
estruturas de significação de conteúdos que circulam na rede, com a finalidade de inferir as
razões pelas quais as tags são responsáveis pela navegação nômade, pela colaboração em rede e
pela alteração de processos comunicativos; e (2) avaliar a adequação do uso de um modelo não
linear de comunicação em rede para compreender como a Web Semântica possibilita o
aproveitamento dos efeitos da rede pelas empresas de comunicação. A fundamentação teórica
deste trabalho tem como pilares as noções de complexidade e de Web Semântica, e de como eles
se relacionam com as tags quando operam como atratores na rota hipertextual da Web. O
conceito de folksonomia foi usado para articular as ideias de “tagueamento” e de classificação na
Web para abordagem dos processos de indexação e de organização popular na rede e das suas
influências nos processos de produção jornalística e de leitura na Web. Optei por desenvolver
uma pesquisa qualitativa baseada no paradigma construtivista na perspectiva do estudo de caso.
A intenção foi a de problematizar os modelos lineares de navegação na Web, disponibilizados
pelos produtores, que não correspondem às expectativas do leitor que tende a fazer uma
navegação nômade, própria dos sistemas complexos. A partir dessa problematização, buscaram-
se possibilidades de soluções na literatura e nos dois casos estudados que compuseram o corpus
da pesquisa formado pelo conjunto de estatísticas e observações da pesquisadora sobre as ações
dos jornalistas. O desenho metodológico da pesquisa consistiu-se de três etapas: (1) análise dos
aspectos de resultado de audiência pelo Google Analytics; (2) análise temporal de tags por meio
do Google Trends para discussão do aspecto linguístico do uso de etiquetagem na Web; e (3)
análise dos depoimentos dos jornalistas envolvidos nos dois casos investigados. As principais
contribuições desta pesquisa foram: um conceito mais “comunicacional” da Web Semântica e a
perspectiva do gerenciamento de tags como ferramenta de trabalho para produtores de conteúdo,
além da cadência de conceitos que ligam complexidade, semântica e folksonomia, neste caso
com aplicabilidade ao jornalismo baseado em tags, mas que pode servir como arcabouço teórico
para outras perspectivas da produção de conteúdo online.
Palavras-chave: Sistemas Complexos; Web Semântica; jornalismo baseado em tags;
leitura hipertextual nômade; folksonomia;
ABSTRACT
This research presents a discussion about hypertext route based on tags and about journalistic
production and reading processes in the context of the Semantic Web from the Complexity
Theory perspective. This topic has been investigated with the goal of mapping the evolution of
these processes advancing to the Semantic Web field. The specific objectives were: (1) discuss
how the tags have changed the structures of content signification on the web, in order to infer the
reasons why the tags are responsible for nomadic navigation, for collaborative networking and
for the changes in the communicative processes; (2) analyze how the tags have become key to
the constitution of globalized discussions in hypermedia environment and (3) evaluate the
suitability of using a nonlinear model of network communication to understand how the
Semantic Web allows the exploitation of network effects by communication companies. The
theoretical framework of this research has as its pillars the notions of complexity and Semantic
Web, and how they relate to the tags when they operate as attractors in the Web hypertext route.
The “Folksonomy” concept was used to articulate the ideas of "tagging" and of web
classification processes in order to approach the indexing and the popular organization in the
network and their influences in the process of news production and of reading in the web. Given
the characteristics of the type of research and in terms of the data that make up the corpus of this
research we opted to develop a qualitative research based on the constructivist paradigm in a
case study perspective. The intention was to discuss the linear models of Web surfing, offered by
producers that do not match the expectations of the reader who tends to make nomad navigation
peculiar of complex systems. From this questioning, we sought possibilities for solutions in the
literature and in the two cases studied that made up the research corpus formed by the set of
statistics and observations of the researcher about the journalists’ actions. The research
methodological design consisted of three steps: (1) analysis of aspects of outcome audience
through Google Analytics; (2) temporal analysis of tags through Google Trends for discussion of
the linguistic aspect of the use of tagging in the Web; and (3) analysis of interviews with the
journalists involved in the two cases investigated. I Evaluate that the major contributions of this
research were: a more "communicational" concept of the Semantic Web and the prospect of
managing tags as working tool for content producers, besides the rate of concepts linking
complexity, semantics and folksonomy, in this case with applicability to journalism based on
tags, but that can serve as a theoretical framework for other perspectives in the production of
online content.
Keywords: Complex Systems; Semantic Web; journalism based on tags; nomadic hypertext
reading; folksonomy
LISTA DE FIGURAS
FIGURA 1 - METÁFORA DO EFEITO DOMINÓ ........................................................................................................................... 32
FIGURA 2 – METÁFORA DA BOLA DE NEVE ............................................................................................................................. 32
FIGURA 3 – IMAGEM DE BARRET LYON .................................................................................................................................. 40
FIGURA 4 – DIAGRAMA EM NUVEM DO DBPEDIA (LINKING OPEN DATA) ..................................................................................... 40
FIGURA 5 – VÓRTICE ......................................................................................................................................................... 53
FIGURA 6 – VÓRTICE DE REDEMOINHO.................................................................................................................................. 53
FIGURA 7 – GOOGLE ANALYTICS .......................................................................................................................................... 86
FIGURA 8 – GOOGLE TRENDS COM TAG “PAPA” ...................................................................................................................... 88
FIGURA 9 –GALERIA DE FOTOS “INCÊNDIO EM SANTA MARIA” .................................................................................................. 95
FIGURA 10 – NÚMEROS INCÊNDIO EM SANTA MARIA .............................................................................................................. 98
FIGURA 11 – GOOGLE TRENDS - INTERESSE PELA TAG “SANTA MARIA” EM BUSCAS DO GOOGLE...................................................... 100
FIGURA 12 – MODELO DE HIERARQUIA MIELNICZUK E PALÁCIOS .............................................................................................. 105
FIGURA 13 – CAPA DO UAI EM JUNHO DE 2013, MESMO MODELO DE NOVEMBRO 2013 ............................................................. 106
FIGURA 14 –MATÉRIA “VÍDEO MOSTRA MOMENTO EM QUE CARRO DE ATOR PAUL WALKER FICA EM CHAMAS APÓS ACIDENTE” ........... 107
FIGURA 17 – NÚMEROS MORTE PAUL WALKER .................................................................................................................... 110
FIGURA 18 - GOOGLE TRENDS - INTERESSE PELA TAG “PAUL WALKER” EM BUSCAS DO GOOGLE ...................................................... 112
FIGURA 19 – ATRATOR DE LOREZ: MODELO PARA IDENTIDADE VISUAL ....................................................................................... 120
LISTA DE ESQUEMAS
ESQUEMA 1 – ORGANIZAÇÃO DA DISSERTAÇÃO....................................................................................................................... 26
ESQUEMA 2 – PROCESSO DE AUTO-ORGANIZAÇÃO .................................................................................................................. 37
ESQUEMA 3 – PROCESSO DE AUTO-ORGANIZAÇÃO NO FENÔMENO “INCÊNDIO EM SANTA MARIA” ................................................. 102
ESQUEMA 4 – PROCESSO DE AUTO-ORGANIZAÇÃO MORTE PAUL WALKER ................................................................................. 113
LISTA DE SIGLAS E ABREVIATURAS
WWW World Wide Web
JB Jornal do Brasil
HTTP Hyper Text Transfer Protocol
W3C World Wide Web Consortium
XML Extra Markup Language
RDF Resource Description Framework
IEML Information Economy Meta Language
RSS Rich Site Summary
URL Uniform Resource Locator
IVC Instituto Verificador de Circulação
SEO Search Engine Optimization
IP Internet Protocol
SUMÁRIO
1 APRESENTAÇÃO DA DISSERTAÇÃO ................................................................................................... 14
1.1 INTRODUÇÃO................................................................................................................................................ 14
1.2 CONTEXTUALIZAÇÃO ...................................................................................................................................... 17
1.3 JUSTIFICATIVA ............................................................................................................................................... 23
1.4 PROBLEMA DE PESQUISA ................................................................................................................................. 25
1.5 OBJETIVO GERAL ........................................................................................................................................... 25
1.5.1 Objetivos específicos ....................................................................................................................... 26
1.6 ORGANIZAÇÃO DESTE TRABALHO ...................................................................................................................... 26
2 COMPLEXIDADE E A WEB SEMÂNTICA ............................................................................................ 28
2.1 O TERMO COMPLEXIDADE E AS METÁFORAS ........................................................................................................ 28
2.2 ENTRE A ORDEM E O CAOS .............................................................................................................................. 35
2.3 A COMPLEXA ROTA HIPERTEXTUAL NA WEB ........................................................................................................ 37
2.4 WEB SEMÂNTICA: CARACTERÍSTICAS E FERRAMENTAS ........................................................................................... 42
2.5 GESTÃO DA INFORMAÇÃO E CONHECIMENTO ....................................................................................................... 46
2.5.1 O computador imitando a mente humana ...................................................................................... 50
2.6 ATRATORES .................................................................................................................................................. 52
3 FOLKSONOMIA ................................................................................................................................... 55
3.1 O TERMO FOLKSONOMIA: CUNHAGEM E DEFINIÇÃO ............................................................................................. 55
3.2 FOLKSONOMIA E SEMÂNTICA ........................................................................................................................... 59
3.3 NARRATIVAS TAGUEADAS ................................................................................................................................ 63
4 JORNALISMO BASEADO EM TAGS ...................................................................................................... 65
4.1 RUPTURAS E CONTINUÍSMOS ........................................................................................................................... 65
4.2 QUEM É ESSE LEITOR? .................................................................................................................................... 68
4.3 QUEM É ESSE JORNALISTA/PRODUTOR? ............................................................................................................. 70
4.4 AUDIÊNCIA .................................................................................................................................................. 73
4.5 BUSCADORES ............................................................................................................................................... 74
4.6 SEO PARA JORNALISMO .................................................................................................................................. 78
5 METODOLOGIA ................................................................................................................................. 81
5.1 MÉTODO ..................................................................................................................................................... 81
5.2 CONTEXTO DE PRODUÇÃO NO EM.COM.BR ...................................................................................................... 84
5.3 COLETAS NO GOOGLE ANALYTICS ...................................................................................................................... 85
5.4 COLETAS NO GOOGLE TRENDS ......................................................................................................................... 87
5.5 DEPOIMENTOS DOS JORNALISTAS ...................................................................................................................... 90
6 ESTUDOS DE CASOS ........................................................................................................................... 92
6.1 INCÊNDIO EM SANTA MARIA ........................................................................................................................... 92
6.1.1 Estatísticas do Google Analytics ...................................................................................................... 95
6.1.2 Google Trends como balizador dos termos “santa maria” .............................................................. 98
6.1.3 Análise de dados............................................................................................................................ 100
6.2 MORTE DE PAUL WALKER ............................................................................................................................. 103
6.2.1 Google Trends como balizador dos termos “paul walker”............................................................. 110
6.2.2 Análise de dados............................................................................................................................ 112
7 CONSIDERAÇÕES FINAIS ................................................................................................................. 114
7.1 CONCLUSÕES .............................................................................................................................................. 114
7.2 FINALIZANDO ............................................................................................................................................. 117
7.3 BASTIDORES ............................................................................................................................................... 118
8 REFERÊNCIAS BIBLIOGRÁFICAS .................................................................................................... 121
APÊNDICE A .......................................................................................................................................... 126
14
“O problema pode muito bem ser recoberto pelas soluções, nem por isso ele
deixa de subsistir na Ideia que o refere às suas condições e organiza a gênese
das próprias soluções. Sem esta Ideia as soluções não teriam sentido”
(DELEUZE, 2007, p. 57).
1 Apresentação da dissertação
A Ideia desta pesquisa surgiu nas andanças como jornalista e pesquisadora em um
caminho não muito longo, mas cheio de novidades: do projeto experimental no fim da graduação
sobre modelos de comunicação hipermidiáticos, cujo ponto final foi o início da “tal” Web
Semântica, à iniciação científica com projeto sobre produção colaborativa na Wikipédia, quando
o gosto pela pesquisa ficou acirrado. Da experiência contrastante como repórter de jornal
impresso, quando entendi o jornalismo diário, à rotina como repórter multimídia de portal de
notícias, quando entendi a diária do jornalismo.
Tudo isso está misturado ao convívio multidisciplinar com os colegas do mestrado em
Estudo de Linguagens, onde conversam pessoas de vários campos – Letras, Comunicação,
Biblioteconomia, Informática, engenharias e outros. As raízes no CEFET-MG como aluna do
curso técnico em Eletrônica, antes mesmo de iniciar o Jornalismo, também fazem parte da
origem. Na construção deste estudo, reúno os questionamentos que surgem na rotina do mercado
de trabalho com a possibilidade de respondê-los com pesquisa acadêmica. A dissertação traz
problemas fabricadores de Ideias, que, por usa vez, darão sentido às soluções.
1.1 Introdução
O jornalismo digital, a difusão das redes sociais e a hipermidiatização do relacionamento
entre empresas e consumidores fazem nascer uma nova era para a produção e leitura na Web.
Muito se discutiu sobre o formato da comunicação e da linguagem na cultura pautada pela lógica
de rede, principalmente na Internet, mas ainda há o que falar sobre as nuvens de informação, em
15
alguns momentos organizadas e, em outros, desorganizadas.
Os estudos sobre efeitos das novas tecnologias na comunicação servem como base para
passos futuros, nos quais o grande desafio é pensar as formas de interação na Web a partir de uma
estética do banco de dados, baseada em tags e remixada na rede. Segundo Moherdaui (2010),
uma tag é uma palavra (relevante) ou termo associado com uma informação – uma imagem, um
artigo, um vídeo – que a descreve e permite uma classificação da informação baseada nessa
etiquetagem. Quando se pensa na perspectiva da recepção, o viés para leitura na Web é de uma
navegação nômade, agenciada pelos usuários, cuja trilha é baseada em tags. A perspectiva da
produção também deve ser ancorada nesse nomadismo, por isso é preciso que os distribuidores de
conteúdo se acostumem com a ideia de gerenciar as tags.
Moherdaui (2010) considera que os produtores – os agentes comunicadores,
principalmente empresas de comunicação – ainda não entraram nesse circuito e continuam
fincados na teoria transmissionista1. Eles não exploram a potencialidade hipertextual da Web. Os
modelos de navegação disponibilizados pelos produtores apresentam estruturas lineares,
enquanto o usuário tende a fazer um caminho próprio pelos sistemas complexos. O que proponho
nesta pesquisa é mostrar que essa realidade está mudando e os produtores incorporaram, mesmo
que timidamente, estratégias de gerenciamento de tags na rotina, pois sabem que a Internet não é
um ambiente para receber e disponibilizar conteúdos, mas um território a ser desenvolvido
cotidianamente pelos leitores (BEIGUELMAN, 2009).
A intenção desta pesquisa foi dar um passo à frente na análise da interferência de
tecnologias nos processos de produção e leitura, avançando para o campo da Web Semântica. A
proposta é substituir a análise isolada de produção e recepção por uma visão complexa sobre o
que está “espalhado” na rede. A metáfora conceitual adotada neste trabalho para ilustrar os
caminhos do leitor no ambiente digital é dos sistemas complexos, numa fundamentação que
engloba Teoria da Complexidade e Teoria do Caos. A metáfora conceitual serviu como elemento
1 Teoria Matemática da Informação (1949): Claude Shannon e Warren Weaver elaboraram o modelo
comunicacional que se apresenta como uma extensão de um modelo de engenharia de telecomunicações. Nesse
modelo, uma fonte passa a informação a um transmissor; este a coloca em um canal e a leva a um receptor/
destinatário. No entanto, o modelo foi criticado pela sua linearidade, incompletude e estatismo.
16
retórico para compor a argumentação, mas além de ser um ornamento do discurso neste trabalho,
será uma ferramenta de compreensão estendendo a capacidade de conceituação.
Outras metáforas que explicam a lógica da rede também foram levantadas na
contextualização, porque ajudam a entender o percurso da Web 1.0 até a Web Semântica. A partir
desses levantamentos, casos reais foram identificados na produção de conteúdo no portal de
notícias em.com.br para evidenciar o gerenciamento de tags e a influência direta delas no
trabalho do profissional de jornalismo digital. Também foi aberto um espaço para entender como
as tags funcionam como elo na rota hipertextual do leitor, trabalhando como “atratoras” e
ganhando novos valores semânticos na Web por causa da lógica de navegação.
Ao aplicar a metáfora dos sistemas complexos à realidade do ambiente digital, parti para a
pesquisa com a hipótese de que os atratores que surgem vão guiar estratégias de etiquetagem de
informações para atrair o leitor. Pela natureza complexa da teoria escolhida, parti da premissa de
que o caminho do leitor na Web não é linear. Também havia a hipótese de que o gerenciamento
das tags entraria na rotina dos produtores de conteúdo na Web e a forma como isso acontece é
uma lacuna preenchida pela pesquisa. Especificamente no jornalismo digital, a relação entre
folksonomia2, os motores de busca na Web e audiência foi uma descoberta na coleta e análise de
dados. Também não havia hipóteses sobre o comportamento semântico das tags em processos de
captura3 do leitor na Web, outro ponto que a pesquisa revelou.
Busquei suporte em estudos desenvolvidos pela Linha de Pesquisa II (Escrita, Leitura e
Processos Interdiscursivos) para ajudar a responder questionamentos como: qual é o terreno de
linkagens temporárias e relações rizomáticas em que a comunicação atualmente “pisa”? O que
mudou desde o início da primeira fase Web para a terceira geração? A Web Semântica possibilita
melhor aproveitamento dos efeitos da rede pelas empresas de comunicação? Como a etapa da
comunicação baseada em tags, que promete inovação no fluxo de informações e uma experiência
estética ancorada em base de dados, está virando realidade? Por que a ferramenta tag é
2 Termo que nomeia a etiquetagem de conteúdos pelas pessoas na Web. O capítulo 3 é dedicado à definição de
folksonomia no contexto desta pesquisa.
3 O termo captura será usado neste trabalho sem a intenção de dizer que o leitor é indiscriminadamente “pego” na
rota hipertextual. O leitor tem sua contribuição em leitura e compreensão, mas foi o termo mais adequado para
retratar a realidade do processo de produção jornalístico na web.
17
responsável pela navegação nômade, pela colaboração em rede e pela alteração de processos
comunicativos? Como o processo de navegação, sob influência de motores de busca, alteram
audiência de sites? Enfim, procurei responder às perguntas com exemplos práticos em dois casos
escolhidos como objeto de estudo: as coberturas jornalísticas do Incêndio em Santa Maria e a
Morte de Paul Walker. As considerações parciais e finais sobre tudo isso estão nos capítulos que
seguem nesta pesquisa, cuja organização está explicada na sessão 1.6.
1.2 Contextualização
A partir da década de 90, alguns autores direcionaram os estudos para a metáfora da rede,
conceito que eles acreditam ser a metáfora da produção, da leitura e da comunicação
contemporâneas. Para França (2002), por exemplo, rede é a metáfora que surgiu no final do
século XX e substitui o modelo do telégrafo, no qual alguns polos de produção possuíam
onipotência sobre os homens, que foram reduzidos ao papel de receptores passivos.
Para Castells (1999), rede é um conjunto de nós interconectados capaz de encurtar
distâncias e integrar novos nós rapidamente. Os nós podem ser textos, pessoas, computadores,
empresas, comunidades, países etc. Segundo ele, a rede pode ser pensada como uma experiência
prática de usuários conectados a espaços virtuais ou como um modelo amplo de funcionamento
social.
Lévy (2003) usa o hipertexto sob a terminologia de uma metáfora para a rede, à luz de
dois paradigmas, o técnico e o funcional. Tecnicamente, hipertexto é um conjunto de nós ligados
por conexões. Os itens de informação não são ligados linearmente, como uma corda com nós,
mas cada um deles, ou a maioria, estende suas conexões em estrela, de modo reticular4.
Funcionalmente, hipertexto é um tipo de estrutura para a organização de conhecimentos ou
dados, a aquisição de informações e a comunicação. Assim como a metáfora da rede, a metáfora
do hipertexto é usada para pensar a comunicação que rompe como o esquema transmissionista.
4 Outra referência de metáfora para rede é o conceito desenvolvido por Deleuze e Guattari, o rizoma (raízes que se
elevam para fora da terra), termo inspirado na botânica e adaptável ao ambiente digital. Rizomas são como linhas
suplementares, que não se ligam a um ponto; emergem de vários pontos, sem exatidão nem destino.
18
Isso porque o papel do hipertexto não é só reunir textos, mas também as redes de associações
capazes de vincular pessoas e ideias na elaboração coletiva de um “hiperssignificado”.
Outra visão é de Jenkins (2008), que cria um paradigma definido como Cultura da
Convergência, uma das visões mais sistêmicas que se pode encontrar sobre a realidade midiática
do século XXI. Uma mudança cultural na forma de pensar e fazer comunicação eclodiu com
ambiente virtual. As novas e antigas mídias começam a interagir de forma cada vez mais
complexa por causa da convergência dos meios de comunicação, da cultura participativa e da
inteligência coletiva.
Por convergência refiro-me ao fluxo de conteúdos através de múltiplos suportes
midiáticos, à cooperação entre múltiplos mercados midiáticos e ao
comportamento migratório dos públicos dos meios de comunicação, que vão a
quase qualquer parte em busca de experiências de entretenimento que desejam.
[...] a convergência representa uma mudança no modo como encaramos nossa
relações com a mídia. (JENKINS, 2008, p.27 e p.49).
Jenkins (2008) fala em “interação complexa” dos meios. Nesse caso, o termo complexo
significa muito mais do que a definição de complicado e intrincado dada pelo dicionário. Para
Morin (2003), a carga semântica da palavra complexidade está atrelada à desordem. Usar a
complexidade para tentar explicar a produção de conteúdo e leitura no ambiente hipermidiático é
a minha escolha nesta pesquisa, um desafio que se justifica pelas características desse ambiente:
ubiquidade, interconectividade, hibridização, interatividade, colaboratividade e imprevisibilidade
(CRUZ et al., 2009). Pensar em todos esses aspectos isoladamente seria um risco de incorrer em
simplismo.
De acordo com Morin (2003), o pensamento complexo integra os modos simplificadores.
Segundo ele, a complexidade é construída junto com a convivência do uno e do múltiplo. É um
tecido de interações e retroações que geram ambiguidade e incerteza. Daí a necessidade de um
pensamento complexo que enfrente a confusão e a contradição geradas.
Usar os sistemas complexos como metáfora nesta pesquisa também é transferir um
conceito da física para estudos das relações humanas, de comunicação e mediação. “Um sistema
complexo pode ser definido como sendo constituído por muitos componentes independentes que
interagem localmente produzindo um comportamento geral, organizado e bem definido
19
independente da estrutura interna dos componentes” (PALAZZO, 1999, p.11). Os estudos da
termodinâmica explicam a troca de energia dentro de um sistema e o caminho de caos e
desordem das partes desse sistema até chegar ao equilíbrio. Da Física vem a ideia da dinâmica
não linear, de um sistema onde as partes são entrelaçadas e trocam feedbacks. A produção e a
leitura online também têm essa característica da não linearidade.
A tecnologia digital está ajudando na construção do que Morin (2003) chama de
pensamento complexo, no qual passamos de uma visão linear da comunicação para uma ideia
circular com auto-organização e conectividade.
Produção e leitura na Internet nem sempre foram dotados dessa hipercomplexidade,
apesar de a plataforma oferecer as possibilidades. Tudo começou quando, em 1992, Tim Berners-
Lee desenvolveu a World Wide Web (rede de alcance mundial), também conhecida como WWW.
A Web foi responsável pelo conceito de navegação, dando ao usuário os links clicáveis que levam
para outros sites.
A Web 1.0, a primeira geração desse novo modo de navegar, era uma espécie de canal de
transmissão de informações, com aplicativos fechados e a adoção de um fluxo de comunicação
unidirecional. O jornalismo, por exemplo, protagonizou uma fase transpositiva nessa época, em
que o conteúdo do jornal impresso invadia a Internet. No Brasil, o primeiro jornal online, lançado
em 1995, foi o Jornal do Brasil (JB)5. Logo depois, o jornalismo se associou ao comércio
eletrônico e tornou-se comum o termo portal, materializando a ideia de uma Internet em
miniatura, simplificada e acessível.
Posteriormente, mas não de forma substitutiva, surgiram as ferramentas de Web 2.0. Essa
nova fase é baseada na colaboração e na produção de conteúdo. O marco inicial para a etapa é o
surgimento do e-commerce como novo canal de vendas e o aumento vertiginoso das ações das
empresas pontocom. A Web 2.0 apresenta aspectos que não eram explorados na Web 1.0, como a
5 Foi também o primeiro jornal a deixar de existir em versão impressa, ficando somente online em 2010. A
mudança de plano de negócio foi resultado de uma crise na venda de jornais.
20
produção coletiva de conteúdo, maior interatividade6 e o usuário como produtor. A nova fase
apontou para o dinamismo e a capacidade de interação, principalmente pelas redes sociais.
Utilizado para descrever a segunda geração da WWW, o termo Web 2.0 foi criado por O’Reilly
(2006):
Web 2.0 é a revolução de negócios na indústria de computadores causada pela
mudança da Internet como plataforma e um entendimento das regras para obter
sucesso nesta nova plataforma. Entre outras, a regra mais importante é
desenvolver aplicativos que aproveitem os efeitos de rede para se tornarem cada
vez melhores quanto mais forem usados pelas pessoas. Isso é o que eu chamo de
aproveitamento da inteligência coletiva. (O’REILLY, 2006 – tradução minha)7.
Na segunda fase, evoluíram muito as ferramentas de busca online otimizada e
principalmente o uso da folksonomia, a produção de conteúdo baseada na ação tagging8. A
folksonomia é uma maneira de indexar informações e surge como uma analogia à taxonomia. O
prefixo folks, palavra da língua inglesa, significa pessoas – ou seja, cada usuário da informação
pode classificá-la com uma ou mais palavras-chave. Assim, abriu-se caminho para a nova etapa
para completar a Web 2.0. “A Web Semântica não é uma Web separada, mas uma extensão da
atual. Nela a informação é dada com um significado bem definido, permitindo melhor interação
entre os computadores e as pessoas.” (BERNERS-LEE, 2001, p.1). A Web Semântica se constitui
com a organização e o uso de maneira mais inteligente de todo o conhecimento já disponível na
plataforma. As informações são compartilhadas na rede digital e uma possível potencialização de
recursos pode reduzir o tempo gasto pelo usuário em buscas frustradas.
A Web foi construída predominantemente para o consumo humano. Aos poucos começam
6 Conforme Primo (2007), interatividade ocorre quando dois ou mais participantes desenvolvem atividade mútua e
simultânea, geralmente buscando o mesmo objetivo. Ela vai além do argumento comercial dos sites ditos
dinâmicos por causa das possibilidades de clicks, pois une pessoas num processo de comunicação mediada por
computador.
7 Web 2.0 is the business revolution in the computer industry caused by the move to the Internet as platform, and
an attempt to understand the rules for success on that new platform. Chief among those rules is this: Build
applications that harness network effects to get better the more people use them. (This is what I've elsewhere
called "harnessing collective intelligence)." (O’REILLY, 2006).
8 Escrita na qual os leitores podem incluir metadados (dados sobre dados) sob forma de palavras-chave para
compartilhar conteúdo. Esse modo de fazer/ler cresceu, sobretudo em redes sociais. A informação publicada é
categorizada para facilitar a busca não só pelo usuário que a marcou, mas por qualquer pessoa com interesses em
comum. (MOHERDAUI, 2012). O conceito será explorado no capítulo 3 desta pesquisa.
21
a aparecer dados legíveis por máquinas, que são distribuídos em um formato específico, sendo
muito limitada a correspondência entre humanos e as versões dos computadores. Segundo
Peixinho (2010), quando os dados na Internet são significativos para o ser humano e são
aumentados com dicas de significado para os programas de computador, esses programas se
tornam muito mais úteis, porque eles começam a compreender a estrutura dos dados.
Essa harmonia de linguagem, que promete ser o futuro da Internet, tem influência na
produção e na leitura na Web, quando esta é pensada como uma mídia. Nesta pesquisa, os casos
estudados (duas coberturas jornalísticas) são voltados para essa perspectiva. Conforme Lima
Júnior (2012), o jornalismo, como braço da mídia, é um dos que se defrontam com as novas
lógicas de produção. Um dos principais pontos é que as empresas de comunicação podem se
apropriar da captura inteligente de leitores na Web usando de forma eficaz as tags.
Essa etapa está proporcionando espantosa produção e armazenamento de dados.
Em vários formatos, esses dados estão disponíveis para serem cruzados e
relacionados por jornalistas que possuem habilidades multidisciplinares ou por
pessoas que possuem conhecimento sobre tecnologias digitais conectadas.
(LIMA JÚNIOR, 2012, p. 69).
O que alguns autores chamam de jornalismo convergente, jornalismo de dados, jornalismo
inteligente ou jornalismo semântico - mesmo não sendo sinônimos - estão incluídos nessa terceira
geração da Web. No jornalismo, é visível a apropriação de ferramentas semânticas no processo de
produção. Os exemplos surgem vertiginosamente: sites como BBC9 e The Economist
10 usam
instrumentos que facilitam a organização do conteúdo e a recuperação de informações.
A BBC, por exemplo, enfrentava um sério problema de falta de integração de conteúdo
porque tem oito canais nacionais de televisão, além de programações regionais, 10 estações de
rádio nacionais, 40 estações de rádio local e um site extenso. Mas a empresa conseguiu se
organizar com uma lógica totalmente baseada em tags, usando a inteligência de buscadores
semânticos e de base de dados disponibilizadas, como DBpedia11
.
9 BBC. Disponível em: <http://www.bbc.co.uk>. Acesso em 10 jul. 2013.
10 THE ECONOMIST. Disponível em: <http://www.economist.com/conversation-cloud>. Acesso em 10 jul. 2013.
11 DBpedia. Disponível em: <http://dbpedia.org/About>. Acesso em 15 jul. 2013.
22
Já o The Economist criou uma nuvem de tags dos tópicos mais comentados do site. Por
meio de palavras-chave, o usuário acessa milhares de conteúdos interconectados e a nuvem
funciona de uma maneira realimentadora para a audiência do portal. É como se ler uma tag
puxasse a leitura de outra e assim a navegação se tornasse infinita sem sair do ambiente do The
Economist. O que se observa nas ações desses dois jornais é o gerenciamento da informação de
uma forma que não era feita antes.
Parte dos processos que descrevo neste trabalho se refere não somente às mudanças na
produção e na leitura, mas às consequências disso para o futuro da Internet. Assange (2012)
discute a liberdade, a vigilância, a censura e novas relações de poder geradas pela divulgação de
dados na Web. O editor de Wikileaks12
, preso pela publicação de informações secretas do
governo americano, relata as batalhas digitais, proporcionadas principalmente pela evolução da
Web até a terceira geração. Ele chama de “guerra furiosa pelo futuro da sociedade”.
O mundo não está deslizando, mas avançando a passos largos na direção de uma
nova distopia transnacional. Esse fato não tem sido reconhecido de maneira
adequada fora dos círculos de segurança nacional. Antes, tem sido encoberto
pelo sigilo, pela complexidade e pela escala. (ASSANGE, 2012, p. 25).
Assange (2012) é apocalíptico, um visionário com motivações políticas, mas deixa um
recado que muito se encaixa nesta pesquisa: mais do que ter em mãos bases de dados e
ferramentas semânticas, a reflexão para produtores e leitores em geral deve ser o que fazer com
esse arcabouço tecnológico. O gerenciamento de informações tem consequências socioculturais.
Nesse gerenciamento incluído na terceira fase da Web, o desafio para uso de tags é
encontrar uma maneira de controlar simultaneamente o lógico e o semântico. O que descrevo nas
situações escolhidas como corpus deste trabalho são exemplos em que os softwares passaram a
fazer parte de estratégias arquitetadas pelos produtores de conteúdo. Ao comunicador – seja ele
jornalista, empresário, membro do governo ou blogueiro – cabe dominar as ferramentas para
entender os resultados do processo como um todo. A analogia de Manovich (2008) é de que os
softwares são os motores das sociedades contemporâneas. Segundo ele, as empresas estão
essencialmente focando seus negócios em softwares: otimização de sites, aplicativos em mapas,
12
WIKILEAKS. Disponível em: <http://wikileaks.org>. Acesso em 3 ago. 2014.
23
mensagens instantâneas e plataformas que possibilitam a criação de outros softwares.
Facebook, Unix, Windows e Android são o centro da economia global, cultural,
vida social e, cada vez mais, política. Esta cultura do software – em que milhares
de pessoas carregam átomos (mídia e informação bem como interações no
entorno dessas mídias e informações) – é apenas a parte visível de um universo
muito maior de softwares. Software é uma cola invisível que amarra nós todos
juntos. Se a eletricidade e a engenharia de combustão fizeram a Sociedade
Industrial, os softwares similarmente permitem a Sociedade da Informação.
Software é o que dirige o processo de globalização. Software é invisível para a
maioria dos acadêmicos, artistas e críticos. Eles se limitam a criticar as noções
de cyber, digital, redes e mídias sociais. Nós nunca olhamos o que está por trás
da nova representação comunicacional. (MANOVICH, 2008, p. 4 – tradução
minha).
Os softwares estão submetidos à inteligência humana. Muitos são criados para repetir,
imitar ou reproduzir ações do homem, sejam eles como extensões – na ideia de McLuhan (1969)
de que todos os meios são o prolongamento de alguma faculdade humana (psíquica ou física) –
ou sejam eles como símbolos da tecnologia da inteligência – uma releitura de Lévy (2004) em
que escrita, leitura, visão, audição e criação são capturados por uma informática cada vez mais
avançada. Os instrumentos da Web Semântica refletem bem a evolução dessa inteligência,
mostrando caminhos e possibilidades aos produtores de conteúdos na Internet.
1.3 Justificativa
A pesquisa é relevante para as áreas de Comunicação Social e Estudo de Linguagens na
medida em que mapeia a evolução de produção e leitura na Web e discute o modo como esses
processos chegaram à Era da Estética de Banco de Dados. São particularmente importantes para a
área acadêmica resultados que apontem especificidades das novas mídias e as mudanças nas
mídias tradicionais, sob a perspectiva de como a comunicação e a linguística se desenvolvem e se
adequam às realidades hipermidiáticas, conforme constata Santaella (2005):
Um dos aspectos evolutivos mais significativos dessa conjuntura revolucionária
está no aparecimento rápido de desenvolvimento de uma nova linguagem: a
hipermídia. Antes da era digital, os suportes estavam separados por serem
incompatíveis: o desenho, a pintura e a gravura nas telas, o texto e as imagens
24
gráficas no papel, a fotografia e o filme na película química, o som e o vídeo na
fita magnética. Depois de passarem pela digitalização, todos esses campos
tradicionais de produção de linguagem e processos de comunicação humanos
juntaram-se na constituição da hipermídia. (SANTAELLA, 2005, p.390).
Para Santaella (2013), a hipermídia como linguagem é o principal ponto da cultura que
emergiu com o universo virtual das redes. Antes dessa cibercultura, a humanidade passou por,
pelo menos, outras cinco fases enumeradas pela autora em palestra na PUC do Rio Grande do
Sul13
: 1) oralidade: externalização do conhecimento – o cérebro morre, mas o conhecimento fica;
2) escrita: dá um status para a memória humana fora do corpo – o ser humano prova o mundo dos
signos; 3) Gutemberg: início das mediações tecnológicas – tecnologia eletromecânica e a cultura
da reprodução; 4) cultura de massa: tecnologia eletroeletrônica, e 5) cultura de mídias: tecnologia
do disponível.
Por fim, segundo a autora, a humanidade entrou na sexta fase – cultura digital – com a
tecnologia do acesso e a interatividade. Ainda assim, uma nova etapa já se inicia com as
possibilidades de mobilidade e miniaturização da tecnologia, o que Santaella (2013) chama de
fase sete – cultura da conexão. Para a entrada dessa nova etapa, nada mais lógico que a evolução
inteligente da Web que esta pesquisa discute. Seria o cenário perfeito para o que a autora
denomina “fusão indissociável entre inteligência do corpo e inteligência artificial”, daí a
relevância em abordar o tema.
Outro aspecto que justifica esta pesquisa é trazer de forma metafórica para as Ciências
Humanas o conceito de sistemas complexos, que vem da Física. Também se buscou uma
definição menos técnica da Web Semântica, muito comum nos trabalhos da área de Computação
e Ciências da Informação. O tema que perpassa esses conceitos na pesquisa é o gerenciamento de
tags na produção e leitura, principalmente as estratégias usadas por produtores ancorados nas
palavras-chave.
A importância das tags está na possibilidade de que a Web deixe de ser um mar de
documentos para se tornar um mar de dados. Os instrumentos da Web Semântica criam
13
O crescimento extrassomático do cérebro humano. Porto Alegre: Pontifícia Universidade Católica do Rio Grande
do Sul, 2013. (Comunicação oral).
25
mecanismos para agenciar esse território de dados. O que pode ser um mar aparentemente caótico
de informações é decodificado pelo navegador/leitor. A comunicação que se processa no
ambiente em rede é de natureza distinta da comunicação de massa, o que motiva a discussão a
respeito do suporte teórico da comunicação, principalmente na Era do Banco dos Dados.
1.4 Problema de pesquisa
Venho observando que os modelos lineares de navegação na Web, disponibilizados pelos
produtores, não correspondem à expectativa do leitor que tende a fazer uma navegação nômade,
própria dos sistemas complexos.
1.5 Objetivo Geral
Mapear a evolução de produção e leitura na Web e discutir o modo como eles chegaram à Era
da Estética de Banco de Dados, avançando para o campo da Web Semântica. Para alcançar este
objetivo busquei casos reais de produção jornalística que evidenciam o gerenciamento de tags
com resultados diretos na audiência desses conteúdos. Com a coleta e análise de dados no Google
Analytics foi possível mostrar a relação entre o uso consciente de determinadas tags para a
captura do leitor na rota hipertextual, uma característica da produção na era semântica da Web -
bem diferente do que se produz quando o foco é a organização de dados online.
Esta pesquisa também esteve focada em aplicar a metáforas escolhida para explicar processos
de produção e leitura na Web, conceituando sistemas complexos no contexto da pesquisa,
definindo a função dos atratores e criando um quadro conceitual usado para a análise de dados.
Outro procedimento foi discutir a produção jornalística e leitura a partir uma estética do banco de
dados, baseada em tags para contextualizar a lógica da rede e a estrutura rizomática em que esses
processos estão inseridos. A ideia era descobrir o que mudou desde o início da primeira fase Web
para a terceira geração, levantando um breve histórico e montando conceitos para Web Semântica
e folksonomia.
26
1.5.1 Objetivos específicos
- Discutir como as tags mudaram as estruturas de significação de conteúdos que circulam a rede:
saber por que as tags são responsáveis pela navegação nômade, pela colaboração em rede e pela
alteração de processos comunicativos.
- Analisar a adequação do uso de um modelo não linear de comunicação em rede: saber como a
Web Semântica possibilita o aproveitamento dos efeitos da rede pelas empresas de comunicação.
1.6 Organização deste trabalho
Além do capítulo de introdução, a dissertação tem mais seis capítulos que ajudam no
entendimento de uma estrutura circular (conforme o Esquema 1) de conceitos e ideias. A proposta
foi trazer a complexidade também para a estruturação do trabalho, em uma montagem menos
simplista e mais integrada possível. Conforme o esquema abaixo, o trabalho foi desenvolvido
para que os temas se englobem e tenham um ponto de interseção.
Esquema 1 – Organização da dissertação
Fonte: Elaborado pela autora
O capítulo 2 traz os conceitos base para o trabalho, complexidade e Web Semântica, e
deixa clara a forma como vou relacioná-los. Uma abordagem fundamental desse capítulo é como
as tags operam como atratores na rota hipertextual da Web.
27
O capítulo 3 trata somente da folksonomia, conceito importante para articular as ideias de
“tagueamento” e classificação na Web. É nesse capítulo que são abordados processos de
indexação e organização popular na rede e as influências disso nos processos de produção e
leitura na Web.
O capítulo 4 especifica processo de produção jornalístico na Web, cujos casos reais são
usados como corpus da pesquisa. Nele contextualiza-se quem é o leitor e o produtor da Web,
além de mostrar qual a influência de motores de busca.
O capítulo 5 é dedicado à metodologia de coleta e análise de dados. São detalhadas as
duas ferramentas de coleta: Google Analytics e Google Trends. Também é apresentada a
importância dos depoimentos dos jornalistas do portal em.com.br, especificamente sobre as
coberturas analisadas.
O capítulo 6 traz os dois estudos de caso, “Incêndio em Santa Maria” e “Morte de Paul
Walker”, com a exposição e análise de dados de forma qualitativa. O capítulo 7 é de
considerações finais para amarrar a análise com as perguntas iniciais da pesquisa.
28
“O círculo do eterno retorno é um círculo sempre excêntrico para um
centro sempre descentrado” (DELEUZE, 2007, p.270)
2 Complexidade e a Web Semântica
O centro é a pesquisadora (descentrada) tentando organizar neste trabalho a
excentricidade da Web. Os círculos são as ideias caóticas para chegar a um consenso sobre o
fenômeno da complexidade, que neste capítulo é explorado junto à construção do conceito – mais
comunicacional do que técnico – de Web Semântica. É neste capítulo que articulo os sistemas
complexos como metáfora conceitual. A metáfora tem um pé na poesia e outro na retórica, por
isso será uma janela muito útil para arremessar as ideias por aqui.
2.1 O termo complexidade e as metáforas
A complexidade é uma palavra problema e não uma solução, mesmo assim ela vem para
resolver o que modos simplificadores de pensamento (como o cartesianismo) mutilaram por anos
ao analisar fenômenos da comunicação e linguagem. Morin (2003) desmistifica a primeira
impressão de que complexidade remete à confusão e à incerteza. O autor prova que algumas
ilusões prejudicam o entendimento da complexidade: 1) muitos pensam que a complexidade
elimina a simplicidade, mas na verdade o pensamento complexo integra os modos
simplificadores; 2) há confusão entre complexidade e completude, na verdade, o pensamento
complexo aspira ao conhecimento multidimensionar, mas esbarra na impossibilidade de
omnisciência ou totalidade. “Se a complexidade não é a chave do mundo, mas o desafio a
enfrentar, o pensamento complexo não é o que evita ou exprime o desafio, mas o que ajuda a
relevá-lo e, por vezes, mesmo a ultrapassá-lo” (MORIN, 2003, p.11).
Mas, afinal o que é a complexidade? É tudo que fica tecido junto com a convivência do
29
uno e do múltiplo, um emaranhado de interações e retroações que geram desordem, mas podem
ser entendidos pelo pensamento complexo. De acordo com Morin (2003), quem não pratica a
complexidade vive na inteligência cega que substitui disjunção por distinção, redução por
conjunção e reducionismo por holismo. “A patologia moderna do espírito está na
hipersimplificação que a torna cega perante a complexidade do real” (MORIN, 2003, p. 22).
Para chegar ao conceito de complexidade, Morin (2003) retoma algumas perspectivas que
deixaram como legado para a análise do conhecimento ciência e comportamento social. Ele
pontua e critica essas teorias, levando em conta os critérios do que considera pensamento
complexo.
A Teoria dos Sistemas, por exemplo, coloca no centro a unidade complexa (um todo que
não se reduz à soma das partes) e situa-se em nível transdisciplinar. Uma vantagem da teoria é
analisar uma causalidade unilinear, ajudando as pessoas a parar de classificar e linearizar as
coisas. No entanto, Morin (2003) critica a teoria pelo fato de ela trazer a noção de sistema como
ambígua ou fantasma. Para completar a teoria, o autor sugere explorar melhor o holismo e a auto-
organização.
A Teoria da Informação, segundo Morin (2003), apresenta a informação como um
conceito em constante construção – o que é positivo. Em contrapartida, a origem física e
matemática da teoria, pensada por Shannon e Weaver, restringe a complexidade. “A informação é
um conceito indispensável, mas não é ainda um conceito elucidado e elucidativo” (MORIN,
2003, p.39). Para completar essa teoria, Morin (2003) sugere a inserção da auto-organização
como mecanismo inseparável da informação.
Outra teoria criticada pelo autor é da Auto-organização, feita originalmente para
compreender o ser vivo, mas que se associou, segundo ele, à cibernética de maneira infeliz. Para
Morin (2003), a aplicação da auto-organização às máquinas artificiais atrofiou o desenvolvimento
teórico porque sugeriu autossuficiência sem interferência do meio externo. O autor sugere como
melhoria para a teoria a inserção da ideia de que o meio faz parte do processo como um
coorganizador.
Por fim, o autor reúne algumas das boas características de todas essas perspectivas e
30
chega à Teoria da Complexidade tratando de incertezas, indeterminações e fenômenos aleatórios.
É uma teoria proposta para compreender unidades e interações que desafiam as nossas
possibilidades de cálculo. De acordo com Morin (2003), um dos saltos da complexidade foi a
associação competente dela à cibernética, que precisou do pensamento complexo para contornar a
famosa caixa-preta (sistemas fechados de alta complexidade e estrutura interna desconhecida).
O desafio do pensamento complexo é entrar na caixa-preta, usando uma visão diferente do
cartesianismo, que elimina ambiguidades. A intenção na complexidade é aceitar certa imprecisão
de conceitos e fenômenos como parte da busca pelo conhecimento. Para isso, três princípios são
fundamentais, conforme Morin (2003): o dialógico, que permite manter a dualidade no seio da
unidade, associando dois termos ao mesmo tempo complementares e antagônicos; a recursão
organizacional, em que produtos e efeitos são ao mesmo tempo causas e produtores daquilo que
os produziu em um ciclo autoconstrutivo, auto-organizador e autoprodutor que quebra a ideia
linear de causa/efeito; e o princípio hologramático, que é a ideia de conceber o todo levando em
conta as partes.
Aos três pontos, acrescento um: o princípio da linguagem, um entendimento de que os
componentes dos sistemas complexos interagem com uma linguagem sofisticada. Não é à toa que
“o pensamento complexo não resolve ele próprio os problemas, mas constitui uma ajuda à
estratégia que pode resolvê-los” (MORIN, 2003, p.121).
Uma forma de cercar melhor a complexidade, com a intenção que esta pesquisa tem de
comparar a produção e a leitura na Web Semântica a um sistema complexo, é levantar as
características desse tipo de sistema. O conceito que aqui será moldado tem como base a ideia
epistemológica de que a “complexidade comporta nela a impossibilidade de unificar, de
acabamento, uma parte da incerteza, uma parte da irresolubilidade e reconhecimento do frente a
frente final com o indizível.” (MORIN, 2003 p.139). Não pecar pela simplificação é muito difícil,
mesmo quando se aspira – como nesta pesquisa – alcançar o pensamento complexo. Mesmo
assim, a imperfeição é parte também da complexificação.
No sentido mais geral, senso comum, o fenômeno da complexidade reside entre a
simplicidade e a “era do caos”. Quando a leis que governam um sistema são relativamente
simples, ele se comporta de forma fácil de compreender e explicar. Por outro lado, quando o
31
sistema é aleatório e não linear (como a Web), pequenas variações de funcionamento podem
alterar bastante o resultado final, fazendo com que esse sistema fique taxado como caótico. Os
sistemas complexos estão entre esses dois extremos, conforme explica Sawyer (2005).
Segundo Palazzo (1999), o melhor “desenho” para explicar um sistema complexo é a
rede, onde há nós, conexões e arcos. De acordo com o autor, a complexidade vem do termo
complexus, que significa entrelaçado ou torcido junto. A explicação muito se assemelha à
metáfora da tapeçaria, usada por Morin (2003) para explicar sistemas não lineares. Segundo o
autor francês, uma tapeçaria contemporânea comporta fios de espessura, cor e textura variadas,
mas nada seriam essas características isoladas se não fosse possível contemplar a globalidade dos
tecidos que se formam com os desenhos originários dos fios entrelaçados. O trabalho final parece
o resultado de uma construção aleatória, mas é fruto de uma organização. Assim também é a
metáfora do rizoma, de Deleuze e Guattari, que já foi citada nesta pesquisa e que faz parecer mais
adequado o uso da complexidade como metáfora conceitual para falar sobre produção e a leitura
na Web.
Os sistemas complexos têm componentes interligados que formam uma estrutura estável,
composição que une distinção e conexão de elementos e que não pode ser analisada
separadamente. Palazzo (1999) usa duas metáforas – da bola de neve (Figura 1) e do efeito
dominó (Figura 2) – para explicar uma característica fundamental dos sistemas complexos: o
feedback. Por meio desse conceito é possível abandonar uma visão linear e simplista para
entender o movimento cíclico de um sistema complexo, composto de autoamplificação e junção
de causa e efeitos em módulos circulares – o que o autor chama de “laço causal”. A principal
vantagem do feedback é ser autoamplificador. Quanto mais complexo é um sistema, mais
estruturas de feedback ele apresenta. Na visão linear, os processos são classificados nos tempos
passado e presente, mas na visão circular tudo ocorre em um mesmo ciclo.
A metáfora da bola que rola e cresce ao mesmo tempo em que aumenta a
velocidade ladeira abaixo, além de representar muito bem o fenômeno
demonstra também dois modos completamente diferentes de perceber o
processo. A bola de neve apresenta dois movimentos diferentes: quando se
acompanha a bola com os olhos, verifica-se que ela possui um movimento
circular de rotação sobre si própria. Por outro lado, quando se observa a bola
rolando ladeira abaixo vê-se que sua trajetória descreve uma linha reta. Os dois
movimentos correspondem a duas formas fundamentalmente diversas de
32
perceber o tempo. [...] Causa grande impressão observar os dominós caírem
sucessivamente, derrubados pela queda de seus antecessores, produzindo assim
uma onda. Entretanto, se este é um padrão emergente, deve haver um ciclo em
algum lugar. Observando cuidadosamente o efeito-dominó pode-se considerar o
mesmo comparável ao efeito produzido por uma esfera invisível, rolando sobre
os dominós e derrubando-os em sequência. (PALAZZO, 1999, p. 7).
Figura 1 - Metáfora do efeito dominó
Fonte: http://www.esquerda.net/
Figura 2 – Metáfora da bola de neve
Fonte: http://algol.dcc.ufla.br/
33
Com essas metáforas e as ideias apresentadas por Palazzo (1999), é possível destacar uma
série de características dos sistemas complexos que ajudarão a articular conceitualmente a
produção e a leitura no ambiente digital. Nos sistemas complexos, consegue-se verificar alguns
padrões, expressos no quadro a seguir. Explorar o ambiente digital pode, também, ajudar a
revelar como surgem padrões de interação. O Quadro 1, baseado na argumentação de Palazzo
(1999), foi montado com a intenção de servir como operador conceitual na análise dos estudos de
caso das coberturas jornalísticas escolhidas como corpus da pesquisa.
Quadro 1 – Características de sistemas complexos
Fonte: Elaborado pela autora
34
O que há de comum entre os padrões apresentados e os artefatos tecnológicos da Web que
permitem caracterizá-los como complexos? Certamente são propriedades que não são
encontradas somente nas partes – as partes são distintas, mas se interconectam. Certamente é
também a tendência de desintegrar-se, mas poder lutar contra a desintegração por meio da
capacidade de criar soluções para os problemas. Segundo Parreiras (2005), para estudar o
ambiente digital é importante avaliar os elementos sem perder as dimensões dinâmicas das
interações, principalmente quando se pretende observar processos passíveis de gerenciamento por
parte do produtor de conteúdo, como no caso desta pesquisa. Não se perdem de vista, em
momento algum, os caminhos do leitor, como observa Santaella (2004):
Quando o usuário “pilota” o computador ele está dentro de um espaço
informacional, um ambiente de signos híbridos no qual imagens, gráficos,
desenhos, figuras, palavras, textos, sons e mesmo vídeos misturam-se na
constituição de uma metamídia complexa. Essa complexidade não é devida
apenas à complexidade dos signos que aciona, mas também devida às exigências
que ela demanda do usuário. É preciso movimentar-se no ambiente, é preciso
encontrar caminhos nessa floresta de signos e de rotas. Em suma: navegar é
preciso. (SANTAELLA, 2004, p.144).
Lévy (2004) corrobora dizendo que as modelizações sistêmicas e cibernéticas usadas por
muitos anos para explicar processos de produção e de leitura são no mínimo insuficientes.
Segundo o autor, elas consistem quase sempre em designar um certo número de agentes de
emissão e recepção, depois em traçar o percurso de fluxos informacionais, com tantos anéis de
retroação quanto se desejar. Assim, interação e comunicação ficam mal representadas.
Os diagramas sistêmicos reduzem a informação a um dado inerte e descrevem a
comunicação como um processo unidimensional de transporte e decodificação.
Entretanto, as mensagens e seus significados se alteram ao deslocarem-se de um
ator a outro na rede, e de um momento a outro do processo de comunicação. O
diagrama dos fluxos de informação é apenas a imagem congelada de uma
configuração de comunicação em determinado instante, sendo geralmente uma
interpretação particular desta configuração, um “lance” no jogo da comunicação.
(LÉVY, 2004, p. 13).
Com a complexidade, por usa vez, é possível discutir características da Web, mas sem
racionalizar demais esses aspectos, porque, no mundo virtual, nem tudo é coerente. Para discutir
a fase da Web em que estamos é necessária desintegração. Essa agitação é importante para a
35
organização do universo em perspectiva complexa, porque une ordem e desordem. Um dia será
possível organizar todas as informações, aceitando a complexidade delas sem eliminar paradoxos
e ambiguidades, que são características constitutivas. “A complexidade está lá onde não se pode
vencer a contradição ou mesmo uma tragédia” (MORIN, 2003, p. 93).
2.2 Entre a ordem e o caos
Palazzo (1999) define a ordem como um conjunto de estruturas simétricas e invariáveis
cuja previsibilidade espaço-temporal pode ser alcançada com facilidade. Parreiras (2005) citando
Williams (1997) define o caos como o vazio primaz do universo antes do início da existência das
coisas, um abismo existente abaixo do mundo. O caos não pode ser incluído em leis porque é
improvável. Os processos de produção e de leitura na Web estão justamente entre a ordem e o
caos, entre padrões de publicação de conteúdo online e total de imprevisibilidade dos caminhos
de navegação do leitor.
Para abordar a complexidade desses processos é necessário descrever o espaço
compreendido entre a ordem e o caos, chamado por Palazzo (1999) de fronteira do caos. Segundo
o autor, a fronteira do caos na Web é o resultado da navegação de leitores que saltam de link em
link, deixando um rastro de conhecimento. Para ele, a WWW é baseada na descentralização de
operações e controle, o que possibilita a interação direta entre produtores e consumidores, com
apelo para uma interface agradável aos leitores da informação. O protocolo Hyper Text Transfer
Protocol (HTTP) é responsável por essa integração entre informação e interface em uma única
representação. Assim, na Web adota-se um princípio de distribuição na representação do
conhecimento, o que significa que este é armazenado como uma rede de nós e links.
Os leitores navegam nessa rede perseguindo os links que lhe são mais significativos entre
um nó e outro, por meio de um julgamento associativo. As contribuições do leitor na rota
hipertextual – criadas a cada navegação – se juntam às projeções estruturais e semânticas dos
desenvolvedores (Web Developers), expandindo o conhecimento da rede como um todo. O
estágio de fronteira do caos permanente na Web se dá por causa do dinamismo na modificação de
36
nós e links (conexões entre eles, exclusões de alguns deles ou inclusão de novos). Toda essa
dinâmica poderia ser sistematizada em uma organização virtual por meio de memória associativa,
no entanto isso não é feito, segundo Palazzo (1999), o que é a grande perda da Web.
Quebrar a fronteira do caos não é tarefa simples, mapear caminhos fortes e fracos é uma
missão de grandeza estatística e semântica enorme, por isso ainda caminhamos para esse
conhecimento. Mesmo com grande aparato tecnológico, vivendo a era em que os softwares
tomaram o comando, conforme avalia Manovich (2008), a organização da informação ainda é
desafiadora porque a tendência é que nós e links se relacionem de forma cada vez mais complexa.
Uma das possibilidades de pensar a fronteira do caos é desenhá-la como um ciclo em que
ordem e desordem giram junto com a interação entre produtores e leitores, que também estão
diretamente ligados à organização. Esta última, quando ocorre – mesmo parcial ou momentânea –
faz emergir espontaneamente novas estruturas e de novas formas de comportamento do processo
de produção e de leitura. A espontaneidade desse ciclo está no fato de que não é necessária
sobreposição ou supervisão de nenhuma das partes (produtores e leitores) ou de instâncias
externas para que os processos continuem acontecendo. A organização é natural e ocorre o tempo
todo a cada advento de reestruturação das formas de interação online. Os próprios processos dão
um rumo ao dinamismo do ciclo, sem linearidade e permeados pelo caos do meio.
37
Esquema 2 – Processo de auto-organização
Fonte: Elaborado pela autora.
2.3 A complexa rota hipertextual na Web
Para entender como a lógica da rede influencia a comunicação, é preciso pensar que a
leitura e a escrita possibilitadas no ambiente hipermidiático apresentam características
específicas. Trata-se de uma escrita não sequencial, não linear, trata-se de hipertexto.
Popularmente os hipertextos são concebidos como uma série de textos conectados por links que
oferecem ao leitor diferentes caminhos, conforme definiu Ted Nelson14
no início dos anos 60.
Sobre esse conceito, Landow (2006) diz:
Hipertexto, como o termo é usado neste trabalho, denota texto composto de
blocos de textos e links eletrônicos que neles se juntam. A hipermídia
14
Theodor Holm Nelson, ou simplesmente Ted Nelson, é um filósofo e sociólogo estadunidense nascido em 1937.
Pioneiro da Tecnologia da Informação, inventou os termos hipertexto e hipermídia, em 1963, e os publicou em
livro, no ano de 1965. Disponível em: <http://pt.wikipedia.org/wiki/Theodor_Nelson> Acesso em: 10 jun.2014.
38
simplesmente estende a noção de texto em hipertexto ao incluir informação
visual, som, animação e outras formas de dados. Desde que um hipertexto ligue
um discurso verbal a imagens, mapas, diagramas e sons tão facilmente como a
outra passagem verbal, pode-se expandir a noção de texto para além do apenas
verbal, não distinguido entre hipertexto e hipermídia. Hipertexto denota um
meio de informação que liga verbal e não verbal. Nessa rede, uso a hipermídia e
hipertexto como termos intercambiáveis. (LANDOW, 2006, p. 3)
Ribeiro (2006) se baseia em Lévy quando afirma o hipertexto como um modelo de
pensamento ou de funcionamento da mente. O conceito de hipertexto do filósofo é um dos que
“foge ao domínio informático e traduz-se em domínios como o das cidades e o das bibliotecas
(físicas)” (RIBEIRO, 2006, p.4). Depois de levantar dezenas de perspectivas sobre o hipertexto,
Ribeiro (2006) não escolhe uma definição ideal, mas sugere que a leitura hipertextual transcende
as telas de computador, considerando que os hipertextos já existiam anteriormente aos meios
digitais.
A conclusão de Ribeiro (2006) é fundamental nesta pesquisa porque considera-se que a
rota hipertextual construída pelos leitores ultrapassa o ato de navegação, daí a complexidade da
qual está dotada a leitura na Web. Daí também a dificuldade do produtor em traçar estratégias
para capturar esse leitor. É possível montar algumas dessas estratégias, como será mostrado nos
casos reais deste trabalho, mas o desafio para cercar a imprevisibilidade da leitura é muito
grande.
Lévy (2004) fala de hipertexto como um mundo de significações baseado em seis
princípios: da metamorfose, heterogeneidade, multiplicidade e de encaixe das escalas,
exterioridade, topologia e mobilidade dos centros. Todos são importantes, mas é essencial
destacar a exterioridade – que resume o conceito de não unidade da rede e dependência de um
exterior indeterminado – e mobilidade dos centros – que significa dizer que a rede não tem
centro, os nós são responsáveis pelas ramificações ao redor de si. O primeiro conceito lembra,
conforme o Esquema 2, o meio externo caótico. O segundo conceito será muito importante
quando este trabalho tratar da função dos atratores, que são os formadores dos centros cambiáveis
no rizoma.
O hipertexto é dinâmico, está perpetuamente em movimento. Com um ou dois
cliques, obedecendo por assim dizer ao dedo e ao olho, ele mostra ao leitor uma
39
de suas faces, depois entra, um certo detalhe ampliado, uma estrutura complexa
esquematizada. Ele se redobra e desdobra à vontade, muda de forma, se
multiplica, se corta e se cola outra vez de outra forma. Não é apenas uma rede de
microtextos, mas sim um grande metatexto de geometria variável, com gavetas,
com dobras. (LÉVY, 2004, p. 24).
Para tratar da fase semântica da Web é preciso pensar no hipertexto como a potencialidade
da rede que permite seu funcionamento e dinamismo. De acordo com Lima Júnior (2012), a
proliferação de dados digitais está produzindo bases de dados gigantescas, espalhadas pelo
mundo e podendo ser acessadas de qualquer lugar do planeta, o que cientistas da computação e
engenheiros cunharam de Big Data. No entanto, somente 5% da informação criada na Web é
estruturada, ou seja, está no padrão de palavras ou números que podem ser lidas pelos
computadores.
O que está ajudando a mudar esse cenário de “desestruturação” é o progressivo
tagueamento do conteúdo na Web. A configuração tecnológica atual ocasiona a conexão entre
bases de dados, por isso surgem novas arquiteturas com níveis informacionais (uma malha) que
tendem ao infinito. Segundo Lima Júnior (2012), para se entender as bases de dados, de modo
conceitual, é preciso conhecer duas importantes definições: Open Data e Linked Data. O
primeiro é a ideia de dados como propriedade pública e o segundo representa a noção de unir
dados que não estavam previamente relacionados. A conformação desses dois conceitos
acrescenta às características da Web 2.015
um valor diferente para o tratamento e a mineração da
informação online, o que nos leva à fase semântica.
A imagem da Internet construída por Barret Lyon16
mostra a estrutura descentralizada
(Figura 3) da Web 2.0, aquela colaborativa e interativa em que as conexões são imensuráveis e
caóticas. Já o digrama de nuvem (Figura 4) revela uma proposta de organização trazida pela Web
Semântica e suas bases de dados. Tanto a imagem de Barret quanto o diagrama são
15
Cf. seção 1.2.
16 Barret Lyon é um empresário americano. É criador do Opte Project, um projeto de mapeamento da Internet que
faz uma representação precisa da extensão da Internet usando gráficos visuais. O projeto começou em 2003, em
um esforço para fornecer um mapa útil da Internet com código-fonte aberto. O projeto reuniu apoio em todo o
mundo e faz parte dos catálogos do Museu de Ciência de Boston e do Museu de Arte Moderna. Disponível em
<http://en.wikipedia.org/wiki/Barrett_Lyon>. Acesso em 15 mai. 2014.
40
representações da hipermídia, o mundo de rotas hipertextuais cambiantes. No entanto, na era Big
Data há um tratamento semântico da informação, o que os cientistas da computação chamam de
estruturação.
Figura 3 – Imagem de Barret Lyon
Fonte http://www.waynebarry.com/
Figura 4 – Diagrama em nuvem do DBPedia (Linking Open Data)
Fonte: http://en.wikipedia.org/wiki/Linked_data
41
Observa-se na Figura 4 como é possível separar por cores cada grupo de informações
correspondentes a classes como mídia, geografia, governamental entre outros. O DBPedia,
exemplo já citado nesta pesquisa17
, funciona com essa organização. O sistema extrai informações
estruturadas da Wikipedia e disponibiliza abertamente na Web, fazendo clara articulação entre
Open data e Linked Data. O que se tem no contexto da Web Semântica é o uso mais
especializado da rota hipertextual proporcionada pelo ciberespaço, que se torna um “lugar”
multidimensional. Este “lugar” é dependente da interação de usuários, permite a eles o acesso, a
manipulação, a transformação e o intercâmbio de seus fluxos codificados de informação. É o
espaço que se abre quando o usuário conecta-se com a rede. (SANTAELLA, 2005).
Pelas inúmeras possibilidades de alterar o conteúdo, esses construtores da rota
hipertextual são chamados por muitos de prosumers (produtores e consumidores de informação) e
produsers (usuários de ambientes colaborativos que se comprometem com conteúdo
intercambiável tanto como consumidores quanto como produtores. Fazem o que agora se chama
de produsage – produção e uso). (BRUNS, 2009).
Para Santaella (2005), a tecnologia da informação digital, aliada às telecomunicações das
redes eletrônicas, conduziu à disseminação da Web, que resultou da associação de dois conceitos
básicos: o de servidores da informação com o de hipertexto. O leitor pode navegar de um texto
em um servidor para qualquer outro, bastando para isso seguir protocolos muito simples. O ato de
navegar é simples, mas a rota gerada pelos caminhos do leitor é extremamente complexa, no
sentido mais “moriniano”. Sobre essa complexificação, Lévy (2004) contribui:
Que isto fique claro: a sucessão da oralidade, da escrita e da informática como
modos fundamentais de gestão social do conhecimento não se dá por simples
substituição, mas antes por complexificação e deslocamento de centros de
gravidade. O saber oral e os gêneros de conhecimento fundados sobre a escrita
ainda existem, é claro, e sem dúvida irão continuar existindo sempre. Não se
trata aqui, portanto, de profetizar uma catástrofe cultural causada pela
informatização, mas sim de utilizar os trabalhos recentes da psicologia cognitiva
e da história dos processas de inscrição para analisar precisamente a articulação
entre gêneros de conhecimento e tecnologias intelectuais. (LEVY, 2004, p.5).
17
Cf. seção 1.2.
42
2.4 Web Semântica: características e ferramentas
A sociedade da informação vive um momento de interoperabilidade semântica e uma
tarefa aguarda os especialistas: aprisionar o caos digital descobrindo sob a sua “aparente”
desordem um cosmos de ideias que deverá funcionar como espelho da inteligência coletiva.
“Aparente” porque, conforme já foi explicado, entre o caos e a desordem existe um quadro de
equilíbrio formador natural de sistemas complexos. O grande desafio desses especialistas é a
gestão do conhecimento, o domínio pessoal dos fluxos de informação, a exploração colaborativa
dos dados e a partilha dos saberes, pois, segundo Lévy (2004), as mensagens que se acumulam e
transitam na esfera midiática derivam de sistemas simbólicos diferentes.
Uma memória digital participativa comum ao conjunto da humanidade está em
vias de construção. Mas no início do século XXI, a exploração dessa memória
por todos e por cada um é limitada por problemas de opacidade semântica, de
incompatibilidade dos sistemas de classificação e de fragmentação linguística e
cultural. Na ausência de modelos computáveis, nós não conseguimos
automatizar a maior parte das operações cognitivas de análise, de filtragem, de
síntese e de interconexão das informações que permitiriam utilizar
vantajosamente a imensa massa de dados que se nos oferecem. Nós não sabemos
ainda como transformar sistematicamente esse oceano digital em observatório
reflexivo de nossa inteligência coletiva. (LÉVY, 2004, p.23)
Uma das propostas para mudar o cenário de opacidade são as ferramentas da Web
Semântica ou Web de Dados. Bernes Lee (2001) a descreve como “uma nova forma de conteúdo
que [...] desencadeará uma revolução de novas possibilidades”. O uso dos metadados18
é a aposta
para aprimorar a Web, pois eles possibilitam a classificação do conteúdo e tornam as buscas mais
eficazes. A Web Semântica tem exercido um papel relevante no estabelecimento de padrões
tecnológicos para a recuperação da informação.
Bernes Lee comanda o projeto World Wide Web Consortium (W3C)19
, que pretende
18
“‘Meta’ é um prefixo de autorreferência, de forma que ‘metadados’ sejam ‘dados sobre dados’. [...]. Em
documentos na Web, têm a função de especificar características dos dados que descrevem a forma com que serão
utilizados, exibidos, ou mesmo seu significado em um contexto.” (ALVARENGA; SOUZA, 2004, p. 134).
19 WORLD WIDE WEB CONSORTIUM (W3C). Disponível em: <http://www.w3.org/Consortium/>. Acesso em
10 jul. 2013.
43
alcançar um elevado nível de resultados de buscas na rede por meio do desenvolvimento de
regras semânticas visando a comunicação entre homem-máquina, de forma que, mesmo sem
deter mais conhecimentos acerca de estratégias de busca, qualquer usuário seja capaz de
recuperar a informação de forma precisa. Essa tecnologia permite que a máquina “compreenda” a
necessidade de informação de quem a busca.
A proposta da Web Semântica é fazer com que a máquina possa executar atividades
simples para os usuários e ajudar a decidir qual serviço usar. Para que os softwares façam isso, é
necessário interpretar informações. A nova fase da Web está maximizando as perspectivas de
compartilhamento e de integração de recursos e aumentando o grau de automatização. Junto às
ferramentas da Web Semântica estão as operações de gestão de conteúdos informacionais que
envolvem classificação, indexação e compatibilização de linguagem. Citando Pierre Guiraud20
,
Alvarenga e Souza (2004) explicam o termo Web Semântica afirmando que a expressão só se
justifica se observarmos as aumentadas possibilidades que o uso de metadados traz:
Embora “semântica” signifique “estudo do sentido das palavras”, Guiraud
(1975) reconhece três ordens principais de problemas semânticos: 1) a ordem
dos problemas psicológicos, que relaciona os estados fisiológicos e psíquicos
dos interlocutores nos processos de comunicação de signos; 2) a ordem dos
problemas lógicos, que estabelece as relações dos signos com a realidade no
processo de significação; 3) a ordem dos problemas linguísticos, que estabelece
a natureza e as funções dos vários sistemas de signos. [...] O uso da conotação
“semântica” para a Web está ancorado na segunda definição, e se justifica se
observarmos as aumentadas possibilidades de associações dos documentos a
seus significados por meio dos metadados descritivos. (ALVARENGA; SOUZA,
2004, p.133)
Esse tratamento de dados está diretamente ligado ao uso de palavras-chave, que são a
representação da metalinguagem Extra Markup Language (XML), uma ampliação da linguagem
HTML (usada para incluir hipertextos na Internet)21
. A nova fase da Web engloba a característica
de criação de redes e comunidades, por isso, Moherdaui (2010) afirma que a noção de
collaborative tagging, com a qual os usuários podem incluir metadados sob forma de palavras-
20
Linguista francês que contribuiu muito para estudos da semântica e análise de dados textuais.
21 Para saber mais sobre HTML e XML, cf. W3C Interaction Domain. Disponível em:
<http://www.w3.org/MarkUp/>. Acesso em 20 jun. 2014.
44
chave, ajuda na publicação de informações categorizadas, um sinal da organização proposta pela
Web Semântica. No capítulo 3, esse aspecto será explorado mais detalhadamente.
Corroborando Alvarenga e Souza (2004), Moura (2009) afirma que a estrutura da Web
Semântica requer três camadas distintas: a lógica, a ontológica e a camada esquema. A primeira é
a mais importante para esta pesquisa porque envolve a interface de conversação e os motores de
busca. A segunda trata das representações semânticas presentes em estruturas taxonômicas e, por
fim, a terceira camada diz respeito ao Resource Description Framework (RDF) e ao XML no
provimento das definições do documento e dos significados a eles associados.
Na visão de Moura (2009), a semântica é parte das constituições da Web 2.0, não podendo
se firmar como etapa evolutiva. Portanto, ela reforça o aspecto de complementaridade que já foi
abordado nesta pesquisa. Conforme Cunha (2006), a Web Semântica faz com que a máquina
consiga entender semanticamente uma determinada busca, o que se torna possível por meio da
utilização da RDF para descrever padrões de metadados e padrões representados por ontologias.
A Web Semântica vem eliminar a dependência de predefinições do usuário e aumentar a
potencialidade de recursos disponíveis para integrar redes, plataformas e sistemas. Isso permite
automatizar a colaboração entre aplicações, por meio de buscas mais efetivas e integração. “Se,
na primeira geração da Web, os documentos eram ligados entre si, deixando para o usuário o
papel de interpretar a natureza destas ligações, a nova geração da Web pretender ter ligações
semanticamente mais ricas, capazes de dar suporte às aplicações em suas negociações”.
(CAMPOS, 2006, p.57).
O aspecto tecnológico dessa integração só será possível com a criação de ontologias,
arquiteturas de metadados padrões, controle de linguagem, modelos de representação,
vocabulários e taxonomias capazes de maximizar o entendimento comum entre homens/máquinas
e máquina/máquina, principalmente tornando as informações compreensíveis para os softwares.
O foco desta pesquisa não é o aspecto tecnológico, mas sim os resultados do uso dessas
ferramentas na produção e na leitura na Web, principalmente do conteúdo jornalístico. Mesmo
assim, é necessário entender o que se passa por trás das operações semânticas e principalmente o
que ainda as impede de acontecer.
45
Um desses impedimentos é a incompatibilidade. A interoperabilidade de documentos e
sistemas na Web depende muito da forma como os dados armazenados são descritos ou definidos
nesses sistemas. Os elementos de descrição (metadados) são fundamentais para qualquer
processo de integração. Eles documentam, com elementos descritores, qualquer recurso
disponível na Web. Se esses elementos descritores tiverem um padrão para todos os sistemas, fica
mais fácil alcançar a operabilidade, por sua vez, facilita a transferência de conhecimento
semântico entre sistemas – situação base do funcionamento da Web Semântica.
Ainda sobre a interoperabilidade, é preciso que haja linguagem comum com etiquetas que
fazem parte do conteúdo do mapa dos sites. Assim é possível criar um vocabulário controlado,
por exemplo, com tesauros22
. A construção de ontologias – conjunto básico de conceitos, relações
entre termos e informações assertivas – também ajuda a promover uma base semântica para
esquemas de metadados, facilitando a comunicação entre sistemas e agentes. Ela ajuda a aliviar o
problema da heterogeneidade semântica, mas não o resolve por completo – sendo esse um dos
maiores desafios da Web Semântica.
Avançando da parte tecnológica para a prática mais próxima da realidade da produção e
leitura de conteúdo, um exemplo oferecido por Campos (2006) ajuda a entender a função da
inteligência da Web Semântica para os conteúdos. Ela pode tornar mais fácil a vida das pessoas
respondendo uma pergunta muito ampla em apenas um ato de busca. Por exemplo: “Qual o
melhor programa de pós-graduação sobre gestão da informação na região sudeste no Brasil?”.
Um resultado eficaz para essa pergunta poderia ser dado por um agente inteligente que “correria”
pela Web, compararia a pontuação das universidades de acordo coma a avaliação da Capes e
traria a lista de nomes. Em seguida, apanharia o formulário de inscrição e os dados sobre auxílio
financeiro dos programas de melhor colocação. Assim, entregaria não só a resposta completa,
mas uma oferta de inscrição para a “melhor” pós-graduação.
Parece mágico, mas é apenas uma possibilidade de busca inteligente em que sites estejam
22
“Vocabulário controlado e dinâmico de termos relacionados semântica e genericamente, cobrindo um domínio
específico do conhecimento, funcionando como dispositivo de controle terminológico usado na tradução de
linguagem natural dos documentos, dos indexadores ou dos usuários para uma linguagem do sistema mais
restrita”. (CAMPOS 2006, p.61, apud UNESCO, 1973, p.6).
46
integrados com padrões que dão maior clareza para o significado da informação manipulada.
Outro exemplo interessante é a possibilidade de que em apenas uma busca a máquina apresente
respostas para palavras de mesmo significado e grafia diferente. O buscador seria capaz de
entender que macaxeira, aipim e mandioca são diferentes expressões do mesmo conceito.
Enfim, surgem vertiginosamente ações tecnológicas e estudos que convergem para o
desenvolvimento da Web Semântica, na tentativa de estabelecer uma forma de navegar não
apenas por palavras-chave, mas por unidades conceituais que possam ajudar a encontrar
documentos de uma forma contextual. (CUNHA, 2006, p.22).
O que se pode perceber é que a Web Semântica é mais do que um conjunto de ferramentas
ou uma plataforma, ela impera com um modelo de produção e leitura cujas prioridades estão no
rearranjo inteligente de dados. Esse modelo é de natureza complexa, dotado de dinamismo, auto-
organização, emergência, feedbacks e ressonâncias. Tem efeitos em grande escala e um
comportamento baseado na linguagem. É por meio dela que será possível realizar processos de
cognição que relacionam volume de dados com objetos do mundo real e permitem que pessoas ou
máquinas movam-se por um infinito de informações conectadas não mais por fios.
2.5 Gestão da informação e conhecimento
A informação ganhou status de insumo básico para a construção do conhecimento e para
tomada de decisão. As condições técnicas da construção colaborativa da memória na Web nos
obrigam a repensar radicalmente as maneiras tradicionais de organizar os arquivos online. Na
rede, as informações estão dispersas em volumes imensuráveis por causa da característica de
liberdade de publicação, autonomia das fontes, descentralização e facilidade no uso da linguagem
natural. O alerta é que a informação, como um bem econômico e social, precisa ser bem cuidada,
por isso todos os profissionais envolvidos no processo de organização e de difusão devem se
empenhar na gestão rápida e de qualidade. “A memória do além-Web clama por um novo suporte
simbólico da conversação criativa, uma esfera semântica aberta, universal, democrática e
computável”. (LÉVY, 2014, p. 139).
47
As ferramentas da Web Semântica são opções para organizar o que Lévy (2014) chama de
“cérebro fractal planetário”, esse conjunto de memórias espalhadas na rede e que ainda não
dispõem de um sistema simbólico que lhes deem consciência reflexiva. A criação desse sistema
poderia ser um foco de políticas públicas, mas certamente serão muito mais resultado de
construções coletivas do que de iniciativa governamental. Lévy (2014) critica as expressões
“capital social” e “desenvolvimento humano” (que pautam políticas públicas de vários países)
dizendo que elas não estão ancoradas na gestão do conhecimento e que deveriam levar em conta
o funcionamento cognitivo das relações humanas.
Para ele, a gestão do canal semiótico está marginalizada, em detrimento de índices não
confiáveis (como as taxas de produto interno bruto, inflação, crescimento, alfabetização,
escolaridade, emprego e renda). O que o autor propõe é um conjunto coerente de dados que
expressem a realidade da sociedade do conhecimento para reunir esses polos. Ele cria um sistema
de coordenadas para endereçar significações e o chama de matriz IEML23
. As combinações
criadas por Lévy (2004) não serão exploradas nesta pesquisa, mas sim as ideias dele para chegar
à formação do sistema.
Lévy (2004) traça os passos da gestão coletiva do conhecimento começando pela gestão
pessoal do conhecimento, aquele em que o leitor exposto ao grande fluxo de informações faz suas
escolhas cognitivas, capta, reúne, filtra, sintetiza, compartilha e retoma o ciclo criativo na rede. O
autor explica como cada leitor pode gerir o próprio conhecimento, começando pela seletividade
da informação – que está associada à escolha de fontes – e terminando com o compartilhamento
dos dados selecionados.
Para ficar mais claro como esse ciclo se completa, vejamos um exemplo: um leitor recolhe
informações, via RSS feed24
, de todos os sites de notícia e blogs de que gosta. O recolhimento
23
IEML: Information Economy Meta Language: novo sistema de codificação das significações, graças ao qual as
operações de sentido na nova memória digital poderiam se tornar transparentes, interoperáveis e computáveis. É
uma linguagem formal de programação em que cada uma das suas expressões válidas modaliza um circuito
semântico próprio que canaliza fluxos de informação. (LÉVY, 2014).
24 Aplicação que permite que alguém não apenas acesse uma página, mas faça uma assinatura sendo notificado cada
vez que haja mudanças na página.
48
pode ser feito também via Twitter25
e Facebook26
, selecionando fontes de informação
preferenciais. O leitor filtra a informação e categoriza esses dados inserindo tags ou comentários
pessoais ao conteúdo. Com essa classificação, ele contribui para a gestão do conhecimento
coletivo, porque constitui redes de compartilhamento e amplia a linguagem natural da rede. Essa
informação categorizada poderá ser usada em curto prazo na memória coletiva (busca de
hashtags em Twitter ou Facebook) ou a longo prazo (como no Delicious27
).
O próximo passo é o leitor sintetizar e fazer um tratamento crítico da informação antes de
partilhar, para que a síntese dele seja útil no processo de colaboração open source e também
visível aos motores de busca. Em breve, após o compartilhamento, o leitor receberá feedback
sobre o conteúdo distribuído e ajudará as pessoas que fazem parte da sua rede a construir projetos
e pensamentos temporários. O exemplo citado pode ser repetir com outras ferramentas online,
pois, segundo Lévy (2004), independente da técnica usada, a função cognitiva do leitor continua
acontecendo. Esse ciclo sempre aconteceu, mas foi potencializado pela Web. Mas como explorar
todos os recursos do meio digital para aumentar a inteligência coletiva? Como a informação
poderia fazer do globo inteiro e do ser humano uma consciência única?
O desafio está lançado, ainda sem respostas concretas. Que a informática atual é capaz de
manipular quase automaticamente símbolos e dados, isso é claro. Mas não é capaz de manipular
conceitos. Os dois grandes embargos são, como já discutimos, o fato de os computadores serem
cegos semanticamente porque só compreendem sintaxe e, em segundo lugar, o fato de o código
usado (línguas naturais) ser irregular. A matriz IEML criada por Lévy (2014) elimina o segundo
problema porque lança um sistema simbólico cujas funções sintáticas e semânticas são paralelas.
O que ele propõe é uma metodologia complementar à Web Semântica proposta pela WWW
Consortium, de Bernes Lee, que ainda se baseia nos “opacos” URL. Lévy é otimista sobre o
futuro: “as pegadas que deixamos na Internet mostram o que fazemos e o que somos. Se somos
capazes de ver a imagem da nossa ação com algoritmos, seremos capazes de controlar a
25
TWITTER. Disponível em: <https://twitter.com/>. Acesso em: 20 ago. 2014.
26 FACEBOOK. Disponível em: <www.facebook.com>. Acesso em: 20 ago. 2014.
27 DELICIOUS SCIENCE LLC. Disponível em: <https://delicious.com/>. Acesso em: 20 ago. 2014.
49
inteligência coletiva na direção do desenvolvimento humano”28
. Santaella (2004) também tem
uma visão sobre essa inteligência:
Simular a inteligência não implica a construção de máquinas com hardwares
específicos, mas sim o desenvolvimento de programas computacionais operando
sobre dados ou representações. (...) inteligência passa a ser definida como
capacidade para produzir e manipular símbolos, tendo em vista a resolução de
problemas (SANTAELLA, 2004, p. 76)
Para Cunha (2006), a possibilidade de uso da Web de forma mais qualitativa viabilizará
uma maior velocidade ao processo de construção do conhecimento e este, por sua vez, promoverá
uma aceleração no alcance da inteligência coletiva. Para que cumpram seu papel transformador,
as informações precisam ser acessadas no tempo e espaço no qual se fazem necessárias. Precisam
também ser organizadas e transformadas em conhecimento. Morin (2003) corrobora as
afirmações:
Hoje, considero prioridade criticar o mito da comunicação. Existem afirmações,
verdadeiros slogans, que não contam do real e geram novos reducionismos. Diz-
se que estamos na “sociedade da informação”, na “sociedade da comunicação”
ou na “sociedade do conhecimento”. Refuto. Estamos em sociedades de
informação, de comunicação e de conhecimento. Claro que estamos em
sociedades de informações, até do ponto de vista físico, da teoria da informação,
basta pensarmos nas tecnologias digitais (DVD, televisão digital etc.), que são
aplicações da teoria da informação. Mas a informação, mesmo no sentido
jornalístico da palavra, não é conhecimento, pois o conhecimento é o resultado
da organização da informação. [...] temos excesso de informação e insuficiência
de organização, logo carência de conhecimento. (MORIN, 2003. p.8).
Por fim, destaca-se que a evolução cultural aponta para uma reunião da esfera midiática
em uma única estrutura digital de registro, de comunicação e de cálculo. Segundo Lévy (2014),
em um futuro próximo – que já se pode tocar, a esfera midiática tece um único meio social da
inteligência coletiva humana. Esta se auto-organiza em um meio para recolher os dados que ela
produz e explorar os dados que ela recolhe. Para o autor, não importa o nome – Web das pessoas,
Web dos dados, Web das coisas, Web local e ubíqua, Web dos saberes e dos tesouros culturais – a
grande rede constitui um único meio digital.
28
Palestra L’inteligence algorithmque, 5 de novembro de 2013, PUC do Rio Grande do Sul. Seminário Imaginário
em Rede.
50
2.5.1 O computador imitando a mente humana
Quando Lévy (2014) fala de “cérebro fractal planetário”, ele critica a incapacidade
informática de juntar dados e ideias. Um passo para sair dessa inércia semântica seria fazer com
que a rede tenha a capacidade de processar signos simbólicos, assim como fazemos nós,
humanos, quando nossa mente se insere no mundo físico retirando dele os significados. Tentar
fazer com que as operações da Web imitem o pensamento humano é o que Santaella (2005)
chama de “modelo computacional da mente”. A ideia surge da união de competências das
ciências cognitivas, da computação e da informação. O princípio fundamental é encarar o cérebro
humano e o computador como sistemas processadores de informação, com alguns aspectos que
os diferenciam. Apesar de distintos, os dois fazem processamento.
De acordo com Santaella (2005), a função intelectual da máquina é processar algoritmos
infinitamente sem qualquer conhecimento sobre seus significados, sendo que esse
“entendimento” torna-se o grande desafio da informática. As máquinas podem fazer operações
numéricas e eletrônicas sofisticadas, mas não são capazes de diferenciar os vários sentidos para a
palavra Lima, por exemplo, que tem pelo menos quatro significados conhecidos na língua
portuguesa: a cidade, a fruta, a ferramenta de amolar facas e o sobrenome. O ser humano, por sua
vez, consegue desmembrar as representações simbólicas dos algoritmos e incorporam o que
Santaella (2005), baseada nos estudos de Allen Newell29
, chama de “sistemas simbólicos físicos”.
Para o computador ter uma boa capacidade semântica ainda é necessário, além da criação
de processadores simbólicos, o desenvolvimento de uma linguagem natural – que envolva a
habilidade de manipular símbolos – para compor a automatização competente. O grande desafio é
simular computacionalmente a linguagem humana. Santaella (2005) propõe que as operações
realizadas no ciberespaço externalizam as operações da mente e as interatividades nas redes
29
Allen Newell foi um pesquisador da ciência da computação e psicólogo cognitivo americano que contribuiu para
a linguagem de processamento de informação e dois dos primeiros programas de inteligência artificial, a Logic
Theorist (1956) e o General Problem Solver (1957) (com Herbert Simon). Disponível em
<http://pt.wikipedia.org/wiki/Allen_Newell> Acesso em 20 jun. 2014.
51
externalizam a essência mais profunda do dialogismo de Bakhtin e Pierce30
, quando estes
colocam em primeiro plano a natureza coletiva dos sentidos da linguagem e o caráter
eminentemente social do signo. Morin (2003) corrobora as afirmações:
Uma das conquistas preliminares no estudo do cérebro humano é compreender
que uma das suas superioridades sobre o computador é poder trabalhar com o
insuficiente e com o vago; é preciso doravante aceitar uma certa ambiguidade e
uma ambiguidade certa (na relação sujeito/objeto ordem//desordem auto-hetero-
organização). É preciso reconhecer fenômenos, como liberdade e criatividade,
inexplicáveis fora do quadro complexo, o único que permite a sua aparição.
(MORIN, 2003, p.53).
Baseada em Pierce, Santaella (2005) postula que não existe pensamento sem signos.
Segundo ela, o pensamento acaba sendo uma extensão dos signos. “Qualquer coisa que esteja
presente à mente, seja ela de uma natureza similar a frases verbais, a imagens, a diagramas de
relações de quaisquer espécies, a reações ou a sentimentos, isso deve ser considerado
pensamento” (SANTAELLA, 2005, p.55). Em palestra na PUC do Rio Grande do Sul, em 2013,
a autora retomou essa ideia quando falou do crescimento extrassomático do cérebro humano.
Rompendo com o pensamento cartesiano de que o signo está separado do pensamento (matéria x
mente), ela conectou a semiosfera (mundo dos signos) com a noosfera (reino das ideais).
De acordo com Santaella (2013), os signos mais relevantes para todas as pessoas estão
externados e compartilháveis para formar o conhecimento e a memória coletiva. “Os signos são
mais eternos do que os mármores e os metais”, afirmou, parafraseando Shakespeare. “A única
entidade que pode estar dentro da mente e fora dela é o signo. O ser humano traduz pensamentos
em signos quando consegue materializar isso”, disse em apresentação no Seminário Imaginário
em Rede. Em suma, a ideia de Santaella (2013) é de que o cérebro humano se expande para fora
do corpo biológico por meio dos signos. Essas extensões de pensamento aliadas à tecnologia
acabam criando o que ela chamou de corpo biocibernético.
30
Santaela trabalha a comparação de ideias dos dois autores partindo da afirmação de Pierce de que todo
pensamento é dialógico na forma e de Bakhtin de que não é o nosso ego que dá significado à linguagem, mas é a
linguagem que dá significado ao ser humano e esse significado só pode emergir nas interações de vozes, nas
trocas e interseções entre o falante e seu ouvinte. Para Santaella, os dois autores constroem o conceito de
dialogismo como importante tese anticartesiana.
52
O mais importante para esta pesquisa é entender o momento em que o signo é
“extrojetado” do pensamento e se manifesta em meios ou suportes exteriores. Desenhos, escrita,
fotografia, cinema e música exemplificam esse “pulo” do signo para fora do cérebro. De acordo
com Santaella (2013), quando o pensamento toma corpo, principalmente em mídias específicas,
há uma enorme profusão da linguagem. A discussão que levanto sobre o uso das tags e a busca
delas na Web reflete esse encontro entre signo e linguagem, o lugar onde os campos semânticos
individuais e senso comum borbulham – local chamado por Santaella de matriz da linguagem e
pensamento.
2.6 Atratores
Para completar o ciclo em que se define a produção e a leitura na Web Semântica como
um sistema complexo, falta trazer uma das ideias fundamentais desta pesquisa em que as tags
protagonizam a sustentação teórica. As tags assumem o papel de articuladoras da complexidade
na Web, como será mostrado nos casos escolhidos para análise na dissertação, e fazem isso
essencialmente como atratoras de leitores na rota hipertextual.
O conceito de atratores, que vem da Física, se encaixa no contexto da análise da produção
e da leitura na Web Semântica. Segundo Parreiras (2005), os atratores definem rotas descritas
pelos sistemas complexos, servindo como pontos de concentração de “energias” do sistema.
Atrator é “o conjunto sobre o qual se move o ponto P que representa o estado de um sistema
dinâmico determinista quando [...] as forças exteriores que [estejam agindo] sobre ele sejam
independentes do tempo” (RUELLE, 1993 apud PARREIRAS, 2005, p. 92).
Palazzo (1999), por sua vez, explica os atratores com as metáforas do redemoinho nas
águas e de tornados no céu, que exemplificam uma força central sugando as massas dos sistemas
a partir de um ponto impreciso ou padrões de trajetória desses sistemas (Figura 5 e Figura 6). Para
ele, a força que atua nos atratores pode ter origem no próprio sistema e talvez seja essa uma
noção fundamental para entender a complexidade. Os dois exemplos usados são desenhos do
fenômeno chamado vórtice, justamente esse ponto de atração que se forma no movimento
53
circular dos sistemas a partir de duas bases: o desequilíbrio do sistema e o feedback contínuo.
Figura 5 – Vórtice
Fonte: http://www.mdig.com.br/
Figura 6 – Vórtice de redemoinho
Fonte: http://valentimeccel.no.comunidades.net/
54
D’Andréa (2011) enxerga os atratores como estados preferenciais e frequentes dos
sistemas complexos, os mais fáceis de serem observados e precisados quando se acompanha um
sistema dinâmico. Os atratores seriam os agentes na busca pela ordem, sem interrupção do
dinamismo, para o alcance da auto-organização. Só é possível observar esses atratores em
situações de constante transformação. Esta pesquisa mostrará que a produção e a leitura na Web,
muitas vezes, são regidas por atratores, reforçando a ideia do ambiente digital como um sistema
complexo que se auto-organiza a partir da dinâmica das redes hipertextuais.
No caso da Web, o atrator é aquele que puxa o fluxo da informação, que agencia, anima e
movimenta. Os padrões da leitura que serão mostrados nesta pesquisa estão cercados de atratores,
representados na Web pelas tags. Essas palavras-chave assumem a responsabilidade de controlar
simultaneamente o lógico e o semântico na rede. A Figura 5 e Figura 6 ajudam a entender essa
lógica de atração, de forma metafórica, porém descritiva. Afinal, conforme Parreiras (2005), uma
maneira de abordar o assunto da complexidade, considerando a ausência de definição satisfatória,
é descrever os espaços compreendidos entre o caos e a ordem.
De forma similar a D'Andréa (2001), que usou a complexidade para explicar os processos
editoriais da Wikipédia, concluindo a plataforma como um sistema adaptativo complexo regido
por uma dinâmica potencialmente auto-organizada e emergente, adoto a mesma lógica para
compreender a produção e a leitura na Web Semântica. Como já definido, esse modelo representa
um processo de comunicação multidimensional, feita de emissores e de receptores e que não se
esgota na presunção de eficácia do emissor, pois existe sempre um receptor dotado de
inteligência na outra ponta da relação comunicacional. Segundo Morin (2003), a complexidade
da comunicação continua a enfrentar o desafio da compreensão e “equilíbrio energético”. Parte
importante desse equilíbrio é a participação dos leitores dando sentido aos conteúdos online,
conforme será mostrado no próximo capítulo.
55
“O sentido não é nunca princípio ou origem, ele é produzido. Ele não é algo
de descoberto, restaurado ou reempregado, mas algo a produzir por meio de
novas maquinações. Não pertence a nenhuma altura, não está em nenhuma
profundidade, mas é efeito de superfície, inseparável da superfície como de
sua dimensão própria”. (DELEUZE, 2007, p. 75).
3 Folksonomia
É de maquinações de sentido que este capítulo vai falar, dos processos de inserção de
significado popular e espontâneo na Web. As combinações de sentido na rede têm origem na
participação e na colaboração, produzindo uma profundidade – antes unilateral, por parte dos
produtores de conteúdo onipotentes – e agora multifacetada. As inúmeras facetas fazem crescer a
memória deixada por essa maquinação de sentidos, com um legado online recuperável e
explorável para busca de conhecimento coletivo.
3.1 O termo folksonomia: cunhagem e definição
Thomas Vander Wal é o pai do termo folksonomia, um neologismo em alusão ao sistema
de classificação biológica de organismos, a taxonomia. O próprio criador conta que desde os anos
80 estudava as tags e o sentido adicionado por elas aos documentos. Nos anos 90, as pessoas
podiam adicionar palavras-chave a documentos e imagens compartilhadas usando serviços
pioneiros em conexão à Internet. Nos anos 2000, começaram as noções de colaboração nos
processos de tagging até que, em 2003, foi criado o Delicious, um classificador social de
favoritos.
Pouco tempo depois, o Flickr31
começou a usar o colaborative tagging, inserção
colaborativa de palavras-chave pelos usuários, como ferramenta de organização de conteúdo. No
período, Wal estudou essa lógica de organização, trocou e-mails e ideias em fóruns sobre o
assunto, por fim, um dia recebeu uma pergunta como esta: existe um nome para a classificação
31
FLICKR. Disponível em: <https://www.flickr.com/>. Acesso em: 20 ago. 2014.
56
social informal de pessoas que usam Flickr e Delicious e definem etiquetas e tags para a
informação compartilhada? Depois de inúmeras respostas dentro do fórum, um dos participantes
propôs: “folk classification”. Daí as ideias fervilharam na cabeça de Wal que, pouco depois,
cunhou o termo folksonomy.
Folksonomia é o resultado da atribuição livre e pessoal de etiquetas a
informações ou objetos (qualquer coisa com URL), visando sua recuperação. A
atribuição de etiquetas é feita num ambiente social (compartilhado e aberto a
outros). Folksonomia é feita pelo próprio consumidor da informação. (WAL,
2007 – tradução minha).
Para Wal (2007), a folksonomia tem um tripé como sustentação: a tag (etiqueta), o objeto
tagueado e a identidade – são todos fundamentais para desambiguação do conteúdo e fornecem
um rico entendimento do objeto marcado. De acordo com Assis e Moura (2013), as atribuições de
palavras-chave geram uma classificação popular que se origina das ações de representação da
informação, desempenhadas por usuários de diversos serviços da Web. É como se o uso de tags
agregasse manifestações da linguagem de sujeitos no processo de colaboração.
As tags são signos que se manifestam como símbolos, mas possuem nuances icônicas –
porque sugerem um compromisso do sujeito com o conteúdo que ele descreve – e indiciais –
porque representam a semiose do sujeito no momento em que escolhe a palavra (JOHANSEN,
1993 apud ASSIS; MOURA, 2013, p. 99). As palavras-chave na Web se transformaram em base
de renovação e sedimentação de linguagem, uma construção cíclica (complexa) de novas
significações, principalmente com o uso nas mídias sociais.
Primo (2010) traz alguns exemplos em que as hashtags32
são usadas como demonstração
de afetos entre tuiteiros33
, como se fizessem uma função da linguagem não-verbal (gesto, boca
torta, sobrancelha franzida): #prontofalei e #rialto. O autor acredita na naturalidade dessa
linguagem que não surgiu, necessariamente, com a intenção de fazer uma rota de informações a
32
Hashtags são compostos pela palavra-chave do assunto antecedida pelo símbolo cerquilha (#). As
hashtags viram hiperlinks dentro da rede, indexáveis pelos mecanismos de busca. Sendo assim, outros usuários
podem clicar nas hashtags ou buscá-las em mecanismos como o Google, para ter acesso a todos que participaram da
discussão. (Disponível em http://pt.wikipedia.org/wiki/Hashtag. Acesso em dezembro de 2014)
33 Usuários Twitter.
57
serem recuperadas, mas sim como um uso menos estruturado. Cabe aos produtores de conteúdo
online – como jornalistas – aproveitarem para estruturar essas informações de forma favorável,
quer seja para capturar os olhares do leitor na rota hipertextual por meio desses atratores, quer
seja para criar padrões de busca e recuperação para memória da informação. Afinal, é nesses
vórtices que estão concentrados os leitores, pois as tags “manifestam a linguagem compartilhada
e modelada continuamente pelas redes sociais que se agregam em torno da organização e do
compartilhamento da informação em contextos digitais colaborativos” (ASSIS; MOURA, 2013,
p.101).
Outros exemplos de serviços que permitem processos de folksonomia são LastFM,
LiveJournal, Youtube, entre outros. Os exemplos operam de forma diferente o uso de tags, mas
criam comunidades em torno dessas palavras-chave de forma bem natural em conjunto com a
operação do sistema. Com tantas ferramentas disponíveis, o produtor de conteúdo online precisa
se enxergar mais como gerenciador de dados na Web, pois, segundo Assis e Moura (2013), a
folksonomia pode ajudar a resolver gaps históricos na organização da informação: a distância
entre a linguagem de indexação e a linguagem do usuário, além do buraco entre produção de
conhecimento e a representação da informação.
A digitalização das informações, a redução dos rituais sincrônicos e a produção
da informação sob demanda provocaram mudanças radicais na disseminação da
informação e, consequentemente, exigem que sejam realizadas alterações nas
metodologias de elaboração dos instrumentos verbais de representação da
informação. Hoje, verificam-se grandes transformações nas formas de agregação
e de arbitragem em torno da informação e do conhecimento (MOURA, 2009, p.
60).
Sabbatini (2011) enxerga a folksonomia como agenciadora de novas narrativas midiáticas
e cria o termo folkcomunicação, compartilhado no pensamento de Jenkins (2008) sobre
convergência e sobre “spreadable media”34
(JENKINS, 2013). As camadas populares florescem
na Web, potencializadas pelo processo tagging, e encontram voz e vez. Elas operam a
participação online como sistema paralelo à comunicação hegemônica e, além de criar um novo
34
Conceito usado para descrever a mídia contemporânea a partir das metáforas que envolvem os virais na Internet,
ou conteúdos que se espalham com facilidade.
58
fluxo de informações, quebram os modelos de negócios de mídia construídos durante anos.
As ideias dos dois autores se encontraram quando pensam em uma mídia com
envolvimento público, em ambiente de participação e com distribuição da informação de forma
“viral”. Para Sabbatini (2011), os receptores se tornam produtores, até mesmo de conhecimento.
Ele considera a folksonomia como catalogação dos excluídos e, junto com a convergência de
mídias, uma agente potencializadora do acervo cognitivo e da bagagem cultural de camadas antes
classificadas apenas como receptoras.
O uso de tags pelos leitores estabelece novos fluxos informacionais e determinam
assuntos, temas, fontes que interessam muito mais ao conjunto de sujeitos que estão “capturados”
no entorno dessas palavras-chave. Como a folksonomia é uma classificação orientada não por
especialistas ou produtores de conteúdo, mas sim pelos usuários das informações e documentos,
ela abre espaço para contrapontos. De acordo com Moreno (2012), a folksonomia gera riqueza
semântica versus polissemia, baixo custo versus baixa precisão, inexistência de padrões de
vocabulário versus baixo controle de sinônimos. Toda essa imprecisão acontece porque a
folksonomia opera como um processo de comunicação que deixa vestígios de comportamento e,
por sua vez, consolida práticas culturais e discursivas de cada indivíduo. No entanto, não há
problema nessa imprecisão, pois ela resulta em processo de construção de conhecimento mais
espontâneo, conforme afirma Sterling (2005):
Ela [folksonomia] oferece um comportamento de rebanho muito barato e
assistido por máquinas; senso comum ao quadrado; uma corrida às nascentes da
semântica. É como se você jogasse um caiaque em um rio agitado e deslizasse
não apenas pelas páginas da Web, mas também por rótulos, conceitos e ideias.
(STERLING, 2005, p. 2).
A etiquetagem popular surge da combinação de máquinas capazes de automatizar, pelo
menos em parte, o necessário para classificação da informação e softwares sociais que tornam os
leitores dispostos a participar do trabalho em troca de nada. O que se forma aparentemente é um
vocabulário descontrolado com o uso de neologismos e gírias como etiquetas. Para Amstel
(2007), no entanto, o que se tem é a movimentação de regulação da cultura horizontal. Isso
conota a intenção de pertencer a determinados grupos de falantes que possuem vocábulos
próprios, a expressão da identidade do leitor em relação a esses grupos e a maximização das
59
trocas linguísticas dentro e fora dos grupos na Web. “A escolha das etiquetas para registrar a
visão do indivíduo sobre um determinado recurso a ser catalogado é um ato de identificação com
um grupo, mesmo que o indivíduo não esteja consciente disso”. (AMLSTEL, 2007, p. 18).
Diante disso, Van Amstel (2007) conclui que os vocabulários não são tão descontrolados
como parecem. Existe controle, mas este não é centralizado nem forçado. Trata-se de
movimentos reguladores da cultura no sentido horizontal, que se propagam pelos laços da rede
social do indivíduo. Essas escolhas se baseiam na identidade cultural de cada sujeito, habilidades
discursivas e cognitivas. Assim, a folksonomia acomoda certa diversidade cultural, no momento
em que muitos pensaram que a solução para a organização de dados na rede seria homogeneizá-
los. O simplismo da homogeneização não caberia na complexidade da Web Semântica.
Por fim, muitos autores discutem se os resultados da folksonomia ficam como legado para
recuperação e indexação de informações na Web, alguns acreditam que, por ser uma etiquetagem
não intencionada, não serviria para formação de memória formal, mas outros acham que tem
utilidade. Nesta pesquisa, considerando a folksonomia como um paradigma de classificação,
aceita-se que é possível que seja uma ferramenta de recuperação, como será mostrado em dois
exemplos práticos de cobertura jornalística em que um processo de classificação beneficiou a
distribuição de conteúdo online e, por sua vez, gerou mais audiência. O que fica como desafio é a
criação de aplicações que mantenham o caráter colaborativo da folksonomia e consigam atingir
qualidade na indexação de tags.
3.2 Folksonomia e semântica
Os sistemas de classificação e indexação sempre existiram, independente da Web, para
organização de conteúdos de bibliotecas diversas. O mesmo raciocínio de organização não
poderia ser usado online? A resposta é não, porque o ambiente físico de bibliotecas é mais
organizável do que a esfera semântica formada por um mar de documentos espalhados em rede
mundial. Além disso, a possibilidade de etiquetagem variada, feita pelos leitores, amplia ainda
mais a escala de palavras ou expressões a serem indexadas.
60
A solução para os problemas advindos da folksonomia seria, segundo Lévy (2014), a
criação de uma escrita de segunda classe, ou uma metalinguagem capaz de guiar o fluxo de dados
na Web. A nova geração de escrita seria, conforme o autor, universal (porque exprime uma
memória mundial), democrática (porque a manipulação não é exclusiva de especialistas e sim de
todos os leitores) e calculável (porque permitiria informatização – criação de computação
ubíqua). Essa metalinguagem viria “para transformar o dilúvio de informação em memória útil,
organizada, portadora de conhecimento, além das barreiras da língua” (LÉVY, 2014, p. 169). É
utópico o que o autor propõe? Talvez sim, mas ele mesmo cria uma linguagem simbólica que, por
enquanto, é única nessa nova geração de escrita, como já foi abordado, o IEML.
As trocas construtivas na Web são muitas vezes agenciadas por hashtags. As mensagens
do Twitter apontam para uma URL com dados multimídias. Segundo Lévy (2014), as mensagens
categorizam esses dados por meio de um breve comentário e/ou por meio de uma hashtag (nesse
caso uma etiqueta metadado). “Em particular as hashtags servem para reunir e encontrar nos
motores de pesquisa especializados – como Twitter search, Twazzup e Topsy – os URLs, os fios
de discussão ou os comentários que concernem o mesmo assunto” (LÉVY, 2014, p. 154).
Dessa forma, dados são filtrados, categorizados e re-categorizados na Web em um
movimento cíclico. Assim, os motores de busca acumulam dados e organizam metadados à sua
memória automatizada. O uso dessa memória pelos leitores transforma os dados iniciais
acumulados em conhecimento. Simetricamente os saberes viram novos dados no ambiente digital
e metadados – por meio da atividade de categorização (em tags ou hashtags). Por causa desses
processos cíclicos, um leitor na Web acaba criando uma identidade semântica e sendo encontrado
por motores de pesquisa justamente pelos seus “marcadores de zona semântica” (LÉVY, 2014, p.
158). É como se um leitor, pelos caminhos na rota hipertextual, criasse um campo de etiquetas
que declaram os interesses desse leitor (em assuntos específicos, notícias, jogos, pessoas etc.). O
fluxo de informações que chegam até ele – de forma automatizada ou natural na Web – ou que ele
busca, provavelmente será de conteúdos relacionados/codificados ao interesse.
A confluência de milhares e milhares de marcadores de zona semântica forma uma grande
esfera onde se encontram a memória coletiva e a inteligência. O mais incrível é quando essa
esfera sai do ambiente virtual e se materializa em projetos temporários e cambiantes como
61
manifestações populares – o caso do movimento35
, em junho de 2013, no Brasil agenciado, por
exemplo, pelas hashtags #vemprarua e #ogiganteacordou.
O cenário cíclico de construção da memória coletiva estaria perfeito se não fosse a
transversalidade de saberes, de comunidades, de pessoas, de mídias sociais e de sistemas. Ainda
não conseguimos tirar partido desse potencial de conhecimento de forma automática porque não
temos uma codificação única e inteligente capaz de ler toda essa esfera semântica e reuni-la. Uma
mesma pessoa pode usar o Twitter, o Facebook, um feed de notícia do Globo.com, um blog na
plataforma Wordpress, o Delicious e criar em cada uma dessas plataformas sua zona semântica,
sendo que essas zonas podem nunca “se comunicar” por uma incompatibilidade de sistemas.
Algumas dessas plataformas “se comunicam”, como quando alguém posta no Twitter ou no
Instagram e aparece na timeline do Facebook, mas segundo Lévy (2014), ainda estamos longe de
uma circulação transparente – que transponha a concorrência entre essas mídias – e permita a
gestão do conhecimento.
Da mesma forma que a informática conheceu uma verdadeira revolução nos
anos 1990, com a generalização dos computadores pessoais, é possível que a
gestão dos conhecimentos conheça no curso do século 21 uma verdadeira
revolução descentralizadora, dando mais poder e autonomia às pessoas e aos
grupos auto-organizados. Mas isso só poderá acontecer por meio da adoção de
um protocolo comum para a expressão dos metadados semânticos que permitirá
a conversação criativa dos limites impostos pelos grandes atores centrais da
Web. (LÉVY, 2014, p. 161).
Além da tríade proposta por Wal (2007) (tag-objeto-identidade), o aspecto semântico ou a
rede de conceitos gerada pela folksonomia é um elemento muito importante. Conforme Assis e
Moura (2013), a classificação popular permite a emergência de padronização de terminologias
quando o “crivo” de vários sujeitos fortalece determinados termos e enfraquece outros. A
autoridade ou credibilidade desses termos surge de acordos coletivos propiciados pelo contexto
dinâmico e auto-organizado da rede. É neste ponto que o uso de tags ajuda a cada vez mais firmar
e manter a Web como sistema complexo, em clico autopoético principalmente no aspecto
semântico.
35
Manifestações em todo o Brasil durante a Copa das Confederações.
62
Segundo Assis e Moura (2013), como a folksonomia tem origem na indexação social,
acaba constituindo espaços sociais semânticos nos quais ocorre agregação de subjetividade e
objetividade – as duas baseadas em linguagem natural. Isso confere à folksonomia elevado grau
de semanticidade, mas baixo grau de formalidade na linguagem. Para as autoras, o intercâmbio
entre essas duas características é historicamente observado em processos de organização da
informação. O equilíbrio delas ajuda a sanar problemas próprios de processos folksonômicos,
como sinonímia e polissemia.
Com efeito, os tags de folksonomia são incoerentes por causa dos fenômenos de
sinonímia, sem falar do ruído introduzido pelos erros de ortografia, os plurais, as
abreviações, etc. Além disso, os tags correspondem a graus de generalidade
muito diferentes e se organizam mal em classes e subclasses. Enfim, a
multiplicidade de línguas naturais (nas quais os tags são geralmente expressos)
ainda fragmenta gravemente as conversações criativas que começaram há alguns
anos a organizar a memória mundial. (LÉVY, 2014, p. 167).
No contexto da Web, algumas ferramentas surgem como promessa de solução para a
busca inteligente de palavras do mesmo significado e grafia diferente ou vice-versa. Os sistemas
de busca foram os que primeiro atentaram para a análise semântica do conteúdo da Web, com
objetivo de retornar resultados superando ambiguidades associadas. Os sistemas de busca
convencional apresentam baixo suporte para informações contextuais, analisando o conteúdo da
página (por meio de links) sem eficiência de informações semânticas. Atualmente surgiram os
buscadores semânticos que usam uma lista de operações coordenadas, ou seja, algoritmos que
geram estatísticas a partir das palavras e seus significados. Alguns exemplos são o
WolframAlpha36
, Swoogle37
e Kartoo38
. Mesmos com os avanços, é preciso pensar mais
rapidamente em um futuro de interoperabilidade e competente recuperação de informações na
Web.
Em última instância, nenhum cérebro humano, nenhum planeta cheio de
cérebros humanos, poderia catalogar o oceano escuro e em expansão de dados
que produzimos. Em um futuro de informação auto-organizada pela
36
WOLFRAM ALPHA. Computational knowledge engine. Disponível em: <http://www.wolframalpha.com/>.
Acesso em: 5 jul. 2014.
37 SWOOGLE. Semantic Web Search. Disponível em: <http://swoogle.umbc.edu/>. Acesso em: 5 jul. 2014.
38 KARTOO. Disponível em: <http://www.kartoo.com/>. Acesso em: 5 jul. 2014.
63
“folksonomy”, poderemos nem ter palavras para o tipo de classificação que
estará ocorrendo; como as verificações matemáticas com 30 mil etapas, ela
poderá estar além da compreensão. Mas permitirá buscas vastas e incrivelmente
poderosas. Não surfaremos mais com as máquinas de busca. Faremos arrastão
com as máquinas de significado. (STELING, 2005, p.2).
3.3 Narrativas tagueadas
A narrativa social, informativa e feita pelo usuário tornou-se possível graças aos avanços
da Web baseada em tags e da computação em nuvem. Essa narrativa é composta em parte pelos
processos de folksonomia e pela noção transmidiática trazida com a participação dos leitores nos
conteúdos online. É uma narrativa que surge como a convergência das mídias e prevê uma
estética que faz novas exigências aos consumidores, dependendo da colaboração deles. “A
narrativa transmídia é a arte da criação em um universo” (JENKINS, 2009, p.49).
O diferencial das narrativas transmídia – da qual fazem parte as narrativas tagueadas – em
relação ao contar história tradicional, é que elas requerem abordagens plurimidiáticas, conforme
definem Alzamora e Tárcia (2013). A narrativa assumiu, por muito tempo, uma forma textual
(monomidiática), no entanto se descobriu que ela pode ser adaptada a qualquer mídia porque a
essência de narrar está na composição estrutural da história, na ordem dos fatos, nos personagens
e na presença de um narrador. Na versão transmídia, o leitor (antigamente destinatário da
história) compartilha o ato de narrar, resultando em um processo de formação de sentido
fragmentado e multifacetado (ALZAMORA; TÁRCIA, 2013).
O jornalismo tem experimentado dessas diversas faces quando incorpora histórias
contadas por meio de várias plataformas (vídeo/TV, áudio/rádio, infografia/Web) e com o
enriquecimento da participação de leitores (comentários, tuítes, compartilhamentos). Para Jenkins
(2009), uma história transmídia se desenrola por meio de múltiplas plataformas de mídia, com
cada novo texto contribuindo de maneira distinta e valiosa para o todo. Para ele, cada ponto de
acesso à história ou ao fato deve ser autônomo e cada um deles deve garantir acesso aos demais.
A compreensão obtida por meio de diversas mídias sustenta uma profundidade de experiência que
motiva mais consumo (JENKINS, 2009, p. 138).
64
A questão que se apresenta ao jornalismo nesse sentido, conforme o trabalho de Campos
(2013), é até que ponto os conteúdos – muitas vezes reunidos em matérias online – não se
complementam. Alguns modelos vendem uma falsa convergência, quando na verdade as
narrativas apresentam tanta autonomia que não podem ser vinculadas como uma produção
convergente. Nem todo conteúdo disperso na rede pode ser considerado narrativa transmidiática,
às vezes as peças do quebra-cabeça não foram geridas para a concepção de um produto com um
planejamento na origem (ALZAMORA; TÁRCIA, 2013). Por isso, considero as narrativas
tagueadas uma parte para alcançar a forma transmidiática.
O ato de compartilhar nas redes sociais exemplifica o tagueamento de narrativas, levando
em conta que as marcações inseridas pelo leitor quando posta um conteúdo é um complemento à
história já contada, seja esse complemento em forma de comentário, hashtag, foto, ou até mesmo
um emoticon39
. Uma pessoa que recebe em sua timeline40
uma matéria jornalística sobre as
organizações do Brasil para receber os turistas na Copa do Mundo em 2014, acompanhada da
hashtag #naovaitercopa, que foi inserida por um amigo, tem elementos “além-texto” que vão
contribuir para a formação de sentido sobre aquele conteúdo.
O amigo que partilhou a reportagem inseriu uma categorização popular, influenciando a
passagem da narrativa, que chega reconstruída ao novo leitor. Isso não significa que se completou
uma produção transmidiática, mas influenciou o processo de leitura. Um compartilhamento como
esse poderia, sim, gerar uma retroalimentação para os produtores de conteúdo (neste caso
jornalistas) planejarem uma narrativa transmídia levando em conta o que a inserção
#naovaitercopa traz como contexto, considerando-a uma tag atratora de engajamento temporário.
A mudança do jornalismo digital, embasado na mídia impressa, para o jornalismo semântico e
tagueado traz aflições e também novas perspectivas, que serão exploradas no próximo capítulo,
baseado na expressão criada por Moherdaui (2010), o jornalismo baseado em tags.
39
Os emoticons são fenômenos de popularidade na internet. São formas de comunicação extralinguística pelas quais
se expressa emoção por meio de um ícones (uma carinha triste ou feliz, uma careta ou um coração). A palavra
emoticons une (emotion) emoção + ícone. Muitas vezes os ícones demonstram uma expressão facial que a pessoa
faria “ por trás” das telas naquele contexto.
40 Timeline é linha do tempo. No contexto da Web significa a exibição de atualizações e conteúdos para o leitor
quando ele usa uma rede social como Twitter ou Facebook.
65
“A linguagem é tornada possível pelo que a distingue. O que separa os sons e
os corpos faz dos sons os elementos para uma linguagem. O que separa falar
e comer torna a palavra possível, o que separa as proposições e as coisas
torna as proposições possíveis. O que torna possível é a superfície e o que se
passa na superfície: o acontecimento como expresso”. (DELEUZE, 2007, p.
191).
4 Jornalismo baseado em tags
O trabalho jornalístico se revela quando a linguagem traduz um acontecimento dando
origem à notícia. Como saber se um fato merece a publicidade de notícia? É como separar corpos
de sons. É retirar do acontecimento o que ninguém vê: o melhor ângulo, a melhor frase, a melhor
fala e a melhor história. A notícia é “tornada possível pelo que a distingue”. Quem diz o que é
notícia é o leitor, a audiência para o “acontecimento como expresso” (DELEUZE, 2007, p. 191).
A essência do jornalismo é a notícia (prevista ou imprevista). Atualmente ela é costurada em uma
série de mudanças tecnológicas e de modos de fazer diferentes. É desse emaranhado de linhas,
pontos e agulhas que este capítulo vai falar.
4.1 Rupturas e continuísmos
A “união” entre comunicação, computação, informação e memória é um mecanismo de
mudança social. O jornalismo, por sua vez, acompanha essas mudanças se apropriando de
tecnologias e ferramentas que elucidem essa “união” com objetivo de melhorar produção e
distribuição de conteúdo. O jornalismo baseado em tags é resultado de um uso não trivial da Web
para produção de conteúdo ancorado na mistura entre o pensamento computacional definido por
Wing (2006) e pensamento comunicacional definido Miège (2000):
Pensar computacionalmente é pensar recursivamente. É processamento paralelo.
É interpretar o código como dado e o dado como código. É a verificação de tipo
como a generalização da análise dimensional. [...] É julgar um programa não
somente pela exatidão e eficiência, mas pela estética e o design do sistema pela
simplicidade e elegância. É usar abstração e decomposição quando se ataca uma
grande e complexa tarefa ou se projeta um grande sistema complexo. [...] É ter a
66
confiança que podemos seguramente usar, modificar, influenciar grandes
sistemas complexos sem entender de todos os detalhes. (WING, 2006, p. 33 –
tradução minha).
O pensamento comunicacional não é estático. Ele é o produto da história
humana. Não é, porém, uma criação constantemente renovável, ele é
profundamente marcado por suas origens, e as etapas por que passou ao longo
dos últimos 50 anos são particularmente esclarecedoras por causa disso.
(MIÈGE, 2000, p. 15).
Juntar esses dois pensamentos é uma ação que provoca rupturas e continuísmos no
processo de produção jornalística. A principal ruptura do jornalismo baseado em tags para o
jornalismo digital que se fez por muitos anos é o encerramento da cultura da página, com a
organização da informação baseada no mecanismo de o leitor folhear o conteúdo, passando para a
noção do leitor navegando pela rota hipertextual.
O que se tem na verdade como ruptura é a implosão do processo comunicacional pautado
em hierarquia, conforme mostrou a tese de doutorado de Luciana Moherdaui. Focada em
características de interface, a autora mostra que a produção baseada na lógica das tags leva à
morte do browser no formato de leitura ancorado ao modelo do impresso. Para a autora, é hora de
pensar um jornal como rede social – um “facejournal” – no qual o leitor faz login e vira jornalista
automaticamente produzindo notícias.
Alguns exemplos de construções jornalísticas baseadas em tags, que fogem da hierarquia
tradicional, podem ser vistos em sites como os agregadores de notícias 10x1041
e Digg42
, a
reportagem especial sobre Hiroshima na plataforma Google Earth43
, o mapa open source44
usado
na cobertura da greve de metrô em Londres pela BBC, o rastreador de tweets relacionados ao
escândalo da decisão de Rupert Murdoch em fechar o News of The World45
. Há também outras
41
10x10. Disponível em: <http://www.tenbyten.org/10x10.html>. Acesso em: 28 ago. 2014. 42
DIGG. Disponível em: <http://digg.com/>. Acesso em: 28 ago. 2014.
43 http://hiroshima.mapping.jp/ge_en.html
44 LONDON Tube Strike Map. November 28th/29th 2010. Disponível em:
<https://tubestrike.crowdmap.com/main>. Acesso em: 28 ago. 2014.
45 THE GUARDIAN. Disponível em: <http://www.theguardian.com/media/interactive/2011/jul/13/news-of-the-
world-phone-hacking-twitter>. Acesso em 28 ago. 2014.
67
iniciativas, não necessariamente jornalísticas, mas que informam e usam ferramentas
interessantes de semântica como o balizador de termos Google Flu Trends46
. Por meio dele, o
Google monitora palavras-chave relacionadas à gripe (como sintomas, posologia, entre outras) e
monta um mapa indicando mês a mês quais as localidades do mundo que mais buscaram aqueles
termos. Com isso, constrói um banco de dados que reflete exatamente a realidade da gripe pelo
mundo, em estações diferentes do ano, podendo servir até como base para políticas públicas de
saúde. Outro exemplo é a aplicação We Feel Fine47
, que reúne tags de sentimentos (feliz, triste,
entediado, entre outros) postadas por tuiteiros e assim traça o humor da população online no
microblog segundo a segundo. Um terceiro exemplo é o Geoplay48
, que traça uma rota em mapa
de um destino inicial e final mostrando todas as fotos postadas na Web sobre monumentos,
prédios ou ruas que fazem parte daquele caminho.
Nenhuma dessas ferramentas deve excluir os veículos de comunicação, mas incluí-los e
motivá-los a usar instrumentos novos de produção e distribuição de notícias, conforme constata a
autora:
A interface jornalística deveria ser pensada não só a partir de um coletivo
inteligente, mas do input de dados e tags, pois ela opera por revezamento entre
informação e contrainformação; poder e contrapoder. É resultado de alteridades.
Não há uma estética definitiva. As redes colocam em xeque a estética
PowerPoint de Manovich e os formatos portal e site não cabem nessa nova
abordagem. É como afirmou o escritor Clay Shirky: uma das razões pelas quais
o Google foi bem-sucedido é o entendimento de que não há arquivos, não há
prateleiras. (MOHERDAUI, 2013, p. 231).
O principal continuísmo do jornalismo baseado em tags é a rotina de pensar a notícia com
uma experiência social, em uma rota hipertextual do leitor que é compartilhada, principalmente,
por meio das redes sociais. Essa experiência cria um ambiente cíclico para circulação e
reverberação de notícias. Na maioria das vezes, essa reverberação é responsável pela
multiplicação de dados e campos semânticos de um assunto/conteúdo. Quando os jornais
46
TENDÊNCIAS da gripe. Google.org. Disponível em: <http://www.google.org/flutrends/>. Acesso em: 28 ago.
2014/.
47 WE feel fine. Disponível em: <http://wefeelfine.org/>. Acesso em: 28 ago. 2014.
48 GEOPLAY. Disponível em: <http://geoplay.info/pt/>. Acesso em: 28 ago. 2014.
68
entendem essa leitura social, vão em busca da captura do leitor, muitas vezes agenciada por tags
ou hashtags.
Além da ruptura e do continuísmo apontados, é preciso destacar o trabalho jornalístico
permeado pela habilidade em lidar com dados. Um levantamento feito pelo fabricante de
equipamentos Cisco49
mostra que há previsão de que o tráfego online cresça para 767 exabytes
em 2014. Um exabyte equivale a 1 bilhão de gigabytes e uma pessoa levaria 72 milhões de anos
para ver todo o conteúdo de vídeo circulando pela rede nos 365 dias do ano. No jornalismo
baseado em tags, o repórter dever estar pronto para cruzar dados e relacioná-los com seus
objetivos de audiência, como é mostrado nos casos desta pesquisa.
Como pesquisadora e repórter da área, admito as mudanças e tento entendê-las. Melhor do
que insistir na ideia, quase senso comum, de que o jornalismo como segmento cultural e
profissional está em uma crise intransponível. É possível transpor e o caminho está na rota
hipertextual. Os estudos desta pesquisa são APENAS exemplos do que pode ocorrer no contexto
da Web Semântica, que tem um mundo de ferramentas e possibilidades de uso não trivial. No
jornalismo, ainda podem ser trabalhadas as perspectivas do lead semântico, hacking jornalístico,
jornalismo computacional, mashups e uso de programação no jornalismo, mineração de dados
para aproximação e agregação de informações, além dos temidos bots, que publicam textos em
massa. O que não se pode perder de vista é que a “a informação como forma é indissociável de
uma constelação onde ela se associa às noções de código, de transmissão, de tradução, de ruído e
de redundância”. (LÉVY, 2014, p. 90).
4.2 Quem é esse leitor?
Quem é esse leitor? É o cidadão que está em rede. É o prosumer/produser que está pronto
para obter a informação e transformá-la em notícia. “Ele reconfigura a lógica dos critérios de
49
TRÁFEGO online será quatro vezes maior até 2014. Olhar Digital. 03 jun.2010. Disponível em
<http://olhardigital.uol.com.br/noticia/trafego-online-sera-quatro-vezes-maior-ate-2014/12145>. Acesso em: 28
ago. 2014.
69
noticiabilidade, muda a agenda da imprensa e inclui fatos ao noticiário que circula na Internet.
Ele não só produz como valida e recomenda uma informação. É dessa maneira e dá a legitimação
na rede. E isso se reflete na interface, na maneira como ela se constitui”. (MOHERDAUI, 2012,
p.111).
O leitor agenciador da rota hipertextual baseada em tags é o sujeito a ser capturado pelos
produtores de conteúdo. É aquele que o jornalista não quer ver disperso, mas sim tê-lo como
audiência, seguindo os atratores na rede e se concentrando nos vórtices do sistema complexo.
Esse leitor participa diretamente do processo de organização da informação, principalmente
quando pratica folksonomia, ajudando a construir novas narrativas e agenciando comunidades em
torno de conteúdos específicos.
Conforme Santaella (2004), tendo a multimídia como suporte e a hipermídia como
linguagem, só é possível pensar no surgimento de um tipo de leitor, o imersivo – aquele que se
depara com a tela. Mesmo havendo semelhanças no modo de leitura, o leitor imersivo é obrigado
a escolher entre nexos, direções e rotas para concluir a atividade de leitura.
[...] conectado na tela, por meio de movimentos e comandos de um mouse, os
nexos eletrônicos dessas infovias, o leitor vai unindo, de modo a-sequencial,
fragmentos de informação de natureza diversas, criando e experimentando, na
sua interação com o potencial dialógico da hipermídia, um tipo de comunicação
multilinear e labiríntica. (SANTAELLA, 2004, p.11).
Segundo Santaella (2004), esse leitor está transitando em arquiteturas líquidas. Uma
comparação interessante da autora é dos leitores online com a identidade do homem moderno,
chamada de flâneur, aquele que passeia pela cidade com olhar contemplativo, ondulante e aberto
à vertigem de alteridades. Esse expectador-visitante é o leitor exposto a uma multiplicidade de
imagens, registros e tipos de estímulos.
Mais importante para esta pesquisa é pensar nesse leitor sem a visão cartesiana em que
corpo e mente estão separados – assim como foi representado historicamente em filmes, livros e
estudos científicos. Nessa visão incompleta, o corpo é visto como inerte e a mente como o
elemento que se junta ao tecnológico em uma navegação virtual. No entanto, segundo Santaella
(2004), o que não se enxerga, muitas vezes, é que essa visão é carregada de um dualismo
70
simplificado porque corpo e mente são indissociáveis. Por exemplo, quando um leitor busca uma
palavra-chave na Web, reage aos resultados, seja pelo movimento aplicado ao mouse ou ao
teclado. Os caminhos que o click do mouse farão o leitor tomar são imprevisíveis, mas a reação
de interagir é quase certa. O fato é que o corpo também influencia a mente e vise versa, em
reações cíclicas.
No contexto do jornalismo baseado em tags, a leitura é e sempre foi mais do que uma
experimentação, é uma ação. No desenho da Web Semântica, a parcela interativa do leitor se dá
pela inserção de dados e metadados. Sobre isso Santaella (2004) define uma contrapartida, que
será tema do próximo tópico da pesquisa:
[...] nesse contexto, o emissor não emite mais mensagens, mas constrói um
sistema com rotas de navegação e conexões. [...] O que se tem aí, portanto, não é
só um tipo de interatividade interpessoal mediada pela máquina, mas também
uma interatividade transindividual, em que a pessoalidade do cibernauta se
pulveriza em tramas infinitas de nexos e passagens por situações e sítios virtuais,
nos quais emissor e receptor perdem seus limiares definidos para ganhar uma
face plural, universal, global. (SANTAELLA, 2004, p.163).
4.3 Quem é esse jornalista/produtor?
Quem é esse jornalista/produtor? É o profissional polivalente50
da atividade humana usada
para compartilhar e colocar em comum: a comunicação, conforme define Charaudeau (2010).
Especificamente na comunicação mediada por computador, durante o processo de “colocar em
comum”, o jornalista lida com termos como “transmissão, publicação e recepção para incorporar,
anotar, comentar, responder, agregar, cortar, compartilhar, além dos termos em inglês download,
upload, input e output” (MANOVICH apud MOHERDAUI, 2010, p.214).
Além disso, é o agente da comunicação que tenta pensar com a cabeça do leitor para
capturá-lo na rota hipertextual e entendê-lo como audiência. Para isso, o produtor, no contexto do
jornalismo baseado em tags, lida com duas inferências da lógica agindo ora com indução, ora
50
No sentido construído por Mielniczuk (2011) em que o profissional é multimídia ao narrar para diferentes
suportes/formatos; multiplataforma ao modular para várias plataformas; multitarefa porque encara várias
editorias.
71
com dedução.
A prática da indução acontece quando o jornalista parte de um caso isolado (ou vários
casos) que já experimentou e do resultado obtido chega à conclusão generalizada de uma regra.
Numa relação de audiência entre produtor e leitor, esse argumento estatístico acontece quando o
jornalista de conteúdos online começa a observar quais tipos de reportagens geram maior número
de cliques e pageviews51
. Se ele, usando ferramentas de medição de audiência, conclui que
futebol é o conteúdo de maior acesso, obviamente poderá direcionar a produção para matérias
sobre esse assunto. Se souber também que palavras-chave, como nome de celebridades, atraem
muita leitura quando colocadas em títulos de matérias, pode optar por essa estratégia de atração.
O pensamento indutivo pode oferecer, ao longo do caminho, conclusões bem corretas a partir de
premissas verdadeiras, no entanto é um pensamento muito dependente de casos concretos ou
operações práticas. (SANTAELLA, 2004). Esta é a lógica:
Caso: Esta notícia é de futebol.
Resultado: Esta notícia de futebol gera alta audiência.
Regra: Todas as notícias de futebol geram alta audiência.
A prática da dedução é menos empírica e ocorre quando se parte de uma regra geral e
deduz-se a propriedade de um caso isolado. Numa situação como essa, o jornalista deveria partir
de situações hipotéticas definidas pelas características das notícias – critérios de noticiabilidade52
,
conhecimento geral do público-alvo, especificidades do veículo onde trabalha – para levantar
uma inferência. A dedução só acontece para que seja validada a conclusão retirada do raciocínio.
(SANTELLA, 2004). Assim, o jornalista de um portal de veículos, sabendo que conteúdos de
lançamentos de carros no mercado geram alta audiência, se depara com a notícia sobre o novo
carro utilitário da Fiat e conclui que uma matéria sobre esse carro vai gerar bons page views. Ele
praticou o tão conhecido silogismo. Esta é a lógica:
51
Número de vezes que uma página da internet é visualizada em um navegador. É uma conta de acessos registrados
por um site. Não engloba o total de pessoas que visitaram o portal, mas, sim, o número de vezes que ele foi
acessado.
52 Critérios usados para selecionar as notícias entre os vários acontecimentos. A noticiabilidade depende do
interesse da empresa jornalística, além de critérios de relevância flexíveis e variáveis a cada veículo.
72
Regra: Todas as notícias de lançamento de carros geram alta audiência.
Caso: Esta matéria é sobre o lançamento do novo utilitário da Fiat.
Resultado (conclusão): Logo, esta matéria sobre utilitário da Fiat gera audiência.
A prática das duas lógicas é muito viva na rotina do jornalismo baseado em tags,
principalmente quando as habilidades do produtor são associadas a ferramentas tecnológicas que
ajudam a capturar o leitor, conforme será exposto nas seções adiante nesta pesquisa. A junção é
útil na medida em que o jornalista contribui para a construção do conhecimento coletivo e
conhece suas funções cognitivas no processo de produção.
O virtuosismo técnico só produz seu efeito completo quando consegue deslocar
os eixos e os pontos de contato das relações entre homens e máquinas,
reorganizando assim, indiretamente, a ecologia cognitiva como um todo. Separar
o conhecimento das máquinas da competência cognitiva e social é o mesmo que
fabricar artificialmente um cego (o informata "puro") e um paralítico (o
especialista "puro" em ciências humanas), que se tentará associar em seguida;
mas será tarde demais, pois os danos já terão sido feitos. (LÉVY, 2014, p.33).
O leitor está exposto a muita informação e quer encontrar a notícia com mais valor para
ele no ambiente digital. O que o jornalista precisa fazer é atribuir cada vez mais valor para as
informações que publica, ser capaz de modalizar os contextos significativos e os ambientes
práticos onde se determina o sentido (LÉVY, 2014). Ainda precisa ser construído um dispositivo
sociotécnico baseado em tags capaz de facilitar a buscas de informações, mas enquanto isso o
jornalista pode fazer bem o papel de produtor de significação e pertinência na Web (e ele tem
ferramentas para isso, como está sendo mostrado nesta pesquisa).
Mais do que manipular palavras – em uma capacidade sintática –, o jornalista deve se
preparar para manipular conceitos – numa visão semântica de produção. Os conceitos organizam
a memória coletiva e agem sobre contextos sociais, facilitando a captura de público por questões
afetivas – que aproximam o texto/conteúdo desse leitor. O jornalista precisa pensar em dar mais
sentido aos dados que expõe na Web.
Com base em estudo da Rede Ibero-Americana de Comunicação Digital, no Projeto
Comunicadores Digitais, Barbosa (2007) traçou algumas recomendações ao jornalista para atuar
73
nas redações: manter-se atualizado no uso de softwares; conhecer o potencial da tecnologia de
base de dados e suas aplicações no jornalismo, as linguagens de programação, recursos para
difundir e compartilhar conteúdos, técnicas para investigar novas formas de produção e
prospecção de informações com metadados e a mineração de dados; compreender o entorno que
o circunda e as questões relacionadas com a cibercultura; entender o funcionamento e as
potencialidades das redes sociais e comunidades virtuais; conhecer bases de jornalismo
participativo e ambientes wiki e blog e compreender a legislação vigente relativa a direito de
autor, delitos, privacidade, copyleft, creative commons e software livre.
Ao pensar quem é o leitor e quem é o produtor, conclui-se que eles são as partes do ato de
linguagem que é a navegação na Web. Nesse ato, há uma encenação linguageira com dois
circuitos, o externo – da relação contratual entre os dois parceiros – e interno – da encenação do
dizer com os dois protagonistas (CHARAUDEAU, 2001). Por isso, os velhos emissor e receptor
foram deixados de lado por transmitirem uma falsa ideia do que sejam atos de linguagens.
4.4 Audiência
A audiência na Web está relacionada à necessidade de informação que as pessoas têm.
Dentro do processo de comunicação, a audiência é o conjunto de respostas dos leitores aos
conteúdos. Segundo Ruótolo (1998), essas respostas podem ser internas (como uma mudança de
opinião) ou externas (como a compra de um produto ou um page view). As respostas que os
indivíduos dão aos conteúdos da comunicação são resultados de contextos sociais, considerando
interesses culturais e as formas de conhecimento dos leitores de sites noticiosos.
Os estudos sobre audiência se desenvolveram a partir da década de 40, baseados em
análises de recepção focadas na programação televisiva. De acordo com Ruótolo (1998), não se
encontram no escopo dos estudos de audiência aspectos muito importantes da comunicação social
que não fazem parte das respostas do leitor. Para o autor, os aspectos tecnológicos (novos meios,
novas tecnologias), a produção de conteúdos e a transnacionalização dos fluxos de comunicação
estão fora dos estudos de audiência e recepção por não tratarem de entender e explicar
74
precipuamente as respostas da audiência. Os aspectos tecnológicos citados por Ruótolo (1998),
agora mais do que nunca, alteram os resultados de audiência nas mídias porque permitem ao
leitor traçar caminhos imprevisíveis.
A exploração mercadológica da audiência pela grande mídia é uma ideia já conhecida:
mais leitores, mais audiência e mais possibilidades de anunciantes nas páginas online. No
entanto, aqui não nos interessa discutir essa questão, pois o simbólico, a rota do leitor e a
experiência do produtor são muito mais importantes, conforme considera Charaudeau (2010):
Por que analisar o discurso midiático, se as mídias parecem viver uma lógica
comercial onde só haveria lugar para estudos econômicos, tecnológicos ou de
marketing? Seria para torná-las mais performáticas e mais rentáveis nos
mercados mundiais? É claro que a resposta é negativa para quem acredita que,
para além da economia e da tecnologia, há o simbólico, essa máquina de fazer
viver as comunidades sociais, que manifesta a maneira como os indivíduos,
seres coletivos, regulam o sentido social ao construir sistemas de valores. Sendo
o papel do pesquisador em ciências humanas e sociais o de descrever os
mecanismos que presidem a esse simbólico e às diferentes configurações que o
tornam visível. (CHARAUDEAU, 2010, p.17).
Nesse contexto, o jornalismo vive um desafio diário de equilíbrio entre critérios de
noticiabilidade e interesses empresariais para conquistar a audiência. Os novos aspectos desse
jogo são as estratégias computacionais – ferramentas de busca, uso de tags e otimização de sites,
que agora compõem o trabalho diário.
4.5 Buscadores
Os buscadores ou motores de busca são ferramentas para recuperação de informação que
vêm influenciando muito a rotina jornalística na Web, na medida em que alteram lógicas de
audiência, porque direcionam os leitores a URL – antes mesmo que esse leitor procure o
conteúdo em um portal de notícias. Os títulos dados pelos repórteres às matérias, galerias de fotos
e outros conteúdos compõem a URL da página, ou seja, aparecem descritos no link criado para
75
aquela publicação53
. Os buscadores indexam e incorporam nos resultados as atualizações de
milhões de sites, por isso entram como fator a mais na concorrência online. Apesar da hegemonia
do Google, existem mais opções como Bing, Yahoo, Teoma, Lycos, All The Web, Cuil, AltaVista,
entre outros.
A importância dos motores de busca para o resultado de audiência no Brasil é
incontestável porque têm direcionado os leitores aos sites noticiosos de maneiras surpreendentes.
De acordo com estudo54
do Instituto Verificador de Circulação (IVC) – entidade sem fins
lucrativos que certifica as métricas de desempenho de veículos impressos e digitais – a origem de
acesso em sites no país pode ser dividida em quatro categorias: buscadores, direto (quando o
leitor digita o nome do site), redes sociais e outros. Uma pesquisa do IVC selecionou dados de 75
sites nacionais, coletando informações de audiência uma semana por mês entre janeiro de 2011 e
janeiro de 2013. Para o acesso em browsers na Web, a primeira categoria detém em média 34%
do tráfego da rede; a segunda, 40%; a terceira, 20% e a quarta, 6%.
Apesar de não liderar o ranking, a representatividade de buscadores é muito grande
levando em conta que o acesso direto tem como vantagens a afinidade do leitor com sites
específicos e a gravação de URL em favoritos (acesso também contabilizado na categoria
“direto”). Os motores de busca, por sua vez, contam com a automatização algorítmica em uma
dimensão inalcançável ao controle humano.
Os mecanismos de busca, para indexarem na Web, possuem programas que
visitam páginas por página da Web, percorrem o texto de cada página, extraindo
daí palavras-chave e armazenando em uma base de dados estas palavras-chave,
associadas ao URL da página. É sobre esta base de dados que os usuários fazem
suas buscas nos sites dos mecanismos. (MARCONDES, 2006, p.97).
A desvantagem que levam os buscadores está no fato de serem desprovidos de informação
53
Por exemplo, o caso da matéria que será usada no estudo de caso da morte do ator Paulo Walker. O título
da matéria é “Vídeo mostra momento em que carro de ator Paul Walker fica em chamas após acidente”. Este é o
URL gerado para o conteúdo:
http://www.em.com.br/app/noticia/internacional/2013/12/01/interna_internacional,475257/video-mostra-
momento-em-que-carro-de-ator-paul-walker-fica-em-chamas-apos-acidente.shtml 54
Estudo sobre audiência de websites. Base IVC: Jan 2011 a Jan 2013. International Federation of Audit Bureaux of
Circulations (IFABC)/ Instituto Verificador de Circulação (IVC). A pesquisa completa está disponível em
<http://www.ivcbrasil.org.br/conteudos/pesquisas_estudos/AudienciaWeb2012.pdf>. Acesso em 25 jun.2014.
76
contextual, pois a indexação automática com base em palavras isoladas não tem um controle
terminológico. Vale ressaltar, no entanto, que nada disso impede a influência dos motores de
busca na audiência da Web.
De forma simplificada, os buscadores vão coletar dados nos sites enviando bots
conhecidos como web crawler (rastreador web, também chamado de aranha eletrônica). O
conteúdo do site é copiado e armazenado no banco de dados do mecanismo de busca. As
“aranhas” são projetadas para seguir os links de uma página, copiar e assimilar o conteúdo. Elas
coletam informações todos os dias, criando uma base de dados com bilhões de informações. As
“aranhas” fazem a leitura conteúdo do site começando no canto superior esquerdo e seguindo
para o direito inferior – como uma leitura convencional de página de revista em países ocidentais.
Se encontrar um link que pode seguir, a “aranha” grava e envia outra “aranha” para seguir e
copiar o conteúdo. A web crawler vai prosseguir no site até que tudo esteja registrado. Para
acompanhar as mudanças, os buscadores fazem visitas regulares, cujas frequências variam de
acordo com as atualizações do site55
.
Para Santaella (2004), os buscadores são exemplos de ferramentas que ajudam a orientar o
leitor imersivo na rede e minimizar o desconcerto ou a frustração de não conseguir ajustar os
alvos pretendidos na leitura. Segundo a autora, os programas de busca são indicativos do grau de
controle de uso que provavelmente estará disponível em todas as mídias daqui a não muito
tempo.
Exemplo disso é o recurso do Google de oferecer publicidade ao leitor de acordo com a
palavra-chave que ele busca. As empresas se inscrevem para que seus anúncios sejam exibidos na
página de ranqueamento de links. Há a possibilidade de uma organização pagar para que uma tag
específica seja associada ao seu site, assim alcança resultados importantes em receitas com
publicidade. Outro exemplo é o recurso de uso dos cookies56
do visitante para exibição de
anúncios relacionados ao interesse dele. Então, se alguém procurava na Web por tênis de corrida
55
Notas da autora em curso de SEO da empresa Nautilus.
56 Cookies são pequenos arquivos que os sites colocam no disco rígido do computador quando o leitor os visita pela
primeira vez. O QUE é cookie? MICROSOFT. Central de Proteção e Segurança. Recursos. 2012. Disponível em
<http://www.microsoft.com/pt-br/security/resources/cookie-whatis.aspx>. Acesso em: em 25 jun.2014.
77
ontem, não deve estranhar que hoje o browser esteja lhe oferecendo inúmeras ofertas de lojas
especializadas em esporte ou dos modelos pesquisados no dia anterior. Os exemplos descritos
fazem parte das tecnologias do Google AdSense57
e Google AdWords58
.
Para o jornalismo, mais importante que entender tecnicamente os buscadores, é saber que
as estatísticas dos motores de pesquisa fornecem indicações sobre a variação da popularidade de
certas palavras-chave no curso do tempo. Saber agenciar essas tags faz parte do trabalho de
conquista do leitor, que, muitas vezes, recorre aos buscadores para encontrar as rotas. A escolha
de uma tag no momento da busca impulsiona uma rede semântica do leitor, com a qual o
produtor de conteúdo precisa ter afinidade. Segundo Lévy (2014), o leitor ativa um contexto e
seleciona uma minirrede centrada sobre a palavra que vai digitar: “Quando ouço uma palavra,
isto ativa imediatamente em minha mente uma rede de outras palavras, de conceitos, de modelos,
mas também de imagens, sons, odores, sensações proprioceptivas, lembranças, afetos etc.”
(LÉVY, 2004, p.14).
De acordo com o autor, o contexto serve para determinar o sentido de uma palavra, sendo
ainda mais judicioso considerar que cada palavra contribui para produzir o contexto, ou seja,
forma uma configuração semântica reticular, que se mostra composta de imagens, de modelos, de
lembranças, de sensações, de conceitos e de pedaços de discurso.
Tomando os termos leitor e texto no sentido mais amplo possível, diremos que o
objetivo de todo texto é o de provocar em seu leitor um certo estado de excitação
da grande rede heterogênea de sua memória, ou então orientar sua atenção para
uma certa zona de seu mundo interior, ou ainda disparar a projeção de um
espetáculo multimídia na tela de sua imaginação. Não somente cada palavra
transforma, pela ativação que propaga ao longo de certas vias, o estado de
excitação da rede semântica, mas também contribui para construir ou remodelar
a própria topologia da rede ou a composição de seus nós (LÉVY, 2004, p.14).
Segundo Lévy (2004), os jornalistas se transformam em “arquitetos cognitivos do futuro”,
levando em conta na produção a possibilidade de seus conteúdos serem encontrados na rede pela
busca de palavras-chave. O salto que o profissional pode dar é saber administrar essa ecologia
57
GOOGLE Anúncios. Google AdSense. Disponível em: <http://www.google.com/adsense/>. Acesso em: em 25
jun.2014.
58 GOOGLE AdWords. Disponível em: <https://adwords.google.com>. Acesso em: 25 jun.2014.
78
cognitiva, conhecendo as tags mais procuradas pelo seu leitor ou as palavras que mais resumem
as ideias de conteúdos e poderiam ser potencialmente buscadas. O caminho de ativação iniciado
por uma tag (atratora) é percorrido intensamente em alguns momentos, mas caem em desuso. A
rede associativa dos leitores é parte do universo mental e está em metamorfose permanente, assim
como a necessidade desses leitores por informação.
4.6 SEO para jornalismo
Os portais de notícia estão fazendo de tudo para serem encontrados na Web. As empresas
querem que as matérias estejam na rota do leitor. Um dos recursos é aparecer no topo dos sites de
busca, um resultado de estratégias de Search Engine Optimization (SEO), traduzido para o
português como otimização de sites. Uma grande discussão, que não será feita nesta pesquisa, é
até que ponto a otimização faz empresas jornalísticas priorizarem o interesse privado em
audiência em detrimento do interesse público, aquele descrito no Código de Ética dos
Jornalistas59
como sendo uma das prerrogativas de produção. O debate não será feito aqui, mas
não passou em vão aos olhos da pesquisadora.
Os mecanismos de busca usam um algoritmo – embasado em um cálculo matemático –
que interpreta a relevância de uma página da Web. Entre os critérios de ranqueamento está a
indexação de palavras-chave ideais, por isso elas precisam ser bem contextualizadas nos títulos
das páginas, domínio do site, corpo dos textos, espaços reservados para tags e na etiquetagem de
imagens. As empresas de comunicação nem sempre se preocupam especificamente com a
matemática algorítmica dos motores de busca, mas querem entender o comportamento do leitor
para escolher as palavras-chave certeiras.
A ideia é pensar além da pauta: “O que o meu leitor buscaria no Google para encontrar o
conteúdo sobre o qual estou escrevendo?”. Esse pensar além da pauta é planejar um ciclo de
complexidade que começa em um contexto desordenado – da enorme prateleira de informações
59
Disponível em http://www.fenaj.org.br/materia.php?id=1811. Acesso em dezembro de 2014.
79
da Web, segue com a articulação de etiquetas atratoras capazes de agenciar a captura do leitor e
encerra na ordenação do conteúdo para alcançar a rede semântica no entorno do vórtice gerado
por essas tags.
Muitas empresas de comunicação ensinam estratégias de SEO para os jornalistas dentro
das redações e outras mantêm um profissional especialista em otimização para auxiliar em tarefas
diárias dos produtores de conteúdo. Algumas também incluem rotinas de produção diferenciadas
para facilitar o ranqueamento de conteúdos como, por exemplo, o em.com.br, que criou uma
agenda de datas comemorativas/aniversários para que os repórteres tentem fazer pautas
relacionadas ao tema do dia. Se dia 28 de outubro é dia de São Judas Tadeu, a busca no Google
pelas palavras-chave relacionadas ao santo aumenta naquela data, o que seria uma oportunidade
de indexação para um site de notícias que tiver matérias com tais tags nos títulos. O conteúdo
poderia ser desde a agenda das festas comemorativas pelo santo na cidade até o mercado religioso
no entorno da paróquia que leva o nome de Judas. Importante é que as matérias com esse campo
semântico específico sejam publicadas naquele dia, tendo, é claro, o valor jornalístico associado
ao valor semântico para motores de busca.
Segundo Formaggio (2008), os passos que um site de notícias deve seguir na elaboração
de um plano para que seja encontrado em mecanismos de busca são: 1) identificar e elaborar as
tags importantes para o site, 2) identificar quais requisitos de SEO (mudanças ou adaptações na
construção da página) são necessários para que o site seja encontrado, 3) identificar as páginas de
entrada desejadas para essas tags, 4) saber qual o posicionamento dos concorrentes sobre aquelas
tags importantes para seu site. Muitos desses aspectos dizem respeito ao trabalho do
desenvolvedor do site e não ao jornalista, mas o repórter pode, sim, ajudar e aumentar a
relevância do site escolhendo títulos assertivos, inserindo tags competentes em suas matérias ou
relacionando conteúdos de forma mais contextualizada possível.
Hoje não basta agradar somente aos robôs dos mecanismos de busca, o usuário
se tornou prioridade. É preciso agradar muito mais aos usuários, entregar-lhes
boas experiências de navegação, bem como orientá-los a uma conversão de
forma adequada. Só assim um site terá vantagem competitiva frente a seus
concorrentes nos mecanismos de busca. (FORMAGGIO, 2008, p.9).
Por exemplo, o Google, durante o processo de indexação, capta URL com no máximo 70
80
caracteres, ou seja, o ideal é que o título de uma página (ou de uma matéria no caso de um portal
de notícias) tenha esse limite. O que há além desse número de caracteres o buscador ignora,
tornando os termos em excesso irrelevantes para o ranqueamento da página. Para a rotina do
jornalista digital, cuja função, além de apurar e escrever o texto, é atribuir títulos para as
matérias, ter conhecimento em SEO é essencial.
São quatro os passos para alcançar bons resultados com as estratégias de SEO: indexação,
ranqueamento, conquista do visitante e, por fim, a chamada taxa de conversão. Esta última é a
grande meta de empresas que investem em otimização, sendo considerado o resultado para o uso
de todas as técnicas. Conversão para os portais de notícias são o alcance de uma audiência
diferenciada, que aumente o número geral de acessos para a página, além de compartilhamentos,
comentários e outras ações responsivas que leitores possam fazer para espalhar o conteúdo.
Nos capítulos que seguem será possível articular a interseção entre complexidade,
folksonomia e o jornalismo baseado em tags. Mais que isso, ficará mais clara com os estudos de
caso a relação complexa entre leitura hipertextual, uso de tags, SEO, audiência e as
consequências dessa mistura para o jornalista no contexto da Web Semântica.
81
“Um minuto pode ser infinito em uma ordem de convergência e, no entanto,
ter uma energia finita, e esta ordem ser limitada”, (DELEUZE, 2007, p. 114).
5 Metodologia
Quando um pesquisador sistematiza uma coleta de dados e converge essas informações ao
arcabouço teórico de anos de pesquisa, ele está criando uma situação limitada relativa ao minuto
em que coletou os dados. No entanto, abre a possibilidade de energia infinita quando aquele
trabalho chega aos pares e estes, por sua vez, fazem daquele minuto uma base para outros
estudos, para outras hipóteses ou para reformulações de teses. Uma das grandes contribuições em
criar uma ordem de convergência é que ela faça parte da construção de conhecimento.
5.1 Método
O desenvolvimento de um método de pesquisa, baseado na consciência científica, consiste
em não aceitar algo como verdadeiro sem antes comprovar, dividir os problemas da pesquisa em
partes tão pequenas que se possa resolvê-los, conduzir os pensamentos em uma ordem e, por fim,
fazer um levantamento completo sobre o tema estudado para que nada seja omitido. Esses
princípios, apesar de úteis, inviabilizam uma metodologia de trabalho que não tenha como base o
pensamento complexo, aquele que compreende as partes do conhecimento e faz dele o resultado
mais importante em um processo de pesquisa. Esta pesquisa tenta trabalhar com um método
ancorado na complexidade que permite transitar entre teorias.
A pesquisa aqui desenvolvida é qualitativa baseada no paradigma construtivista, segundo
Guba e Lincoln (2006), pois explora a realidade do leitor ao traçar caminhos pela rede e as
estratégias dos produtores de conteúdo para capturar esse leitor. Os autores classificam como
construtivista a metodologia que inclui o relativismo, quando é analisada uma realidade local e
82
especificamente construída. Além disso, a pesquisa lida com uma teoria de natureza construtivista
– a complexidade – que nasceu para criticar o positivismo lógico. Por fim, é uma pesquisa que
trata da Web, um ambiente dinâmico, ambíguo, incerto e contraditório, o que contribui ainda mais
para classificação construtivista.
A escolha da pesquisa qualitativa se deu, principalmente, pelo ponto forte desse tipo de
trabalho: usar dados que ocorrem naturalmente para encontrar sequências (“como”) em que os
significados dos participantes (“o quê”) são exibidos e, assim, estabelecer o caráter de algum
fenômeno. Silverman (2009) representou essa lógica: [os quês → o fenômeno → os comos].
O principal ponto forte da pesquisa qualitativa é a capacidade para estudar
fenômenos simplesmente indisponíveis em qualquer lugar. Os pesquisadores
qualitativos estão corretamente preocupados em estabelecer correlações entre
variáveis. (SILVERMAN, 2009, p. 51).
Os saberes da pesquisa advêm da experiência da autora (como pesquisadora e jornalista)
com os casos em que o gerenciamento de tags alterou o processo de comunicação e na
experimentação de ferramentas da Web Semântica. A problemática da pesquisa é comunicativa e
descritiva, conforme Charaudeau (2010), pois o objeto de estudo é empírico – determinado a
partir da observação. Além disso, no corpus selecionado, foi possível observar diferentes tipos de
situações comunicativas. Conforme Charadeau (2010), essas situações determinam as condições
de produção e de interpretação, além de dar legitimidade aos discursos em um processo de
interação.
O que foi feito nos capítulos anteriores faz parte da revisão bibliográfica e construção
teórica que ajudaram na análise dos dados. As características de sistemas complexos retratadas no
Quadro 1 (página 33) e os padrões de interação do Esquema 2 (página 37) são trazidos para a
análise de dados na tentativa de identificá-los nos casos reais e, assim, mostrar a complexidade
nos processos de produção e de leitura no contexto da Web Semântica. Da mesma forma, o
processo de folksonomia, criado especificamente em cada caso analisado, retoma o conceito de
etiquetagem de forma bem particular.
A maior parte da coleta de dados e depoimentos de jornalistas ocorreram na terça-feira
subsequente a dois fatos jornalísticos de relevância em 2013. O primeiro deles é o incêndio da
83
boate Kiss em Santa Maria/RS, em 27 de janeiro, e o segundo é a morte do ator Paul Walker, em
30 de novembro. As duas coberturas feitas pelo site do jornal Estado de Minas (em.com.br)
apresentaram características exclusivas de audiências por fatores relacionados ao uso de tags,
buscadores e captura do leitor na rota hipertextual. Com os dados coletados naquelas terças-
feiras, foi possível levantar os padrões de audiência para a pesquisa. No entanto, os dados foram
observados e atualizados até julho de 2014, porque há pequenas mudanças de valores.
Os aspectos de resultado de audiência foram observados por meio do Google Analytics60
e
as estatísticas são exploradas nesta pesquisa de forma qualitativa. Os dois casos aconteceram em
finais de semana – um no domingo e outro no sábado – por isso a terça-feira foi escolhida para
coleta, considerando que os dados do Google Analytics estavam, de certa forma, mais estáveis.
Há um delay de atualização desses dados que precisou ser considerado antes da coleta.
O Google Trends61
é usado para a análise temporal de tags, que é importante para
discussão do aspecto linguístico do uso dessas etiquetas na Web. O corpus da pesquisa é formado
pelo conjunto de estatísticas e observações da pesquisadora sobre as ações dos jornalistas nessas
coberturas, ações que mudaram o cenário de taxa de conversão.
O incêndio foi escolhido porque uma galeria de fotos produzida durante a cobertura
alcançou, em número absoluto, a maior audiência do portal desde o início das produções, em
setembro de 2010. A morte do ator foi escolhida porque uma das matérias da cobertura
jornalística – aquela em que há um vídeo com o acidente automobilístico que resultou na morte –
alcançou a maior audiência que o site já teve, em número absoluto, na categoria “tempo real”62
.
60
GOOGLE Analytics. Disponível em: < http://www.google.com/analytics/>. Acesso em: 25 jun.2014.
61 GOOGLE Trends. Disponível em: <http://www.google.com/trends/>. Acesso em: 25 jun.2014.
62 Cf. explicação da categoria em 5.3 Coletas no Google Analytics.
84
5.2 Contexto de produção no EM.COM.BR
O em.com.br é o site de notícias do Jornal Estado de Minas que faz parte do grupo Diários
Associados, fundado pelo jornalista Assis Chateaubriand, em 1924, e que conta com portais de
notícia em cinco estados brasileiros, além do Distrito Federal. A empresa de comunicação
também tem 10 emissoras de TV, 12 rádios, 11 jornais impressos e cinco revistas.
O em.com.br surgiu em setembro de 2010 para substituir a produção de notícias do Portal
Uai, no ar desde 1996. A ideia era que o público identificasse melhor o conteúdo do Estado de
Minas, tendo um site que levasse as iniciais do nome do jornal. Assim, passou a abrigar o
conteúdo das editorias de Política, Economia, Nacional, Gerais, Internacional, entre outros canais
que surgiram com o tempo. O Portal Uai começou a funcionar como um grande “guarda-chuva”
de sites do grupo de comunicação – em.com.br, Divirta-se, Vrum, Lugar Certo e Admite-se.
Como porta de entrada, o Portal Uai é responsável por grande parte da origem de audiência de
todos os sites que estão ancorados nele. O em.com.br é um dos carros-chefes da empresa porque
nele é produzido todo o conteúdo factual, o chamado hard news63
. O site conta atualmente com
uma equipe formada de editor, editora assistente, três subeditoras, infografista, quatro estagiários
e cerca de 20 repórteres.
O trabalho dos repórteres de apuração, elaboração de texto, edição de imagens, escolha de
títulos e bigodes para cada matéria é o que resume o conceito de produção nesta pesquisa. Cada
jornalista é responsável por uma editoria, monitorando os temas e produzindo setorialmente. Nos
casos analisados, as duas coberturas ocorreram em finais de semana – quando a equipe não segue
a divisão de tarefas dos dias úteis – ficando todos os repórteres envolvidos nas coberturas de
destaque durante o plantão (uma espécie de “todo mundo faz tudo”). Os dois casos analisados
foram produzidos respectivamente nas editorias de Nacional e Internacional com trabalho de
repórteres que normalmente atual em outros “setores”.
Esta pesquisa, apesar de ter um caráter descritivo, não foge às críticas necessárias ao
63
Notícias de grande atualidade, marcadas de temporalidade e, principalmente, de uma construção com pirâmide
invertida – aquela em que é priorizada no lead a informação mais importante.
85
processo de produção jornalística e os apontamentos para o futuro do jornalismo, mesmo sendo a
pesquisadora repórter do Estado de Minas. Os dados da coleta serão apresentados em percentuais,
que permitem a comprovação da mudança de audiência com gerenciamento de tags sem expor
números absolutos e estratégicos para o negócio da empresa, o que não é o objetivo. Descrevo a
seguir as duas ferramentas usadas na coleta de dados, detalhando como o trabalho foi feito.
5.3 Coletas no Google Analytics
O Google Analytics é uma ferramenta gratuita que pode ser usada por qualquer produtor
de conteúdo para medir audiência na Internet. É necessário cadastrar o site a ser monitorado e
definir usuários que podem visualizar as informações disponibilizadas. A medição direta de
acessos é feita por meio da contagem de vezes que as páginas dos sites são carregadas pelos
usuários. Coloca-se um código em todas as páginas do site e, quando alguém acessa a página, o
código é lido pelo programa que fica “anotando” a quantidade de leitores, o tempo que eles
gastam na página, de onde eles “vieram” (origem de tráfego), entre outros parâmetros. Há outras
ferramentas parecidas que fazem Web analytics, como, por exemplo, o Omniture64
. O em.com.br
usa o Google Analytics para medição de audiência.
A tela capturada (Fig. 7) mostra, como os destaques em vermelho, a disposição de dados
no Analytics. Na esquerda, o repórter vê qual a matéria está monitorando – por meio do URL – e
na direita visualiza a quantidade de pageviews em tempo real. A aplicação traça automaticamente
os gráficos na parte superior da tela.
64
ADOBE MARKETING CLOUD. Disponível em: <http://www.omniture.com>. Acesso em: 25 jun.2014.
86
Figura 7 – Google Analytics
Fonte: Captura de tela pela autora (25 jun.2014)
Para o jornalismo online, essas ferramentas de análise tornaram-se essenciais na rotina
dos repórteres que acompanham em tempo real as matérias mais escolhidas pelos leitores,
podendo controlar quais são as notícias preferidas, quais devem permanecer em destaque nas
capas dos portais e quais assuntos rendem continuidade. Pela URL (endereço da página) da
matéria, a ferramenta do Google faz um ranking de notícias quase em tempo real. Existe um
delay de leitura do comportamento em tempo real, mas que não atrapalha a análise de audiência.
O acompanhamento da ferramenta é essencialmente uma função do repórter e se torna
também parâmetro de medição de produtividade para os editores. O monitoramento em tempo
real é usado de minuto em minuto por jornalistas na redação, por trazer essa noção instantânea. É
possível também fazer levantamentos de audiência mensal, semestral ou de qualquer período
determinado, porém esses dados não ajudam tanto na produção diária. É possível analisar dados
gerais ou divididos por editorias.
Uma das principais vantagens de medir audiência é poder “brincar” com o efeito cauda
longa (ANDERSON, 2004), em que a infinita prateleira jornalística da Web consegue oferecer
conteúdo por nicho. Se as especificidades do leitor são conhecidas, passa-se a produzir para ele.
87
O em.com.br, por exemplo, tem grande enfoque no conteúdo local. A editoria carro-chefe é
Gerais, aquela que trata de conteúdos regionais de Minas.
O que esta pesquisa vai mostrar é que esse público habitualmente conquistado pelo
conteúdo do site não é exatamente aquele capturado pelos buscadores na rota hipertextual.
Quando os motores de busca entram em ação e os jornalistas percebem alterações de audiência
provocadas pelo gerenciamento de tags, leitores novos – que nunca visitaram o site nem mesmo
pelo conteúdo de nicho – entram para as estatísticas de audiência. Os casos estudados nesta
pesquisa são das editorias de Nacional e Internacional, as mais beneficiadas pela ação de motores
de busca, conforme mostrará a análise de dados.
5.4 Coletas no Google Trends
O Google Trends é uma ferramenta que aponta o volume de busca de uma palavra-chave
no Google. Com esse sistema, é possível ver padrões de busca ao longo do tempo. Digitando uma
tag ou expressão, o programa traça um gráfico sobre o comportamento de busca daquela palavra
desde 2004 até o dia da solicitação, sendo o eixo horizontal a representação do tempo e o vertical,
a frequência com que o termo é procurado globalmente. É possível saber em quais localidades a
palavra é mais “googlada”, em quais períodos aconteceram mais buscas e as combinações que
geralmente os internautas usam para buscar a palavra.
Usar o Trends nesta pesquisa ajudou a revelar padrões linguísticos e de campo semântico
que ajudam a aproximar o trabalho dos Estudos de Linguagem. Para explicar melhor, escolhi usar
a tag “papa” que servirá como exemplo para mostrar o que é o comportamento linguístico na
Web que será mostrado nos estudos de caso. Vejamos:
88
Figura 8 – Google Trends com tag “papa”
Fonte: Captura de tela pela autora (2014)
A tag “papa” tem picos de busca em abril de 2005, mês em que morreu João Paulo II e foi
eleito Bento VI. A mesma palavra volta ao topo de buscas em março de 2013, quando Francisco
assume o papado no lugar de Bento VI – que renunciou. Pelo mapa percebe-se uma busca maior
dessa tag em países de língua espanhola e portuguesa, locais em que a palavra representa,
respectivamente, o legume batata (tradução de “papa” em português) e o pontífice, representante
89
máximo da igreja católica. É claro que se analisarmos a tag “pope” (papa em inglês) haverá um
comportamento diferente. No Google Trends também é possível saber em quais combinações a
etiqueta “papa” é mais procurada. O campo semântico referente ao maior volume de buscas da
tag “papa” no Google não se refere ao pontífice – o que seria mais lógico aos leitores da língua
portuguesa -, mas sim a um restaurante norte-americano de nome “Papa Johns”65
e a um site de
games chamado “Papa Jogos”66
. Quais as lições que essa análise da tag papa deixam?
Primeiramente, que acontecimentos podem mudar os rumos do volume de buscas na Web,
como é o exemplo do que ocorreu com as trocas no Vaticano. Os fatos alteram a rotina de
buscadores e vice-versa, como será mostrado nos casos reais desta pesquisa. As pessoas se
interessam por temas da atualidade, motivadas por outros veículos noticiosos (TV, rádio, jornais)
ou pela agenda setting67
, que inclui o assunto na rotina de cada um, fazendo o leitor recorrer à
Web para mais informações ou atualizações.
A segunda lição é que, pelo caráter global dos buscadores e da Web, o uso de uma tag
com vários significados em línguas diferentes pode ser uma armadilha semântica. Ao mesmo
tempo em que o jogo semântico pode se tornar útil para transformar a tag em “atratora” de
leitores na rota hipertextual, ele pode capturar leitores em busca de resultados muito diferentes.
Se uma pessoa no Brasil, buscando a tag “papa”, esteja querendo mesmo saber sobre a pizzaria
americana, e não sobre o pontífice; o Google tem recursos para amenizar esses “erros de
resultado”. Nem todos os recursos são claramente conhecidos, mas existe, por exemplo, um
direcionamento por localidade. Se um endereço IP68
dos EUA procura pela tag “papa”, o
buscador provavelmente oferecerá links no ranqueamento relacionados ao restaurante, diferente
se a busca for de um IP no Brasil. Mesmo assim, o idioma fica como desafio não resolvido na
65
http://www.papajohns.com.
66 http://www.papajogos.com.br/.
67 A Teoria do Agendamento ou Agenda-setting Theory, no original, em inglês, é uma teoria de Comunicação
formulada por Maxwell McCombs e Donald Shaw na década de 1970. De acordo com este pensamento, a mídia
determina a pauta para a opinião pública ao destacar determinados temas e preterir ofuscar ou ignorar outros
tantos. Disponível em <http://pt.wikipedia.org/wiki/Agendamento>. Acesso em 16 jul. 2014.
68 Endereço IP, de forma genérica, é uma identificação de um dispositivo (computador, impressora etc.) em uma
rede local ou pública. Cada computador na internet possui um IP (Internet Protocol ou Protocolo de internet)
único, que é o meio que as máquinas usam para se comunicarem na Internet. Disponível em
<http://pt.wikipedia.org/wiki/Endere%C3%A7o_IP>. Acesso em 16 jul. 2014.
90
análise temporal do Trends.
A terceira lição é a importância do uso do Trends nesta pesquisa, para ajudar a entender a
alteração de campos semânticos causados por coberturas jornalísticas e também para o uso da
ferramenta no dia a dia do produtor, que pode conhecer as redes semânticas de cada termo usado
em títulos e bigodes de matérias. Se ele conhece as tags associadas a papa - “johns” e “jogos” –
sabe que nem sempre o conteúdo que carrega a tag “papa” será encontrado na Web em buscas
relacionadas ao pontífice. Assim, consegue alterar no processo de produção um filtro de
associação dessa tag, talvez juntando-a sempre ao nome do pontífice como Francisco ou Bento.
Ao invés de optar pelo título “Papa pede desculpas a vítimas de abuso e critica cumplicidade da
Igreja”, talvez escolhesse “Papa Francisco pede desculpas a vítimas de abuso e critica
cumplicidade da Igreja”, para resultados mais certeiros nos motores de busca.
Por fim, fica como lição a utilidade do Trends para avaliar a regularidade de termos e
influência que os buscadores exercem não só no jornalismo baseado em tags, mas também na
linguagem usada para organização da informação online. O Trends é um balizador de termos:
Acredita-se que o movimento capturado pelos algoritmos nas buscas evidencia a
configuração sobreposta das garantias de uso, literária e estrutural manifestas no
contexto digital para o termo pesquisado. A referida sobreposição se deve ao fato
de no contexto digital estarem em ação múltiplos atores sociais, dentre os quais
usuários, autores e gestores de informação. Evidentemente, ao apresentarmos
essa ponderação, não se trata de afirmar que o Google Trends poderá sozinho
resolver o problema das garantias preconizadas no processo de composição das
linguagens de indexação. Entretanto, acredita-se que ele pode ser um
instrumento auxiliar importante na medida em que tem a capacidade de
evidenciar o nascedouro de um termo, a representação das necessidades
informacionais dos sujeitos no espaço e no tempo e ainda, fornecer os indícios
da obsolescência de um tópico no contexto digital.” (MOURA, 2009, p. 67).
5.5 Depoimentos dos jornalistas
Juntamente com a coleta de dados, foi recolhido depoimento de um repórter de cada uma
das coberturas jornalísticas estudadas. A pesquisadora apresentou duas perguntas prontas como
estímulo aos entrevistados, com os quais havia um rapport mínimo e um entendimento, por parte
deles, sobre a pesquisa desenvolvida. Assim, as perguntas foram colocadas de forma objetiva,
mas com possibilidade de respostas que poderiam render outras questões – sem um roteiro
91
rigoroso.
O objetivo das entrevistas foi entender o contexto de gerenciamento de tags do ponto de
vista dos repórteres que participaram dos trabalhos na redação e saber o nível de consciência
deles em relação aos atos que fizeram dessas duas coberturas fenômenos de audiência. Além
disso, as respostas serviram como padrão para contar a história da rotina desenvolvida naqueles
dias (27 de janeiro e 1° de dezembro) pelos produtores.
Foi importante para a pesquisa comparar os dados naturais do Analytics com as
representações indiretas de experiências dos repórteres em relação aos fatos, corroborando o que
afirma Silverman (2009): “O que uma entrevista produz é uma representação particular ou um
relato das visões ou das opiniões de um indivíduo.” (p. 114).
O roteiro com os depoimentos dos repórteres está disponível no APÊNDICE A.
92
“São os acontecimentos que tornam a linguagem possível. Mas tornar
possível não significa fazer começar. Começamos sempre na ordem da
palavra, mas não na da linguagem em que tudo deve ser dado
simultaneamente, em um golpe único. Há sempre alguém que começa a falar;
aquele que fala é manifestante; aquilo de que se fala é o designado; o que se
diz são as significações. O acontecimento não é nada disto: ele não fala mais
do que dele se fala ou do que se diz.” (DELEUZE, 2007, p. 187).
6 Estudos de casos
Os casos estudados neste capítulo são nada mais que acontecimentos, no sentido mais
puro apresentado por Deleuze (2007). São fatos que surpreendem e exigem que falemos deles.
Escolhi falar deles não apenas com olhar jornalístico, mas como objetos de estudo numa
perspectiva da semântica. O estudo prova, pela grandeza da audiência, que os temas produziram,
que muito se falou sobre esses acontecimentos. A cobertura de tragédias pode surpreender porque
elas despertam interesse global – são acontecimentos que não falam mais do que deles se fala.
6.1 Incêndio em Santa Maria
No dia 27 de janeiro de 2013, o Brasil assistiu a uma das maiores tragédias de todos os
tempos. Morreram 242 jovens no incêndio da Boate Kiss, na cidade de Santa Maria, no Rio
Grande do Sul. Era um domingo e todas as atenções da imprensa nacional, assim como dos
brasileiros, se voltaram para o fato. Os jovens, maioria universitários, participavam de uma festa
na casa de shows, quando um integrante da banda – que comandava a noite – usou pirotecnia na
apresentação e acabou provocando o incêndio.
A notícia, provavelmente, se tornou o topo da audiência nos sites de notícias. Um dos
fatores responsáveis é a própria essência jornalística que atribui valor ao fato – os critérios de
noticiabilidade. É um acontecimento que, por si só, atrai o olhar do leitor imersivo e até mesmo
do disperso. A tragédia englobou os seguintes aspectos, segundo experiência da pesquisadora
como repórter: 1) interesse social – suscitou questões de segurança em casas noturnas que se
aplicam a qualquer cidade, 2) imprevisibilidade – surpreendeu a população brasileira, 3)
93
significância e singularidade – foi um fato intenso, com centenas de envolvidos que sofreram
consequências, além de ser inédito; 4) atualidade – naquele domingo, o que havia de recente nos
noticiários eram as informações de cada momento sobre a tragédia; 5) continuidade – as notícias
sobre o caso perpetuaram durante dias, semanas e meses; 6) emoção – o fato foi tratado como
imagem da comoção nacional porque sensibilizou a população brasileira; 7) proximidade afetiva
e geográfica – familiares e amigos das vítimas se tornaram leitores potenciais pelo interesse em
informações; 8) negatividade – no senso comum é tratado como interesse pela tragédia do outro;
esse desvio que as pessoas têm para notícias trágicas é psicanaliticamente um sistema emocional
de autodefesa que dá uma sensação de alívio ou tensão ao saber que outra pessoa passou pela
situação violenta.
No caso específico do em.com.br, a cobertura do incêndio aconteceu à distância, com
informações apuradas pelos repórteres, por telefone, junto ao Corpo de Bombeiros, polícia,
autoridades envolvidas nos atendimentos, além de textos de agências de notícias. No dia da
tragédia, foram publicadas 27 matérias relacionadas ao conteúdo e uma galeria de fotos. Além do
trabalho tradicional do jornalismo, no em.com.br o gerenciamento de tags potencializou a
audiência da cobertura, conforme relata o jornalista Emerson Campos:
A gente já tava com uma audiência que era bem atípica para o dia de domingo
porque o fato em si pedia, gerava essa audiência grande. Então a gente já tinha
notado que obviamente a audiência tinha subido muito, só que a partir de certo
momento a gente viu que ela se multiplicou quatro, cinco, seis, sete vezes. Foi
aumentando e a gente ficou meio sem entender. Quando a gente entrou nessa
notícia em si que tava dando mais audiência do que todas as outras e não estava
com destaque tão grande na capa quanto as outras, a gente foi ver o que tinha de
diferente nela e a gente percebeu que era a tag, as palavras-chave de Santa
Maria. A gente até deu uma olhada nos outros sites e ninguém tava usando, tava
todo mundo puxando como tragédia sul, boate, incêndio, mas não usava Santa
Maria. A gente usou o mesmo artifício para colocar em outros conteúdos que
estavam no ar, usando a mesma tag. A partir do momento que a gente colocou
essa mesma tag nos outros conteúdos, os outros conteúdos também começaram a
responder e a audiência a subir. Não subiu tanto como essa primeira, acho que
foi uma coisa inicial. Ela veio antes das outras, ela teve e gerou mais acesso no
Google do que as demais, mas as outras também responderam em algum nível e
começaram a gerar acesso pelo Google e não mais pela capa do nosso portal. A
galeria que começou a dar muito acesso era de fotos iniciais. O conteúdo em si
não justificava tanto a quantidade de acesso. A gente sabia que não era por causa
do destaque na capa, porque não tinha uma foto tão boa ainda para chamar
acesso pela capa e a gente foi notar que era mais a semântica da coisa mesmo, de
94
ser a palavra-chave que estava buscando acesso e não o conteúdo em si.
(Depoimento de Emerson Campos – grifos meus).
O conteúdo citado pelo jornalista e que fez disparar os acessos do site no dia 27 foi a
galeria de fotos intitulada “Incêndio em Santa Maria”, expressão que formou a URL do conteúdo
na publicação. O que foi descrito pelo repórter é uma situação real em que os conteúdos foram
publicados, monitorados com a ferramenta de medição de audiência e retroalimentados com a
recolocação da palavra-chave propositadamente para gerar acessos. Aproveitando o relato do
jornalista, é possível entender que ele descreve uma situação de folksonomia reversa, em que os
produtores de conteúdo perceberam qual tag estava capturando leitores na rota hipertextual. Eles
usaram essa etiqueta para multiplicar a atração e, consequentemente, os acessos.
As palavras grifadas ajudam a traçar um ciclo para entendimento da situação atípica, que
será corroborada com os números extraídos do Google Analytics. Inicialmente se tem alta
audiência, justificada pelo valor-notícia da tragédia. Em seguida, uma multiplicação desses
acessos por motivo não relacionado ao valor-notícia, pois a galeria sequer estava em local de
destaque na capa do site. O que aumenta a audiência é a indexação do conteúdo pelo Google
mediante a busca da palavra-chave “santa maria”. As matérias que normalmente apresentam alta
audiência são aquelas expostas com algum recurso nas capas dos portais, no Twitter ou Facebook
do em.com.br. Esse não era o caso da galeria de fotos “Incêndio em Santa Maria”.
O jornalista só fez a descoberta sobre a tag porque a ferramenta de medição de audiência
permite saber a origem de tráfego da leitura do site. Adiante, o artifício de taguear outros
conteúdos com a mesma etiqueta é a ação efetiva de consciência do repórter sobre a captura do
leitor na rota hipertextual, produto do que ele chamou de “semântica da coisa”. O ciclo se fecha
com o acesso inesperado dos leitores e com a taxa de conversão muito positiva.
95
Figura 9 –Galeria de fotos “Incêndio em Santa Maria”
Fonte: Captura de tela pela autora (2014)
6.1.1 Estatísticas do Google Analytics
Conforme dados do Google Analytics, naquele domingo, 93,19% do tráfego na página da
galeria teve origem em ferramentas de busca orgânica. O restante ficou para o tráfego direto
(leitor que clicou no link da galeria dentro de uma matéria ou em outro site que havia usado a
96
galeria), e para o tráfego de referência69
(leitores que chegaram até a galeria pelas capas do Portal
Uai, em.com.br, Google News, estaminas.com.br ou Facebook). De todo esse tráfego, 98,19%
veio do buscador Google. As combinações procuradas nos buscadores que renderam maior
audiência à galeria foram “incendio em santa maria” (18,81%), “fotos do incendio em santa
maria” (12,92%) e “fotos incendio santa maria”(5,42%).70
A diferença entre as combinações de tag parecem sutis, podem ser por apenas uma
preposição, mas mudam o cenário da audiência. Considerando que o site do Estado de Minas tem
o domínio em.com.br, a busca das preposições “em” no Google juntamente com as palavras-
chave “santa maria” pode ter ajudado no ranqueamento da página e impulsionado acessos para o
site mineiro.
Os números mostram que a maior parte da audiência para esse conteúdo é de leitores
capturados pela oferta que o Google fez do link para o site do Estado de Minas. É claro que são
leitores interessados no assunto, mediante todos os critérios de noticiabilidade citados, mas que
não chegaram à galeria de fotos de forma completamente espontânea. Esse leitor fez suas
escolhas baseado em um processo de cognição individual, porém optou dentro de uma oferta
preparada pelo buscador. Um dos impactos disso é a mudança imediata que o produto de
conteúdo precisou fazer para se “aproveitar” desse direcionamento de leitores.
Para se ter uma ideia da importância desse exemplo de gerenciamento de tag, o número
absoluto de acessos dessa galeria de fotos a colocou em primeiro lugar como a mais clicada de
todos os tempos desde o surgimento do portal em.com.br, em setembro de 2010. A audiência,
medida desde o dia da tragédia até julho de 201471
, é o dobro da galeria que vem em segundo
lugar – fotos da mulher Barbie. É também uma audiência quase três vezes maior que a galeria de
69
Esses sites do tráfego de referência são definidos pelo proprietário do site e passam a ser monitorados como
origens importantes de “porta de entrada” dos leitores.
70 Lembrando que os dados de palavras-chave ficam muito nebulosos porque existe uma variável do Google
chamada de not provided – não fornecido. São tags que não se conseguem definir. Isso causa uma distorção no
resultado final, porque o not provided fica com percentual altíssimo e não é possível saber quais palavras estão
incluídas no grupo. Especialistas em SEO discutem e rediscutem o tema, criam soluções alternativas, mas a
dificuldade de análise por causa do not provided permanecem. No caso do Incêndio em Santa Maria, o valor not
provided foi de 26,96%.
71 Data de fechamento de dados da pesquisa
97
fotos de um grave acidente na Avenida Nossa Senhora do Carmo em Belo Horizonte, que está no
ar desde 6 de junho de 2012. O incêndio consegue vencer qualquer conteúdo relacionado a
manifestações de julho de 2013, que foram fenômenos de audiência para o site. Nem mesmo o
fator regional do portal, a proximidade, o ineditismo e tantos outros critérios de noticiabilidade
associados ao acidente e às manifestações em Belo Horizonte venceram a competência da
semântica na indexação pelo Google.
Outro dado fundamental é o número de novos visitantes que a galeria atraiu,
comprovando que o gerenciamento de tags capturou leitores que nunca haviam visitado o site,
nem mesmo pelo conteúdo de nicho. São esses os leitores alvo dessa captura em rota hipertextual,
aqueles que habitualmente não clicariam na capa do em.com.br em busca de notícia. As novas
visitas não significam novos leitores imersivos para o site, talvez eles nunca mais tenham
voltado. No entanto, engrossaram as estatísticas daquele domingo. É possível conferir o resumo
dos números que fazem da galeria de fotos “Incêndio em Santa Maria” um diferencial histórico
de audiência no em.com.br na Figura 10:
98
Figura 10 – Números Incêndio em Santa Maria
Fonte: Elaborado pela autora
6.1.2 Google Trends como balizador dos termos “santa maria”
O uso de uma combinação de tags específica alterou o processo de produção dos
repórteres – que passaram a incluir a expressão “santa maria” em todo o conteúdo sobre a
99
tragédia – e capturaram leitores quase72
automaticamente. Possivelmente, antes da tragédia, a
expressão “santa maria” tivesse alguns valores semânticos associados quando procurada em
buscadores na Web. Agora não é mais possível testar essas antigas combinações, porque a
palavra-chave assumiu o significado atrelado ao incêndio, com novo campo semântico
construído. Essa rede de palavras muda com frequência, influenciada, muitas vezes, por
acontecimentos.
Uma rede semântica, segundo Santaella (2013), é a junção de um mecanismo por trás da
memória, o crescimento do significado e o entendimento de símbolos. Tudo isso é mantido
mutuamente na estrutura do conhecimento. É provável que, antes do incêndio, os resultados de
busca remetessem à santa – mãe de Jesus –, alguma cidade que não fosse aquela do Rio Grande
do Sul, alguma música, bairro, avenida, porto, peça teatral, igreja, enfim, a uma centena de
significados a que a expressão pode se referir.
No Google Trends, a tag alcançou o topo máximo de buscas em janeiro de 2013 e ganhou
combinações improváveis, que ficaram registradas por quase mais de ano: “tragédia santa maria”,
“santa maria tragédia”, “kiss santa maria”, “fotos santa maria”, “incêndio santa maria”. Uma
nova rede de conhecimento se formou no entorno da expressão a partir do acontecimento no Rio
Grande do Sul e da cobertura jornalística sobre o fato.
Quando outros portais de notícia escolheram, no processo de tagging de conteúdos, usar
as etiquetas “boate” ou “kiss”, podem ter perdido uma boa oportunidade de indexação certeira e a
consequente taxa de conversão. Essas duas palavras têm um campo semântico infinito,
principalmente aquela que pertence à língua inglesa. O em.com.br acertou na folksonomia reversa
de “santa maria”, conquistando novos visitantes e alta audiência.
72
“Quase automaticamente” porque, mesmo tendo como oferta o link do Estado de Minas em primeiro lugar, o
leitor poderia ter escolhido outra rota.
100
Figura 11 – Google Trends - interesse pela tag “santa maria” em buscas do Google
Fonte: Captura de tela pela autora (2014)
6.1.3 Análise de dados
A operação jornalística e linguística da cobertura Incêndio em Santa Maria é dotada de
dinamismo porque o acompanhamento de números da audiência em tempo real gera
comportamentos diferentes nos repórteres responsáveis pelo trabalho. Gera também uma variação
de ações do leitor a cada fato diferente sobre o incêndio e a cada caminho que ele assume na rota
hipertextual para chegar ao conteúdo do em.com.br. Falando em ações do leitor no contexto da
Web Semântica, leva-se em conta o ciclo de escolha a partir do momento em que digita palavras-
chave no buscador até a opção final pelo conteúdo. O leitor não para por aí, devido às inúmeras
possibilidades de reverberação e compartilhamento da leitura feita.
Percebe-se que o processo de produção e leitura no entorno do incêndio encontra ordem
no caos de um fato tão consternador, que exige competência para seleção de fontes de notícias,
além de uma minuciosidade no texto tão carregado pela tragédia. Essa auto-organização
alcançada durante a cobertura foi um resultado natural da adaptação do sistema de produção
numa situação caótica.
A característica mais marcante para se observar no episódio do “Incêndio em Santa
101
Maria” é a não-linearidade na produção do conteúdo – reforçada pela folksonomia reversa – e na
leitura que aconteceu em grande percentual por meio da captura em motores de busca. A
cobertura de Santa Maria marcou o processo jornalístico com um “algo a mais” diante de todas as
outras coberturas feitas no em.com.br porque destacou um padrão de produção diferenciado pelo
gerenciamento de tags. Essa cobertura em específico, como parte de um todo, fez surgir a
emergência para uma nova potencialidade ser cada vez mais explorada: a captura de leitor na rota
hipertextual.
O resultado da folksonomia reversa parecia ao repórter, conforme relatou Emerson
Campos, uma interação em pequena escala, mas os números do Analytics mostram que teve um
efeito em grande escala, principalmente quando se analisa a perspectiva de taxa de conversão. A
medida desse efeito está clara na autoamplificação em feedbacks dessa cobertura. O maior dos
retornos é a audiência gerada em efeito bola-de-neve a partir do uso da atratora “santa maria”.
O feedback ressoou e hoje observa-se a cobertura do incêndio como um fenômeno único
para o site, porque nele é possível ver o caos (no “estourar” das notícias) se transformando numa
perspectiva meta-balanceada de alcance de audiência. A cobertura do incêndio evoluiu durante
aquele domingo e tantos outros dias em que o conteúdo perpetuou. Os repórteres aprenderam a
eficiência do tagueamento para este caso – ação que foi “filtrada” como essencial para o
jornalismo que se fez a partir dali. O ciclo de quebra da fronteira do caos na cobertura pode ser
exemplificado da seguinte forma:
102
Esquema 3 – Processo de auto-organização no fenômeno “Incêndio em Santa Maria”
Fonte: Elaborado pela autora.
O ciclo remete ao Esquema 3 desta pesquisa. Em uma leitura mais refinada desse
esquema, poderia ser sugerido que cada um dos círculos fosse também um ciclo, pensando na
produção jornalística. Há uma auto-organização em cada uma das partes, daí a ideia de
dinamismo complexo onde quatro processos giram dentro de um sistema macro e integrado. A
ideia é semelhante quando se pensa no aspecto linguístico, resultado desse ciclo. A tag “santa
Maria”, além de atratora, pode ter funcionado como chave para a renovação da linguagem, com
novos elementos incorporados à rede de conceitos. Essa renovação pode representar uma situação
caótica inicialmente, mas logo se torna uma consolidação ou uma sedimentação da linguagem.
103
6.2 Morte de Paul Walker
No dia 30 de novembro de 2013, morreu o ator Paul Walker, 40 anos, muito conhecido
por protagonizar a sequência de filmes Velozes e Furiosos interpretando Brian O'Conner. A
notícia da morte ganhou destaque em sites nacionais e internacionais por se tratar de uma
celebridade e, além disso, pela forma trágica como o artista morreu: um acidente de trânsito. A
repercussão no Brasil ocorreu no domingo, dia 1° de dezembro. Paul era passageiro de um Porshe
dirigido por um amigo, que perdeu o controle do veículo, bateu em uma árvore e um poste. Eles
voltavam de evento beneficente da organização Reach Out Worldwide na cidade californiana de
Santa Clarita, ao norte de Los Angeles. Muito se especulou sobre as causas do acidente e as
investigações apontaram uma velocidade excessiva de 160 km/h. Com o impacto na árvore, o
carro explodiu e incendiou matando os dois ocupantes.
Uma tragédia automobilística com imagens fortes como a desse acidente geralmente atrai
olhares dos leitores de portais de notícias pela proximidade geográfica, singularidades ou pelo
critério da negatividade. Nesse caso específico, o valor-notícia se multiplica porque o acidente
envolve uma celebridade, atraindo ainda mais audiência para o fato. As oportunidades de
publicações naquele domingo sobre o tema foram inúmeras, tendo o em.com.br divulgado quatro
matérias sobre o acidente. A cobertura foi feita com informações de agências de notícias e dados
de sites locais da Califórnia, mas o trabalho de gerenciamento de tags fez, novamente, a diferença
para a audiência do conteúdo. O repórter João Henrique do Vale Almeida relata o que ocorreu:
Quando chegamos na redação, por volta das 7h, vimos que o ator tinha morrido
em um acidente de carro. Fomos nos sites dos EUA e apuramos as informações
para fazer a matéria, que ainda não tinha saído em agências de notícias.
Escrevemos uma pequena reportagem com as informações básicas e contando
um pouco a vida do artista. Como não tinha fotos do acidente, colocamos uma
imagem dele que tinha no nosso banco. Na capa do Uai, ficou em um destaque
com foto pequena no lado direito. Com o passar das horas, notamos que a
matéria começou a subir de audiência assustadoramente, coisa muito difícil de
acontecer, principalmente no fim de semana, quando a audiência é baixa. A
audiência estava vindo do Google. Nossa matéria era a primeira quando buscava
pela morte do ator. Por causa disso, começamos a investir na reportagem.
Colocamos uma foto do acidente e um vídeo do carro em chamas. Também
104
mudamos o destaque de lugar na capa. Subimos a reportagem para o rotacional.
Para não deixar a audiência cair, fizemos outras duas ou três matérias sobre o
caso. Elas também tiveram muito acesso, mas não chegaram a ter o acesso da
reportagem do vídeo que foi a mais lida. (Depoimento de João Henrique do Vale
Almeida – grifos meus).
O que se percebe no relato do João Almeida é uma reação um pouco diferente dos
repórteres que participaram da cobertura do Incêndio em Santa Maria e também se depararam
com uma situação de audiência extraordinária. No caso da morte do ator, o processo de indexação
e o sucesso do conteúdo não motivaram a folksonomia reversa, mas uma espécie de hierarquia e
produção reversas. É possível constatar isso no momento em que os jornalistas começaram a
“investir” no conteúdo ao perceberem o potencial de audiência para aquele domingo.
As palavras grifadas ajudam, novamente, a traçar um ciclo para entendimento da situação
atípica levando em conta o depoimento do entrevistado. Percebe-se que o conteúdo relacionado à
morte de Paul Walker começa a ser publicado com um destaque tímido (foto pequena) na capa do
Portal Uai até que a audiência assustadora altera a avaliação dos repórteres e motiva mudanças. A
primeira matéria ganha mais informações e outros conteúdos – como o vídeo do acidente – viram
prioridades na cobertura.
Quando o repórter diz: “a audiência estava vindo do Google”, nada mais é do que um
resumo de todo o processo de indexação e captura de leitores do qual esta pesquisa trata. Por
causa dos resultados de indexação, os jornalistas dão mais valor àquela notícia, escolhendo
posicioná-la em local mais destacado na capa do Portal Uai, o “guarda-chuva” responsável pela
maior visibilidade de produtos dos Diários Associados. Eles optam também por produzir mais
textos relacionados: “Subimos a reportagem para o rotacional. Para não deixar a audiência cair,
fizemos outras duas ou três matérias sobre o caso”.
A primeira ação representa uma mudança na hierarquia da informação na capa do site,
sendo importante destacar que o “rotacional” é um trecho nobre da capa, localizado no primeiro
scroll do site. Para entender como funciona uma distribuição de matérias na capa de um portal e
saber da importância da mudança que a indexação provocou, trago uma breve explicação sobre
estratégias de exibição das notícias em portais. Mielniczuk e Palácios (2001) dão uma
105
contribuição com um modelo73
de hierarquia das notícias:
Figura 12 – Modelo de hierarquia Mielniczuk e Palácios
A
C B1
B2 D
Fonte: Adaptado de Mielniczuk; Palácios (2001).
Segundo os autores, a Zona A corresponde ao cabeçalho do produto, contendo o nome do
jornal, o nome do portal e links para outras seções do portal. A Zona B é dedicada às notícias,
sendo que na parte superior (B1) há matérias mais novas e na parte inferior (B2) são colocados
apenas os títulos das notícias mais antigas. A Zona C é constituída prioritariamente por links que
conectam a todos os canais do portal. A Zona D tem links apontados para fora do conteúdo do
portal. Há espaço para publicidade, serviços ou sites externos relacionados com o material
jornalístico. O que se percebe é que a maioria dos portais de notícias segue esse padrão de
disponibilização de matérias. Nas zonas B1 e C estão geralmente notícias destacadas em letras
maiores (manchetes) e acompanhadas de fotos. A Zona B2 traz os chamados “destaques textos”
de fatos que já perdem valor-notícia. A Zona C atende a outras necessidades do leitor que não
seja a informação factual.
Essa matriz corrobora com um aspecto fundamental da lógica editorial do jornalismo na
Web: a multimodalidade. Segundo Kress e Leeuwen (1998), todos os textos são multimodais.
Quando falamos, nossa mensagem não vai apenas por meio das palavras, mas também por gestos,
entonações e expressão facial. Da mesma forma, quando escrevemos, a mensagem não é expressa
apenas linguisticamente, mas por meio de um visual marcado na página. As empresas
jornalísticas se preocupam muito com o layout e a apresentação das notícias. A importância dada
para cada destaque e o posicionamento dele na página expressam o valor do fato para aquele
veículo.
Os jornalistas que montam as capas de portais, geralmente, se apoiam em uma estrutura
que Kress e Leeuwen (1998) chamam de Given-News, um equilíbrio entre notícias que já são de
73
Modelo criado pelos autores em análise do site Último Segundo, jornal desenvolvido exclusivamente para Web.
106
conhecimento do público (Given), mas geram interesse e familiaridade, por isso precisam estar
nas capas, e os fatos novos (News), que as pessoas ainda não leram e aos quais vão dedicar certa
atenção durante a navegação no site. O balanceamento desses aspectos é uma tarefa complexa,
porém a chave para uma estrutura editorial.
A capa do Portal Uai na época da morte do ator era montada conforme a Figura 113 e o
conteúdo sobre a tragédia entrou na sessão de fotos que giram na capa – o rotacional. Se a captura
de leitores por tags, a indexação e o aumento imediato de audiência não ocorressem, as mudanças
de hierarquia não teriam acontecido. O jornalista foi motivado a fazer as alterações por causa da
audiência, resultado da captura de leitores na rota hipertextual. Dessa forma, fica demonstrado
que o modelo de Mielniczuk e Palácios (2001) e de Kress e Leeuwen (1998) ganharam a
indexação em buscadores como aliada, ficando ela no papel de “gatekeeper” para hierarquização
de matérias e capas nos portais.
Figura 13 – Capa do Uai em Junho de 2013, mesmo modelo de novembro 2013
Fonte: Captura de tela pela autora (2013).
Rotacional
107
A matéria de grande acesso à cobertura sobre a tragédia envolvendo Paul Walker é aquela
em que é inserido o vídeo do acidente automobilístico. O título dessa reportagem, ou seja, a URL
dela, tem palavras-chave importantes quando se pensa em captura do leitor em motores de busca:
“vídeo”, “paul walker” e “acidente”. Uma ação natural do repórter, acostumado com estratégias
de SEO, seria pensar quais palavras o leitor buscaria no Google para saber mais sobre a morte do
ator de Velozes e Furiosos. Muitas combinações de tags poderiam ser certeiras nesse caso, mas as
três etiquetas citadas acima foram eficientes quando se trata da curiosidade do leitor sobre o
assunto. Não é à toa que a matéria “Vídeo mostra momento em que carro de ator Paul Walker fica
em chamas após acidente” alcançou o maior acesso74
em tempo real do site em.com.br, pico de
audiência causada pelo ranqueamento eficiente da matéria Google.
Figura 14 –Matéria “Vídeo mostra momento em que carro de ator Paul Walker fica em chamas
após acidente”
Fonte: Captura de tela pela autora (2013).
74
Vale lembrar que a pesquisa encerrou a coleta de dados em julho de 2014. Por curiosidade, verificaram-se os
dados após o encerramento e o recorde de acessos em tempo real foi superado em 13 de agosto de 2014, com a
morte do candidato Eduardo Campos.
108
Estatísticas do Google Analytics
Conforme dados do Google Analytics, naquele domingo, 82,49% dos acessos à matéria
com o vídeo sobre a morte do ator vieram de busca orgânica, sendo 82,15% do Google. O mais
importante desses números foi o resultado dos motores de busca na audiência em tempo real, um
recorde para o portal em.com.br. A matéria alcançou milhares de pageviews simultâneos nesse
mesmo link, valores que permaneceram estáveis por mais de 24 horas. Para se ter uma ideia, um
conteúdo local de Minas Gerais sobre protestos em junho de 2013 alcançava, no auge de conflitos
entre policiais e manifestantes – em matérias com muitos vídeos, informações, fotos e galerias –,
metade dos acessos simultâneos registrados na cobertura da morte de Paul Walker.
As combinações procuradas nos buscadores que renderam maior audiência foram as tags
“paul walker” (5,02%), “morte de paul walker” (1,4%), “ator de velozes e furiosos morre”
(0,76%) e “morre ator de velozes e furiosos (0,55%)”75
. O número de novos visitantes na matéria
do vídeo também é relevante: 74,40% das pessoas que clicaram eram estreantes.
Os números mostram que a maior parte da audiência para este conteúdo é de leitores
capturados pela oferta que o Google fez do link para o site do Estado de Minas. A importância
jornalística dos resultados nesta cobertura vai além das mudanças demonstradas com a hierarquia
e produção reversas. A audiência assustadora em tempo real é estrategicamente fundamental para
um portal, porque demonstra sua saliência em relação a concorrentes e sua relevância na Web.
A origem de audiência para o conteúdo local é geralmente tráfego direto e tráfego de
referência, mas no conteúdo internacional – como no caso da morte de Paul Walker – o
em.com.br tem contado cada vez mais com a busca orgânica. Cria-se, assim, um desafio de
planejamento de acessos aos portais de notícia locais, como o em.com.br, que focam o negócio
nas notícias de Minas e, muitas vezes, perdem o time para a ação de motores de busca. Para uma
empresa de comunicação, toda e qualquer audiência é sempre bem-vinda, mas é necessário
repensar planos e produção quando uma ferramenta tecnológica como a busca orgânica influencia
muito na audiência.
Se um site tem, por exemplo, um plano de metas de audiência por repórter ou por editoria
75
Cf. nota 70 sobre not provided. Neste caso, o valor foi de 82,04%.
109
e os resultados são influenciados por fatores do meio (Web Semântica), a meta precisa ser refeita
considerando essa variável. Se está planejado um crescimento X para a editoria Internacional e
um crescimento Y para a editoria Gerais, as proporcionalidades de origem de tráfego precisam
fazer parte do plano, senão, a editoria local ficará com crescimento distorcido em relação àquelas
que ganham muito com a busca orgânica. O conteúdo local quase nunca se beneficia da
indexação de matérias no Google, diferente de matérias nacionais ou internacionais, pois conta
mais com o tráfego direto.
Audiência é apenas um dos fatores jornalísticos que precisam ser levados em conta numa
produção, mas se há ferramentas que ajudam na reverberação automática de acessos, nada melhor
do que administrá-las com inteligência. O em.com.br começou a fazer isso recentemente, de
forma bem primária, porque vive tomado pela rotina de produção e o processo de análise e
estudos de SEO fica em segundo plano.
Vejamos o resumo de números que fazem da matéria “Vídeo mostra momento em que
carro de ator Paul Walker fica em chamas após acidente” um diferencial histórico de audiência no
em.com.br:
110
Figura 15 – Números Morte Paul Walker
Fonte: Elaborado pela autora
6.2.1 Google Trends como balizador dos termos “paul walker”
O comportamento da tag “paul walker” tem um perfil parecido com “santa maria” por
causa do pico de buscas no período da morte do ator. No caso da morte, é possível fazer uma
análise diferente do campo semântico atualmente associado ao nome do artista. Os fatores de
111
busca que possivelmente vinham acompanhados de tags como “ator”, “filme”, “velozes e
furiosos” agora ficam eternizados como uma procura associada a palavras-chave como “dead”,
“death”, “crash”.
Na análise da tag “paul walker”, é difícil balizar o termo com uma língua específica –
inglês ou português – porque a expressão é um nome próprio usado com esta grafia em qualquer
língua. A tag “santa maria”, por exemplo, ainda poderá retomar os significados anteriores,
porque, passado um bom tempo da tragédia, as buscas no Google voltam a associar essa etiqueta
a outros campos semânticos. No caso de “paul walker”, dificilmente haverá a reversão do campo
semântico relacionado ao acidente fatal. O sétimo filme da série Velozes e Furiosos está marcado
para estrear em 2015 com homenagens ao ator e participação dos irmãos dele. A estreia, como
fato jornalístico, poderá alterar a marca semântica que o nome de Paul Walker agora carrega na
Web – com associação à morte.
O estudo dessa tag poderia nos levar até a uma reflexão mais profunda sobre memória na
Web, o que não é o objetivo deste estudo. Uma análise temporal de tags específicas mostraria o
rastro deixado pelas marcas linguísticas na história relacionada àquela etiqueta (neste caso,
história do ator), mas isso é assunto para outra pesquisa. Lévy tem uma contribuição sobre essa
perspectiva de semântica e memória na Web:
O mundo virtual contém dados simbolicamente codificados da memória pessoal
e social, bem como todos os jogos de interpretação e de avaliação desses dados.
Mesmo se os dados e suas interpretações sejam necessariamente sustentados por
entidades ou processos materiais, as suas significações e os seus valores
pertencem ao mundo virtual. Pois, do ponto de vista dos céus de ideias, os dados
são percebidos como vetores do sentido donde escapa uma multiplicidade
inesgotável de conceitos pensados pelo intelecto discursivo e pela sua atividade
hermenêutica. Os significados, as classes, as categorias gerais e os seus valores
simbólicos não possuem endereços espaço-temporais. (LÉVY, 2014, p.118).
112
Figura 16 - Google Trends - interesse pela tag “paul walker” em buscas do Google
Fonte: Captura de tela pela autora (2014).
6.2.2 Análise de dados
O esquema cíclico criado na cobertura da Morte de Paul Walker, em que o repórter
reverteu a produção por causa da audiência, mostra uma operação jornalística e linguística
dinâmica, baseada em um comportamento de constante mudança: variação de page views x
mudanças no processo de produção e hierarquização das notícias. A ação da tag “paul walker”
como atratora de leitores na rota hipertextual alterou não somente a audiência do portal, mas
também o trato da notícia pelos jornalistas.
O processo caótico de noticiabilidade naquele domingo de intensa produção se auto-
organizou e se manteve até o dia seguinte, quando a audiência ainda estava com a origem de
tráfego no ranqueamento do Google. Os resultados vieram de uma adaptação natural do sistema
criado no entorno da cobertura. Não foi necessária qualquer ação externa para que a audiência se
mantivesse; o que os repórteres fizeram alterando hierarquia e produção foi apenas consequência
do resultado já alcançado quase automaticamente pela indexação da tag na URL. Conclui-se que
a captura do leitor na rota hipertextual por meio de tags atratoras indexadas pelos motores de
busca se autossutenta em uma estrutura reticular e não linear.
O efeito em grande escala, resultado números de acesso alcançados pela matéria do vídeo,
113
marca não somente um recorde em audiência tempo real como a emergência de um padrão de
potencialidades relacionadas às estratégias de SEO para editorias que muito se beneficiam com a
busca orgânica. Essas editorias e suas coberturas – como sistemas – alcançam um nível de auto-
organização muito maior do estado anterior sem os processos de captura quase automática do
leitor.
Os feedbacks em audiência amplificaram as ações dos repórteres e consequentemente a
reverberação de taxa de conversão para todo o conteúdo relacionado à morte do ator Paul Walker.
Como consequência direta também – em efeito bola-de-neve – o em.com.br como um todo
alcançou bons números naquele fim de semana de produção. Nesse ciclo de feedbacks é
interessante pensar que há protagonismo de leitor e produtor igualmente envolvidos no ciclo de
interação que vai da desordem à ordem, com ressonância constante.
Esquema 4 – Processo de auto-organização Morte Paul Walker
Fonte: Elaborado pela autora.
114
O todo não pode, pois, ser descrito por um movimento simples, mas por um
movimento de ida e volta, de ação e reação linguísticas, que representa o
círculo de proposição. (DELEUZE, 2007, p.189).
7 Considerações finais
O todo desta pesquisa não se encerra aqui nas considerações finais, porque o objetivo é
que este estudo continue representando círculos de proposições, da autora ou de outros. O
resultado de dois anos de pesquisa não pode ser descrito por um movimento simples, por isso
idas e vindas do texto ajudam a fechar este primeiro ciclo. No entanto, o fechamento não é o
limite, sempre fica a chance de um algo a mais.
7.1 Conclusões
Modelos lineares de navegação na Web, ainda disponibilizados por muitos produtores,
não correspondem à expectativa do leitor que tende a fazer uma navegação nômade, própria dos
sistemas complexos. No jornalismo, por exemplo, o leitor tem chegado aos conteúdos de formas
diferentes pela rota hipertextual, nem sempre pelo tráfego direto a portais de notícias. O uso de
buscadores impacta os processos de produção e de leitura, como foi mostrado nos casos das
coberturas jornalísticas desta pesquisa, em duas situações comunicativas distintas. Nesse sentido,
o jornalismo digital fica cada vez mais baseado em tags e remixado na rede.
É nesse contexto que as palavras-chave surgem como atratoras no sistema complexo
guiando produtores nas estratégias de etiquetagem de conteúdo e capturando os leitores para
conteúdos direcionados em um caminho não linear. Elas emergem como articuladoras da
complexidade. Por causa disso, o gerenciamento de tags entra de vez como atividade parte da
rotina de produção, mesmo que timidamente, puxada pelas ferramentas da Web Semântica e
SEO.
115
Os processos de dedução e indução do produtor também são potencializados pelo
gerenciamento de dados, influenciando diretamente em resultados e regras na lógica produtiva.
Para o jornalismo, esse gerenciamento passa pelo monitoramento de audiência e origem de
tráfego das matérias online, que geram ações de folksonomia (reversa) ou mudanças de hierarquia
(reversa) na distribuição da informação em portais. A folksonomia, em especial, ganha status de
paradigma de classificação, considerada como ferramenta de distribuição de conteúdo online e
recuperação de informação.
Os resultados linguísticos para toda essa lógica complexa de produção e leitura no
contexto da Web são as construções de novos valores semânticos para as tags - quando se pensa
em memória de navegação. As palavras-chave se enchem de campos semânticos variados, um
reflexo do encontro entre signo e linguagem. A rede se torna o lugar onde o signo “extrojetado”
de cada pensamento se manifesta em ambiente conjunto, de compartilhamento e construção
coletiva de conhecimento. Este ambiente agora tem como desafio operar significados de forma
não fragmentada.
Esses significantes estão bem interconectados, mas não os seus significados. As
camadas de complexidade das mensagens e as formações discursivas, as
ressonâncias semânticas entre as multiplicidades dialógicas, as longas linhas
solidárias de transformações hermenêuticas, tudo que faz a sutileza, a riqueza a
própria essência da cultura, permanecem quase opaco ao cálculo. E é por esse
motivo que ainda hoje a inteligência coletiva fragmentada não pode representar
para si mesma os seus próprios processos cognitivos, segundo a ordem de
grandeza do novo meio digital (LÉVY, 2014, p. 81).
A produção e a leitura regidas por atratores reforçam a ideia do ambiente digital como um
sistema complexo que se auto-organiza a partir da dinâmica das redes hipertextuais. As
possibilidades da Web Semântica ajudam a entender o que se passa na cabeça do leitor, a atraí-lo
na rota tentando adiantar a lógica de pensamento dele quando navega. As ferramentas inteligentes
trazem todo o potencial que tem origem, nada mais nada menos, que no pensamento humano.
Para Lévy (2014), as ações dos jornalistas e comunicadores farão com que o leitor entenda as
mensagens por meio de contextos. Dar sentido ao texto é o mesmo que ligá-lo, conectá-lo a
outros textos, portanto é o mesmo que construir um hipertexto. Uma observação do autor que
casa com as considerações finais desta pesquisa é que “todos os documentos estão virtualmente
116
interconectados, formando, no limite, um único hipertexto movente, lido e relido por uma
multiplicidade de autores e leitores de línguas, de culturas e de ética diferentes” (LÉVY, 2014, p.
191). O que se pode perceber é que no meio digital, a língua não é mais apenas a memória
autônoma que a escrita lhe confere, pois ela possui uma capacidade de ação e de interação
autônoma.
A Web Semântica está fornecendo estruturas e dando significado ao conteúdo, criando um
ambiente onde agentes de softwares e leitores possam trabalhar de forma cooperativa. A
tecnologia está ajudando na construção do que Morin (2003) chama de pensamento complexo, no
qual passamos de uma visão linear para uma ideia circular com conectividade.
O terreno de linkagens temporárias e relações rizomáticas que a comunicação em
ambiente digital “pisa” é resultado do uso de potencialidades da Web, que mudou muito desde a
primeira geração até a fase de gerenciamento de dados que alcança atualmente. São mudanças de
visão de navegação e leitura, essenciais para a produção mais competente de conteúdo que reflita
a hipercomplexidade do ambiente. Ainda há muito que fazer, principalmente no aspecto da
interoperabilidade entre linguagens e sistemas, mas a Web Semântica possibilita melhor
aproveitamento dos efeitos da rede pelas empresas de comunicação. Haja vista os exemplos de
aumento expressivo de taxa de conversão para em.com.br nos dois casos estudados.
Acredita-se que as principais contribuições deixadas pela pesquisa são um conceito mais
“comunicacional” da Web Semântica, a perspectiva do gerenciamento de tags como ferramenta
de trabalho para produtores de conteúdo, além da cadência de conceitos que ligam complexidade,
semântica e folksonomia, neste caso com aplicabilidade ao jornalismo baseado em tags, mas que
pode servir como arcabouço teórico para outras perspectivas da produção de conteúdo online.
As consequências dos aspectos aqui estudados para a Web são um sinal de que o futuro
está no alcance de mais claridade semântica. Se a humanidade quiser produzir conteúdos
significativos e recuperáveis na rede, é preciso construir instrumentos para observação capazes de
canalizar uma complexidade inesgotável. Canalizar a complexidade não é limitar, mas sim
explorar de forma funcional toda tecnologia disponível. Isso em todas as dimensões, da menor –
quando um jornalista percebe a audiência com origem de tráfego em uma tag e incorpora essa
palavra-chave na produção – até a criação de uma esfera semântica como Lévy propõe com o
117
IEML. Organizar os sentidos dos dados na Web: esse é o próximo passo.
O sentido de uma palavra não é outro senão a guirlanda cintilante de conceitos e
imagens que brilham por um instante ao seu redor. A reminiscência desta
claridade semântica orientará a extensão do grafo luminoso, disparado pela
palavra seguinte, e assim por diante, até que uma forma particular, uma imagem
global, brilhe por um instante na noite dos sentidos. Ela transformará, talvez
imperceptivelmente, o mapa do céu, e depois desaparecerá para abrir espaço
para entras constelações. (LÉVY, 2004, p. 14)
7.2 Finalizando
Considero que consegui mapear a evolução de produção e leitura na Web, avançando para o
campo da Web Semântica por meio dos casos usados como exemplo nesta pesquisa. Foi possível
mostrar os novos posicionamentos do produtor de conteúdo, no que diz respeito ao
gerenciamento de tags e as ações do leitor na rota hipertextual - características proporcionadas
pela era semântica da Web de uma forma que não era observada antes.
Os aspectos que indicam essa evolução de posturas do produtor são a inserção do S.E.O na
realidade diária, a prática de uma folksonomia e uma hierarquia da informação ordenadas pelo
indicativo de audiência. A folksonomia e hierarquia reversas praticadas pelos repórteres se
assemelham como processo de gerenciamento de tags, mas se diferenciam como estratégia
jornalística, porque mobilizam os repórteres de formas distintas. Para concluir as duas práticas, o
jornalista usa ferramentas, programas e habilidades diferentes. Mesmo assim, o objetivo das duas
ações – que nasceram durante o processo de produção – foi o alcance de mais audiência.
Os produtores percebem que modelos lineares de navegação na Web frustram expectativas do
leitor e inserem – mesmo que timidamente ou inconscientemente – estratégias semânticas na
produção. Quando digo inconscientemente é porque os jornalistas talvez não tenham essa noção
global de linearidade x não-linearidade, mas veem a necessidade de mudança na disponibilização
de conteúdo.
O que indica a mudança na perspectiva do leitor é o uso de buscadores para dar início a um
processo de navegação ordenado primeiramente pelo que passa na cabeça desse leitor, depois
pelos termos que ele procura e depois pelo link que ele escolhe para iniciar a rota hipertextual. É
por isso que o jornalista agora pensa além da pauta na tentativa de acertar o que o leitor buscaria
no Google para encontrar o conteúdo sobre o qual está escrevendo. É por isso, também, que a
118
Web Semântica está criando um ambiente onde agentes de softwares, jornalistas e leitores
trabalham de forma coordenada, potencializando resultados de audiências para empresas de
comunicação - um aproveitamento muito melhor da rede por essas organizações.
Por fim, considero que ficou claro o gerenciamento das tags mudando a estrutura de
significação de conteúdos na Web porque altera o campo semântico no em torno de etiquetas
associados a uma informação, tópico ou discussão. Foi isso que aconteceu com “santa maria” e
“paul walker” logo depois das duas tragédias. A indexação incorporou a essas tags novas
significações relacionadas ao incêndio e ao acidente automobilístico.
As estratégias exemplificadas nesta pesquisa poderiam ser aplicadas a qualquer cobertura
jornalística e em qualquer site. Este trabalho não é um serviço para empresas jornalísticas, mas
sim, um debate que inclui até a tal essência jornalística citada na página 92. Em que medida, o
jornalismo não é pretensioso demais em definir critérios para transformar fatos em notícias? As
demonstrações nos dois casos desta pesquisa revelam um processo muito mais espontâneo de
interesse do leitor aos conteúdos do que uma criação produtora pré-determinada. Sendo assim,
esta pesquisa é muito mais um serviço para o leitor, porque discute um movimento de escolhas
em rota hipertextual, que talvez o leitor nem perceba que faz.
7.3 Bastidores
Escolhi Deleuze para iniciar cada capítulo porque, em a Lógica do Sentido, ele ensina
como explorar as inter-relações dos sentidos como estrutura. Deleuze não se satisfaz com o plano
formal dado para o sentido, assim o explora de maneira mais complexa, enredada. O que ele faz
nesse livro dialoga muito com a organização do meu trabalho e, metalinguisticamente, com o
tema. A identidade visual da dissertação também não é por acaso. Ao fundo das imagens criadas
119
está a foto do sistema dinâmico conhecido como atrator de Lorez76
. Os círculos se amarram com
a metodologia criada por Deleuze, uma lógica circular com interseção de sentidos.
76
O Atractor de Lorenz foi introduzido por Edward Lorenz em 1963, que o derivou a partir das equações
simplificadas de rolos de convecção que ocorrem nas equações da atmosfera. É um mapa caótico que mostra
como o estado de um sistema dinâmico evolui no tempo num padrão complexo, não-repetitivo e cuja forma é
conhecida por se assemelhar a uma borboleta. Disponível em <http://pt.wikipedia.org/wiki/Atractor_de_Lorenz>.
Acesso em 8 ago.2014.
121
8 Referências Bibliográficas
ALVARENGA, Lídia; SOUZA, Renato Rocha. A Web Semântica e suas contribuições para a
ciência da informação. Ci. Inf., Brasília, v. 33, n. 1, p. 132-141, 2004,. Disponível em
<http://revista.ibict.br/index.php/ciinf/article/viewArticle/50>. Acesso em 10 jun. 2014.
ALZAMORA, Geane; TÁRCIA, Lorena. A narrativa transmidiática: considerações sobre prefixo
trans. In: D’ANDREA, Carlos et al (Org.) Jornalismo Convergente: reflexões, apropriações,
experiências. Florianópolis: Insular, 2012.
ANDERSON, Chris. "The Long Tail" Wired, 2004.
ASSANGE, Julian. Cypherpunks: liberdade e futuro da internet. São Paulo: Boitempo, 2013.
ASSIS, Juliana; MOURA, Maria Aparecida. Folksonomia: a linguagem das tags. Encontros
Bibli: Revista Eletrônica de Biblioteconomia - Ciência da Informação, v. 18, n. 36, p. 85-106.
Florianópolis, 2013.
BAPTISTA, Ana Alice; CATARINO, Maria Elisabete. Folksonomia: um novo conceito para
organização de recursos digitais na web. Data Grama Zero, Revista de Ciência da Informação.
v. 8, n. 3, 2007.
BARBOSA, Suzana. Jornalismo Digital em Base de Dados (JDBD): um paradigma para
produtos jornalísticos digitais dinâmicos. 2007. Tese (Doutorado). Universidade Federal da
Bahia, Bahia, 2007.
BEIGUELMAN, G. Processos de criação e produção do conhecimento em hipermídia e em
redes fixas e móveis: pressupostos críticos e criativos no Design de Interfaces. Programa de
Pós-Graduação em Cultura e Semiótica. PUC/SP, fev-jun. 2009.
BERNERS-LEE, T., LASSILA, Ora; HENDLER, James. The semantic Web. Scientific
America, 2001.
Bruns, Axel. From Prosumer to Produser: Understanding User-Led Content Creation. In
Transforming Audiences 2009, 3-4 Sep, London, 2009.
CAMPOS, E. G. Convergência de mídias: uma análise da união de linguagens em notícias do
Portal Uai. Belo Horizonte, 2013.
CAMPOS, Maria Luiza Machado; CAMPOS, Maria Luiza de Almeida; CAMPOS, Linair Maria.
Web Semântica e a gestão de conteúdos informacionais. In: MARCONDES, Carlos H. et al
(Orgs.). Bibliotecas digitais: saberes e práticas. Brasília, 2006.
CASTELLS, Manuel. A sociedade em rede. A era da informação: economia, sociedade e cultura,
122
v.1, 9. ed. São Paulo: Paz e Terra, 1999.
CHARAUDEAU, Patrick. Discurso das mídias. São Paulo: 2. ed. Contexto, 2010.
______. Uma teoria dos sujeitos da linguagem. In: MARI, H. et al. Análise do discurso:
fundamentos e práticos. Belo Horizonte, Núcleo de Análise do Discurso/ FALE UFMG, 2001.
CRUZ, Luana; FERREIRA, Priscila; GODINHO, Poliana; GOMES, Alba; PEIXOTO, Giuliano.
Discussão dos modelos teóricos de comunicação em rede e suas aplicações práticas em
produtos para hipermídia: um estudo de caso do iGoogle. Disponível em
<http://www.bocc.ubi.pt/pag/gomes-peixoto-cruz-pires-ferreira-discussao-dos-modelos-
teoricos.pdf>. Acesso em 18 jun. 2014.
CUNHA, Jaqueline de Araújo. Web Semântica: o estado da arte. Universidade Federal do Rio
Grande do Norte. Centro de Ciências Sociais Aplicadas. Natal, 2006.
D'ANDRÉA, Carlos Frederico de Brito. Processos editoriais auto-organizados na Wikipédia
em português: a edição colaborativa de “biografias de pessoas vivas”. Belo Horizonte, 2011.
Disponível em <http://www.bibliotecadigital.ufmg.br/dspace/handle/1843/DAJR-8MYFZQ>
Acesso em 31 ago.2014.
DELEUZE, Gilles; GUATTARI, Félix. Mil Platôs - Capitalismo e esquizofrenia. São Paulo:
Editora 34, v. 5, 2007.
DELEUZE, Gilles. Lógica do sentido. São Paulo: Perspectiva 2007.
FERRARI, Pollyana. Narrativas tagueadas: uma narrativa social, informativa e feita pelo usuário.
Revista Select, São Paulo, 2012.
FRANÇA, Vera R. Do telégrafo à rede: o trabalho dos modelos e a apreensão da comunicação.
In: PRADO, José L. (Org.). Crítica das práticas midiáticas: da sociedade de massa às
Ciberculturas. São Paulo: Hacker Ed, 2002-a., p. 57-76.
FORMAGGIO, Erick Beltrami. SEO – otimização de sites: aplicando técnicas de otimização de
sites com uma abordagem prática. Rio de Janeiro: Brasport, 2008.
GOUVÊA, Cleber; LOH, Stanley. Jornalismo semântico: uma visão em direção ao futuro do
jornalismo online. In.: D’ANDREA, Carlos et al (Org.) Jornalismo Convergente: reflexões,
apropriações, experiências. Florianópolis: Insular, 2012.
GUBA, E.; LINCOLN, Y. Controvérsias paradigmáticas, contradições e confluências emergentes.
In: DENZIN, N.K.; LINCOLN, Y.S. O planejamento da Pesquisa Qualitativa. 2. ed., Porto
Alegre, 2006.
JENKINS, Henry. Cultura da Convergência. São Paulo, Editora Aleph, 2009.
123
JENKINS, Henry; FORD, Sam; GREEN, Joshua. Spreadable Media: Creating Value and
Meaning in a Networked Culture. New York, NY: New York University Press, 2013.
LANDOW. George P. Hypertext 3.0: critical theory and new media in era of globalization. Rev.
ed. Hypertext 2.0 1997. Baltimore, The Johns Hopkins University Press, 2006.
LÉVY, Pierre. Pela ciberdemocracia. In: MOARAES, de Denis (Org). Por uma outra
comunicação. Mídia mundialização cultural e poder. Rio de Janeiro: Record, 2003.
______. As tecnologias da Inteligência: o futuro do pensamento na era da informática. Rio de
Janeiro, Editora 34, 2004.
_____________ A esfera semântica. Tomo I: computação, cognição, economia da
informação. São Paulo, Annablume 2014.
LIMA JÚNIOR, Walter Teixeira. “Era do Big Data” impulsiona crescimento do Jornalismo
Computacional. In: D’ANDREA, Carlos et al (Org.) Jornalismo Convergente: reflexões,
apropriações, experiências. Florianópolis: Insular, 2012.
MCLUHAN, Marshall; FIORE, Quentin. O meio são as massa-gens. 2. ed. Rio de Janeiro:
Record, c1969.
MANOVICH, Lev. Softwares takes command. 2008. Disponível em <http://migre.me/fublx>
Acesso em 31 ago. 2014.
MARCONDES, Carlos Henrique. Metadados: descrição e recuperação de informação na Web. In:
MARCONDES, Carlos H. et al (Org.). Bibliotecas digitais: saberes e práticas, Brasília, 2006.
MIELNICZUK, Luciana. Sistemas de Publicação em Ciberjornalismo: Rotinas produtivas.
Universidade Federal do Maranhão, 2011.
MIÈGE, Bernard. O pensamento comunicacional. Rio de Janeiro: Vozes, 2000.
MOHERDAUI, Luciana. Jornalismo baseado em tags. In: RIBEIRO, Ana Elisa et al (Org.).
Leitura e escrita em movimento. São Paulo: Peirópolis, p.214-228, 2010.
______. Interfaces nômades: uma proposta para orientar o fluxo noticioso na Web. São Paulo,
2012.
MORIN, Edgar. Introdução ao pensamento complexo. Lisboa: Instituto Piaget, 2003.
______. A comunicação pelo meio (teoria complexa da comunicação). Revista FAMECOS.
Porto Alegre, 2003.
MOURA, Maria Aparecida. Informação, ferramentas ontológicas e redes sociais ad hoc: a
interoperabilidade na construção de tesauros e ontologias. Revista Informação & Sociedade.
124
João Pessoa, v.19, n.1, p.59-73, 2009.
MORENO, Josyane; ROCHA, Ana Karolina. A folksonomia como ferramenta para a
representação do conhecimento na web sob a ótica das redes sociais. XXXV Encontro Nacional
de Estudantes de Biblioteconomia, Documentação, Ciência da Informação e Gestão da
Informação Escola de Ciência da Informação, UFMG, Belo Horizonte, 2012.
PALAZZO, L.A.M. Complexidade, caos e auto-organização. 1999. Disponível em:
<http://algol.dcc.ufla.br/~monserrat/isc/Complexidade_caos_autoorganizacao.html>. Acesso em
31 ago. 2014.
PARREIRAS, Vicente. A sala de aula digital sob a perspectiva dos sistemas complexos: uma
abordagem qualitativa. Tese. UFMG, 2005.
PRIMO, Alex. Interação mediada por computador: comunicação, cibercultura, cognição.
Porto Alegre: Sulina, 2007.
PRIMO, Alex. As tags como informação contextual de afeto. 2010.
RIBEIRO, Ana Elisa. Leituras sobre hipertexto: trilhas para o pesquisador. Trabalho apresentado
no GT Hipertexto: que texto é esse?, no XI Simpósio Nacional de Letras e Linguística e I
Simpósio Internacional de Letras e Linguística, Uberlândia, nov. 2006.
RUÓTOLO, A. C. Audiência e recepção: perspectivas. Comunicação & Sociedade. São
Bernardo do Campo, PósCom-Umesp, 1998.
SABBATINI, Marcelo. A folkcomunicação na era da convergência midiática digital: da
folksonomia às narrativas folkmidiáticas transmídia. Revista Eletrônica Razón y Palabra. 2011
SANTAELLA, Lucia. Navegar no ciberespaço: o perfil cognitivo do leitor imersivo. São Paulo:
Paulus, 2004.
______. Matrizes da Linguagem e Pensamento: sonora, visual, verbal. 3. ed. São Paulo:
Iluminuras/Fapesp, 2005.
______. O crescimento extrassomático do cérebro humano. Porto Alegre, Pontifícia
Universidade Católica do Rio Grande do Sul, 2013. (Comunicação oral)
STERLING. Bruce. Folksonomia. Observatório da Imprensa, n. 326, 26 abr. 2005. Entre Aspas.
O'REILLY, Tim. Web 2.0 Compact Definition: Trying Again. 2006. Disponível em:
<http://radar.oreilly.com/2006/12/web-20-compact-definition-tryi.html >. Acesso em 21 abr.
2014.
SAWYER, R. Keit. Social Emergence: societies as complex systems. Washington University,
2005.
125
SILVERMAN, David. Interpretação de dados qualitativos: método para análise de entrevistas,
textos e interações. Tradução: Magda Franca Lopes – Porto Alegre: Artmed, 2009.
VAN AMSTEL, Frederick. Folksonomia: vocabulário descontrolado, anarquitetura da informação
ou samba do crioulo doido? In: Encontro Brasileiro de Arquitetura da Informação, São Paulo,
2007. Disponível em:
<http://www.usabilidoido.com.br/arquivos/folcsonomia_anarquitetura.pdf>. Acesso em 31
ago.2014
WAL, Thomas Vander. Folksonomy Coinage and Definition. 2007. Disponível em
<http://vanderwal.net/folksonomy.html>. Acesso em: 31 ago.2014.
WING, Jeannete M. Computacional Thinking. Communication of the Association for Comuting
Machinery. v. 49. n 3, março 2006.
126
APÊNDICE A
Roteiro de entrevistas com repórteres
Incêndio em Santa Maria - I
Pergunta padrão 1: O que aconteceu na redação no dia da cobertura?
Pergunta padrão 2: O que vocês fizeram quando perceberam aquela audiência atípica?
Pergunta livres: E aquela galeria, o que havia de diferente nela?
Morte de Paul Walker – II
Pergunta padrão 1: O que aconteceu na redação no dia da cobertura?
Pergunta padrão 2: O que vocês fizeram quando perceberam aquela audiência atípica?