Upload
others
View
12
Download
0
Embed Size (px)
Citation preview
fevereiro de 2018
Ângela Rodrigues Alpoim
Identificação dos desafios que o Big Data
coloca à área do Business Analytics
Dissertação do Mestrado Integrado em Engenharia
e Gestão de Sistemas de Informação
Trabalho efetuado sob orientação do
Professor Doutor Manuel Filipe Santos
e do
Professor Doutor Carlos Filipe Portela
Página | iii
RESUMO
Atualmente, a chave de sucesso de muitas organizações passa por gerir, eficazmente, a enorme
quantidade de informação que têm ao seu dispor. Realizar uma correta gestão de todos estes recursos
informacionais e entender como obter valor a partir dos mesmos é essencial para gerar as oportunidades
necessárias e obter o tão desejado sucesso. É então fundamental entender quais são as oportunidades
e potencialidades do big data e contrastá-los com os desafios inerentes à sua utilização.
Com os avanços tecnológicos que se tem vindo a assistir afincadamente nos últimos anos, torna-se
realmente mais difícil e complexo realizar análises ao grande volume de dados (que tem crescido
exponencialmente, advindos das mais diversas fontes), utilizando as técnicas tradicionais existentes.
Consequentemente, tem-se também vindo a assistir a mudanças aceleradas dos negócios, que têm
vindo a provocar uma necessidade crescente de garantir que projetos de big data analytics suportem a
estratégia de negócio de cada organização com sucesso. Até porque, atualmente, as visões
convencionais de business analytics (BA) estão preocupadas e diretamente relacionadas com a melhoria
do funcionamento dos negócios e com o objetivo de os apoiar.
A principal contribuição desta dissertação passa, essencialmente, pelo estudo e comparação de um
conjunto de desafios que o big data coloca à área do business analytics. Pretende-se ainda providenciar
uma visão geral dos conceitos relacionados com big data e business analytics, bem como os desafios,
capacidades e áreas associados a estes.
Uma vez que as técnicas tradicionais já não conseguem satisfazer as necessidades de extrair
informações relevantes às empresas em tempo real, estão a ser adotados novos paradigmas no que diz
respeito aos repositórios de dados. Este novo paradigma traz novos desafios para as abordagens de
business analytics que é necessário identificar e sistematizar, sendo este o objetivo principal deste
projeto de dissertação.
Palavras-chave: big data, business analytics, data analytics, capacidades, desafios
Página | v
ABSTRACT
Nowdays, the key to success of many organizations is to effectively manage the massive volume of
information they have at their disposal. Performing a correct management of all these informational
resources and understanding how to gain value from them is essential to create the necessary
opportunities to achieve the so desired success. Therefore, it is fundamental to understand the
opportunities and potentialities of big data and to contrast them with the challenges inherent in its use.
Technological advances that have been deeply felt in the last years, have made more difficult and complex
the task of analyzing the large volume of data (which has grown exponentially from the most diverse
sources), using the existing traditional techniques.
As a result, there have also been rapid changes in business, which has provoked an increasing need to
ensure that big data analytics projects support each organization's business strategy successfully.
Especially because the conventional views of business analytics (BA) are currently concerned and directly
related to the improvement of business operations and with the objective of supporting them.
The main contribution of this dissertation is essentially the study and comparison of a set of challenges
that big data lays in the area of business analytics. It is also intended to provide an overview of concepts
related to big data and business analytics, as well as challenges, capabilities and areas associated with
them.
As traditional techniques are no longer able to meet the needs of extracting relevant business information
in real time, new paradigms are being adopted with respect to data repositories. This new paradigm
brings new challenges to the business analytic approaches that need to be identified and systematized.
And this is the main purpose and objective of this dissertation project.
Keywords: big data, business analytics, data analytics, capabilities, challenges
Página | vii
ÍNDICE
RESUMO ......................................................................................................................................................... iii
ABSTRACT ........................................................................................................................................................ v
ÍNDICE ........................................................................................................................................................... vii
ÍNDICE DE FIGURAS ........................................................................................................................................ ix
ÍNDICE DE TABELAS ......................................................................................................................................... x
LISTA DE ABREVIATURAS, SIGLAS E ACRÓNIMOS .......................................................................................... xii
1. CONTEXTUALIZAÇÃO ...............................................................................................................................1
1.1. INTRODUÇÃO ..................................................................................................................................1
1.2. MOTIVAÇÃO .....................................................................................................................................3
1.3. ESTRUTURA DO DOCUMENTO .........................................................................................................3
2. ESTADO DA ARTE .....................................................................................................................................5
2.1. ESTRATÉGIA DE PESQUISA ..............................................................................................................5
2.2. BIG DATA .........................................................................................................................................6
2.2.1. DEFINIÇÃO E CONCEITOS ...............................................................................................................7
2.2.2. CARACTERÍSTICAS E DESAFIOS .......................................................................................................9
2.3. BIG DATA ANALYTICS ................................................................................................................... 15
2.3.1. PRINCIPAIS DESAFIOS DO BIG DATA ANALYTICS .......................................................................... 17
2.4. BUSINESS ANALYTICS .................................................................................................................. 18
2.4.1. MODELOS DESCRITIVOS, PREDITIVOS E PROSPETIVO .................................................................. 21
2.4.2. DESAFIOS E CAPACIDADES DO BUSINESS ANALYTICS ................................................................. 22
2.5. BUSINESS INTELLIGENCE E A SUA IMPORTÂNCIA NAS ORGANIZAÇÕES ...................................... 27
3. OBJETIVOS ............................................................................................................................................ 31
3.1. OBJETIVO GERAL .......................................................................................................................... 31
3.2. OBJETIVO ESPECÍFICO ................................................................................................................. 31
3.3. RESULTADOS ESPERADOS ........................................................................................................... 31
4. ABORDAGEM METODOLÓGICA .............................................................................................................. 32
4.1. BENCHMARKING .......................................................................................................................... 32
Página | viii
4.1.1. METODOLOGIA A ABORDAR .......................................................................................................... 33
4.2. CASE STUDY ................................................................................................................................. 34
4.2.1. METODOLOGIA DE INVESTIGAÇÃO ............................................................................................... 35
5. PLANO DE ATIVIDADES ......................................................................................................................... 36
5.1. PLANEAMENTO ............................................................................................................................ 36
5.2. WBS E DIAGRAMA DE GANTT ........................................................................................................ 38
5.3. TABELA DE RISCOS ...................................................................................................................... 39
6. CONCLUSÃO ......................................................................................................................................... 43
7. REFERÊNCIAS ....................................................................................................................................... 44
Página | ix
ÍNDICE DE FIGURAS
Figura 1 - Os 5V'S do big data ...........................................................................................................................9
Figura 2 - 7 V's + C que caracterizam o big data ............................................................................................. 12
Figura 3 - Áreas do Business analytics ............................................................................................................ 20
Figura 4 – Modelo de maturidade das capacidades do BA .............................................................................. 24
Figura 5 - Estrutura de BI ............................................................................................................................... 28
Figura 6 - Interesse em big data, business analytics e business intelligence ao longo do tempo. ...................... 29
Figura 7 - WBS e Respetivo Diagrama de Gantt ............................................................................................... 38
Página | x
ÍNDICE DE TABELAS
Tabela 1 - Diferentes conceitos de big data ........................................................................................................7
Tabela 2 - Princiapis desafios do big data ....................................................................................................... 13
Tabela 3 - Principais desafios do big data analytics ......................................................................................... 17
Tabela 4 - Características do BA ..................................................................................................................... 23
Tabela 5 - Áreas das Capacidades do BA ........................................................................................................ 24
Tabela 6 - Calendarização das atividades ....................................................................................................... 36
Tabela 7 - Tabela de Riscos ............................................................................................................................ 39
Página | xii
LISTA DE ABREVIATURAS, SIGLAS E ACRÓNIMOS
APQC – American Productivity and Quality Center
BA – Business Analytics
BI – Business Intelligence
BI & BA – Business Intelligence & Analytics
BPM – Business Performance Management
CIO – Chief Information Officer
DW – Data Warehouse
E-Commerce – Electronic Commerce
E-Government – Electronic Government
ETL – Extraction, Transformation and Load
IBM – International Business Machines
OLAP – Online Analytical Processing
TI – Tecnologias de Informação
WBS – Work Breakdown Structure
Página | 1
1. CONTEXTUALIZAÇÃO
1.1. INTRODUÇÃO
Estamos a viver aquela que é denominada, por muitos, a era da “explosão” da quantidade de dados e
de informação, ou seja, a era do big data. Os avanços tecnológicos (a digitalização da informação, o
desenvolvimento de cloud computing e de computadores cada vez mais rápidos) tornam este enorme
crescimento de dados ainda mais acessíveis e úteis e permitem às organizações explorarem e
descobrirem factos, correlações e padrões nos dados que antes não era possível. Se antigamente
analisar uma grande quantidade de dados era visto como um problema técnico, hoje pode ser
considerada uma oportunidade de negócio (Russom, 2011).
A verdade é que os dados digitais estão em todo o lado, em todos os setores da economia e em todas
as organizações. A capacidade de armazenar e combinar esses dados para depois utilizar os resultados
para realizar análises detalhadas e precisas tem-se tornado cada vez mais acessível e importante, até
mesmo para as empresas entenderem o estado atual dos seus negócios e tomarem as melhores
decisões.
Para realizar estas análises e atuar de forma segura e objetiva, é essencial recorrer às Tecnologias de
Informação (TI) e às suas aplicações. No entanto, essas análises não podem ser realizadas através de
processos ou sistemas tradicionais, já que os mesmos podem ter dificuldades em armazenar e a
desempenhar as devidas análises aos dados.
Na realidade, são diversos os desafios que as organizações enfrentam, já que, o facto de terem a
oportunidade de aceder a uma grande quantidade de dados, não significa que saibam retirar e obter
valor a partir dos mesmos. Esta exorbitante quantidade de dados cresce à medida que diminui a própria
capacidade de guardá-los e processá-los e é aí que se encontra o grande desafio, pois a maior parte
destes dados são não estruturados, tornando difícil tomar a decisão daquilo que vale ou não vale a pena
guardar (Lima et al., 2013).
A chave para conseguir obter este valor é entender como transformar, utilizar e realizar as devidas
análises aos dados. Num mundo cada vez mais competitivo, é essencial que as organizações tomem
decisões rápidas, ágeis e consigam transformar este recurso tão fundamental que é a informação em
conhecimento. Cabe às organizações serem capazes de transformar essa informação em conhecimento
e lhe darem a devida utilidade.
Página | 2
Este fenómeno do big data é considerado aquele que mais atenção tem capturado na indústria de
computadores moderna desde a era da internet (Lima, 2014). De facto, hoje, são muitas as organizações
que recolhem, armazenam e analisam esta grande quantidade de dados. Big data é um termo que se
popularizou e que tem sido sujeito a diversas definições, por diversos autores com diferentes perspetivas.
De forma geral, pode ser definido como ativos de grande volume (grande quantidade), de diferentes
fontes e níveis de complexidade, criados a diferentes velocidades que exigem formas inovadoras de
processamento de informações para maior visibilidade e tomada de decisão, ou seja, de forma a gerar
valor.
De forma a responder a esta grande necessidade, algumas soluções foram desenvolvidas por empresas
que precisavam de lidar rapidamente com grandes quantidades de dados. Por essa razão, essas
empresas desenvolveram algumas tecnologias com o objetivo principal de ajudá-las a processar e a
analisar big data (Lima, 2014).
Apesar de todas as vantagens relacionadas com a recolha, armazenamento e análise de dados, também
estão associados a este um conjunto de desafios, como já referido, e que serão discutidos mais
detalhadamente neste documento.
Através da realização de estudos e análises comparativas entre soluções, serão identificados, neste
projeto, os requisitos que o big data impõe às abordagens de business analytics. Como tal, é importante
realizar a distinção entre estes dois conceitos que podem ser muitas vezes confundidos.
Segundo O’neil (O’neil, 2013), a diferença fundamental entre big data e business analytics, é que
“independentemente do big data utilizado, no final do dia, se estiver a ser realizada uma análise de
negócio (business analytics), haverá sempre uma pessoa a olhar para gráficos ou números, para tomar
uma decisão depois de possivelmente ter tido uma discussão com mais 150 pessoas, de forma a ser
ajustado e modificado algo sobre a forma como o negócio é executado". Ambos os conceitos, assim
como outros associados a este “mundo” dos dados e do seu tratamento e análise serão abordados e
aprofundados neste documento de forma a enquadrar melhor este estudo.
Hoje, com o surgimento do big data, estão a ser adotados novos paradigmas no que respeita aos
repositórios de dados. Este novo paradigma traz novos desafios para as abordagens de business
analytics que é necessário identificar e sistematizar, sendo este o principal objetivo deste projeto.
Página | 3
1.2. MOTIVAÇÃO
A importância dada à informação e à sua obtenção por parte das organizações tem vindo a crescer,
principalmente nos últimos anos, com o crescente desenvolvimento da tecnologia.
Para se ter uma noção da dimensão e da relevância do estudo deste tema, a McKinsey Global Institute
estimou um crescimento do volume de dados de 40% por ano e concluiu que, entre 2009 e 2020, esse
crescimento será 44 vezes maior (Lima, 2014). Números impressionantes e que provocam uma reflexão
acerca da importância dos mesmos para as organizações e como se podem aproveitar esses dados para
extrair informações estratégias e obter vantagens competitivas.
Na realidade, tantos os clientes como as organizações podem obter vantagens. Os clientes porque
podem obter um determinado produto ou serviço de forma personalizada. As organizações, por outro
lado, podem evitar situações de risco e sustentar uma abordagem competitiva.
Apesar das enormes vantagens que a exploração do big data e do business analytics podem oferecer às
organizações, há um conjunto de desafios que podem comprometer a facilidade de adotá-los e explorá-
los adequadamente.
É então de extrema importância estudar esses fatores e desafios que o big data coloca à área do business
analytics para ser possível identificar as melhores formas de ultrapassar as dificuldades sentidas no
processo de tomada de decisão e que possibilitem o acesso e a exploração de informação.
1.3. ESTRUTURA DO DOCUMENTO
Este documento está estruturado de uma forma simples, composto por 7 capítulos e respetivos
subcapítulos.
No primeiro capítulo (Contextualização) é definido o contexto, o âmbito, os objetivos do projeto, assim
como os fatores motivadores que levaram ao seu desenvolvimento e estudo.
No segundo capítulo (Estado de Arte) é abordada e explicada a estratégia de pesquisa utilizada e a forma
como foi executada. Também é neste capítulo que é realizado o enquadramento teórico, através da
revisão de literatura e onde são apresentados os conceitos mais relevantes para o projeto.
No terceiro capítulo (Objetivos) são definidos os principais objetivos deste projeto, desde uma perspetiva
mais geral a uma perspetiva mais específica e detalhada. Também serão estipulados os resultados
esperados.
Página | 4
No quarto capítulo (Abordagem Metodológica) serão apresentadas as abordagens metodológicas adotas
para a realização deste estudo que servirão de base para a realização do projeto.
No quinto capítulo (Plano de Atividades) é apresentado o plano de atividades, onde está definido o
planeamento do projeto desde uma perspetiva mais genérica, através de uma pequena matriz com a
calendarização inicial estipulada no Plano de Trabalhos a uma perspetiva mais detalhada através do
diagrama de Gantt e da WBS. Para o dimensionamento dos riscos deste projeto foi realizada uma tabela
de riscos, que apresenta os principais riscos associados a este projeto.
No sexto capítulo (Conclusão) são apresentadas algumas considerações e conclusões acerca do trabalho
realizado e as expectativas do trabalho a realizar na segunda fase deste projeto de dissertação.
No sétimo e último capítulo (Referências) serão listadas um conjunto de referências que serviram e
servirão de base e apoio para realizar este estudo.
Página | 5
2. ESTADO DA ARTE
2.1. ESTRATÉGIA DE PESQUISA
A revisão de literatura é um das partes iniciais e essenciais para conduzir este projeto de investigação.
Através desta, é possível analisar, sintetizar e interpretar investigações já realizadas na área em estudo,
tendo, neste caso, como base principal de fonte de pesquisa, artigos científicos.
Os passos básicos da revisão da literatura foram realizados tendo como referência Webster & Watson
(2002), Urbach et al. (2009) e Bento (2012). De uma forma sintetizada, foram realizadas duas etapas
principais: Seleção da fonte (1) e seleção da linha temporal (2).
Os diferentes estudos sobre big data, big data analytics, business analytics (BA) e business intelligence
(BI) foram obtidos e recolhidos através de ferramentas de pesquisa e de base de dados como o Scopus,
ScienceDirect e Google Scholar.
No que diz respeito à estratégia de pesquisa utilizada na realização deste projeto, esta pode ser definida
em dois níveis principais: o primeiro respeitante à recolha de materiais, ou seja, à pesquisa e recolha
de documentos científicos relacionados com o tema da investigação e o segundo respeitante à análise
e interpretação desses materiais recolhidos.
Conforme já referido na introdução, além de não existir um consenso comum no que toca à definição
de conceitos como big data e business analytics, estes termos estão muitas vezes associados a outros
como business intelligence. Dessa forma, o processo de pesquisa bibliográfica foi realizado utilizando
diferentes termos de pesquisa, bem como variações e combinações dos termos, tais como “big data
challenges” ou “business analytics + big data + challenges” ou ainda “big data analytics + desafios”.
Além disso, foram encontrados e recolhidos mais alguns artigos científicos realizando a pesquisa
“forward and backward”, em que, sempre que possível, se acedia ao artigo científico citado no artigo
em análise, até se conseguir obter a fonte original que definiu o conceito ou a metodologia.
A pesquisa abordou ainda quatro tópicos essenciais, que resultou em quatro processos de revisão de
literatura diferentes. O primeiro diz respeito ao big data, onde serão apresentadas algumas definições,
características e os principais desafios. O segundo apresenta o conceito de big data analytics bem como
os principais desafios associados a este. No terceiro, business analytics, além de serem apresentados
alguns conceitos, serão também abordados os três modelos e ainda os desafios e capacidades
Página | 6
associados ao BA. Finalmente, no quarto tópico, será introduzido o conceito de business intelligence e
descrita a sua importância nas organizações.
Este processo de revisão de literatura foi realizado com o objetivo principal de apoiar e dar resposta à
questão de investigação subjacente a este projeto de investigação “Quais os desafios que o big data
coloca à área de business analytics?”.
Para realizar a revisão de literatura, a janela temporal considerada para a pesquisa de artigos foi
delimitada até aproximadamente 10 anos. Ou seja, foram considerados maioritariamente artigos
publicados a partir de 2006/2007. No entanto, para definir alguns conceitos, foram tidos em conta
artigos datados antes desse período, por se considerar relevante apresentar as definições primárias de
alguns conceitos e para uma melhor contextualização dos assuntos em questão. Além disso,
pontualmente, foram utilizados artigos datados antes desse período por se considerar que os mesmos
contribuíam significativamente para a realização do estudo.
2.2. BIG DATA
A inovação e o desenvolvimento tecnológico aliados a uma maior acessibilidade a dispositivos digitais
levaram ao surgimento daquela que é considerada, por muitos, a “Era” do big data. Como resultado
deste impacto que o papel das tecnologias tem vindo a assumir atualmente nas pessoas e nas suas
vidas, surge uma “explosão” na quantidade, diversidade e disponibilidade dos dados digitais em tempo
real (Pulse, 2012).
Segundo Taurion (Taurion, 2013), antes de 2000, apenas 25% dos dados disponíveis no planeta estavam
em formato digital e em 2013, esses dados ultrapassavam os 98%. Ainda de acordo com outro autor,
Lima (Lima et al., 2013), acrescenta que, a cada minuto, são criados 571 novos sites na internet e
204.166.667 mensagens de email são enviadas. O Google recebe mais de 2 milhões de pesquisas, o
YouTube recebe 48 horas de novos vídeos, 684.478 conteúdos são publicados no Facebook, 3.600
fotos são compartilhadas no Instagram e mais de 100 mil tweets são enviados através do Twitter. A
tendência é para estes números aumentarem à medida que o número de utilizadores também aumenta,
pelo que, atualmente, estes números deverão ser muito superiores.
Gerir e analisar este grande crescimento de quantidade de dados, desde a perspetiva de partilhas de
informação nas redes sociais, passando pela análise de transações bancárias, pesquisas online, acessos
a websites e até à análise de registos de chamadas telefónicas, pode ser visto, simultaneamente, como
Página | 7
um dos maiores benefícios e desafios das organizações. Isto porque é tão importante obter e gerar
informação como ter a capacidade de processá-la rapidamente (Volpato, et al., 2014).
A leitura inteligente destas informações e dados é essencial, até porque, segundo algumas pesquisas, o
uso adequado de big data pode desempenhar um papel económico muito útil às organizações,
promovendo inclusivamente a inovação, competitividade e produtividade em todos os segmentos (Lima
et al., 2013). As organizações esperam, assim, obter benefícios em diversos domínios, tais como no e-
commerce, e-government, na área de saúde e de segurança. Estes benefícios e valores que as
organizações esperam criar vão depender também das estratégias adotas e dos objetivos que as
mesmas pretendem alcançar (Günther et al., 2017).
2.2.1. DEFINIÇÃO E CONCEITOS
Existem diversas perspetivas distintas no que toca à definição do termo “big data”, não existindo uma
definição que seja aceite como única, mesmo que existam algumas que se destaquem mais.
Este vocábulo foi formulado por Doug Laney em fevereiro de 2001, durante uma apresentação de análise
dos desafios que as empresas enfrentavam na gestão dos dados (Santos, 2016). Claramente que a
característica mais intuitiva que se pode rapidamente deduzir deste termo está relacionada com o
tamanho. No entanto, esta não é a única característica, dado que existem mais algumas que
complementam a definição deste termo. Na Tabela 1 serão apresentados alguns conceitos e definições
de big data, elucidados por diferentes autores.
TABELA 1 - DIFERENTES CONCEITOS DE BIG DATA
AUTOR CONCEITO
Hurwitz et. al, 2013
“Capacidade de gerir um grande volume de
dados diferentes, com a velocidade adequada e
dentro do prazo certo para permitir análises e
reações em tempo real”.
Günther et al., 2017
“Big data trata-se de um conjunto de tecnologias
que são capazes de analisar e processar grandes
quantidades de dados de diferentes fontes,
usando ferramentas e recursos que sejam
capazes de o fazer em alta velocidade”.
Página | 8
AUTOR CONCEITO
Zikopoulos & Eaton, 2011
“Resumidamente, o termo big data aplica-se a
informação que não pode ser processada ou
analisada utilizando processos ou ferramentas
tradicionais”.
Dumbill, 2012
“São dados que excedem a capacidade de
processamento dos sistemas de base de dados
convencionais. Os dados são muito grandes,
movem-se muito rápido ou não se encaixam nas
restrições das arquiteturas de base de dados”. Taurion, 2013 “Big Data = volume + variedade + velocidade”.
Hashem et al., 2015
“Conjunto de técnicas e tecnologias que
requerem novas formas de integração, de forma
a descobrir valores ocultos de grandes conjuntos
de dados diversos, complexos e de grande
escala”.
Gupta et al., 2015
“São recursos de informação de alto volume, alta
velocidade e alta variedade que exigem formas
inovadoras e económicas de processamento de
informações para uma melhor compreensão e
tomada de decisão”.
Campos et al., 2015
“Conjunto volumoso de vários tipos de dados
(estruturados, semiestruturados e não
estruturados) e de fontes de dados (web, redes
sociais), que necessitam de soluções
tecnológicas específicas para serem
armazenados e analisados, na perspetiva de
geração de informação e valor."
Apesar de não existir um consenso sobre o conceito, as diversas definições dos autores assemelham-se
bastante, já que grande parte delas referem que as ferramentas tradicionais e convencionais não são
capazes de satisfazer as exigências da nova Era do big data. Outros autores acrescentam e enfatizam
ainda a ideia de existirem algumas características chave que definem o conceito, tais como a “grande
quantidade de dados”, “volume”, “variedade” e a “velocidade”.
Página | 9
2.2.2. CARACTERÍSTICAS E DESAFIOS
De facto, inicialmente, este conceito foi definido como sendo composto por um conjunto de 3
características fundamentais (3V’s): volume, variedade e velocidade. De uma forma muito simplificada
e sintetizada, pode-se referir que “volume” corresponde à quantidade, “variedade” corresponde à
diversidade de tipos e fontes dos dados e “velocidade” corresponde à taxa de transferência (Salas-Veja
et al., 2015).
No entanto, algumas organizações consideram importante adicionar outro “V”, como é o caso da IBM1,
que adicionou a veracidade como outra característica importante para definir o conceito de big data
(4V’s). Além de empresas como a IBM que sentiram a necessidade completar o conceito ao adicionar
outro “V”, ainda existem outras empresas, como a Oracle2, que sentiram a necessidade de acrescentar
o quinto “V”, que se refere à característica valor (5V’s), como se pode observar na Figura 1.
Reunidas estas 5 características do big data, é importante defini-las e distingui-las.
1 Informação recolhida do próprio website da empresa. Disponível em: https://www.ibm.com/developerworks/community/blogs/jfp/entry/big_data_for_dummies23?lang=en Acedido a 20/12/2017. 2 Informação recolhida do próprio website da empresa. Disponível em: https://www.oracle.com/big-data/index.html Acedido a 20/12/2017.
BIG DATA
Volume
Velocidade
VariedadeVeracidade
Valor
FIGURA 1 - OS 5V'S DO BIG DATA (ADAPTADO DE ORACLE, 2015)
Página | 10
A primeira, volume, está relacionada com a quantidade de dados. Como já referido neste artigo,
atualmente, são muitos os fatores que levam ao aumento exponencial do volume de dados. As redes
sociais ou os sensores de localização, por exemplo, geram terabytes de informação, diariamente, na
internet. A grande tarefa do big data é transformar estes dados em informações com valor (Volpato,
2014). No entanto, o que tem vindo a acontecer, é que o volume de dados disponíveis para análise tem
vindo a crescer, enquanto que a percentagem de dados que são efetivamente analisados está em
declínio (Zikopoulos et al., 2011).
O grande volume dos dados não é o único desafio. Este relaciona-se fortemente com a segunda
característica, a variedade, já que esses dados podem ser de diversos tipos e formas (Ribeiro, 2014). A
variedade refere-se aos diferentes tipos de dados recolhidos através de sensores, smartphones ou redes
sociais. Estes dados incluem registos de vídeo, imagem, texto, áudio, em formato estruturado ou não
estruturado, sendo que a maioria dos dados gerados por aplicações móveis (como jogos online e
mensagens de texto) são não estruturados (Hashem et al., 2015). Além da dificuldade sentida em
recolher informação de dados não estruturados, há também a dificuldade de integrar essa informação
com os dados já existentes (Lima et al., 2014).
Esta variedade é um grande desafio, já que as tradicionais plataformas analíticas e de base de dados
não conseguem lidar com esta enorme variedade de dados. Além disso, o sucesso de uma organização
vai ser determinado pela capacidade de obter e gerar informações sobre os vários tipos de dados
disponíveis, o que inclui quer os tradicionais, quer os não tradicionais (Zikopoulos et al., 2011).
Da mesma forma que o volume e variedade de dados se tem vindo a alterar e a crescer, também a
velocidade, a terceira característica apontada, tem vindo a sentir essa mudança. A velocidade diz respeito
ao quão rápido os dados são criados, inseridos, acumulados e processados (Suzuki, 2016). Os dados
são criados a alta velocidade e precisam de ser processados quase em tempo real, de forma a atenderem
a procura (Lima et al., 2014).
Mais uma vez, o exemplo das redes sociais pode ser aplicado neste caso. Gerir dados em movimento
contínuo requer tecnologias bastante diferentes do que gerir dados armazenados num data warehouse
(IBM, 2013). Também se sabe que as aplicações móveis, atualmente, têm um grande número de
utilizadores, pelo que o aumento de tráfego de rede também é expectável. Logo, é essencial que a
resposta a esta exigência seja quase imediata (Oracle, 2013).
Página | 11
A melhoria dos canais de transmissão (através das redes de fibra ótica) bem como as comunicações
em tempo real para controlo de processos na internet, tem possibilitado atingir uma maior velocidade
para troca de dados e informação. Além disso, segundo a literatura, é possível afirmar que esta
velocidade continuará a crescer, já que o desenvolvimento da tecnologia de processadores, dos canais
e do hardware para armazenamento (discos rígidos e memória rápida – flash memory), duplica o seu
poder a cada 2 anos (Ribeiro, 2014).
É notória a importância de garantir a velocidade e de obter as informações pretendidas e úteis em tempo
real. No entanto, é também necessário garantir que esses dados são corretos, até porque é essencial
garantir que são realizadas as devidas análises a esses dados (Santos, 2016). Ou seja, é necessário
garantir a veracidade dos dados, o quarto “V” e quarta característica do conceito de big data.
Grandes quantidades de dados podem, geralmente, combinar várias fontes de confiabilidade e confiança
variável (Bellazi, 2014). É então essencial garantir que os utilizadores interessados nestes dados os
utilizem de forma apropriada, gerando informações verdadeiras. Até porque para serem tomadas
decisões concretas e, inclusivamente, ser possível às organizações ganharem vantagens competitivas,
possuir dados verídicos é de extrema importância. Se forem utilizados dados incorretos, as organizações
correm o risco de incorrer em prejuízo e ter o efeito contrário ao desejado (Mazzega, 2016).
É então muito importante extrair benefícios de diversas naturezas a partir do uso de big data, ou seja,
agregar valor aos processos, produtos, serviços e negócios através dos dados confiáveis extraídos
(Mazzega, 2016). Por isso é que o quinto “V”, valor, é considerado, por muitos autores, a principal
característica do big data (Hashem et al., 2015). Existe uma diversidade de técnicas quantitativas e de
investigação para descobrir o valor dos dados, desde descobrir uma preferência de um consumidor até
mesmo prever a falha de um equipamento. O grande desafio em “descobrir” este valor é,
maioritariamente, de cariz humano, isto porque é necessário saber fazer as perguntas certas, reconhecer
padrões, fazer suposições informadas e prever comportamentos durante a análise dos dados (Oracle,
2013).
Apesar das 5 características acima referidas e adotadas por muitas empresas, a literatura recente
acrescenta mais 3 atributos que não devem ser excluídos na definição e na caracterização de big data.
O modelo dos 7 V’s + C, presente na Figura 2, acrescenta a variabilidade, a visualização e a
complexidade como características importantes para descrever o conceito de big data.
Página | 12
A variabilidade está relacionada tanto com a inconsistência dos fluxos de dados, dadas as múltiplas
fontes de onde estes provêm, como também se refere à velocidade inconsistente na qual os dados são
carregados (Katal et al., 2013). Dificulta assim o processo de gerir estes dados de forma eficaz (Gupta
et al., 2015).
A visualização traduz a necessidade de apresentar a grande e complexa quantidade de dados de uma
forma mais eficaz e mais percetível, de forma a melhor compreender essas informações, através, por
exemplo, de gráficos (Kamilares et al., 2017). A visualização dos dados pode ser um grande desafio
para as organizações, já que para tirar total partido das análises visuais que se podem obter a partir dos
dados, é necessário garantir que estes são compreendidos devidamente, que são exibidos e
demonstrados resultados significativos que apoiem o negócio e que de facto são analisados dados com
a devida qualidade (Gupta et al., 2015).
Finalmente, a complexidade, é um aspeto muito importante, principalmente no processo de gestão da
enorme quantidade de dados provenientes das diversas fontes (Gupta et al., 2015). É então essencial
relacionar estes dados, as hierarquias e as múltiplas conexões entre os mesmos (Katal et al., 2013).
BIG DATA
Complexidade
Valor
Velocidade
Variedade
Variabilidade
Veracidade
Visualização
Volume
FIGURA 2 - 7 V'S + C QUE CARACTERIZAM O BIG DATA
Página | 13
Além dos desafios acima referidos, são apresentados, na Tabela 2, de forma sucinta, aqueles que foram
os principais desafios identificados, associados ao big data e à sua implementação.
TABELA 2 - PRINCIAPIS DESAFIOS DO BIG DATA
ÁREAS DESAFIO
Privacidade e Segurança
O facto das organizações possuírem demasiada
informação dos seus clientes poderá colocar
algum receio no que diz respeito à sua
privacidade e à violação da mesma. O
relacionamento de uma grande quantidade de
dados é útil às organizações e acrescenta valor ao
negócio, mas pode interferir na privacidade, já
que ocorre o acesso a informações pessoais e
possivelmente secretas, que a pessoa em causa
não gostaria que fossem obtidas por ninguém
(Katal et al., 2013).
Acesso e Partilha de Dados
Para tomar as devidas decisões no tempo certo,
é necessário garantir que os dados estão
disponíveis de forma completa, precisa e
atempada, o que torna o processo de gerir os
dados mais complexo (Katal et al., 2013). Além
disso, as organizações podem ser relutantes no
que toca à partilha ou troca de dados com
parceiros e outras organizações devido, por
exemplo, a questões de privacidade e segurança
(Günther et al., 2017), ou quando a análise de
dados é considerada uma fonte de
competitividade e esta partilha pode colocar em
perigo a posição estratégica da organização (Katal
et al., 2013).
Página | 14
ÁREAS DESAFIO
Tecnologia: Armazenamento, Processamento e
Acesso aos Dados
Existe a necessidade de ter recursos de TI (tanto
hardware como software) compatíveis com o
negócio da empresa. E apesar de existirem
muitas tecnologias de big data gratuitas ou até
mesmo de baixo custo, estas podem ser difíceis
de implementar e programar (Campos, 2015). O
desafio pode também estar na forma como são
realizadas as extrações dos dados, o seu
armazenamento (dadas as limitações e a
necessidade de múltiplos discos), o seu
processamento (requer extensivo processamento
e novos algoritmos analíticos de forma a fornecer
informação atempada), o acesso ou a análise final
aos dados (Mazzega, 2016). Estas limitações
levam as organizações a tomarem decisões
importantes, tais como decidir quais os dados
que devem manter e quais os que devem “deitar
fora” (Gupta et al., 2015).
Aptidões e Conhecimentos
A própria implementação de big data pode ser
considerada um grande desafio. Isto porque é
necessário que as organizações e os seus
recursos detenham um conjunto de aptidões e
conhecimentos tanto a nível tecnológico, como
também de análise de dados e pesquisa
(Mazzega, 2016).
Qualidade versus Quantidade
Apesar de muitas organizações sentirem a
necessidade de recolher uma grande quantidade
de dados de forma contínua, a verdade é que o
importante não é ter acesso a “todos” os dados
possíveis, mas àqueles que permitam retirar
conclusões precisas e com o devido valor (Kaisler
Página | 15
ÁREAS DESAFIO et al., 2013). Caso contrário, este processo de
recolha de dados poderá ter o efeito oposto ao
desejado (Gupta et al., 2015).
Dados Estruturados versus Dados Não
Estruturados
A maior parte dos dados gerados atualmente
(como das redes sociais, por exemplo) são não
estruturados. Trabalhar com este tipo de dados é
muito mais custoso e complexo do que com
dados estruturados, que são organizados de uma
forma que os tornam fáceis de gerir. Além disso,
transformar dados não estruturados em dados
estruturados nem sempre é viável, tornando-se
uma tarefa difícil e com custos associados (Katal
et al., 2013).
Visualização dos Dados
De forma a ser possível tirar total partido das
análises visuais, as organizações têm que ter em
conta os diversos desafios existentes com a
manipulação de big data, sendo essencial ter em
conta os seguintes fatores chave: entender bem
os dados, perceber se os dados têm a devida
qualidade e apresentar resultados realmente
significativos e conclusivos (Gupta et al., 2015).
2.3. BIG DATA ANALYTICS
Hoje, são diversas as organizações que recolhem, armazenam e analisam grandes quantidades de
dados porque já reconhecem o seu valor, pelo que têm vindo a apostar e a colocar tecnologias, pessoas
e processos no seu “devido lugar” para maximizar as oportunidades (Watson, 2014).
Como já discutido neste documento, de todo o grande conjunto de dados e informações disponíveis,
apenas uma pequena percentagem tem, de facto, utilidade já que o resto é considerado “ruído”. É
essencial entender as potenciais características desses dados, ou seja, ser capaz de extrair um pequeno
Página | 16
“sinal” de todo o ruído existente. Este pode ser considerado o maior benefício de utilizar o big data
analytics (Hurwitz et al., 2013).
Recolher e armazenar big data cria pouco valor, mas com o uso de big data analytics é possível extrair
e analisar apenas as informações realmente relevantes de forma a tomar decisões que efetivamente
gerem valor (Watson, 2014).
Big data analytics pode então ser definido como “o conjunto de ferramentas e metodologias que visam
transformar grandes quantidades de dados brutos em "dados sobre dados" - para fins analíticos” (Pulse,
2012). Ou ainda, segundo o “líder global em analytics” (SAS) como o “processo de examinar big data
para descobrir padrões escondidos, correlações desconhecidas e outras informações úteis que podem
ser utilizadas para a melhor tomada de decisão”3. Ou seja, de forma muito sintetizada, é onde “as
técnicas analíticas avançadas operam sobre o big data” (Russom, 2011).
Segundo a literatura, a principal razão para se realizar a análise de dados está relacionada com a
obtenção de informações a partir dos mesmos, com a obtenção de conhecimento a partir dessas
informações e a obtenção de sabedoria a partir desse conhecimento (Mello, 2015).
Obviamente que um dos objetivos das organizações é conseguir obter esta sabedoria, de modo a
tomarem as decisões corretas e obterem vantagens competitivas. Através da utilização destas análises,
é possível entenderem o negócio e, por exemplo, acompanharem o comportamento de um cliente. No
entanto, e como já discutido neste documento, o modo de realizar a análise de big data é diferente da
análise tradicional.
Um ponto de partida para entender esta análise aos dados é compreender as suas origens. Os sistemas
de apoio à decisão, na década de 1970, foram os primeiros sistemas a apoiar a tomada de decisões
das organizações (Power, 2007). Com a evolução tecnológica foram surgindo outras ferramentas muito
úteis para analisar essa grande quantidade de dados. Ferramentas para extração, transformação e
carregamento (ETL) são essenciais para a conversão e integração de dados específicos das
organizações. Consulta de base de dados, processamento analítico online (OLAP) e ferramentas de
reporting baseadas em gráficos intuitivos e simples são usadas para explorar características importantes
dos dados. O business performance management (BPM) através da utilização de dashboards e
scorecards ajuda a analisar uma diversidade de métricas de desempenho (Chen et al., 2012).
3 Informação recolhida do próprio website da empresa. Disponível em: https://www.sas.com/pt_br/insights/analytics/big-data-analytics.html Acedido a 21/12/2017.
Página | 17
Segundo Hurwitz et al. (2013), podem ser definidas três classes essenciais de ferramentas analíticas,
nomeadamente: ferramentas de reporting ou dashboards (monitorização frequente do desempenho das
operações comerciais através de representações intuitivas como os dashboards), visualização (em que
o resultado tende a ser altamente interativo e dinâmico, distinguindo-se do reporting pela animação da
visualização, podendo ser utilizadas diversas técnicas de visualização, incluindo mapas de calor e
diagramas de conexão) e, finalmente, a análise avançada (estas ferramentas processam os dados do
data warehouse para depois servirem os seus utilizadores, através de explicações de tendências ou
eventos revolucionários para práticas de negócio existentes).
Aquele que pode ser referido como um dos requisitos para se ter sucesso num projeto de big data
analytics é ter pessoas com as skills necessárias e adequadas, dado que é essencial ter recursos
humanos com conhecimentos em negócios, dados e capacidades analíticas (Russom, 2011).
2.3.1. PRINCIPAIS DESAFIOS DO BIG DATA ANALYTICS
Para que o processo do big data analytics seja implementado com sucesso, é necessário garantir que
as organizações estão consciencializadas para os desafios associados a este processo, de forma a
conseguirem superá-los. Assim, são descritos na Tabela 3 os principais desafios identificados na
implementação do big data analytics.
TABELA 3 – PRINCIPAIS DESAFIOS DO BIG DATA ANALYTICS
DIMENSÃO DESAFIO
Escala
Gerir eficazmente esta rápida expansão e
aumento de volume de dados tornou-se um
grande desafio. Atualmente, o volume de dados
está a crescer mais rapidamente do que a
velocidade dos processadores e outros recursos
de computação (Jagadish et al., 2014).
A verdade é que cada algoritmo, a um
determinado ponto, deixa de aumentar
linearmente o seu desempenho com o aumento
dos recursos computacionais, podendo mesmo
Página | 18
DIMENSÃO DESAFIO começar a diminuir o seu desempenho (Kaisler et
al., 2013).
Inconsistência e Incompletude dos Dados
As origens e fontes dos dados são cada vez mais
diversificadas, muitas vezes de confiabilidade
variável. Isto traduz-se na possibilidade de haver
erros, inconsistências, valores em falta e
incertezas nos dados. É então necessário obter
tecnologias que apoiem e facilitem a deteção
desses erros (Jagadish et al., 2014).
Dados Chave
Encontrar os dados fundamentais e chave que
apoiem devidamente a tomada de decisão é uma
tarefa complexa, principalmente devido ao
enorme volume dos mesmos. De forma a obter a
tão desejada “resposta” ao problema é
necessário seguir um dos seguintes caminhos:
reduzir o tamanho da amostra ou melhorar os
procedimentos de procura, análise e tomada de
decisão (Gupta et al., 2015).
Heterogeneidade dos Dados
Dado um conjunto muito grande de dados
heterogéneos, um dos grandes desafios está
também em descobrir como analisar esses dados
que se adquiriram (Kaisler et al., 2013). Para
analisar esses dados, será necessário adaptar e
integrar múltiplas técnicas analíticas para, por
exemplo, perceber que novos conhecimentos
provavelmente poderão surgir (Gupta et al.,
2015).
2.4. BUSINESS ANALYTICS
Com as mudanças aceleradas dos negócios e das suas complexidades, é essencial garantir que projetos
de big data analytics suportem a estratégia de negócio de cada organização. Até porque, atualmente, as
Página | 19
visões convencionais de business analytics (BA) estão preocupadas e diretamente relacionadas com a
melhoria do funcionamento dos negócios com o objetivo de os apoiar (por exemplo, com as tomadas de
decisão) (Holsapple, 2014).
Segundo uma pesquisa realizada pela IBM, 4 em 5 dos CIO’s (ou seja, aproximadamente 80% dos CIO’s)
opinam que o business analytics e o business intelligence são os principais caminhos para a
competitividade4.
Com a crescente competitividade, a área de BA requer indivíduos que detenham conhecimentos sobre
os negócios, de forma a que saibam colocar as questões corretas, que tenham a habilidade e capacidade
de aproveitar, armazenar e processar vastos conjuntos de dados (estruturados e não estruturados) e
que depois possa utilizar um conjunto de técnicas estatísticas e de machine learning para tomar as
melhores decisões (Shmueli et al., 2017). A verdade é que, ao longo dos últimos anos, a área de BA
melhorou significativamente, proporcionando esse tão desejado conhecimento aos utilizadores.
O BA, atualmente, está muito enraizado no avanço e desenvolvimento de sistemas de apoio à decisão.
Esses avanços incluem mecanismos cada vez mais poderosos para “adquirir, gerar, assimilar, selecionar
e emitir conhecimentos relevantes para a tomada de decisões”. Esse conhecimento que deve ser
processado, pode variar de qualitativo a quantitativo e, na realidade, o BA está preocupado com o
funcionamento com ambos os tipos de conhecimento, conforme aquilo que é apropriado para a tomada
de decisão (Holsapple, 2014).
Business analytics pode ser visto como a interseção de um conjunto de áreas, em que a pesquisa
operacional, inteligência artificial e sistemas de informação têm particular relevância, como se pode
constatar na Figura 3.
Refere-se ainda à recolha, armazenamento, análise e interpretações dos dados para apoiar as decisões
(Sharma et al., 2010). Este conceito pode ainda ser considerado como uma definição agregada de
Business Intelligence & Analytics (BI&A), como sendo o conjunto de “técnicas, tecnologias, sistemas,
práticas, metodologias e aplicações que analisam dados críticos no negócio para auxiliar as organizações
num melhor entendimento do seu mercado e negócio, de forma a tomar decisões mais rápidas” (Chen
et al., 2012), ou seja, pode ser visto como um subconjunto de BI, que tem como principal foco gerar
relatórios baseados em técnicas estatísticas e inteligência de negócio, sendo mais apropriado para a
4 Informação recolhida do próprio website da empresa. Disponível em: http://www-03.ibm.com/press/us/en/pressrelease/34530.wss. Acedido a 20/12/2017.
Página | 20
definição e revisão dos indicadores da empresa (Sayão, 2017). É ainda caracterizado por ser constituído
por modelos descritivos, preditivos e prospetivos, utilizando dados heterogéneos e de grande volume
(Watson, 2014).
Os objetivos do BA podem, ainda assim, ser definidos em quatro tipos, os quais formam a sigla SPED.
O primeiro diz respeito a entender uma situação (make Sense of a situation), o segundo a realizar
previsões (make Predictions), o terceiro a realizar avaliações (make Evaluations) e último a tomar
decisões (make Decisions) (Holsapple et al., 2014). Estes autores ainda afirmam que o BA tanto pode
atuar na identificação como na solução de problemas, sendo esses conceitos mais amplos que apenas
o suporte à tomada de decisão.
Dada a multidisciplinaridade do conceito, como já supracitado, os conhecimentos na área de BA podem
ser classificados em três grupos (como se pode observar, uma vez mais, na Figura 3):
Tecnológicos - em que são incorporadas diversas ferramentas de forma a que o processamento de dados
seja realizado de forma eficiente (por exemplo, hardware, software, redes de computadores);
Métodos Quantitativos - em que são aplicadas abordagens quantitativas para a análise de dados (por
exemplo, estatística, inteligência artificial e pesquisa operacional);
Tomada de decisão – que representa as ferramentas, teorias e práticas utilizadas para apoiar e suportar
o processo de tomada de decisão. Este grupo fundamenta-se tanto em áreas de conhecimento como
FIGURA 3 - ÁREAS DO BUSINESS ANALYTICS (MORTENSON ET AL., 2015)
Página | 21
psicologia e ciência comportamental, como noutras áreas menos tradicionais como é o caso da
visualização da informação (Mortenson et al., 2015).
2.4.1. MODELOS DESCRITIVOS, PREDITIVOS E PROSPETIVO
Como já referido, o BA é caracterizado por ser constituído por 3 tipos de modelos: descritos, preditivos
e prospetivos.
Os modelos descritivos utilizam dados para analisar os eventos passados de forma a saber como abordar
o futuro, analisando o desempenho passado para procurar as razões e fatores do sucesso ou falha de
determinados eventos. Ao contrário dos modelos preditivos que se concentram na previsão de um
determinado comportamento de um cliente (por exemplo, o risco de crédito), os modelos descritivos
identificam muitas relações diferentes entre clientes ou produtos, categorizando-os muitas vezes em
grupos (Walker, 2012). Sucintamente, uma análise descritiva revela o que ocorreu, utilizando métodos
estatísticos para explorar “o que aconteceu?” (Mortenson, 2015).
Os modelos preditivos sugerem aquilo que acontecerá no futuro, através da utilização de dados para
determinar o provável resultado futuro de um evento ou a probabilidade de ocorrência de uma situação
(Walker, 2012). Ou seja, a análise preditiva abrange uma variedade de técnicas estatísticas de
modelação, machine learning e data mining que analisam factos históricos e atuais para fazer previsões
sobre eventos futuros e, inclusivamente, identificar riscos e oportunidades nos negócios (Walker, 2012).
Enquanto que os modelos preditivos sugerem aquilo que acontecerá, os modelos prospetivos sugerem
o que fazer (Appelbaum et al., 2017). Esta análise vai além de prever os resultados futuros, sugerindo
também ações para se beneficiar das previsões realizadas, de forma a demonstrar as implicações de
cada opção de decisão. Ou seja, consegue não só antecipar o que acontecerá e quando acontecerá,
mas também a razão e o motivo pelo qual acontecerá. Na prática, a análise prospetiva pode melhorar a
eficácia da predição e fornecer melhores opções de decisão (Walker, 2012).
As organizações geralmente passam de análise descritiva para preditiva finalizando com a análise
prospetiva. Outra forma de descrever essa progressão é raciocinar da seguinte forma: o que aconteceu?
Qual o motivo pelo qual aconteceu? O que acontecerá? O que se pode fazer para que isso aconteça, ou
seja, como agir? (Watson, 2014).
Estes modelos permitem, então, que as organizações tomem decisões mais rápidas e mais inteligentes
de forma a criar valor, podendo ser a diferença entre a sobrevivência e extinção num mundo, como já
referido, cada vez mais competitivo (Sharma et al., 2010).
Página | 22
Apesar destes conceitos definidos, existem alguns autores que defendem a dificuldade e a falta de
consenso sobre a definição de BA e a sua semelhança com os conceitos de BI e Pesquisa Operacional
(Mortenson et al., 2015), principalmente porque têm objetivos comuns e muito semelhantes: melhorar
as operações das empresas e tomadas de decisão (Sayão, 2017).
2.4.2. DESAFIOS E CAPACIDADES DO BUSINESS ANALYTICS
Apesar de todos os avanços tecnológicos e de análise de dados sentidos nos últimos anos, estão sempre
associadas a estes alguns desafios, já que a dimensão e a complexidade dos dados não para de crescer,
como é o caso dos dados não estruturados, maioritariamente provenientes de fontes online) (Mortenson,
2011).
O que também não para de crescer é a competitividade do mundo dos negócios, pelo que é necessário
que as empresas encontrem uma forma de se conseguirem diferenciar. Segundo Bose (Bose, 2009), a
forma das empresas encontrarem esta diferenciação no atual mercado tão competitivo, está na
habilidade e capacidade de realizar decisões de forma precisa, rápida e efetiva, de modo a ir de encontro
às preferências e prioridades dos clientes.
Segundo uma pesquisa realizada pela McKinsey Global Institute, há uma previsão que, até 2018, só os
Estados Unidos enfrentarão uma escassez de 140.000 a 190.000 pessoas com conhecimentos e
capacidades analíticas profundas, bem como um défice de 1,5 milhões de gerentes experientes e com
o know-how necessário para analisar grandes quantidades de dados para tomar as devidas decisões
(Manyika et al., 2011).
É de realçar a importância das técnicas de integração e de data mining para o levantamento das
informações e da utilização de métodos estatísticos para a identificação de tendências e padrões nas
informações (Bose, 2009). É notória também a necessidade de apostar nesta área e de aprender
continuamente a manipular e a analisar dados, ou seja, adquirir os devidos conhecimentos, por exemplo,
de base de dados, machine learning, estatística e visualização.
Segundo Sayão (Sayão, 2017), os principais conhecimentos e habilidades que os profissionais de BA
devem possuir podem ser divididos em três grupos, nomeadamente:
- Habilidades técnicas e quantitativas: capacidade de realizar análises quantitativas e conhecimento em
software para a sua operacionalização. As técnicas utilizadas podem variar entre setores e empresas,
Página | 23
como por exemplo: técnicas de data mining e desenvolvimento de algoritmos, construção e análise de
dashboards e simulação de cenários;
- Conhecimentos de negócios: os profissionais de BA deverão ter familiaridade e conhecimentos na área
de gestão, de modo a serem capazes de identificar oportunidades e desafios enfrentados pelas
organizações e de encontrarem a devida solução recorrendo a BA;
- Habilidades de relacionamento e comunicação: deverão ser capazes de trabalhar em equipa de
diferentes áreas de negócio e devem também ser capazes de comunicar de forma clara e compreensível
os resultados das análises realizadas.
Sem dúvida que as pessoas são um dos fatores críticos de sucesso das ferramentas de BA. No entanto,
e como já referido e observado na Figura 3, o BA é um conceito multidisciplinar, pelo que os fatores
críticos de sucesso de ferramentas de BA devem também cobrir os desafios das áreas envolvidas no
processo, pelo que existem mais três dimensões de grande relevância: a tecnologia (sistemas de
informação), a cultura organizacional e a governação. Segundo Cosic, Shanks & Maynard (2015), estas
são as denominadas capacidades de BA e estão apresentadas na Figura 4. Estes fatores são ainda
descritos com mais detalhe na Tabela 5.
TABELA 4 - CARACTERÍSTICAS DO BA (RETIRADO DE SAYÃO, 2017)
CARACTERÍSTICAS BA
Objetivo principal do sistema Fornecer informações que auxiliem a tomada de
decisão.
Principal desafio de implementação
Garantir a credibilidade das informações geradas
para apoiar o processo de tomada de decisão, a
integração no processo de tomada de decisão e a
contínua utilização do sistema.
Página | 24
FIGURA 4 – MODELO DE MATURIDADE DAS CAPACIDADES DO BA (RETIRADO DE COSIC, SHANKS & MAYNARD, 2015)
Tendo por base o modelo de Cosic, Shanks & Maynard (2015) - Figura 4 - na seguinte tabela (Tabela 5)
estão descritas as áreas de capacidade do BA e as suas principais características. Segundo Sayão
(2017), estes podem ainda ser considerados os fatores críticos de sucesso do BA.
TABELA 5 – ÁREAS DAS CAPACIDADES DO BA
ÁREA CARACTERÍSTICAS DESCRIÇÃO
Tecnologia (Sistemas de
Informação)
Qualidade do sistema
Capacidade do sistema de
consolidar dados de distintas
fontes, de forma a providenciar
informações úteis e confiáveis, a
qualquer momento, que
auxiliem o processo de tomada
de decisão (Sayão, 2017).
Uso das Tecnologias
Desenvolvimento e uso efetivo
do hardware, software e dados
nas atividades de BA (Cosic et
Página | 25
ÁREA CARACTERÍSTICAS DESCRIÇÃO al., 2015). Também diz respeito
à integração dos sistemas de BA
com outros sistemas de
informação organizacionais
(Davenport & Harris, 2007) e é
ainda importante no que toca à
integração de dados com fontes
de diferentes origens (Watson,
2002).
Envolvimento dos utilizadores
no projeto
É importante que os
colaboradores entendam as
análises que devem ser
realizadas aos dados. Para tal,
não devem ter qualquer
dificuldade em aceder aos
dados que necessitam, a
qualquer momento, devendo
utilizar aqueles que são os mais
oportunos e que conduzam às
melhores decisões (Bayrak et
al., 2015).
Cultura Organizacional Gerir as mudanças
A adoção efetiva de BA nas
empresas requer mudanças na
cultura, processos,
comportamentos e
conhecimentos dos
colaboradores. É importante
preparar os colaboradores para
que a resistência à mudança
não seja um problema (Cosic et
al., 2015)
Página | 26
ÁREA CARACTERÍSTICAS DESCRIÇÃO
Pessoas
Competência da equipa do
projeto
Grau do conhecimento do
negócio, bem como de técnicas
de extração, análise e
visualização de dados (Sayão,
2017). Além das skills técnicas,
também requer aptidões e
conhecimentos de gestão e de
entendimento do negócio (Cosic
et al., 2015).
Capacidade, treino e
aprendizagem
Grau de compreensão dos
indicadores e informações
disponíveis, da lógica
(algoritmo) utilizada nos tipos de
análises realizadas, bem como
dos possíveis planos de ação a
serem executados de acordo
com o desempenho dos
indicadores (Sayão, 2017).
Governação
Gerir o uso dos recursos de BA:
empenho e compromisso dos
responsáveis e liderança do
projeto
De forma a alinhar os objetivos
organizacionais com as
iniciativas de BA, torna-se
necessário delegar
responsabilidades pela
organização (Cosic et al., 2015).
Tem que existir um esforço por
parte dos responsáveis e líderes
do projeto para executar esta
tarefa com sucesso, já que, em
algumas situações, pode ter que
haver uma necessidade de
alterar processos, papéis e até
Página | 27
ÁREA CARACTERÍSTICAS DESCRIÇÃO mesmo responsabilidades
(Sayão, 2017).
2.5. BUSINESS INTELLIGENCE E A SUA IMPORTÂNCIA NAS ORGANIZAÇÕES
Segundo a literatura, o termo Business Intelligence (comummente designado por BI) foi introduzido em
1958 por um cientista computacional da IBM, que afirma que o objetivo do BI é responder a questões
do tipo “Quem faz ou sabe determinada coisa?” e que o define como o conjunto de técnicas que “são
baseadas em procedimentos estatísticos que podem ser realizados em máquinas de processamento de
dados atuais. Juntamente com instalações de comunicação adequadas e equipamentos de entrada e
saída, pode ser construído e montado um sistema completo para acomodar todos os problemas de
informação de uma organização“ (Luhn, 1958).
A ideia principal de Luhn baseava-se, essencialmente, em criar “perfis de interesse” para cada um dos
“pontos de ação” de uma organização, ou seja, ser possível otimizar o negócio através da utilização de
dados.
Apesar da enorme diversidade de definições para este conceito, e que mais uma vez não existe uma
definição do conceito mundialmente aceite, esta ideia base de Luhn mantém-se ainda hoje, nas mais
recentes definições de BI. Segundo Fernandes (Fernandes, 2016), BI pode ser caracterizado como um
processo que fornece dados confiáveis e consistentes em formato útil, através do processamento e
análise de grandes quantidades de dados, provenientes de diferentes fontes, com vista à tomada de
decisões mais adequadas, seguras e imediatas, repercutindo em melhorias da competitividade.
BI pode ser definido como o processo constituído por duas atividades primárias (Figura 5): entrada de
dados (envolve a mudança de dados de um conjunto de sistemas de origem para um data warehouse
integrado) e saída de dados (que consiste em utilizadores empresariais e aplicações que acedem aos
dados do DW para realizar relatórios de empresa, OLAP, consultas e análises preditivas). Esta segunda
atividade é comummente referida como BI (Watson et al., 2007).
É ainda definido como um termo que abrange uma ampla gama de software analítico e de soluções que
permitem reunir, consolidar, analisar e fornecer acesso a informações de uma forma que deveria permitir
às organizações tomarem melhores decisões de negócios (Sahay, 2008).
Página | 28
O BI é considerado o “próximo nível” do BA e refere-se à visualização e reporting de dados de forma a
entender “o que aconteceu e o que está a acontecer” (Sayão, 2017). Os seus objetivos fundamentais
passam pela recolha de dados, transformá-los em informação, através de padrões e tendências, tendo
em vista a entrega de informação precisa e rigorosa (intelligence) aos decisores em tempo oportuno
(Costa e Santos, 2012).
Business intelligence, business analytics e big data são áreas que se tem tornado cada vez mais
importantes tanto na área académica como empresarial (Chen et al., 2012).Como se pode observar na
Figura 6, ao longo dos últimos 13 anos, o interesse (especialmente) por big data tem crescido
consideravelmente. A um crescimento menos explosivo, também o termo business analytics tem vindo
a ganhar notoriedade, principalmente a partir de 2012, ano em que também, curiosamente, o termo big
data começou a crescer exponencialmente. Contrariamente a estas tendências, o termo business
intelligence tem vindo a perder algum protagonismo e a ser substituído pela pesquisa dos dois termos
anteriores.
FIGURA 5 - ESTRUTURA DE BI (ADAPTADO DE WATSON ET AL., 2007)
Página | 29
INTERESSE EM BIG DATA, BUSINESS ANALYTICS E BUSINESS INTELLIGENCE
AO LONGO DO TEMPO. RETIRADO DE GOOGLE TRENDS.
https://trends.google.com/trends/explore?date=all&q=business%20analytics,bus
iness%20intelligence,%2Fm%2F0bs2j8q
2.6. VISÃO CRÍTICA DO ESTADO DE ARTE
As organizações enfrentam, atualmente, mudanças ambientais muito rápidas, resultantes da nova
“economia de informação” e da natureza cada vez mais dinâmica e global da concorrência. Assim,
tornam-se necessárias infraestruturas de apoio à decisão adequadas, que analisem de forma rápida
informações precisas e oportunas, de forma a enfrentar esses desafios (Sahay, 2008). Como já referido
neste documento, as organizações que conseguem efetivamente obter informação em quantidade
adequada, com qualidade, confiável e no momento certo alcançam vantagem competitiva. As
organizações que não são capazes de gerar esse tipo de informações incorrem na perda de
oportunidades (Costa e Santos, 2012).
A gestão das organizações pode ainda ser apoiada pelos sistemas de BI, através da disponibilização de
informação útil que pode ser utilizada ao longo dos três níveis da pirâmide organizacional: estratégica
(que torna possível a definição de metas e objetivos estratégicos e verificar se os mesmos estão a ser
atingidos), tática (que possibilita otimizar ações futuras, modificar aspetos organizacionais, financeiros
ou tecnológicos de modo a alcançar os objetivos estratégicos de forma mais eficaz) e operacional (para
realizar análises e responder a questões relacionadas com operações das atividades da organização,
como, por exemplo, a questão das vendas) (Fernandes, 2016).
É de extrema importância para as organizações a utilização de sistemas de BI, permitindo a
disponibilização de informação útil e com qualidade, que apoiam os gestores no processo de tomada de
decisão (Costa e Santos, 2012). Segundo a literatura, pode mesmo afirmar-se que será difícil encontrar
FIGURA 6 - INTERESSE EM BIG DATA, BUSINESS ANALYTICS E BUSINESS INTELLIGENCE AO LONGO DO TEMPO. ADAPTADO DE
GOOGLE TRENDS.
Página | 30
uma organização bem-sucedida que não tenha aproveitado os sistemas de business intelligence para o
seu negócio (Chaudhuri et al., 2011).
Página | 31
3. OBJETIVOS
3.1. OBJETIVO GERAL
Este trabalho pretende dar resposta aos desafios que o big data coloca à área do business analytics.
Com o surgimento do big data, estão a ser adotados novos paradigmas no que respeita aos repositórios
de dados. Este novo paradigma traz novos desafios para as abordagens de business analytics que é
necessário identificar e sistematizar, sendo este o objetivo geral deste projeto de dissertação.
3.2. OBJETIVO ESPECÍFICO
De forma a ser possível alcançar o objetivo geral, houve a necessidade de desdobrá-lo em objetivos mais
específicos. Como tal, foram definidos alguns objetivos mais singulares.
O primeiro está relacionado com a necessidade de definir o conceito de big data, business analytics e
de todos os conceitos considerados relevantes associados ao tema do projeto, de forma a distingui-los
e a relacioná-los (como business intelligence e big data analytics).
O segundo com a necessidade de abordar as metodologias adotadas de forma a atingir os objetivos e
resultados esperados (Benchmarking e Case Study).
Finalmente, entender como essas metodologias podem apoiar o desenvolvimento do projeto e,
consequentemente, apoiar na consecução dos resultados esperados.
3.3. RESULTADOS ESPERADOS
Através da realização de estudos e análises comparativas entre soluções, serão identificados os
requisitos que o big data impõe às abordagens de business analytics ao nível descritivo, perspetivo e
prospetivo.
Também através do estudo de vários casos reais que utilizam técnicas de benchmarking pretende-se
obter as devidas conclusões acerca dos possíveis impactos que o big data impõe à área do business
analytics. Com este estudo pretende-se ainda demonstrar quais são os principais desafios que se
verificam e, possivelmente, sugerir formas de os contornar.
Na sequência destes objetivos estipulados, foi apresentada uma revisão de literatura que servirá de base
teórica para a realização deste projeto e para a obtenção dos resultados esperados.
Página | 32
4. ABORDAGEM METODOLÓGICA
4.1. BENCHMARKING
O benchmarking tem sido reconhecido como uma ferramenta muito importante no desenvolvimento de
áreas críticas de negócio, de forma a melhorar o desempenho das organizações, pelo que são muitas
as organizações que utilizam o benchmarking como ferramenta de gestão para alcançar vantagem
competitiva no mundo dos negócios (Anand & kodali, 2008).
No entanto, para alcançar a tão desejada vantagem competitiva e ter a capacidade de transformar big
data em dados com valor e que apoiem a tomada de decisão, são necessários sistemas de big data
adequados. Daí a pressão de medir, comparar e avaliar estes sistemas ter vindo a aumentar e o
benchmarkimg de big data ter surgido como a base desses esforços (Wang et al., 2014).
Da enorme variedade de definições citadas em diversos artigos científicos, uma das que mais se destaca
e que se trata de uma definição pioneira do termo é a de Camp (1989), que define benchmarking como
“a busca das melhores práticas da indústria que levarão as organizações a um desempenho excecional
através da implementação dessas melhores práticas”. Também pode ser definido como “o processo de
identificação, compreensão e adaptação de práticas que se destacam de organizações em todo o mundo
para ajudar uma organização a melhorar seu desempenho” (Kumar & Dhakar, 2006). Na literatura mais
recente, é ainda referido como o termo que permite a “identificação de oportunidades de melhoria; a
busca por melhores práticas (tanto dentro como fora de uma dada indústria); como também a sua
implementação de forma sistemática, ordenada e padronizada, a fim de abordar as diversidades e
especialidades dos próprios processos e prioridades de uma empresa” (Oliveira & Bernardes, 2017).
Existem diversos tipos de métodos de benchmarking, mas de uma forma geral, e apesar de serem
definidos pelo menos onze tipos de benchmarking diferentes (Wah Fong et al., 1998), segundo Stiakakis
& Kechagioglou (2006) pode-se afirmar que todos se enquadram em quatro categorias essenciais:
interna, competitiva, funcional e genérica. Se uma empresa optar por estudar dados de diferentes
departamentos que pertencem à própria organização, então esse processo é denominado benchmarking
interno. No benchmarking competitivo, são realizadas comparações entre empresas que são
concorrentes diretos. Em contrapartida, o benchmarking funcional envolve o estudo de práticas que são
utilizadas por empresas que não competem diretamente nos mesmos mercados. Finalmente, o
benchmarking genérico trata da comparação das melhores práticas e processos, independentemente
da indústria (Stiakakis & Kechagioglou, 2006).
Página | 33
4.1.1. METODOLOGIA A ABORDAR
O benchmarking é considerado um processo bastante estruturado, por isso, segundo a literatura, podem
ser definidas um conjunto de etapas aquando a realização deste processo.
Apesar alguns modelos de benchmarking considerarem 5 etapas neste processo (Stapenhurst, 2009;
Singh & Grover, 2013), apenas serão consideradas e seguidas neste projeto aquelas que foram
consideradas as 4 fases principais do processo de benchmarking. Ou seja, a metodologia de
benchmarking que será abordada neste projeto foi inspirada nas fases da metodologia disponibilizada
pela American Productivity and Quality Center (APQC) – APQC’s Process Classification
Framework®(PCF), que foi considerada a mais utilizada em todo o mundo.5 Desta forma, poderão ser
enumeradas as seguintes fases:
— Fase 1 – Planeamento: é necessário ter bem estipulado o objetivo que levou à necessidade de realizar
o processo de benchmarking e decidir o que será o alvo do estudo (Oiko, 2007). Além disso, é também
nesta fase que se estabelece o âmbito do projeto e que se estipula a abordagem para a recolha de dados
(Torres, 2017). No caso deste projeto o método de recolha definido é a revisão de literatura, sendo que
as fontes de dados utilizadas foram essencialmente o Google Scholar, o Science Direct e o Scopus;
— Fase 2 – Recolha de dados: esta etapa envolve a recolha de informações sobre as melhores práticas
das empresas e os respetivos desempenhos (Singh & Grover, 2013);
— Fase 3 – Análise dos dados: depois de realizada a recolha, procede-se à análise dos dados, de forma
a determinar e comparar lacunas de desempenho e as suas possíveis causas (Singh & Grover, 2013).
Além disso, compreender variações entre processos de empresas diferentes permite a identificação de
estratégias para melhoria (Oiko, 2007);
— Fase 4 – Ações de Adaptação de Melhoria: nesta última fase é importante ter em conta três ações
fundamentais: medir o desempenho das melhores variáveis de desempenho (como o custo,
produtividade e qualidade); determinar a forma como os níveis de desempenho são alcançados; e por
último, utilizar a informação para desenvolver e implementar um plano de ações que conduza à melhoria
(Singh & Grover, 2013).
Segundo Singh & Grover (2013) estas 4 fases podem ainda ser complementadas com um conjunto de
7 atividades, nomeadamente: 1) Estabelecer a necessidade de Benchmarking; 2) Identificar as funções
5 Informação recolhida do próprio website da empresa. Disponível em: https://www.apqc.org/pcf. Acedido a 03/02/2018.
Página | 34
a serem comparadas; 3) Selecionar os pontos de referência que se pretendem atingir; 4) Recolher e
analisar os dados para identificar as falhas no desempenho, processos e práticas; 5) Estabelecer os
ideais e objetivos que se pretendem atingir para melhorar e ultrapassar os melhores; 6) Identificar as
falhas e idealizar uma forma de as implementar e, por último, 7) Implementar o plano para corrigir as
falhas e monitorizar os resultados.
4.2. CASE STUDY
Para realizar pesquisa científica é essencial definir primeiramente o objeto de estudo e, a partir daí,
construir um processo de investigação, delimitando as fronteiras do universo que será investigado e
estudado (Ventura, 2007).
O método de estudos de caso é o mais adequado de aplicar quando o fenómeno em estudo é
contemporâneo e quando há pouca ou nenhuma possibilidade de controlar os eventos no contexto da
vida real (Yin, 2006). Os estudos de caso são levados a cabo de forma a ser possível realizar um estudo
aprofundado sobre determinado tema e de maneira a divulgar os detalhes dos diferentes pontos de vista
dos participantes, utilizando para tal diversas fontes de dados (Telles, 2007).
Segundo Gil (2002), o estudo de caso caracteriza-se pela sua grande flexibilidade, pelo que não existe
um guia único e rígido de como deverá ser conduzida a pesquisa. No entanto, apresenta quatro etapas
fundamentais que devem ser tidas em conta e que serão seguidas e adotadas para realizar esta
pesquisa, nomeadamente: a) a delimitação da unidade caso; b) a recolha de dados; c) análise e
interpretação dos dados e d) redação do relatório.
A primeira fase, a delimitação da unidade de caso, refere-se à delimitação da unidade que constitui o
caso de estudo, ou seja, exige-se que o pesquisador detenha alguma intuição para perceber quais são
os dados que são suficientes para se chegar à compreensão do objeto como um todo, pelo que o autor
aconselha o estudo de uma certa variedade de casos. Esta variedade deverá englobar casos típicos (em
função da informação prévia que aparentam ser o tipo ideal da categoria), casos atípicos (ou anormais
para, por contraste, determinar as possíveis causas do desvio) e casos extremos (para fornecerem uma
ideia dos limites dentro dos quais as variáveis podem oscilar) (Gil, 2002).
A segunda fase, recolha de dados, é geralmente realizada recorrendo a diversos procedimentos
quantitativos e qualitativos (por exemplo, através da observação, de análise de documentos,
Página | 35
levantamento de dados e análises de conteúdos), sendo que geralmente é utilizado mais do que um
procedimento (Ventura, 2007).
Na terceira fase, análise e interpretação dos dados, é importante que o pesquisador defina
antecipadamente o seu plano de análise. Este plano deve considerar as limitações dos dados obtidos,
principalmente no que diz respeito à qualidade da amostra. Se houver garantias da qualidade da
amostra, há uma base racional para fazer generalizações a partir dos dados. Quando não se tem certeza
dessa qualidade, será razoável apresentar as conclusões em termos de probabilidade (Gil, 2002). A
seleção dos dados deve considerar os objetivos da investigação, os seus limites e um sistema de
referências para avaliar quais são os dados que poderão ser úteis ou não e os que deverão ser analisados
ou não (Ventura, 2007).
Na quarta e última fase, redação do relatório, é importante que fique explícito, mas de uma forma
concisa, a forma como foram recolhidos os dados para que seja possível garantir a fidedignidade dos
mesmos, facilitando assim ao leitor a análise da qualidade dos resultados apresentados (Gil, 2002).
4.2.1. METODOLOGIA DE INVESTIGAÇÃO
A metodologia de investigação a ser adotada neste projeto teve como base a estratégia de pesquisa
descrita no subcapítulo 2.1 e as fases descritas no ponto anterior. Depois de recolhidas e escolhidas as
fontes de dados a serem utilizados sobre os temas que abrangem este projeto, a aplicação da
metodologia Case Study envolveu a análise de uma diversidade de documentos científicos com o objetivo
de explorar os conceitos relacionados e associados ao big data e business analytics para desta forma
ser possível responder à pergunta de investigação, também definida no subcapítulo 2.1. De realçar que
para dar continuidade ao projeto de dissertação irá recorrer-se, sempre que necessário, não só à síntese
realizada e apresentada neste documento como também aos artigos e documentos que poderão servir
de apoio para chegar aos resultados pretendidos.
Página | 36
5. PLANO DE ATIVIDADES
5.1. PLANEAMENTO
De modo a alcançar, de uma forma mais eficiente e eficaz, as metas e objetivos definidos neste projeto
com uma melhor distribuição de esforços e tempo, surge a necessidade de definir e organizar as tarefas
e atividades do projeto. Aquando a estruturação do plano de trabalhos, foi definida de uma forma
genérica, a calendarização e planeamento das atividades a realizar. Esta calendarização encontra-se
representada na Tabela 6.
TABELA 6 - CALENDARIZAÇÃO DAS ATIVIDADES
MESES 2017/2018
Out Nov Dez Jan Fev Mar Abr Mai Jun Jul Ago Set Out
Levantamento
de literatura X X
Revisão de
Literatura X X
Enquadramento
teórico X X
Discussão
teórica em
função da
determinação
dos objetivos
X X X X
Realização de
estudos X X
Escrita de um
artigo científico X X X X
Página | 37
MESES 2017/2018
Out Nov Dez Jan Fev Mar Abr Mai Jun Jul Ago Set Out
Análises
comparativas
entre soluções
X X X X
Análise e
interpretação
dos resultados
X X X X
Redação final
da dissertação X X X
Página | 38
5.2. WBS E DIAGRAMA DE GANTT
Depois de definida a referida calendarização, procedeu-se à elaboração da WBS e do respetivo Diagrama
de Gantt (Figura 7). Estas ferramentas visam apoiar e facilitar a definição de todas as atividades, bem
como a sua duração, de uma forma bastante precisa. Além disso, são ferramentas essenciais que
servem também de controlo, já que apoiam a monitorização do progresso do projeto e o cumprimento
das atividades no devido tempo planeado.
FIGURA 7 - WBS E RESPETIVO DIAGRAMA DE GANTT
Página | 39
5.3. TABELA DE RISCOS
Todos os projetos envolvem incertezas e, consequentemente, riscos. Estes riscos podem pôr em causa
a concretização das tarefas e até mesmo dos objetivos estipulados. O grande objetivo com esta gestão
de riscos é aumentar a probabilidade e o impacto dos eventos positivos (oportunidades) e reduzir a
probabilidade e o impacto dos eventos negativos (ameaças) do projeto.
Para o dimensionamento dos riscos deste projeto foi utilizado um método sugerido na norma ISO27000
(36), classificando as ameaças por probabilidade e impacto, atribuindo-se a cada fator um valor
crescente de 1 a 5. O valor do risco (seriedade) é obtido a partir do resultado da multiplicação dos
valores dos fatores de cada ameaça.
TABELA 7 - TABELA DE RISCOS
Risco
Probabilida
de (P)
[1-5]
Impacto
(I)
[1-5]
Serieda
de
[P * I]
Descrição Impacto Estratégia de
Mitigação
Complexidade
do Projeto 3 4 12
Maiores
dificuldades e
desafios estão
geralmente
associados a
projetos
“grandes”, com
alguma
complexidade.
Esta
complexidade
pode colocar
em causa a
viabilidade do
projeto, se não
forem tomadas
as devidas
medidas.
A principal
estratégia é dividir
grandes tarefas em
subtarefas menos
complexas e mais
simples. Além
disso, é importante
estipular desde o
início os objetivos
concretos que se
pretendem
alcançar.
Atrasos na
disponibilização
de dados e
informações
3 4 12
Os orientadores
poderão atrasar-
se na
disponibilização
do material
necessário para
Atraso geral na
realização do
projeto,
colocando em
causa o
cumprimento
Comunicar
diretamente com
os orientadores, de
forma a
fornecerem
algumas guidelines
Página | 40
Risco
Probabilida
de (P)
[1-5]
Impacto
(I)
[1-5]
Serieda
de
[P * I]
Descrição Impacto Estratégia de
Mitigação
acerca do
projeto
a realização do
projeto.
das atividades
no devido
tempo.
daquilo que poderá
ser feito, mesmo
sem os devidos
documentos.
Incumprimento
de prazos 4 4 16
Devido a
atrasos na
realização de
algumas
atividades,
poderão ocorrer
alguns
incumprimentos
de prazos.
Atraso no
projeto,
colocando em
risco a sua
finalização no
tempo
estipulado.
Realizar o controlo
constantes das
atividades
realizadas e por
realizar. O
diagrama de Gantt
poderá auxiliar
nesta
monitorização.
Falha na
execução das
atividades
3 3 9
O facto de
poderem surgir
dúvidas com o
projeto poderá
colocar em
causa a
execução de
algumas
atividades.
Poderá colocar
em causa a
qualidade do
projeto
Solicitar, de forma
regular, o feedback
dos orientadores
relativamente ao
trabalho
desenvolvido até ao
momento.
Falha de
comunicação/
feedback com o
orientador
2 4 8
Poderão ocorrer
falhas de
comunicação
com os
orientadores
devido a
indisponibilidad
es de ambas as
partes.
A comunicação
bilateral é
fundamental
para entender
se está a ser
seguido o
caminho correto
na realização do
projeto.
Marcar reuniões
com alguma
regularidade com
os orientadores, de
modo a garantir
que estão a ser
tomadas as
decisões corretas.
Página | 41
Risco
Probabilida
de (P)
[1-5]
Impacto
(I)
[1-5]
Serieda
de
[P * I]
Descrição Impacto Estratégia de
Mitigação
Perda de dados
e ficheiros 3 5 15
Se não forem
tomadas as
devidas
precauções no
armazenamento
dos dados,
pode ocorrer a
perda dos
mesmos, dado
que podem
surgir situações
inesperadas que
provoquem esta
situação.
Colocar em
causa a
finalização do
projeto no prazo
estipulado e
refazer trabalho
que já tinha
sido realizado.
Armazenar os
dados em
diferentes sistemas
de armazenamento
e ter o cuidado de
realizar cópias de
segurança
constantes.
Falta de
conhecimento e
inexperiência na
área em estudo
4 2 8
O facto de
nunca ter sido
desenvolvido
um projeto
desta dimensão
e com esta
complexidade,
existe a
possibilidade de
surgirem
algumas
dificuldades.
Atrasos e
incumprimento
dos prazos
estipulados
inicialmente no
planeamento.
Estudo e consulta
de dados de apoio
à concretização do
projeto. Consultar
os orientadores
para auxiliarem a
esclarecer dúvidas
que possam surgir.
Ausência de
dados e
informações
importantes na
área em estudo
1 3 3
Existe a
possibilidade de
que a literatura
existente,
atualmente, não
seja suficiente
Atrasos
consecutivos na
realização das
tarefas e
atividades
planeadas.
Comunicar os
orientadores e
informá-los da
dificuldade surgida.
Pesquisar outro
tipo de fontes.
Página | 42
Risco
Probabilida
de (P)
[1-5]
Impacto
(I)
[1-5]
Serieda
de
[P * I]
Descrição Impacto Estratégia de
Mitigação
para auxiliar em
todos os
parâmetros do
estudo.
Pode colocar
em causa a
qualidade do
projeto.
Página | 43
6. CONCLUSÃO
Este documento constitui a primeira fase daquele que é o maior e mais complexo projeto individual e de
investigação do curso, o projeto de dissertação do Mestrado Integrado em Engenharia e Gestão de
Sistemas de Informação.
Neste sentido, e tal como definido no planeamento, podem-se definir como os objetivos principais desta
pré dissertação: o levantamento da literatura, em que se procedeu à pesquisa e obtenção de documentos
científicos que serviram e servirão de apoio para o desenvolvimento do tema deste projeto de
investigação e a realização da revisão de literatura que serviu de base para realizar o enquadramento
teórico, em que, depois de selecionados os artigos que melhor se adequariam e apoiariam o
desenvolvimento do tema, procedeu-se à leitura e síntese da literatura, sendo os resultados dessa síntese
apresentados no capítulo 2 deste documento (Estado de Arte) e ainda no capítulo 4 (Abordagem
Metodológica).
Com a referida revisão de literatura foi possível atingir os objetivos estipulados e definidos neste
documento, tendo sido possível definir, caracterizar e contextualizar os conceitos de big data, business
analytics e data analytics, associando os desafios e oportunidades que o big data coloca à área de
analytics. Além disso, foram ainda definidas e caracterizadas as metodologias que serão aplicadas para
realizar este estudo.
A próxima etapa deste projeto de investigação, assentará numa vertente mais prática, tendo por base
os conhecimentos adquiridos na revisão de literatura realizada nesta fase e onde serão aplicadas as
metodologias abordadas no capítulo 4, ou seja, através da realização de estudos e análises comparativas
entre soluções, serão identificados os requisitos que o big data impõe às abordagens de business
analytics ao nível dos modelos descritivo, preditivo e prospetivo.
Finalmente, espera-se ainda que as incertezas e riscos associados e identificados neste projeto sejam
ultrapassados com sucesso, realizando a correta gestão dos mesmos e aplicando as estratégias de
mitigação identificadas no plano de atividades.
Página | 44
7. REFERÊNCIAS
Anand, G., & Kodali, R. (2008). Benchmarking the benchmarking models. Benchmarking: An
International Journal, 15(3), 257-291.
Appelbaum, D., Kogan, A., Vasarhelyi, M., & Yan, Z. (2017). Impact of business analytics and enterprise
systems on managerial accounting. International Journal of Accounting Information Systems, 25, 29-44.
Bayrak, T. (2015). A review of business analytics: a business enabler or another passing fad. Procedia-
Social and Behavioral Sciences, 195, 230-239.
Bellazzi, R. (2014). Big data and biomedical informatics: a challenging opportunity. Yearbook of medical
informatics, 9(1), 8.
Bento, A. (2012). Como fazer uma revisão da literatura: Considerações teóricas e práticas. Revista JA
(Associação Académica da Universidade da Madeira), (65), 42-44.
Bose, R. (2009). Advanced analytics: opportunities and challenges. Industrial Management & Data
Systems, 109(2), 155-172.
Camp, R.C. (1989), Benchmarking: The Search for Industry Best Practices that Lead to Superior
Performance, ASQC Quality Press, Milwaukee, WI.
Campos, F. R. (2015). A gestão da inovação em serviços intensivos em conhecimento: oportunidades e
desafios do Big Data.
Chaudhuri, S., & Narasayya, V. R. (2011). New frontiers in business intelligence. Proc VLDB Endow,
4(12), 1502-1503.
Chen, H., Chiang, R. H., & Storey, V. C. (2012). Business intelligence and analytics: From big data to big
impact. MIS quarterly, 36(4).
Cosic, R., Shanks, G., & Maynard, S. B. (2015). A business analytics capability framework. Australasian
Journal of Information Systems, 19.
Costa, R. J. R. (2012). Business intelligence: apoio à contenção de custos na BorgWarner Emissions
Systems.
Costa, S. A. R. D. (2012). Sistema de business intelligence como suporte à gestão estratégica (Doctoral
dissertation).
Página | 45
Davenport, T. H., & Harris, J. G. (2007). Competing on analytics: The new science of winning. Harvard
Business Press.
Dumbill, E. (2012). Planning for big data. "O'Reilly Media, Inc.".
Fernandes, J. C. A. (2016). O processo de Business Intelligence em empresas de telecomunicações: o
caso da dstelecom, SA (Doctoral dissertation).
Gil, A. C. (2002). Como elaborar projetos de pesquisa. São Paulo, 5(61), 16-17.
Google Trends: Interest in Big Data, Business Analytics and Business Intelligence over time (2017).
https://trends.google.com/trends/explore?date=all&q=business%20analytics,business%20intelligence,
%2Fm%2F0bs2j8q. Acedido a 19 de dezembro de 2017.
Günther, W. A., Mehrizi, M. H. R., Huysman, M., & Feldberg, F. (2017). Debating big data: A literature
review on realizing value from big data. The Journal of Strategic Information Systems.
Gupta, S., & Chaudari, M. S. (2015). Big Data issues and challenges. International Journal on Recent
and Innovation Trends in Computing and Communication, 3(2), 062-066.
Hashem, I. A. T., Yaqoob, I., Anuar, N. B., Mokhtar, S., Gani, A., & Khan, S. U. (2015). The rise of “big
data” on cloud computing: Review and open research issues. Information Systems, 47, 98-115.
Holsapple, C., Lee-Post, A., & Pakath, R. (2014). A unified foundation for business analytics. Decision
Support Systems, 64, 130-141.
Hurwitz, J., Nugent, A., Halper, F., & Kaufman, M. (2013). Big data for dummies. John Wiley & Sons.
IBM: Big Data For Dummies. JeanFrancoisPuget, abril de 2013. Disponível em:
https://www.ibm.com/developerworks/community/blogs/jfp/entry/big_data_for_dummies23?lang=e
n Acedido a: 20 de dezembro 2017.
Jagadish, H. V., Gehrke, J., Labrinidis, A., Papakonstantinou, Y., Patel, J. M., Ramakrishnan, R., &
Shahabi, C. (2014). Big data and its technical challenges. Communications of the ACM, 57(7), 86-94.
Kaisler, S., Armour, F., Espinosa, J. A., & Money, W. (2013, January). Big data: Issues and challenges
moving forward. In System sciences (HICSS), 2013 46th Hawaii international conference on (pp. 995-
1004). IEEE.
Página | 46
Kamilaris, A., Kartakoullis, A., & Prenafeta-Boldú, F. X. (2017). A review on the practice of big data
analysis in agriculture. Computers and Electronics in Agriculture, 143, 23-37.
Katal, A., Wazid, M., & Goudar, R. H. (2013, August). Big data: issues, challenges, tools and good
practices. In Contemporary Computing (IC3), 2013 Sixth International Conference on (pp. 404-409).
IEEE.
Kumar, A., Antony, J., & Dhakar, T. S. (2006). Integrating quality function deployment and benchmarking
to achieve greater profitability. Benchmarking: An International Journal, 13(3), 290-310.
Lima, C. A. R., & Calazans, J. D. H. C. (2013). Pegadas Digitais:“Big Data” E Informação Estratégica
Sobre O Consumidor.
Lima, L. C. B. D. (2014). Big data for data analysis in financial industry (Doctoral dissertation).
Manyika, J., Chui, M., Brown, B., Bughin, J., Dobbs, R., Roxburgh, C., & Byers, A. H. (2011). Big data:
The next frontier for innovation, competition, and productivity.
Mazzega, C. L. (2016). BIG DATA: OPORTUNIDADES E DESAFIOS PARA OS NEGÓCIOS.
Mello, R. G. S. D. (2015). Utilização de big data analytics nos sistemas de medição de desempenho:
estudos de caso.
Mortenson, M. J., Doherty, N. F., & Robinson, S. (2015). Operational research from Taylorism to
Terabytes: A research agenda for the analytics age. European Journal of Operational Research, 241(3),
583-595.
Oiko, O. T. (2007). Desenvolvimento de um sistema de informação para benchmarking e sua aplicação
em arranjos produtivos locais (Doctoral dissertation, Universidade de São Paulo).
Oliveria, G. G. D., & Bernardes, M. M. (2017). O que é o benchmarking? Bernardes, Mauricio Moreira e
Silva; Linden, Júlio Carlos de Souza van der (orgs.). Design em pesquisa. Porto Alegre: Marcavisual,
2017. p. 110-125.
O’neil, Cathy: What’s the difference between big data and business analytics? Mathbabe, agosto de 2013.
Disponível em: https://mathbabe.org/2013/08/16/whats-the-difference-between-big-data-and-
business-analytics/. Acedido a: 28 de dezembro 2017.
Página | 47
Oracle: Big Data for the Enterprise. Oracle White Paper, junho de 2013. Disponível em:
http://www.oracle.com/us/products/database/big-data-for-enterprise-519135.pdf Acedido a: 20 de
dezembro 2017.
Power, D. J. (2007). A brief history of decision support systems. DSSResources. COM, World Wide Web,
http://DSSResources. COM/history/dsshistory. html, version, 4.
Pulse, U. G. (2012). Big data for development: Challenges & opportunities. Naciones Unidas, Nueva
York, mayo.
Ribeiro, C. J. S. (2014). Big Data: os novos desafios para o profissional da informação. Informação &
Tecnologia, 1(1), 96-105.
Russom, P. (2011). Big data analytics. TDWI best practices report, fourth quarter, 19, 40.
Sahay, B. S., & Ranjan, J. (2008). Real time business intelligence in supply chain analytics. Information
Management & Computer Security, 16(1), 28-48.
Salas-Vega, S., Haimann, A., & Mossialos, E. (2015). Big Data and Health Care: Challenges and
Opportunities for Coordinated Policy Development in the EU. Health Systems & Reform, 1(4), 285-300.
SANTOS, I. A. B. D. (2016). Condicionantes do uso efetivo de big data e business analytics em
organizações privadas: atitudes, aptidão e resultados.
Sayão, C. (2017). Fatores críticos de sucesso para ferramentas de Business Analytics (Doctoral
dissertation, Universidade de São Paulo).
Sharma, R., Reynolds, P., Scheepers, R., Seddon, P. B., & Shanks, G. G. (2010, August). Business
Analytics and Competitive Advantage: A Review and a Research Agenda. In DSS (pp. 187-198).
Shmueli, G., Bruce, P. C., Yahav, I., Patel, N. R., & Lichtendahl Jr, K. C. (2017). Data Mining for Business
Analytics: Concepts, Techniques, and Applications in R. John Wiley & Sons.
Singh, B., Grover, S., & Singh, V. (2013). An overview of benchmarking process: the continuous
improvement tool. International Journal of YMCAUST, 1(2), 80-83.
Stapenhurst, T. (2009). The benchmarking book. Routledge.
Stiakakis, E., & Kechagioglou, I. (2006). Applying benchmarking practices in small companies: an
empirical approach. Int Bull of Bus Admin, 1, 115-126.
Página | 48
SUZUKI, C. W. (2016). OPORTUNIDADES E DESAFIOS PARA PROJETOS DE BIG DATA: um estudo de
caso da parceria Petrobras EMC².
Taurion, C. (2013). Big data. Brasport.
Torres, H. M. O. (2017). Benchmarking de Tecnologias de Big Data aplicadas à saúde / medicina.
Urbach, N.; Smolnik, S.; Riempp, G (2009): The State of Research on Information Systems Success – A
Review of Existing Multidimensional Approaches. Business & Information Systems Engineering (4)
Ventura, M. M. (2007). O estudo de caso como modalidade de pesquisa. Revista SoCERJ, 20(5), 383-
386.
Volpato, T., Rufino, R. R., & Dias, J. W. (2014). BIG DATA – TRANSFORMANDO DADOS EM DECISÕES.
Wah Fong, S., Cheng, E. W., & Ho, D. C. (1998). Benchmarking: a general reading for management
practitioners. Management Decision, 36(6), 407-418.
Walker, M., 2012. Predictive, Descriptive, Prescriptive Analytics. Analytic Bridge. Disponível em:
http://www.analyticbridge.com/profiles/blogs/predictive-descriptive-prescriptive-analytics. Acedido a
22 de dezembro de 2017.
Wang, L., Zhan, J., Luo, C., Zhu, Y., Yang, Q., He, Y., ... & Zheng, C. (2014, February). Bigdatabench: A
big data benchmark suite from internet services. In High Performance Computer Architecture (HPCA),
2014 IEEE 20th International Symposium on (pp. 488-499). IEEE.
Watson, H. J. (2002). Recent developments in data warehousing. Communications of the Association for
Information Systems, 8(1), 1.
Watson, H. J. (2014). Tutorial: Big data analytics: Concepts, technologies, and applications. CAIS, 34,
65.
Watson, H. J., & Wixom, B. H. (2007). The current state of business intelligence. Computer, 40(9).
Webster, J.; Watson, R. T. (2002). Analyzing the Past to Prepare for the Future: Writing Literature Review.
MIS Quarterly, Vol. 26, No. 2 (Jun., 2002).
Yin, R. K. (2006). Case study research and applications: Design and methods. Sage publications.
Zikopoulos, P., & Eaton, C. (2011). Understanding big data: Analytics for enterprise class hadoop and
streaming data. McGraw-Hill Osborne Media.