Cassandra e Hadoop - Adilson Carvalho - eBehavior

Preview:

DESCRIPTION

 

Citation preview

O que a gente faz

RastreamentoRecomendação

Hadoop

Hadoop...•Problema:

•Arquivos muito grandes para o servidor do Mahout•O servidor não conseguia mais calcular a estratégia de recomendação•Processo de geração dos dados de entrada muito pesado para o SQL Server

•Necessidade:•Adoção de Framework para computação distribuída que tenha agendamento de tarefas e storage distribuídos

Hadoop...•Estratégia:

•Adoção do Hadoop•Vantagens

•File System distribuído e replicado•Distribuição de processamento no Cluster•Tolerância a falhas•Redução do processamento para gerar recomendação

•Desvantagens•Curva de aprendizado

Cassandra

Cassandra...•Problema:

•Exaustão dos recursos de banco de dados relacional•Necessidade:

•Remover do SQL Server itens de baixa latência

•****REPETIR DESENHO DO CENÁRIO HADOOP

Cassandra...•Estratégia:

•Adoção do Cassandra•Vantagens

•Compatibilidade e interoperabilidade com o Hadoop•Altas taxas de leitura/gravação•File System distribuído e replicado•Distribuição de processamento no Cluster•Tolerância a falhas•Redução do processamento para gerar recomendação

•Desvantagens•Curva de aprendizado•Incompatibilidade entre clientes Java e .Net

obrigadoobrigado

Adilson CarvalhoAdilson Carvalhoadilson@ebehavior.com.br

Twitter: @lcadilsonTwitter: @lcadilson

Recommended