16
Guia de Planejamento Introdução à Big Data Como avançar com uma implantação bem-sucedida Junho de 2014 Por que ler este documento Este guia de planejamento fornece informação valiosa e etapas práticas para gerentes de TI que desejam planejar e implementar iniciativas analíticas Big Data, incluindo: O cenário atual de TI para Big Data e os desafios e oportunidades associados a esta força desagregadora Tecnologias de Big Data, com foco na estrutura do Apache Hadoop* e na analítica na memória A importância de colocar a infra-estrutura certa em vigor para uma implantação de Big Data ideal Três "próximas etapas" básicas e uma lista de verificação para ajudar os gerentes de TI a avançar com o planejamento e a implementação de seu próprio projeto de Big Data

e7 Big Data Planning-guide Webready Bt Final 0

Embed Size (px)

DESCRIPTION

Big

Citation preview

Guia de PlanejamentoIntroduo Big Data Como avanar com uma implantao bem-sucedidaJunho de 2014Por que ler este documento Este guia de planejamento fornece informao valiosa e etapas prticas para gerentes de TI que desejam planejare implementar iniciativas analticas Big Data, incluindo: O cenrio atual de TI para Big Data e os desafios e oportunidades associados a esta fora desagregadora Tecnologias de Big Data, com foco na estrutura do Apache Hadoop* e na analtica na memria A importncia de colocar a infra-estrutura certa emvigor para uma implantao de Big Data ideal Trs "prximas etapas" bsicas e uma lista de verificao para ajudar os gerentes de TI a avanar com o planejamento e a implementao de seu prprio projeto de Big Data ndice 3 O cenrio atual de TI para analtica de Big Data 4 Entendendo tecnologias de Big Data 6 Implantao de solues de Big Data 11Introduo analtica de Big Data: trs etapas bsicas14Recursos Intel para aprender mais 3 Intel IT Center Guia de Planejamento|Introduo Big Data Cenrio atual de TI para analtica de Big DataO novo burburinho sobre Big Data mudou de exagerada para uma conversa mais ponderada. Tecnologias ainda em amadurecimento, escassez de recursos e mudanas na forma como TI e os negcios trabalham juntos so a nova realidade: Explorar Big Data no simples. Ainda assim, o caso de negcios de Big Data permanece convincente. Apesar de uma reao contrria de cticos que fcaram desiludidos com as promessas econmicas de Big Data, as organizaes esto progredindo de forma contnua. Por exemplo, a pesquisa da Intel de 2013 sobre Big Data com 200 gerentes de TI nos Estados Unidos concluiu que mais da metade dos entrevistados j haviam implementado ou esto atualmente implementando uma distribuio Apache Hadoop*.1 Manter o status quo representa um risco muito grande de ser deixado para trs pela concorrncia. Hoje, os fornecedores oferecem um nmero crescente de plataformas e solues abrangentes e prontas para a empresa baseadas em inovaes tecnolgicas. A conversa passou de "H valor em Big Data?" para "Como posso usar isso para criar valor e vantagem competitiva para minha organizao?" O que vem por a para Big Data:analtica preditiva e a Internet das coisas Big Data deriva a maior parte de seu valor de insights que produz quando analisado ajudando as organizaes a descobrir padres, encontrar signifcado, tomar decises e, fnalmente, responder ao mundo com inteligncia. medida que a tecnologia amadurece e a conversa continua a evoluir, as organizaes iro desenvolver novas maneiras de obter insight operacionalizando abordagens de Big Data que, em geral, tm estado fora do alcance para os negcios tradicionais. Por exemplo, as organizaes esto se voltando para a analtica preditiva para ajud-las a se aprofundar no compromisso com os clientes, otimizar processos e reduzir custos operacionais. A combinao de fuxos de dados em tempo real e analtica preditiva por vezes referida como processamento que nunca para tem o potencial de prover vantagem competitiva signifcativa para os negcios. Para obter uma viso geral da analtica preditiva, inclusive por que importante e como os negcios podem operacionalizar isso, consulte Analtica preditiva 101:Inteligncia de Big Data da prxima gerao.A Internet das coisas (IoT) dispositivos habilitados para a Internet que fazem uma rede e se comunicam uns com os outros e com a nuvem tambm est direcionando a inovao da analtica de Big Data. O IDC estima que a IoT envolver 212 bilhes de "coisas" at o final de 2020,2 gerando enormes quantidades de dados em um fluxo de dados em rpida movimentao. A maioria desses dados ser gerada por mquinas atravs de sensores integrados e acionadores ligados por meio de redes com e sem fio que se comunicam usando o mesmo protocolo que se conecta Internet. Dados gerados por humanos a partir de dispositivos, como celulares e tablets, tambm sero parte da mistura. Esses dados podem ser usados para desbloquear as correlaes entre eventos, automatizar sistemas inteligentes e fornecer a introspeco para resolver problemas sociais e comerciais novos e mais complexos. Saiba mais sobre a perspectiva da Intel em dados gerados por mquina em Minerao de dados distribudos e Big Data. Aumento da presso sobre o TI Com tanta coisa em jogo para os negcios, as iniciativas de Big Data no podem acontecer em um vcuo. O TI deve frmar uma forte parceria com lderes de negcios para identifcar oportunidades de Big Data e seguir em frente com o apoio necessrio. Big Data tambm exige novos conjuntos de habilidades tcnicas, analticas e de negcios para ajudar a modelar problemas de negcios complexos e descobrir insights, integrar sistemas, construir bancos de dados enormes e administrar estruturas de software distribudo.O que exatamente "Big Data"? Big Data refere-se a grandes conjuntos de dados que esto em ordens de magnitudes maiores (volume), mais diversifcadas, incluindo dados estruturados, semiestruturados e no estruturados (variedade), e chegando mais rapidamente(velocidade) do que voc ou sua organizao j viram. Essa avalanche de dados gerada por dispositivos conectados de PCs e smartphones a sensores, como leitores de RFID e cmeras de trnsito. Alm disso, heterognea e vem em muitos formatos, incluindo texto, documentos, imagens, vdeos, weblogs, transaes e muito mais.4 Intel IT Center Guia de Planejamento|Introduo Big Data Uma adoo plena da analtica de Big Data envolve trs etapas bsicas de alto nvel. A ordem importante, embora as atividades sero sobrepostas conforme voc avanar: 1.Trabalhar com lderes de negcios para determinar os limites culturais da sua implementao interna e externamente. 2.Adquirir os conjuntos de habilidades de negcios, tecnologia e analtica que voc precisa, como cientistas de dados, arquitetos de sistemas e engenheiros de dados. 3.Identifcar os requisitos de tecnologia e implementar a pilha de soluo.Embora todas as trs etapas sejam essenciais para seu sucesso, este guia concentra-se na etapa 3: implementao de solues de Big Data. O International Institute for Analytics (Instituto Internacional para Analtica) uma excelente fonte de recursos para as duas primeiras etapas. Entendendo tecnologias de Big DataAs ferramentas e infraestrutura tradicionais no so efcientes para trabalhar com conjuntos de dados maiores, variados e rapidamente gerados. Para que as organizaes realizem o pleno potencial de Big Data, elas devem encontrar uma nova abordagem para capturar, armazenar e analisar dados.As tecnologias de Big Data usam o poder de uma grade distribuda de recursos de computao e "arquitetura de nada compartilhado", estruturas de processamento distribudo e bancos de dados no relacionais para redefnir a maneira como dados so gerenciados e analisados. As inovaes de servidores e solues de analtica na memria de expanso tornam possvel otimizar o poder de computao, escalabilidade, confabilidade e custo total de propriedade para as mais exigentes cargas de trabalho de analtica. A pilha de soluo de Big Data Dependendo do caso de uso, sua pilha de soluo de Big Data inclui uma infraestrutura de alto rendimento que confere poder a uma combinao de estruturas de processamento distribudo, como software Apache Hadoop, bancos de dados analticos relacionais e no relacionais e aplicativos analticos.Do ponto de vista funcional, essas tecnologias se complementam e trabalham juntas como uma plataforma fexvel de Big Data que tambm pode tirar proveito da arquitetura de gerenciamento de dados existente. Por exemplo, a anlise histrica de Hadoop* pode ser movida para bancos de dados analticos ou integrada a dados estruturados em data warehouses corporativos tradicionais(EDWs) para anlise adicional.Software Apache Hadoop* O software Apache Hadoop uma estrutura completa de cdigo-fonte aberto para Big Data e emergiu como uma das melhores abordagens para processamento de conjuntos de dados grandes e variados. A estrutura do Hadoop fornece um modelo de programao simples para processamento distribudo de grandes conjuntos de dados. Inclui o Apache* Hadoop Distributed File System (HDFS*), uma estrutura para planejamento de tarefas chamada Apache Hadoop YARN e uma estrutura de processamento paralelo chamada Apache Hadoop MapReduce. Diversos componentes suportam a ingesto de dados (o servio Apache Flume*), consultas e anlise (software Apache Pig*, Apache Hive* e Apache HBase*) e coordenao dos fuxos de trabalho (Apache Oozie), assim como o gerenciamento e o monitoramento do cluster de servidor subjacente (software Apache Ambari*). Combinados, os componentes de software Apache so uma estrutura poderosa para processamento e anlise de dados distribudos em lote para anlise histrica. Oua os especialistas do Apache Hadoop* Uma maneira de aprender sobre o software Apache Hadoop* e seus componentes ouvir diretamente de especialistas profundamente engajados na comunidade de cdigo-fonte aberto e seu trabalho de desenvolvimento. Escute os podcasts de entrevistas com lderes da comunidade para Apache Hadoop MapReduce, the Apache* Hadoop* Distributed File System (HDFS*), Apache Hive*, Apache Pig* e HCatalog, descrevendo como cada um funciona, onde se encaixa na pilha de Hadoop e planos de desenvolvimento contnuo. PDFs acompanham cada podcast.5 Intel IT Center Guia de Planejamento|Introduo Big Data A estrutura do Hadoop est disponvel atravs da comunidade de cdigo-fonte aberto ou como uma distribuio em pacote de fornecedores que incluem software de valor agregado e servios (como gesto, treinamento e suporte). Muitas dessas distribuies podem se integrar a EDWs, sistemas de gerenciamento de banco de dados relacionais (RDBMs) e a outros sistemas de gerenciamento de dados para que dados possam ser movidos entre clusters do Hadoop e outros ambientes para expandir o conjunto de dados a processar ou consultar. Analtica na memriaA computao na memria tem o potencial de afetar significativamente o poder e a velocidade da analtica de Big Data. Gartner reconhece seu valor estratgico, identifcando a computao na memria como uma das 10 principais tendncias de tecnologia estratgica para 2013, com a capacidade de fornecer oportunidades de negcios transformacionais.3 Com a computao na memria, a tomada de deciso em tempo real baseada em dados torna-se possvel.A computao na memria elimina uma das principais limitaes para muitas solues de Big Data a alta latncia e gargalos de E/S causados pelo acesso aos dados a partir do armazenamento baseado em disco. A computao na memria mantm todos os dados relevantes na memria principal do sistema de computador. Os dados podem ser acessados em ordens de magnitudes mais rpidas, tornando-os disponveis para anlise imediata e insights de negcios estaro disponveis quase que instantaneamente. Com a computao na memria, data marts e data warehouses inteiros podem ser movidos para DRAM para anlise rpida de todo o conjunto de dados.A analtica na memria integra aplicativos analticos e bancos de dados na memria em servidores dedicados. Isso ideal para cenrios analticos com requisitos de computao pesados e processamento de dados em tempo real. Exemplos de solues de banco de dados na memria incluem a plataforma SAP HANA* (desenvolvida em conjunto pela Intel e SAP), Oracle* Database In-Memory Option for Oracle 12c, sistemas IBM* na memria com BLU Acceleration e SAS* In-Memory Analytics. Para saber mais sobre as solues atuais na memria de fornecedores e como a inovao de computao na memria est mudando a maneira como as empresas analisam Big Data, leia o white paper Mudando a maneira como as empresas computam e competem com a analtica. Intel e Cloudera unem foras Em maro de 2014, a Intel anunciou um patrimnio substancial (US$ 740 milhes) e investimento em propriedade intelectual na Cloudera, fornecedora da verso do software Apache Hadoop* mais popular no mercado. A Intel tambm anunciou que iria sair do mercado de software de analtica de Big Data com a sua prpria distribuio e trabalhar com a Cloudera para integrar otimizaes do Intel Distribution for Apache Hadoop (tambm chamada de Plataforma de Dados da Intel) distribuio da Cloudera, incluindo o Apache Hadoop (CDH).Juntas, Intel e Cloudera continuam a inovar por meio de tecnologias de cdigo-fonte aberto, com foco na segurana, rendimento, gerenciamento e aplicativos. A Cloudera tambm trabalha em parceria com a Intel para certifcar-se de que seus produtos fazem o melhor uso das tecnologias do data center da Intel. A colaborao de tecnologia da Intel com a Cloudera tambm combina esforos em tecnologias fundamentais do Hadoop* para ajudar a avanar a estrutura de software e encorajar os desenvolvedores de cdigo-fonte aberto a inovar na e com base na plataforma.Para obter mais informaes sobre o CDH,visite cloudera.com. Computao na memria:mais potncia e velocidade A computao na memria j existe h algum tempo na forma de grades de dados distribudos e instalaes grandes e caras. No entanto, os sistemas na memria de hoje so mais rpidos, mais potentes e com melhor efcincia de custo. Por qu? Conforme previsto pela Lei de Moore, o custo de memria continua a cair os custos de memria fash DRAM e NAND caram drasticamente e, ao mesmo tempo, o nmero de processadores por chip est aumentando. Com a famlia do processador Intel Xeon E7 v2, um servidor de quatro sockets pode ser confgurado com at 6 terabytes (TB) de memria e um servidor de oito sockets com at 12 TB, sufciente para manter muitos dos maiores bancos de dados de hoje na memria de um nico servidor. Isso, combinado com as inovaes de servidor, como melhorias de rendimento (por exemplo, a tecnologia hyperthreading) e o amadurecimento de plataformas de software analtico, tornam as arquiteturas de banco de dados na memria de expanso mais acessveis. 6 Intel IT Center Guia de Planejamento|Introduo Big Data Bancos de dados NoSQL Esses bancos de dados no relacionais vm em quatro tipos diferentes de armazenamentos valor chave, colunar, grfco ou documento e fornecem armazenamento de alto desempenho e alta disponibilidade em escala da web. Eles so teis para a manipulao de enormes fuxos de dados e tipos de esquemas e dados fexveis com tempos de resposta rpidos. Os bancos de dados NoSQL usam uma arquitetura distribuda e tolerante a falhas, que fornece escalabilidade e confabilidade do sistema. Exemplos de bancos de dados NoSQL incluem software Apache HBase, Apache Cassandra*, MongoDB* e Apache CouchDB*.Bancos de dados analticos colunares Esses bancos de dados baseados em grade armazenam dados usando colunas em vez de linhas, reduzindo o nmero de elementos de dados a serem lidos durante o processamento de consultas e fornecendo rendimento rpido para a execuo de um grande nmero de consultas simultneas. Os bancos de dados analticos colunares so ambientes somente leitura que fornecem vantagens de desempenho e escalabilidade com relao ao preo sobre RDBMSs convencionais. So usados para EDWs e outros aplicativos com consultas intensivas e otimizados para armazenamento e recuperao de analtica avanada. As plataformas analticas SAP* Sybase* IQ, ParAccel* Analytic Platform e HP* Vertica* dependem de bancos de dados analticos colunares. Bancos de dados grfcos e ferramentas de analticaOs bancos de dados grfcos so um tipo de banco de dados NoSQL cada vez mais importante. Esses bancos de dados so especialmente teis para dados altamente conectados, em que as relaes so mais numerosas ou mais importante que as entidades individuais. As estruturas de dados grfcos so fexveis e facilitam a conexo e modelagem de dados. So mais rpidas de consultar e mais intuitivas para modelar e visualizar. Grande parte do crescimento em Big Data de natureza grfca.Bancos de dados grfcos trabalham sozinhos ou em conjunto com outras ferramentas grfcas, como visualizaes de grfcos, analtica de grfcos e aprendizado de mquina. Por exemplo, com a aprendizagem de mquina, bancos de dados grfcos podem ser usados para minerar e prever relaes para solucionar uma srie de problemas.Implantao de solues de Big Data As implantaes de Big Data podem ter necessidades de grandes infraestruturas. As escolhas de hardware e software feitas no momento do design podem ter um impacto signifcativo no rendimento e no custo total de propriedade. O TI pode obter o mximo de uma implantao de Big Data assegurando que a infraestrutura esteja em vigor para o seu caso de uso especfco e que o software Hadoop e de analtica estejam otimizados e ajustados para melhor rendimento.Uma plataforma de Big Data fexvel e extensvelCom uma plataforma de Big Data fexvel e extensvel, o TI pode construir os recursos necessrios para os negcios enquanto escolhe os sistemas com melhor efcincia de custo para lidar com cada caso de uso. Os trs modelos de uso a seguir so baseados uns nos outros para prover maior valor.Extrair, transformar e carregar (ETL)Extrair, transformar e carregar (ETL) agrega, pr-processae armazena dados, mas as solues ETL tradicionais no conseguem lidar com o volume, velocidade e variedade que caracterizam Big Data. Como a plataforma Hadoop armazena e processa dados em um ambiente distribudo, o Hadoop divide dados recebidos em partes e lida com o processamento de grandes volumes em paralelo. A escalabilidade inerente do Hadoop acelera tarefas ETL para que o tempo para anlise seja signifcativamente reduzido. Saiba mais sobre ETL usando o software Hadoop no white paper Extrair, transformar e carregar Big Data com o Apache Hadoop*. Consultas interativasCombinar a estrutura do Hadoop com um moderno EDW baseado na arquitetura de processamento paralelo massivo (MPP) amplia sua plataforma de Big Data para lidar com consultas interativas e analtica mais avanada. O Hadoop pode ingerir e processar grandes volumes de dados de streaming diversifcados e carreg-los no EDW para consultas, anlise e emisso de relatrios Structured Query Language (SQL) ad hoc. Como o Hadoop processa uma grande variedade de tipos de dados, o EWD enriquecido com dados que no so geralmente possveis de armazenar em EDWs tradicionais. Alm disso, os dados armazenados na infraestrutura do Hadoop podem persistir por muito mais tempo, permitindo que voc fornea mais dados granulares detalhados por meio do EDW para anlise de alta fdelidade.7 Intel IT Center Guia de Planejamento|Introduo Big Data Analtica preditiva A analtica preditiva extrai maior valor de dados usando dados histricos para prever o que pode acontecer no futuro. O TI da Intel recomenda combinar um EWD baseado na arquitetura MPP que pode realizar analtica preditiva complexa rapidamente com um cluster Hadoop para ETL rpido, escalvel e acessvel. O cluster Hadoop tambm pode ser estendido com ferramentas e outros componentes para executar processamento adicional de dados e funes analticas. Para obter mais detalhes sobre esse modelo de uso, leia o white paper Executar analtica preditiva e consultas interativas em Big Data. Plataforma de Big Data de TI da Intel Como o TI da Intel tem trabalhado com os negcios para desenvolver casos de uso de Big Data, eles combinaram elementos dos primeiros dois modelos de uso com analtica preditiva para uma infraestrutura de analtica fexvel hbrida.O IT da Intel usa o Hadoop para descarregar a ingesto, transformao e integrao de dados no estruturados de mdias sociais, trfego da web e logs de sensores em um EDW baseado na arquitetura MPP. A vantagem aqui que, adicionando estrutura aos dados heterogneos no Hadoop durante a extrao e transformao e, em seguida, carregando-os no EWD, os usurios podem aplicar inteligncia de negcios tradicional (BI) e ferramentas de analtica para consultas interativas e outras anlises avanadas. O TI da Intel implanta o software Hadoop em execuo na famlia do processador Intel Xeon E5 para ingesto de dados heterogneos, armazenamento em cache, indexao da web e analtica de mdias sociais. O software Hadoop fltra os dados conforme necessrio para anlise e move os mesmos para um dispositivo de data warehouse.O dispositivo de data warehouse baseado na arquitetura MPP e usado para executar rapidamente analticas preditivas complexas e explorao de dados interativos, com resultados quase em tempo real. O dispositivo de data warehouse uma soluo de terceiros construda na famlia do processador Intel Xeon E7 v2 para prover alto desempenho e disponibilidade a um custo relativamente baixo. O dispositivo integra-se s solues de BI existentes e fornece suporte a ferramentas de analtica avanada, como o pacote estatstico R. O TI da Intel estendeu ainda maissua plataforma de Big Data desenvolvendo um mecanismo de analtica preditiva para fornecer servios preditivos em andamento. Um primeiro caso de uso a implementao de um servio de recomendao em tempo real. Para este servio, a equipe de BI desenvolveu algoritmos preditivos usando a biblioteca de minerao de dados Apache Mahout*. Esses algoritmos agem sobre dados histricos armazenados no Hadoop e, em seguida, transferem os resultados para o banco de dados NoSQL Cassandra*. O software Cassandra fornece a recuperao de dados rpida de baixa latncia necessria para cenrios de uso em tempo real. Durante uma interao do usurio online, os resultados so recuperados do banco de dados Cassandra e combinados aos dados contextuais (entrada do usurio e localizao, por exemplo) para fornecer recomendaes de melhor ajuste em tempo real. Para prover a capacidade de resposta de consulta extrema necessria para anlise em tempo real de conjuntos de dados de grande volume, o TI da Intel conduziu testes para determinar a plataforma ideal para uma soluo de BI na memria de alto desempenho com efcincia de custo. Consulte Confgurando uma plataforma de BI na memria para desempenho extremo para melhores prticas relacionadas a combinar velocidade do servidor, nmero de ncleos de processadores, tamanho de cache e memria para servidores baseados em processadores Intel Xeon padro da indstria.8 Intel IT Center Guia de Planejamento|Introduo Big Data Infraestrutura para osServidores de Estrutura Hadoop* A estrutura do Hadoop funciona segundo o princpio de mover a computao para mais perto de onde os dados residem e a estrutura normalmente executada em clusters de servidores grandes construdos usando hardware padro. A estrutura facilmente escalada em servidores baseados em processadores Intel Xeon. A combinao da estrutura Hadoop com plataformas de servidores padro fornece a base para uma plataforma de analtica de alto desempenho com efcincia de custo para aplicativos em paralelo. Numa perspectiva de custo-benefcio, dois servidores de socket baseados na famlia do processador Intel Xeon E5 so a escolha ideal para a maioria das cargas de trabalho do Apache Hadoop. Esses servidores so geralmente mais efcientes para ambientes de computao distribuda do que plataformas de multiprocessadores em grande escala. Eles oferecem desempenho excepcional e proporcionam maior efcincia em balanceamento de carga e rendimento paralelo em comparao a servidores menores de socket nico. As tecnologias para acelerar a criptografa, reduzir a latncia e aumentar a largura de banda esto integradas aos processadores. Algumas cargas de trabalho de ETL, como a classifcao de dados simples, no requer o poder de processamento dos processadores Intel Xeon. Nesse caso, voc pode ser capaz de executar tais cargas de trabalho leves de forma mais efciente em microservidores baseados na famlia do produto processador Intel Atom C2000. Esses processadores de classe de servidor fornecem alta densidade e consumo de energia extremamente baixo (to pouco quanto 6 watts). Tanto processadores Intel Xeon quanto Intel Atom oferecem suporte memria de cdigo de correo de erros (ECC), que automaticamente detecta e corrige erros de memria, uma fonte comum de corrupo de dados e inatividade do servidor. Um cluster Apache Hadoop tem muita memria (normalmente cerca de 64 gigabytes [GB] ou mais por servidor), tornando a memria ECC um recurso crtico.Plataforma de Big Data fexvel de TI da Intel medida que novos casos de uso so desenvolvidos, o TI da Intel pode estender a plataforma de Big Data da empresa. Conforme os recursos crescem, o TI da Intel tem a fexibilidade para executar cargas de trabalho na arquitetura de menor custo.Massively ParallelProcessing PlatformApache Hadoop* FrameworkPredictiveAnalytics Engine Third-party solution Faster processing than traditional systems Built on Intel Xeon processor E7 family Developed in-house Enables real-time, ongoing predictive service Built on Intel Xeon processor E7 family Optimized for Intel Xeon processor E5 family, Intel Solid-State Drives, and Intel 10 gigabit Ethernet Distributed file system that can scale linearly Apache HBase* NoSQL database9 Intel IT Center Guia de Planejamento|Introduo Big Data Processadores Intel para a Estrutura Apache Hadoop* Famlia do processadorIntel Xeon E5 v2Construdo na microarquitetura Ivy Bridge usando a tecnologia lder de mercado da Intel do transistor de 22 nanmetros (nm) 3D Tri-Gate para rendimento superior e efcincia energticaEscala elstica para adaptar-se s futuaes de carga de trabalho e aumentar as demandas de rede e de armazenamentoAprimoramentos de rendimento e E/S para melhorar e equilibrar o rendimento geral do sistema e aumentar a efcincia do servidor Alta largura de banda, baixa latncia para aplicativos de computao de alto desempenho Permite rpida criptografa e descriptografa para incentivar a proteo de dados generalizada Memria de cdigos de correo de erros (ECC) Suporte para rede integrada de 10 gigabit Ethernet (10 GbE) e infraestrutura de data center simplifcadaMonitoramento e gerenciamento de energia no nvel do servidor e do data center para otimizar o consumo de energiaRendimento para aplicativos com thread simples e mltiplo, incluindocomputao de alto rendimentoSuporte para solues abertas e interoperveisFamlia de processadores Intel AtomRendimento para cargas de trabalho leves e expansivasSistema em um chip (SoC) oferece extrema densidade que maximiza o espao em rackConsumo de energia muito baixo, com envelopes de energia to baixos quanto 6 wattsMemria ECCA Intel oferece opes fexveis para implantaes do Apache Hadoop* de alto desempenho com efcincia de custo.Redes e armazenamento As plataformas de servidores de Big Data so benefciadas por melhorias drsticas em recursos de computao e armazenamento de mainstream, complementadas por solues de 10 gigabit Ethernet (10 GbE) para um sistema equilibrado. A largura de banda aumentada associada a 10 GbE fundamental para a importao e replicao de grandes conjuntos de dados entre servidores. As solues Intel 10 gigabit Ethernet fornecem conexes de alta taxa de transferncia, e os Intel Solid-State Drives (SSDs) so unidades de disco rgido de alto rendimento e alta taxa de transferncia para o armazenamento bruto. Para aumentar a efcincia, o armazenamento precisa oferecer suporte a recursos avanados, como compactao, criptografa, hierarquizao de dados automatizada, deduplicao de dados, eliminao de codifcao e thin provisioning todos compatveis com a famlia do processador Intel Xeon E5 hoje. Saiba mais sobre construo equilibrada, com efcincia de custo de clusters Hadoop em 10 GbE. A Intel tem feito testes considerveis usando servidores baseados na famlia do processador Intel Xeon E5 como a plataforma de servidor de linha de base para clusters Hadoop. Uma equipa de peritos em Big Data, rede e armazenamento da Intel mediu os resultados do rendimento do Apache Hadoop para diversas combinaes de componentes de rede e de armazenamento. O equilbrio dos recursos de computao, armazenamento e rede forneceram uma vantagem de rendimento signifcativa de acordo com critrios de referncia TeraSort, o tempo de processamento foi reduzido de 4 horas para 12 minutos resultados quase em tempo real.4, 5, 6 Para obter mais informaes sobre clusters Hadoop de alto desempenho em tecnologias Intel, consulte o white paper Tecnologias de Big Data para resultados quase em tempo real.10 Intel IT Center Guia de Planejamento|Introduo Big Data Infraestrutura para solues de analtica na memria Servidores Enquanto o software Hadoop pode ingerir e preparar grandes conjuntos de dados heterogneos, a analticaavanada (monitoramento, consultas interativas, anlise preditiva) requer uma infraestrutura mais poderosa. As plataformas de data warehouse MPP modulares so oferecidas como um dispositivo por diversos fornecedores. Esses dispositivos so fornecidos com software pr-integrado para implantao simplifcada e apresentam processamento, memria, E/S e armazenamento altamente otimizados. As ferramentas integradas de gerenciamento de dados e analtica avanada fornecem novas maneiras de trabalhar com seus dados. Muitas solues tambm podem ser compatveis com o seu ambiente de BI e analtica existente. Os requisitos de rendimento extremo podem exigir um dispositivo de analtica na memria que combine banco de dados e analtica em um sistema dedicado. Esses sistemas so ideais para processamento de eventos complexos (CEP) e outros aplicativos em tempo real. Os servidores baseados na famlia de produtos do processador Intel Xeon E7 v2 fornecem a memria, os recursos de execuo e a confabilidade necessrios para tais solues de memria de escala corporativa exigentes. Por exemplo, a capacidade de memria at trs vezes maior do que a gerao anterior,7 e voc pode aumentar o desempenho do banco de dados em at 148 vezes (14.700 por cento) usando as solues de memria no IBM DB2 10.5 com BLU Acceleration para consultas responsivas.4, 8 Os servidores de quatro sockets podem ser confgurados com at 6 terabytes (TB) de memria e os servidores com oito sockets com at 12 TB.Alm disso, como os sistemas na memria geralmente lidam com conjuntos de dados maiores e cargas de trabalho mais escalveis por servidor do que as solues tradicionais, eles fornecem integridade de dados e alta disponibilidade necessrias para apoiar os processos de crticos para a misso. Processadores Intel para analtica na memria A famlia do processador Intel Xeon E7 v2 acelera a analtica para cargas de trabalho de expanso intensivas de dados e bancos de dados na memria. Construdo na tecnologia do transistor de 22 nanmetros (nm) 3D Tri-Gate lder de mercado da Intel para rendimento superior e efcincia de energiaGrande capacidade de memria: -Confguraes de quatro e oito sockets com at 1,5 terabytes (TB) de memria por socket para at 6 TB ou 12 TB de memria por servidor -At trs mdulos de memria em linha duplos (DIMMs) por canal (DPC) e at oito canais (total de at 24 DIMMs), com capacidade individual DIMM de at 64 gigabytes (GB) de DIMMs com carga reduzida (LR) -Escalabilidade alm de oito sockets usando um controlador de n de terceiros (OEM) Maior cache com at 37,5 megabytes (MB) de cache de terceiro nvel por processador At 50 por cento mais ncleos e threads do que a gerao anterior de processadores (at 60 ncleos e 120 threadsem um servidor de quatro sockets para rpida execuo de transaes simultneas e consultas grandes e complexas) At quatro vezes maior largura de banda de E/S com relao gerao anterior de processadores Rendimento para aplicativos com thread simples e mltiplo, incluindo computao de alto rendimento de expansoe aplicativos tcnicos Capacidade e fexibilidade extras para armazenamento e conexes de rede com portas PCI Express* integradas (PCIe) 3.0, que melhora a largura de banda e suporta unidades de estado slido baseadas em PCIe Recursos avanados de confabilidade, disponibilidade e facilidade de manuteno (RAS) para melhorar a integridade dos dados e tempo de atividade para cargas de trabalho analticas essenciais para a misso com tecnologia Intel Run Sure Nenhum sistema de computador pode fornecer confabilidade, disponibilidade ou facilidade de manuteno absoluta. Requer um sistema habilitado para a Tecnologia IntelRun Sure, incluindo um processador Intel ativado e tecnologia(s) ativada(s). Os recursos de confabilidade integrados disponveis em alguns processadores Intel podem exigir software, hardware, servios adicionais e/ou uma conexo com a Internet. Os resultados podem variar dependendo da confgurao. Consulte o seu fabricante de sistemas para obter mais detalhes. Reivindicao de at 4 x a largura de banda de E/S com base em estimativas internas do rendimento da famlia de produtos do processador Intel Xeon E7-4890 v2 normalizado com relao s melhorias sobre a famlia de produtos do processador Intel Xeon E7-4870 com Hub de E/S (IOH) duplo usando uma ferramenta de largura de banda interna da Intel executando o teste de 1R1W.Intel IT Center Guia de Planejamento|Introduo Big Data 11Otimizao e ajuste paramelhor rendimento A Intel um dos principais colaboradores de iniciativas de cdigo-fonte aberto, como softwares Linux*, OpenStack*, KVM e Xen*. A Intel tambm tem dedicado recursos para anlise, testes e caracterizaes de rendimento do Hadoop, tanto internamente quanto com os colegas viajantes como HP, Super Micro e Cloudera. Por meio desses esforos tcnicos, a Intel tem observado muitas compensaes prticas em confguraes de hardware, software e sistema que tm implicaes no data center. Projetar a pilha de soluo para maximizar a produtividade, limitar o consumo de energia e reduzir o custo total de propriedade pode ajudar a otimizar a utilizao de recursos, minimizando os custos operacionais. As confguraes para o ambiente do Hadoop so um fator-chave no sentido de obter o pleno benefcio do resto do hardware e das solues de software. Baseado em testes de referncia extensos no laboratrio e em sites de clientes usando arquitetura baseada em processador Intel, as recomendaes de otimizao e ajuste da Intel para o sistema Hadoop pode ajudar a confgurar e gerenciar seu ambiente Hadoop para desempenho e custo. Acertas as confguraes exige um tempo inicial signifcativo, porque os requisitos para cada sistema Hadoop corporativo iro variar dependendo da tarefa ou da carga de trabalho. O tempo gasto para otimizar suas cargas de trabalho especfcas ser recompensado no s em um melhor rendimento, mas tambm em um menor custo total de propriedade para o ambiente Hadoop. Consulte Otimizando implantaes do Hadoop* para confguraes especfcas. Rendimento de parmetros de referncia (benchmark)Os parmetros de referncia (benchmark) so a base quantitativa para medir a efcincia de qualquer sistema de computador. A Intel desenvolveu um suite HiBench como um conjunto abrangente de testes de benchmark para ambientes Hadoop.9 Medidas individuais representam 10 cargas de trabalho importantes do Hadoop com uma mistura de caractersticas de uso do hardware. O HiBench inclui microrreferncias, bem como aplicativos Hadoop do mundo real representantes de uma ampla gama de analtica de dados, como indexao de pesquisa, aprendizagem de mquina e consultas. O HiBench 2.2 est disponvel agora como software de cdigo-fonte aberto sob a Apache License 2.0. Voc pode baixar o software, saber mais sobre cargas de trabalho especfcas e descobrir como comear em https://github.com/intel-hadoop/HiBench. Se voc leu at aqui, voc agora tem uma boa compreenso do cenrio de TI para Big Data, seu valor potencial para as organizaes e as tecnologias que podem ajudar a obter insights de recursos de dados estruturados, semiestruturados e no estruturados. Alm disso, voc tem uma boa viso geral dos princpios bsicos para colocar a infraestrutura certa em vigor e funcionando perfeitamente para apoiar suas iniciativas de Big Data. Voc pode comear com seu projeto de anlise de Big Data seguindo as trs etapas bsicas que descrevemos nas primeiras pginas deste guia. Embora este guia tenha se concentrado na tecnologia e na etapa 3, voc pode usar a seguinte lista de verifcao para ajud-lo a trabalhar nas atividades crticas em todas as trs etapas. Etapa 1: Entender como Big Data afetar culturalmente a sua organizao. Desenvolva um entendimento do valor que a analtica de Big Data pode trazer para sua organizao.a Converse com seus colegas de TI e de negcios. a Tire proveito dos recursos do Intel IT Center para Big Data para se atualizar sobre as tecnologias. a Entenda as ofertas de fornecedores. a Faa tutoriais e examine a documentao de usurio oferecida pelo Apache.Introduo analtica de Big Data: trs etapas bsicasIntel IT Center Guia de Planejamento|Introduo Big Data 12 Colabore com a liderana de negcios em uma estratgia e abordagem de Big Data. Desenvolva: a O caso de negcios para Big Data Como a analtica de Big Data trar valor para o seu negcio? Quais so os principais desafos dos negcios que ir abordar? a Objetivos de curto, mdio e longo prazo Quais so as fases-chave para alcanar os seus objetivos de Big Data? a Estado atual e futuro de sua infraestrutura de TI Seu data center pode oferecer suporte plataforma de Big Data? Avalie sua tecnologia atual de data center e descreva, se necessrio, seu plano de atualizao de recursos de computao, armazenamento e rede. a Fontes de dados e qualidade de dados Quais so as fontes de dados principais internamente? Que dados adicionais voc pode comprar? Como voc ir garantir a qualidade? a Plataforma de Big Data e ferramentas Qual plataforma voc usar para construir a sua soluo? Que software e ferramentas so necessrios para atingir seu objetivo? a Mtricas para medir o sucesso Como voc vai medir o rendimento do sistema? Baseie seu sucesso em quantas tarefas so enviadas, processadas em paralelo e concludas de forma efciente. Trabalhe com os usurios de negcios para articular as grandes oportunidades. a Identifque e colabore com os usurios de negcios (analistas, cientistas de dados, profssionais de marketing, etc.) para encontrar as melhores oportunidades de negcios para analtica de Big Data em sua organizao. Por exemplo, considere um problema de negcios existente especialmente um que seja difcil, caro ou impossvel de realizar com seus sistemas atuais de fontes de dados e analtica. Ou considere um problema que nunca foi resolvido antes porque as fontes de dados so novas e no estruturadas. a Priorize sua lista de oportunidades e selecione um projeto com um aparente retorno sobre o investimento. Para determinar o melhor projeto, considere suas respostas a estas perguntas: -O que eu estou tentando fazer?-Este projeto se alinha aos objetivos de negcios estratgicos?-Posso obter suporte da gerncia para o projeto? -A anlise de Big Data mantm uma promessa exclusiva de insight com relao analtica mais tradicional?-Quais aes posso executar com base nos resultados do meu projeto? -Qual o retorno em potencial sobre o investimento para o meu negcio? -Pode entregar este projeto com um tempo de 6 a 12 meses para valorizao? -Os dados que eu preciso esto disponveis? O que eu possuo? O que preciso comprar? -Os dados so coletados em tempo real ou so dados histricos? Etapa 2: Contratar as habilidades que voc precisa. Entenda e planeje as habilidades que voc precisa para os negcios e para TI. a Que habilidades voc precisa para realizar com sucesso a iniciativa? Esses recursos existem internamente?a Voc vai desenvolver habilidades de dentro da empresa? Contratar novos talentos? Terceirizar?a Onde estes indivduos residem no negcio? Em TI?13 Intel IT Center Guia de Planejamento|Introduo Big Data Etapa 3: Implementar a soluo de Big Data.Desenvolva um caso de uso para o seu projeto. a Identifque os casos de uso necessrios para realizar o seu projeto. aMapeie os fuxos de dados para ajudar a defnir qual tecnologia e recursos de Big Data so necessrios pararesolver o problema de negcios. aDecida que dados incluir e o que deixar de fora. Identifque apenas os dados estratgicos que levaro aum insight signifcativo. a Determine como os dados se relacionam e a complexidade das regras de negcios. a Identifque as consultas analticas e os algoritmos necessrios para gerar as sadas desejadas.a Considere se voc precisa de suporte analtico avanado, como consultas interativas ou analtica preditiva,ou suporte a fuxos de dados em tempo real. Identifque as lacunas entre as capacidades do estado atual e futuro. aQuais exigncias de qualidade de dados adicionais voc ter para coleta, limpeza e agregao de dados emformatos utilizveis? aQuais polticas de governana de dados precisaro estar em vigor para classifcar dados, defnir sua relevncia, e armazenar, analisar e acessar os mesmos? a Quais recursos de infraestrutura precisam estar em vigor para garantir escalabilidade, baixa latncia e rendimento, incluindo recursos de computao, armazenamento e rede? aVoc precisa adicionar componentes especializados como um banco de dados NoSQL para pesquisas de baixa latncia em grandes volumes de dados heterogneos? a Se voc planeja processar um fuxo constante de dados em tempo real, quais recursos de infraestrutura e memria adicionais voc precisar? Voc precisar de um dispositivo analtico na memria MPP? Uma soluo CEP? a Voc est considerando computao em nuvem para o seu modelo de entrega? Que tipo de ambiente de nuvem voc usar? Privado, hbrido, pblico? a Como os dados sero apresentados aos usurios? Os resultados precisam ser entregues de uma forma fcil de entender para uma variedade de usurios de negcios,de altos executivos a profssionais da informao. Desenvolva um ambiente de teste para uma verso de produo. a Adapte arquiteturas de referncia para sua empresa. A Intel est trabalhando com os principais parceiros para desenvolver arquiteturas de referncia que podemajudar como parte do programa Intel Cloud Builders com casos de uso de Big Data. a Defna a camada de apresentao, camada de aplicativo analtico, armazenamento de dados e, se for o caso, gerenciamento de dados em nuvem privado ou pblico. a Determine as ferramentas que os usurios precisam para apresentar os resultados de uma forma signifcativa. A adoo de ferramentas pelo usurio ir infuenciar signifcativamente no sucesso global do seu projeto. 14 Intel IT Center Guia de Planejamento|Introduo Big Data Alm dos recursos j citados neste artigo, consulte o seguinte para obter mais contedo interessante. Websites Para recursos adicionais sobre: Big Data: intel.com/bigdata Famlia do processador Intel Xeon E5: intel.com/xeone5 Famlia do processador Intel Xeon E7: intel.com/xeone7 Sobre plataformas de Big Data Accelerate Big Data Analysis with Intel Technologies Este artigo destaca tecnologias disponveis da Intel que as empresas podem usar para expandir clusters Apache Hadoop para lidar com o crescente volume, variedade e velocidade de dados. Usando menos e mais poderosos servidores, as empresas podem reduzir signifcativamente os custos operacionais. intel.com/content/www/us/en/big-data/big-data-analysis-intel-technologies-paper.html Big Data Mining in the Enterprise for Better Business Intelligence Este white paper da Intel descreve como a Intel est colocando em vigor os sistemas e habilidades para analisar Big Data para impulsionar a efcincia operacional e vantagem competitiva. O TI da Intel, em parceria com grupos de negcios da Intel, est implantando vrias provas de conceito para uma plataforma de Big Data, incluindo deteco de malware, validao de projetos de chips, inteligncia de mercado e um sistema de recomendao. intel.com/content/www/us/en/it-management/intel-it-best-practices/mining-big-data-In-the-enterprise-for-better-business-intelligence.html Extract Business Value from Big Data Este resumo da soluo descreve como a estrutura Apache Hadoop fornece uma base que voc pode implementar hoje para valor alvo e depois expandir para atender s necessidades crescentes. http://software.Intel.com/sites/default/fles/article/402151/Extract-Business-Value-from-Big-Data.pdfPesquisa de pares: Big Data Analytics (2013) Leia o relatrio completo dos resultados da pesquisa de 2013 da Intel com 200 gerentes de TI fornecendo insights sobre como as organizaes esto usando analtica de Big Data hoje, incluindo o que as organizaes precisam avanar e o que a pesquisa signifca para a indstria de TI. Os destaques so relatados no vdeo IT Managers Speak Out about Big Data Analytics. Esta pesquisa estende os resultados da pesquisa de 2012 da Intel sobre Big Data. Intel.com/content/www/us/en/Big-data/Big-data-Analytics-2013-peer-Research-Report.html Predictive Analytics: Use All Your Data to Compete and Win Como voc analisa Big Data to importante quanto os dados em si. Este resumo da soluo descreve como as organizaes podem implementar com efcincia de custo uma plataforma de Big Data extensvel para analtica descritiva, consultas interativas e analtica preditiva. software.intel.com/sites/default/fles/article/486773/sb-use-all-your-data-to-compete-and-win.pdfTurn Big Data into Big Value: A Practical Strategy As inovaes da Intel em silcio, sistemas e software podem ajud-lo a implantar trs modelos de uso (ETL usando software Apache Hadoop, consultas interativas e analtica preditiva na plataforma Hadoop) e outras solues de Big Data com efcincia de energia, custo e desempenho ideal. software.intel.com/sites/default/fles/article/402150/turn-big-data-into-big-value.pdfRecursos Intel para aprender mais15 Intel IT Center Guia de Planejamento|Introduo Big Data 1.Pesquisa de pares: Analtica de Big Data: Intels 2013 IT Manager Survey on How Organizations Are Using Big Data. Intel (Agosto de 2013). intel.com/content/www/us/en/big-data/big-data-analytics-2013-peer-research-report.html 2.The Internet of Things Is Poised to Change Everything, Says IDC. Business Wire (3 de outubro de 2013). businesswire.com/news/home/20131003005687/en/Internet-Poised-Change-IDC#.UvFfLfdXzg 3.Elliott, Timo. Why In-Memory Computing Is Cheaper and Changes Everything. Business Analytics (blog) (17 de abril de 2013).http://timoelliott.com/blog/2013/04/why-in-memory-computing-is-cheaper-and-changes-everything.html4.O Software e as cargas de trabalho utilizadas nos testes de desempenho podem ter sido otimizados para desempenho apenas em microprocessadores Intel. Testes de desempenho tais como SYSmark* e MobileMark* utilizam sistemas, componentes, software, operaes e funes especfcas. Qualquer alterao em um desses fatores poder ocasionar resultados variados. Consulte outras informaes e testes de rendimento para ajud-lo a avaliar amplamente o produto que pretende adquirir, incluindo o rendimento desse produto quando combinado com outros produtos. 5.Referncias TeraSort efetuadas pela Intel em dezembro de 2012. Confguraes customizadas: mapred.reduce.tasks=100 e mapred.job.reuse.jvm.num.tasks=-1. Para obter mais informaes, visite http://hadoop.apache.org/docs/current/api/org/apache/hadoop/examples/terasort/package-summary.html. 6.Confgurao de cluster: Um node principal (node de nome, rastreador de trabalho), 10 trabalhadores (nodes de dados, rastreadores de tarefas), comutador Cisco Nexus* 5020 de 10 Gigabit.Worker node da linha de base: Servidores SuperMicro* SYS-1026T-URF 1U com dois processadores Intel Xeon X5690 @ 3,47 GHz, discos rgidos SATA de 48 GB RAM, 700 GB 7200 RPM, Intel Ethernet Server Adapter I350-T2, Apache Hadoop* 1.0.3, Red Hat Enterprise Linux* 6.3, Oracle Java* 1.7.0_05. Upgrade de processador e sistema bsico no worker node: Servidores Dell PowerEdge* R720 2U com dois processadores Intel Xeon E5-2690 @ 2.90 GHz, 128 GB RAM.Upgrade de armazenamento no worker node: Intel Solid-State Drive 520 Series.Upgrade de adaptador de rede no worker node: Adaptador de rede convergente Ethernet X520-DA2 da Intel. Upgrade de software no worker node: Software Intel Distribution for Apache Hadoop* 2.1.1. 7.Em uma plataforma de quatro sockets nativamente conectada: A famlia do processador Intel Xeon E7 suporta 64 DIMMS, mximo de memria por DIMM de 32 GB DIMM registrado (RDIMM); a famlia do processador Intel Xeon E7 v2 suporta 96 DIMMs, mximo de memria por DIMM de 64 GB RDIMM. Isto permite um aumento de 3x na memria.8.O rendimento do banco de dados usando a soluo de memria, resultados de referncia com base em uma referncia de Prova de Desempenho e Escalabilidade (POPS) de um banco de dados interno de 10 TB: intel.com/content/www/us/en/big-data/big-data-xeon-e7-v2-unlock-the-value-ibm-paper.html. Nmeros de melhoria de desempenho so acumulativos de todas as consultas na carga de trabalho. Os resultados individuais variam de acordo as condies, confguraes e cargas de trabalho individuais. Comum a todas as trs confguraes: SUSE * Linux Enterprise Server 11 SP3 x86-64, 1.024 GB de memria, armazenamento IBM XIV*Storage System Gen3 conectado com 8 Gbps Fibre Channel (FC) atravs de comutador SAN de 8 GB com espao bruto total de 111 TB (2 TB x 12 discos/pModule x 11 mdulos XIV). Confgurao de linha de base de software "Software de gerao anterior": IBM DB2 10.1 mais de famlia de produtos do processadorIntel Xeon E7-4870 de quatro sockets usando a soluo IBM XIV Storage System Gen3 FC SAN, completando as consultas em cerca de 3,75 horas para a nova confgurao de "Nova gerao": IBM DB2 10.5 com BLU Acceleration mais a famlia de produtos do processador Intel Xeon E7-4890 de quatro sockets usando tabelas de memria (total de 1 TB) completando as mesmas perguntas em cerca de 90 segundos. 9.Huang, Shengsheng, Jie Huang, Jinquan Dai, Tao Xie, Bo Huang. The HiBench Benchmark Suite: Characterization ofthe MapReduce-Based Data Analysis. IEEE (maro de 2010). Notas de rodapOs resultados foram simulados e so fornecidos apenas para fns informativos. Os resultados foram obtidos com simulaes executadas em um simulador ou modelo de arquitetura. Qualquer diferena em projeto ou confgurao de hardware ou software de sistema poder afetar o rendimento real.O rendimento relativo a cada benchmark calculado a partir do valor de 1,0 como linha de base para o resultado real da primeira plataforma testada, em seguida dividindo-se o resultado real do benchmark da plataforma de linha de base entre cada um dos resultados de benchmark especfcos de cada uma das outras plataformas e atribuindo a eles um nmero de desempenho relativo que se correlacione aos aumentos de desempenho reportados.Os compiladores da Intel podem ou no otimizar com o mesmo grau microprocessadores no Intel para otimizaes que no so exclusivas dos microprocessadores Intel. Essas otimizaes incluem SSE2, SSE3 e conjuntos de instrues SSSE3 e outras otimizaes. A Intel no garante a disponibilidade, funcionalidade ou efetividade de qualquer otimizao em microprocessadores no fabricados pela Intel. As otimizaes deste produto dependentes de microprocessadores so destinadas para uso com microprocessadores Intel. Algumas otimizaes no especfcas da microarquitetura Intel so reservadas para microprocessadores Intel. Consulte os Guias de Referncia e do Usurio do produto aplicveis para mais informaes sobre os conjuntos de instrues especfcas abrangidos pela presente nota. Nota de reviso #20110804. Os nmeros dos processadores Intel no representam uma medida de desempenho. Os nmeros dos processadores diferenciam os recursos de acordo com cada famlia de processadores, e no entre as famlias de processadores.Visite intel.com/content/www/us/en/processors/processor-numbers.html.Mais sobre o Intel IT Center Guia de Planejamento: Introduo Big Data trazido a voc pelo Intel IT Center. O Intel IT Center projetado para fornecer informaes simples e imparciais que ajudem os profssionais de TI a implementarem projetos estratgicos na ordem do dia, incluindo virtualizao, projeto de data center, Big Data, nuvem e segurana de infraestrutura e cliente. Visite o Intel IT Center para ter acesso a: Guias de planejamento, pesquisa colaborativa e outros recursos para ajuda-lo na implementao de projetos importantesEstudos de caso reais que mostram como seus colegas lidaram com os mesmos desafos que voc enfrentaInformaes sobre como a prpria empresa de TI da Intel est implementando a nuvem, virtualizao, seguranae outras iniciativas estratgicasInformaes sobre eventos, nos quais voc pode ouvir especialistas de produtos Intel, bem como dosprofssionais de TI da prpria Intel Saiba mais em intel.com/ITCenter. Compartilhe com seus colegasLegal Este artigo serve apenas para fns informativos. ESTE DOCUMENTO FORNECIDO NO ESTADO EM QUE SE ENCONTRA, SEM QUAISQUER GARANTIAS, INCLUINDO QUALQUER GARANTIA DE COMERCIABILIDADE, NO VIOLAO, ADEQUAO A QUALQUER FIM ESPECFICO OU QUALQUER GARANTIA PROVENIENTE DE UMA PROPOSTA, ESPECIFICAO OU AMOSTRA. A Intel se isenta de toda e qualquer responsabilidade, incluindo a responsabilidade por violao de quaisquer direitos de propriedade, relacionados ao uso desta informao. Nenhuma licena, explcita ou implcita, por embargo ou outra forma, a quaisquer direitos de propriedade intelectual concedida por meio deste instrumento. Copyright 2014 Intel Corporation. Todos os direitos reservados. Intel, o logotipo Intel, Intel Atom, o logotipo Look Inside. e Xeon so marcas registradas da Intel Corporation nos Estados Unidos e/ou em outros pases. *Outros nomes e marcas podem ser considerados propriedades de terceiros.0614/RF/ME/PDF-USA 330278-001