Hive Presentacion

Embed Size (px)

Citation preview

  • 8/18/2019 Hive Presentacion

    1/3

    ¿Qué es?

    Hive es almacén de datos creado específicamente para Hadoop

    que nos facilita la tarea de sumarizar los datos pre-existentes en

    HDFS. La idea principal de Hive es la de funcionar como capa

    externa a Hadoop a modo de envoltorio, donde vamos a poderrealizar consultas sobre el sistema de archivos que serán tratadas

    como MapReduces en modo nativo en HDFS.

  • 8/18/2019 Hive Presentacion

    2/3

    Para poder realizar estas operaciones, los de pache crearon un

    len!ua"e de consultas a #$ase de datos# %recordemos que HDFS es

    un sistema de ficheros& muy similar a SQL, que denominaron

    HiveQL o HQL %dependiendo de en que li$ro lo leas lo verás de una

    manera u otra&.

    ¿Qué es?

  • 8/18/2019 Hive Presentacion

    3/3

     El corazón de esta idea se basa en el denominado MetaStore, que es un"lugar" donde se van a ir guardando toda la información relacionada con las

    operaciones en Hive,

    Características Principales