¿Cuál es el mejor libro para estudiar Hadoop?

A continuación se muestra la lista de los mejores libros de Big Data y Hadoop:
a. Hadoop: la guía definitiva de Tom White (leer en http://amzn.to/2ksU84S )
Este es el mejor libro para que los principiantes aprendan a Hadoop a ser desarrolladores de Hadoop y administradores de Hadoop. El lenguaje es bastante fácil y cubre conceptos de Hadoop y su ecosistema junto con características de Hadoop2.x como YARN, HA, etc. Aprenderá cómo desarrollar y mantener sistemas confiables y escalables de múltiples nodos con Apache Hadoop y cómo analizar grandes conjuntos de datos con él. .

si. Hadoop para Dummies por Dirk Deroos (leer en http://amzn.to/2ksObFf )
Este libro es fácil de leer y entender. Hace que los lectores comprendan el valor de Big data y cubre conceptos como el origen de Hadoop. su funcionalidad y beneficios y pocas aplicaciones prácticas de Big Data. También cubre el ecosistema de Hadoop y los programas Map Reduce y muestra cómo las aplicaciones de Hadoop se pueden usar para minería de datos, resolución de problemas y análisis de datos y cómo evitar dificultades comunes al desarrollar el clúster de Hadoop.

C. Hadoop en acción por Chuck Lam (leer en http://amzn.to/2jeFzgg )
Proporciona una introducción a las terminologías y programación de Hadoop en Map Reduce, comenzando con ejemplos sencillos y avanzando gradualmente para mostrar el uso de Hadoop en tareas complejas de análisis de datos. Cubre las mejores prácticas y patrones de diseño de la programación de Map Reduce.

re. Operaciones de Hadoop por Eric Sammers (leer en http://amzn.to/2ksQ7xm )
Este libro le explicará los métodos para mantener grupos de Hadoop grandes y complejos. Hay capítulos dedicados para el mantenimiento de Hadoop, monitoreo, copias de seguridad, resolución de problemas en Hadoop, etc. para realizar estas tareas de manera eficiente. También cubre todos los componentes de Hadoop para ser un ingeniero de Big Data.

mi. Patrones de diseño de reducción de mapas: creación de algoritmos y análisis efectivos para Hadoop por Donald Miner (leer en http://azon.ly/0qXD )
Este libro asume que el lector tiene un conocimiento básico de Hadoop y está dispuesto a dominar los algoritmos de Map Reduce. Describe varias aplicaciones de Map Reduce con Hadoop y varios métodos para resolver problemas de Hadoop rápidamente y explica las técnicas para la optimización de Map Reduce.

F. Programming Pig de Alan Gates (leer en http://azon.ly/qn5s )
Este es el mejor libro para aprender Apache Pig – componente del ecosistema Hadoop para procesar datos utilizando scripts de Pig Latin. Proporciona conocimientos básicos para avanzar de nivel en Pig, incluido Pig Latin Scripting Language, Grunt Shell y funciones definidas por el usuario para extender Pig. También aprenderá cómo Pig convierte estos scripts en programas Map Reduce para trabajar eficientemente en Hadoop.

g Apache Sqoop Cookbook por Kathleen Ting y Jarek Jarcec Cecho (leer en http://azon.ly/bpwJ )
Es una guía de usuario para Apache Sqoop – componente del ecosistema Hadoop para transferir datos entre RDBMS y Hadoop. Se centra en la aplicación de parámetros que proporciona la interfaz de línea de comandos. Proporciona un mecanismo de cómo transferir datos masivos de RDBMS a HDFS y viceversa de manera eficiente.

h. Programming Hive por Dean Wampler, Edward Capriolo y Jason Rutherglen (leer en http://azon.ly/bHnh )
Esta guía completa lo presenta a Apache Hive – Infraestructura de almacenamiento de datos Hadoop. Le ayudará a aprender el dialecto SQL de Hive: Hive QL para resumir, consultar y analizar grandes conjuntos de datos almacenados en HDFS.

yo. HBase: la guía definitiva de Lars George (leer en http://azon.ly/mjIA )
Cubre todos los aspectos de Apache HBase de manera muy detallada. Cubre los conceptos de HBase desde lo básico hasta el nivel avanzado y explica cómo HBase puede ayudarlo a proporcionar una solución de almacenamiento escalable para acomodar datos prácticamente infinitos.

j. Usando Flume por Hari Shreedharan (leer en http://azon.ly/W2aK )
A través de esta guía, aprenderá las características de Apache Flume para recopilar, agregar y escribir grandes conjuntos de datos en HDFS, HBase, etc. Muestra cómo configurar, implementar y monitorear el clúster Flume y cómo escribir complementos Flume para casos de uso. Le ayudará a explorar las API para enviar datos a los agentes Flume desde sus propias aplicaciones.

Hoy Hadoop es la palabra de moda más grande en la industria. Todas y cada una de las personas buscan hacer un cambio de carrera en esta tecnología emergente y de tendencia Apache Hadoop.

Para aprender Hadoop en detalle, es obligatorio elegir un buen libro.
Aquí está mi recomendación para algunos de los mejores libros para aprender Hadoop y su ecosistema. Algunos de ellos son libros de Hadoop para principiantes, mientras que otros son para programadores de Map Reduce y Big Data desarrolladores para obtener más conocimiento. A continuación se muestra el enlace de los libros de Hadoop. Estos libros te ayudarán a aprender Hadoop desde cero para avanzar de nivel.

  • Lista de libros de Apache Hadoop

a. Hadoop – La guía definitiva por Tom White

si. Hadoop para Dummies por Dirk Deroos

C. Hadoop en acción por Chuck Lam

re. Operaciones de Hadoop por Eric Sammers

mi. Patrones de diseño de reducción de mapas: creación de algoritmos y análisis efectivos para Hadoop por Donald Miner

  • Guía de defensa de Hadoop
  • Hadoop: la guía definitiva
  • Hadoop en la práctica
    • Hadoop en la práctica
  • Operaciones de Hadoop
    • Operaciones de Hadoop
  • Learning HBase
    • Shashwat Shriparv: Amazon.es: tienda Kindle

    En orden según mi opinión. y además de la guía de defensa, http://hadoop.apache.com es un lugar demasiado increíble para aprender.

    La guía definitiva de hadoop es el mejor libro con contenido detallado.

    Explicó muy bien la arquitectura hadoop.

    Además de este libro, hay muchos libros disponibles en línea, pero sugeriría que no pierda el tiempo buscando diferentes libros o contenido en línea y que solo se quede con 1 libro.

    Para su práctica, hay muchos conjuntos de datos disponibles en línea de forma gratuita que puede descargar y usar en la máquina virtual (CDH) proporcionada por cloudera de forma gratuita que contiene la configuración de hadoop.

    http://ACDGILD.com contiene muchos proyectos de muestra para practicar.

    También en Your Home for Data Science puede encontrar muchos conjuntos de datos con casos de uso que son muy útiles para comenzar.

    Feliz aprendizaje..!!!

    Puede aprender de Hadoop en acción o la guía definitiva sobre Hadoop. Estos son uno de los mejores recursos. Consulte siempre el sitio web de Apache Hadoop, ya que hay muchas actualizaciones nuevas.

    Mi entrenador sugirió dos libros. Uno es HADOOP FOR DUMMIES, que es fácil de leer y otro es la GUÍA DEFINITIVA DE HADOOP: 4ª edición que es bastante difícil de entender pero que vale la pena pasar el tiempo. Ambos están disponibles en Amazon.

    Gracias por A2A

    Me referí a ‘Hadoop, la guía definitiva’ y te sugiero esto. También puede referirse a ‘Hadoop en acción’

    Hadoop: la guía definitiva de Tom White

    Operaciones de Hadoop por Eric Sammer

    Comience con el libro de cocina de Hadoop para que tenga una idea sobre el marco, luego puede saltar a la guía definitiva de Hadoop de Tom white.