1- Principios de minería de datos (computación adaptativa y aprendizaje automático)
Principios de minería de datos (Computación adaptativa y aprendizaje automático): David J. Hand, Heikki Mannila, Padhraic Smyth: 9780262082907: Amazon.com: Libros
El creciente interés en la minería de datos está motivado por un problema común en todas las disciplinas: ¿cómo se almacena, accede, modela y finalmente describe y comprende conjuntos de datos muy grandes? Históricamente, diferentes aspectos de la minería de datos han sido abordados independientemente por diferentes disciplinas. Este es el primer texto verdaderamente interdisciplinario sobre minería de datos, que combina las contribuciones de la ciencia de la información, la informática y las estadísticas.
El libro consta de tres secciones. El primero, fundamentos, proporciona una visión general tutorial de los principios subyacentes a los algoritmos de minería de datos y su aplicación. La presentación enfatiza la intuición más que el rigor. La segunda sección, algoritmos de minería de datos, muestra cómo se construyen los algoritmos para resolver problemas específicos de una manera basada en principios. Los algoritmos cubiertos incluyen árboles y reglas para clasificación y regresión, reglas de asociación, redes de creencias, modelos estadísticos clásicos, modelos no lineales como redes neuronales y modelos locales “basados en memoria”. La tercera sección muestra cómo se ajusta todo el análisis anterior cuando se aplica a problemas de minería de datos del mundo real. Los temas incluyen la función de los metadatos, cómo manejar los datos faltantes y el preprocesamiento de datos.
2- Hadoop: la guía definitiva
Hadoop: la guía definitiva: Tom White: 9781491901632: Amazon.com: Libros
Prepárese para desbloquear el poder de sus datos. Con la cuarta edición de esta guía completa, aprenderá a construir y mantener sistemas confiables, escalables y distribuidos con Apache Hadoop. Este libro es ideal para programadores que buscan analizar conjuntos de datos de cualquier tamaño y para administradores que desean configurar y ejecutar clústeres de Hadoop.
Usando Hadoop 2 exclusivamente, el autor Tom White presenta nuevos capítulos sobre YARN y varios proyectos relacionados con Hadoop como Parquet, Flume, Crunch y Spark. Aprenderá sobre los cambios recientes en Hadoop y explorará nuevos estudios de caso sobre el papel de Hadoop en los sistemas de atención médica y el procesamiento de datos genómicos.
- Aprenda componentes fundamentales como MapReduce, HDFS y YARN
- Explore MapReduce en profundidad, incluidos los pasos para desarrollar aplicaciones con él
- Configure y mantenga un clúster de Hadoop que ejecute HDFS y MapReduce en YARN
- Aprenda dos formatos de datos: Avro para la serialización de datos y Parquet para datos anidados
- Use herramientas de ingestión de datos como Flume (para la transmisión de datos) y Sqoop (para la transferencia de datos a granel)
- Comprenda cómo funcionan las herramientas de procesamiento de datos de alto nivel como Pig, Hive, Crunch y Spark con Hadoop
- Conozca la base de datos distribuida de HBase y el servicio de configuración distribuida de ZooKeeper
3- Ciencia de datos para empresas: lo que necesita saber sobre minería de datos y pensamiento analítico de datos
Amazon.com: Data Science for Business: lo que necesita saber sobre la minería de datos y el pensamiento electrónico de análisis de datos eBook: Foster Provost, Tom Fawcett: Kindle Store
Escrito por los renombrados expertos en ciencia de datos Foster Provost y Tom Fawcett, Data Science for Business presenta los principios fundamentales de la ciencia de datos y lo guía a través del “pensamiento analítico de datos” necesario para extraer conocimiento útil y valor comercial de los datos que recopila. Esta guía también lo ayuda a comprender las muchas técnicas de minería de datos que se utilizan actualmente.
4- Big Data: principios y mejores prácticas de sistemas de datos escalables en tiempo real
Big Data: Principios y mejores prácticas de sistemas de datos escalables en tiempo real: Nathan Marz, James Warren: 9781617290343: Amazon.com: Libros
Big Data le enseña a construir sistemas de big data utilizando una arquitectura que aprovecha el hardware en clúster junto con nuevas herramientas diseñadas específicamente para capturar y analizar datos a escala web. Describe un enfoque escalable y fácil de entender para los sistemas de big data que un pequeño equipo puede crear y ejecutar. Siguiendo un ejemplo realista, este libro guía a los lectores a través de la teoría de los sistemas de big data, cómo implementarlos en la práctica y cómo implementarlos y operarlos una vez que están construidos.
5- Análisis de datos hecho accesible
Amazon.com: Análisis de datos accesible eBook: Anil Maheshwari: Tienda Kindle
Este libro llena la necesidad de un libro conciso y conversacional sobre el creciente campo de Data Analytics y Big Data. Fácil de leer e informativo, este libro lúcido cubre todo lo importante, con ejemplos concretos, e invita al lector a unirse a este campo. Los capítulos del libro están organizados para un curso típico de un semestre.
6- Data Smart: uso de la ciencia de datos para transformar la información en información
Amazon.com: Data Smart: uso de la ciencia de datos para transformar la información en un libro electrónico Insight: John W. Foreman: Kindle Store
Data Science es arrojado a la prensa como si fuera magia. Los principales minoristas predicen todo, desde cuando sus clientes están embarazadas hasta cuando quieren un nuevo par de Chuck Taylors. Es un mundo nuevo y valiente donde los datos aparentemente sin sentido se pueden transformar en información valiosa para impulsar decisiones comerciales inteligentes.
7- Minería en la red social: minería de datos en Facebook, Twitter, LinkedIn, Google+, GitHub y más
Mining the Social Web: Minería de datos en Facebook, Twitter, LinkedIn, Google+, GitHub y más: Matthew A. Russell: 9781449367619: Amazon.com: Libros
¿Cómo puede aprovechar la gran cantidad de datos de redes sociales para descubrir quién está haciendo conexiones con quién, de qué están hablando y dónde se encuentran? Con esta edición ampliada y completamente revisada, aprenderá cómo adquirir, analizar y resumir datos de todos los rincones de la web social, incluidos Facebook, Twitter, LinkedIn, Google+, GitHub, correo electrónico, sitios web y blogs.
8- Los elementos del aprendizaje estadístico: minería de datos, inferencia y predicción, segunda edición (Serie Springer en estadística)
Amazon.com: The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition (Springer Series in Statistics) (9780387848570): Trevor Hastie, Robert Tibshirani, Jerome Friedman: Books
Durante la última década ha habido una explosión en la informática y la tecnología de la información. Con esto han llegado grandes cantidades de datos en una variedad de campos como la medicina, la biología, las finanzas y el marketing. El desafío de comprender estos datos ha llevado al desarrollo de nuevas herramientas en el campo de la estadística, y ha generado nuevas áreas como la minería de datos, el aprendizaje automático y la bioinformática. Muchas de estas herramientas tienen bases comunes, pero a menudo se expresan con una terminología diferente. Este libro describe las ideas importantes en estas áreas en un marco conceptual común.
9- Minería de datos: conceptos y técnicas, segunda edición (serie Morgan Kaufmann en sistemas de gestión de datos)
Data Mining: Concepts and Techniques, Second Edition (The Morgan Kaufmann Series in Data Management Systems): 9781558609013: Computer Science Books @ Amazon.com
Nuestra capacidad para generar y recopilar datos ha aumentado rápidamente. No solo todas nuestras transacciones comerciales, científicas y gubernamentales ahora están informatizadas, sino que el uso generalizado de cámaras digitales, herramientas de publicación y códigos de barras también genera datos. En el lado de la colección, las plataformas de texto e imágenes escaneadas, los sistemas de sensores remotos satelitales y la World Wide Web nos han inundado con una enorme cantidad de datos. Este crecimiento explosivo ha generado una necesidad aún más urgente de nuevas técnicas y herramientas automatizadas que puedan ayudarnos a transformar estos datos en información y conocimiento útiles.
10- Técnicas de minería de datos: para marketing, ventas y gestión de relaciones con clientes
Técnicas de minería de datos: para marketing, ventas y gestión de la relación con el cliente: Gordon S. Linoff, Michael JA Berry: 9780470650936: Amazon.com: Libros
¡El libro introductorio líder en minería de datos, totalmente actualizado y revisado!
Cuando Berry y Linoff escribieron la primera edición de Técnicas de minería de datos a fines de la década de 1990, la minería de datos apenas comenzaba a salir del laboratorio a la oficina y desde entonces se ha convertido en una herramienta indispensable para los negocios modernos. Esta nueva edición, más del 50% nueva y revisada, es una actualización significativa de la anterior, y le muestra cómo aprovechar los métodos y técnicas de minería de datos más nuevos para resolver problemas comerciales comunes. El dúo de autores sin paralelo comparte consejos invaluables para mejorar las tasas de respuesta a campañas de marketing directo, identificar nuevos segmentos de clientes y estimar el riesgo de crédito. Además, cubren temas más avanzados, como la preparación de datos para el análisis y la creación de la infraestructura necesaria para la minería de datos en su empresa.
11-Ciencia de datos desde cero: primeros principios con Python
Ciencia de datos desde cero: primeros principios con Python 1, Joel Grus, eBook – Amazon.com
Las bibliotecas, los marcos, los módulos y los kits de herramientas de ciencia de datos son excelentes para hacer ciencia de datos, pero también son una buena manera de sumergirse en la disciplina sin comprender realmente la ciencia de datos. En este libro, aprenderá cuántas de las herramientas y algoritmos de ciencia de datos más fundamentales funcionan al implementarlos desde cero .
Si tiene aptitudes para las matemáticas y algunas habilidades de programación, el autor Joel Grus lo ayudará a sentirse cómodo con las matemáticas y las estadísticas en el núcleo de la ciencia de datos, y con las habilidades de pirateo que necesita para comenzar como científico de datos. El desorden de datos desordenado de hoy contiene respuestas a preguntas que nadie pensó hacer. Este libro le proporciona los conocimientos para extraer esas respuestas.