¿Cuál es el mejor libro de aprendizaje automático en Python en tu opinión?

1) Programación de Inteligencia Colectiva: Creación de aplicaciones Web 2.0 inteligentes – Toby Segaran

Esta fue en realidad mi primera introducción adecuada al aprendizaje automático en Python. Tengo una copia de la primera edición de este libro y la usé originalmente para las aplicaciones de análisis de consumo que trata. Este libro es realmente adecuado para aquellos que desean ver exactamente cómo se implementan los algoritmos de aprendizaje automático (en Python puro) en lugar de que se les enseñe cómo usar una biblioteca en particular.

El libro cubre una amplia variedad de temas y dominios. En particular, hay secciones sobre recomendación, agrupamiento, búsqueda / clasificación, optimización, árboles de decisión, máquinas de vectores de soporte, detección de características y programación genética. A pesar de que este libro está menos directamente relacionado con las finanzas cuantitativas, creo que es uno de los mejores aquí para aprender el proceso de aprendizaje automático. Definitivamente vale la pena recogerlo.

2) Construcción de sistemas de aprendizaje automático con Python – Willi Richert, Luis Pedro Coelho

Este libro entra en detalles significativos sobre cómo usar scikit-learn para las tareas de regresión y clasificación. Además de una amplia cobertura en scikit-learn, en realidad considera otras bibliotecas como gensim (para el modelado de temas). El libro pasa una cantidad razonable de tiempo mirando la clasificación basada en texto y el análisis de sentimientos, que se está convirtiendo en un tema candente en el comercio cuantitativo, ya que las personas y los fondos intentan formar estrategias que pueden comerciar en función del sentimiento de las redes sociales.

El libro también considera la regresión en un escenario de recomendación, que si bien es interesante por derecho propio, probablemente sea más aplicable a los científicos de datos e ingenieros de análisis de consumidores.

3) Aprendizaje scikit-learn: Machine Learning en Python – Raúl Garreta, Guillermo Moncecchi

Este es un libro bastante corto en comparación con algunos de los otros. Recomendaría este a las personas que se sienten cómodas codificando en Python y que han tenido una exposición básica a NumPy y Pandas, pero que desean ingresar rápidamente al aprendizaje automático. Cubre algo más que la documentación de scikit-learn, pero realmente no diferencia entre los componentes matemáticos de cada algoritmo y, por lo tanto, es un poco más como un libro de recetas básico de aprendizaje automático. Sin embargo, esto puede ser atractivo para aquellos que solo quieren “sumergirse”.

4) Aprendizaje automático en acción – Peter Harrington

Este libro se divide en tres áreas principales: clasificación supervisada, regresión supervisada y métodos no supervisados ​​(como la reducción de la dimensionalidad). Entra en muchos detalles sobre estos temas, con comparaciones entre muchos algoritmos diferentes. El libro está algo más orientado matemáticamente que los libros anteriores discutidos anteriormente, por lo que esto puede resultar atractivo para los programadores de Python que tienen antecedentes en matemática aplicada.

El libro también considera el campo emergente de “big data” al presentar Hadoop, MapReduce y Amazon Web Services (AWS). Esto puede ser apropiado para algunas empresas financieras cuantitativas que también utilizan datos de consumo o basados ​​en Internet para llevar a cabo sus algoritmos comerciales.

5) Aprendizaje automático: una perspectiva algorítmica – Stephen Marsland

Este libro está en el extremo más orientado matemáticamente del espectro de aprendizaje automático de Python. Cubre temas no discutidos en los libros anteriores, como Neural Networks, Hidden Markov Models y Markov Chain Monte Carlo. A pesar del enfoque matemático, todavía hay mucho código Python y, por lo tanto, el libro puede leerse “en la computadora”.

Si bien el libro cubre mucho terreno matemáticamente, es probable que necesite complementarlo con un libro sobre métodos estadísticos como Elementos de aprendizaje estadístico. También necesitará tener una comprensión básica de las estadísticas bayesianas, ya que muchos de los métodos en este libro tocan esta área.