Requiere el conocimiento de Python ya que todo el libro usa Beautiful Soup como tecnología Scraping. Y en otros lugares se habla de Selenium (con PhantomJs Webdriver) y el módulo de solicitudes. Todo esto se implementa en Python.
En caso de que sea nuevo en Python, pruebe estos tutoriales. Los conceptos explicados en estos son suficientes para Scraping.
Punto de tutorial de Python
Python – Codeacademy
- ¿Cuáles son algunos libros excelentes sobre cómo lograr sueños profesionales? Estoy buscando un libro de una gran figura conocida, no del tipo de 1 minuto para el éxito.
- ¿Cuántos libros debo leer al mes para estar al nivel de un lector voraz?
- ¿Qué novelas debería leer en la vida una vez?
- ¿Cuáles son los libros esenciales sobre el suicidio?
- ¿Cuáles son algunos buenos libros? (Preferiblemente fantasía, pero no tiene que serlo y el adulto joven también es bueno)
Para Xpaths: –
Tutorial XPath
Yo diría que en lugar de leer este libro, prueba Scrapy. Scrapy tiene una amplia función que facilitará el rastreo. De lo que se habla en el libro es de la biblioteca de análisis, aún debe depender de otras bibliotecas, como peticiones, urllib, urllib2 para recuperar el contenido. Donde como estas cosas se abordan en Scrapy. Lo único es que puede que necesite escribir Xpath y ponerse en marcha.
Scrapy de un vistazo