¿Cuál es el nivel de conocimiento requerido de Python para leer el libro de raspado web de Ryan Mitchell?

Requiere el conocimiento de Python ya que todo el libro usa Beautiful Soup como tecnología Scraping. Y en otros lugares se habla de Selenium (con PhantomJs Webdriver) y el módulo de solicitudes. Todo esto se implementa en Python.

En caso de que sea nuevo en Python, pruebe estos tutoriales. Los conceptos explicados en estos son suficientes para Scraping.

Punto de tutorial de Python

Python – Codeacademy

Para Xpaths: –

Tutorial XPath

Yo diría que en lugar de leer este libro, prueba Scrapy. Scrapy tiene una amplia función que facilitará el rastreo. De lo que se habla en el libro es de la biblioteca de análisis, aún debe depender de otras bibliotecas, como peticiones, urllib, urllib2 para recuperar el contenido. Donde como estas cosas se abordan en Scrapy. Lo único es que puede que necesite escribir Xpath y ponerse en marcha.

Scrapy de un vistazo