¿Cuál es la mejor manera de saber la cantidad total de palabras en un libro?

Si. Hay más de una forma de hacer esto.

  • La forma más simple de obtener el recuento de palabras es haciendo una búsqueda en Google de algo como “número de palabras en Infinite Jest”. Debería funcionar en muchos de los casos.
  • Alternativamente, puede ir a WolframAlpha y escribir el nombre del libro. Sin embargo, esto funciona solo en el caso de los clásicos y un subconjunto extremadamente pequeño del número total de trabajos disponibles. Por ejemplo, podría escribir algo como Número de palabras en Moby Dick o Número de palabras en Hamlet y obtener todo, desde la longitud promedio de las palabras hasta el número de palabras únicas. Utilice este método en lugar de buscar en Google obras conocidas.
  • Si tiene acceso al archivo de texto de todo el libro, es decir , si lo ha descargado de sitios como Gutenberg, obtener el recuento de palabras es tan simple como ejecutar un script simple . Incluso puede ejecutar scripts avanzados para obtener los n-gramos del texto dado.
  • Si está viendo la versión HTML del libro / si está leyendo un artículo en línea, puede obtener el recuento de palabras instantáneamente descargando una de las muchas extensiones de “recuento de palabras” disponibles para navegadores como Chrome o Firefox.

Si ninguno de ellos funciona, no hay otra manera que contarlos por aproximación.

Es posible que este procedimiento no pueda darle el número exacto de palabras, pero el error podría reducirse tanto como desee.

Suposiciones

  • Se usa la misma fuente y tamaño en toda la novela.
  • No cuenta las páginas que tienen mapas o ilustraciones gráficas.
  • El libro es “suficientemente” grande.
  1. Recolecte una muestra de líneas (no oraciones) de la novela. Las líneas deben elegirse preferiblemente de muchas partes diferentes de la novela. Para una mejor estimación de la respuesta final, el número de líneas de longitud ‘n’ en la muestra debe ser proporcional al número de líneas de longitud ‘n’ en la novela. La forma más fácil de garantizar todas estas cosas sería elegir líneas aleatorias de páginas aleatorias a lo largo de la novela.
  2. Cuente el número promedio de palabras en esas líneas. (deje que este número sea #wpl, es decir, palabras por línea).
  3. Cuente el número promedio de líneas por página (deje que este número sea #lpp, es decir, líneas por página. Dado que se supone que la fuente y el tamaño de la impresión son uniformes en toda la novela, no será muy malo decir que el número de líneas en cada página es igual. Si aún desea ser más preciso, obtenga el número promedio de líneas por página seleccionando al azar algunas páginas y calcule el número promedio de líneas por página).
  4. Deje que el número de páginas en el libro sea #p.
  5. La fórmula puede estimar el número de páginas del libro.

# páginas = #wpl X #lpp X #p.

El error en la respuesta se puede reducir tanto como desee. Tenga en cuenta que si elegimos todas las líneas como parte de nuestra muestra de líneas (viñeta 1.) obtendremos la respuesta exacta.

Podrías contar las palabras de una línea y multiplicarlas por el número de líneas en una página y luego multiplicar ese producto por el número de páginas.

et … total estimado
w … palabras en la línea de referencia
l … número de líneas en la página de referencia
p … número de páginas del libro

et = w * l * p

Hay aproximadamente 300 palabras por página, así que simplemente verifique el número de páginas y multiplique por 300.

En términos generales, los libros publicados tienen (en promedio) alrededor de 250 palabras por página.

Cuente las palabras en una página típica y multiplique por el número de páginas. Es posible que desee reducir un poco el número de páginas si hay espacios en blanco o páginas parciales en los títulos de los capítulos.

Si puede encontrar una copia del libro en el Proyecto Gutenberg, descargue la versión de texto sin formato y ejecútela a través del comando wc de UNIX.