Me pidieron que clasificara un conjunto de 3000 libros (pdf y otros). ¿Cuál es la forma más inteligente de hacer eso? ¿Alguna herramienta que pueda ayudar?

No hay suficiente información para una respuesta real …

Respuesta corta: pregunte a un bibliotecario u otro especialista en recuperación de información.

Respuesta media:

Es realmente importante comprender el propósito por el que se los clasifica y cuán similares son en el tema.

¿Quizás es tan simple como separar la ficción de la no ficción y alfabetizar por primer autor?

Los documentos técnicos a menudo tienen resúmenes o listas de palabras clave que pueden indexarse.

Copiar catalogación: si se trata de trabajos publicados con una amplia variedad, puede acceder a la información de catalogación de ellos de organizaciones que brindan este servicio a las bibliotecas ($) o desde el catálogo de una biblioteca grande (gratis). Esta información puede ser aumentada para necesidades especiales por un especialista en catalogación.

Si el material aún no está publicado, la colección está enfocada en su alcance, o las necesidades de recuperación están especializadas y luego la clasificación personalizada.

La clasificación personalizada por expertos es costosa. Hace algunos años, recuerdo haber escuchado que el costo de la catalogación original de un nuevo libro en una gran biblioteca universitaria era de alrededor de $ 50 por libro.

Si todos los libros están en formato electrónico, es un software que los agrupará automáticamente por similitud o los buscará. Si se imprimen algunos, se requiere un reconocimiento de texto preciso ($).

Los libros técnicos a menudo tienen listas de palabras clave o resúmenes de los que se pueden extraer palabras clave para un índice simple.

Quizás un índice de texto completo para los libros funcionaría. Algunos productos (Adobe, Microsoft, …) tienen esto incorporado y podría funcionar para usted y probablemente requiera un experto en ese producto para configurarlo correctamente si se debe compartir el acceso.

Si tiene acceso a una gran cantidad de libros ya clasificados para satisfacer sus necesidades, el software puede clasificar sus libros por similitud con los libros de las categorías existentes.

Ninguna de estas herramientas para la clasificación personalizada es “dispara y olvida”. Se requiere un experto para ajustar su operación a sus necesidades y generar resultados utilizables.

Resumen: a menos que las necesidades de recuperación sean muy simples, necesita un experto y la solución puede ser muy costosa.


Es difícil de decir sin más detalles y una idea clara de sus necesidades. Pero si sus necesidades no son demasiado exigentes, puede probar un programa de catálogo como Data Crow – Cataloger (catalogación general) o calibre – Gestión de libros electrónicos (específicamente para libros electrónicos, aunque también podría evitarlo para administrar las fuentes de impresión).

More Interesting