¿Qué significa “separador de palabras” en un trabajo de investigación, y cómo deben tratarse los “separadores de palabras” para mantener los estándares de publicación?

Un separador de palabras es un componente en un sistema de indexación de texto que divide el texto en varias palabras para indexar y buscar. Un ejemplo en inglés es la palabra “base de datos”, que un separador de palabras podría dividir en “base de datos”. Los separadores de palabras son especialmente importantes para los idiomas que se escriben sin espacios entre palabras, como el japonés y el chino. Me está costando entender qué tendría que ver un separador de palabras con los estándares de publicación, ya que es un procedimiento aplicado a los documentos existentes.

[Nota: También existe un problema relacionado con el “Salto de palabras” que a menudo se usa como ejemplo para las técnicas de programación dinámica. En ese problema, se le da una cadena de letras sin espacios, como

“Muchas palabras se unen”

y tienes que averiguar si puedes insertar espacios para obtener una secuencia de palabras en inglés (o cualquier idioma):

“Muchas palabras pegadas”.

Una solución recursiva simple puede terminar resolviendo el mismo subproblema varias veces, mientras que las soluciones de programación dinámica recuerdan (o calculan previamente) la respuesta a los subproblemas.]

Mi mejor conjetura es que se refiere a la separación silábica al final de las líneas, pero nunca antes había escuchado el término.

Los editores generalmente tienen guías de estilo en sus sitios web que analizan (generalmente en detalle) cómo les gustaría que se vieran los manuscritos. Sus formatos preferidos varían.