Porque aunque reinventar la rueda ocasionalmente puede ser divertido, generalmente es algo estúpido. La mayoría de los sistemas operativos (y sitios web) ahora usan UTF-8, de los cuales ASCII es un subconjunto, porque si no lo hicieran, el comercio internacional sería mucho más difícil. Las cadenas de caracteres ASCII se identifican fácilmente al visualizar un archivo binario; Unix tiene un comando “cadenas” para hacer eso automáticamente.
En años pasados. algunos sistemas operativos utilizan otras convenciones de codificación, por ejemplo, EBCDIC o Radix-50
para que este no fuera el caso.
Los archivos de texto sin formato no tienen metadatos o estilo, como los que se usan en texto enriquecido o en programas de procesamiento de texto como Office, de modo que una vez que el usuario conoce la codificación de caracteres (y posiblemente la convención de final de línea), el archivo puede leerse fácilmente.
Sin embargo, si un archivo UTF-8 de texto griego se ve en un terminal configurado en ISO-8859-7, o viceversa, será ilegible ya que los caracteres de 8 bits son diferentes. Dado que ASCII es un subconjunto de la mayoría de los juegos de caracteres ISO-8859, así como de UTF-8, el texto en inglés generalmente se puede leer independientemente de la configuración del terminal, aunque algunos procesadores de texto utilizan caracteres UTF más altos para la puntuación y pueden aparecer con caracteres impares entre palabras legibles
Por ejemplo, aquí hay un segmento de correo ruso no solicitado que recibí, visto en diferentes conjuntos de caracteres.
Terminal configurado correctamente en UTF-8:
Terminal configurado en ISO-8859-1:
Los nombres de archivo se pueden leer porque, en muchos casos, el programa de copia los cambiará automáticamente; si tuviera que ejecutar ftp entre una máquina EBCDIC y una máquina ASCII, vería nombres de archivo legibles desde ambos extremos.
Todavía hay casos como máquinas Windows más antiguas en las que “progra ~ 1” puede aparecer en algunos programas que usan restricciones de nombre de archivo de DOS y “Archivos de programa” en otro.
También hay problemas en Linux en los que un archivo transferido desde otro sistema incluye caracteres reservados: todavía se pueden usar, pero los caracteres deben escaparse o citarse. Por ejemplo, C: \ Users \ Joe \ My.doc se convierte en /home/Joe/My.doc pero
C: \ Users \ Joe \ My / first / paper; la versión 1.doc debe escribirse como / home / Joe / My / first \ / paper \; versión \ 1.doc. Además, My.doc y my.doc son el mismo archivo en Windows, pero diferentes en Unix, ya que la mayoría de los sistemas de archivos distinguen entre mayúsculas y minúsculas.