La mayoría de los archivos de texto se almacenan utilizando caracteres ASCII; cada carácter se codifica con un byte (8 bits). Esto quiere decir que podremos tener un máximo de 256 personajes diferentes. Esto no es un problema en la mayoría de los entornos de habla inglesa, pero se convierte en un problema una vez que comienzas a codificar caracteres en diferentes idiomas.

 

Unicode es un estándar para codificar caracteres que intenta abordar el problema de codificar todos los caracteres internacionales posibles en un formato único y unificado.

 

Como ocurre con la mayoría de los estándares, hay varios sabores para elegir. V admite UCS-2 y UTF-8. (Consulte la nota a continuación sobre UTF-16)

 

Indicador de la barra de estado

 

V detectará automáticamente la mayoría de los archivos Unicode y los mostrará en consecuencia, incluidos los archivos con caracteres extranjeros. UNI Se mostrará en la barra de estado para indicar que el archivo es un archivo Unicode. ANS (para ANSI) se mostrará en la barra de estado cuando el archivo no sea un archivo Unicode.

 

If V no adivina la codificación correcta, puede hacer clic en el UNI/ANS indicador en la barra de estado y seleccione la codificación correcta (suponiendo que sepa cuál es).

 

Sustitución de fuentes

 

V no admite la sustitución de fuentes (o reserva de fuentes). En la sustitución de fuentes, si la fuente seleccionada no contiene un carácter en particular, el programa intentará usar otra fuente para mostrar ese carácter. Desde V no realiza sustitución de fuentes, es muy importante utilizar una fuente que contenga todos los caracteres que se mostrarán. En particular, la norma Mensajería La fuente no debe usarse para mostrar archivos Unicode. Courier New debe usarse en su lugar.

 

UCS-2 frente a UTF-16

 

Estrictamente hablando V no es totalmente compatible con UTF-16; sólo es compatible con UCS-2 (que es el predecesor obsoleto de UTF-16).

 

UCS-2 es una codificación de longitud fija que codifica todos los caracteres en un valor de 16 bits (de 0 a FFFF). UTF-16 es una codificación de longitud variable capaz de codificar toda la gama de caracteres Unicode. En particular, UTF-16 se puede utilizar para codificar caracteres mayores que FFFF.

 

Sin embargo, en la mayoría de los casos, UCS-2 y UTF-16 son idénticos. Si los usuarios encuentran algún problema al ver archivos Unicode, comuníquese con [email protected] (preferiblemente adjuntando una copia del archivo Unicode).

 

 

Notas

 

V no es compatible con UTF-32

 

V no admite visualización RTL (de derecha a izquierda)