lunes, 12 de enero de 2015

Idioma para programas no Unicode en Windows, un espectro innecesariamente abarcativo

Desde Windows 2000 o puede que incluso NT 4, al estar íntegramente basados en Unicode, por razones de compatibilidad hacia atrás con programas diseñados para sistemas anteriores con juegos de caracteres distintos según el idioma (en la práctica la línea de Windows domésticos hasta aparecido XP que de alguna manera buscó unificar ese mercado y el empresarial), en la configuración regional existe una configuración regional del sistema hoy llamada Idioma para programas no Unicode que, precisamente, permite especificar el juego de caracteres al que habrán de recurrir estos programas.

Tanto por la posibilidad que supone de usar muchos programas antiguos como por las ventajas que dicha retrocompatibilidad representa si un desarrollador desea reciclar código, no me opongo a su existencia. ¿Pero es en verdad necesario un espectro de variantes idiomáticas tan amplio? En cuanto a formatos, ese espectro procura ofrecer predefinidas las configuraciones de cómo expresar o separar horas, fechas, monedas, medidas etc. según el país que se escoja; las alfabetizaciones tradicional e internacional existentes para nuestro idioma, por otra parte, establecen el modo de ordenación alfabética al incluir o no el dígrafo /ch como letra independiente antes de la d. Para el caso del idioma para programas no Unicode cuya selección incide en el juego de caracteres que se emplea para éstos, no obstante, tanta disponibilidad de variantes no tiene sentido sino en unos pocos idiomas entre los que no está el español.

Incluso en las épocas en que Windows no estaba basado en Unicode o dicho más propiamente la rama NT estaba tan solo enfocada a las empresas, la versión en español era una sola. A pesar de la existencia de la Compatibilidad multilingüe cual componente de instalación opcional para mostrar textos en idiomas con otros juegos de caracteres (p. ej. de alfabetos no latinos), el juego de caracteres base estaba definido por el idioma en que se instalaba el SO. Entre la inexistencia de MUI y la mencionada disponibilidad de una única versión en español, el idioma para el caso que nos ocupa siempre era español (España, alfab. internacional) y, como para la mayoría de idiomas europeo-occidentales, el juego de caracteres Windows-1252.
Comprendido esto, configurar en los Windows actuales este idioma en una variante de español distinta de la predeterminada (Argentina, Bolivia, Chile, Ecuador, Estados Unidos o cualquier otra) no importa sino problemas, porque ningún programa no Unicode en español que además de en la familia NT pretenda funcionar desde el punto de vista idiomático igual de bien que en Windows 9x/ME podrá hacerlo con una configuración distinta de la alfabetización internacional. Desconozco a qué conjunto(s) de caracteres dirigen las otras variantes, porque para el caso del inglés cualquiera que se seleccione es completamente compatible con las otras y, si nos ponemos a pensar en que los caracteres del español son los mismos en todo el mundo y por lo tanto no precisan de múltiples juegos de caracteres, nuestras variantes también deberían serlo.

Para ejemplificar el problema con algo que podemos ver a diario, no hay nada mejor que los archivos de ayuda en HTML compilados que incluyen muchos programas, aquellos famosos con la extensión .chm que a la izquierda ofrecen los contenidos y a la derecha, con diseño cual página web (por algo es ayuda en HTML). Es un formato que viene de arrastre desde Windows 98 del que Microsoft ha intentado deshacerse, pese a lo cual continúa siendo harto utilizado. El problema que ataña al tópico que nos ocupa es que, al no ser su visualizador completamente compatible con Unicode, para que los títulos y otras peculiaridades menos importantes se muestren bien al ser en idiomas diferentes del inglés, se deben haber creado en el mismo idioma que el establecido en el sistema del usuario para programas no Unicode. Como la inmensa mayoría se crea por todo lo discutido en español internacional, quien tenga este valor establecido en otra variante sólo verá como título HTML Help.
Desde el punto de vista de traductores y creadores de contenido, el programa HTML Help Workshop de la propia Microsoft y gratuito que crea archivos en este formato establece por omisión el idioma del proyecto en el establecido en la configuración regional para los formatos que, como se ve en el propio diálogo de Windows, nada tiene que ver con el estudiado en esta entrada. ¿Qué pasa entonces si el contenido lo crea o traduce un argentino cuyo sistema usa formatos de aquel país y antes de compilar se olvida de cambiar en las opciones del proyecto el idioma a español internacional? Pues que los usuarios de otros países, sea que tengan el idioma para programas no Unicode en español internacional o en el propio de sus países, no verán el título y otras cosas fuera del contenido HTML no se les mostrarán correctamente.

Reflexionado esto, resulta claro que para la mayoría de idiomas sería más adecuado que al establecer esta configuración aparezcan sin variantes, lo cual además de facilitar la búsqueda del deseado evitaría problemas de compatibilidad. Ofrecer variantes para escoger el idioma de esta configuración sólo tiene sentido respecto de idiomas que por tener diferentes alfabetos requieren múltiples juegos de caracteres, tales como el servio que puede tener alfabeto latino o cirílico, o los chinos simplificado y tradicional. Ni siquiera es necesario ofrecer variantes portuguesa y brasileña para el portugués porque, si bien por las diferencias ortográficas se ofrecen traducciones de las interfaces en las dos, los caracteres y por ende el juego de caracteres que se utilizan son los mismos.

Mi consejo, pues, es que si cambiaron esta configuración la vuelvan a establecer en español con alfabetización internacional. Hacerlo, por fortuna, no incide en las configuraciones ordinarias de ubicación y formatos. Es cierto que Windows peca de servicial y si no la tenemos agrega una distribución de teclado del idioma que elegimos, pero de no necesitarse se quita sin más, ya que en realidad lo que se haga con las distribuciones de teclado y demás métodos de entrada no afecta en nada a otras configuraciones.

No hay comentarios.:

Publicar un comentario