¿Qué son las codificaciones de caracteres como ANSI y Unicode, y en qué se diferencian?

Sep 28, 2025
Nube e Internet
CONTENIDO NO CUBIERTO

ASCII, UTF-8, ISO-8859 ... Es posible que hayas visto estos extraños apodos flotando, pero ¿qué significan realmente? Siga leyendo mientras explicamos qué es la codificación de caracteres y cómo se relacionan estos acrónimos con el texto sin formato que vemos en la pantalla.

Bloques de construcción fundamentales

Cuando hablamos de lenguaje escrito, hablamos de que las letras son los componentes básicos de las palabras, que luego construyen oraciones, párrafos, etc. Las letras son símbolos que representan sonidos. Cuando hablas de lenguaje, estás hablando de grupos de sonidos que se unen para formar algún tipo de significado. Cada sistema de lenguaje tiene un conjunto complejo de reglas y definiciones que gobiernan esos significados. Si tiene una palabra, es inútil a menos que sepa de qué idioma proviene y la use con otras personas que hablan ese idioma.

(Comparación de guiones de Grantha, Tulu y malayalam, imagen de Wikipedia )

En el mundo de las computadoras, usamos el término "personaje". Un carácter es una especie de concepto abstracto, definido por parámetros específicos, pero es la unidad fundamental de significado. La "A" latina no es lo mismo que un "alfa" griego o un "alif" árabe porque tienen contextos diferentes, son de diferentes idiomas y tienen pronunciaciones ligeramente diferentes, por lo que podemos decir que son caracteres diferentes. La representación visual de un carácter se denomina "glifo" y los diferentes conjuntos de glifos se denominan fuentes. Los grupos de personajes pertenecen a un "conjunto" o un "repertorio".

Cuando escribe un párrafo y cambia la fuente, no está cambiando los valores fonéticos de las letras, está cambiando su apariencia. Es solo cosmético (¡pero no sin importancia!). Algunos idiomas, como el antiguo egipcio y el chino, tienen ideogramas; estos representan ideas completas en lugar de sonidos, y su pronunciación puede variar con el tiempo y la distancia. Si sustituye un carácter por otro, está sustituyendo una idea. Es más que solo cambiar letras, es cambiar un ideograma.

Codificación de caracteres

(Imagen de Wikipedia )

Cuando escribe algo en el teclado o carga un archivo, ¿cómo sabe la computadora qué mostrar? Para eso está la codificación de caracteres. El texto de su computadora no es realmente letras, es una serie de valores alfanuméricos emparejados. La codificación de caracteres actúa como una clave para qué valores corresponden a qué caracteres, de manera muy similar a cómo la ortografía dicta qué sonidos corresponden a qué letras. El código Morse es una especie de codificación de caracteres. Explica cómo los grupos de unidades largas y cortas, como los pitidos, representan personajes. En código Morse, los caracteres son solo letras, números y puntos en inglés. Hay muchas codificaciones de caracteres de computadora que se traducen en letras, números, acentos, signos de puntuación, símbolos internacionales, etc.

A menudo, en este tema, también se utiliza el término "páginas de códigos". Básicamente, son codificaciones de caracteres tal como las utilizan empresas específicas, a menudo con ligeras modificaciones. Por ejemplo, la página de códigos de Windows 1252 (anteriormente conocida como ANSI 1252) es una forma modificada de ISO-8859-1. Se utilizan principalmente como un sistema interno para hacer referencia a codificaciones de caracteres estándar y modificadas que son específicas de los mismos sistemas. Al principio, la codificación de caracteres no era tan importante porque las computadoras no se comunicaban entre sí. Con el aumento de la prominencia de Internet y la creación de redes como algo común, se ha convertido en un elemento cada vez más importante de nuestra vida cotidiana sin que nos demos cuenta.

Muchos tipos diferentes

(Imagen de sarah sosiak )

Hay muchas codificaciones de caracteres diferentes, y hay muchas razones para ello. La codificación de caracteres que elija utilizar dependerá de sus necesidades. Si se comunica en ruso, tiene sentido usar una codificación de caracteres que admita bien el cirílico. Si te comunicas en coreano, entonces querrás algo que represente bien a Hangul y Hanja. Si eres matemático, entonces quieres algo que tenga todos los símbolos científicos y matemáticos bien representados, así como los glifos griegos y latinos. Si eres un bromista, tal vez te beneficie texto al revés . Y, si desea que todos esos tipos de documentos sean vistos por cualquier persona, desea una codificación que sea bastante común y de fácil acceso.

Echemos un vistazo a algunos de los más comunes.

(Extracto de la tabla ASCII, imagen de asciitable.com )

  • ASCII - El Código estándar americano para el intercambio de información es una de las codificaciones de caracteres más antiguas. Originalmente se diseñó en base a códigos telegráficos y evolucionó con el tiempo para incluir más símbolos y algunos caracteres de control no impresos ahora obsoletos. Probablemente sea lo más básico posible en términos de sistemas modernos, ya que se limita al alfabeto latino sin caracteres acentuados. Su codificación de 7 bits permite solo 128 caracteres, por lo que existen varias variantes no oficiales en uso en todo el mundo.
  • ISO-8859 - El grupo de codificaciones de caracteres más utilizado por la Organización Internacional de Normalización es el número 8859. Cada codificación específica se designa con un número, a menudo precedido por un apodo descriptivo, p. Ej. ISO-8859-3 (latín-3), ISO-8859-6 (latín / árabe). Es un superconjunto de ASCII, lo que significa que los primeros 128 valores de la codificación son los mismos que ASCII. Sin embargo, es de 8 bits y admite 256 caracteres, por lo que se basa en ellos e incluye una gama mucho más amplia de caracteres, con cada codificación específica centrada en un conjunto diferente de criterios. Latin-1 incluía un montón de letras y símbolos acentuados, pero luego fue reemplazado por un conjunto revisado llamado Latin-9 que incluye glifos actualizados como el símbolo del euro.

(Extracto de la escritura tibetana, Unicode v4, de unicode.org )

  • Unicode - Este estándar de codificación apunta a la universalidad. Actualmente incluye 93 guiones organizados en varios bloques, con muchos más en proceso. Unicode funciona de manera diferente a otros juegos de caracteres en que, en lugar de codificar directamente un glifo, cada valor se dirige a un "punto de código". Estos son valores hexadecimales que corresponden a caracteres, pero los glifos en sí los proporciona el programa de forma separada, como su navegador web. Estos puntos de código se representan comúnmente de la siguiente manera: U + 0040 (que se traduce como ‘@’ ). Las codificaciones específicas bajo el estándar Unicode son UTF-8 y UTF-16. UTF-8 intenta permitir la máxima compatibilidad con ASCII. Es de 8 bits, pero admite todos los caracteres mediante un mecanismo de sustitución y varios pares de valores por carácter. UTF-16 abandona la compatibilidad ASCII perfecta para una compatibilidad de 16 bits más completa con el estándar.
  • ISO-10646 - Esta no es una codificación real, solo un conjunto de caracteres de Unicode que ha sido estandarizado por ISO. Es sobre todo importante porque es el repertorio de caracteres utilizado por HTML. Faltan algunas de las funciones más avanzadas proporcionadas por Unicode que permiten la clasificación y la escritura de derecha a izquierda junto con la de izquierda a derecha. Aún así, funciona muy bien para su uso en Internet, ya que permite el uso de una amplia variedad de scripts y permite que el navegador interprete los glifos. Esto hace que la localización sea algo más fácil.

¿Qué codificación debo utilizar?

Bueno, ASCII funciona para la mayoría de hablantes de inglés, pero no para mucho más. Con más frecuencia, verá ISO-8859-1, que funciona para la mayoría de los idiomas de Europa occidental. Las otras versiones de ISO-8859 funcionan para escritura cirílica, árabe, griega u otras escrituras específicas. Sin embargo, si desea mostrar varios scripts en el mismo documento o en la misma página web, UTF-8 permite una compatibilidad mucho mejor. También funciona muy bien para las personas que utilizan la puntuación adecuada, los símbolos matemáticos o caracteres improvisados, como cuadrados y casillas de verificación .

(Varios idiomas en un documento, captura de pantalla de gujaratsamachar.com )

Sin embargo, cada conjunto tiene sus inconvenientes. ASCII está limitado en sus signos de puntuación, por lo que no funciona increíblemente bien para las ediciones tipográficamente correctas. ¿Alguna vez escribió copiar / pegar desde Word solo para tener una combinación extraña de glifos? Ese es el inconveniente de ISO-8859, o más correctamente, su supuesta interoperabilidad con páginas de códigos específicas del sistema operativo (¡te estamos mirando a TI, Microsoft!). El principal inconveniente de UTF-8 es la falta de un soporte adecuado en aplicaciones de edición y publicación. Otro problema es que los navegadores a menudo no interpretan y solo muestran la marca de orden de bytes de un carácter codificado en UTF-8. Esto da como resultado que se muestren glifos no deseados. Y, por supuesto, declarar una codificación y usar caracteres de otra sin declararlos / hacer referencia a ellos correctamente en una página web dificulta que los navegadores los muestren correctamente y que los motores de búsqueda los indexen de manera adecuada.

Para sus propios documentos, manuscritos, etc., puede utilizar lo que necesite para realizar el trabajo. Sin embargo, en lo que respecta a la web, parece que la mayoría de las personas están de acuerdo en usar una versión UTF-8 que no usa una marca de orden de bytes, pero eso no es del todo unánime. Como puede ver, cada codificación de caracteres tiene su propio uso, contexto y fortalezas y debilidades. Como usuario final, probablemente no tendrá que lidiar con esto, pero ahora puede dar un paso más si así lo desea.

.entrada-contenido .entry-footer

Cryptography Fundamentals - 03 Character Encodings ASCII , ANSI , UNICODE

What Is The Differences Between ANSI And Unicode

Unicode And Character Encoding

ASCII And Unicode Character Sets

Character Encoding And Unicode Tutorial

What Is Unicode? And Why Do I Need To Use Unicode?

Unicode, UTF 8 And ASCII

Character Encodings (Jack)

ANSI And Unicode Encoding, TCHAR LPSTR LPCSTR LPWSTR LPCWSTR LPTSTR LPCTSTR

Characters, Symbols And The Unicode Miracle - Computerphile

Code Pages, Character Encoding, Unicode, UTF-8 And The BOM - Computer Stuff They Didn't Teach You #2

Character Encoding


Nube e Internet - Artículos más populares

Cómo hacer copias de seguridad de fotos y videos de Android en la nube

Nube e Internet Jun 5, 2025

Tus fotos y videos son recuerdos preciosos y no quieres perderlos. Aquí hay cuatro servicios, en su mayoría gratuitos, que puede utilizar para realizar copias de seguridad automá..


Cómo transmitir sus juegos de Xbox One en Twitch o Mixer

Nube e Internet Mar 5, 2025

La Xbox One puede transmitir tu juego en el propio servicio Mixer de Microsoft, pero también te permite transmitir en Twitch. La transmisión de Twitch solo requiere una configurac..


Cómo utilizar la búsqueda en lenguaje natural en Spotlight de OS X

Nube e Internet Jun 17, 2025

Si bien ciertamente puede hacer clic en OS X para encontrar lo que necesite, no hay nada más fácil ni más eficiente que el Spotlight probado por el tiempo . Spotli..


Cómo imprimir en PDF en Windows: 4 consejos y trucos

Nube e Internet Jul 29, 2025

A diferencia de la mayoría de los otros sistemas operativos, Windows todavía no incluye soporte de primera clase para imprimir en archivos PDF. Sin embargo, la impresión de PDF s..


Deshabilitar Messenger en el nuevo Hotmail Wave 4

Nube e Internet Aug 6, 2025

¿Le molesta que Messenger inicie sesión automáticamente cuando lee sus correos electrónicos en el nuevo Hotmail? A continuación, le indicamos cómo puede desactivar Web Messenger en Hotm..


Agregue aplicaciones gratuitas de Windows Live a su sitio web o blog

Nube e Internet Jun 15, 2025

¿Le gustaría utilizar Hotmail, Office Web Apps, Messenger y más en el dominio de su sitio web? A continuación, le mostramos cómo puede agregar Windows Live a su sitio web de forma gratui..


Reparar Internet Explorer que no solicita elegir la ubicación para guardar en XP

Nube e Internet Dec 9, 2024

CONTENIDO NO CUBIERTO Si todavía usa Internet Explorer y Windows XP, es posible que haya encontrado un problema en el que desmarcó la casilla "Preguntar siempre antes de abrir este tipo d..


Nuestro vistazo a las nuevas aplicaciones web de Microsoft Office

Nube e Internet Sep 24, 2025

Las aplicaciones web de Microsoft le permitirán editar, ver y compartir documentos de MS Office a través de la web con la misma funcionalidad que su suite de escritorio. Recientemente, lanz..


Categorías