Unicode
Unicode es una norma de codificación de caracteres. Su objetivo es asignar a cada posible carácter de cada posible lenguaje un número y nombre único, a diferencia de la mayor parte de los juegos ISO como el ISO-8859-1, que sólo definen los necesarios para un idioma o zona geográfica.
Unicode se representa con tres tipos de codificación, según el número de bits necesarios para identificar cada carácter (UTF-8, UTF-16, UTF-32). (UTF-8, UTF-16, UTF-32) permiten representar los mismos caracteres, y Unicode define la relación biyectiva entre los tres.
Actualmente coincide con el estándar ISO/IEC 10646. Su utilización más frecuente, UTF-8, es compatible con el juego de caracteres ASCII. El UTF8 tiene la ventaja de ser parcialmente compatible con los programas anteriores que funcionaban con caracteres de 8 bits.
* * *
Sistema internacional de codificación de caracteres diseñado para apoyar el intercambio electrónico, procesamiento y presentación de los textos escritos en los diversos lenguajes del mundo moderno y clásico.
El estándar de caracteres mundial Unicode incluye letras, dígitos, diacríticos, signos de puntuación y símbolos técnicos para todos los principales lenguajes escritos del mundo, usando un esquema de codificación uniforme. La primera versión de Unicode fue introducida en 1991; la más reciente contiene alrededor de 50.000 caracteres. Muchos sistemas de codificación (
como ASCII) lo preceden. Con Unicode (a diferencia de los sistemas anteriores), el número único provisto para cada carácter permanece constante en cualquier sistema que soporta Unicode.
Enciclopedia Universal.
2012.