Unicode es una
norma de
codificación de caracteres. Su objetivo es asignar a cada posible carácter de cada posible lenguaje un número y nombre único, a diferencia de la mayor parte de los juegos ISO como el
ISO-8859-1, que sólo definen los necesarios para un idioma o zona geográfica.
Unicode se representa con tres tipos de codificación, según el número de bits necesarios para identificar cada carácter (
UTF-8,
UTF-16, UTF-32). (UTF-8, UTF-16, UTF-32) permiten representar los mismos caracteres, y
Unicode define la relación biyectiva entre los tres.
Actualmente coincide con el estándar
ISO/IEC 10646. Su utilización más frecuente,
UTF-8, es compatible con el juego de caracteres
ASCII. El UTF8 tiene la ventaja de ser parcialmente compatible con los programas anteriores que funcionaban con caracteres de 8 bits.