La información en formato de texto se representa mediante un código en el que cada uno de los distintos símbolos del texto (tales como letras del alfabeto o signos de puntuación) se asignan a un único patrón de bits.
El texto se representa como una cadena larga de bits en la cual los sucesivos patrones represen-tan los sucesivos símbolos del texto original.
Se puede representar cualquier información escrita (texto) mediante caracteres. Los caracteres que se utilizan en computación suelen agruparse en cinco categorías:
1. Caracteres alfabéticos (letras mayúsculas y minúsculas, en una primera versión del abecedario inglés).
A, B, C, D, E, … X, Y, Z, a, b, c, … , X, Y, Z
2. Caracteres numéricos (dígitos del sistema de numeración).
0, 1, 2, 3, 4, 5, 6, 7, 8, 9 sistema decimal
3. Caracteres especiales (símbolos ortográficos y matemáticos no incluidos en los grupos anteriores).
{ } Ñ ñ ! ? & > # ç …
4. Caracteres geométricos y gráficos (símbolos o módulos con los cuales se pueden representar cuadros, figuras geométricas, iconos, etc.
|—| |—| ? _ …
5. Caracteres de control (representan órdenes de control como el carácter para pasar a la siguiente línea [NL] o para ir al comienzo de una línea [RC, retorno de carro, «carriage return, CR»] emitir un pitido en el terminal [BEL], etc.).
Al introducir un texto en una computadora, a través de un periférico, los caracteres se codifican según un código de entrada/salida de modo que a cada carácter se le asocia una determinada combinación de n bits.