ASCII (American Standard Code for Information Interchange)
ASCII (American Standard Code for Information Interchange) war das gebräuchlichste Format für Textdateien in Computern und im Internet. In einer ASCII-Datei wird jedes alphabetische, numerische oder Sonderzeichen durch eine 7-Bit-Binärzahl (eine Zeichenfolge von sieben Nullen oder Einsen) dargestellt. Ursprünglich waren so 128 Zeichen mögliche. Von diesen Zeichen sind 95 druckbar, die restlichen 33 sind Steuerzeichen. Infolge der nur 128 möglichen Zeichen umfasst der US-ASCII-Zeichensatz nur das lateinische Alphabet. Nationale gebräuchliche Sonderzeichen wie etwa im deutschsprachigen Raum Ä/ä,Ö/ö,Ü/ü und ß sind damit nicht möglich. Das ursprünglich nicht genutzte achte Bit setzte man dann unter anderem für die Darstellung von nationalen Zeichensätzen ein. Der ASCII-Zeichensatz wurde vom American National Standards Institute (ANSI) definiert (PDF). Auf ASCII baut ISO/IEC 646 auf, welches das internationale Alphabet beschreibt.
Die S/390-Mainframes von IBM setzten einen proprietären 8-Bit-Code namens EBCDIC ein. Bei Mac-Computern kommt der Zeichensatz Mac OS Roman zum Einsatz, der in RFC 1345 definiert ist.
Die älteren UNIX- und DOS-basierten Betriebssysteme verwendeten ASCII für Textdateien. Ab Windows NT setzte Microsoft einen neueren Code ein: Unicode oder ISO 8859. Die Entwicklung von Unicode wird vom Unicode Consortium koordiniert. Unicode ist heute der gebräuchlichste Zeichensatz.
Konvertierungsprogramme ermöglichen es verschiedenen Betriebssystemen, eine Datei von einem Zeichencode in einen anderen zu wandeln.