Es ist wohl ein besonderes Problem aller Softwareentwickler – Chatsets, also die Zeichenkodierung und Darstellung von Schrift. Die Welt besteht nun mal nicht nur aus Europäern, geschweige denn Deutschen. So haben sich über die Jahre viele Möglichkeiten entwickelt, Zeichen, besonders Sonderzeichen darzustellen.
Nehmen Sie nur mal eine eMail, geschrieben in England mit einem Programm das ISO-8859-1 unterstützt, versendet nach Rumänien, weitergeleitet nach Deutschland, empfangen als UTF-8, dargestellt im Browser als Windows-1252. Herzlichen Glückwunsch – aus üäö und Eurozeichen können die unleserlichsten Zeichen werden. Wer ist Schuld? Der Browserhersteller, der Mailserver, der Mailversender, der Empfänger? Zumindest eine eindeutige Schuldfrage wäre hilfreich, ist allerdings nicht so einfach. Die gemeine Schreibkraft läuft zumindest rot an, wenn mal wieder der Rechner spinnt und Zeichen “kaputt” dargestellt werden.

Um das Chaos im Laufe der Zeit in den Griff zu bekommen, sollte man heute auf UTF-8 konforme Zeichen setzen. Dieser Unicode hat sich als Ziel gesetzt, irgendwann alle menschlich bekannten Schriftzeichen in einem Code unterzubringen. Es müssen also erstmal alle Informationen auf Basis von UTF-8 umgesetzt werden. Die zur Datenspeicherung benutzten Datenbanken sind heute aber oft Latin-1 codiert (entspricht dem ISO-8859-1) und die Datenbank muss ebenfalls angepasst werden, alte Daten müssen in endlicher Zeit konvertiert werden. Zuletzt noch das Programm in der Anwenderschicht, welches die Daten anzeigt. Ein Browser steht standardmäßig auf ISO-8859-1 oder -15, wobei der Zusatz -15 als Erweiterung noch das Eurozeichen vorsieht. Es sei denn, der User hat sich dazu entschlossen, die Zeichenkodierung an seinem PC doch wieder anders einzustellen.
Jetzt kann man sich vorstellen, welche Komplexität hinter der Tatsache steht, wenn SIE mal wieder schimpft, die chinesischen Sonderzeichen seien nicht sauber.