Von UTF-8 und ANSI oder warum die Sonderzeichen so komisch aussehen

Von UTF-8 und ANSI oder warum die Sonderzeichen so komisch aussehen

Seit dem Start unseres Open-Data-Portals erreichen uns einige Hinweise darauf, dass Umlaute und Sonderzeichen in den Daten in Excel komisch angezeigt werden.

Der Grund dafür liegt bei der Tabellenkalkulation Microsoft Excel. Beim Öffnen von Dateien im csv-Format nimmt Excel an, dass diese mit Excels Standard-Zeichenkodierung „Windows (ANSI)“ abgespeichert wurden und fragt auch gar nicht erst nach. Ergebnis ist, dass Spezialzeichen umgewandelt und dadurch nahezu unlesbar werden – sie sehen komisch aus.

Warum UTF-8?

UTF-8 ist eine Zeichenkodierung für Unicode. Das ist ein internationaler Standard für die Darstellung aller sinntragenden Schriftzeichen. Ob deutsches Alphabet oder japanische Schriftzeichen, Musiknoten oder Pfeile: All das wird mit den jeweils selben Codes verarbeitet. So können die Schriftzeichen in jedem Land, in jeder Sprache und mit jedem Betriebssystem richtig angezeigt werden. UTF-8 benötigt dafür nur sehr wenig Speicherplatz.

Damit Open Data aus Düsseldorf mit anderen Daten, auch aus internationalen Quellen, verschnitten und weiterverwendet werden kann, ist es hilfreich, von vornherein eine international anerkannte und weit verbreitete Zeichensatzkodierung zu nutzen.

Wir nutzen UTF-8 auch, um bei Bedarf selbst andere Schriftzeichen oder Symbole in den Daten speichern zu können, aber vor allem, um grundsätzlich eine internationale Verwendung zu ermöglichen.

Warum hat gerade ein weit verbreitetes Programm wie Microsoft Excel damit Probleme?

Das wissen wir nicht. Andere Tabellenkalkulationen verarbeiten UTF-8-kodierte Dateien mit weniger Aufwand. Aber auch Excel kann grundsätzlich mit solchen Daten umgehen, wenn der Textkonvertierungs-Assistent genutzt wird.

Dazu gibt es zwei Methoden:

  • Die einfachste ist, wenn Sie die Datei umbenennen und aus der Textendung csv die Endung txt machen. Wenn Sie dann in Excel die umbenannte Datei öffnen, startet Excel automatisch den Textkonvertierungs-Assistenten. Dort können Sie die Dateikonvertierung (versteckt als „Dateiursprung“) auswählen.
  • Die zweite Möglichkeit ist, die Datei zu importieren. Wie das geht, haben wir in den FAQ beschrieben.

 

Wenn Sie weitere Fragen oder Anregungen haben, können Sie uns gerne ansprechen.

Neuen Kommentar schreiben

Plain text

  • Keine HTML-Tags erlaubt.
  • Internet- und E-Mail-Adressen werden automatisch umgewandelt.
  • HTML - Zeilenumbrüche und Absätze werden automatisch erzeugt.
To prevent automated spam submissions leave this field empty.