Der Schnee ist weg, die Temperaturen überlegen sich langsam aber sicher doch ein bisschen zu steigen - der Frühling kann quasi kommen! Wenn ich nicht von einem Informanten aus Luxemburg erfahren hätte, dass bei ihnen gerade der Winter zu neuer Höchstform aufläuft, hätte ich die Hoffnung diesmal wirklich gehabt! Außerdem sind noch fiese Erkältungsviren unterwegs und während ich gerade zu einer regelrechten Taschentuchvernichtungsmaschine mutiere, komme ich mal wieder dazu hier etwas zu schreiben, yay!
Vermutlich von vielen unbemerkt, habe ich letzte Woche die Seite von der alten ISO-8859-1 Zeichencodierung auf die UTF-8 Unicode Codierung umgestellt. Die Vorteile liegen klar auf der Hand, Sonderzeichen wie Ä, Ü, Ö müssen nicht mehr in ihre HTML-Entities umgewandelt werden, Quelltexte bleiben lesbarer und ein Ä kommt bei einem US-Bürger auch als Ä an, ohne dass zusätzliche Schritte notwendig sind (andersherum werden bei uns z.B. Späße wie chinesische Schriften korrekt wiedergegeben und nicht als leere Rechtecke angezeigt, zumindest wenn die richtigen Schriftsätze vorhanden sind).
Wie man seine Seite und seine Scripte dazu kriegt, korrekt in UTF-8 zu arbeiten, findet sich etwas zerstreut im Netz. Fast alles zum Umstellen hat Dirk Niemeier in einem Blogeintrag bereits ziemlich gut zusammengefasst. Allerdings waren bei mir noch ein paar Schritte mehr nötig um wirklich alles auf UTF-8 umzustellen. So kann man noch in PHP das interne Encoding umstellen:
// UTF-8 - to get us happy
Außerdem sollte man seiner Datenbank nach Verbindungsaufbau noch mitteilen, dass ankommende Daten genauso wie auszugebende UTF-8 codiert sind bzw. sein sollen:
Nach diesen Schritten lief bei mir alles rund. Ein weiterer guter Artikel zum Thema UTF-8 findet sich auch noch bei 6b.com.
Daniel, 12. März 2008 um 15:31 Uhr // 0 Kommentare
