UTF-8 Endlösung in Python
Da ich seit einiger Zeit von diversen Codierungsproblemen in Python genervt bin (und das sicher nicht nur mir so geht, z.B. Snookie hat da auch so seine Probleme), habe ich mir nun eine mini-Funktion geschrieben die meine Probleme zu einem guten Teil lösen sollte.
Hauptproblem war: Wie bringe ich diverse Strings aus dem IRC (von den man nie weiß in welcher Codierung sie ankommen) in ein generelles UTF-8-Format?
def encodeMsg(self, msg):
try:
return msg.encode('utf-8')
except:
return msg
Das Ganze ist sicher noch zu verbessern, ein generelles except ist z.B. sicher kein guter Code (hier nicht so wichtig, aber bei längeren Abschnitten kann das nervig werden) aber es tut zumindest erstmal.
Diese Funktion rufe ich nun auf wenn ich meine Nachrichten versende und schon hab ich keine Probleme mehr... egal ob die Daten in UTF-8 kommen oder nicht.
Importierte/Alte Kommentare:
#734: 09.Oct.2008 12:10 von geby
Endlösung?
Böse! Böse! Böse!
#735: 09.Oct.2008 12:10 von Dr. Azrael Tod
eigentlich überhaupt nicht...
Es liegt wie immer nur an der geschichtlichen Vorbelastung des Begriffes.
Von "das haben Nazis mal verwendet, das ist böse!" halte ich jetzt rein grundsätzlich nicht soooo viel.
#736: 13.Oct.2008 04:10 von Friedenspanzer
Bin auch schon angepflaumt worden weil ich das Wort "Führer" benutzt hab. Aber wenn mich jemand führt ist es eben der Führer, so.
Bei der Übersetzung von UT 2004 hatten sie damit vermutlich auch Probleme, da kommen dann so Begriffe bei rum wie "Leader Blau"
#737: 13.Oct.2008 04:10 von Dr. Azrael Tod
Zugegeben: bei mir spielte in diesem Fall auch ein kleinwenig Provokation mit. g