venerdì 14 maggio 2010

intermezzo: pitonare pallido e assorto, ma con le accentate lette giusto

interrompo il triste silenzio di colui che, protruso e felice, coltiva la speranza di un domani tutto suo che gli appartenga per registrare una pitonatura: come gestire le lettere (tipo le accentate) italiane extra-ascii in un programma che va a scrivere poi in UTF-8.

impostiamo una tantum l'encoding di default a utf-8 nel file sitecustomize.py

# sitecustomize.py 1
# this file can be anywhere in your Python path,
# but it usually goes in ${pythondir}/lib/site-packages/
import sys
sys.setdefaultencoding('utf-8')
###

ma nel programma, apriamo il file di input (dove ci stanno i caratteri accentati da leggere) con il codec ISO8859-15 corretto.

# importo il modulo codecs
import codecs
...
# leggo il file con il codec ISO8859-15 che prevede i caratteri italiani
inf = codecs.open(mio_file_con_lettere_accentate, 'rb', 'iso8859-15')
###


se non ci avete capito nulla, è perché nulla capite della vera poesia del computer, come presumibilmente non v'intendete di tetti ritinti - ma probabilmente siete in grado di fare il pane saporoso e fragrante con le vostre belle mani callose e rosse come le ciliegie maggioline

Nessun commento: