Kurztipp - Zeichenkodierung von Textdateien konvertieren
Aus Macwrench
Um die Zeichenkodierung von Textdateien (beispielsweise UTF-8 oder ISO Latin-1) zu konvertieren, genügt folgende Zeile im Terminal:
iconv -f QUELLKODIERUNG -t ZIELKODIERUNG QUELLDATEI > ZIELDATEI
beispielsweise um ein russisches (kyrillisches) Textfile in UTF-8 umzuwandeln:
iconv -f WINDOWS-1251 -t UTF-8 text.txt > text-utf8.txt
Alternativ kann natürlich auch der Texteditor des Vertrauens dazu verwendet werden, allerdings ist imho eine Zeile im Terminal schneller eingetippt als man durch ein seitenlanges Menü verschiedener Textkodierungen gescrollt hat ...
Unterstützte Kodierungen
Im Folgenden ein kleiner Auszug aus der Liste der von iconv unterstützten Kodierungen. Über die Option -l oder --list kann man sich eine Liste aller unterstützter Kodierungen ausgeben lassen, weitere Informationen dazu sind auch in der Manpage von
iconv zu finden.
Die in einer Zeile stehenden Kodierungen sind dabei geleichbedeutend (alternative Schreibweisen und Bezeichnungen)
- Unicode
- UTF-8, UTF8
- UTF-8-MAC, UTF8-MAC
- UTF-16
- UTF-16BE
- UTF-16LE
- UTF-32
- UTF-32BE
- UTF-32LE
- UTF-7
- ISO
- CP819, IBM819, ISO8859-1, ISO_8859-1, ISO_8859-1:1987, L1, LATIN1, CSISOLATIN1
- ISO-8859-2, ISO-IR-101, ISO8859-2, ISO_8859-2, ISO_8859-2:1987, L2, LATIN2, CSISOLATIN2
- ISO-8859-3, ISO-IR-109, ISO8859-3, ISO_8859-3, ISO_8859-3:1988, L3, LATIN3, CSISOLATIN3
- ISO-8859-4, ISO-IR-110, ISO8859-4, ISO_8859-4, ISO_8859-4:1988, L4, LATIN4, CSISOLATIN4
- CYRILLIC, ISO-8859-5, ISO-IR-144, ISO8859-5, ISO_8859-5, ISO_8859-5:1988, CSISOLATINCYRILLIC





