Форум сайта python.su
857
f = open('Connect (2).txt', encoding='utf-16') print(f.read())
f = open('Connect (2).txt', encoding='utf-16le') print(f.read()[1:])
Отредактировано py.user.next (Апрель 12, 2013 01:25:15)
Офлайн
16
py.user.next
Подскажите, пожалуйста, есть ли возможность программно определить кодировку исходного файла?
Офлайн
36
alexbadaloffПопробуйте что-нибудь из chardet, cchardet, charade. (все можно взять на pypi.python.org)
Подскажите, пожалуйста, есть ли возможность программно определить кодировку исходного файла?
Офлайн
0
Спасибо
Офлайн
857
alexbadaloffесли такая потребность возникла, то это странно
есть ли возможность программно определить кодировку исходного файла?
Отредактировано py.user.next (Апрель 12, 2013 17:04:30)
Офлайн
16
py.user.next
если такая потребность возникла, то это странно
это типа вопроса “есть ли возможность залезть на шкаф?”, ответ “есть, можно применить лестницу”
кодировка должна быть известна (сообщена)
f = open('Connect (2).txt') x = f.getCoding(); print(x)
Отредактировано alexbadaloff (Апрель 15, 2013 12:30:18)
Офлайн
857
alexbadaloffКак создаётся файл ?
Может получиться так, что пришлют файл с плохой кодировкой, например сменится человек или ОС поменяют, где умолчания другие были.
Офлайн
16
py.user.nextНеизвестно. Просто указан расширение txt.
Как создаётся файл ?
Отредактировано alexbadaloff (Апрель 19, 2013 11:59:57)
Офлайн
857
alexbadaloffу бинарного тоже можно расширение такое сделать
Неизвестно. Просто указан расширение txt.
alexbadaloffне, это реально; если нужно распознать кодировку, то нужно определить признаки каждой кодировки и сопоставить их
То есть это вполне реально.
Офлайн