暴力解字符编码
Python支持的字符集在这里:
usr/lib/python2.7/encodings
然后写个暴力循环:
charsets = ["big5hkscs", "big5", "bz2_codec", "charmap", "cp037", "cp1006", "cp1026", "cp1140", "cp1250", "cp1251", "cp1252", "cp1253", "cp1254", "cp1255", "cp1256", "cp1257", "cp, 1258" "cp424", "cp437", "cp500", "cp720", "cp737", "cp775", "cp850", "cp852", "cp855", "cp856", "cp857", "cp858", "cp860", "cp861", "cp862", "cp863", "cp864", "cp865", "cp866", "cp869", "cp874", "cp875", "cp932", "cp949", "cp950", "euc_jis_2004", "euc_jisx0213", "euc_jp", "euc_kr", "gb18030", "gb2312", "gbk", "hex_codec", "hp_roman8", "hz", "idna", "iso2022_jp_1", "iso2022_jp_2004", "iso2022_jp_2", "iso2022_jp_3", "iso2022_jp_ext", "iso2022_jp", "iso2022_kr", "iso8859_10", "iso8859_11", "iso8859_13", "iso8859_14", "iso8859_15", "iso8859_16", "iso8859_1", "iso8859_2", "iso8859_3", "iso8859_4", "iso8859_5", "iso8859_6", "iso8859_7", "iso8859_8", "iso8859_9", "johab", "koi8_r", "koi8_u", "latin_1", "mac_arabic", "mac_centeuro", "mac_croatian", "mac_cyrillic", "mac_farsi", "mac_greek", "mac_iceland", "mac_latin2", "mac_romanian", "mac_roman", "mac_turkish", "mbcs", "palmos", "ptcp154", "punycode", "quopri_codec", "raw_unicode_escape", "rot_13", "shift_jis_2004", "shift_jis", "shift_jisx0213", "string_escape", "tis_620", "undefined", "unicode_escape", "unicode_internal", "utf_16_be", "utf_16_le", "utf_16", "utf_32_be", "utf_32_le", "utf_32", "utf_7", "utf_8", "utf_8_sig", "uu_codec", "zlib_codec"] for c in charsets: try: print(text.encode(c)) # text 变量的值就是一堆乱码 except Exception: continue