python检测编码类型

用 chardet.detect()方法检测bytes的编码类型

第一步 在命令行下输入pip install chardet 并且按下回车键(Enter)

然后导入chardet这个第三方库 第一行代码 import chardet

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34

import chardet

data = '床前明月光,疑是地上霜'.encode('utf-8')
c = chardet.detect(data)
print(c)

print(chardet.detect('离离原上草一岁一枯荣'.encode('utf-8')))

data = '离离原上草一岁一枯荣'.encode('utf-8')
print(chardet.detect(data))

c = chardet.detect('离离原上草一岁一枯荣'.encode('utf-8'))
print(c)

# 分别用三行代码来检查编码类型 发现是utf-8的编码 confidence表示检测概率 1为100% 因为是0.99 所以检测概率是99%

# -------------------------------------------------------------------------------------------------------------

data = '床前明月光,疑是地上霜'.encode('gbk')
c = chardet.detect(data)
print(c)

print(chardet.detect('离离原上草一岁一枯荣'.encode('gbk')))

data = '离离原上草一岁一枯荣'.encode('gbk')
print(chardet.detect(data))

c = chardet.detect('离离原上草一岁一枯荣'.encode('gbk'))
print(c)

# 分别用三行代码(代码行数取决于 赋值给变量or不赋值给变量) 来检测编码类型 发现是gbk的编码 date是简体中文 检测概率是gbk编码的为74%
# chardet.detect()方法易用 用该方法检测编码类型非常的简单方便

🔰本文标题: python检测编码类型

🔞本文链接: https://193.gs/Python-encode/index.html

🌡️本文总热度