一、文件编码:数据与二进制的桥梁
1.1 为什么需要编码?
- 计算机只能识别
0
和1
,编码技术将文本内容转换为二进制存储,并在读取时反向翻译。 - 常见编码格式:UTF-8(通用)、GBK(中文)、Big5(繁体)等。
- 核心原则:读写文件时需使用相同的编码格式,否则会出现乱码(比如用UTF-8编码后,用GBK解码会失败)。
1.2 如何选择编码?
- 推荐使用UTF-8:兼容全球语言,通用性强。
- 查看文件编码:Windows记事本打开文件后,右下角显示编码格式。
二、文件操作三步走:打开 → 读写 → 关闭
2.1 打开文件:open()
语法:
f = open(name, mode, encoding="UTF-8")
- 参数说明:
name
:文件名(可含路径)。mode
:访问模式(r
读、w
写、a
追加)。encoding
:编码格式(必须用关键字参数指定)。
- 示例:
f = open("python.txt", "r", encoding="UTF-8")
2.2 读取文件内容
read()
:读取全部内容或指定字节数。content = f.read(10) # 读取前10字节
readline()