Python Journey - Day12 -文件操作

本文详细介绍了Python中的文件操作,包括打开、关闭、读写模式、上下文管理器的使用。此外,还讲解了文本文件的读取方法如read、readline和readlines,以及二进制文件的读取。同时,文章提到了enumerate函数在遍历文件内容时的应用。最后,文章探讨了pickle模块在对象序列化和反序列化中的作用,展示了如何将数据持久化到硬盘并重新加载。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

创建文件对象open()

用于创建文件对象 格式如下:

file object = open(file_name [, access_mode][, buffering])

  1. file_name:file_name变量是一个包含了你要访问的文件名称的字符串值。
  2. access_mode:access_mode决定了打开文件的模式:只读,写入,追加等。所有可取值见如下的完全列表。这个参数是非强制的,默认文件访问模式为只读®。
  3. buffering:如果buffering的值被设为0,就不会有寄存。如果buffering的值取1,访问文件时会寄存行。如果将buffering的值设为大于1的整数,表明了这就是的寄存区的缓冲大小。如果取负值,寄存区的缓冲大小则为系统默认。
模式描述
t文本模式 (默认)
x写模式,新建一个文件,如果该文件已存在则会报错。
b二进制模式。
U通用换行模式(不推荐)。
r以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
rb以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。一般用于非文本文件如图片等。
r+打开一个文件用于读写。文件指针将会放在文件的开头。
rb+以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件如图片等。
w打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
wb以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。
w+打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。
wb+以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。
a打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
ab以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
a+打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。
ab+以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。

总结如下:

在这里插入图片描述

在这里插入图片描述

file对象的属性

其中softspace 在python3中已经移除.

在这里插入图片描述

fo = open("d:/a.txt", "w")
print("文件名: ", fo.name)
print("是否已关闭 : ", fo.closed)
print("访问模式 : ", fo.mode)
print("末尾是否强制加空格 : ", fo.softspace)
fo.close()
文件名:  d:/a.txt
是否已关闭 :  False
访问模式 :  w
Traceback (most recent call last):
  File "C:/file.py", line 7, in <module>
    print("末尾是否强制加空格 : ", fo.softspace)
AttributeError: '_io.TextIOWrapper' object has no attribute 'softspace'

close() 关闭文件流

File 对象的 close()方法刷新缓冲区里任何还没写入的信息,并关闭该文件,这之后便不能再进行写入。

fileObject.close()

write()方法

write()方法可将任何字符串写入一个打开的文件。需要重点注意的是,Python字符串可以是二进制数据,而不是仅仅是文字。

# 打开一个文件
fo = open("d:/a.txt", "w")
fo.write("www.csdn.com!\nVery good site!\n")

# 关闭打开的文件
fo.close()

在这里插入图片描述

with语句(上下文管理器)

可以自动管理上下文管理,不论什么原因跳出with块,都能确保文件正确的关闭,并可以在代码块执行完毕后自动还原进入该代码块时的现场.

with open(r'a.txt', 'a') as f:
    f.write('HHVic, I love you!')
HHVic, I love you!

文本文件的读取 read()

  1. read([size])
    从文字读取size个字符,并作为结果返回. 如果没有size参数,则读取整个文件.
    读取到文件末尾,会返回空字符串.
  2. readline()
    读取一行作为过返回. 读取到文章末尾, 会返回空字符串.
  3. readlines()
    文本文件中,每一行作为一个字符串存入列表中,返回该列表.
with open(r'a.txt','r', encoding = 'utf8') as f:
    str = f.read()
    print(str)
HHVic, I love you!
www.csdn.net
Vic
输入法
乾坤大挪移

读取前4个字符:

with open(r'a.txt','r', encoding = 'utf8') as f:
    str = f.read(4)
    print(str)
HHVi

读取第一行:

with open(r'a.txt','r', encoding = 'utf8') as f:
    str = f.readline()
    print(str)
HHVic, I love you!

读取多行(循环readline):

with open(r'a.txt', 'r', encoding='utf8') as f:
    for a in f:
        print(a, end='')
HHVic, I love you!
www.csdn.net
Vic
输入法
乾坤大挪移

读取多行存入列表:

with open(r'a.txt','r', encoding = 'utf8') as f:
    str = f.readlines()
    print(str)
['HHVic, I love you!\n', 'www.csdn.net\n', 'Vic\n', '输入法\n', '乾坤大挪移\n']

enumerate()函数

a = ['HHVic, I love you!','www.csdn.net','输入法','乾坤大挪移']
b = enumerate(a)
print(a)
print(b)
print(list(b))

c = [temp+' #' + str(index) for index, temp in enumerate(a)] # 每行后面加#数字
print(c)
['HHVic, I love you!', 'www.csdn.net', '输入法', '乾坤大挪移']
<enumerate object at 0x000002AD9E566900>
[(0, 'HHVic, I love you!'), (1, 'www.csdn.net'), (2, '输入法'), (3, '乾坤大挪移')]
['HHVic, I love you! #0', 'www.csdn.net #1', '输入法 #2', '乾坤大挪移 #3']

推导式:

with open('a.txt', 'r', encoding='utf8') as f:
    lines = f.readlines()
    lines = [line.rstrip() +' #'+ str(index) for index, line in enumerate(lines)]

with open('a.txt', 'w', encoding='utf8') as f:
    f.writelines(lines)

HHVic, I love you! #0www.csdn.net #1Vic #2输入法 #3乾坤大挪移 #4

二进制文件读取

with open('day12-7.JPG','rb') as f:
    with open('day12-7_copy.JPG','wb') as w:
        for line in f.readlines():
            w.write(line)
print('图片copy成功!')

在这里插入图片描述

__seek()任意位置操作

操作的是字节数!!! 语法如下:

fileObject.seek(offset[, whence])

  1. offset – 开始的偏移量,也就是代表需要移动偏移的字节数,如果是负数表示从倒数第几位开始。
  2. whence:可选,默认值为 0。给 offset 定义一个参数,表示要从哪个位置开始偏移;0 代表从文件开头开始算起,1 代表从当前位置开始算起,2 代表从文件末尾算起。
with open('a.txt','r',encoding='utf-8') as f:
    print('文件名是: {0}'.format(f.name))
    print(f.tell())
    print('文件名是: {0}'.format(str(f.readline())))
    print(f.tell())
    print('文件名是: {0}'.format(str(f.readline())))
    print(f.tell())
    f.seek(0)
    print('文件名是: {0}'.format(str(f.readline())))
    print(f.tell())
文件名是: a.txt
0
文件名是: HHVic, I love you! #0

23
文件名是: www.csdn.net #1Vic #2

46
文件名是: HHVic, I love you! #0

23

使用pickle序列化

对象的序列化: 将对象转化成’串行化’数据形式. 存储到硬盘或者通过网络传输到其他地方.
对象的反序列化: 将读取到的’串行化数据’ 转化成对象.

pickle.dump(obj, file[, protocol])

序列化对象,并将结果数据流写入到文件对象中。参数protocol是序列化模式,默认值为0,表示以文本的形式序列化。protocol的值还可以是1或2,表示以二进制的形式序列化。

pickle.load(file)

反序列化对象。将文件中的数据解析为一个Python对象。
其中要注意的是,在load(file)的时候,要让python能够找到类的定义,否则会报错:

import pickle
a1 = 'HHVic'
a2 = 23424
a3 = [1,2,3,4]

with open('b.mov','wb') as f:
    pickle.dump(a1, f)
    pickle.dump(a2, f)
    pickle.dump(a3, f)

with open('b.mov','rb') as f:
    b1 = pickle.load(f)
    b2 = pickle.load(f)
    b3 = pickle.load(f)
    print(b1); print(b2); print(b3)
HHVic
23424
[1, 2, 3, 4]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值