文章目录
创建文件对象open()
用于创建文件对象 格式如下:
file object = open(file_name [, access_mode][, buffering])
- file_name:file_name变量是一个包含了你要访问的文件名称的字符串值。
- access_mode:access_mode决定了打开文件的模式:只读,写入,追加等。所有可取值见如下的完全列表。这个参数是非强制的,默认文件访问模式为只读®。
- buffering:如果buffering的值被设为0,就不会有寄存。如果buffering的值取1,访问文件时会寄存行。如果将buffering的值设为大于1的整数,表明了这就是的寄存区的缓冲大小。如果取负值,寄存区的缓冲大小则为系统默认。
模式 | 描述 |
---|---|
t | 文本模式 (默认) |
x | 写模式,新建一个文件,如果该文件已存在则会报错。 |
b | 二进制模式。 |
U | 通用换行模式(不推荐)。 |
r | 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。 |
rb | 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。一般用于非文本文件如图片等。 |
r+ | 打开一个文件用于读写。文件指针将会放在文件的开头。 |
rb+ | 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。一般用于非文本文件如图片等。 |
w | 打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。 |
wb | 以二进制格式打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。 |
w+ | 打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。 |
wb+ | 以二进制格式打开一个文件用于读写。如果该文件已存在则打开文件,并从开头开始编辑,即原有内容会被删除。如果该文件不存在,创建新文件。一般用于非文本文件如图片等。 |
a | 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 |
ab | 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。 |
a+ | 打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。 |
ab+ | 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。 |
总结如下:
file对象的属性
其中softspace 在python3中已经移除.
fo = open("d:/a.txt", "w")
print("文件名: ", fo.name)
print("是否已关闭 : ", fo.closed)
print("访问模式 : ", fo.mode)
print("末尾是否强制加空格 : ", fo.softspace)
fo.close()
文件名: d:/a.txt
是否已关闭 : False
访问模式 : w
Traceback (most recent call last):
File "C:/file.py", line 7, in <module>
print("末尾是否强制加空格 : ", fo.softspace)
AttributeError: '_io.TextIOWrapper' object has no attribute 'softspace'
close() 关闭文件流
File 对象的 close()方法刷新缓冲区里任何还没写入的信息,并关闭该文件,这之后便不能再进行写入。
fileObject.close()
write()方法
write()方法可将任何字符串写入一个打开的文件。需要重点注意的是,Python字符串可以是二进制数据,而不是仅仅是文字。
# 打开一个文件
fo = open("d:/a.txt", "w")
fo.write("www.csdn.com!\nVery good site!\n")
# 关闭打开的文件
fo.close()
with语句(上下文管理器)
可以自动管理上下文管理,不论什么原因跳出with块,都能确保文件正确的关闭,并可以在代码块执行完毕后自动还原进入该代码块时的现场.
with open(r'a.txt', 'a') as f:
f.write('HHVic, I love you!')
HHVic, I love you!
文本文件的读取 read()
- read([size])
从文字读取size个字符,并作为结果返回. 如果没有size参数,则读取整个文件.
读取到文件末尾,会返回空字符串. - readline()
读取一行作为过返回. 读取到文章末尾, 会返回空字符串. - readlines()
文本文件中,每一行作为一个字符串存入列表中,返回该列表.
with open(r'a.txt','r', encoding = 'utf8') as f:
str = f.read()
print(str)
HHVic, I love you!
www.csdn.net
Vic
输入法
乾坤大挪移
读取前4个字符:
with open(r'a.txt','r', encoding = 'utf8') as f:
str = f.read(4)
print(str)
HHVi
读取第一行:
with open(r'a.txt','r', encoding = 'utf8') as f:
str = f.readline()
print(str)
HHVic, I love you!
读取多行(循环readline):
with open(r'a.txt', 'r', encoding='utf8') as f:
for a in f:
print(a, end='')
HHVic, I love you!
www.csdn.net
Vic
输入法
乾坤大挪移
读取多行存入列表:
with open(r'a.txt','r', encoding = 'utf8') as f:
str = f.readlines()
print(str)
['HHVic, I love you!\n', 'www.csdn.net\n', 'Vic\n', '输入法\n', '乾坤大挪移\n']
enumerate()函数
a = ['HHVic, I love you!','www.csdn.net','输入法','乾坤大挪移']
b = enumerate(a)
print(a)
print(b)
print(list(b))
c = [temp+' #' + str(index) for index, temp in enumerate(a)] # 每行后面加#数字
print(c)
['HHVic, I love you!', 'www.csdn.net', '输入法', '乾坤大挪移']
<enumerate object at 0x000002AD9E566900>
[(0, 'HHVic, I love you!'), (1, 'www.csdn.net'), (2, '输入法'), (3, '乾坤大挪移')]
['HHVic, I love you! #0', 'www.csdn.net #1', '输入法 #2', '乾坤大挪移 #3']
推导式:
with open('a.txt', 'r', encoding='utf8') as f:
lines = f.readlines()
lines = [line.rstrip() +' #'+ str(index) for index, line in enumerate(lines)]
with open('a.txt', 'w', encoding='utf8') as f:
f.writelines(lines)
HHVic, I love you! #0www.csdn.net #1Vic #2输入法 #3乾坤大挪移 #4
二进制文件读取
with open('day12-7.JPG','rb') as f:
with open('day12-7_copy.JPG','wb') as w:
for line in f.readlines():
w.write(line)
print('图片copy成功!')
__seek()任意位置操作
操作的是字节数!!! 语法如下:
fileObject.seek(offset[, whence])
- offset – 开始的偏移量,也就是代表需要移动偏移的字节数,如果是负数表示从倒数第几位开始。
- whence:可选,默认值为 0。给 offset 定义一个参数,表示要从哪个位置开始偏移;0 代表从文件开头开始算起,1 代表从当前位置开始算起,2 代表从文件末尾算起。
with open('a.txt','r',encoding='utf-8') as f:
print('文件名是: {0}'.format(f.name))
print(f.tell())
print('文件名是: {0}'.format(str(f.readline())))
print(f.tell())
print('文件名是: {0}'.format(str(f.readline())))
print(f.tell())
f.seek(0)
print('文件名是: {0}'.format(str(f.readline())))
print(f.tell())
文件名是: a.txt
0
文件名是: HHVic, I love you! #0
23
文件名是: www.csdn.net #1Vic #2
46
文件名是: HHVic, I love you! #0
23
使用pickle序列化
对象的序列化: 将对象转化成’串行化’数据形式. 存储到硬盘或者通过网络传输到其他地方.
对象的反序列化: 将读取到的’串行化数据’ 转化成对象.
pickle.dump(obj, file[, protocol])
序列化对象,并将结果数据流写入到文件对象中。参数protocol是序列化模式,默认值为0,表示以文本的形式序列化。protocol的值还可以是1或2,表示以二进制的形式序列化。
pickle.load(file)
反序列化对象。将文件中的数据解析为一个Python对象。
其中要注意的是,在load(file)的时候,要让python能够找到类的定义,否则会报错:
import pickle
a1 = 'HHVic'
a2 = 23424
a3 = [1,2,3,4]
with open('b.mov','wb') as f:
pickle.dump(a1, f)
pickle.dump(a2, f)
pickle.dump(a3, f)
with open('b.mov','rb') as f:
b1 = pickle.load(f)
b2 = pickle.load(f)
b3 = pickle.load(f)
print(b1); print(b2); print(b3)
HHVic
23424
[1, 2, 3, 4]