本文从下到上更新,最新发现的在最前面。
-
通过glob模块方便地读取文件夹中文件列表
假设文件存放在root根目录下,文件名均为".txt"的后缀。可以一行语句读取所有文件路径:
import glob
files = glob.glob( root_dir + '*.txt' )
读取的文件是无序的,可通过sorted对文件路径排序:
files = sorted( files, key = lambda x: x[x.rindex("\\")+1:] )
-
通过csv模块快速写入文件
一般手动写入文件,需要open打开文件,把数据转化为string类型写入文件、close文件。虽然操作简单,写出来代码不优雅。
csv模块省略文件关闭操作。把list写入文件时,也不用考虑元素类型。elegant!
import csv
writer = csv.writer( open( output_file, 'w', newline=''))
writer.writerow( [ 'id', 'label' ] )
writerow()函数写入文件时会默认在行尾加个空行,加入newline=''是为了消除这个空行。
-
通过Numpy.genfromtxt读取并格式化数据
为了得到我们需要的有用数据,我们有两个硬的要求: (1) 跳过表头信