最近在写爬虫爬取文本数据中发现自己爬下来的文本数据太长,且里面有各式各样的符号,用csv格式存储的话会因为里面各种各样的符号(csv默认以逗号分隔)导致数据错乱乱码,用pandas库里面的to_Excel方法的话会因为这个方法会限制单个单元格里的字符长度而无法写入,openpyxl对pandas非常友好提供了方法可以直接导出数据,所以采用openpyxl库来进行写入话不多说直接上代码:
from openpyxl import Workbook
from openpyxl.utils.dataframe import dataframe_to_rows
import pandas as pd
#这个就是我们要导出的Dataframe
dataframe = pd.DataFrame({'name':name,'href':href,'time':times,'html_content':cont,'html_content_text':cont_text})
wb = Workbook()
ws = wb.active
for r in dataframe_to_rows(dataframe, index=True, header=True):
ws.append(r)
wb.save("text2.xlsx")
上述代码只是openpyxl最简单的一个应用,大家可以详细的阅读openpyxl手册。