使用openpyxl将Dataframe数据以Excel格式存储 解决csv格式导出数据错乱,和excel格式导出会有单元格字符限制问题

本文介绍了一种利用openpyxl库处理长文本数据并导出到Excel的方法,解决了pandas to_excel方法因字符长度限制无法写入的问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

最近在写爬虫爬取文本数据中发现自己爬下来的文本数据太长,且里面有各式各样的符号,用csv格式存储的话会因为里面各种各样的符号(csv默认以逗号分隔)导致数据错乱乱码,用pandas库里面的to_Excel方法的话会因为这个方法会限制单个单元格里的字符长度而无法写入,openpyxl对pandas非常友好提供了方法可以直接导出数据,所以采用openpyxl库来进行写入话不多说直接上代码:

from openpyxl import Workbook
from openpyxl.utils.dataframe import dataframe_to_rows
import pandas as pd
#这个就是我们要导出的Dataframe
dataframe = pd.DataFrame({'name':name,'href':href,'time':times,'html_content':cont,'html_content_text':cont_text})
wb = Workbook()
ws = wb.active
for r in dataframe_to_rows(dataframe, index=True, header=True):
    ws.append(r)
wb.save("text2.xlsx")

上述代码只是openpyxl最简单的一个应用,大家可以详细的阅读openpyxl手册。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值