Pandas Excel操作：read_excel与to_excel函数详解

PDF文件

pandas

read_excel()

to_excel()

58KB | 更新于2024-09-01 | 103 浏览量 | 举报收藏

立即下载

"这篇文章主要讲解了pandas库中的read_excel()和to_excel()两个关键函数，它们用于Excel文件的读取和写入操作。通过具体的示例和参数解析，为学习或工作中处理Excel数据提供了参考。" 在数据分析过程中，Excel文件是一种常用的存储格式，而Python的pandas库提供了解析和保存Excel文件的强大功能。`read_excel()`和`to_excel()`就是这两个关键函数。 `read_excel()`函数用于从Excel文件中读取数据到DataFrame对象。它的主要参数有： 1. `io`: 这个参数是Excel文件的路径，可以是字符串或path对象。 2. `sheetname`: 指定要读取的工作表。默认值为0，意味着读取第一个工作表。可以设置为字符串、整数或包含多个工作表的列表。`sheetname=None`会读取所有工作表，并返回一个字典，键为工作表名称，值为DataFrame。 3. `header`: 定义列名所在的行。默认值为0，即第一行。若数据没有列名，可设为`header=None`。 4. `skiprows`: 可以是一个包含行号的列表，用于跳过开头的指定行。 5. `skip_footer`: 从文件底部起跳过的行数。 6. `index_col`: 指定用作DataFrame索引的列。可以是整数、列名或包含多个列的列表。 7. `names`: 当数据中没有列名时，可以手动指定列名的数组。举例来说，假设我们有一个名为'sheet1'的Excel工作表，其内容如下： ``` ID NUM-1 NUM-2 NUM-3 36901142168661 3690278521602 36903144600521 3690495457468 3690 ``` 我们可以使用如下代码读取该工作表： ```python import pandas as pd df = pd.read_excel('file.xlsx', sheet_name='sheet1', header=0) ``` `to_excel()`函数则负责将DataFrame对象写入Excel文件。它的主要参数包括： 1. `io`: 输出文件的路径或FileObject。 2. `sheet_name`: 工作表的名称，默认为0，表示新建一个工作表。 3. `index`: 是否包含索引，默认为True。 4. `header`: 是否包含列名，默认为True。 5. `na_rep`: 缺失值的表示方式。 6. `float_format`: 浮点数的格式化规则。例如，如果我们有一个DataFrame `df`，并希望将其保存为Excel文件，可以这样操作： ```python df.to_excel('output.xlsx', index=False) ``` 这将在当前目录下创建一个名为'output.xlsx'的Excel文件，其中包含DataFrame的内容，且不包含索引列。 `read_excel()`和`to_excel()`是pandas与Excel文件交互的重要工具，它们使得在Python中处理Excel数据变得简单高效。在实际工作中，根据具体需求调整这些函数的参数，可以灵活地完成数据的读取和保存任务。

pandas read_excel()和和to_excel()函数解析函数解析

主要介绍了pandas read_excel()和to_excel()函数解析，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学

习学习吧

前言前言

数据分析时候，需要将数据进行加载和存储，本文主要介绍和excel的交互。

read_excel()

加载函数为read_excel(),其具体参数如下。

read_excel(io, sheetname=0, header=0, skiprows=None, skip_footer=0, index_col=None,names=None, parse_cols=None, parse_dates=False,date_parser=None,na_values=None,thousands=None, convert_float=True, has_index_names=None, converters=None,dtype=None, true_values=None, false_values=None, engine=None, squeeze=False, **kwds)

常用参数解析：

io : string, path object ; excel 路径。

sheetname : string, int, mixed list of strings/ints, or None, default 0 返回多表使用sheetname=[0,1],若sheetname=None是返回全表注意：int/string 返回的是dataframe，而none和list返回的是dict of

dataframe

header : int, list of ints, default 0 指定列名行，默认0，即取第一行，数据为列名行以下的数据若数据不含列名，则设定 header = None

skiprows : list-like,Rows to skip at the beginning，省略指定行数的数据

skip_footer : int,default 0, 省略从尾部数的int行数据

index_col : int, list of ints, default None指定列为索引列，也可以使用u”strings”

names : array-like, default None, 指定列的名字。

数据源：

sheet1:

ID NUM-1 NUM-2 NUM-3

36901 142 168 661

36902 78 521 602

36903 144 600 521

36904 95 457 468

36905 69 596 695

sheet2：

ID NUM-1 NUM-2 NUM-3

36906 190 527 691

36907 101 403 470

(1)函数原型

basestation ="F://pythonBook_PyPDAM/data/test.xls"

data = pd.read_excel(basestation)

print data

输出：是一个dataframe

ID NUM-1 NUM-2 NUM-3

0 36901 142 168 661

1 36902 78 521 602

2 36903 144 600 521

3 36904 95 457 468

4 36905 69 596 695

(2) sheetname参数：返回多表使用sheetname=[0,1],若sheetname=None是返回全表注意：int/string 返回的是dataframe，而none和list返回的是dict of dataframe

data_1 = pd.read_excel(basestation,sheetname=[0,1])

print data_1

print type(data_1)

输出：dict of dataframe

OrderedDict([(0, ID NUM-1 NUM-2 NUM-3

0 36901 142 168 661

1 36902 78 521 602

2 36903 144 600 521

3 36904 95 457 468

4 36905 69 596 695),

(1, ID NUM-1 NUM-2 NUM-3

0 36906 190 527 691

1 36907 101 403 470)])

（3）header参数:指定列名行，默认0，即取第一行，数据为列名行以下的数据若数据不含列名，则设定 header = None ，注意这里还有列名的一行。

data = pd.read_excel(basestation,header=None)

print data

输出：

0 1 2 3

0 ID NUM-1 NUM-2 NUM-3

1 36901 142 168 661

2 36902 78 521 602

3 36903 144 600 521

4 36904 95 457 468

5 36905 69 596 695

data = pd.read_excel(basestation,header=[3])

print data

输出：

36903 144 600 521

0 36904 95 457 468

1 36905 69 596 695

（4） skiprows 参数：省略指定行数的数据

data = pd.read_excel(basestation,skiprows = [1])

print data

输出:

ID NUM-1 NUM-2 NUM-3

0 36902 78 521 602

1 36903 144 600 521

2 36904 95 457 468

3 36905 69 596 695

(5)skip_footer参数：省略从尾部数的int行的数据

data = pd.read_excel(basestation, skip_footer=3)

print data

输出：

ID NUM-1 NUM-2 NUM-3

0 36901 142 168 661

1 36902 78 521 602

（6）index_col参数：指定列为索引列，也可以使用u”strings”

data = pd.read_excel(basestation, index_col="NUM-3")

print data

输出：

ID NUM-1 NUM-2

NUM-3

661 36901 142 168

602 36902 78 521

下载后可阅读完整内容，剩余3页未读，继续阅读

开通会员，免费下载（低至0.43元/天)

成为会员后, 你将解锁

下载资源随意下

优质VIP博文免费学

优质文库回答免费看

付费资源9折优惠

weixin_38704857

粉丝: 10

Pandas Excel操作：read_excel与to_excel函数详解

htmlToExcel.js

pandas read_excel

pandas read_excel

pandas read_excel参数

pandas read_excel方法的参数详解

pandas read_excel 数据全部定义为字符串

pandas系列 read_excel() 和 to_excel()各参数详解

详细介绍一下pandas库的read_excel和read_csv函数

Pandas与Excel交互：read_excel()与to_excel()详解

pandas的read_excel

pandas.read_excel参数

read_csv和read_excel是pandas库的函数还是pandas库中DataFrame类的方法

pandas.read_excel 详细参数

pandas.read_excel参数说明

pandas read_csv函数可以读xls文件吗

pandas.read_excel 参数详细用法

pandas.read_excel的扩展参数

基于Python实现的信息检索与文本挖掘综合搜索引擎系统-包含网络爬虫模块-网页内容解析与分词处理-索引构建与数据库存储-Web查询服务与结果展示-用于课程大作业与学术研究-技术栈.zip

【总结】网络安全基础知识

【工业激光3D投影系统】基于多算法融合的精度标定与补偿技术研究：实现亚毫米级高精度工业制造应用（论文复现含详细代码及解释）

最新资源

pandas　read_excel