Matplotlib库

一、概念

Matplotlib 库:是一款用于数据可视化的 Python 软件包,支持跨平台运行,它能够根据 NumPy ndarray 数组来绘制 2D 图像,它使用简单、代码清晰易懂

二、安装

在pip install matplotlib -i https://pypi.tuna.tsinghua.edu.cn/simple/这里插入代码片

三、应用场景

数据可视化主要有以下应用场景:

  • 企业领域:利用直观多样的图表展示数据,从而为企业决策提供支持
  • 股票走势预测:通过对股票涨跌数据的分析,给股民提供更合理化的建议
  • 商超产品销售:对客户群体和所购买产品进行数据分析,促使商超制定更好的销售策略
  • 预测销量:对产品销量的影响因素进行分析,可以预测出产品的销量走势

四、常用API

4.1 绘图类型

函数名称描述
Bar绘制条形图
Barh绘制水平条形图
Boxplot绘制箱型图
Hist绘制直方图
his2d绘制2D直方图
Pie绘制饼状图
Plot在坐标轴上画线或者标记
Polar绘制极坐标图
Scatter绘制x与y的散点图
Stackplot绘制堆叠图
Stem用来绘制二维离散数据绘制(又称为火柴图)
Step绘制阶梯图
Quiver绘制一个二维按箭头

4.2 lmage 函数

函数名称描述
Imread从文件中读取图像的数据并形成数组
Imsave将数组另存为图像文件
Imshow在数轴区域内显示图像

4.3 Axis 函数

函数名称描述
Axes在画布(Figure)中添加轴
Text向轴添加文本
Title设置当前轴的标题
Xlabel设置x轴标签
Xlim获取或者设置x轴区间大小
Xscale设置x轴缩放比例
Xticks获取或设置x轴刻标和相应标签
Ylabel设置y轴的标签
Ylim获取或设置y轴的区间大小
Yscale设置y轴的缩放比例
Yticks获取或设置y轴的刻标和相应标签

4.4 Figure 函数

函数名称描述
Figtext在画布上添加文本
Figure创建一个新画布
Show显示数字
Savefig保存当前画布
Close关闭画布窗口

五、pylab模块

PyLab 是一个面向 Matplotlib 的绘图库接口,其语法和 MATLAB 十分相近。

pylab 是 matplotlib 中的一个模块,它将 matplotlib.pyplot 和 numpy 的功能组合在一起,使得你可以直接使用 numpy 的函数和 matplotlib.pyplot 的绘图功能,而不需要显式地导入 numpy 和 matplotlib.pyplot。

优点:

  • 方便快捷:pylab 的设计初衷是为了方便快速绘图和数值计算,使得你可以直接使用 numpy 的函数和 matplotlib.pyplot 的绘图功能,而不需要显式地导入 numpy 和 matplotlib.pyplot。
  • 简化代码:使用 pylab 可以减少导入语句的数量,使代码更简洁。

缺点:

  • 命名空间污染:pylab 将 numpy 和 matplotlib.pyplot 的功能组合在一起,可能会导致命名空间污染,使得代码的可读性和可维护性降低。
  • 不适合大型项目:对于大型项目或需要精细控制的项目,pylab 可能不够灵活。

pyplot 是 matplotlib 中的一个模块,提供了类似于 MATLAB 的绘图接口。它是一个更底层的接口,提供了更多的控制和灵活性。

使用 pyplot 需要显式地导入 numpy 和 matplotlib.pyplot,代码量相对较多。例如:

import matplotlib.pyplot as plt
import numpy as np

六、常用函数

6.1 plot 函数

pylab.plot 是一个用于绘制二维图形的函数。它可以根据提供的 x 和 y 数据点绘制线条和/或标记。
语法:

pylab.plot(x, y, format_string=None, **kwargs)

参数:

  • x: x 轴数据,可以是一个数组或列表。
  • y: y 轴数据,可以是一个数组或列表。
  • format_string: 格式字符串,用于指定线条样式、颜色等。
  • **kwargs: 其他关键字参数,用于指定线条的属性。

格式字符串:
格式字符串由颜色、标记和线条样式组成。例如:
颜色:
‘b’:蓝色 ‘g’:绿色 ‘r’:红色 ‘c’:青色 ‘m’:洋红色 ‘y’:黄色 ‘k’:黑色 ‘w’:白色
标记:(用的不多,记得常用的就行!)
‘.’:点标记
‘,’:像素标记
‘o’:圆圈标记
线条样式:
‘-’:实线 ‘–’:虚线 ‘-.’:点划线 ‘:’:点线
案例:

from matplotlib import pyplot as plt
import numpy as np

def test01():

    x = np.linspace(5, 20, 100)
    y = np.sin(x)

    # plot():绘制图形
    # 参数
    # format_string: 格式字符串,用于指定线条样式、颜色等
    plt.plot(x, y, "r--")  #颜色 线的样式

    #显示图形
    plt.show()
if __name__ == '__main__':
	test01()

6.2 figure 函数

figure() 函数来实例化 figure 对象,即绘制图形的对象,可以通过这个对象,来设置图形的样式等
参数:

  • figsize:指定画布的大小,(宽度,高度),单位为英寸
  • dpi:指定绘图对象的分辨率,即每英寸多少个像素,默认值为80
  • facecolor:背景颜色
  • dgecolor:边框颜色
  • frameon:是否显示边框

6.2.1 figure.add_axes()

Matplotlib 定义了一个 axes 类(轴域类),该类的对象被称为 axes 对象(即轴域对象),它指定了一个有数值范围限制的绘图区域。在一个给定的画布(figure)中可以包含多个 axes 对象,但是同一个 axes 对象只能在一个画布中使用。
参数:
是一个包含四个元素的列表或元组,格式为 [left, bottom, width, height],其中:
left 和 bottom 是轴域左下角的坐标,范围从 0 到 1。
width 和 height 是轴域的宽度和高度,范围从 0 到 1。
案例:

from matplotlib import pyplot as plt
import numpy as np

def test02():
    # figure():生成画布
    # 参数
    # figsize:画布的宽和高,数据格式是元组,单位:英寸
    fig = plt.figure(figsize=(10, 10))

    # add_axes:画布生成绘图区域
    # 参数
    # left, bottom, width, height:取值范围是0到1之间
    ax = fig.add_axes([0.1, 0.1, 0.8, 0.8])

    x = np.linspace(-10, 10, 100)
    y = x ** 2

    #通过绘图区域对象绘制图形,使图形绘制在绘图区域里
    ax.plot(x, y)
    plt.show()
if __name__ == '__main__':
	test02()

6.2.2 axes.legend()

legend 函数用于添加图例,以便识别图中的不同数据系列。图例会自动显示每条线或数据集的标签。
参数:

  • labels 是一个字符串序列,用来指定标签的名称
  • loc 是指定图例位置的参数,其参数值可以用字符串或整数来表示
  • handles 参数,它也是一个序列,它包含了所有线型的实例

案例:

from matplotlib import pyplot as plt
import numpy as np

def test03():
    fig = plt.figure()
    ax = fig.add_axes([0.1, 0.1, 0.8, 0.8])

    x = np.linspace(-10, 10, 100)
    y = x ** 2

    # legend():设置图形的图例
    # 参数:
    # handles:设置图形实例,数据格式是列表
    # labels:设置图形实例的标签说明,数据格式是列表
    # loc:设置图例显示的位置

    # plot:返回对象是一个列表
    # line = ax.plot(x, y)
    # print(type(line))
    # ax.legend(handles=line, labels=['x^2'], loc='best')

    # 图例设置第二种方式:(常用)
    # 1、在plot方法中添加label参数,设置图例说明
    # 2、调用legend方法使图例生效,legend方法可以不用设置handles和labels
    ax.plot(x, y, label='x^2 函数')
    ax.legend(loc='upper right')
    plt.show()

if __name__ == '__main__':
    test03()

legend() 函数 loc 参数:

位置字符串表示整数数字表示
自适应Best0
右上方upper right1
左上方upper left2
左下lower left3
右下lower right4
右侧right5
居中靠左center left6
居中靠右center right7
底部居中lower center8
上部居中upper center9
中部center10

6.3 标题中文乱码

局部处理:

plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False

案例:

#该代码中的 中文 可以显示在图形上
ax.plot(x, y, label='x^2 函数')

6.4 subplot 函数

subplot 是一个较早的函数,用于创建并返回一个子图对象。它的使用比较简单,通常用于创建网格状的子图布局。subplot 的参数通常是一个三位数的整数,其中每个数字代表子图的行数、列数和子图的索引。

add_subplot 是一个更灵活的函数,它是 Figure类的一个方法,用于向图形容器中添加子图。推荐使用 add_subplot,因为它提供了更好的灵活性和控制。
语法:

fig.add_subplot(nrows, ncols, index)

案例:

from matplotlib import pyplot as plt
import numpy as np

def test01():
    # 准备数据
    x = np.linspace(0, 10, 100)
    y1 = np.sin(x)
    y2 = np.cos(x)
    y3 = np.tan(x)

    # 生成figure画布
    fig = plt.figure(figsize=(12, 4))

    # 添加第一个绘图区域
    # fig.add_subplot()方法不适用于很多个绘图方法的情况
    ax1 = fig.add_subplot(1,3,1)
    ax1.plot(x, y1, label='sin(x)')
    plt.legend()

    # 添加第二个绘图区域
    ax2 = fig.add_subplot(1,3,2)
    ax2.plot(x, y2, label='cos(x)')
    plt.legend()

    # 添加第三个绘图区域
    ax3 = fig.add_subplot(1,3,3)
    ax3.plot(x, y3, label='tan(x)')
    # 使图例生效
    plt.legend()

    plt.show()
if __name__ == '__main__':
    test01()

6.5 subplots 函数

subplots 是 matplotlib.pyplot 模块中的一个函数,用于创建一个包含多个子图(subplots)的图形窗口。subplots 函数返回一个包含所有子图的数组,这使得你可以更方便地对每个子图进行操作。
语法:

fig, axs = plt.subplots(nrows, ncols, figsize=(width, height))

参数:

  • nrows: 子图的行数。
  • ncols: 子图的列数。
  • figsize: 图形的尺寸,以英寸为单位。

案例:

from matplotlib import pyplot as plt
import numpy as np
def test02():
    x = np.linspace(0, 10, 100)
    y1 = np.sin(x)
    y2 = np.cos(x)
    y3 = np.tan(x)
    
    # 按照nrows和ncols生成多个子图区域,在每个子图区域中绘制图形
    fig, axs = plt.subplots(1, 3, figsize=(12, 4))
    axs[0].plot(x, y1)
    axs[1].plot(x, y2)
    axs[2].plot(x, y3)

    plt.show()
if __name__ == '__main__':
    test02()

6.6 grid 函数

grid 是用于在图形中添加网格线的函数。网格线可以帮助读者更清晰地理解数据的分布和趋势。grid 函数可以应用于 Axes 对象,用于在子图中添加网格线。
语法:

ax.grid(b=None, which='major', axis='both', **kwargs)

参数:

  • b: 是否显示网格线,默认为 None,表示根据当前设置显示或隐藏网格线。
  • which: 指定要显示的网格线类型,可以是 ‘major’(主刻度)、‘minor’(次刻度)或 ‘both’(主刻度和次刻度)。
  • axis: 指定要显示网格线的轴,可以是 ‘both’(两个轴)、‘x’(X 轴)或 ‘y’(Y 轴)。
  • **kwargs: 其他可选参数,用于定制网格线的外观,如 color、linestyle、linewidth 等。

案例:

from matplotlib import pyplot as plt
import numpy as np

def test01():
    x = np.linspace(0, 10, 100)
    y = np.sin(x)

    fig, axs = plt.subplots()
    axs.plot(x, y)
    # grid():在图形中添加网格线
    # 参数:
    # b:是否显示网格线
    # which:指定要显示的网格线类型,可以是 'major'(主刻度)、'minor'(次刻度)或 'both'(主刻度和次刻度)
    # axis: 指定要显示网格线的轴,可以是 'both'(两个轴)、'x'(X 轴)或 'y'(Y 轴)。
    # **kwargs: 其他可选参数,用于定制网格线的外观,如 color、linestyle、linewidth 等。
    plt.grid(True, which='both', axis='both', color='r', linestyle='--', linewidth=0.5)

    #xscale、yscale设置x、y轴刻度类型
    plt.xscale('linear')
    plt.yscale('linear')

    # set_xlim、set_ylim:设置x、y轴的取值范围
    axs.set_xlim(0, 5)
    axs.set_ylim(0, 1)

    # set_xticks、set_yticks:自己设置刻度
    axs.set_xticks([1,2,4,6])
    axs.set_yticks([0,0.4,0.8,1])

    plt.show()
if __name__ == '__main__':
    test02()

6.7 xscale 和 yscale 函数

xscale 和 yscale 函数用于设置坐标轴的刻度类型。默认情况下,坐标轴的刻度类型是线性的,但你可以使用 xscale 和 yscale 函数将其更改为对数刻度或其他类型的刻度。
语法:

ax.set_xscale(value)
ax.set_yscale(value)

参数:
value: 刻度类型,可以是 ‘linear’(线性刻度)、‘log’(对数刻度)、‘symlog’(对称对数刻度)、‘logit’(对数几率刻度)等。
案例:

 #xscale、yscale设置x、y轴刻度类型
    plt.xscale('linear')
    plt.yscale('linear')

6.8 set_xlim 和 set_ylim 函数

set_xlim 和 set_ylim 函数用于设置坐标轴的范围。

语法:

ax.set_xlim(left, right)
ax.set_ylim(bottom, top)

参数:

  • left 和 right: X 轴的范围,left 是 X 轴的最小值,right 是 X 轴的最大值。
  • bottom 和 top: Y 轴的范围,bottom 是 Y 轴的最小值,top 是 Y 轴的最大值。

案例:

 # set_xlim、set_ylim:设置x、y轴的取值范围
    axs.set_xlim(0, 5)
    axs.set_ylim(0, 1)

6.9 set_xticks 和 set_yticks 函数

Matplotlib 可以自动根据因变量和自变量设置坐标轴范围,也可以通过 set_xticks() 和 set_yticks() 函数手动指定刻度,接收一个列表对象作为参数,列表中的元素表示对应数轴上要显示的刻度。
案例:

 # set_xticks、set_yticks:自己设置刻度
    axs.set_xticks([1,2,4,6])
    axs.set_yticks([0,0.4,0.8,1])

6.10 twinx 和 twiny 函数

twinx 和 twiny 函数用于在同一个图形中创建共享 X 轴或 Y 轴的多个子图。twinx 函数用于创建共享 X 轴的子图,twiny 函数用于创建共享 Y 轴的子图。
案例:

ax2 = ax.twinx()
ax2 = ax.twiny()

七、图形

7.1 柱状图

柱状图(Bar Chart)是一种常用的数据可视化工具,用于展示分类数据的分布情况。
语法:

ax.bar(x, height, width=0.8, bottom=None, align='center', **kwargs)

参数:

  • x: 柱状图的 X 轴位置。
  • height: 柱状图的高度。
  • width: 柱状图的宽度,默认为 0.8。
  • bottom: 柱状图的底部位置,默认为 0。
  • align: 柱状图的对齐方式,可以是 ‘center’(居中对齐)或 ‘edge’(边缘对齐)。
  • **kwargs: 其他可选参数,用于定制柱状图的外观,如 color、edgecolor、linewidth 等。

案例1-普通柱状图:`

from matplotlib import pyplot as plt
import numpy as np


# 数据
categories = ['A', 'B', 'C', 'D']
values = [20, 35, 30, 25]

# 创建图形和子图
fig, ax = plt.subplots()

# 绘制柱状图
ax.bar(categories, values, color='skyblue', linewidth=1.5, width=0.6)

# 设置标题和标签
ax.set_title('Customized Bar Chart')
ax.set_xlabel('Categories')
ax.set_ylabel('Values')

# 显示图形
plt.show()

案例2-堆叠柱状图:

# 数据
categories = ['A', 'B', 'C', 'D']
values1 = [20, 35, 30, 25]
values2 = [15, 25, 20, 10]

# 创建图形和子图
fig, ax = plt.subplots()

# 绘制第一个数据集的柱状图
ax.bar(categories, values1, color='skyblue', label='Values 1')

# 绘制第二个数据集的柱状图,堆叠在第一个数据集上
ax.bar(categories, values2, bottom=values1, color='lightgreen', label='Values 2')

# 设置标题和标签
ax.set_title('Stacked Bar Chart')
ax.set_xlabel('Categories')
ax.set_ylabel('Values')

# 添加图例
ax.legend()

# 显示图形
plt.show()

案例3-分组柱状图:

# 数据
categories = ['A', 'B', 'C', 'D']
values1 = [20, 35, 30, 25]
values2 = [15, 25, 20, 10]

# 创建图形和子图
fig, ax = plt.subplots()

# 计算柱状图的位置
x = np.arange(len(categories))
width = 0.35

# 绘制第一个数据集的柱状图
ax.bar(x - width/2, values1, width, color='skyblue', label='Values 1')

# 绘制第二个数据集的柱状图
ax.bar(x + width/2, values2, width, color='lightgreen', label='Values 2')

# 设置 X 轴标签
ax.set_xticks(x)
ax.set_xticklabels(categories)

# 设置标题和标签
ax.set_title('Grouped Bar Chart')
ax.set_xlabel('Categories')
ax.set_ylabel('Values')

# 添加图例
ax.legend()

# 显示图形
plt.show()

7.2 直方图

直方图(Histogram)是一种常用的数据可视化工具,用于展示数值数据的分布情况
语法:

ax.hist(x, bins=None, range=None, density=False, weights=None, cumulative=False, **kwargs)

参数:

  • x: 数据数组。
  • bins: 直方图的柱数,可以是整数或序列。
  • range: 直方图的范围,格式为 (min, max)。
  • density: 是否将直方图归一化,默认为 False。
  • weights: 每个数据点的权重。
  • cumulative: 是否绘制累积直方图,默认为 False。
  • **kwargs: 其他可选参数,用于定制直方图的外观,如 color、edgecolor、linewidth 等。

案例:

from matplotlib import pyplot as plt
import numpy as np

# 生成随机数据,生成均值为 0,标准差为 1 的标准正态分布的随机样本
data = np.random.randn(1000)

# 创建图形和子图
fig, ax = plt.subplots()

# 绘制直方图
ax.hist(data, bins=30, color='skyblue', edgecolor='black')

# 设置标题和标签
ax.set_title('Simple Histogram')
ax.set_xlabel('Value')
ax.set_ylabel('Frequency')

# 显示图形
plt.show()

7.3 饼图

饼图(Pie Chart)是一种常用的数据可视化工具,用于展示分类数据的占比情况。
语法:

ax.pie(x, explode=None, labels=None, colors=None, autopct=None, shadow=False, startangle=0, **kwargs)

参数:

  • x: 数据数组,表示每个扇区的占比。
  • explode: 一个数组,表示每个扇区偏离圆心的距离,默认为 None。
  • labels: 每个扇区的标签,默认为 None。
  • colors: 每个扇区的颜色,默认为 None。
  • autopct: 控制显示每个扇区的占比,可以是格式化字符串或函数,默认为 None。
  • shadow: 是否显示阴影,默认为 False。
  • startangle: 饼图的起始角度,默认为 0。
  • **kwargs: 其他可选参数,用于定制饼图的外观。

案例:

from matplotlib import pyplot as plt
import numpy as np

# 数据
labels = ['A', 'B', 'C', 'D']
sizes = [15, 30, 45, 10]

# 创建图形和子图
fig, ax = plt.subplots()

# 绘制饼图
ax.pie(sizes, labels=labels, autopct='%1.1f%%', startangle=90)

# 设置标题
ax.set_title('Simple Pie Chart')

# 显示图形
plt.show()

7.4 折线图

使用plot函数

案例:

from matplotlib import pyplot as plt

# 创建数据
x = np.linspace(0, 10, 100)
y1 = np.sin(x)
y2 = np.cos(x)

# 创建图形和子图
fig, ax = plt.subplots()

# 绘制多条折线图
ax.plot(x, y1, label='sin(x)', color='blue')
ax.plot(x, y2, label='cos(x)', color='red')

# 设置标题和标签
ax.set_title('Multiple Line Charts')
ax.set_xlabel('X-axis')
ax.set_ylabel('Y-axis')

# 添加图例
ax.legend()

# 显示图形
plt.show()

7.5散点图

散点图(Scatter Plot)是一种常用的数据可视化工具,用于展示两个变量之间的关系。

语法:

ax.scatter(x, y, s=None, c=None, marker=None, cmap=None, norm=None, vmin=None, vmax=None, alpha=None, linewidths=None, edgecolors=None, **kwargs)

参数:

  • x: X 轴数据。
  • y: Y 轴数据。
  • s: 点的大小,可以是标量或数组。
  • c: 点的颜色,可以是标量、数组或颜色列表。
  • marker: 点的形状,默认为 ‘o’(圆圈)。
  • cmap: 颜色映射,用于将颜色映射到数据。
  • norm: 归一化对象,用于将数据映射到颜色映射。
  • vmin, vmax: 颜色映射的最小值和最大值。
  • alpha: 点的透明度,取值范围为 0 到 1。
  • linewidths: 点的边框宽度。
  • edgecolors: 点的边框颜色。
  • **kwargs: 其他可选参数,用于定制散点图的外观。
    案例:
from matplotlib import pyplot as plt

plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
fig = plt.figure()
axes = fig.add_axes([.1,.1,.8,.8])
x = ['Mon', 'Tue', 'Wed', 'Thu', 'Fri', 'Sat', 'Sun']
data = [
    [120, 132, 101, 134, 90, 230, 210],
    [220, 182, 191, 234, 290, 330, 310],
]
y0 = data[0]
y1 = data[1]
axes.scatter(x,y0,color='red')
axes.scatter(x,y1,color='blue')
axes.set_title('散点图')
axes.set_xlabel('日期')
axes.set_ylabel('数量')
plt.legend(labels=['Email', 'Union Ads'],)
plt.show()

八、图片读取

plt.imread 是 Matplotlib 库中的一个函数,用于读取图像文件并将其转换为 NumPy 数组。这个函数非常方便,可以轻松地将图像加载到 Python 中进行处理或显示。
参数:

  • fname: 图像文件的路径(字符串)。

  • format: 图像格式(可选)。如果未指定,imread 会根据文件扩展名自动推断格式。
    返回值

  • 返回一个 NumPy 数组,表示图像的像素数据。数组的形状取决于图像的格式:

  • 对于灰度图像,返回一个二维数组 (height, width)

  • 对于彩色图像,返回一个三维数组 (height, width, channels),其中 channels 通常是 3(RGB)或 4(RGBA)。
    案例:

from matplotlib import pyplot as plt
import numpy as np
import os


def read_img():
    dirpath = os.path.dirname(__file__)
    print(dirpath)

    filepath = os.path.relpath(os.path.join(dirpath, 'leaf.png'))
    print(filepath)

    img = plt.imread(filepath)
    print(img.shape)
    plt.imshow(img)
    plt.show()

    img1 = np.transpose(img, (2, 0, 1))
    for channel in img1:
        plt.imshow(channel)
        plt.show()


if __name__ == '__main__':
    read_img()
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值