第一章 数据可视化与matplotlib
1、数据可视化的概述
数据可视化在维基百科上是这样定义的:指一种表示数据或信息的技术,它将数据或信息编码为包含在图形里的可见对象,如点、线、条等,目的是将信息更加清晰有效地传达给用户,是数据分析或数据科学的关键技术之一。简单地说,数据可视化就是以图形化方式表示数据。决策者可以通过图形直观地看到数据分析结果,从而更容易理解业务变化趋势或发现新的业务模式。使用可视化工具,可以在图形或图表上进行下钻,以进一步获得更细节的信息,交互式地观察数据改变或处理过程。
2、matplotlib概述
数据可视化在机器学习和数据科学中是很重要的组成部分。在数据分析阶段,数据可视化能够帮助我们理解洞察数据间关系;在算法调试阶段,数据可视化能够发现问题,优化算法;在项目总结阶段,数据可视化能够展示项目成果。
Matplotlib是绘制图表的第三方库,可以快速方便地生成高质量的图表,包括直方图,柱形图,散点图,气泡图,折线图,三维图等。
●安装Matplotlib库
Anaconda :安装了anaconda之后,Matplotlib就已经被安装好了
●导入Matplotlib库中的pyplot子库
import matplotlib.pyplot as plt
在pyplot中使用figure对象进行画图,他相当于一张画布,因此需要先创建对象
figure( num,