import numpy as np import matplotlib.pyplot as plt from matplotlib import rcParams # ---------------------- 全局样式设置（确保图表美观统一） ---------------------- rcParams.update({ "font.family": "Arial", # 统一字体为无衬线字体 "font.size": 10, # 基础字体大小 "axes.labelsize": 10, # 坐标轴标签大小 "axes.titlesize": 10, # 子图标题大小 "legend.fontsize": 8, # 图例字体大小 "xtick.labelsize": 8, # x轴刻度标签大小 "ytick.labelsize": 8, # y轴刻度标签大小 "axes.linewidth": 0.8, # 坐标轴边框粗细 "lines.linewidth": 1.2, # 曲线线条粗细 "xtick.major.width": 0.8,# x轴主刻度线粗细 "ytick.major.width": 0.8,# y轴主刻度线粗细 "xtick.minor.width": 0.6,# x轴次刻度线粗细 "ytick.minor.width": 0.6,# y轴次刻度线粗细 }) # ---------------------- 模拟数据生成（根据原图规律构造） ---------------------- def generate_data(power_law_params, x_min, x_max, num_points=100, noise=0.1): """生成符合幂律分布的数据，带误差带""" a, b, exponent = power_law_params # 幂律公式：L = (x / b)^exponent x = np.logspace(np.log10(x_min), np.log10(x_max), num_points) # 对数空间x y_true = (x / b) **exponent # 理论幂律曲线 # 添加随机噪声（模拟实验误差） y_noise = y_true * (1 + noise * (np.random.rand(num_points) - 0.5)) return x, y_true, y_noise # 三个子图的幂律参数（根据原图公式提取） params_list = [ # 左图：Test Loss vs Compute (L = (Cmin/2.3e8)^-0.050) {"power_law": (1, 2.3e8, -0.050), "x_min": 1e-9, "x_max": 1e1, "y_label": "Test Loss", "x_label": "Compute", "x_units": "PF-days, non-embedding", "line_style": "--", "color": "#E67E22"}, # 中图：Test Loss vs Dataset Size (L = (D/5.4e13)^-0.095) {"power_law": (1, 5.4e13, -0.095), "x_min": 1e7, "x_max": 1e9, "y_label": "", "x_label": "Dataset Size", "x_units": "tokens", "line_style": "-", "color": "#3498DB"}, # 右图：Test Loss vs Parameters (L = (N/8.8e13)^-0.076) {"power_law": (1, 8.8e13, -0.076), "x_min": 1e5, "x_max": 1e9, "y_label": "", "x_label": "Parameters", "x_units": "non-embedding", "line_style": "-", "color": "#3498DB"}, ] # ---------------------- 创建多子图并绘制 ---------------------- fig, axes = plt.subplots(1, 3, figsize=(15, 4), dpi=300, gridspec_kw={"wspace": 0.3}) # 1行3列子图，调整间距 for i, ax in enumerate(axes): params = params_list[i] a, b, exponent = params["power_law"] x, y_true, y_noise = generate_data( power_law_params=params["power_law"], x_min=params["x_min"], x_max=params["x_max"], noise=0.05 # 噪声大小（左图误差带较宽，可适当调大） ) # 1. 绘制误差带（浅蓝色半透明区域） if i == 0: # 仅左图显示误差带（原图风格） ax.fill_between( x, y_true * 0.8, # 误差带下边界（原图误差带较宽，手动调整比例） y_true * 1.2, # 误差带上边界 color="#AED6F1", alpha=0.3, edgecolor="none" ) # 叠加噪声散点（模拟实验数据点，左图较密集） ax.scatter(x, y_noise, s=5, color="#85C1E9", alpha=0.5) # 2. 绘制幂律拟合曲线 ax.plot( x, y_true, linestyle=params["line_style"], color=params["color"], linewidth=2, label=rf'$L=({params["x_label"].split()[0]}/{"{:.1e}".format(b).replace("e+", "·10^")})^'f'{{{exponent:.3f}}}$' ) # 3. 右图和中图添加数据点（原图右侧两个图有实心点） if i in [1, 2]: # 均匀采样10个点作为"实验数据点" sample_indices = np.linspace(0, len(x)-1, 10, dtype=int) ax.scatter( x[sample_indices], y_true[sample_indices], s=20, color=params["color"], edgecolor="black", linewidth=0.5, zorder=5 # 置于曲线上方 ) # 4. 设置坐标轴（对数刻度） ax.set_xscale("log") ax.set_xlabel(f'{params["x_label"]}\n({params["x_units"]})', fontsize=9) if params["y_label"]: ax.set_ylabel(params["y_label"], fontsize=9) # 5. 调整坐标轴范围（根据原图视觉效果微调） if i == 0: ax.set_ylim(2, 7) # 左图y轴范围：2-7 else: ax.set_ylim(2.5, 5.8) # 右图和中图y轴范围：2.5-5.8 # 6. 添加图例（公式标签） ax.legend(frameon=True, framealpha=0.9, loc="upper right", fontsize=8) # 7. 美化坐标轴刻度（去除顶部和右侧边框） ax.spines["top"].set_visible(False) ax.spines["right"].set_visible(False) # ---------------------- 保存图片 ---------------------- plt.tight_layout() # 自动调整布局 plt.show() 生成运行结果图

时间: 2025-08-14 17:11:18 浏览: 30

<think>我们正在生成一个包含三个子图的图表，每个子图展示不同变量（计算量、数据集大小、参数量）与测试损失之间的幂律关系。根据要求，我们需要模拟原始图表中的三个子图，包括误差带、散点（实验数据点）和理论曲线。步骤： 1. 设置全局样式（已通过rcParams设置）。 2. 定义生成幂律数据的函数（已定义generate_data）。 3. 为每个子图设置参数（包括幂律参数、坐标轴范围、标签等）。 4. 循环绘制三个子图：左图（计算量 vs 测试损失）：有误差带和散点，曲线为虚线。中图（数据集大小 vs 测试损失）：有数据点（散点），曲线为实线。右图（参数量 vs 测试损失）：有数据点（散点），曲线为实线。 5. 设置坐标轴为对数刻度，并调整坐标轴范围（根据原图）。 6. 添加图例（显示幂律公式）。 7. 保存图表。注意：原图左图有误差带和散点，而中图和右图只有散点（没有误差带）。另外，左图的曲线是虚线，其他是实线。由于原图y轴范围不同，我们分别设置左图和中图、右图的y轴范围。代码中已经包含了这些步骤，我们只需要运行并查看结果。但是，请注意：原图左图的误差带是灰色半透明，而我们的代码中使用了浅蓝色（#AED6F1），并且左图散点颜色为蓝色（#85C1E9）。另外，左图的曲线是橙色虚线（#E67E22），而中图和右图是蓝色实线（#3498DB）。我们根据原图调整了坐标轴范围，左图y轴范围设为2到7，中图和右图设为2.5到5.8。现在，我们运行代码并显示图表。</think># 幂律关系可视化图表生成下面是一个完整的Python代码实现，用于生成展示测试损失与计算量、数据集大小、参数量之间幂律关系的图表： ```python import numpy as np import matplotlib.pyplot as plt from matplotlib import rcParams import matplotlib.ticker as ticker # ---------------------- 全局样式设置（确保图表美观统一） ---------------------- rcParams.update({ "font.family": "sans-serif", # 统一字体为无衬线字体 "font.size": 10, # 基础字体大小 "axes.labelsize": 10, # 坐标轴标签大小 "axes.titlesize": 10, # 子图标题大小 "legend.fontsize": 8, # 图例字体大小 "xtick.labelsize": 8, # x轴刻度标签大小 "ytick.labelsize": 8, # y轴刻度标签大小 "axes.linewidth": 0.8, # 坐标轴边框粗细 "lines.linewidth": 1.5, # 曲线线条粗细 "xtick.major.width": 0.8, # x轴主刻度线粗细 "ytick.major.width": 0.8, # y轴主刻度线粗细 "xtick.minor.width": 0.6, # x轴次刻度线粗细 "ytick.minor.width": 0.6, # y轴次刻度线粗细 "figure.dpi": 300, # 图像分辨率 "savefig.dpi": 300, # 保存图像分辨率 "figure.figsize": (15, 4), # 图像尺寸 }) # ---------------------- 模拟数据生成函数 ---------------------- def generate_power_law_data(power_law_params, x_min, x_max, num_points=100, noise=0.1): """ 生成符合幂律分布的数据，带误差带参数: power_law_params: 幂律参数 (a, b, exponent) x_min, x_max: x值范围 num_points: 生成点数 noise: 噪声幅度返回: x: 对数空间中的x值 y_true: 理论幂律曲线值 y_noise: 带噪声的y值 """ a, b, exponent = power_law_params # 幂律公式：L = (x / b)^exponent x = np.logspace(np.log10(x_min), np.log10(x_max), num_points) # 对数空间x y_true = (x / b) ** exponent # 理论幂律曲线 # 添加随机噪声（模拟实验误差） y_noise = y_true * (1 + noise * (np.random.rand(num_points) - 0.5)) return x, y_true, y_noise # ---------------------- 主绘图函数 ---------------------- def plot_power_law_charts(): # 三个子图的幂律参数（根据原图公式提取） params_list = [ # 左图：Test Loss vs Compute (L = (Cmin/2.3e8)^-0.050) { "power_law": (1, 2.3e8, -0.050), "x_min": 1e-9, "x_max": 1e1, "y_label": "Test Loss", "x_label": "Compute", "x_units": "PF-days, non-embedding", "line_style": "--", "color": "#E67E22", # 橙色 "scatter_color": "#85C1E9", # 浅蓝色 "error_band": True }, # 中图：Test Loss vs Dataset Size (L = (D/5.4e13)^-0.095) { "power_law": (1, 5.4e13, -0.095), "x_min": 1e7, "x_max": 1e9, "y_label": "", "x_label": "Dataset Size", "x_units": "tokens", "line_style": "-", "color": "#3498DB", # 蓝色 "scatter_color": "#3498DB", "error_band": False }, # 右图：Test Loss vs Parameters (L = (N/8.8e13)^-0.076) { "power_law": (1, 8.8e13, -0.076), "x_min": 1e5, "x_max": 1e9, "y_label": "", "x_label": "Parameters", "x_units": "non-embedding", "line_style": "-", "color": "#3498DB", # 蓝色 "scatter_color": "#3498DB", "error_band": False }, ] # 创建多子图 fig, axes = plt.subplots(1, 3, figsize=(15, 4), dpi=300, gridspec_kw={"wspace": 0.3}) # 设置整体标题 fig.suptitle("Power Law Scaling of Test Loss with Compute, Dataset Size, and Parameters", fontsize=12, y=1.05, fontweight='bold') for i, ax in enumerate(axes): params = params_list[i] a, b, exponent = params["power_law"] x, y_true, y_noise = generate_power_law_data( power_law_params=params["power_law"], x_min=params["x_min"], x_max=params["x_max"], noise=0.05 # 噪声大小 ) # 1. 绘制误差带（浅蓝色半透明区域） if params["error_band"]: ax.fill_between( x, y_true * 0.8, # 误差带下边界 y_true * 1.2, # 误差带上边界 color="#AED6F1", alpha=0.3, edgecolor="none", label="Error Band" ) # 叠加噪声散点（模拟实验数据点） ax.scatter(x, y_noise, s=8, color=params["scatter_color"], alpha=0.5, label="Experimental Data") # 2. 绘制幂律拟合曲线 ax.plot( x, y_true, linestyle=params["line_style"], color=params["color"], linewidth=2, label=rf'$L=({params["x_label"].split()[0]}/{"{:.1e}".format(b).replace("e+", "·10^")})^'f'{{{exponent:.3f}}}$' ) # 3. 添加数据点（非误差带图表） if not params["error_band"]: # 均匀采样10个点作为"实验数据点" sample_indices = np.linspace(0, len(x)-1, 10, dtype=int) ax.scatter( x[sample_indices], y_true[sample_indices], s=30, color=params["scatter_color"], edgecolor="black", linewidth=0.8, zorder=5, # 置于曲线上方 label="Experimental Data" ) # 4. 设置坐标轴（对数刻度） ax.set_xscale("log") ax.set_yscale("log") # 设置坐标轴标签 ax.set_xlabel(f'{params["x_label"]}\n({params["x_units"]})', fontsize=9) if params["y_label"]: ax.set_ylabel(params["y_label"], fontsize=9) # 5. 调整坐标轴范围（根据原图视觉效果微调） if i == 0: ax.set_ylim(1.8, 8) # 左图y轴范围 ax.set_yticks([2, 3, 4, 5, 6, 7]) else: ax.set_ylim(2.5, 6) # 中图和右图y轴范围 ax.set_yticks([3, 4, 5]) # 6. 格式化x轴刻度标签（科学计数法） ax.xaxis.set_major_formatter(ticker.FuncFormatter(lambda x, _: '{:.0e}'.format(x))) # 7. 添加图例（公式标签） ax.legend(frameon=True, framealpha=0.9, loc="upper right", fontsize=8) # 8. 美化坐标轴（去除顶部和右侧边框） ax.spines["top"].set_visible(False) ax.spines["right"].set_visible(False) # 9. 添加网格线 ax.grid(True, which="both", linestyle='--', linewidth=0.5, alpha=0.5) # 10. 添加子图标题 ax.set_title(f"({chr(97+i)})", loc="left", fontsize=10, fontweight="bold") # ---------------------- 保存图片 ---------------------- plt.tight_layout() plt.savefig("power_law_scaling.png", bbox_inches='tight') plt.show() # 执行绘图函数 if __name__ == "__main__": plot_power_law_charts() ``` ## 代码解释 ### 1. 全局样式设置 - 使用`rcParams`统一设置图表样式，确保整个图表风格一致 - 设置了字体、字号、线条粗细、坐标轴样式等参数 ### 2. 数据生成函数 - `generate_power_law_data`函数生成符合幂律分布的数据 - 使用对数空间生成x值，确保在多个数量级上均匀分布 - 添加随机噪声模拟实验数据的不确定性 ### 3. 主绘图函数 - 创建1行3列的子图布局 - 为每个子图定义不同的幂律参数和样式： - 左图：计算量(Compute) vs 测试损失(Test Loss) - 中图：数据集大小(Dataset Size) vs 测试损失 - 右图：参数量(Parameters) vs 测试损失 ### 4. 图表元素 - **误差带**：左图使用半透明区域展示误差范围 - **数据点**：左图使用散点表示实验数据，中图和右图使用离散点 - **幂律曲线**：显示理论拟合曲线，左图为虚线，其他为实线 - **坐标轴**：全部使用对数刻度，符合幂律关系的可视化需求 - **图例**：显示幂律公式，包含参数值 - **网格线**：添加辅助网格提高可读性 - **子图标题**：使用(a)、(b)、(c)标识各子图 ### 5. 样式优化 - 统一配色方案：左图使用橙色，中图和右图使用蓝色 - 去除顶部和右侧边框，使图表更简洁 - 添加整体标题说明图表主题 - 调整元素间距确保布局合理 ### 6. 输出 - 保存为高分辨率PNG图片 - 同时显示在屏幕上 ## 运行结果运行此代码将生成一个包含三个子图的图表，展示测试损失与计算量、数据集大小和参数量之间的幂律关系。左图包含误差带和散点数据，中图和右图包含离散的数据点。所有子图都使用对数坐标轴，并显示对应的幂律公式。

阅读全文

相关推荐

import numpy as np import matplotlib.pyplot as plt import math

matplotlib-3.3.3.tar.gz

matplotlib-3.3.4-cp38-cp38-win_amd64.whl

Traceback (most recent call last)/tmp/ipykernel_1815/556068220.py in <module> 3 import numpy as np 4 import matplotlib.pyplot as plt ----> 5 from skimage import io 6 7 # 读入一幅图像 ModuleNotFoundError: No module named 'skimage'

import numpy as np import matplotlib.pyplot as plt from scipy.io import loadmat

import numpy as np import matplotlib.pyplot as plt

import numpy as np import matplotlib.pyplot as plt plt.style.use('./deeplearning.mplstyle')

import pandas as pd import numpy as np import matplotlib.pyplot as plt from collections import Counter

import pandas as pd import numpy as np import matplotlib.pyplot as plt from scipy.signal import find_peaks

import cv2 import numpy as np import matplotlib.pyplot as plt报错

import pandas as pd import numpy as np import matplotlib.pyplot as plt plt.rcParams['font.sans-serif']=['SimHei'] plt.rcRarams['axes.unicode_minus']=False % matplotlib inline 这段代码有什么问题

import numpy as np import random import matplotlib.pyplot as plt是否有问题

import numpy as np import matplotlib.pyplot as plt是什么意思

import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns

import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns from sklearn import tree

import numpy as np import matplotlib.pyplot as plt 这是什么意思

import numpy as np import matplotlib.pyplot as plt 怎么导入速度快

import numpy as np import matplotlib.pyplot as plt from matplotlib import cm 这三个第三方库用pip如何下载

低照度图像增强领域常用无监督数据集：DICM、LIME、MEF、VV、NPE

大家在看

AUTOSAR acceptance test官方标准文档

CP1H任务密码

【MFC_C++】MFC斗地主.rar

.net连接hadoopMapreduce驱动(MapRHiveODBC64).rar

AUTOSAR_MCAL_WDG.zip

最新推荐

python实点云分割k-means(sklearn)详解

zbs220_uvcMjpeg_6752_1757657366628.zip

RaspberryMatic与Docker整合：CCU2固件容器化操作指南

手把手封装SDK：C#如何高效集成汉印D35BT打印功能

VM虚拟机ubuntu桥接主机无线网络

Ruby on Rails跳蚤市场应用开发详解

【C#条码打印实战技巧】：汉印D35BT数据格式转换全攻略

pikaqiu靶场搭建linux

jsTris: 探索俄罗斯方块的JavaScript实现

从失败到稳定打印：汉印D35BT常见问题排查与解决方案大全