还不秃顶的计科生-CSDN博客

原创 bash的基础使用介绍

当我们使用MacOS,Linux，Unix机器上打开终端时，那默认的终端就是Bash.

2025-06-23 16:25:06 229

原创向量的外积和内积运算（以及与矩阵运算的关系）

76 编程猫发布了一篇小红书笔记，快来看吧！😆 0dmS16RDdRiEgz0 😆 http://xhslink.com/a/6ANZ1GgRW3Dfb，复制本条信息，打开【小红书】App查看精彩内容！

2025-06-23 11:16:41 169

原创服务器中文件夹的移动指令

我想要把服务器的这个文件夹移动到同一目录下oft-control的里面，使用什么指令？需要移动到路径：/data/zjc/oft-main/oft-control/当前路径：/data/zjc/oft-main/文件夹。

2025-06-22 21:57:01 178

原创标量、向量、矩阵、数组、张量之间的区别和联系

一般一维数组，我们称之为向量（vector）,二维数组，我们称之为矩阵（matrix）;

2025-06-21 14:00:27 449

原创（OFT正交矩阵）Controlling Text-to-Image Diffusion by Orthogonal Finetuning论文讲解

主要围绕如何对 Stable Diffusion 这类文本到图像扩散模型进行微调（finetuning），以更好地适应特定的下游任务。Stable Diffusion 是一种高性能的文本到图像生成模型，能够根据文本提示生成高质量的图像。然而，尽管其生成能力强大，但直接使用预训练模型可能无法满足特定应用场景的需求。例如：在主题驱动生成（Subject-driven Generation）中，可能需要生成特定主题（如某个特定人物或物体）的图像。在可控生成（Controllable Generation）中，

2025-06-20 16:30:16 29 1

原创 Unet网络结构详细介绍

详细执行流程：

2025-06-20 12:07:58 287

原创服务器实现解压压缩包

我想要在“/data/zjc/oft-main/scripts/data/”目录下的“gpt2模型总结代码汇总.zip”给解压。

2025-06-19 22:06:37 133

原创 windows下运行.sh文件出现wget: command not found解决方法

原因就是没有安装wget工具。

2025-06-18 22:39:21 304

原创何恺明做的meanflow的模型讲解

MeanFlow 是何恺明团队提出的单步生成建模框架，核心是引入概念改进流匹配方法，能通过单次函数评估，高效完成从先验分布到数据分布的转换，显著提升生成效率，在 ImageNet 256×256 数据集单步生成任务中表现突出，FID 分数达 3.43 ，无需预训练、蒸馏或课程学习，还可自然整合分类器自由引导（CFG）提升生成质量，为生成模型研究和高效数据生成提供新路径，不过训练存在依赖 Flow Matching 条件瞬时速度、计算开销等问题。

2025-06-16 00:52:28 291

原创什么是VAE模型（变分自编码器）

生成模型（如 VAE、扩散模型）的核心目标，就是学习并拟合这个 “图像分布”

2025-06-14 20:51:23 244

原创 cifar10数据集下载代码

【代码】cifar10数据集下载代码。

2025-06-12 21:43:30 293

原创第54篇：Flat-LoRA: Low-Rank Adaptation over a Flat Loss Landscape论文解读

通过低秩矩阵优化实现高效微调，但仅关注低维子空间，可能在全参数空间存在尖锐方向，导致下降。：将（Sharpness-Aware Minimization）直接应用于 LoRA 参数（LoRA-SAM）只能优化低秩子空间的尖锐性（公式4），且（需额外梯度步骤），LORA+SAM虽然将SAM与LoRA结合（称为LoRA-SAM（Li等人，2024a））对于大型模型微调是有希望的，但有几个问题需要讨论。首先，LoRA-SAM只能在受限空间。其次，SAM需要额外的梯度步骤，使，对于大型模型来说不切实际。最后，在。

2025-06-11 23:00:19 231

原创第56篇GAM《Gradient Norm Aware Minimization Seeks First-Order Flatness and Improves Generalization》还没弄完

最近，平坦极小值已被证明对提高模型泛化能力有效，而取得了领先的性能。然而，目前在SAM及其后续研究中所讨论的平坦度定义仅限于。然而，优化最坏情况依赖于对的合理选择。作为SAM中的一个预定义超参数，或在其变体（如ASAM，参考文献[42] ）中参数缩放时的超参数，。我们表明，。如图1a所示，当ρ涵盖多个极小值点时，零阶平坦度（SAM）无法衡量波动频率。当ρ内只有一个极小值点时，如图1b所示，观测半径有限，且ρ内的最大损失可能与损失的上升趋势不一致。因此，为最小化泛化误差需要损失梯度的信息。

2025-06-10 22:24:32 135

原创第55篇：ADALORA: ADAPTIVE BUDGET ALLOCATION FOR PARAMETER-EFFICIENT FINE-TUNING 论文讲解

我们实现了AdaLoRA用于微调DeBERTaV3-base（He等，2021a）和BART-large（Lewis等，2019）。我们评估了所提出算法在自然语言理解（GLUE，Wang等，2019）、问答（SQuADv1，Rajpurkar等，2016和SQuADv2，Rajpurkar等，2018）以及自然语言生成（XSum，Narayan等，2018和CNN/DailyMail Hermann等，2015）上的有效性。所有增益均通过了显著性测试，p < 0.05。

2025-06-08 18:43:28 70

原创第52篇：OpenFedLLM: Training Large Language Models onDecentralized Private Data via Federated L论文解读

大型语言模型（LLMs）在多个领域取得了巨大成功，但高质量的公开数据预计将在这可能成为LLMs发展的瓶颈。私有数据的价值与限制：大量高质量数据分散在不同实体中，但由于隐私（如医疗和金融数据）或物理限制（如缺乏网络连接）而未被充分利用。这些，限制了当前LLMs的发展。论文提出了OpenFedLLM框架，利用（FL）在不直接共享原始数据的情况下，让多个数据所有者协作训练共享模型。

2025-06-04 13:48:59 56

原创矩阵SVD分解

主成分分析(PCA)本质上就是SVD的应用。通过保留前k个奇异值，可以实现数据降维。：Eckart-Young定理指出，SVD提供了矩阵的最佳低秩近似。潜在语义分析(LSA)使用SVD来发现词语和文档之间的潜在关系。协同过滤算法中，SVD用于分解用户-物品评分矩阵，预测缺失值。对于奇异或接近奇异的矩阵，SVD提供了稳定的伪逆计算方法。通过保留前k个奇异值，可以大幅减少图像存储空间。：奇异值唯一确定（不考虑排列顺序）：小的扰动只会导致小的奇异值变化。：矩阵的秩等于非零奇异值的个数。

2025-06-02 10:16:12 253

原创快速找到谷歌学术上的顶级期刊和顶级会议，快速搜文献

然后把上面这个安装到扩展浏览器中，此时会出现：我的是计算机领域，所以我选：CCF+CORE。

2025-06-01 12:17:06 317

原创第53篇：LoRA-FAIR: Federated LoRA Fine-Tuning with Aggregation and InitializationRefinement论文讲解

作为所有客户端的起始LoRA点。。

2025-05-27 19:09:20 91

原创模型参数量化具体讲解

量化（Quantization）是一种模型优化技术，用于减少模型的内存占用和加速推理过程。具体来说，量化通过将模型的权重（如32位浮点数，FP32）转换为低精度（如8位整数，INT8）来实现这些目标。：低精度表示，这使得模型更适合在资源受限的设备上运行。：低精度运算通常比，尤其是在支持低精度运算的硬件（如NVIDIA Tensor Cores）上。：低精度运算通常需要：在训练完成后对模型进行量化，通常需要一个校准数据集来确定量化参数。：在训练过程中对模型进行量化，通常不需要校准数据集。

2025-05-21 11:46:31 252

原创 css、index.html实现图片上传服务器

我想要将自己的这个index.html中的上传图片功能能够“真正”将图片上传到服务器。

2025-05-15 15:15:21 246 1

原创解决常规index.html文件无法加载本地txt文件的方法

我的文件内容为：现在是使用本地html但是无法加载这个txt内容。

2025-05-15 14:48:51 213

原创 cifar10数据集转图片

将测试集的第一条转化为图片格式。

2025-05-15 12:58:52 253

原创 (raylet) file_system_monitor.cc:111: /tmp/ray/session_2025-05-07_10-57-35_266368_3504255 is over 95%

【代码】(raylet) file_system_monitor.cc:111: /tmp/ray/session_2025-05-07_10-57-35_266368_3504255 is over 95%

2025-05-07 11:05:23 418 1

原创 TypeError: Descriptors cannot be created directly. If this call came from a _pb2.py file, 解决方法

【代码】TypeError: Descriptors cannot be created directly. If this call came from a _pb2.py file, 解决方法。

2025-05-05 23:08:08 542

原创第50篇：（GSAM）SURROGATE GAP MINIMIZATIONIMPROVES SHARPNESS-AWARE TRAINING

我们在图 3 中通过数值玩具示例展示了不同的算法。

2025-05-04 23:06:30 54

原创可视化平坦度的代码，适用于swa和sam

ConvNet 和 ConvNet100 函数用于创建不同类别数量的 ResNet 模型。。

2025-05-02 17:46:43 521

原创第49篇：AdaSAM——通过自适应学习率和动量加速提升锐度感知最小化

在训练深度神经网络时，传统优化器如，但在复杂模型和大规模数据面前存在。通过引入额外的扰动步骤来优化模型的泛化性能，但存在等不足(SAM需要计算2倍的参数）

2025-04-29 08:54:00 47

原创泛化误差和经验误差

2025-04-27 08:22:22 193

原创第47篇：锐化感知最小化在训练后期有效地选择更平坦的最小值SHARPNESS-AWARE MINIMIZATION EFFICIENTLY SELECTS FLATTER MINIMA LATE I

也能获得。

2025-04-26 15:55:59 61

原创强制中断由于关闭ray进程后的残余进程

我正在使用ray框架在服务器上跑代码，然后ctrl+c终止代码，结果发现，后台仍有残余进程。可以看到其实ray并没有被真正关闭。

2025-04-25 09:10:43 283 2

原创上采样和下采样

指或。

2025-04-22 16:57:28 322 1

原创第46篇：On the Effectiveness of Parameter-Efficient Fine-Tuning+

基于投影的方法。

2025-04-22 00:52:42 390

原创 “ImportError: numpy.core.multiarray failed to import”解决方法（numpy问题）

（连续输入两次，因为卸载一次只是卸载了一个numpy,一般电脑上有两个numpy，分别是pip的和conda的）

2025-04-18 01:15:43 1536 1

原创第44篇：《SLoRA: Federated Parameter Efficient Fine-Tuning of Language Models》

边缘设备资源有限（计算、通信、存储），直接全量微调（FFT）成本高；数据分布异质性（非IID）导致传统PEFT方法（如LoRA）性能显著下降（图1显示PEFT与FFT的差距越大异质性影响：数据越异质，SLoRA相对LoRA的优势越明显（图3、图6显示PEFT基线在异质数据下性能暴跌，SLoRA保持稳定）。在集中式学习中，LoRA 在不同任务上始终展现出良好的性能，且与全量微调（FFT）的准确率相当接近。对于数据分布更均匀（α 值较大）的联邦学习场景，这种情况依然成立。

2025-04-17 11:24:51 547

原创 MobaXterm实现无中断连接服务器

长时间没有点击MobaXterm，它就会自动断开服务器。

2025-04-16 15:47:44 727

原创 pycharm查看具体函数的用法（点击方法进入详细界面）

我想要知道这个具体的train方法是什么内容。

2025-04-16 15:45:54 413

原创 L光滑性介绍

2025-04-15 23:09:32 202

原创机器学习/深度学习中的“各种通信协议示意图”

①a:经典的联邦学习方案（中央服务器可能会面临系统故障或恶意攻击的风险，这可能会威胁到用户隐私泄露或被破坏训练过程）此外，通信过程完全发生在服务器-客户端端，这可能会对服务器造成相当大的通信负担。不存在b-d所示的全局模型状态，参与的客户端遵循通信协议达成所谓的共识模型。

2025-04-14 19:02:03 181

夏令营~预推免~保研通用资料汇总整合（ppt汇总）保研ppt展示（简化版+完整版）（已删除个人信息）

2024-09-28

夏令营~预推免~保研通用资料汇总整合（推荐信汇总）

2024-09-28

夏令营~预推免~保研通用资料汇总整合（计算机专业课复习汇总）（算法分析与设计+计算机网络+操作系统+计算机组成原理+数据结构）

2024-09-28

夏令营~预推免~保研通用资料汇总整合（简历汇总）

2024-09-28

夏令营~预推免~保研通用资料汇总整合（自我介绍）（个人陈述）80字版本+150字版本+300字版本+400~500字版本等

夏令营~预推免~保研通用资料汇总整合（自我介绍）（个人陈述）80字版本+150字版本+300字版本+400~500字版本+700字版本+900字版本+1000字版本（含未来规划）+1500字版本+1600字版本

2024-09-28

夏令营~预推免~保研通用资料汇总整合（英文知识点汇总）（1min急速通关英文面试）（简历英文）（常见英文问题）

2024-09-28

夏令营~预推免~保研通用资料汇总整合（编程知识点汇总）（c语言）（c++）(pyhton)附带天津大学真题练习

夏令营~预推免~保研通用资料汇总整合（编程知识点汇总）（c语言）（c++）(pyhton)附带天津大学真题练习。我编程主要用的是两个渠道： ①自己学校的oj题，二话不说，先刷个200道行吧，你基础搞不通透，盲目刷力扣根本没用，而且不是我说，你只要不是去清北复交人浙南，刷基础oj足矣了 ②需要靠机试的那个学校的历年真题，这个csdn上一搜都能搜到，提前做个20道，真正考核的时候整个及格线绰绰有余。我最后也准备了编程常用的一些代码示例，csdn上也不定时会发相关的解题思路：

2024-09-28

联邦学习开山之作PPT讲解

联邦学习开山之作：Communication-Efficient Learning of Deep Networks from Decentralized Data。论文深度解读，PPT总结版。

2024-08-03

“SCAFFOLD:联邦学习的随机控制平均”PPT核心算法解析

“SCAFFOLD:联邦学习的随机控制平均”PPT核心算法解析 SCAFFOLD Stochastic Controlled Averaging for Federated Learning“SCAFFOLD:联邦学习的随机控制平均”论文解读PPT形式

2024-08-03

2021年全国大学生数学建模竞赛试题ABCDE

2023-09-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人