- 博客(112)
- 资源 (2)
- 收藏
- 关注
原创 Datawhlale_快乐学习大模型_task02_NLP 基础概念
对给定的文本做个总结抽取式摘要从原文摘取,简单但不够通顺生成式摘要自己生成,需要复杂的模型。
2025-06-19 00:20:33
996
原创 霹雳吧啦Wz_深度学习-图像分类篇章_1.1 卷积神经网络基础_笔记
英文:Convolutional Neural Network,CNN。雏形:1998年LeCun的LeNet5,第一个卷积神经网络。卷积网络特有的网络结构。稀疏处理,渐少运算量。
2025-05-29 21:37:07
492
原创 平白语言摘要(PLS)
本研究旨在评估城市绿化对城市微气候的影响,特别是在夏季高温期间。我们使用了一个综合方法,结合了地面温度测量、遥感数据和城市气候模型。结果表明,绿化覆盖率每增加10%,夏季最高温度可降低0.5至1.0摄氏度。这一发现对于城市规划者在设计更宜居、更可持续的城市环境时具有重要意义。你有没有想过,城市里种更多的树和植物可以让城市在炎热的夏天变得更凉爽?我们的研究就是这样的。我们发现,如果在城市里多种些花草树木,那么在最热的日子里,温度可以降低一点点,让人感觉更舒服。
2024-12-10 03:54:31
335
原创 chaper data writting
在大气科学领域的期刊论文中,这个章节应该清晰地说明数据的来源、获取方式、处理过程和分析方法,以便其他研究人员能够理解和验证研究结果。
2024-01-25 17:08:57
491
原创 论文写作之十个问题
最近进入瓶颈?改论文,改到有些抑郁了总是不对,总是被打回好的写作,让人一看就清楚明白非常重要郁闷时候看看大佬们怎么说的沈向洋、华刚:读科研论文的三个层次、四个阶段与十个问题。
2024-01-23 02:40:37
1213
原创 记一次天池参赛总结
第一次参加这类的算法比赛,记录一下自己遇到的一些点,做个总结。比较浅显的一些记录,第一次的经验之谈,适合首次参加可能容易遇到的问题。
2023-10-31 00:20:44
291
原创 对比学习的锚网络和自动生成标签
总之,锚网络是对比学习中的一部分,它负责将输入数据样本转化为一个可比较的向量表示,以便模型可以学习将相似样本靠近并将不相似样本分散开来。在对比学习(Contrastive Learning)中,“锚网络”(Anchor Network)通常是指一个用于生成数据样本的表示的网络。在对比学习中,锚点表示通常与正样本(相似的样本)和负样本(不相似的样本)的表示一起用于计算对比损失,以促进模型学习有用的表示。表示生成:锚网络将提取的特征映射到一个低维度的向量空间中,生成锚点表示或锚点向量。
2023-09-27 21:09:31
891
原创 常用gpt提示词(待更新
润色假如你是大气科学方向专业的导师,对下述内容,你有什么修改意见,请一一指出翻译假如你是大气科学方向专业的导师,请翻译下述文字
2023-09-25 22:03:55
315
1
原创 对比学习与simclr详解
样本三元组(Sample Triplets): 在对比学习中,通常需要构造样本三元组,每个三元组包括一个锚定样本(anchor)、一个正样本(positive),和一个负样本(negative)。其核心思想是通过将相似的样本映射到相邻的位置,将不相似的样本映射到远离的位置,从而在表示空间中更好地区分不同类别或概念。对比学习任务(Contrastive Learning Task): 对比学习模型的训练过程通常包括从样本三元组中选择合适的锚定、正样本和负样本,然后通过优化对比损失函数来调整模型参数。
2023-09-08 22:23:31
964
原创 降水预报之双重惩罚
当假阴性(漏报降水事件)和假阳性(误报)受到同等惩罚或加权时,就会出现双重惩罚问题,这在某些应用中可能会产生问题。威胁分数 (TS): TS 也称为关键成功指数 (CSI),衡量的是相对于所有观测到的降水事件而言,降水事件预测的正确率(包括命中率)。值得注意的是,双重惩罚问题的严重程度取决于具体应用以及漏报降水事件和误报的相对重要性。检测概率(POD): POD 计算正确预测的降水事件(命中)与所有观测到的降水事件的比率。它考虑降水和非降水事件的正确预报,但仍可能同样惩罚假阴性和假阳性预报。
2023-09-07 23:30:00
1686
原创 Spearman Footrule距离
Spearman Footrule距离是一种用于衡量两个排列之间差异的指标。具体而言,Spearman Footrule距离是每个元素在两个排列中的排名差的绝对值之和。Spearman Footrule距离适用于比较排列之间的相似性,更小的距离表示排列更相似,而更大的距离表示排列差异较大。这种距离可以用于排序评价、排列匹配和其他需要比较排列之间关系的领域。这个指标的名字中包含"Spearman"是因为它基于斯皮尔曼秩相关系数的概念,而"Footrule"表示它在计算过程中考虑了元素之间的位置关系。
2023-08-25 22:27:32
1023
原创 肯德尔秩相关系数(Kendall‘s Tau)排名
肯德尔秩相关系数(Kendall’s Tau)是一种用于衡量两个排列之间相似性的统计指标,它考虑了元素之间的顺序关系而不考虑具体数值。该系数被广泛用于排序、排名和比较不同实验结果的相关性等领域。具体而言,肯德尔秩相关系数衡量了两个排列之间逆序对(倒置对)的数量,从而反映了它们的相似程度。逆序对是指在一个排列中,两个元素的顺序与另一个排列中它们的顺序相反。肯德尔秩相关系数的计算步骤如下:给定两个排列,比较它们的每一对元素,计算其中一个排列中元素在另一个排列中的顺序关系(逆序或非逆序)。计算逆序对的数量。
2023-08-24 17:46:40
3299
原创 【辨析】投影到高维空间 VS 嵌入到高维空间
总结来说,"投影到高维空间"是简单地将数据点映射到高维,而"嵌入到高维空间"更强调学习新的表示,以便在高维空间中更好地表达数据之间的关系和相似性。在实际应用中,这两种技术可能有不同的使用场景和目标。虽然"投影到高维空间"和"嵌入到高维空间"都涉及将数据映射到高维空间,但它们在深度学习和机器学习领域中有着不同的含义和应用。
2023-08-03 17:47:57
1152
4
原创 【python切片】一个有意思的问题:为啥np.array(v[0:3][0]).reshape(3, -1)是错的,而np.array(v[0][0:3]).reshape(3, -1)是不报错的
在这种情况下,首先v[0]是对列表v的索引操作,取出索引为0的元素,这个元素是一个可迭代对象(可能是另一个列表或数组)。而第二种情况不报错是因为在该情况下,对一个可迭代对象进行切片操作后,返回的是一个新的可迭代对象,而不是单一的元素,所以它可以被转换为NumPy数组并进行reshape操作。为啥np.array(v[0:3][0]).reshape(3, -1)是错的,而np.array(v[0][0:3]).reshape(3, -1)是不报错的。今天碰到一个奇怪的问题:切片放前面不对,放后面就行,
2023-08-02 22:18:03
177
原创 【解析】对比学习和孪生网络的关系
这种网络架构通常由两个(或更多)并行的子网络组成,这些子网络共享权重并行工作。它们将输入样本转换为嵌入空间,在这个空间中,相似的样本被映射到接近的位置,不相似的样本被映射到远离的位置。这种网络常用于一些需要衡量样本相似性的任务,如人脸验证、图像检索等。这种学习策略试图让模型学习区分正样本对(相似)和负样本对(不相似)。训练过程中,模型被鼓励将正样本对映射到嵌入空间中的接近位置,将负样本对映射到远离的位置。对比学习是一种学习策略,它试图让模型学习如何区分正样本对(相似)和负样本对(不相似)。
2023-07-28 17:59:04
2358
3
原创 【解析】介绍simclr、moco、simsiam、BYOL的联系和区别
SimCLR, MoCo, SimSiam 和 BYOL 都是无监督学习中的对比学习算法,具体来说,它们是自监督学习(SSL)的一部分,这是一种使用未标记数据进行训练的方法。所有这些算法都以某种方式利用正负样本对进行训练,并学习从原始数据中提取有用特征的方式。然而,每种方法都有其独特的方式来创建和使用这些样本对。
2023-07-28 16:28:05
2594
原创 【DASOU视频记录】VIT (Vision Transformer) 模型论文+代码(源码)从零详细解读,看不懂来打我
(DASOU)VIT不涉及到MLM这种形式的任务,只会有一个多分类任务,所以CLS符号不是必须的。DASOU老哥太强了,每次讲的深入浅出,基本上了解ViT咋回事了。tokenization指的是分词,分出来的每一个词语叫做token。一个朴素的输入思路:把图片每个像素点作为一个token输入。CLS:标注句子语义的标注(Classification)将图片切割成patch,一个patch作为一个token。都能达到同样的效果,就是中间的学习率不一样。等DASOU回代码再更,꒰⑅•ᴗ•⑅꒱。
2023-07-05 15:45:34
691
4
原创 【霹雳吧啦Wz】Transformer中Self-Attention以及Multi-Head Attention详解
前天啥也不懂的时候点开来一看,各种模型和公式,直接头大,看完DASOU的视频后,重新来看,串起来了,一下子明白了,霹雳吧啦对细节有了更好的描述。Transformer是2017年Google在Computation and Language上发表的,当时主要是针对自然语言处理领域提出的。如果没有位置编码,输入的顺序改变会导致不同的结果(不同线程抢占可能导致输入顺序改变。这个视频主要用小例子将公式过了一遍,可以用来加深对整体过程细节的认识和把控。多个q、k、v可以叠在一起用矩阵来做。同样可以堆在一起计算。
2023-07-05 12:52:05
1212
原创 【DASOU视频记录】Transformer从零详细解读
进一步细化的结构,就是多个编码器和多个解码器,每个器件的结构一样,但是具体的参数可以不同,参数是独立训练的。RNN是共享一套W、U、V参数的,所以只能等处理完“我”,才能接下来处理“爱”/“你”,时序的。而transformer并行处理,则需要位置编码告诉网络,“我爱你”三个字之间的位置关系。transformer的具体结构和上面类似。将embedding词向量和位置编码相加。细化容易理解的结构,就是先编码,再解码。多个字,每个字对应一个512维的向量。
2023-07-04 16:41:21
1479
原创 【Bubbliiiing视频记录】Pytorch 搭建自己的Unet语义分割平台
语义分割:对图像每个像素点进行分类常见神经网络处理过程:Encoder提取特征,接着Docoder恢复成原图大小的图片。
2023-07-03 00:30:00
4835
3
原创 rain-nowcasting-using-deep-learning github:使用深度学习进行临近降水预报
用于训练网络的数据是MeteoNet数据库(https://meteonet.umr-cnrm.fr/),该数据库提供了2016年至2018年法国境内的气象参数,关于预处理的详细信息请参见论文。雨和风的预处理数据可以直接在https://www-pequan.lip6.fr/~bereziat/rain-nowcasting/data.tar.gz(数据通过./setup.sh下载)。首先要确保满足requirements.txt中指定的要求,然后下载数据和补丁,最后你可以调整训练参数来影响训练过程。
2023-07-01 17:42:53
1345
原创 【论文】U-Net:用于生物医学图像分割的卷积网络
有很大的同意,成功地训练深度网络需要许多万个注释的训练样本。在本文中,我们提出了一种网络和训练策略,该策略依赖于对数据增强的有力使用,以更有效地使用现有的注释样本。该架构由一个捕捉上下文的收缩路径和一个实现精确定位的对称扩展路径组成。我们表明,这样的网络可以从很少的图像中进行端到端的训练,并在ISBI挑战中胜过之前的最佳方法(滑动窗口卷积网络),用于分割电子显微镜堆中的神经元结构。使用在透射光显微镜图像(相位对比和DIC)上训练的同一网络,我们在2015年ISBI细胞追踪挑战赛中以较大的优势赢得了这些类别。
2023-06-29 18:15:44
379
原创 UNet++ github介绍
UNet++ 是一种新的通用图像分割架构,用于更准确的图像分割。UNet++:重新设计跳过连接以利用图像分割中的多尺度特征。UNet++:用于医学图像分割的嵌套 U-Net 架构。,旨在解决 U-Net 的两个关键挑战:1)用于医学图像分割的嵌套 U-Net 架构。
2023-06-29 17:32:37
790
原创 WF-UNet: 用于降水临近预报的天气融合 UNet
设计恶劣天气及其影响(例如城市洪水或山体滑坡)的早期预警系统需要准确的短期降水预报(临近预报)。临近预报对于农业管理或提高飞行安全等多种环境应用来说是一项重要任务。在这项研究中,我们研究了 UNet 核心模型的使用及其在西欧提前 3 小时降水临近预报的扩展。特别是,我们提出了Weather Fusion UNet(WF-UNet)模型,该模型利用Core 3D-UNet模型,将降水和风速变量作为学习过程的输入,并分析其对降水目标任务的影响。我们收集了2016 年 1 月至 2021 年 12 月。
2023-06-29 17:20:17
1105
原创 使用ClimateLearn
混淆术语(例如,气候建模中的“偏差”与机器学习中的“偏差”)、将机器学习应用于气候科学问题时缺乏标准化(例如,定义适当的训练和保留数据集、数据增强)阻碍了进展。气候科学家可以理解改变输入变量的值将如何导致不同的输出分布,这与现代气候研究的完成方式相匹配:科学家根据假设的排放情景提供了一系列潜在结果。今天,我们推出了 ClimateLearn,这是一个软件包,可以通过提供直接的数据集访问、易于比较的基线方法以及用于理解模型输出的指标和可视化来弥合气候科学和机器学习社区之间的差距。是预测未来气候变量的问题。
2023-06-29 17:12:54
614
原创 ClimateLearn github介绍
ClimateLearn 是一个 Python 库,用于以标准化、直接的方式访问最先进的气候数据和机器学习模型。该库提供对多个数据集、一系列基线方法以及一套用于统计缩减和时间预测方法的大规模基准测试的指标和可视化的访问。有关我们过去的动机和未来计划的更多背景信息,请查看我们的公告博客文章。我们还在 2022 年神经信息处理系统大会上的“利用机器学习应对气候变化”研讨会的重点教程中预览了 ClimateLearn 的一些关键功能。我们建议按以下顺序阅读它们,以了解典型的 ClimateLearn 工作流程。
2023-06-29 16:28:59
271
加密与解密 (第三版).zip
2019-08-15
程序(堆栈).zip
2020-01-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人