自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 推荐系统混排 - DPP算法

是一种用于建模和选择具有多样性的子集的概率模型。DPP是通过行列式来度量子集之间的多样性,它广泛应用于机器学习、信息检索、推荐系统、自然语言处理等领域,尤其适用于需要同时考虑和的场景。

2025-01-09 22:40:35 1228

原创 PEPNet:融合个性化先验信息的多场景多任务网络

在多目标的建模过程中,如果不同的学习任务之间较为相关时,多个任务之间可以共享一部分的信息,这样最终能够提升整体的模型学习效果。但是如果多个任务之间的相关性并不强,或者说多个任务之间存在某种冲突,一个任务指标的提升可能伴随着另外一些任务指标的下降,造成多任务之间的跷跷板(task seesaw)。如果每个场景、每个任务都训练一个独立的模型,当场景、任务很多的时候成本太高,还影响迭代效率,同时也没有充分利用所有的数据,导致训练得到的模型实际上不是最优的。输入和输出的维度一致,用来衡量各个维度的重要性。

2025-01-05 18:42:15 3351

原创 推荐系统混排 - MMR多样性算法

是一种常用的信息检索与文档排序算法,旨在优化检索结果的多样性和相关性。MMR 算法通过平衡文档的相关性(relevance)和文档之间的多样性(diversity),从而提高了最终返回文档的质量,避免了检索结果中的冗余信息。这个方法广泛应用于信息检索、推荐系统和自然语言处理等领域。关注多样性是为了提升用户体验,避免推荐结果的冗余,增加内容的探索性和发现性,帮助用户接触更多不同类型的内容。

2025-01-05 13:39:18 916

原创 偏序和全序关系

给定集合和其上的二元关系,如果满足以下三个条件,则称该二元关系自反性(Reflexive):对于任意,都有。反对称性(Antisymmetric):对于任意,如果并且,则。传递性(Transitive):对于任意,如果并且,则。

2025-01-04 19:12:04 565

原创 Transformer是怎么处理可变长度数据的?

当然在实际应用上,如果序列太长,计算复杂度太大,一般会做截断。下面就来分析下,我们先来看一下Transformer的结构:因为Encoder和Decoder结构基本一致,这里以Encoder结构为例,我们逐个模块分析。

2025-01-01 17:48:09 895

原创 大模型基础组件 - 位置编码

Transformer 模型中的自注意力(Self-Attention)机制计算的是输入序列中所有位置的元素之间的关系,而这些关系仅仅依赖于元素的内容,而不考虑它们在序列中的顺序。例如,模型并不能自动地识别“第一个词”和“最后一个词”之间的顺序关系。这意味着,如果没有额外的信息,模型不能知道一个词在句子中的位置。:为了让 Transformer 理解序列中的顺序,必须通过引入位置编码将位置信息显式地注入到模型的输入中。

2025-01-01 16:11:38 2097

原创 大模型基础组件 - Tokenizer

Tokenizer分词是大模型的基础组件,用于将文本转换成模型可以理解的形式。常见的分词方式包括基于词的切分(word-based)、基于字符的切分(character-based)、基于子词的切分(subword-based)。基于词的切分和基于字符的切分都比较简单容易理解,这里只介绍主流的分词方法subword-based。subword-based方法的目的是通过一个有限的单词列表来解决所有单词的分词问题,同时将结果中token的数目降到最低。

2024-12-25 00:00:28 2073

原创 MacOS+Docker安装和启动Jupyter Notebook

Docker Hub 上提供了很多官方的 Jupyter Notebook 镜像,可以直接拉取并运行。常用的 Jupyter 镜像是。首先,确保你已经在MacOS上安装了Docker。开启容器后在浏览器输入。

2024-12-21 20:33:08 544

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除