自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 实现DeepSeek流式返回数据

deepseek的流式数据返回

2025-02-23 21:24:59 1545

原创 DeepSpeed原理简要概述

DeepSpeed原理简要概述

2025-01-12 16:18:43 297

原创 fatal error: cusparse.h: No such file or directory

解决deepspeed遇到的error

2025-01-12 16:12:04 627

原创 LangChain - Trim Message History 裁剪历史信息

裁剪历史对话信息,避免超过LLM的最大上下文长度。

2024-11-14 19:50:59 735

原创 本地访问服务器jupyter,全流程详解

如果是inactive,防火墙就没有工作,不需要管防火墙了。state: LISTEN 就说明端口正在被监听。什么都没有返回,说明端口没有被监听。

2024-10-27 17:35:42 382

原创 Decoder在训练阶段如何处理输入序列和注意力掩码

教师强制(Teacher Forcing):在训练过程中,模型使用目标序列的实际前序单词作为输入,而不是模型预测的单词。因果掩码(Causal Mask):在 Decoder 的自注意力机制中,使用因果掩码确保模型在预测当前位置的单词时只能访问当前位置及其之前的单词,而无法看到未来的单词。并行计算:得益于自注意力机制和因果掩码,模型可以在一次前向传播中并行地处理整个序列,同时避免信息泄漏。

2024-10-27 17:08:08 1072

原创 基于BERT里的[CLS] Token在Pytorch里是如何实现的,引出对Torch的视图View和扩展视图expand的理解

在 BERT 模型中,每个输入序列的开头需要添加一个 [CLS] 标记,用于聚合整个序列的信息进行分类等任务。在批量处理中,您需要为每个序列添加一个 [CLS] 标记,并确保它们共享相同的嵌入参数。在BERT中,输入的所有的sequence都是和同一个[CLS] token 进行的拼接。这样在反向传播的时候,对[CLS] token 求导的时候,是**分别对不同句子的同一个[CLS] token求导后的和****如何在Pytorch里实现不同句子和同一个[CLS] token拼接。在构建模型的 __in

2024-10-21 19:10:52 1754

原创 【论文精度-大模型结果评测】A Systematic Evaluation of GPT-4V’s Multimodal Capability for Medical Image Analysis

本文对GPT-4V在医学影像分析的能力进行了评测,并且比较了传统的评价指标与专家对GPT-4V生成结果的评测,发现传统的评价指标无法正确的评测大模型生成的结果,急需一种全新的评价指标来评测大模型生成的结果。

2024-10-14 16:05:45 657

原创 [论文解读-多模态-知识蒸馏]PROTOTYPE KNOWLEDGE DISTILLATION FOR MEDICAL SEGMENTATION WITH MISSING MODALITY

论文解读-多模态/蒸馏-针对缺失模态的场景,如何提高模型效果

2024-10-08 12:39:51 1313

原创 IOS Notes 转成 Markdown 格式

打开这个工具后,需要先给它你的Note权限,然后点击这个下载按钮,选择导出目录,它会把你所有的Notes都导出到指定目录,好像只有付费可以指定单个Note导出。在App Store 下载Exporter APP。

2024-03-03 20:28:56 1128 1

原创 装饰器装饰实例函数与普通函数的区别&Python function type和method type的区别

Note: 文章内容都是基于自己的理解,如有理解错误,欢迎指正修改,大家一起进步。

2024-03-03 20:16:59 790 1

原创 克隆conda环境

克隆conda环境

2022-05-23 19:09:35 4151

原创 Docker扩展无法在VS code远程服务器安装

Docker扩展无法在VS Code远程服务器安装

2022-05-23 18:57:35 1487

原创 孤立森林可视化子树

孤立森林可视化子树

2022-05-20 18:10:52 541 2

原创 sentence-transformer在TorchServe的应用&如何自定义handler(custom handler)

系列文章目录文章目录系列文章目录前言一、TorchServe必安包&环境二、torch-model-archiver将模型转成.mar文件1.使用torch-model-archiver解释下各个参数的含义2.如何自定义使用我们自己的handler3.启动tochserve4.Reference总结前言本文是关于sentence-transformer在TorchServe的应用&如何自定义handler(custom handler)一、TorchServe必安包&环境

2022-05-18 18:28:27 802 3

原创 DTW标准代码,在轨迹相似度有过应用

自己理解写出来的DTW 的理解思路还是按照动态规划的思路 ,和LeetCode的72题编辑距离类似。DTW会重复使用序列中的点,从而达到扭曲对齐的.一般都是用两个指针i,j分别指向两个列表的最后,然后一步步往前走,缩小问题的规模。先计算a[i-1]和b[j-1]的两点距离,然后开始移动指针i和j,可以i,j一起移动到i-1,j-1,也可以i或者j只移动一个即i-1,j和 i,j-1。那么dp[i,j]= distance(i,j)+min(dp[i-1,j-1],dp[i-1,j],dp(i,j-1))

2021-07-01 13:28:59 942 1

原创 selenium自定义启动浏览器和ChromeDriver

设定好浏览器路径,和chrome_driver路径按照浏览器路径启动浏览器按照chrome_driver路径启动Chrome_driverchrome_options = Options() browser_url = '/Applications/360Chrome.app/Contents/MacOS/360Chrome'chrome_options.binary_location = browser_url chrome_driver = '/Applications/360Chr

2020-07-01 11:02:08 805

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除