
人工智能
文章平均质量分 62
人工智能
SugarPPig
国企中年计算机爱好者。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
基于大模型的通用命名实体识别(NER)提示词
命名实体识别(NER)是NLP领域的核心技术,用于从文本中提取特定类别实体。原创 2025-08-18 15:05:50 · 224 阅读 · 0 评论 -
TensorFlow 和 Transformer 的关系
PyTorch和TensorFlow是深度学习框架,提供张量计算、自动求导等基础工具,用于构建各种神经网络模型。而Transformer是一种特定的神经网络架构,基于自注意力机制设计。两者关系如同"工具箱"和"蓝图":框架是通用工具,架构是具体设计方案。开发者使用框架来实现Transformer等模型架构,类似用乐高积木按图纸搭建特定结构。这体现了工具与产品设计的不同层次关系。原创 2025-08-14 11:56:34 · 417 阅读 · 0 评论 -
通用辅助生成: 使用任意辅助模型加速大模型文本生成速度
通用辅助生成 UAG原创 2025-08-13 15:20:31 · 821 阅读 · 0 评论 -
(二)LoRA微调BERT:为何在单分类任务中表现优异,而在多分类任务中效果不佳?
将BERT替换为Llama、Mistral等大语言模型(LLM)并采用LoRA微调,能显著提升多标签分类效果。原创 2025-08-01 14:41:22 · 1128 阅读 · 0 评论 -
(一)LoRA微调BERT:为何在单分类任务中表现优异,而在多分类任务中效果不佳?
LoRA微调BERT在单标签分类任务表现优异,但在多标签分类中效果不佳。主要原因在于多标签任务需要学习更复杂的特征表示和标签关联性,而LoRA的低秩近似限制了参数调整自由度,难以捕捉这些复杂信号。解决方案包括:增加LoRA秩数、调整超参数、优化数据平衡和训练策略,以及尝试AdaLoRA等变体方法。建议通过建立全量微调基线,系统调整参数来提升模型性能。原创 2025-08-01 14:37:43 · 767 阅读 · 0 评论 -
使用的IDE没有内置MCP客户端怎么办?
IDE MCP原创 2025-07-31 15:17:39 · 813 阅读 · 0 评论 -
模型上下文协议(MCP)
MCP 交互流程原创 2025-07-31 15:03:24 · 878 阅读 · 0 评论 -
Spring AI vs LangChain4j
Spring AI LangChain4j原创 2025-07-31 14:22:26 · 741 阅读 · 0 评论 -
“非参数化”大语言模型与RAG的关系?
“非参数化”大语言模型 RAG原创 2025-07-29 21:54:31 · 523 阅读 · 0 评论 -
多智能体架构
多智能体 架构原创 2025-07-27 17:52:26 · 191 阅读 · 0 评论 -
企业级LLMOps实现
LLMOps 企业级 落地方案原创 2025-07-24 11:22:34 · 1226 阅读 · 0 评论 -
个人电脑 LLMOps 落地方案
LLMOps 个人 落地方案原创 2025-07-24 11:18:05 · 1037 阅读 · 0 评论 -
什么是 LLMOps ?
LLMOps 介绍及推荐原创 2025-07-24 10:11:38 · 424 阅读 · 0 评论 -
vllm --model 绝对路径和模型名称的区别
vllm --model原创 2025-07-22 20:05:28 · 554 阅读 · 0 评论 -
单张显卡运行多个vllm模型
docker vllm 显卡 多模型原创 2025-07-22 18:51:17 · 922 阅读 · 0 评论 -
Hugging Face 模型的缓存和直接下载有什么区别?
Hugging Face 模型 缓存 下载原创 2025-07-22 14:26:50 · 1064 阅读 · 0 评论 -
大模型追问建议功能指令模板
大模型 追问建议 prompt原创 2025-07-21 10:24:51 · 375 阅读 · 0 评论 -
MCP 客户端与服务端
MCP原创 2025-07-11 16:51:15 · 735 阅读 · 0 评论 -
Claude Code 可视化工具
Claude Code Chat 可视化工具 GUI 镜像站 环境变量原创 2025-07-09 17:30:49 · 323 阅读 · 0 评论 -
ReAct (Reason and Act) OR 强化学习(Reinforcement Learning, RL)
ReAct RL原创 2025-07-07 19:40:06 · 912 阅读 · 0 评论 -
微调(Fine-tuning)OR 强化学习(Reinforcement Learning, RL)?
如何选择合适的训练方式?原创 2025-07-06 11:32:54 · 897 阅读 · 0 评论 -
微调(Fine-tuning)、检索增强生成(RAG)和强化学习(Reinforcement Learning)
对比分析及应用场景原创 2025-07-03 11:04:23 · 518 阅读 · 0 评论 -
中文工单分类模型选择
工单分类 模型选择 实战步骤原创 2025-06-25 21:35:48 · 985 阅读 · 0 评论 -
LLaMA-Factory 微调模型与训练数据量对应关系
llamafactory lora 数据量原创 2025-05-26 00:07:29 · 1237 阅读 · 0 评论 -
docker-volume-backup 备份 ragflow volumes
docker-volume-backup ragflow volumes 定时备份原创 2025-05-22 18:26:13 · 475 阅读 · 0 评论 -
Xinference 中内置的重排序模型详细对比
Xinference 重排序模型 reranker原创 2025-05-21 16:35:04 · 1653 阅读 · 0 评论 -
Ollama 如何在显存资源有限的情况下合理分配给不同的服务?
Ollama 资源分配原创 2025-05-19 17:18:50 · 885 阅读 · 0 评论 -
conda 环境克隆
conda 克隆原创 2025-05-06 16:05:01 · 910 阅读 · 0 评论 -
RAG 知识库文件上传前格式转换脚本
【代码】RAG 知识库文件上传前格式转换脚本原创 2025-04-30 10:42:46 · 171 阅读 · 0 评论 -
Embedding 模型的选择策略介绍
嵌入模型选择原创 2025-04-27 15:06:41 · 1029 阅读 · 0 评论 -
Ollama 本地化部署 LLM 常用配置
Ollama原创 2025-04-27 09:27:59 · 319 阅读 · 0 评论 -
RAG + LLM 如何对全量数据进行统计分析
RAG LLM 数据统计分析原创 2025-04-21 09:26:16 · 672 阅读 · 0 评论 -
Milvus 索引如何选择
Milvus 索引原创 2025-04-17 15:44:47 · 284 阅读 · 0 评论 -
RAG 评估框架
RAG 评估原创 2025-04-15 16:49:00 · 620 阅读 · 0 评论 -
高级 RAG 技术
RAG原创 2025-04-15 11:02:11 · 174 阅读 · 0 评论 -
vllm 运行推理模型
vllm deepseek原创 2025-03-17 14:37:47 · 280 阅读 · 0 评论 -
多式联运最优路径算法
多式联运 最优路径 算法原创 2025-02-13 10:16:27 · 1564 阅读 · 0 评论 -
如何使本地大模型拥有联网搜索的能力?
要让本地部署的大模型(如DeepSeek、LLaMA、ChatGLM等)具备联网搜索能力,需要将模型与外部工具结合,通过API调用、插件或代理机制实现实时信息获取。原创 2025-02-07 23:45:31 · 8810 阅读 · 0 评论 -
Ollama Model File
Ollama Model File(模型文件)是一个蓝图,用于在 Ollama 平台上创建和共享模型。原创 2025-02-07 10:25:27 · 1245 阅读 · 0 评论 -
大模型的蒸馏和量化有什么区别?
大模型的蒸馏和量化原创 2025-02-05 09:27:54 · 1510 阅读 · 0 评论