大模型
文章平均质量分 51
写bug如流水
励志成为百万年薪架构师
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Embedding和Rerank模型介绍
在信息检索和NLP处理中,embedding和rerank模型是两种常见的技术,它们通常用于提高搜索引擎、推荐系统和其他相关应用的性能和准确性。原创 2024-04-25 14:15:46 · 7500 阅读 · 0 评论 -
Embedding和Rerank模型类模板
【代码】Embedding和Rerank模型类模板。原创 2024-04-25 13:53:58 · 1338 阅读 · 0 评论 -
VLLM启动报错:ValueError: The model‘s max seq len (19008) is larger than the maximum number of tokens tha
ValueError: The model's max seq len (19008) is larger than the maximum number of tokens that can be stored in KV cache (3840). Try increasing `gpu_memory_utilization` or decreasing `max_model_len` when initializing the engine.原创 2024-04-24 13:00:13 · 6790 阅读 · 1 评论 -
Qwen1.5:使用VLLM加速推理模型(包含:OpenAI如何调用)
在开始使用VLLM库之前,首先需要确保安装正确的版本。以下指南将帮助你完成安装和配置。原创 2024-04-24 11:50:45 · 6654 阅读 · 3 评论 -
RuntimeError: probability tensor contains either `inf`, `nan` or element < 0
这个问题卡了有一天的时间,后来,在对于torch的每个版本进行测试后,发现torch 2.2会出现这个问题,将版本降到torch 2.1.0就可以解决。原创 2024-04-22 10:20:54 · 3849 阅读 · 2 评论 -
利用语言模型的Agents:学习指南(langchain agent)
近年来,语言模型(LLM)作为Agent的应用在人工智能领域引起了广泛关注。这些Agent不仅能理解和生成自然语言,还能在复杂场景中执行一系列操作。本文将通过具体的例子探讨几种主要的Agent类型,并分析它们的应用、挑战和未来发展。原创 2023-12-06 14:40:26 · 577 阅读 · 0 评论
分享