
大模型
文章平均质量分 78
丁师兄大模型
大模型1v1学习 -> 公众号:丁师兄大模型
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
详细说说:长文本和Sparse Attention的结合有哪些?
长文本和Sparse Attention的结合有哪些,详细说说原创 2024-09-25 19:40:44 · 1009 阅读 · 0 评论 -
211硕士遭怒怼:稀疏注意力机制都不会?
211硕士遭怒怼:稀疏注意力机制都不会?原创 2024-09-24 19:40:55 · 553 阅读 · 0 评论 -
复旦女硕复试,被LongLoRA微调问懵了…
上周面的复旦女硕,问了LongLoRA微调原创 2024-09-24 19:36:02 · 1065 阅读 · 0 评论 -
985硕士,最近投了100多份大模型算法岗,没下文...
从面试官的视角看,什么样的简历算一份优质的简历?以及如何快速把简历改好。原创 2024-09-12 18:51:48 · 1299 阅读 · 0 评论 -
因为不懂推测解码,被面试官鄙视了...
推测解码—无障碍实现10倍大模型的推理原创 2024-09-10 19:54:38 · 1208 阅读 · 0 评论 -
研究生秘籍 | 不为导师当苦力,抓住实习机遇
读研的同学请记住一句话啊,一边偷懒一边学习。原创 2024-09-04 19:38:54 · 546 阅读 · 0 评论 -
为什么Transformer推理要做KV缓存?
从面试官的视角,来拆解这个Transformer的面试连环炮原创 2024-09-03 20:02:36 · 2044 阅读 · 0 评论 -
上周面的一个985女生,问了Transformer模型的内存优化
面试加分项:掌握Transformer模型的内存优化方法原创 2024-08-21 19:40:33 · 640 阅读 · 0 评论 -
阿里面试惊现难题:大模型服务吞吐率太小咋整?
大模型服务的吞吐率太小怎么解决?原创 2024-08-15 19:44:10 · 1291 阅读 · 0 评论 -
字节面试官:什么是RRF,你能解释一下吗?
今天我们来聊聊 RRF(Reciprocal Rank Fusion),如果你简历上写了 RAG 的内容,一定要清楚以下 RRF 相关的问题。原创 2024-08-14 20:31:14 · 3834 阅读 · 0 评论 -
华为985硕士裸辞:八个月过去了,还没有找到工作...
大模型中的分组查询注意力机制(GQA),如果面试时你被问到这个知识点,应该如何应对?原创 2024-08-12 20:44:33 · 1007 阅读 · 0 评论 -
算法秋招的同学,推荐两个准备面试的神器!
强烈推荐大家这两个面试准备神器,秋招加油~原创 2024-08-09 19:37:35 · 444 阅读 · 0 评论 -
阿里面试官:大模型上线前为什么要做推理优化?985学妹的满分回答!
大模型上线前为什么要做推理优化,这么回答面试满分!原创 2024-08-08 19:31:30 · 524 阅读 · 0 评论