- 博客(10)
- 收藏
- 关注
原创 大白话解析 W1(词向量矩阵)和 W2(输出权重矩阵)
P.S.在之前的文章和中,我们已经频繁的接触到W1和W2,在神经网络的训练代码里,W1 和 W2 这两个矩阵就像模型的 “左膀右臂”—— 少了谁都不行。很多人觉得它们只是一堆数字,其实里面藏着模型对语言的 “理解”。今天咱们就用最接地气的方式,把这两个矩阵讲明白:它们到底是啥、各自干啥用、怎么配合工作,以及训练时是怎么一点点变好的。
2025-08-03 11:31:25
920
原创 从“刷题提分“到模型训练:用学生刷题逻辑拆解Word2Vec训练代码
用外层循环控制 “刷几遍题”(epoch用内层循环 “逐题练习”(sample每道题都经历 “做题→对答案→算错→找原因→改思路”;最终通过多轮练习,让模型对词语关系的理解越来越准。
2025-08-03 11:09:40
842
原创 大白话解析 Word2Vec
Word2Vec是一种通过上下文学习词语含义的自然语言处理技术。它将词语转化为数值向量,使语义相近的词在向量空间中距离接近。Word2Vec包含CBOW(用上下文预测中心词)和Skip-gram(用中心词预测上下文)两种训练方法。这些向量不仅能反映词语相似度,还能捕捉诸如"国王-男人+女人≈王后"这样的语义关系。该技术广泛应用于搜索引擎、推荐系统等领域,但也存在处理一词多义不佳、依赖训练数据等局限。使用现成的词向量工具即可快速体验Word2Vec的功能。
2025-08-01 10:48:36
743
原创 大白话解析注意力机制
比如把中文 “他喜欢吃苹果” 翻译成英文,AI 会通过注意力机制知道 “他” 对应 “he”,“喜欢” 对应 “likes”,“苹果” 对应 “apples”,不会翻译错。而有了注意力机制,AI 在翻译 “它” 的时候,会自动 “回头看” 前面的 “小狗”,给 “小狗” 分配高权重,明确 “它” 的指代;没有注意力机制的 AI,可能会把这句话拆成一个个短词,逐个翻译,但很难处理词与词之间的远距离关系(比如 “它” 指的是 “小狗”,“旁边” 指的是 “公园旁边”),结果翻译出来的句子可能逻辑混乱。
2025-08-01 10:37:32
717
原创 大白话解析RAG技术:给AI装上“记忆外挂“
RAG(检索增强生成)技术通过"检索+生成"的方式,解决了传统AI"胡编乱造"和"知识局限"两大痛点。其工作流程分为三步:首先将资料转化为向量存储,然后基于问题检索最相关资料,最后生成准确回答。这一技术通过让AI"带小抄"的方式,显著提升了回答的准确性和时效性,已广泛应用于企业知识库、智能客服等场景。但使用时需注意资料质量、更新频率和检索效率等问题。RAG与向量化技术相辅相成,为AI应用开辟了新路径,用户可通过ChatPDF等工具直观体验其效果。
2025-07-31 22:31:27
600
原创 大白话解析向量化(Embedding):AI世界的“翻译官“
假设你去水果摊买水果,老板问你想要啥。你说:“我想要个甜的、水分多的、红色的水果。” 老板听完,转身就给你拿了一串草莓。这时候你可能会想:老板怎么知道我要草莓呢?其实老板在脑子里做了个简单的 “分类”:甜的、水分多的、红色的 —— 这几个特征一组合,最符合的就是草莓。如果把每个特征看作一个 “维度”,那草莓就可以用三个维度来描述:甜度(高)、水分(多)、颜色(红)。。
2025-07-31 14:21:18
633
原创 Redis缓存队列深度解析:5种实现方式+5大巨头案例+竞品对比
Redis的创始人Salvatore Sanfilippo(网名antirez)当时是意大利的一名软件开发人员,为了解决自己创业公司LLOOGG的实时日志分析需求,他开发了Redis最初版本。而"缓存队列"是Redis最常用的功能之一,它允许系统把需要处理的任务像奶茶店排队一样暂时存储起来,然后按照顺序或者优先级逐个处理。这时候,店员会让顾客排队——先来的站前面,后来的站后面,按顺序处理。这是Redis专门为消息队列设计的数据类型,支持消费者组、消息确认等高级特性,可以看作Redis版的Kafka。
2025-07-31 13:41:52
776
原创 浏览器如何拦截跨域请求?——像小区保安一样层层设卡
你可能好奇:其实,浏览器的拦截机制就像小区门口的保安,会严格检查每一个“进出请求”,一旦发现不符合规则(跨域且没通行证),就会立刻拦下。下面我们分步骤拆解这个过程,用生活化的比喻帮你彻底理解。
2025-07-22 16:08:33
527
原创 大白话解析:CORS代理
CORS代理就像一把“万能钥匙”,能快速解决跨域问题,但它不是长久之计。理想情况下,应该让后端服务正确配置CORS(比如只允许信任的前端域名访问),或者通过后端中转数据(前端→自己的后端→第三方API,这样浏览器只会看到“同源”请求,彻底避开跨域问题)。
2025-07-22 15:52:24
425
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人