- 博客(39)
- 收藏
- 关注

原创 计算广告系统学习路径记录
本文以互联网广告技术架构图为索引,展开记录本博客之后的更新路径,包括1)因果推断 (uplift建模)、2)广告反作弊、3)推荐算法(传统推荐算法、深度学习算法)、4)广告工程。同时还记录互联网广告的业务知识、上下游产业链等
2023-10-05 17:27:19
368
原创 AI Agent笔记--读腾讯技术公众号
《AIAgent技术发展全景:从构成要素到范式变革》摘要:本文系统梳理了AIAgent的技术演进,指出其核心由大模型、记忆系统、工具调用和自主规划四大能力构成,并强调真正Agent需具备自主决策特性。当前技术面临幻觉累积、记忆管理、协作失效等挑战,业界正通过固化工作流、优化ReAct框架及多Agent协同等方案应对。技术范式正经历从"模型即服务"到"模型即产品"的转变,2024年将出现专用Agent模型,强化学习成为后训练阶段的核心技术。未来Agent将呈现工程化与端
2025-07-26 11:56:44
475
原创 安德鲁·卡帕西:深入探索像ChatGPT这样的大语言模型
本文总结了安德鲁·卡帕西关于大语言模型的核心观点。大模型训练分为三个阶段:预训练(学习语料)、监督微调(学习对话)和强化学习(优化输出)。预训练包括数据处理、token化和神经网络参数调整;监督微调通过对话数据集教会模型应答;强化学习则让模型自主优化答案质量。文章还探讨了模型特性(如幻觉、记忆方式)和发展方向(多模态、任务代理等),并提供了相关资源链接。这种分阶段训练方法使大模型能逐步掌握从知识积累到对话应答的完整能力。
2025-07-26 11:53:18
1246
原创 openManus源码解析
OpenManus是一个多功能AI Agent框架,协调LLM、工具与外部系统交互。其工作流程包括:通过config.toml配置LLM(支持OpenAI、Claude等)、MCP服务和浏览器;用户输入prompt经LLM解析后,动态调用搜索、浏览器交互、Python执行等工具集;系统采用分层代理架构(BaseAgent→ToolCallAgent→领域专用Agent),核心方法think()和act()实现推理与执行分离。框架优势在于高扩展性,支持自定义工具集成和专用A
2025-07-13 13:23:20
935
原创 DeepSeek 11篇关键论文及要点,DeepSeek为什么能做到成本降低
DeepSeek 2024年1月至2025年1月,技术演进摘要。基座模型(DeepSeek LLM、DeepSeek MoE、DeepSeek-V2、DeepSeek-V3);推理模型(DeepSeek-Coder、DeepSeek-Coder-V2、DeepSeek-Math-Shepherd、DeepSeek-Math、DeepSeek-Prover、DeepSeek-Prover-V1.5、DeepSeek-R1)
2025-07-13 13:17:05
812
原创 反作弊中的无监督算法2_聚类的4种方式及典型算法
聚类的4种方式:1)基于原型的kmeans算法、2)基于密度的DBSCAN算法、3)基于概率模型的高斯混合模型、4)基于层次聚类的Louvain\GN算法
2023-11-27 20:39:23
1269
原创 逻辑回归(Logistic Regression)_推荐_前深度学习时代的常用算法1
逻辑回归算法的原理、Python实现、sckitlearn参数说明
2023-11-21 17:33:50
188
原创 TensorFlow基础1_对张量的基础操作_用Dataset API构建流水线
TensorFlow中对张量的定义;对张量的操作:拆分(split)、堆叠(stack)、连接张量(concatenate);构建数据流水线的方式
2023-11-19 15:12:31
118
原创 广告反作弊思路分享
目前络产的产业链较成熟,作弊逃不开的两大要素——账号和设备,其背后都有完整的资源和服务链条,见图1。同时,由于广告投放还存在归因的步骤,因此,还有一种作弊手段为,媒体获得大量设备id发给广告主,抢夺归因的作弊手段,同见表1。(注意,根据国家的法律要求,设备指纹在生成ID的过程中,不可以使用用户的个人隐私信息,如通讯录、手机号码、短信等)[2]。注1:设备的指纹不是成不变的,会随着时代的发展,不断更新——如机新增的压感应功能,就会多个参数;TCP、IP头信息,如TTL、起IP地址、端号;
2023-11-08 17:24:10
1153
原创 因果推断、用户增长、广告系统 文章合集
本文持续收集一些与用户增长、广告投放相关的因果推断文章。(更新日期:2023-08-09)(更新日期:2021-07-08)
2023-10-01 17:25:00
164
原创 shell脚本学习笔记
shell是一个程序,用C语言编写,是用户和linux内核沟通的桥梁。它既是一种命令语言,又是一种解释性的编程语言。shell讲用户的指令翻译为二进制,传给内核处理。功能:将内容输出到默认显示设备echo命令的功能是在显示器上显示一段文字,起到一个提示的作用。功能说明:显示文字。语法echo [-ne][字符串]补充说明:echo会将输入的字符串送往标准输出。输出的字符串间以空白字符串隔开,并在最后加上换行号。-n 不要在最后自动换行。
2023-03-25 20:51:03
1168
原创 《计算广告》笔记2_基础知识准备
本文笔记来源于刘鹏、王超的《计算广告》第二版第十章,本文非常粗略的记录了计算广告涉及到的3个领域:信息检索(InformationRetrieval,IR),最优化(optimization),机器学习(MachineLearning,ML)
2023-03-21 10:01:36
246
原创 《计算广告》笔记1_计算广告技术概览
本文笔记来源于刘鹏、王超的《计算广告》第二版第九章关键技术概览;通过个性化系统框架展开讲述计算广告系统涉及的优化目标和技术
2023-03-21 09:55:00
515
原创 flink5_自定义函数
自定义函数(UDF)可以用 JVM 语言(例如 Java 或 Scala)或 Python 实现,实现者可以在 UDF 中使用任意第三方库,本文聚焦于使用 JVM 语言开发自定义函数。原文档:https://nightlies.apache.org/flink/flink-docs-release-1.16/zh/docs/dev/table/functions/udfs/
2023-03-10 22:22:41
803
原创 flink4_flink SQL
source表、连续查询、Sink表Regular Joins、Interval Joins、Temporal Joins
2023-03-10 22:17:43
496
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人