自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(39)
  • 收藏
  • 关注

原创 计算广告系统学习路径记录

本文以互联网广告技术架构图为索引,展开记录本博客之后的更新路径,包括1)因果推断 (uplift建模)、2)广告反作弊、3)推荐算法(传统推荐算法、深度学习算法)、4)广告工程。同时还记录互联网广告的业务知识、上下游产业链等

2023-10-05 17:27:19 368

原创 AI Agent笔记--读腾讯技术公众号

《AIAgent技术发展全景:从构成要素到范式变革》摘要:本文系统梳理了AIAgent的技术演进,指出其核心由大模型、记忆系统、工具调用和自主规划四大能力构成,并强调真正Agent需具备自主决策特性。当前技术面临幻觉累积、记忆管理、协作失效等挑战,业界正通过固化工作流、优化ReAct框架及多Agent协同等方案应对。技术范式正经历从"模型即服务"到"模型即产品"的转变,2024年将出现专用Agent模型,强化学习成为后训练阶段的核心技术。未来Agent将呈现工程化与端

2025-07-26 11:56:44 475

原创 安德鲁·卡帕西:深入探索像ChatGPT这样的大语言模型

本文总结了安德鲁·卡帕西关于大语言模型的核心观点。大模型训练分为三个阶段:预训练(学习语料)、监督微调(学习对话)和强化学习(优化输出)。预训练包括数据处理、token化和神经网络参数调整;监督微调通过对话数据集教会模型应答;强化学习则让模型自主优化答案质量。文章还探讨了模型特性(如幻觉、记忆方式)和发展方向(多模态、任务代理等),并提供了相关资源链接。这种分阶段训练方法使大模型能逐步掌握从知识积累到对话应答的完整能力。

2025-07-26 11:53:18 1246

原创 openManus源码解析

OpenManus是一个多功能AI Agent框架,协调LLM、工具与外部系统交互。其工作流程包括:通过config.toml配置LLM(支持OpenAI、Claude等)、MCP服务和浏览器;用户输入prompt经LLM解析后,动态调用搜索、浏览器交互、Python执行等工具集;系统采用分层代理架构(BaseAgent→ToolCallAgent→领域专用Agent),核心方法think()和act()实现推理与执行分离。框架优势在于高扩展性,支持自定义工具集成和专用A

2025-07-13 13:23:20 935

原创 DeepSeek 11篇关键论文及要点,DeepSeek为什么能做到成本降低

DeepSeek 2024年1月至2025年1月,技术演进摘要。基座模型(DeepSeek LLM、DeepSeek MoE、DeepSeek-V2、DeepSeek-V3);推理模型(DeepSeek-Coder、DeepSeek-Coder-V2、DeepSeek-Math-Shepherd、DeepSeek-Math、DeepSeek-Prover、DeepSeek-Prover-V1.5、DeepSeek-R1)

2025-07-13 13:17:05 812

原创 模型评估方式

有监督-分类、回归模型;无监督模型的评估指标小结

2024-02-24 19:00:40 971

原创 计算广告中涉及的设备id:oaid、androidid、imei、idfa、caid

计算广告中的设备ID,以及简单的发展历史

2024-02-24 16:09:35 7820 2

原创 机器学习中的数据预处理方法

数据预处理方法:处理缺失数据、处理类别数据、划分训练数据集和测试数据集、保持相同的特征缩放

2024-01-28 15:21:26 1152 1

原创 Git学习笔记

git使用方法,Git常用命令、分支操作、团队协作机制、github操作

2024-01-28 12:10:54 1546

原创 反作弊中的图算法_文章集合与摘要

反作弊中的图算法_目前的文章合集

2023-11-30 16:12:54 315

原创 特征选择方式

本文转载自以下文章。

2023-11-27 20:45:57 119

原创 反作弊中的无监督算法2_聚类的4种方式及典型算法

聚类的4种方式:1)基于原型的kmeans算法、2)基于密度的DBSCAN算法、3)基于概率模型的高斯混合模型、4)基于层次聚类的Louvain\GN算法

2023-11-27 20:39:23 1269

原创 逻辑回归(Logistic Regression)_推荐_前深度学习时代的常用算法1

逻辑回归算法的原理、Python实现、sckitlearn参数说明

2023-11-21 17:33:50 188

原创 反作弊中的无监督算法1_孤立森林_算法原理及实现

互联网反作弊中的无监督算法_孤立森林的原理、python实例、参数说明

2023-11-21 17:30:10 464

原创 TensorFlow基础1_对张量的基础操作_用Dataset API构建流水线

TensorFlow中对张量的定义;对张量的操作:拆分(split)、堆叠(stack)、连接张量(concatenate);构建数据流水线的方式

2023-11-19 15:12:31 118

原创 uplift在营销领域建模的4种方法

介绍了因果推断在营销领域的应用方式——uplift建模,解释了4种建模方法和两种离线评估方式

2023-11-19 15:05:10 2058 2

原创 王争《数据结构与算法之美》笔记_下篇

排序、查找、跳表、散列表、哈希算法、二叉树、图

2023-11-08 17:58:54 481

原创 广告反作弊思路分享

目前络产的产业链较成熟,作弊逃不开的两大要素——账号和设备,其背后都有完整的资源和服务链条,见图1。同时,由于广告投放还存在归因的步骤,因此,还有一种作弊手段为,媒体获得大量设备id发给广告主,抢夺归因的作弊手段,同见表1。(注意,根据国家的法律要求,设备指纹在生成ID的过程中,不可以使用用户的个人隐私信息,如通讯录、手机号码、短信等)[2]。注1:设备的指纹不是成不变的,会随着时代的发展,不断更新——如机新增的压感应功能,就会多个参数;TCP、IP头信息,如TTL、起IP地址、端号;

2023-11-08 17:24:10 1153

原创 《因果推断的python实现》序言_Matheus Facure

《因果推断的Python实现》书籍大纲

2023-11-01 14:54:43 281

原创 用Python实现感知器学习算法

感知器原理+用Python实现一个感知器

2023-10-25 11:53:11 683

原创 因果推断、用户增长、广告系统 文章合集

本文持续收集一些与用户增长、广告投放相关的因果推断文章。(更新日期:2023-08-09)(更新日期:2021-07-08)

2023-10-01 17:25:00 164

原创 王争《数据结构与算法之美-基础篇》笔记_上篇

数据结构与算法之美,回顾基础数据结构及刷题的指导路径

2023-09-30 10:59:43 415 1

原创 《程序化广告实战》笔记_持续更新

《程序化广告实战》笔记

2023-08-20 17:08:47 474 2

原创 airflow定义一个pipeline的例子

调度工具airflow的pipeline例子

2023-04-09 15:25:23 211

原创 Linux文件与文件系统的压缩、打包

本篇笔记来自《鸟哥的Linux私房菜 基础篇》

2023-04-09 15:12:39 427

原创 Linux磁盘与文件系统的简单操作

本文笔记来自《鸟哥的Linux私房菜》第四版第7章。。好多东西没太理解,先记录一下用得上的。

2023-04-04 09:51:18 165

原创 Linux的文件与目录管理

linux的文件与目录管理

2023-04-01 16:59:32 238

原创 shell脚本学习笔记

shell是一个程序,用C语言编写,是用户和linux内核沟通的桥梁。它既是一种命令语言,又是一种解释性的编程语言。shell讲用户的指令翻译为二进制,传给内核处理。功能:将内容输出到默认显示设备echo命令的功能是在显示器上显示一段文字,起到一个提示的作用。功能说明:显示文字。语法echo [-ne][字符串]补充说明:echo会将输入的字符串送往标准输出。输出的字符串间以空白字符串隔开,并在最后加上换行号。-n 不要在最后自动换行。

2023-03-25 20:51:03 1168

原创 Linux的文件权限与目录配置

linux的文件权限与目录配置

2023-03-25 20:48:04 1107

原创 linux语句之首次登录与在线求助man page

linux首次登录与在线求助

2023-03-25 19:27:17 123

原创 《计算广告》笔记2_基础知识准备

本文笔记来源于刘鹏、王超的《计算广告》第二版第十章,本文非常粗略的记录了计算广告涉及到的3个领域:信息检索(InformationRetrieval,IR),最优化(optimization),机器学习(MachineLearning,ML)

2023-03-21 10:01:36 246

原创 《计算广告》笔记1_计算广告技术概览

本文笔记来源于刘鹏、王超的《计算广告》第二版第九章关键技术概览;通过个性化系统框架展开讲述计算广告系统涉及的优化目标和技术

2023-03-21 09:55:00 515

原创 flink5_自定义函数

自定义函数(UDF)可以用 JVM 语言(例如 Java 或 Scala)或 Python 实现,实现者可以在 UDF 中使用任意第三方库,本文聚焦于使用 JVM 语言开发自定义函数。原文档:https://nightlies.apache.org/flink/flink-docs-release-1.16/zh/docs/dev/table/functions/udfs/

2023-03-10 22:22:41 803

原创 flink4_flink SQL

source表、连续查询、Sink表Regular Joins、Interval Joins、Temporal Joins

2023-03-10 22:17:43 496

原创 flink3_流式聚合和数据类型

flink流式聚合和数据类型

2023-03-10 22:15:30 117

原创 flink2_流式概念

apache Flink文档中关于流式概念的部分

2023-03-04 14:11:01 290

原创 flink1-概念

flink中文文档学习笔记1-一些基本概念

2023-03-04 14:03:48 135

转载 hive的数据存储与压缩

本文梳理一下hive表的存储与压缩方式

2023-03-04 13:51:52 523

原创 《信息流广告入门》学习笔记

宁阿姨《信息流广告入门》学习笔记

2023-02-25 10:19:44 7140

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除