- 博客(132)
- 收藏
- 关注
原创 PO→DO→DTO→VO 和 DAO → DTO → VO
在分层架构设计中,PO→DO→DTO→VO 和 DAO → DTO → VO 是两种常见的数据流转模型,分别对应和。
2025-06-30 15:49:45
505
原创 ubuntu安装docker遇到权限问题
Snap 的沙盒规则仍可能阻断非标准路径的访问,导致权限失效。若上述步骤无效,说明 Snap 版存在兼容性缺陷,建议。,容器无法直接访问宿主机的绝对路径(如。Snap 版 Docker 默认启用。手动授权 Docker 访问。
2025-06-26 14:45:19
661
原创 Traefik和Spring Cloud Gateway接口级限流和熔断对比
接口级限流和熔断支持情况Traefik: ✅ 支持但配置复杂,适合简单接口级需求: ✅ 原生支持且非常灵活,适合复杂接口级需求建议🔹当前项目: 继续使用Traefik的服务级配置🔹简单接口级需求: 可以考虑扩展Traefik配置🔹复杂接口级需求: 这时Spring Cloud Gateway会更有优势。
2025-06-25 16:37:12
287
原创 Ceph 和 MinIO
维度CephMinIO本质存储操作系统对象存储专家选型口诀“一池多用,企业全能手”“云原生S3,快简专精”关系竞争 & 互补(混合架构中可协同)需块/文件/对象统一存储→Ceph需高性能S3对象存储→MinIO。
2025-06-24 14:40:42
715
原创 vLLM、Triton Inference Server 和 Ray
vLLM:核心推理引擎 →“肌肉”(高效计算)Triton:服务包装框架 →“骨骼”(稳定托管)Ray:分布式调度器 →“神经系统”(智能调度)完整技术链价值用 Ray 调度集群资源 → 部署 Triton 实现生产级服务 → 通过 vLLM 释放 GPU 潜力 =高吞吐、低延迟、可扩展的 LLM 服务。Triton 的本质:AI 模型的“高性能执行引擎”(类似 Kubernetes 之于容器)LiteLLM 的本质:AI 模型的“标准化接入网关”(类似 API Gateway 之于微服务)
2025-06-24 14:08:39
979
原创 vLLM能否用于模型训练?
尽管 vLLM 不参与训练,但可与训练框架配合实现。但其推理优化技术可显著提升训练后模型的部署效率。vLLM 是推理专用引擎,
2025-06-24 11:58:10
589
原创 数据血缘定义与价值
层次目标衡量指标基础层保障数据链路可靠运行数据事故下降率(如 -70%)进阶层建立全域数据知识图谱字段平均可解释率(如 95%+)战略层成为企业数据信任基石数据驱动决策占比(如 80%+)结论最小化修改影响是数据血缘的显性价值,而终极目标在于将数据从“不可控的黑盒”变为可信赖的核心资产—— 这才是企业在数字化竞争中的底层优势。
2025-06-24 09:49:38
604
原创 SSE和Kafka应用场景对比
维度SSEKafka核心价值浏览器实时推送分布式可靠消息管道是否可替代❌ 完全不可替代对方❌ 定位本质不同协作建议用作Kafka数据的最终展示层出口用作SSE背后的数据支撑引擎✅如果你需要让用户的浏览器实时更新数据 →SSE如果你需要在后端服务间传递海量数据 →KafkaKafka处理数据流 + SSE推送到前端= 🚀 完整解决方案。
2025-06-24 08:56:22
593
原创 TRL技术成熟度评估
TRL(Technology Readiness Level,技术成熟度等级)是一种国际通用的技术发展阶段评估体系,由NASA于20世纪70年代提出,后经美国国防部(DoD)等机构标准化为9级框架,广泛应用于科研管理、国防采办及产业研发。
2025-06-23 17:42:13
694
原创 Elasticsearch(ES)与 OpenSearch(OS)
开源信仰 vs 商业创新:OpenSearch 坚守开源普惠,Elasticsearch 深耕企业场景,两者已形成差异化竞争格局未来趋势OpenSearch 正加速补齐功能(如向量检索 k-NN 插件),但性能与生态成熟度仍需追赶Elasticsearch 凭借 Lucene 原生优化和商业投入,持续领跑复杂查询与智能化能力建议技术决策者根据合规需求、功能优先级、云生态绑定三维度绘制评估矩阵,避免陷入“技术宗教战争”,用数据而非口碑做选择[citation:3][citation:4]。
2025-06-23 16:15:29
791
原创 微软ASR与开源模型分析
您指的是 微软语音识别(Automatic Speech Recognition,ASR)技术方案,这是微软人工智能服务中的核心能力之一,主要集成在 Azure Cognitive Services(认知服务) 的 Speech Service 中。以下是深度解析:音频输入Azure Speech Service语音识别ASR说话人识别语音合成TTS文本输出/分析2. 接入方式方式适用场景工具REST API简单异步识别(<60秒音频) + 认证密钥SDK实时流/复杂应
2025-06-23 11:39:43
965
原创 DeepEP开源MoE模型分布式通信库
该库以 Apache 2.0 许可证发布,代码完全开放,是全球首个专注于优化 MoE(Mixture-of-Experts)模型分布式通信的高性能库。· 2025 年 3 月:推出 v0.4.0,新增对 FP8 低精度计算支持和 Hopper 架构(H100/NVIDIA H800)优化;· 2025 年 5 月:发布 v0.8.0,大幅提升 推理端到端效率、RDMA 通信性能,开始支持 多节点大规模集群训练;· 当前最新版本(2025年6月):DeepEP v0.9.1,提供更多文档、教程及配套工具链。
2025-06-21 12:01:25
239
原创 Menlo/Jan-nano-gguf:优化工具调用方向的热门模型
基于 Qwen3-4B 模型微调,采用 DAPO技术(Domain-Adaptive Pretraining Optimization)提升工具调用与信息关联能力。· 工具调用能力:在 Hugging Face 工具使用评测中超越 DeepSeek-R1-671B 等大模型,成为小型模型中的性能标杆。· 在同等任务下,40亿参数的 Jan-nano 推理效率显著高于百亿级模型,适合预算有限的科研场景。· MCP(模型上下文协议)架构:支持自主调用搜索工具,实现实时信息检索与跨源数据关联分析。
2025-06-21 08:48:27
341
原创 ubuntu添加域名解析服务器地址
方法适用场景生效范围持久性/etc/hosts本地开发/域名拦截单机生效立即生效resolvconfUbuntu ≤16.04 系统全局生效永久Ubuntu ≥18.04 系统全局/按网卡永久Netplan 配置多网卡需不同 DNS 的服务器按网卡指定永久优先使用/etc/hosts本地测试修改配置全局 DNS。
2025-06-19 09:24:38
387
原创 Operator相关知识
fill:#333;color:#333;color:#333;fill:none;部署应用运维指令状态反馈自动修复/扩缩容用户HelmK8s。
2025-06-19 09:16:22
834
原创 pip初始化安装依赖报错:error: resolution-too-deep解决办法
现在您的虚拟环境已经配置好了,可以正常使用ADK Python项目了。如果遇到特定功能需要额外依赖,可以按需安装对应的extras。错误,这是因为尝试一次性安装所有依赖(包括。)导致依赖解析过于复杂。
2025-06-18 16:12:42
154
原创 Google ADK开源项目分析
ADK 是 Google 开发的一个开源、代码优先的 Python 工具包,专门用于构建、评估和部署复杂的 AI 智能体。虽然为 Gemini 和 Google 生态系统进行了优化,但 ADK 是模型无关的,支持多种部署方式。
2025-06-18 09:42:43
303
原创 ubuntu运行cursor
解决:默认使用Cursor.AppImage 会自动挂载临时目录在/tmp目录下,出现没有权限挂载的报错问题。直接从 https://www.cursor.com/en/download下载最新版本。增量更新的方式没有尝试成功;
2025-06-17 09:58:33
167
原创 LangGraph支持的核心设计模式及对应代码示例
模式核心机制适用场景复杂度顺序执行固定节点链路线性流程任务⭐监督模式动态路由(Command)多智能体分工⭐⭐⭐Map-ReduceSend对象分发批量并行处理⭐⭐人机协同中断(interrupt)高风险操作审核⭐⭐反思优化条件循环边迭代优化输出⭐⭐⭐LangGraph官方示例库提示:结合可强化结构化输出能力(见的JSON模式)。
2025-06-17 09:24:46
375
原创 Kubernetes架构解析
Kubernetes 技术栈的深度解析,涵盖架构设计、核心组件、生态工具及二次开发实践,结合实战案例说明其内在关联:调度运行容器Control PlaneWorker NodesPodDocker/containerd1. 控制平面(Control Plane)API Server:唯一入口,RESTful 接口,认证/授权(如 RBAC)etcd:分布式键值存储,保存集群状态(唯一有状态组件)Scheduler:调度策略(Bin packing/Spread 等),通过 Watch 机制监听未绑
2025-06-15 10:56:04
1260
原创 Remmina远程访问如何开启本地音频?
要在使用 Remmina 远程连接 Windows 主机时接收会议声音(如 Teams、Zoom 等音频),需确保 功能正确配置。
2025-06-10 15:49:20
1135
原创 LangFlow技术架构分析
🔧 LangFlow 的可视化技术栈· 底层框架:基于 (一个现代化的 React 节点绘图库)· 功能:· 拖拽式构建 LangGraph 状态机· 实时连线定义节点依赖关系· 可视化调试循环和分支逻辑LangFlow 功能 对应 LangGraph 技术节点参数配置表单 自动解析 LangGraph 的 State 和 Runnable一键导出为代码 生成 LangGraph 的 Python/TypeScript 代码。
2025-06-09 08:29:06
293
原创 ubuntu显示器未知
Xorg日志 grep -E “EE|WW” Xorg.0.log EDID错误、驱动加载失败、分辨率配置异常。grep -E “EE|WW” /var/log/Xorg.0.log # 过滤错误(EE)和警告(WW)tail -f /var/log/Xorg.0.log # 实时刷新日志(Ctrl+C退出)tail -n 50 /var/log/Xorg.0.log # 查看最近50行日志。内核日志 dmesg | grep -i “edid” EDID读取失败、硬件连接问题。
2025-06-07 21:55:04
572
原创 VS Code在windows powershell执行报错解决办法
pnpm : 无法加载文件 C:\Users\AppData\Roaming\npm\pnpm.ps1,因为在此系统上禁止运行脚本。有关详细信息,请参阅 https:/go.microsoftLinkID=135170 中的 about_Execution_Policies。所在位置 行:1 字符: 1。
2025-06-06 14:20:20
179
原创 Flyway
主要用于管理数据库结构的变更和演进。项目,能显著提升开发效率和部署可靠性。:Flyway是现代应用开发中。的数据库版本控制工具,特别适合。Flyway在数据库中创建。
2025-06-05 15:25:33
527
原创 【Agent智能体】吴恩达:AI智能体发展现状 | LangChain访谈--快速总结
本环节为炉边对话,嘉宾为吴恩达(Andrew Ng),无需过多介绍,广为人知。吴恩达在 Coursera 和深度学习教育领域影响深远。Harrison 介绍自己与吴恩达的合作渊源,尤其在 LangChain 相关课程开发上的支持。原片 @ 01:10吴恩达回顾了约 1.5-2 年前业界关于“智能体”与否的争论。彼时他提出不必纠结某系统是否“真正的 agent”,而应关注“agenticness(智能体性)”这一连续光谱,每个系统都有不同自治程度。
2025-06-03 11:32:45
550
原创 BiliNote 项目的实现流程和原理
可以轻松添加新的视频平台、转写引擎或 GPT 提供商,同时保持了高性能和良好的用户体验。这个架构的精妙之处在于。
2025-06-03 11:03:34
875
原创 CUDA与venv的配置
根据技术原理和实际配置经验,CUDA 工具包本身无法完全安装在 Python 的 venv 虚拟环境目录中,但可通过环境变量和依赖管理实现虚拟环境对特定 CUDA 版本的调用。以下是关键分析及配置方案:⚙️ 一、CUDA 工具包的安装位置与虚拟环境的关系· 原因:CUDA 是硬件相关的底层驱动,需被所有应用共享,且依赖 NVIDIA 显卡驱动支持。
2025-06-03 07:59:03
819
原创 python的几种虚拟环境创建方式
提示:优先使用 venv(Python 3.3+)或 pipenv(需依赖管理),旧项目维护选 virtualenv,科学计算选 conda。· 支持 --without-pip(跳过 pip 安装)、–system-site-packages(复用系统包)等参数。pipenv --python 3.8 # 创建环境并指定 Python 版本。source myenv/bin/activate # 激活(Linux/macOS)
2025-06-03 07:49:45
887
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人