sara_han 个人主页

@sara_han

sara_han

2023-06-25 14:29:39 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Kubernetes就绪探针揭秘：AI服务上线不再“秒挂”

AI模型服务在Kubernetes上部署时，常常遇到"刚启动就503"的问题。这是因为K8s默认认为容器启动即可接收流量，而AI服务需要加载大模型，导致未就绪时就被分配请求。解决方案是配置就绪探针(ReadinessProbe)，通过特定接口检查模型是否加载完成。关键配置包括initialDelaySeconds预留加载时间、periodSeconds设置检查频率等。建议AI服

#kubernetes #人工智能 #容器

AI系统背后的“数据保险箱”：S3与MinIO如何撑起MLOps的数据底座？

项目阶段推荐方案快速验证、小团队AWS S3（省心省力）企业级、合规要求高MinIO（自主可控）混合云/边缘场景MinIO + 多站点复制希望避免厂商锁定抽象存储层，统一使用S3 API🔑核心建议：无论选择哪种后端，都应通过标准接口（如boto3）进行抽象，让上层应用不感知底层差异。这才是MLOps工程化的正确姿势。AI不是一个人的算法秀，而是一群人的系统工程。当你的模型开始频繁迭代、数据不断积

#人工智能

不重启服务也能换模型？揭秘AI系统背后的热更新机制

《模型热更新：AI服务无缝升级的核心技术》摘要：模型热更新技术让AI系统在不停机情况下完成模型升级，实现零感知服务迭代。文章解析了热更新的三大核心目标（无中断、自动切换、可回滚）和三种主流实现方案：TensorFlow Serving的工业级方案、自研服务的灵活方案及Kubernetes的微服务方案，并给出关键落地实践。该技术已成为电商推荐、金融风控等高频迭代场景的必备能力，是AI工程化的重要体现

#人工智能 #neo4j #后端

模型版本控制：如何管理你的“AI产品迭代”？

摘要：模型版本控制（MVC）是AI工程化的关键环节，解决模型管理混乱问题。完整的MVC需管理权重、代码、数据、超参、环境、评估指标六要素，确保模型可追溯、可复现。主流方案包括：MLflow（轻量级全周期管理）、HuggingFace Hub（NLP专用Git式管理）、W&B（实验-模型一体化）、TFX（企业级血缘追踪）。最佳实践强调唯一标识、完整元数据、版本只读和CI/CD集成。不同规模

#人工智能 #语言模型 #后端 +1

模型参数 vs 超参数：90% 的人搞混了这两个概念

摘要：模型参数与超参数是AI训练中的关键区别。模型参数是训练过程中自动调整的内部变量（如权重），决定模型学到的知识；超参数是训练前人为设定的外部配置（如学习率、批量大小），控制学习过程。理解两者的差异（参数=学生学到的知识，超参数=教师制定的学习计划）对模型性能至关重要。正确设置超参数能确保模型达到其能力上限，而调参不当会导致训练失败。掌握这一区别是从"会跑代码"到"

#人工智能 #语言模型 #后端

搞懂模型训练与模型推理：AI落地的两个关键阶段

文章摘要：AI系统的模型训练与推理是两大核心环节。训练是让AI"学习"知识的过程，通过大量数据迭代优化模型参数；推理则是应用已训练模型解决实际问题的过程。两者在目标、参数更新、计算复杂度、资源需求等方面存在显著差异：训练计算密集但只需一次，推理要求快速响应且需反复执行。在实际应用中，训练与推理形成闭环系统，通过数据飞轮持续优化模型性能。理解两者的区别与联系，是构建高效AI系统的

#人工智能 #机器学习 #深度学习 +2

选对“骨架”，模型才能跑得快！一文看懂模型结构的底层逻辑

本文揭秘AI模型结构设计的关键要点。模型结构如同建筑蓝图，决定了模型的能力边界，包含层类型、连接方式和组件组合三大要素。文章剖析了5种主流结构：MLP适用于结构化数据，CNN擅长图像处理，RNN适合时序数据，Transformer具备并行计算优势，GAN和Autoencoder则专注于生成任务。模型结构设计需平衡深度、参数量、计算效率等因素，现代趋势正转向自动结构搜索（NAS）和Transform

#人工智能 #后端 #语言模型

后端工程师如何转型 AI？一份从0开始的系统攻略（建议收藏）

《后端工程师转型AI系统攻略》针对后端开发者的转型困惑，提出"工程能力是AI落地的核心优势"的观点。文章指出后端程序员已具备Python编程、系统设计和部署能力等AI工程化关键技能，并给出四大转型方向：1）AI工程/MLEngineer；2）大模型应用开发；3）工程化算法岗；4）AI平台/MLOps。建议分三阶段学习路径：1-2个月基础学习，2-3个月实战项目，最后聚焦细分方向

#人工智能

到底了