- 博客(35)
- 收藏
- 关注
原创 对于深度神经网络,为了使得训练过程更少遇到极小点,应该采用何种权重初始化策略?
在深度神经网络中,权重初始化策略的核心目标是打破对称性、维持信号(前向传播)和梯度(反向传播)的稳定方差,从而避免训练陷入不良的局部极小点(更常见的是鞍点)并加速收敛。Leaky ReLU/PReLU:使用 He 初始化,并在公式中考虑负斜率(如 √(2 / (1 + a²)) / √fan_in,`a` 为负斜率)。均匀分布:W ~ Uniform(-√(6/(fan_in + fan_out)), √(6/(fan_in + fan_out)))
2025-08-11 11:37:13
402
原创 大模型推理加速技术的学习路线是什么?
必学算子:Embedding、Linear、Matmul、RoPE位置编码、MHA/GQA/MQA(多头/分组/多查询注意力)、RMSNorm、SoftMax、MLP、MoE(稀疏专家混合)- 注意力简化:滑动窗口(Sliding Window)、动态NTK(长文本外推)、MQA/GQA(多查询/分组注意力)- 算法优化:FlashAttention(减少显存访问)、旋转位置编码(RoPE)的CUDA实现。- 并行范式:数据并行(DP)、张量并行(TP)、流水线并行(PP)、专家并行(EP)
2025-08-11 11:36:38
735
原创 未来人工智能操作系统能否取代通用的手机操作系统?
长期看,AIOS可能成为下一代智能终端的“新基座”,推动交互范式从“应用中心”向“智能体中心”跃迁。- 引态科技提出三层架构:态核(硬件驱动)、引元OS(设备间协议)、小引助手(统一接口),实现“设备如神经网络协作”。- AIOS需支持本地大模型推理(如GPT-5端侧运行)、实时跨设备调度(如小米澎湃OS3的分布式算力)。- 手机OS深度整合AI能力(如iOS+GPT-5、澎湃OS+场景管家),但保留传统应用兼容层。- 入口迁移:用户通过智能体直接获取服务(如“帮我规划旅行”),应用商店价值衰减。
2025-08-11 11:36:04
915
原创 华为发布AI推理“破壁”技术:突破HBM封锁,国产算力生态迎来拐点
当美国通过HBM禁运卡住中国AI算力咽喉,华为选择用系统级创新对抗单点技术霸权——正如任正非所言:“用数学补物理,非摩尔补摩尔,用群计算补单芯片”。8月12日的技术发布,既是国产AI推理生态的“破壁宣言”,更是全球算力竞赛进入“第二赛道”的转折点。2025年8月12日,华为将在“金融AI推理应用落地与发展论坛”发布一项颠覆性技术——通过创新架构设计大幅降低AI推理对高带宽内存(HBM)的依赖。”——论坛组委会技术顾问。- 打破“唯HBM论”产业惯性,推动全球AI芯片竞争从“硬件堆砌”转向“架构创新”;
2025-08-11 09:59:33
984
原创 北京人形机器人创新中心发布四大技术突破 推动“天工“实现从奔跑向实用的跨越
"技术负责人指出,该模型通过融合机器人操作数据与互联网视频资源,建立起通用操作知识库。而全身控制系统则让机器人实现"移动中作业"——导航系统保障动态避障能力,上身控制模块支持移动状态下的精准操作。通过远程遥操作中心调度,机器人深入制造车间、商业空间等真实环境,采集包含环境扰动、突发状况的高价值数据。这些突破性进展正推动曾创造马拉松纪录的"天工"人形机器人向工业实用化迈进,标志着我国在人形机器人"群体智能"领域取得重大进展。这种打破传统"单机单岗"模式的无缝协作,标志着工业自动化正式迈入"群体智能"时代。
2025-08-11 09:58:49
243
原创 银河通用机器人Galbot闪耀2025世界机器人大会,具身智能应用遍地开花
在工业领域,Galbot同样展现出了卓越的性能。在汽车零件SPS分拣工作中,面对多层堆叠且错位的零件、外观高度相似的工件以及工厂内的各种环境干扰,Galbot凭借精准的视觉识别系统,能够快速锁定目标工件并精准抓取。在熙熙攘攘的展厅中,银河通用精心打造的Galbot机器人从序厅的技术演示到自主展位的全场景应用展示,再到会客厅的真实商业售卖,全程无需人工遥控,高效流畅地完成各项任务。银河通用的这些创新成果不仅展示了具身智能技术的强大适应力和多场景应用潜力,也为未来机器人的发展提供了新的思路和方向。
2025-08-11 09:58:14
331
原创 银河通用Galbot领衔具身智能,携手英伟达,加速机器人产业落地
通过与英伟达的合作,Galbot在处理复杂任务时的效率和精准度都得到了显著提升,例如在工业场景中,Galbot能够高效完成汽车零件SPS分拣工作,即使面对多层堆叠、外观相似的工件以及环境干扰,也能精准抓取。银河通用在本次大会上所展示的成果,不仅体现了具身智能技术的强大适应性和多场景应用潜力,也为未来机器人的发展提供了新的思路和方向。最值得关注的是银河通用与英伟达的合作。在零售领域,它展示了GroceryVLA大模型的应用,能够在密集陈列的商品中识别和抓取各种包装形态的商品,无需人工干预。
2025-08-11 09:57:48
326
原创 奥特曼发布新一代人工智能模型GPT-5
今日凌晨(北京时间2025年8月8日),OpenAI首席执行官山姆·奥特曼(Sam Altman)正式发布新一代人工智能模型GPT-5,标志着AI技术迈入全新阶段。奥特曼以教育阶段类比模型进化:GPT-3如高中生(灵光乍现但不可靠),GPT-4像大学生(具备实用智慧),而GPT-5则相当于按需召唤的领域博士专家,尤其在编程、数学推理、医疗健康等场景表现卓越。整合GPT系列语言模型与o系列推理模型,首次采用“三位一体架构”(基础模型+深度思考模型+智能路由),根据任务复杂度自动切换子模型,无需用户手动选择。
2025-08-08 10:10:19
804
原创 GPT-5登场,有三大亮点!OpenAI奥特曼:已从大学生变博士级专家
OpenAI还专门开发了一个路由系统,可以根据对话类型、复杂度、工具需求以及用户的明确意图(例如如果提示词中说到“认真思考一下”)自动切换版本,路由系统会根据真实信号持续训练,包括用户切换模型的时间、响应偏好率以及测量的正确率,并不断改进。据OpenAI介绍,团队在GPT-5中引入了一种全新的安全训练形式——安全补全(safe completions),让模型在安全界限内尽可能给出最有帮助的答案,也就是部分回答用户的问题,或只提供高水平的回答。8月8日,人工智能(AI)巨头OpenAI正式推出GPT-5。
2025-08-08 10:09:18
303
原创 云计算一哥首度牵手OpenAI,大模型「选择」自由,才是终极胜利
Anthropic 在 8月5日 发布 Opus 4.1,而 OpenAI 在 8月6日 官宣开源模型 —— 两者仅隔数小时,被业内视为“狙击式竞争”。OpenAI 开源 可能催生更多小众优化模型(如医疗、金融专用版),而 Anthropic 的 Opus 4.1 让企业获得“开箱即用”的编码专家。GPT-OSS-120B 与 GPT-OSS-20B 两款模型开源,采用 专家混合架构(MoE),根据任务激活不同子网络,兼顾性能与效率。OpenAI 则突出开源的“普惠性”,降低技术使用门槛。
2025-08-08 10:08:30
491
原创 AI 未来会不会分成:社会主义阵营AI,和资本主义阵营AI?
2025年数据显示,微软、谷歌、Meta控制全球60%的AI基础设施,训练尖端模型的成本动辄数千万美元,加剧了技术资源的集中。若资本主义无法调和AI引发的矛盾,社会主义模式或为全球提供 “技术国有化”范本——正如冯象所言:“当AI消弭稀缺性时,共产主义的使命是让解放的双手托起星辰大海。社会主义AI强调 集体主义、公平分配,例如中国探索“人机价值对齐”时,要求AI输出符合社会主义核心价值观的内容,避免算法偏见强化社会不平等。不是有可能,而是必然,这种必然是历史发展的必然,不以人的意志为转移。
2025-08-07 11:48:23
2349
原创 《计算机视觉:瓶颈之辩与未来之路》
2024 年 2 月,吉林省科学技术厅印发《关于发布核心光电子器件和高端芯片等 3 个重大科技专项项目申报指南的通知》,提出要利用计算机视觉和机器学习技术,自动识别数字地球上的地物、地貌、水文等信息,并进行标注,提高数字地球中地物信息的自动化获取和处理效率,为数字地球的应用和发展提供更好的支持。在实际应用中,图片数据可能会存在很多问题,如噪声、模糊、失真、曝光不足、图像遮挡等,这些问题会影响图片的质量,进而影响计算机视觉算法的准确性。例如,多变和非均匀的光照场景,如逆光场景,会影响计算机视觉的效果;
2024-12-12 17:05:14
2602
原创 《计算机视觉证书:开启职业发展新航道》
证书持有者在实际工作中,不断学习新的知识和技能,掌握最新的技术动态和应用趋势,为企业带来新的思路和方法。作为政府机构颁发的证书,拥有较高的公信力。谷歌的 TensorFlow 框架在深度学习领域占据重要地位,该证书主要检验使用 TensorFlow 进行深度学习开发的能力,为开发者在深度学习领域的发展提供了有力的支持。计算机视觉设计工程师:从事计算机视觉应用场景的需求分析,模型构建及验证,实现相应的计算机视觉产品设计、交付及运维,并对人工智能系统进行设计、优化、运维、管理和应用的专业人员。
2024-12-11 14:28:12
1388
原创 工信部人工智能大模型学习
从2022年大语言模型ChatGPT的问世,到2024年的视频生成大模型Sora的推出,人工智能技术已发展到生成技术和多模态大模型阶段,成为每一位科技人才重点关注和研究的方向。各省市、自治区从事人工智能、自然语言处理、图像处理、视频处理、数据挖掘、无人机、无人车、无人艇、智慧城市、智慧医疗、智能装备、目标识别、轨迹规划、智慧交通等领域相关研究的企事业单位技术骨干、科研院所研究人员和大专院校相关专业教学人员及在校研究生等相关人员,以及生成式AI、大模型研究感兴趣的广大爱好者。那么,什么是大模型?
2024-12-10 11:19:20
801
原创 计算机视觉在科学研究(数字化)中的实际应用
为进一步贯彻落实中共中央印发《关于深化人才发展体制机制改革的意见》和国务院印发《关于“十四五”数字经济发展规划》等有关工作的部署求,深入实施人才强国战略和创新驱动发展战略,加强全国数字化人才队伍建设,持续推进人工智能专业人员能力培养和评价,工业和信息化部电子工业标准化研究院牵头研制的SJ/T11805-2022《人工智能从业人员能力要求》已经于2022年7月1日发布实施。例如,利用计算机视觉技术,科学家可以研究人类的面部表情、动作和语言等特征,以推断他们的情感状态和行为意图。鉴于计算机视觉技术的关键应用,
2024-12-09 09:45:51
704
原创 大模型学习有什么发展前景?
从2022年大语言模型ChatGPT的问世,到2024年的视频生成大模型Sora的推出,人工智能技术已发展到生成技术和多模态大模型阶段,成为每一位科技人才重点关注和研究的方向。各省市、自治区从事人工智能、自然语言处理、图像处理、视频处理、数据挖掘、无人机、无人车、无人艇、智慧城市、智慧医疗、智能装备、目标识别、轨迹规划、智慧交通等领域相关研究的企事业单位技术骨干、科研院所研究人员和大专院校相关专业教学人员及在校研究生等相关人员,以及生成式AI、大模型研究感兴趣的广大爱好者。那么,什么是大模型?
2024-12-06 14:13:57
1040
原创 大模型学习有什么发展前景?
为帮助大家掌握大模型调用、大模型微调、大模型开发技术,积极响应科研及工程技术人员的需求,根据人社部发布的《2021-2030专业技术人才知识更新工程》,中国人工智能培训网联合相关单位特举办“生成式AI与大模型核心技术开发与应用研修班”。AI大模型在自然语言处理、计算机视觉、语音识别等领域有着广泛的应用,例如我们所用到的 豆包(字节云雀大模型)、通义千问(阿里通义大模型)、讯飞星火(星火认知大模型)、文心一言(百度文新大模型)、智谱清言(智谱 ChatGLM 2大模型)等都是大型语言模型的产物。
2024-12-05 11:02:25
495
原创 计算机视觉设计如何应用于人脸识别技术?
人脸表情分析:计算机视觉设计可以使用人脸表情分析算法,如基于特征的方法、基于深度学习的方法等,来分析人脸的表情。这些算法可以通过提取人脸的表情特征,并与已知的表情特征进行比对,从而确定人脸的表情状态,如高兴、悲伤、惊讶等。人脸定位:一旦检测到人脸,计算机视觉设计可以使用人脸定位算法,如基于特征点的方法、基于模型的方法等,来确定人脸的关键点位置,如眼睛、鼻子、嘴巴等。人脸识别:计算机视觉设计可以使用人脸识别算法,如基于特征的方法、基于统计的方法、基于深度学习的方法等,来对人脸进行识别。
2024-12-04 11:29:00
678
原创 计算机视觉技术在智慧城市建设中的应用
为进一步贯彻落实中共中央印发《关于深化人才发展体制机制改革的意见》和国务院印发《关于“十四五”数字经济发展规划》等有关工作的部署求,深入实施人才强国战略和创新驱动发展战略,加强全国数字化人才队伍建设,持续推进人工智能专业人员能力培养和评价,工业和信息化部电子工业标准化研究院牵头研制的SJ/T11805-2022《人工智能从业人员能力要求》已经于2022年7月1日发布实施。例如,智能监测系统可以通过对空气中微小颗粒物的自动检测,给出预警和建议,提醒市民采取相应的防护措施,避免空气污染对健康造成的危害。
2024-12-03 11:02:48
779
原创 计算机视觉技术的应用现状和发展趋势
如果已经从事或者准备从事人工智能行业的人员,对于考证宜早不宜迟,早拿证早安心,国家对人工智能行业从业证书的要求将会越来越高,现在证书刚开始推广,无论从费用上,还是从考试难度上,都是最低的。从事计算机视觉应用场景的需求分析,模型构建及验证,实现相应的计算机视觉产品设计、交付及运维,并对人工智能系统进行设计、优化、运维、管理和应用的专业人员。由国家工信部权威认证的人工智能证书是跨入人工智能行业的敲门砖,随着人工智能技术的发展越来越成熟,相关的从业人员也会剧增,证书的考取难度也会变高。
2024-12-02 09:40:37
1222
原创 人工智能培训班有用吗?AI培训怎么报名?都学什么培训内容?
要证书的话,行内比较有权威的应该就属工信部颁发的证书了。工信部一般都会和下属的一些培训机构或公司啊什么的联合,你直接搜想要报的课程或专业,找第三方培训机构报名就行。2.如果是为了好就业、升职加薪而培训的话,那就得找那种有培训证书可拿的培训机构了,只要对口,培训机构都无所谓。1.如果想学点东西建议大家根据自己的专业(人工智能也分好多细的专业)和自己掌握知识的程度找培训机构。报班的话最好报那种理论+实战都有的,理论自不必说,实战是根据工作中需要的案例来的。第一、看培训的目的是什么?2、选自己在行的专业。
2024-11-29 10:40:08
500
原创 人工智能专业好就业吗?工作岗位多吗?
尽管人工智能专业在就业市场上前景看好,但也要注意很多问题,人工智能技术在不断演进,需要持续学习和更新知识以保持竞争力,来适应快速变化的技术。随着技术的不断发展,各个行业对于人工智能和机器学习的需求不断增加。总体而言,人工智能专业具有良好的就业前景和多样化的工作岗位选择,但就业成功仍然需要个人的努力、技能发展和市场趋势的把握。由于人工智能技术的高度技术性和市场需求,人工智能专业的毕业生通常能够获得较高的起薪和薪水增长。1.机器学习工程师: 设计、开发和优化机器学习算法和模型,用于数据分析、预测和自动化任务。
2024-11-28 09:26:25
532
原创 生成式AI、大模型、跨模态技术开发与应用
北京理工大学教授,国家自然基金委项目函审专家、国家重点研发计划评审专家、科技部项目评审专家、北京市自然科学基金/重点基金评审专家、博士点基金/博士后基金评审专家,国际期刊NLPR主编,以及其它期刊编委。目前主要从事自然语言处理、机器学习、模式识别、生成式AI、大模型、多模态方面研究。3.深度学习框架:Pytorch 4.大语言模型:几种国产开源大语言模型。5.大语言模型开源微调、Agent开源框架。2024年12月13日-17日 杭州。第三章 Transformer。
2024-11-26 14:47:46
173
原创 生成式AI、大模型、跨模态技术开发与应用
北京理工大学教授,国家自然基金委项目函审专家、国家重点研发计划评审专家、科技部项目评审专家、北京市自然科学基金/重点基金评审专家、博士点基金/博士后基金评审专家,国际期刊NLPR主编,以及其它期刊编委。目前主要从事自然语言处理、机器学习、模式识别、生成式AI、大模型、多模态方面研究。注:整个环境可在局域网内部署,学员连接云服务器(GPU 80G显存)实操。5.大语言模型开源微调、Agent开源框架。4.大语言模型:几种国产开源大语言模型。2024年12月13日-17日 杭州。第十一章 Sora训练。
2024-11-25 11:33:31
285
原创 生成式AI、大模型、跨模态技术开发与应用
北京理工大学教授,国家自然基金委项目函审专家、国家重点研发计划评审专家、科技部项目评审专家、北京市自然科学基金/重点基金评审专家、博士点基金/博士后基金评审专家,国际期刊NLPR主编,以及其它期刊编委。目前主要从事自然语言处理、机器学习、模式识别、生成式AI、大模型、多模态方面研究。3.深度学习框架:Pytorch 4.大语言模型:几种国产开源大语言模型。5.大语言模型开源微调、Agent开源框架。2024年12月13日-17日 杭州。第三章 Transformer。第十一章 Sora训练。
2024-11-22 16:06:03
281
原创 医疗新势力 ——AI:提升诊断与治疗的神奇魔杖
在医学发展的漫长历程中,我们正站在一个前所未有的转折点上,而这一转折的关键驱动力便是人工智能(AI)。如同神奇魔杖一般,AI 正在深刻地重塑医疗领域的诊断与治疗模式,为人类健康事业带来全新的希望和变革。
2024-11-05 09:15:14
1086
原创 AI 在软件开发流程中所具有的优势,同时面临一些挑战
大家都知道AI 大模型是一种基于大规模数据训练而成的人工智能模型,它拥有庞大的参数数量和复杂的神经网络结构。这些模型可以通过对海量文本、代码等数据的学习,能够理解和生成自然语言、代码等信息。今天就聊一下当下AI在软件开发领域,这种能力所具有的优势,以及会面临一些挑战,我们应该怎么应对这些问题。
2024-11-05 09:08:55
1232
原创 AI 智能家居:打造便捷舒适的未来家庭生活新图景
当科技的曙光穿透生活的迷雾,AI 智能家居如一颗璀璨的明星,在家庭生活的苍穹中闪耀,勾勒出一幅便捷舒适的未来新图景。
2024-11-04 09:20:17
619
原创 点亮生活的智能魔法 —— 无处不在的应用大揭秘
在当今这个科技飞速发展的时代,AI(人工智能)已经如同一股不可阻挡的浪潮,席卷了我们生活的每一个角落。它宛如神奇的魔法,悄然改变着我们的生活方式,为我们带来前所未有的便捷与惊喜。
2024-11-04 09:11:39
564
原创 AI技术原理大揭秘:机器学习是如何工作的?
数据收集: 数据来源:数据是机器学习的基础,其来源非常广泛。例如,在图像识别领域,数据可以是从互联网上收集的大量图片、科研机构提供的专业图像数据集,或者是企业内部积累的特定场景下的图像数据;在金融领域,数据可能来自银行的交易记录、客户信息、市场行情等。 数据质量:高质量的数据对于机器学习的效果至关重要。这就需要对收集到的数据进行筛选和预处理,去除噪声、异常值和重复数据等,以确保数据的准确性、完整性和一致性。 数据预处理: 数据清洗:对数据中的缺失值进行处理。对于数值型数据,可能采用均值、中位数
2024-11-01 10:22:00
477
原创 初识 AI:理解人工智能的基本原理与特点
然而,我们也需要认识到人工智能带来的挑战和问题,如伦理道德、就业结构变化等,并积极寻求解决方案,以确保人工智能的健康、可持续发展,使其更好地服务于人类社会。希望通过本文的介绍,你对人工智能的基本原理和特点有了初步的认识和理解,为进一步探索人工智能的世界打下基础。它们可以根据环境的变化和输入的数据,自动调整自身的参数和策略,而不需要人类实时的干预。而且,随着数据量的增加和算法的改进,人工智能的学习能力还在不断增强。大量的数据是训练人工智能模型的基础,数据的质量和数量直接影响模型的性能和准确性。
2024-11-01 09:15:32
6034
原创 人工智能的核心概念详解
一、机器学习定义与原理 机器学习是人工智能的核心领域之一,它使计算机能够自动从数据中学习规律和模式,而无需明确编程。其原理基于统计学和算法,通过让计算机分析大量的数据样本,自动调整模型的参数,以优化对数据的预测或分类准确性。例如,在图像识别中,机器学习模型会通过分析大量的图片数据,学习到不同物体的特征模式,从而能够准确识别新的图像中的物体。 主要类型 监督学习 定义:监督学习是机器学习中最常见的类型之一。在监督学习中,训练数据包含输入特征和对应的输出标签。计算机通过学习输入特征与输出
2024-10-31 09:38:33
1387
原创 AI 基础解密:人工智能的定义与发展历程
广义定义人工智能是一个广泛的领域,涵盖了多种技术和方法,旨在使机器能够执行通常需要人类智能才能完成的任务。这包括学习、推理、解决问题、感知、理解语言、识别图像和模式等能力。从广义上讲,AI 的目标是创建能够模拟人类智能行为的智能系统,使其能够在各种环境和任务中自主地或辅助人类进行决策和行动。狭义定义在计算机科学领域,人工智能通常被定义为对计算机系统进行编程和设计,使其能够执行特定的智能任务,如机器学习算法的开发和应用、自然语言处理技术的实现、计算机视觉系统的构建等。
2024-10-31 09:21:14
1227
原创 走近 AI 的世界:什么是人工智能?
人工智能是一门研究、开发用于模拟、延伸和扩展人类智能的技术科学。它试图让计算机系统具备像人类一样的智能能力,如学习、推理、解决问题、理解语言、识别图像等。简单来说,人工智能就是让机器能够像人一样思考和行动,尽管目前的技术水平还无法完全达到人类智能的复杂性和灵活性,但 AI 已经在许多领域取得了显著的成就,并展现出了巨大的潜力。
2024-10-30 17:25:38
3488
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人