大家好,我是ALLMHUB,AI前沿简报将为您定期整理AI最新咨询,助您在极短的时间里了解AI界的各类大事件。
本期,AI领域动态频繁,DeepSeek升级V3.1版本扩展上下文长度至128K,小红书发布DynamicFace人脸生成技术,Nvidia推出Nemotron-Nano-9B-v2小型开放模型,同时OpenAI CEO透露GPT-6将更快到来并具备个性化记忆功能,理想汽车、ElevenLabs等公司也相继推出创新产品,展现了AI技术在多个垂直领域的快速发展与应用拓展。
DeepSeek V3.1重磅升级
DeepSeek开源新模型V3.1-Base,参数约685B,上下文长度扩展至128K。线上版本同步升级,可通过官网、App、小程序测试。大幅提升的上下文容量使其在长文档分析、代码库理解、长对话一致性方面表现更优。
OpenAI CEO预告GPT-6加速到来
奥尔特曼透露GPT-6将比GPT-4到GPT-5间隔更短,将具备个性化记忆功能,能根据用户偏好、习惯调整响应。同时承认GPT-5推出存在问题,已悄悄进行语气更新使其更友好。
小红书推出DynamicFace人脸技术
小红书AIGC团队发布可控人脸生成技术DynamicFace,针对图像和视频人脸融合任务优化,实现高质量与高度一致性的人脸置换效果。技术强调可控性,在娱乐社交和影视制作领域具有广泛应用前景。
理想汽车发布MindGPT 3.1模型
理想汽车推出MindGPT3.1智能体模型,每秒输出速度达200个tokens,性能提升近5倍。将智能体能力融入大模型架构,支持边想边搜功能,在数学计算、代码编程等关键维度全面超越前代版本。
Gemini API新增URL Context功能
Gemini API推出URL Context功能,开发者可直接在API中嵌入网页链接,模型自动访问解析内容。提升开发效率的同时,可能催生类似AdSense的联盟商业模式,为内容提供商带来新收入来源。
Nvidia发布Nemotron-Nano小型模型
Nvidia推出90亿参数的Nemotron-Nano-9B-v2模型,支持智能推理开关,优化于单个A10 GPU运行。基于混合架构高效处理长序列信息,适用于多语言任务和代码生成,以开放许可证发布允许商业用途。
ElevenLabs推出视频配乐生成
ElevenLabs发布视频到音乐生成流程,可基于视频内容自动生成定制化配乐。同时推出AI学生包,提供免费积分和折扣工具支持教育应用,进一步扩展多模态能力和AI音频生态。
马斯克发布Grok Imagine测试版
马斯克宣布xAI推出图像生成功能Grok Imagine 0.1测试版,定位为"想象力放大器",旨在与DALL-E、Midjourney等主流工具竞争。虽承认当前版本需改进,但对未来发展充满信心。
更多大模型咨询及使用教程尽在ALLMHUB