【摘要】 本周,全球AI领域迎来历史性时刻,OpenAI发布革命性的Sora 2模型及应用,将视频生成技术推向“GPT-3.5时刻”,成为无可争议的焦点。与此同时,国际科技巨头在算力、模型和应用层面持续加码。国内方面,以腾讯、阿里、DeepSeek为代表的企业掀起新一轮大模型开源浪潮,产业投资、基础设施建设与政策支持协同发力,展现出强劲的追赶与创新势头。AI正从技术突破全面转向产业重塑与生态构建。
一、 国际大事
1. OpenAI发布Sora 2,开启视频生成新纪元
事件:OpenAI发布旗舰视频与音频生成模型Sora 2及同名社交应用Sora。
时间:9月30日(北京时间10月1日)。
事件要点和描述:Sora 2实现了对物理世界的精准模拟、音视频同步生成、以及跨镜头叙事等革命性突破。其配套的Sora应用引入“Cameo”功能,允许用户将个人形象高保真植入AI场景,开启社交式共创。该应用首批在美国和加拿大以邀请制上线,迅速登顶应用商店榜首,标志着AI视频生成技术从实验走向大规模应用。
相关评论和业界声音:OpenAI CEO山姆·奥特曼称之为“创意领域的ChatGPT时刻”,预示着内容创作将迎来“寒武纪大爆发”。业界普遍认为,Sora 2是AI内容生产力从辅助工具迈向主力引擎的里程碑,将对影视、广告、社交等行业带来颠覆性影响,其估值也因此飙升至5000亿美元,超越SpaceX。
省心点评:Sora 2不仅是技术上的“王炸”,更是商业模式与内容生态的“核爆”。
2. 谷歌升级Gemini模型并发布端侧新品
事件:谷歌升级Gemini 2.5 Flash/Lite模型,并发布EmbeddingGemma。
时间:本周内(具体日期未在原文明确,归入本周)。
事件要点和描述:谷歌对其轻量级模型Gemini 2.5 Flash/Lite进行更新,旨在显著降低API调用的成本与延迟,提升性价比。同时,发布了参数量极小的端侧文本嵌入模型EmbeddingGemma,该模型可助力移动设备和物联网(IoT)设备在离线状态下进行高效的语义理解与分析,推动AI能力向边缘端下沉。
相关评论和业界声音:此举被视为谷歌在AI应用普及化和端侧智能布局上的重要一步。通过降低大模型使用门槛和强化边缘计算能力,谷歌正试图构建一个覆盖云端到终端的、更具成本效益的AI生态系统,与OpenAI等对手展开差异化竞争。
省心点评:谷歌一手降本增效,一手布局终端,意在让AI无处不在。
3. 微软深化AI集成并调整算力战略
事件:微软上线Microsoft 365 Premium订阅,并宣布调整AI数据中心芯片战略。
时间:本周内。
事件要点和描述:微软推出集成了Copilot高级能力与多模态交互的Microsoft 365 Premium订阅服务,进一步将AI深度融入其核心办公软件生态。同时,公司宣布未来的AI数据中心将逐步以自研芯片为主,旨在减少对外部GPU供应商(如英伟达)的依赖,优化成本结构并保障供应链安全。
相关评论和业界声音:业界分析认为,微软正通过“软件+硬件”两条腿走路,构建其AI帝国的护城河。将AI能力打包进高附加值订阅服务是其商业变现的关键,而自研芯片则是在底层算力竞赛中谋求长远自主权的战略核心。
省心点评:微软一边收割应用层红利,一边筑牢算力层根基。
4. Meta开源CWM代码世界模型
事件:Meta开源其代码世界模型CWM(Code World Model)。
时间:本周内。
事件要点和描述:Meta发布并开源了其最新的代码大模型CWM。该模型具备处理超长上下文的能力,并拥有创新的“自我修复”机制,能够自动检测并修正代码中的错误。CWM的开源旨在赋能开发者,提升软件开发效率和代码质量,进一步巩固Meta在AI开源社区的影响力。
相关评论和业界声音:开发者社区对CWM的超长上下文和自我修复能力表示期待,认为这将极大改善处理复杂代码库和遗留系统时的开发体验。此举也被看作是Meta坚持开源战略,与OpenAI、谷歌等闭源或部分开源路线竞争的重要举措。
省心点评:Meta用更聪明的代码模型,为全球程序员送上“神级辅助”。
5. 联合国发起全球AI治理对话
事件:联合国发起“全球AI治理对话”(Global Dialogue on AI Governance)。
时间:本周内。
事件要点和描述:为应对人工智能技术快速发展带来的全球性挑战,联合国发起了一项高级别对话倡议。该对话旨在为各国政府、科技公司、学术界及社会组织提供一个中立的协商平台,共同探讨AI在战略安全、伦理规范、公平发展等方面的议题,推动形成全球性的治理框架。
相关评论和业界声音:国际社会普遍欢迎这一倡议,认为在全球AI竞赛加剧的背景下,一个权威的多边协调机制至关重要。这有助于避免监管碎片化,促进技术向善,并确保发展中国家在全球AI浪潮中不被边缘化。
省心点评:技术狂飙突进,全球共商“交通规则”已刻不容缓。
二、 国内大事
1. 腾讯混元开源Image-3.0图像模型
事件:腾讯混元宣布开源其80亿参数的图像生成大模型Image-3.0。
时间:9月28日。
事件要点和描述:腾讯混元开源了其最新的原生多模态图像模型Image-3.0,并宣布支持商业化应用。该模型在中文语境下的图像生成、中英双语精准渲染以及复杂长文本指令理解方面表现出色,旨在为国内开发者和企业提供一个高性能、可商用的AIGC底层工具,促进自主创新。
相关评论和业界声音:国内开发者对此反响热烈,认为腾讯此举将极大丰富国产AI工具箱,降低AIGC应用的开发门槛。媒体评论称,这是国内大厂在开源生态建设上的又一重要落子,有助于构建不依赖于国外模型的自主技术链路。
省心点评:腾讯送出“画笔”,鼓励中国开发者画出自己的“蒙娜丽莎”。
2. 阿里巴巴开源轻量级多模态模型并加码AI基建
事件:阿里巴巴开源Qwen3-VL-30B-A3B模型,并宣布追加3800亿元AI基建投资。
时间:国庆期间(10月1日-4日);9月28日(云栖大会)。
事件要点和描述:国庆期间,阿里开源了采用MoE架构的轻量级多模态模型Qwen3-VL,推理时仅需激活30亿参数,显著降低了端侧部署门槛。此前在云栖大会上,阿里CEO吴泳铭宣布将追加3800亿元投资AI基础设施,以迎接ASI(通用人工智能)时代的到来,并发布了多款大模型与智能体工具。
相关评论和业界声音:吴泳铭关于ASI时代“三阶段演进”的判断引发行业热议。巨额的基建投资被视为阿里豪赌AI未来的决心体现。轻量化模型的开源则被看作是其抢占移动端和边缘设备AI应用生态入口的务实之举。
省心点评:阿里左手“砸钱”建高速,右手“送车”铺市场,双线并进备战AI终局。
3. DeepSeek发布效率版模型并开源VLA模型
事件:DeepSeek发布V3.2-Exp效率版模型并开源VLA-1B视觉-语言-动作模型。
时间:9月29日。
事件要点和描述:DeepSeek发布了采用稀疏注意力机制的V3.2-Exp模型,旨在优化长文本处理效率与成本,并同步下调API定价。同时,开源了VLA-1B模型,该模型融合视觉、语言与动作控制,可将机器人抓取、导航等任务的训练效率提升5倍,加速具身智能在工业、服务等场景的应用。
相关评论和业界声音:DeepSeek的系列动作被解读为在AI大模型“价格战”和“场景战”中双重出击。效率版模型和降价策略直指广大成本敏感型开发者,而VLA模型的开源则切中了具身智能这一前沿热点,展现了其在底层技术创新上的实力。
省心点评:DeepSeek一手卷价格,一手卷前沿,力图成为AI赛道的“效率之王”。
4. 国内最大人形机器人训练场在京启用
事件:国内规模最大的人形机器人训练场在北京石景山正式投入运营。
时间:本周内。
事件要点和描述:该训练场占地上万平方米,年产数据量可超600万条,将为全国的人形机器人研发提供海量、高质量的训练数据和测试环境。它的启用标志着我国在具身智能关键基础设施建设上迈出重要一步,将有力推动人形机器人“具身大脑”的快速进化和产业化进程。
相关评论和业界声音:业内专家认为,高质量的训练数据是具身智能从实验室走向现实的关键瓶颈。该训练场的落成,将为国内机器人企业提供一个“超级驾校”,加速机器人在复杂真实环境中的学习与适应能力,是中国追赶特斯拉等国际领先者的重要布局。
省心点评:为机器人建“超级驾校”,中国具身智能产业按下“加速键”。
5. 多场重磅AI行业会议召开,多地出台支持政策
事件:2025天府人工智能产业生态大会、全球数字贸易博览会等会议召开;多部门及地方政府发布AI支持政策。
时间:9月28日起。
事件要点和描述:本周,成都、杭州、北京等地接连举办大型AI相关会议,聚焦产业生态、数字贸易和算力建设,发布超200亿元的供需清单和合作机会。同时,工信部等六部门发文推动“人工智能+现代物流”,北京、四川等地也相继出台算力补贴、专项基金等精准扶持政策,形成“会议搭台、政策铺路”的良好局面。
相关评论和业界声音:密集的会议和政策表明,发展AI已成为从中央到地方的共识与行动。与会专家指出,AI智能体(Agent)正成为继大模型后的新热点。政策层面从宏观引导转向精准滴灌,有助于解决企业在算力、资金、场景等方面的实际困难,加速区域AI产业集群的形成。
省心点评:政企学研同频共振,中国AI产业发展驶入“快车道”。
结语
本周,人工智能领域上演了一场由Sora 2引爆的全球盛宴,它不仅重新定义了内容创作的边界,也预示着AI正以前所未有的速度融入现实世界。在国际巨头凭借“技术-产品-资本”三位一体模式加速领跑的同时,中国AI力量也展现出强大的韧性与活力,通过“政策-开源-落地”协同并进,在模型技术、产业应用和基础设施等多个维度奋起直追。
展望未来,三大趋势值得重点关注:首先,多模态与具身智能将成为技术竞赛的主战场,AI将从理解世界走向与物理世界交互;其次,算力基础设施的竞争将愈发激烈,“主权AI”和算力自主可控成为各国战略焦点;最后,随着AI能力的指数级增长,安全、伦理与全球治理的重要性将空前凸显,构建可信、可控、普惠的AI生态将是所有参与者共同的课题。新一轮智能革命的浪潮已至,机遇与挑战并存。