一句话总结

2026年6月8日-9日全球AI领域迎来密集动态,苹果在WWDC 2026完成库克任期收官并推出深度结合谷歌技术的全新Siri与Apple Intelligence,OpenAI秘密启动IPO,国内外多款大模型、AI框架、开源工具集中发布,智能体成为行业核心发展方向,同时AI商业模式、算力硬件、行业监管与应用落地均出现诸多新变化,国产大模型调用量持续领跑全球,智联网、Agent经济等新形态引发行业深度探讨。

一、模型与技术突破

1.1 通用大模型&多模态模型

  1. 字节跳动:开源3B参数多模态模型Lance,采用双混合专家架构与模态感知旋转位置编码技术,可完成图像、视频的理解、生成与编辑,上线后登顶Hugging Face趋势榜,主打轻量化多模态能力。
  2. Next团队:推出40亿参数国产认知模型“新程Alpha”,端侧部署后等效4B大小,可媲美大型推理模型,降低算力成本,拓展主动式AI应用场景。
  3. 云知:发布新一代基座模型U2,秉持“智能密度×Token价值”设计,推理成本与Token消耗大幅下降,同时具备原生智能体能力,可拆解超100步复杂任务,推动AI从资源竞争转向价值创造。
  4. 斑马智能:推出全模态端侧大模型AutoOmni,参数覆盖3B至30B,车载场景下自然交互度提升45%,服务成功率上涨35%,安全响应延迟低于500毫秒。
  5. MiniMax:推出M3模型,集成百万超长上下文、原生多模态与编程能力,综合性能对标Claude Sonnet,定价仅为其五分之一,配套MiniMax Code支持长程编程任务。
  6. 阿里:发布Qwen3.7-Plus多模态智能体模型,融合视觉、UI操作与编码能力,可自主完成应用开发;同时推出RTPurbo V2技术,将Transformer注意力计算量压缩16至32倍,无损精度。
  7. 谷歌:升级NotebookLM并搭载Gemini 3.5模型,新增Agent能力与高级推理,支持PNG、SVG、PDF等多格式输出,可主动检索外部权威资料;Gemma 4 12B模型支持音视频多模态,8GB内存设备可本地运行。
  8. Anthropic:网传Mythos 5模型参数量达10万亿,代码训练速度提升52倍,擅长SVG生成与音乐创作;Claude Opus 4.8引入dynamic workflows,优化长程任务稳定性。
  9. 苹果:自研Apple Foundation Models(AFM),分为端侧与云端双模型架构,搭配谷歌Gemini能力,构成Apple Intelligence核心,实现端云协同,苹果明确该模型为自主研发,非单纯套壳第三方产品。
  10. 小米:推出MiMo-V2.5-Pro-UltraSpeed模式,万亿参数模型解码速度突破1000tokens/s,基于MXFP4量化与块扩散投机解码技术,兼顾速度与输出质量,对应底层模型为MiMo-V2.5-Pro-FP4-DFlash。
  11. MindLab Research:开源749B参数Macaron-V1-Preview模型,基于GLM-5.1训练,融合五个专项LoRA适配器,可动态切换能力模块,适配生活、编程、UI生成等多元场景。
  12. 北京大学联合团队:推出EvoPhys-World 5D世界模型,在世界生成评测中排名第一,全程基于摩尔线程MTT S5000 GPU训练。
  13. 高德:发布ABot-Earth0.5 3D原生城市世界模型,输入图像或文本后,消费级GPU可在10分钟生成公里级3D城市场景,成本仅为传统方案1%,覆盖190余个国家地区,素材可导入主流引擎。

1.2 垂直大模型

  1. M-A-P社区联合南京大学:开源OProver数学定理证明模型与OProofs语料库,在Lean 4评测中斩获三项第一、两项第二,配套1.76M条形式化陈述、6.80M条编译器验证证明数据,解决训练与部署策略错位问题。
  2. 南加州大学PSI Lab:相关模型在CVPR 2026具身智能赛道获奖,聚焦3D世界理解、物理感知,适配人形机器人任务。
  3. Meta:发布VLM³三维视觉模型,在单目深度估计、相机姿态估计等任务上表现优异,简化三维视觉开发架构。
  4. 中科院自动化所:发布空间智能相关综述,依托认知地图技术,优化智能体空间感知、推理与生成能力。
  5. Anthropic:推出gget virus工具,优化生物数据检索,将AI病毒序列查询准确率提升至90%以上,明确生物学AI瓶颈为数据基础设施。
  6. 香港大学联合腾讯混元:推出PhysForge框架,单张图像即可生成带物理属性的3D资产,已被ICML 26收录,服务机器人仿真、虚拟世界领域。
  7. 百度:开源0.9B参数PaddleOCR-VL-1.6文档解析模型,在OmniDocBench榜单登顶,表格、公式识别能力突出。
  8. 中科院海洋所:发布琅琊2.0海洋预报大模型,针对台风、海冰等六类海洋现象优化,提升预报精度与分辨率。
  9. 京东:开源JoyAI-Echo长视频生成框架,解决角色、声纹漂移问题,推理速度提升7.5倍,支持超分处理。

1.3 专项技术突破

  1. 字节:dual-stream mixture-of-experts架构、Modality-Aware Rotary Positional Encoding技术,实现模型理解与生成能力分离协同。
  2. 南洋理工、复旦等:推出δ-mem轻量级在线记忆机制,仅增加0.12%参数,大幅提升大模型长对话能力。
  3. 微软亚洲研究院联合清华:提出VITRA框架,依托海量人类视频预训练,少量微调即可实现机器人灵巧操作。
  4. 北大:AesFormer美学重构模型,分美学规划、像素编辑两大阶段,优化照片构图与观感,配套AesRecon数据集。
  5. 投机键值编码技术:实现四倍无损显存压缩,助力长文本模型在消费级显卡运行。
  6. 隐式思维链(ICoT):伯克利与普林斯顿团队完成数学证明,4层Transformer在奇偶校验任务中准确率达100%。
  7. 谷歌DeepMind:升级Gemini相关技术,强化实时图像修改、多轮推理能力。
  8. 安纳智芯:研发模拟计算芯片,专攻矩阵求逆运算,采用非冯诺依曼架构,功耗更低、并行性更强。

1.4 AI框架&开源工具

  1. Nex AGI:开源Nex-N2-Pro智能体框架,融合推理、工具调用、环境执行闭环,分为Pro、mini双版本,适配不同延迟需求。
  2. 谷歌:开源google-skills工具集,面向Google Cloud服务提供预置技能,简化AI代理开发;同时推出turbovec向量索引工具,高压缩比且检索速度领先。
  3. 开发者:开源xiaohu-video-translate视频翻译工具,基于Whisper,本地运行、零API费用,支持多语言字幕制作;Light Novel Studio小说创作工具,支持中日文轻小说生成。
  4. 蚂蚁集团:发布AMP智能体支付协议,搭建全球智能体支付链路,配套AgentSafePay安全体系。
  5. 微软:开源MXC沙箱系统,支持多类隔离方案,保障AI代码、插件安全执行;sandboxd提供隔离式云开发环境。
  6. 开源项目Spice:轻量级智能体决策层,赋予模型自主规划、模拟、反思能力。
  7. Meta_Kim:开源AI编程任务治理工具,标准化复杂任务协作流程。
  8. ActiveLoop:推出Hivemind,实现编码智能体经验共享。
  9. 多方开源MANGO多智能体优化框架,提升模型准确率与推理效率。

二、智能体与AI应用

  1. 苹果:WWDC 2026上线全新Siri AI与独立Siri App,搭载Apple Intelligence,支持读屏、跨App操作、视觉识别,基于端云混合架构,秋季推送测试版,初期不支持欧盟、中国大陆地区;Xcode 27集成编码智能体,支持MCP协议,可调用Claude、Gemini。
  2. 腾讯:发布WorkBuddy企业版,分为专家、助理、团队三层能力,集成7万+Skills,支持私有化部署;微信开放AI生态,小程序提供自动、开发两种接入模式,滴滴、美团、京东为首批接入伙伴;同步推出LearnBuddy教育智能体。
  3. OpenAI:ChatGPT新增数据可视化、Gmail联动功能,上线Lockdown封锁模式防范提示注入,Codex与ChatGPT逐步融合,计划打造全能超级应用;内部员工单月最高消耗6030亿tokens,资源消耗问题引发讨论。
  4. 谷歌:Google AI Plus订阅降价至4.99美元/,存储空间翻倍至400GB;NotebookLM升级Agent能力,可自主梳理研究资料。
  5. 云知声:U2模型打造原生智能体,端到端完成任务拆解、执行、校验全流程。
  6. Kimi Code:完成版本升级,支持CLI一键安装、视频上下文,兼容主流编辑器,可预测世界杯赛事。
  7. 井英科技:获数千万美元融资,原AWS首席科学家王敏捷加盟,聚焦AI内容生产智能体。
  8. 滴滴、携程:接入微信AI生态,用户可通过自然语言调用出行、票务服务。
  9. 生数科技、华策影视:基于Vidu模型搭建AI视听创制中心,落地影视类AI智能体应用。
  10. 快看漫画:Livo数字生命产品定于7月公测,依托多Agent架构打造交互IP。
  11. 多家企业采用结果计费模式:Sierra按客服工单成效收费,Salient按催收回款分成,参考EMC合同模式落地AI分成机制。
  12. 高德ABot-Earth0.5:应用于应急救援、具身智能训练场搭建等场景。

三、物理AI/机器人

  1. 宇树科技:G1人形机器人售价降至2.7万美元,出货量接近万台,出海进程加速。
  2. 上汽:旗舰智己LS9搭载L3级自动驾驶硬件、520线激光雷达与英伟达Thor芯片,整车完成第1亿台交付。
  3. 蔚来:ES9纯电SUV开启预售,车身尺寸与轴距位居国内纯SUV前列,搭载智能投影大灯与行政座舱。
  4. 尊界V800 MPV:搭载华为ADS5智驾系统与896线双光路激光雷达,定位超高端出行市场。
  5. 零跑:全系新车标配激光雷达与800V高压平台,搭载高通8650智驾芯片。
  6. 长安:“天枢”车载大模型完成网信备案,落地车载交互场景。
  7. 斑马智能AutoOmni:上车优化人车交互,提升车载安全响应能力。
  8. 国内多款人形机器人、服务机器人启动实地测试,部分家用机器人可完成洗碗、叠衣等日常任务。
  9. 英伟达、LG、现代:合作布局人形机器人与物理AI,联合投资30亿美元推进相关技术。
  10. 中科院DexJoCo:发布机器人灵巧手评测工具,覆盖双手协作、长程操作等复杂任务。
  11. RoboScience团队:Bi-Adapt框架提升机器人泛化能力,连续两年斩获ICRA相关奖项。

四、硬件与基础设施

  1. 华为:发布昇腾950DT芯片,内存144GB,带宽达4TB/s;灵衢智算集群支持10万卡规模算力,Token时延控制在10毫秒内。
  2. 英伟达:与SK海力士达成多年合作,联合研发AI工厂下一代存储技术;RTX Spark PC芯片、Vera系列算力硬件推进落地,DLSS 4.5提升光追画质。
  3. 英特尔:斩获谷歌超300万颗TPU订单,成为台积电之外的AI芯片备选代工厂。
  4. 安纳智芯:模拟计算芯片流片完成,专攻矩阵计算,适配AI训练与自动驾驶。
  5. 中科院金属所:研制硅-石墨烯-锗势垒晶体管,刷新晶体管频率与电流增益纪录,赋能6G与传感设备。
  6. 光联芯:完成近5亿元A轮融资,主攻光互连芯片。
  7. 燧原科技:科创板IPO定于6月15日上会,拟募资60亿元研发新一代国产GPU。
  8. 超微:推出多款Arm架构AI服务器,单机架算力超6000核,搭配6TB DDR5内存。
  9. 欧菲光Dex400R工业相机:识别精度1.5毫米,测距盲区仅5厘米,服务机器人视觉。
  10. 天工3.0人形机器人:搭载旭日S600芯片,计划2026年下半年量产。
  11. 存储行业:美光、SK海力士均表示AI带动存储需求,供应紧张将持续至2026年后。
  12. 微软:多款AI开发工具遭黑客植入盗号程序,官方紧急下线排查。
  13. 亚马逊、康宁:达成数十亿美元合作,采购光纤产品支撑数据中心建设。

五、企业动态

  1. 苹果:2026 WWDC 2026为蒂姆·库克任期最后一场发布会,其将于9月1日卸任CEO;正面回应AI套壳质疑,重申AFM为自研体系。
  2. OpenAI:秘密提交IPO申请,预计2026年秋季上市,当前估值8520亿美元;芯片核心人员Clive Chan离职加入Anthropic。
  3. 阿里:合并通义大模型与未来生活实验室,成立Token Foundry事业部,周靖人出任首席,同步设立AI未来研究院,AI业务连续十一个季度三位数增长。
  4. 美团:设立AI Transformation一级部门,与外卖、闪购平级,发力本地生活To B AI业务。
  5. 字节跳动:多款模型开源,Seedance等视频模型营收表现亮眼,前Seed团队核心人员顾全全离职创业。
  6. 蚂蚁:发布AMP协议,布局智能体支付基础设施。
  7. 阶跃星辰:拟登陆港股IPO,估值120亿美元。
  8. 月之暗面:完成20亿美元新一轮融资,整体估值达300亿美元。
  9. 原力灵机:并购Atom机器人公司,同时获智谱、阿里等企业联合投资。
  10. 地平线:创始人余凯持续投资14位离职员工的具身智能创业项目。
  11. 京东:全面接入微信AI生态,同步推进AI视听、长视频技术研发。
  12. vivo、荣耀:新机搭载AI大模型与智能交互功能,强化大屏、移动端AI体验。
  13. 生数科技、华策影视:战略合作布局AI影视内容生产。
  14. 微软:GitHub Copilot全面切换Token计费模式,调整商业化方案。

六、产品更新

  1. 苹果:推出iOS 27、iPadOS 27等系统,集成Apple Intelligence、新版Siri、Image Playground图像生成、Spatial Reframing照片重构功能;地图Flyover升级为3D高斯散射技术,实现照片级3D实景;Xcode 27深度集成AI编码能力。
  2. 谷歌:NotebookLM、Gemini Live功能升级,AI Plus订阅降价扩容,Gemma系列模型持续迭代。
  3. OpenAI:ChatGPT新增数据可视化、安全封锁模式、记忆优化功能,Codex强化代码与远程控制能力。
  4. 小米:MiMo系列模型推出极速推理模式,终端产品适配高实时性AI场景。
  5. 微信:小程序全面开放AI接入,打通AI Agent与海量应用链路。
  6. 腾讯:WorkBuddy、LearnBuddy多款企业、教育类AI产品落地。
  7. 猿辅导:即将推出“猿辅导AI大阅读”,主打3D沉浸式伴读。
  8. TCL:AI睡眠新风空调上线,依托AI定制睡眠曲线。
  9. 壳牌:接入C3智能代理,实现设备预测性维护。

七、投资

  1. OpenAI:3月完成史上最大融资,估值8520亿美元,现已秘密递交IPO材料,秋季有望上市。
  2. 月之暗面:获20亿美元融资,估值300亿美元,半年内完成三轮融资。
  3. 阶跃星辰:冲击港股IPO,估值120亿美元。
  4. 井英科技:拿到数千万美元融资,引入首席科学家。
  5. 原力灵机:并购同时获得智谱、阶跃星辰、商汤、阿里联合投资。
  6. 光联芯:近5亿元A轮融资,聚焦光互连芯片。
  7. 燧原科技:IPO拟募资60亿元,用于国产GPU研发。
  8. 像素绽放:完成C轮融资,发力办公AI Agent。
  9. 英伟达、现代、LG:合计30亿美元投资物理AI与机器人领域。
  10. 华尔街机构推出AI培训服务,单节课程收费2.5万美元,花旗、美银等机构采购。

八、行业观点与社会影响

  1. 商业模式变革:移动互联网以注意力、时长为核心的广告、订阅模式逐步弱化,智联网时代兴起Token按量计费、按结果分成、专家分身付费等新模式,TCR(任务完成率)或将取代DAU成为核心指标;Stripe推出Agent Payment API,适配智能体小额高频自动支付场景。
  2. 数据现状:上周全球大模型总调用量36.1万亿Token,中国模型连续六周登顶,全球前五占据四席,DeepSeek-V4-Flash调用量领先。
  3. 学界观点:强化学习之父Richard Sutton指出生成式AI存在“创新与质量无法兼顾”的问题;李飞飞认为AI发展瓶颈是高质量物理场景数据,而非算力与算法;诺奖得主借助Claude完成12年物理猜想证明,验证人机科研协作价值。
  4. 安全与监管:教育部发布AI高考押题风险预警;多国关注AI数据泄露、提示注入攻击问题,Anthropic呼吁暂停前沿AI研发;英国禁止AI起草司法文书;美国考虑监管头部AI企业,传出白宫拟入股OpenAI的消息。
  5. 产业趋势:a16z等机构判断传统席位型SaaS逐步承压,Agent原生模式成为增量赛道;AI支出从IT预算转向劳动力预算;具身智能领域中“抓取”被视作基础原子任务。
  6. 人才变化:AI工具大幅提升研发效率,Anthropic工程师效率提升8倍;AI编程工具使代码量激增,但软件发布效率增幅有限。
  7. 内容行业:AI影视、短剧制作成本大幅下降,创作效率提升,但也出现AI内容同质化、平台清理低质AI账号等问题。
  8. 汽车行业:欧盟预警AI与电动化转型将造成60万汽车岗位流失;国内车企加速自研车载大模型与智驾系统。

九、学习与研究资源

  1. 开源数据集&语料:OProofs数学证明语料库、Anchor Lab机器人数据集、AesRecon美学照片数据集。
  2. 开源教程&课程:503节AI系统构建全套课程开源;各类LLM推理、量化、本地部署实战文档持续更新。
  3. 技术文档:Anthropic发布AI Agent零信任安全白皮书;谷歌更新生成式AI优化(GEO)指南。
  4. 行业报告:《2026中国OPC白皮书》、腾讯研究院智联网系列报告、美光存储行业分析报告。
  5. 评测平台:Agent Arena智能体评测基准、各类大模型代码、推理能力基准测试集。
  6. 社区工具:各类提示词库、AI协作工具、代码共享平台,支持开发者交流实践经验。

十、总结与洞察

  1. 技术层面:轻量化多模态、端侧大模型、3D世界模型、智能体框架成为本轮技术热点,国产模型在调用量、落地场景上优势明显,开源生态持续繁荣,量化、投机解码等技术不断降低大模型部署门槛。同时数学、生物、物理等专业领域AI工具实现突破性落地,AI加速赋能前沿科研。
  2. 产品与生态:智能体(Agent)成为全行业核心方向,从个人助手、办公软件延伸至出行、影视、工业、车载等全场景;苹果、谷歌、腾讯、OpenAI等巨头纷纷重构产品形态,入口从传统App转向用户意图交互。跨模型调用、MCP等协议普及,推动AI生态互联互通。
  3. 商业逻辑:行业彻底告别单纯的算力、模型参数竞争,转向Token效率、任务落地效果比拼;按量计费、结果分成等新型商业模式快速落地,配套的智能体支付、信用体系开始搭建,传统互联网商业模式迎来迭代。
  4. 硬件与基建:AI芯片、存储、光互联、机器人硬件多点突破,全球芯片供应链格局调整,英特尔开始承接谷歌等企业订单;算力紧张促使行业持续优化推理、量化技术,端侧算力迎来快速发展。
  5. 风险与挑战:AI安全、数据合规、伦理问题持续受到全球监管关注;模型幻觉、认知漂移、提示注入等技术难题仍未完全解决;同时AI快速迭代带来岗位结构变化,行业需平衡技术创新与就业、安全的关系。
  6. 未来方向:智联网、Agent经济被视作移动互联网的下一代形态,用户主Agent、任务市场、支付基础设施将构成新生态;物理AI、机器人结合大模型,有望成为下一个万亿级赛道;开源模型与闭源模型形成互补,本地部署+云端协同成为主流架构。
Logo

鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者,聚合华为+生态”的社区,内容涵盖鲲鹏、昇腾资源,帮助开发者快速获取所需的知识、经验、软件、工具、算力,支撑开发者易学、好用、成功,成为核心开发者。

更多推荐