【Reading Notes】（7.9）Favorite Articles from 2024September

北京时间周四晚19：58，这位“北极星黎明”任务的指挥官、41岁的亿万富翁打开舱口，率先走出太空舱，通过“天行者”梯子，以及一根约3.7米长的系绳，在舱外呆了10多分钟。具体来说，平台不仅提供99%的业界SOTA开源大语言模型、开源多模态模型，并且均已针对昇腾算子、显存优化，预置最优超参配置，做到“模型全、免配置、免调优、性能优”。针对更深入的模型定制需求，平台也提供了包括模型调优、模型压缩、模型

bryant_meng

427人浏览 · 2026-03-15 21:23:17

bryant_meng · 2026-03-15 21:23:17 发布

在这里插入图片描述

陶哲轩力荐，哈佛反向学习法火了：教会AI就是教会自己（ 2024年09月02日）
利用提示工程，让学生尝试教AI完成平时数学作业（不纳入正式考核），期末再让这些AI参加考试。
电脑CPU依然得看英特尔酷睿：新一代性能提升20%，AI能力翻5倍；网友：感谢AMD（2020年09月03日）
英特尔第十一代「酷睿家族」终于登场了！代号Tiger Lake，10nm SuperFin 工艺
MiniMax不藏了，大秀视频/语音/文本全模态模型家族，“每天与世界交互30亿次”（2024年09月03日）
- 每天30亿次交互量。其中生成文本量3万亿文本tokens，生成图片2000万张、生成语音7万小时。
- 积累用户超过6000万。
- MiniMax 率先完成了全模态模型的研发和开放。
  视频模型，abab-video-1，目前AI视频时长最高6秒，未来或支持10秒。
  音乐模型，abab-music-1
  语音模型，abab-speech-1，只需要20秒真人语音作为语料数据
  文本万亿多模态模型，abab-7，MoE+Linear Attention
- MiniMax 旗下主要有四款产品：星野、Talkie、海螺AI和开放平台。
- hailuoai.com/video
英伟达市值暴跌2万亿！一夜蒸发3个英特尔，创美国历史纪录（2024年09月04日）
据悉，美国司法部已经向英伟达发出传票，寻找这家芯片巨头违反反垄断法的证据。

仅看今年的利润，英伟达已经超过了最接近自己的竞争对手——AMD的总销售额。
AI落地新战场，云厂商开卷MaaS：大模型即服务，华为给所有人发船票了（2024年09月05日）
- 比如云厂商们近期都“卷”的 MaaS（Model-as-a-Service），就是降低大模型应用门槛的重要途径之一。
- MaaS 是一种可以为开发者用户提供大模型以及各种开发工具的服务，它能够让哪怕没有大模型开发背景的人也能进行一站式开发。
- 具体来说，平台不仅提供99%的业界SOTA开源大语言模型、开源多模态模型，并且均已针对昇腾算子、显存优化，预置最优超参配置，做到“模型全、免配置、免调优、性能优”。
- 针对更深入的模型定制需求，平台也提供了包括模型调优、模型压缩、模型部署、模型体验的全流程工具链，覆盖大模型全生命周期。
- ModelArts Studio 大模型即服务平台，就是发给各位玩家的“船票”。只要手握这张船票，人人都能在华为云的基座上做大模型开发。
支付宝突然推出新App，竟想用AI让日常生活开挂（2024年09月05日）
- TA 生动展示了大语言模型的应用如何从理解（ Chat ）转向采取实际行动( Act ）。
- 当产品体验丝滑到「无感」后，人们反而容易忽视沉淀在下面的深刻技术，甚至会有「这也不难做到」的错觉。
  
  支付宝首页下拉就是同样的功能
华为离职副总裁徐家骏：透露年薪千万的工作感悟，太震撼！（2024年09月05日）
《黑神话：悟空》里惊艳的古建场景是如何生成的？（2024年09月07日）
- 在人工智能时代，NeRF（Neural Radiance Fields，神经辐射场） 与 3DGS（3D Gaussian Splatting，3D高斯溅射） 技术成为完成三维重建、新视角合成、3D生成等任务不可或缺的重要工具。
- NeRF 是一种可微的、自动生成的，连续的三维隐式表达方法，最初用于解决新视角生成（Novel View Synthesis，NVS）这个计算视觉里的基础问题。
- 相较于 NeRF，3DGS 是显式的三维表达方式，其设计遵循“大道至简”的原则，用简捷的逻辑构造了三维空间。
北大王立威：理论视角看大模型，为什么AI既聪明又愚蠢 | 智者访谈（2024年09月08日）
- 本期机器之心《智者访谈》邀请到北京大学智能学院教授王立威，从机器学习理论视角看大模型的能力边界，探讨理论对 AI 未来发展的影响。
- 刚才讲的另一类系统，比如说 AlphaGeometry（能够解奥赛级别的几何证明题），以及后来的 AlphaProof，用的是深度强化学习这种方法，而深度强化学习不是今天语言大模型的主要技术方案。它们还有一大特点，也是区别于语言大模型的，是专注于解决特定类型的封闭世界问题（closed-world problem)。——这套思路与 DeepMind 在几年前用 AlphaGo下围棋的方法一脉相承
- 使用机器学习解决数学和科学问题的潜力——人类科学家仍然要做顶层设计，但是其中的某些环节或部分可以用机器学习和人工智能方法更高效地完成
- 机器之心：我们的终极目标是希望 AI 能够独立完成数学证明，并且像伟大的科学家比如爱因斯坦那样，发现新的科学理论。为了实现这个目标，还需要克服哪些主要困难？
- 幻觉
- scaling law
- 解释性
- 泛化性，benchmark
  今天我们的大模型能够处理的任务是非常之多的，不再是一个固定的，像图像分类这样的单个任务。所以我们在讨论泛化的时候，已经不是过去那种狭义的泛化了，甚至我们今天讨论的泛化，是指给大模型一个全新的任务，看它能不能够把这个任务也解决好。所以从这个层面上说，过去的理论就显得比较局限了。
- 大模型时代的理论研究
- 王立威，北京大学智能学院教授，研究兴趣为机器学习。长期从事机器学习基础理论研究，为设计更有效的新算法提供理论指导，并开发基于机器学习的医疗影像诊断算法与系统。近来致力于通过机器学习方法解决科学与数学领域重大基础问题。
  王立威教授已在 NeurIPS、ICML、TPAMI 等国际顶级期刊和会议上发表论文 150 余篇，其中关于图神经网络表示理论的两篇工作分获 ICLR 杰出论文奖与提名奖。担任 TPAMI 编委，并长期担任 NeurIPS、ICML、ICLR 等机器学习顶会的领域主席／高级领域主席。此外，入选 AI’s 10 to Watch，是首位获此殊荣的亚洲学者。
离谱，深圳某公司重新定义8小时工作制！（2024年09月09日）
- 10:00-12:00：上午2小时；14:00-18:00：下午4小时；19:00-21:00：晚上2小时。
- 然而，关于午休和晚餐时间是否应当算入工作时间，法律并没有明确的条款说明。用人单位拥有一定的自主权，可以根据具体情况决定是否将这些休息时段纳入 8 小时工作时间的计算范围。
视觉模型底座超越OpenAI，格灵深瞳开启多模态落地的Scaling Law（2024年09月09日）
- 它曾因“A股AI视觉第一股”的标签为人熟知，如今以新姿态再次刷新外界认知：大模型落地先行者。
- 自研视觉大模型 Unicom v2
- 从某种意义上说，ChatGPT是替所有AI公司做好了教育市场的工作。
- https://github.com/deepglint/unicom
从腾讯大模型的「实用」路线，我们看到了企业应用AI的新方向（2024年09月09日）
- 腾讯全球数字生态大会
- 易车和腾讯合作，基于内置在 TI 平台的大模型，使用大模型精调工具链，精调训练出 「易车大模型」。这个大模型能为用户提供 3D 看车、AI 解读、AI 对比问答和 AI 搜索等服务，增强了用户获取信息的效率。据统计，这些功能上线后，用户的停留时长有了大幅提升。
大模型/Sora/世界模型之间是什么关系，对自动驾驶的意义是什么？（2024年09月10日）
“不断理解，不断预测”，这种理解世界的方式，是人类理解世界的方式。这种思维模式就叫做：世界模型。
人经历的事情越多，大脑里就会形成越复杂的世界模型，用于更准确地预测这个世界。这就是人类与世界交互的方式：世界模型。
目前sora存在的缺点
（1）物理交互的不准确模拟
（2）对象状态变化的不正确
（3）长时视频样本的不连贯性
（4）对象的突然出现
YOLOv8为什么是最好用的目标检测网络？（2024年09月12日）
- 2023年1月10日：YOLOv8正式发布，采用新的无锚点架构，旨在简化模型训练并提高各种任务中的检测精度。
- Yaseen M. What is YOLOv8: An in-depth exploration of the internal features of the next-generation object detector. arXiv 2024[J]. arXiv preprint arXiv:2408.15857.
- https://arxiv.org/pdf/2408.15857
SpaceX再创历史，人类首次商业太空行走成就达成！（2024年09月13日）
- 随着“宇宙素人”贾里德·艾萨克曼在距离地球700多公里的太空出舱，人类首次商业太空行走就此完成。
- 北京时间周四晚19：58，这位“北极星黎明”任务的指挥官、41岁的亿万富翁打开舱口，率先走出太空舱，通过“天行者”梯子，以及一根约3.7米长的系绳，在舱外呆了10多分钟。
- 四人分别是亿万富翁贾里德·艾萨克曼和他的朋友前空军飞行员斯科特·“基德”·波提特，与他们同行的还有SpaceX的两名首席工程师莎拉·吉利斯和安娜·梅农。
- 龙飞船
基于YOLOv8算法改进，景区行人检测算法（2024年09月13日）
- 通过引入注意力机制BiFormer和上采样算子CARAFE来提高网络的回归精度和收敛速度；其次，通过引入DepthSepConv卷积模块降低模型复杂度，减少参数量；最后，通过增加一层小目标检测层改善对小目标的检测性能
余承东：ADS断代领先！华为发布首款轿跑SUV（2024年09月13日）
- 智界R7车长/宽/高分别为4956/1981/1634（mm），比Model Y大得多，外观和智界S7相似，形成了鸿蒙智行家族设计语言。
- 三电方面，搭载800V高压平台，最高续航802km，在纯电的SUV中实现了罕见的“双800”。
- 46.98万起，问界M9五座版上市，少了一排座位，后备箱空间自然更富裕了。比如类似劳斯莱斯的“揽景座椅”，非常适合钓鱼佬。
李飞飞携24人最强天团打造「大世界模型」！Hinton站台力挺，获2.3亿融资（2024.09.14）
她将人类智能归结为两大智能，一是语言智能，另一个便是空间智能。
「如果想让AI超越其自身当前的能力，我们需要的是，不仅仅能够看到、会说话的AI，而是一个可以行动的AI」。
戴手表就能检测打鼾？Apple Watch到底用什么诊断「睡眠呼吸暂停」（2024年09月14日）
- 打鼾是导致睡眠质量差的最主要影响因素，医学上称其为睡眠呼吸暂停，表现为睡觉时呼吸多次停止和重新开始。
- 库克会在下一代的Apple Watch中推出检测睡眠呼吸暂停的功能。
刚刚，CVPR 2025新规来了：审稿进入「半实名制」，不负责任的审稿人将被标记并拒稿（2024年09月16日）
黑神话悟空火了，为何没人用H100打游戏?（盘点H100和4090的十点区别）（2024年09月18日）

一张RTX 4090市场价，1.3-1.6W，一张H100 PCIe卡在22W左右，八卡HGX模组210W
聊一聊大模型六小虎生存现状（2024年09月18日）
- 智谱AI、百川智能、零一万物、月之暗面、Minimax、阶跃星辰
- 模型能力增长放缓，各家如何开卷产品差异化？
- 烧钱的游戏还在持续，但资本只垂青强者
- 8月底，零一万物的算法副总裁黄文灏被证实已加盟字节的大模型团队，负责技术项目管理和规划。紧接着，另一位公司的核心成员李先刚也被爆出走，选择返回“老东家”贝壳任职，他曾任过零一万物的法定代表人。
- AGI的等待：冲刺上市，旷日持久
- 2013年，斯派克·琼斯执导的电影《Her》上映了，谁能设想仅仅十余年之后，我们就将遇见自己的萨曼莎呢？
Yolo轻量级网络，超轻算法在各硬件可实现工业级检测效果（附源代码）（2024年09月19日）
- Yolo-Fastest开源代码：https://github.com/dog-qiuqiu/Yolo-Fastest
- Yolo-Fastest-V2开源代码：https://github.com/dog-qiuqiu/Yolo-FastestV2
奥特曼：o1仅仅是“推理模型的GPT-2”；黄仁勋：我给你加速50倍（2024年09月19日）
英伟达创始人黄仁勋，则表示新一代 Blackwell 架构GPU能给o1推理提速50倍。
OpenAI CEO奥特曼，我们谈到AI的五个级别：L1是聊天机器人（ChatBot），L2是我们刚刚达到的推理者（Reasoner），L3是智能体（Agent），L4是创新者（Innovator），能够发现新的科学信息，L5是完整的组织（Organization）。
关于「车路协同vs单车智能」的全方位辩论（2022年09月22日）
- 以静态环境下的动态感知，叠加其空间连续、时间连续、算力调用的特点，可以应对盲区死角、意图判断难等问题，提升感知准招率
  1、前方发生连环追尾事故或建筑物遮挡，路侧感知提前将信息同步给车辆，防止事故；
  2、遇无信号灯、路况复杂的十字路口，通过车-车协同，每辆车可实时获知其他方向来车轨迹意图；
  3、十字路口交叉车流调度，云端基于对交叉车道不同车流量的大数据分析，调整路口红绿灯授时，缓解车流量大的道路拥堵，提高道路资源利用率。
- 车路协同听上去好像很美好、技术上也可以实现，但要想实现大规模商业运作却很艰难，会面临责任归属、法律法规、道德维度、市场监管、成本分摊、价值分配、商业保险等诸多复杂因素，实际上已经超出了技术范畴。
- 用户很难接受在某一区域有自动驾驶，开出覆盖范围就无法继续使用的情况。这样一来，车企如果不想让产品丧失竞争力，就还需要不断开发基于单车智能的自动驾驶，这也将导致车路协同能够提供的帮助越来越少。而车企在自身就可以实现高阶自动驾驶的情况下，也不会再为车路协同付出额外一份费用。

鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者，聚合华为+生态”的社区，内容涵盖鲲鹏、昇腾资源，帮助开发者快速获取所需的知识、经验、软件、工具、算力，支撑开发者易学、好用、成功，成为核心开发者。

更多推荐

国产GPU与ROCm架构的关系国产GPU架构总结 ROCm 7.1 在 PyTorch 官网上被划掉（横线）直接支持

国产GPU并非都是ROCm架构✅只有海光信息是通过正规商业授权使用AMD/ROCm架构❌摩尔线程、壁仞、沐曦、天数智芯等都是完全自主研发架构，通过软件层兼容CUDA，与ROCm无关❌华为昇腾、寒武纪等走完全独立的技术路线因此，"国产GPU都是ROCm架构"是一个误解。实际上，绝大多数国产GPU厂商都在努力构建自主可控的软件生态，而非依赖AMD的ROCm授权。横线划掉 ROCm 7.1 是 PyTo

鲲鹏昇腾开发者社区

百倍加速、科研级精度：CANN社区MCE SIG发布首个算子LJForceFused，破解分子动力学算力困局

鲲鹏昇腾开发者社区

CPU 并行编程系列（三）《鲲鹏 CPU 矩阵加速与特性介绍》

华为鲲鹏超智融合芯片创新性地将AI矩阵计算单元集成到CPU中，开创了HPC与AI融合新范式。该芯片具备众核架构、片上矩阵计算单元和高带宽内存三大特性，通过鲲鹏统一并行库(KPL)提供矩阵编程、并行开发等核心能力，优化了传统HPC和AI科学计算的性能表现。在WASP地形模拟和AlphaFold蛋白质预测等应用中，优化策略实现了3-10倍的性能提升，部分场景超越GPU表现。华为通过开源策略构建软件生态