上周AI大事:谷歌深夜“放大招”,Meta撒钱挖人

发布时间:2025-06-30 15:02:35

本文作者:小古

前言:AI技术在狂奔,商业化在加速,规则在追赶。巨头们一边疯狂秀肌肉,一边悄悄巩固护城河;初创公司则在夹缝中寻找垂直赛道和爆款机会。从程序员的终端到你的虚拟衣橱,从音乐创作到情感陪伴,AI正以前所未有的深度和广度渗透。

一、热门工具:AI主战场还是编程框

1.新闻:谷歌推出开源AI智能体Gemini CLI,将Gemini 2.5 Pro的强大功能及其百万级token上下文窗口直接引入终端。正如相关文章所述,这是一款专为编程等任务打造的命令行AI智能体。Gemini CLI不仅开源,还提供使用配额相当大方的免费版本。

锐评:谷歌这是要把“万物皆可Gemini”的口号喊到底了。开源还给相当大方的免费额度,这招“农村包围城市”玩得溜。

二、AI技术与产品发布:神仙打架,凡人吃瓜

2.新闻:谷歌正式发布Gemma 3N。这是谷歌在今年5月份I/O开发者大会上首次推介的一款新型开源多模态小模型,针对设备端应用进行了优化,支持图像、音频、视频和文本等多种输入。Gemma 3N采用了名为Matformer的架构,该架构可同时训练不同大小的嵌套式AI模型,为模型在设备端高效运行提供了计算灵活性,使其能在有限体积内集成丰富功能。谷歌声称,“Gemma 3N在多语言能力(支持140种语言的文本处理和35种语言的多模态理解)、数学、编程和推理方面均实现了质量提升。E4B版的Gemma 3N在基准测试平台LMArena上的得分超过1300,成为首个突破此基准的百亿参数以下模型。”

锐评:谷歌模型中的“小钢炮”来了。

3.新闻:谷歌升级Imagen图像模型。谷歌通过Gemini API和Google AI Studio推出新版文生图模型Imagen 4和Imagen 4 Ultra。Imagen 4在图像质量和文字渲染方面均有显著提升,而Imagen 4 Ultra精度更高,输出与文本提示高度契合。

锐评:这是要砸平面设计师的饭碗?

4.新闻:谷歌捐赠A2A协议。谷歌已将智能体到智能体(A2A)协议捐赠给Linux基金会,后者随即宣布启动Agent2Agent Protocol项目,旨在将A2A确立为多智能体系统的主要开放标准。这将推动不同开发者和平台的AI智能体之间实现更好的互操作性。

锐评:送“标准”的最终目的还不是想立自己的规矩。

5.新闻:谷歌调整免费API限额。谷歌降低上一代Gemini Flash模型的免费API调用额度,减少了免费请求的数量,更好平衡使用情况和成本结构。

锐评:免费午餐吃久了,总归是要付钱的。

6.新闻:微软推出专为Windows设计的设备端大语言模型MU。这款模型小巧高效,可以在Copilot PC的神经处理单元(NPU)上运行。MU每秒可生成超过100个token,已经内置在Windows系统中,可为Copilot智能体支持特定任务,在Windows设备上实现快速、私密的AI功能。

锐评:以后Windows的AI功能不仅快,还能保护你的隐私。

7.新闻:Higgsfield推出AI图像生成模型Higgsfield Soul。公司称,“我们隆重推出Higgsfield Soul这一全新的高审美图片模型。拥有超过50种精选预设风格,具备时尚大片级的逼真效果。”在竞争激烈的AI图像生成工具市场中,Higgsfield Soul凭借专注于市场营销和广告领域的应用而脱颖而出,输出质量足以满足专业需求。

锐评:能让甲方爸爸满意的AI才是好AI。

8.新闻:月之暗面发布升级版多模态推理模型Kimi-VL-A3B-Thinking-2506。新版模型增强了视频理解能力,并支持更高分辨率输入(最高支持1792×1792像素)。升级版2506模型不仅在推理基准测试上取得了显著进步,其中MathVision得分提升20.1,MMMU-Pro得分提升3.2,而且同时还将token消耗降低了20%。此外,这款模型还拓展了视频推理能力,并在VideoMMMU基准测试中达到最高性能水平(SOTA)。

锐评:堪称业界“加量还降价”的典范。

9.新闻:Eleven Labs推出AI语音助手11AI。这款模型将公司先进的对话式AI语音技术与MCP(模型协作协议)相结合,能连接Perplexity、Linear、Slack和Notion等工具来执行任务。这款语音助手支持高度定制化且功能强大的语音交互界面,拥有超过5000种声音选项(包括声音克隆),并运行在Eleven Labs自家基础设施上。11AI堪称苹果本应打造的下一代Siri。

锐评:这把苹果脸打得啪啪响。

10.新闻:DeepMind发布Magenta Realtime音乐模型。这款开放权重的小型音乐生成模型可用于实时创作和演奏音乐。Magenta Realtime拥有8亿参数,是Lyria RealTime模型的开放权重等效版本。Magenta Realtime体积小巧,支持本地下载运行;用户也可以在AI Studio中体验音乐生成功能。

锐评:人人都是“电音小子”的时代来了。

11.新闻:Anthropic支持Claude内托管应用。Anthropic现允许用户在Claude内部构建、托管以及共享可执行的AI应用。登录Claude的其他用户也可以使用这些应用,相关token使用费用由使用者自行承担。这项新功能为创建和分享AI驱动工具开辟了新途径。

锐评:这就是直接在聊天框里开了个“App Store”。

12.新闻:Salesforce发布AI智能体的新一代产品AgentForce 3。这款产品配备了用于监控和优化智能体性能的中央指挥中心,由Atlas推理引擎驱动,支持通过MCP和A2A协议连接各种工具。Salesforce报告称,内部约30%的客户服务和销售业务现都已经通过AI智能体处理。

锐评:人家已经让AI去跑业务、做客服了

13.新闻:小米发布AI眼镜。小米在最新一场人车家新品发布会上发布首款AI眼镜,有3个版本,价格1999元起。尽管智能眼镜市场热度上升,目前尚无厂商通过该产品盈利。

锐评:价格很“小米”,雷总这次能趟出智能眼镜这个大坑吗?

14.新闻:谷歌推出名为AlphaGenome的新型DNA序列模型。这款模型使用公共基因数据库,仅耗时4小时就完成高效训练,能分析的DNA片段长度比之前工具长100倍。AlphaGenome能够预测人类DNA中单个变异或突变对调控基因生物过程的影响。这些预测能力有助于理解遗传疾病、合成生物学以及基因组基础研究。美国纪念斯隆凯特琳癌症中心的计算生物学家迦勒·拉罗(Caleb Lareau)评价道,“这是领域内的里程碑。我们首次拥有了一个兼具长上下文和碱基层级精度,并在整个基因组任务谱系中展现出顶尖性能的单一模型。”

锐评:AI开始破解生命的终极密码了。

15.新闻:北京智源人工智能研究院 (BAAI)发布开源图像生成模型OmniGen2。这款模型擅长文生图和图像编辑任务。研究人员在论文《OmniGen2:探索高级多模态生成》中分享了相关细节信息。在完成类似Photoshop的编辑任务方面,OmniGen2被评价为与专有模型FluxKontext相似但质量略低。

锐评:国产AI研究力量秀肌肉。

16.新闻:中科院发布“任意到任意”(any-to-any)的大语言-视觉-语音模型Stream-Omni。正如《Stream-Omni》论文所述,这款模型能够在无缝的“边听边看”交互中同时处理文本、图像和音频输入,并生成文本和语音,实时显示中间的语音识别(ASR)转录和响应。Stream-Omni开源并已经在Hugging Face上线。

锐评:开源更是自信的表现。

17.新闻:Anthropic发表新研究,详述AI模型Claude在提供情感支持方面的用途。公司表示,“我们基于数百万份匿名对话研究成年人如何利用AI满足情感和个人需求——从应对孤独、处理人际关系到探讨存在主义问题。”Anthropic在文章《人们如何使用 Claude寻求支持、建议和陪伴》中指出,大约4%的Claude使用场景与情感支持相关,对话内容涵盖寻求建议、辅助治疗、角色扮演和陪伴等。这些对话结束时的情绪通常比开始时更为积极。

锐评:赛博版“知心姐姐”上线。

三、AI商业与政策动态:金钱、权力和规则的游戏

18.新闻:Meta继续挖角AI人才。Meta仍在继续招募AI人才,最近用高达1800万美元的总薪酬从OpenAI挖来三名研究员。多名来自OpenAI苏黎世办公室的研究人员已确认转投Meta。据传,Meta还对Safe Super Intelligence的联合创始人兼CEO感兴趣。

锐评:扎克伯格就喜欢“大力出奇迹”。

19.新闻:Meta拟收购语音克隆公司Play AI。据报道,Meta正洽谈收购语音克隆初创公司 Play AI,增强面向消费者的AI功能。这笔潜在交易涉及整合Play AI技术和员工。

锐评:打不过,就买下你。

20.新闻:AI推荐初创公司Crossing Minds将加入OpenAI,并停止接收新客户。公司此前专注为电商构建注重隐私的AI个性化系统。

锐评:OpenAI业务是越做越大。

21.新闻:前OpenAI首席技术米拉·穆拉蒂(Mira Murati)创办的Thinking Machine Labs (TML) 已成功融资20亿美元,估值达到100亿美元。TML专注于为企业开发定制化AI,利用强化学习优化关键绩效指标(KPI),从而提升收入和利润。

锐评:AI圈的“明星效应”太可怕了。

22.新闻:OpenAI与微软谈判停滞。据报道,OpenAI与微软关于合作条款的谈判陷入僵局。OpenAI寻求转型为营利性实体,并提议对协议进行重大修改,但微软目前不愿接受。

锐评:“父子局”也开始闹别扭了。

23.新闻:初创公司Cluely获A16z投资1500万美元。Cluely制造热度的能力符合A16z在消费级 AI领域“势头即护城河”的观点,但Cluely“一切皆可作弊”的产品营销Slogan曾招致批评。

锐评:放眼整个AI界,这钱不算多。

24.新闻:Suno收购WavTool。AI音乐公司Suno收购基于浏览器的AI数字音频工作站WavTool,以增强其为词曲作者和制作人提供的编辑能力。

锐评:AI音乐界的强强联合。

25.新闻:Replit宣布年化经常性收入超过1亿美元。公司表示,“我们激动且荣幸地宣布,上周我们的年度经常性收入(ARR)已突破1亿美元。”

锐评:用AI实现盈利任重而道远。

26.新闻:OpenAI Codex被广泛采用。数据显示OpenAI Codex每天被用于处理10000次代码拉取请求(pull requests)。

锐评:会“偷懒”的程序员越来越多。

27.新闻:阿里“通义千问3”开源大模型全球下载超1250万次。阿里巴巴在最新财报中表示,“通义千问3”大模型今年4月开源后下载量迅速破千万,开源模型家族累计下载逾3亿次。

锐评:开源战略助力全球AI生态建设,也为国产模型赢得更大话语权。

28.新闻:盖洛普调查显示美国员工AI使用率翻倍。盖洛普对美国员工的一项调查显示,过去两年间称自己在工作中使用AI的员工比例翻了一番:“在过去两年中,表示每年至少在工作中使用过几次AI的美国员工比例从21%增至40%,几乎翻倍。频繁使用AI(每周几次或更多)的员工比例也自2023年首次调查以来几乎翻了一番,从11%增至19%。仅在过去12个月内,AI每日使用率就从4%升至8%。”

锐评:AI的普及速度远超想象。

29.新闻:Gartner发布2025年中国人工智能十大趋势。报告预测到2030年中国AI普及率将超50%,50%产业生态基于开放式GenAI模型构建。这一趋势报告为企业数字化转型提供了清晰路径,需重点关注数据与模型治理。

锐评:我们已经走在了时代前列。

30.新闻:重要AI版权案裁决出炉。上周两项重要的AI版权案裁决确认,使用受版权保护作品训练AI属于“合理使用”,但同时也裁定相关应用并非自动合法。其中一名联邦法官裁定,Anthropic使用书籍训练Claude AI模型的行为构成美国版权法下的“合理使用”,但同时也认定他们使用盗版材料的行为面临法律责任。在另一项诉讼中,莎拉·西尔弗曼(Sarah Silverman)等多位作家起诉Meta非法使用其受版权保护的书籍训练AI。联邦法官裁定Meta的使用属于“合理使用”,认为其具有“变革性”,且原告未能证明对其造成了市场损害。

锐评:这让所有AI公司都松了一口气。

31.新闻:美国提案拟冻结州级AI监管。参议员特德·克鲁兹(Ted Cruz)牵头的一项联邦提案计划禁止各州在未来10年内监管AI。支持者认为,此举可防止出现阻碍创新的“碎片化”法规。

锐评:美国想搞“十年禁令”,防止各州乱来。

32.丹麦拟立法赋予公民形象权。丹麦提出开创性版权法修正案,赋予公民对其身体、面部特征和声音的所有权,目的是打击深度伪造滥用。立法将允许个人要求删除使用其肖像的AI生成内容,并就未经授权使用行为寻求赔偿。

锐评:我的形象我做主。

33.新闻:德国指控DeepSeek非法传输数据。德国数据保护官员迈克·坎普(Meike Kamp)向苹果和谷歌举报AI应用DeepSeek,指控其非法传输用户数据,违反了欧盟法律。坎普表示,DeepSeek缺乏“令人信服”的数据保护证据。

锐评:保护数据隐私很重要,但要防止有人拿它刷存在感。

34.新闻:特斯拉Model Y首次完成全自动驾驶交付。公司CEO马斯克在X平台宣布,这辆Model Y全程无人驾驶穿越高速,比计划提前一天完成。这展示了特斯拉自动驾驶技术的重大突破。

锐评:马斯克说,我家自动驾驶是真能上路了。

四、AI观点与文章:冷静一下,听听人话

35.新闻:Anthropic现实测试项目失败。Anthropic的Project Vend项目尝试让AI模型Claude自主经营一家小商店,最终未能盈利,反遭操控,并经历了“身份认同危机”。这项现实世界测试揭示AI缺乏商业常识且管理不善。这说明,即使AI系统日益承担重要商业角色,但目前似乎还无法匹敌人类商业智慧。

锐评:这盆冷水泼得及时,AI当老板还差远了。

36.新闻:正确监管可促进AI创新。微软首席科学家埃里克·霍尔维茨(Eric Horvitz)表示,若以风险为导向而非“一刀切”,合理监管可促进AI创新;他呼吁建立以透明度和问责制为核心的法规框架,以应对技术飞速发展带来的伦理与安全挑战。

锐评:大佬这话说得艺术,翻译过来就是“监管可以有,但别一刀切把创新给管死了”。(辰辰)

图片来源:互联网

图片来源:互联网

本文转载自互联网,如有侵权,联系删除。

相关文章