【全文版】对话Sam Altman:GPT-5、星门计划与人工智能的未来· OpenAI播客EP1 | 1.5万字+视频

发布时间:2025-06-19 10:02:16

本文作者:小古

文:Web3天空之城| 未经许可不得转载

【城主说】OpenAI开播了!今天OpenAI官方新鲜热辣放出了博客第一期,首席执行官Sam Altman亲自上阵作为嘉宾。

在自家的播客第一期里,探讨了奥尔特曼对人工智能现状与未来的多维度思考。内容涵盖了AI在日常生活(如育儿)中的应用、对通用人工智能(AGI)和超级智能的定义、下一代模型GPT-5的展望、用户隐私与商业模式的权衡、以及旨在解决未来算力需求的“星门”计划。

核心观点

• 超级智能的衡量标准 :真正的超级智能并非仅指认知能力,而是指能够自主发现新科学或极大加速人类科学发现进程的系统。

• “星门”计划的愿景 :这是一项旨在建设前所未有规模的算力基础设施的宏大计划,目标是让智能变得极其廉价和普及,从而驱动下一代AI服务。

• 隐私是核心原则 :随着AI与用户生活的深度融合,保护用户隐私必须成为不可动摇的核心原则,任何商业模式或外部压力都不能损害用户的信任。

• AI发展的迭代性 :模型的发展正从离散的版本发布转向持续迭代和改进。未来如GPT-5的更新,将是一个不断变强的复杂系统,而非单个静态模型。

• 人机交互的未来 :当前为无AI世界设计的硬件和软件范式即将过时,未来的设备将更深入地感知环境、理解用户语境,并支持全新的交互方式。

天空之城全文整理版

安德鲁·梅恩: 欢迎收听OpenAI播客。 我的名字是安德鲁·梅恩。 几年来,我曾在OpenAI工作,先是担任应用团队的工程师,后来是科学传播者。 之后,我与多家公司和个人合作,试图弄清楚如何整合人工智能。 通过这个播客,我们有机会与在OpenAI工作或与OpenAI合作的人们交谈,了解幕后发生的事情,或许也能一窥未来。 我的第一位嘉宾是OpenAI的首席执行官兼联合创始人萨姆·奥尔特曼。 我们将更多地了解“星门”项目,他作为父母如何使用ChatGPT,或许还能得知GPT-5何时问世。

人工智能与日常生活:从育儿到学习

安德鲁·梅恩: 每年都会有越来越多的人认为我们已经达到了通用人工智能系统。 人们对硬件和软件的需求正在迅速变化。 如果人们知道我们能用开放计算做什么,他们会想要更多,更多。 我有个朋友是新晋父母,他们大量使用ChatGPT来提问。 它已经成为一个非常好的资源。 你也是新晋父母,ChatGPT在这方面帮了你多少?

萨姆·奥尔特曼: 很多。 我是说,显然人们在没有ChatGPT的情况下也能照顾婴儿很长时间。 我不知道我当时会怎么做。 最初的几周,几乎每隔…… 我是说,是持续不断地。 现在我更多地会问一些关于发展阶段的问题,因为基本的我都能处理了,但是…… 这正常吗? 嗯,但那对那件事超级有帮助。

我花了很多时间思考我的孩子未来将如何使用人工智能。 顺便说一句,这有点像极度倡导生育。 我认为每个人都应该多生孩子。 是的,我在OpenAI的很多朋友,包括前同事和现任同事,都在生孩子,人们会问,那个人工智能的事情怎么办? 我认识的内部人员都对组建家庭非常乐观。 我认为那是个好迹象。

比如,我的孩子永远不会比人工智能更聪明,但他们也会长大。 这真是打击他们了。 我是说,他们长大后会比我们这一代人能力强得多,能做我们无法想象的事情,而且他们会非常擅长使用人工智能。 显然我经常思考这个问题,但我更多思考的是他们将拥有我们不曾拥有的东西,而不是他们会失去什么。 他们就像是,我不认为我的孩子会因为他们不比人工智能聪明而感到困扰。 我就是觉得,你知道,有一个视频一直让我印象深刻:一个婴儿或蹒跚学步的小孩拿着一本旧的光面杂志,在屏幕上做这样的动作。 是因为它是个iPad吗? 我以为那是个坏掉的iPad。 而且,你知道,现在出生的孩子会认为世界一直都有人工智能,他们会极其自然地使用它,他们会回顾现在,觉得这是一个非常,你知道的,史前时期。

安德鲁·梅恩: 我在社交媒体上看到一件事,有个男人说他厌倦了和孩子聊托马斯小火车。 于是他把内容输入到ChatGPT的语音模式里。 孩子们喜欢ChatGPT的语音模式。 一个小时后,他发现那孩子还在谈论托马斯小火车。

萨姆·奥尔特曼: 再者,我怀疑这不会全是好事。 会有问题。 人们会发展出这些或多或少有问题,甚至可能有很大问题的拟社会关系,社会将不得不找出新的防护措施,但其益处将是巨大的。 而且我们,整个社会普遍擅长找出如何减轻这些弊端。 是的。 所以,是的,我认为我很乐观。

安德鲁·梅恩: 我们看到一些有趣的数据表明,在教室里有优秀教师和良好课程的配合下,ChatGPT变得非常好用。 如果单独使用,仅仅作为家庭作业的辅助工具,可能会导致孩子们像只是在谷歌上搜索资料一样。

萨姆·奥尔特曼: 我就是那种每个人都曾担心过的孩子。 我原打算等它问世后就凡事都去谷歌搜索,然后停止学习。 而且,你知道,事实证明学校里的孩子们适应得相对较快。 所以我想我们会解决这个问题的。

安德鲁·梅恩: 山姆,想想如果你没有凡事都去谷歌搜索,你会变成什么样。 你明白吗? 所以我们看到了这些普及数据,它们真是惊人。 它是OpenAI最受欢迎的产品。 五年后,它还会是ChatGPT吗?

萨姆·奥尔特曼: 我的意思是,我觉得五年后ChatGPT会变成一个完全不同的东西。 所以从某种意义上说,不会,但它还会被叫做ChatGPT吗? 很可能。 是的。

安德鲁·梅恩: 好的。 所以这是一个扎实的名字。

重新定义智能:从AGI到超级智能

萨姆·奥尔特曼: 从许多意义上讲,如果你在五年前,让我或其他人基于软件的认知能力提出AGI的定义,我认为那时许多人会给出的定义,现在已经远远被超越了。 这些模型现在很智能。 是的。 而且它们会持续变得更智能。 它们会持续改进。 我认为每年都会有越来越多的人认为我们已经达到了通用人工智能系统。 尽管定义会不断外延并变得更具雄心,但仍会有更多人认可它。 但你知道,我们现在拥有的系统确实能够大幅提升人们的生产力,并能从事有价值的经济工作。

也许一个更好的问题是,要达到我所说的超级智能需要什么条件? 好的。 如果我们有一个系统,能够自主发现新科学,或者大幅提升人们利用工具发现新科学的能力,那么对我而言,这几乎就等同于定义上的超级智能,并且我认为这对世界来说将是一件美妙的事情。

安德鲁·梅恩: 所以,基本上,很多时候这都像一个梯度过程,它不断变得越来越好,而我们每一个定义都会说,哦,这感觉…… 当我们达到GPT-4,或在内部试用它时,我就是这种感觉。 我就想,我们有10年的发展空间,可以用它做很多事情。 甚至当它开始自我运行,比如你可以输入推理指令时,它表现得非常强大。 但当你说它提出了什么新的定理或证明,然后,哦,嘿,我们找到了更好的癌症疗法,或者我发现了一些新的GLP药物之类的。

萨姆·奥尔特曼: 是的,我的意思是,我坚信人们生活变好的主导因素是更多的科学进步。 那才是限制我们的地方。 所以如果我们能发现更多,我认为那将真正产生非常显著的影响。 对我来说,那将是一个极其令人兴奋的里程碑。 我认为人工智能的许多其他出色应用也会出现,但那个感觉真的非常重要。

安德鲁·梅恩: 你在内部看到过这种迹象吗? 你看到过让你觉得“哦,我想我们差不多弄明白了”的事情吗?

萨姆·奥尔特曼: 我不会说我们已经完全弄明白了,但我会说我们对所追求的方向越来越有信心。 也许是,我的意思是,这是人人都在谈论的例子,但我认为它仍然很有趣。 人们使用人工智能系统编写代码,编码人员的生产力大幅提高,从而研究人员的生产力也随之提高,这是怎么回事? 这就好比一个例子,它显然没有创造新的科学,但它确实让科学家们能够更快地完成他们的工作。 我们也经常从科学家那里听到关于O3的类似说法。 所以我不会说我们已经完全弄明白了。 我不会说我们已经掌握了算法,或者说我们只要指着它,它就能自己去进行科学研究,但我们正在获得不错的猜测。 而且进展速度仍然令人印象深刻。

[安-德鲁·梅恩]: 看着从O1到O3的进展,那时几乎每隔几周,团队就会说:“我们有了一个重大的新想法”,然后大家就都继续投入工作。 这也提醒我们,有时当你发现一个重大的新见解时,事情的进展会出乎意料地快。 我相信我们还会看到很多次这样的情况。 我最近注意到OpenAI刚刚将模型和操作转移到了O3。 是的。 我注意到有了很大的改进。

萨姆·奥尔特曼: 好得多。 我想说,我们之前遇到的问题是其脆弱性,就是说,人们承诺的代理系统可以做所有这些事情,但一旦遇到无法解决的问题,它就崩溃了。

工具的进化:从O3到深度研究

安德鲁·梅恩: 有趣的是,说到通用人工智能的问题,很多人告诉我,他们感到触动的时刻是O3的操作能力。 观看一个人工智能相当好地使用电脑,虽然不完美,但它并非…… O3是一个巨大的进步,感觉非常像通用人工智能。

萨姆·奥尔特曼: 它对我没有产生同样程度的影响,尽管它相当令人印象深刻,但我已经听过很多次了。 我感到触动的时刻是深度研究,因为那感觉像是它的真正代理式应用。 那就是我回来,就我感兴趣的一个话题产出了比我以前读过的任何东西都好的内容,因为之前所有那些模型都只是获取一堆资料,然后进行总结。 但是当我看到这个系统连接互联网、获取数据、顺藤摸瓜、追溯源头、然后返回,它做得比我更好,这很有趣。

安德鲁·梅恩: 我最近遇到一个人,他是一个狂热的自学者,痴迷于学习,并且无所不知。 他利用深度研究,就他好奇的任何事物撰写报告,然后一整天就坐在那里,已经擅长快速消化这些报告并知道下一步该提出什么问题。 对于那些对学习有着极度渴望的人来说,这是一个令人惊叹的新工具。 我开发了自己的应用程序,它确实能让我提问,并为我生成相关内容的音频文件,因为它就是这样运作的。 我的好奇心可能超出了我的记忆力。

在Operator中,对我来说最神奇的时刻,而且我很好奇接下来事情会如何发展,是当时我正在研究马歇尔·麦克卢汉,想获取大量他的图片,我让你去做了,然后突然之间,我就有了一个装满了这些图片的文件夹,这对于一项研究工作来说,我自己做的话会耗费我极长的时间。

安德鲁·梅恩: 是的,你是如何使用它的? 深度研究吗?

萨姆·奥尔特曼: 是的。 我感兴趣的科学领域是? 我现在处于一个奇怪的境地,时间极其紧张。 如果我有更多时间,我会优先阅读深度研究报告,而不是阅读大多数其他内容,但我总体上阅读时间不足。 另外,很棒的是分享功能,我喜欢它,因为现在更容易与他人分享。 PDF 文件很棒,这很酷。

下一代产品:GPT-5、版本与记忆

安德鲁·梅恩: 而且我会说,尽管我们有深度研究,我们有这些工具,但一场模型竞赛正在进行中。 所以问题就来了,GPT-5会是什么情况?以及,是否有观点认为,有了那样的系统,我们应该看到能力上的提升? GPT-5的时间表是怎样的? 我们什么时候能看到它?

萨姆·奥尔特曼: 可能是今年夏天某个时候。 对。 我不知道具体是何时。 我们反复讨论的一件事是,对于新模型,我们应该在版本号上做多大的提升,还是像我们对待GPT-4.0那样,只是让它变得越来越好。

安德鲁·梅恩: 而我当时必须处理最近的GPT-4,对吧? 当它发布时。 同时,我必须对GPT-4和3.5进行某种程度的测试比较。 而3.5则持续变得越来越好。 于是我能进行的比较也在不断变化。 所以,这就是我的问题。 是的,就好比我能区分GPT-5和“哇,这是一个非常优秀的GPT-4.5”吗?

萨姆·奥尔特曼: 未必。 我的意思是,这两种情况都可能发生,对吧? 你可以一直迭代4.5版本,或者在某个时候你就可以称其为5。 过去情况要明确得多。 我们会训练一个模型并将其发布。 然后我们会训练一个新的大型模型并将其发布。 而现在系统已变得复杂得多,我们可以持续地对它们进行后期训练以使其变得更好。 我现在正在思考这件事。 比如每次,假设我们推出了GPT-5,然后我们不断地更新它。 我们是否应该像对待GPT-4.0那样,继续称之为GPT-5,还是应该称之为5.1、5.2、5.3? 这样你就知道版本何时变化了。 我认为我们对此还没有答案,但我认为有比我们处理4.0的方式更好的做法。 我们周期性地看到这种情况。 比如有时人们更喜欢某个快照,而非另一个,他们可能想继续使用其中一个。 我们得想办法解决这个问题。

安德鲁·梅恩: 是的,挑战在于即使你懂技术,你也能大概理解,好的,如果前面有个零,我就知道了,但如果我想,你知道,比如,但即便如此也不清楚,我该用O4 mini,我该用O3,我该用这个吗? 我认为这就像一个例子,这是范式转变的产物。 然后我们似乎同时推进着这两件事。

萨姆·奥尔特曼: 我认为我们即将解决当前的这个问题,但我能想象一个世界,我不知道它是什么,但我能想象一个世界,在那里我们发现某种新范式,那再次意味着我们需要分叉模型树。 甚至更复杂的名称。 我希望我们不必那样做。 我很高兴能直接用上GPT-5,然后再用上GPT-6。 我认为那样人们会更容易使用。 你也不必考虑,我是想要O4 mini high、O3还是O4,诸如此类……

安德鲁·梅恩: O4 mini high是我用来编程的。 当我想进行对话时,就用O3。

安德鲁·梅恩: 是的,当你明白它们各自的含义时,有选择是很有趣的,但这仍然…… 我认为,让这些事物功能更强大,但同时也更难理解其能力来源的因素之一,是诸如记忆等方面的整合。 记忆最初只是一件非常简单的事情,但现在它变得更加复杂了。

萨姆·奥尔特曼: 记忆功能可能是我最近最喜欢的ChatGPT功能。 知道吗,我们第一次能和电脑对话时,比如和GPT-3或其他什么的,那感觉就像一件非常了不起的事情。 而现在,这台电脑,我感觉它好像对我有了很多语境了解。 如果我只用寥寥数语问它一个问题,它就能充分了解我生活的其他方面,从而相当确定我想要它做什么。 有时候甚至以我意想不到的方式,这真是一个令人惊喜的飞跃。 所以我……而且我也从许多其他人那里听到过这种说法。 有些人不喜欢它,但大多数人确实很喜欢。 我认为我们正在迈向这样一个世界:如果你愿意,人工智能将对你的生活拥有难以置信的上下文信息,并为你提供极其有用的答案。

隐私、信任与商业模式的挑战

安德鲁·梅恩: 对我而言,这很酷。 能够将其关闭的事实也很好。 但其中一个挑战出现在《纽约时报》与OpenAI正在进行的诉讼中,他们刚刚要求法院告知OpenAI,他们必须保留消费者ChatGPT的用户记录,超过因常规原因而必须保存的30天期限。 针对此事,布拉德·莱特卡普写了一封信作为回应。 您能解释一下OpenAI的立场吗?

萨姆·奥尔特曼: 显然,我们将对此进行抗争。 我认为,我希望,但我确实认为我们会赢。 我认为《纽约时报》提出这种要求是离谱的越权行为。 这(指《纽约时报》)是声称重视用户隐私的一方,等等。 但我,想要在此寻找一线希望。 我希望这将是一个社会意识到隐私真正重要的时刻。 隐私需要成为使用人工智能的核心原则。 你不能让像《纽约时报》这样的公司要求人工智能提供商损害用户隐私。 我认为社会需要…… 我认为《纽约时报》这样做确实很不幸。 但我希望这能加速社会需要进行的、关于我们将如何对待隐私和人工智能的对话。 我希望答案是,我们非常非常认真地对待它。 人们现在正在与ChatGPT进行相当私密的对话。 ChatGPT将是一个非常敏感的信息来源。 我认为我们需要一个能反映这一点的框架。

安德鲁·梅恩: 因此,这引出了正在使用或持怀疑态度的人提出的另一个问题:OpenAI现在可以访问这些数据。 担忧之一是关于训练,对此OpenAI已经非常清楚地说明了何时进行或不进行训练,你也有选择关闭该功能的选项。 另一件事是广告之类的内容。 OpenAI对此的方针是什么? 你们将如何承担这项责任?

萨姆·奥尔特曼: 我们尚未推出任何广告产品。 我某种意义上,我的意思是,我并非完全反对。 我可以指出一些我喜欢广告的方面。 我觉得Instagram上的广告,挺不错的。 我从他们那里买了不少东西。 但我认为,这会非常困难,需要投入大量精力才能妥善处理。 人们对ChatGPT有着极高的信任度,这很有趣,因为AI会产生幻觉。 它本应是你不太信任的那种技术。

安德鲁·梅恩: 我的朋友也会胡编乱造。 所以我信任他们。

萨姆·奥尔特曼: 人们确实如此。 但我认为部分原因在于,如果你将我们与社交媒体或网页搜索等进行比较,在这些平台中,你能或多或少地察觉到你正在被变现,而且公司在努力为你提供好的产品和服务,这毫无疑问,但同时也在某种程度上试图让你点击广告之类的东西。 你知道,你在多大程度上相信你得到的是该公司实际认为对你来说最好的内容,而不是那种也试图与广告结合的内容呢? 我认为这里面存在某种心理因素。

所以举例来说,我认为如果我们开始修改输出,比如根据谁支付我们更多来修改从大语言模型(LLM)返回的信息流,那会让人感觉非常糟糕。 作为用户我将非常讨厌那样。 我认为那会是一个破坏信任的时刻。 也许如果我们只是说,嘿,我们永远不会修改那个信息流。 但如果点击那里面的某样东西,而那本来就是我们会展示的内容,那么我们就能获得一点交易收入,而且对所有人来说都是统一的。 如果我们,你知道,有一个简便的支付方式或者类似的东西,也许那样可行。 也许可以在交易流之外放置广告。 抱歉,是在LLM信息流之外,但仍然非常出色。 但我认为那里的举证责任会非常高。 而且它必须让用户觉得真正有用,并且非常清楚它没有干预LLM的输出。

安德鲁·梅恩: 是的,这会是一个难题。 我希望有解决方案。 我很乐意通过 ChatGPT 或一个非常好的聊天机器人进行所有采购,因为很多时候我觉得我没有做出最明智的决定。

萨姆·奥尔特曼: 从而减轻... 不,如果我们能以某种非常清晰和一致的方式做到这一点,那就很好。 但我不知道。 我喜欢我们能够提供优质的服务。 人们为此向我们付费。 这非常明确。 那是有益的。

安德鲁·梅恩: 我会说,模型上的区别在于,我认为谷歌构建了很棒的东西。 我认为新的 Gemini 2.5 是一个非常好的模型。 我认为他们从…… 这是一个非常好的模式。 是的,他们从那种“哦,老天,这些东西真不错”的心态转变为…… 但归根结底,谷歌是一家广告技术公司。 而这正是总让我有些…… 使用他们的API等并不那么令人担忧,尽管…… 但我确实会想,老天,如果我正在使用他们的聊天机器人,那无论是何种情况,我的想法是他们的激励措施是否与此保持一致。

萨姆·奥尔特曼: 谷歌搜索在很长一段时间里都是一款出色的产品。 我确实觉得它已经退化了。 但也曾有一段时间,虽然广告很多,但我仍然认为它是互联网上最好的东西。 我的意思是,我喜欢谷歌搜索。 所以我不是…… 比如说,显然有可能成为一家优秀的广告驱动型公司。 但是……我挺尊重谷歌所做的很多事情。 但是显然也存在问题。

安德鲁·梅恩: 是的,我…… 作为一名苹果用户,我喜欢的苹果模式是,我知道,我为我的手机支付了很多钱,但我也知道他们并没有试图在里面塞入所有这些东西。 他们做了iAds,那,你知道,效果不是特别好,这可能表明他们真的没有用心去做。

安德鲁·梅恩: 是的。 所以我想,这会很有趣。 但我们必须继续观察和关注这件事。 我们开始想,嘿,你知道,Janchi Patee 真的在大力推动这件事。 我需要开始思考这件事。

模型个性、对齐与“星门”计划

安德鲁·梅恩: 所以我们遇到了一个问题。 有一个模型更新。 然后发生的事情是,看来这个模型似乎有点过于讨好,有点过于顺从了。 随着人们越来越多地使用这些系统并与之建立这种关系,这引出了人机交互的问题。 那么,您如何看待这种趋势的走向,以及在个性方面会开辟出怎样的可能性?

萨姆·奥尔特曼: 社交媒体时代的一大错误是,信息流算法对整个社会,甚至可能对个人用户,产生了一系列意想不到的负面后果。 尽管它们正在做用户想要的事情,或者有人认为用户当下想要的事情,即让他们持续在该网站上花费时间。 而这正是社交媒体的重大错位。 我认为还有很多其他因素,比如让人心烦相比快乐和满足,更能让人沉迷其中。

我一直都知道人工智能领域会出现新的问题,会出现某种以不明显方式错位的情况。 但我们确实遇到的首批问题之一是,如果你询问用户对某一个特定回复的需求,与之相对的是,当你试图构建一个对用户最有帮助的模型,然后向用户展示,比如说,两个回复,并询问:“哪个对你更有帮助?”在任何特定情况下,你可能希望模型以某种方式行事,但在你与人工智能的所有互动过程中,这可能并不相符。 你知道,你可以看到,而且我们也确实看到了这些问题,即如果你过于关注用户信号,以及我们在事后分析中讨论的许多其他问题,但我认为这只是一个有趣的例子。 从短期来看,你某种程度上无法获得用户最想要的行为,或者说从长远来看对用户最有帮助、最有用或最健康的行为。 所以,你知道,也许对过滤气泡的类比,将会是那些在短期内对用户有益,但长期则不然的人工智能。

安德鲁·梅恩: 我认为Dolly 3就是这种迹象的一个表现,我认为它在技术上是一个非常有能力的模型,但它们都开始倾向于一种类型的图像流派。 而且它们都像是那种HDR风格。 这是否来自于用户进行那种比较时,仅仅孤立地看待这两个事物,然后说“我更喜欢这一个”的结果呢?

萨姆·奥尔特曼: 我不记得Dolly 3是否如此,但我猜是这样。 是的,我认为它已经变得更好了。 新的图像模型简直是…… 新的图像模型太棒了。 好得令人难以置信。 我简直无法想象它今后会发展到何种程度。

安德鲁·梅恩: 因此,当你构建这些系统并增加使用量时,这总是一个问题。 新的图像模型发布后,你必须限制使用,就像Sora那样,你只能拥有一定量的算力来完成任务,这说明了大家面临的巨大问题,那就是算力。 为了解决这个问题,我们听说了“星际之门”项目,它有一个非常酷的名字,而且与计算机有关。 除此之外,我认为很多人都对它的价格感到震惊,因为它高达五千亿美元。 我们会说:“等等,什么?”我该如何向我妈妈简单描述“星际之门”呢?

萨姆·奥尔特曼: 我认为这相当简单。 它是一项旨在资助和构建前所未有算力的努力。 确实如此,人们…… 我们没有足够的算力让人们随心所欲地做他们想做的事。 但如果人们知道我们能用更多的算力做什么,他们会想要更多更多。 因此,我们今天能为世界提供的,与在算力增加十倍,甚至有朝一日有望增加百倍的情况下能提供的,存在着巨大的鸿沟。 人工智能与我曾从事的其他技术不同之处,或者至少就人工智能而言,将其有效地交付给全球数亿乃至数十亿人的规模,就在于其所需的基础设施投资是多么巨大。 因此,“星门”计划旨在汇集大量资本、技术和运营专长,以建设基础设施,从而向所有需要的人提供下一代服务,并使智能尽可能地普及和廉价。

安德鲁·梅恩: 因此,这是一个大规模的全球项目。 我们之前谈过,其中一个合作伙伴是阿联酋。 你们正在为此努力。 你们正在与世界各国政府就此合作。 其中一个考虑因素是,你知道,社交媒体上有人问过,五千亿美元,5000亿美元。 你们有这笔钱吗?

萨姆·奥尔特曼: 它就在房间里。 但我们将在接下来的... 甚至用不了那么多年,你知道的,除非真的出现什么问题,结果我们造不出这些计算机。 我坚信人们会把这件事办好。 我最近去了我们在阿比林正在建设的第一个场地。 那大约是,你知道的,对“星际之门”项目最初承诺总额的约10%,也就是约5000亿美元的投入。 真是令人惊叹。 我脑海中知道一个吉瓦级规模的场地是什么样子,但亲身去看看正在建设中的,以及成千上万的人四处忙碌地施工,走进安装图形处理器的房间里,看看整个系统是多么复杂,以及它建设的速度,真是非同凡响。 我们很快就会分享更多关于下一批地点的信息,但有一个关于铅笔的绝佳引言,就像一支标准的,你知道的,木质石墨铅笔,它说明了没有人能独自造出它。 这就像是资本主义的魔力。 世界能够协调起来做这些事情,这真是一个奇迹。 站在第一个Stargate基地里,我真正在思考的是,要让这些成排的GPU运行起来,所需要的全球性复杂程度。 你知道,当你拿出手机,在ChatGPT里输入一些东西并得到答案时,你可能……到了这个阶段,你可能甚至不觉得那有什么特别令人惊讶的。 你只是期望它能正常工作。 曾几何时,也许是你第一次尝试时,你会觉得,那真是太神奇了。 但是,在过去一千年或至少几百年里,人们极其努力地工作,才取得了这些来之不易的科学洞见,然后在此基础上建立了工程体系、公司和复杂的供应链,并重构了世界,所有这些都必须发生,才能让这些“魔力机架”被放置在某个地方。 想想所有为此投入的东西。 并将其一直追溯到那些只是从地里挖出石头并观察结果的人们。 所以你现在只需在ChatGPT中输入内容,它就能为你完成任务。

竞争、能源与全球合作

安德鲁·梅恩: 我读过一个关于“星门计划”开发及其国际合作(特别是与阿联酋的合作)的幕后故事,以及埃隆·马斯克曾试图阻挠该计划。 你看到了什么? 你听到了什么?对此有何看法?

萨姆·奥尔特曼: 我曾说过,我想也是对外说过,但至少是在内部说过,在大选之后,我不认为埃隆会滥用他在政府中的权力进行不公平竞争。 遗憾地说,我在这方面错了。 我的意思是,我通常不喜欢犯错,但主要是我觉得他会做这些事,这对国家来说真的非常不幸。 我没有想到,我真心地没有想到他会那样做。 我很感谢本届政府确实做了正确的事情,并坚持抵制了那种行为,但是,是的,这很糟糕。

安德鲁·梅恩: 嗯,我认为改变了的是,而且我认为格雷格·布洛克曼刚刚谈到了这一点,那就是几年前,人们认为,谁先达到目标谁就是赢家,仅此而已,游戏就结束了。 而现在我们意识到其他地方也有很棒的人工智能实验室,比如Anthropic正在构建出色的工具。 我认为谷歌真的提升了它的竞争力。 到处都有好的事情发生,而且不会是一个人独占鳌头。

萨姆·奥尔特曼: 我同意。 我最喜欢的一个例子是,人工智能的发现与此类似,虽不完美,但很接近,在许多令人惊讶的方面与晶体管的发现类似。 但许多公司将在此基础上构建伟大的产品。 然后它最终会渗透到几乎所有产品中,但你不会一直想着在使用晶体管。 所以是的,我认为很多人会建立真正成功的公司,建立在这项令人难以置信的科学发现之上。 我希望埃隆对此少一些零和博弈的心态。

萨姆·奥尔特曼: 或者负和。 我想,如果我们这样考虑的话,蛋糕只会越做越大。

安德鲁·梅恩: 我刚刚参加了一个能源会议,与那些从事能源生产及相关工作的人交谈很有趣,“超大规模化”(hyperscaling)——他们对这种情况使用的术语——是一个话题。 这确实引出了能源需求的问题。 我知道,就Grok 3而言,显然他们不得不在停车场里放置发电机,才能训练那个模型。 问题在于,能源将从何而来? 钱,我能理解;但当我们谈论所需的能源规模时,能源(的供应)才是需要思考的问题。

萨姆·奥尔特曼: 我想,可以说无处不在。 我认为目前是多种来源的混合。 最终,我认为很多…… 我对先进核能,无论是裂变还是聚变,都感到非常兴奋。 但就目前而言,我认为这需要整个能源结构的全面组合。 对。 天然气、太阳能,我的意思是,确实还有核能,所有一切。

萨姆·奥尔特曼: 是的,我曾和一些人交谈过,他们中有些人在艾伯塔省等地区工作,他们说那里有大量的能源可供获取,但在当地没有那么多用途等等。 而这正是这样一种我甚至从未思考过的全貌。 你知道,传统上,大多数种类的能源都很难在世界范围内转移。 但是如果你将能量转化为智能,然后在世界范围内转移这种智能,就会容易得多。 所以你可以把巨型训练中心甚至大型推理集群放在很多地方,然后通过互联网传输输出结果。

人工智能与科学的边界

安德鲁·梅恩: 有一位在OpenAI做演讲的人,我参加了一场活动,有个人正在研究,我想是詹姆斯·韦布空间望远镜。 他谈到他最大的瓶颈是他们即将获得所有这些,你知道的,数太字节的数据,但他没有科学家来处理,也没有足够的人来梳理这些数据。 于是我们面前就有了这些关于宇宙的答案,诸如此类,这就像一个大数据问题。

萨姆·奥尔特曼: 是的,我总是开玩笑说,当我们有足够的钱时,当OpenAI有足够的资金时,我们应该做的就是建造一个巨型粒子加速器。 并一劳永逸地解决高能物理问题。 因为那将是一件非常成功、了不起的事情。 但我想知道,一个非常非常聪明的AI有多大的可能性,只查看我们目前拥有的数据,不再需要更多数据,也不需要更大的粒子加速器,就能把它弄明白? 这并非不可能。

安德鲁·梅恩: 是的,所以就出现了这样一个问题,那就是:现在已经有大量数据了。 世界上有很多聪明人,但我们不知道智能能够发展到何种程度。 如果不再进行实验,我们还能发现多少? 是的,我记得读到过一篇文章,里面谈到在1990年代早期,有人发现了一种类似司美格鲁肽的药物,并将其提交给一家制药公司,但他们说,不,我们不采纳。 而那却成为了一种改变人生的药物,例如对于那些患有慢性肥胖症的人来说,它将改善他们的生活质量。 而你会想,哦,这东西就那样搁置了25年。

萨姆·奥尔特曼: 我怀疑我们还会发现许多其他例子,或许我们已经拥有已知有益的现有药物,但它们能以某种重大方式被再利用,或者只需进行少量修改,我们就能非常接近某个伟大发现。 听到科学家们甚至正在使用当前一代模型进行这类工作,这非常令人振奋。

安德鲁·梅恩: 听起来,我们下一代模型将需要具备的一项能力是理解物理学、化学等知识的模型。 Sora 是对这方面的一种尝试吗?

萨姆·奥尔特曼: 我的意思是,它会理解牛顿物理学。 我不知道它是否能帮助我们发现新化学,以及类似新颖物理学或新颖理论物理学等等你喜欢的东西。 但我认为,我们用于推理模型的技术将对这些方面大有帮助,对此我持乐观态度。

安德鲁·梅恩: 那么,推理模型的工作原理,与我直接向GPT 4.1提问有什么简短的区别定义呢?

萨姆·奥尔特曼: GPT模型本身就具备一定的推理能力。 事实上,在GPT模型早期,最令人兴奋的发现之一就是,通过告诉模型“让我们一步步思考”,就能获得更好的性能表现。 然后,它就会输出逐步思考的文本,并得到一个更好的答案,这种方法竟然有效,这本身就有些令人惊讶。 而推理模型只是将这种能力进一步推进。 所以它的理念是,当模型能够分解问题时,它就能在每一步上投入更多时间。 当你问我一个问题时,如果问题非常简单,我可能会几乎本能地反射性地立即给出答案。 但如果是一个更难的问题,我可能会在脑海中思考,进行内心独白,并自言自语:“我可以这样做或那样做,或者也许这样会更清楚。”我对此不确定。 我可以回溯并重新审视我的步骤。 然后,当我思考完毕,并且我一直是用英语思考的,我就可以列出一些要点,然后以英文形式向您输出一个答案。

安德鲁·梅恩: 现在,当我使用这个应用时,我观察到一件有趣的事情是,如果我提出一个深入的研究问题或类似的问题,然后我切换到锁屏界面,我会看到它仍在处理和思考。 我听说有另一家公司,我忘了是哪家了,正在使用一个衡量某事物耗时多久的指标。 我想是Anthropic,他们说:“嘿,这个模型实际花费了15分钟或30分钟或任何时长来思考某件事,”这是一个好的衡量指标,但它确实需要为您提供正确的答案。

萨姆·奥尔特曼: 我认为那是一种有趣的范式……我感到惊讶的一点是,人们竟然出奇地愿意等待一个出色的答案,即使模型需要思考一段时间。 我所有的直觉都告诉我,对重要的事情应该即时响应,并且用户讨厌等待。 而在很多情况下,这是真的。 但对于那些有非常好答案的难题,人们则非常愿意等待。

人机交互的未来:新硬件与新范式

安德鲁·梅恩: 是的。 那么,我们拥有所有这些工具,所有这些东西。 到目前为止,我用的是我的手机。 而现在,OpenAI 刚刚宣布你们正在开发硬件。 你们发布了一个视频,你和乔尼·艾维(Johnny Ive)在其中谈论了你们已交流协作数年。 显然,你不能……我的意思是,嗯,我可以问你,它现在在你身上吗?

萨姆·奥尔特曼: 还需要一段时间。 好的。 我们将尝试达到一种极高的质量水平。 而这并非一蹴而就。 但计算机,包括软件和硬件,以我们目前所理解的方式,是为没有人工智能的世界而设计的。 而现在,我们正处于一个截然不同的世界。 你对硬件和软件的需求也正在迅速变化。 你可能想要一些能更深入感知环境、在你的生活中拥有更多语境信息的东西,你可能想以不同于打字和看屏幕的方式与它互动。 我们已经对此探索了一段时间。 我们有一些令我们非常兴奋的想法。 我认为人们需要时间来适应在这种世界中使用计算机的意义。 因为现在一切都变得如此不同。

但是,如果你真的信任一个AI,让它理解你生活和问题的全部语境,并代表你做出良好判断,比如让它参加会议,听完整个会议,知道可以与谁分享什么,不应该与任何人分享什么,以及你的偏好是什么,然后你问它一个问题,你信任它会与合适的人进行正确的后续跟进并行动,那么你就可以想象一种截然不同的使用电脑来达成目标的方式。

萨姆·奥尔特曼: 我的意思是,你也可以说,我们与ChatGPT的互动方式受到了上一代设备的塑造。 所以我认为,这是一种协同进化的事物。

安德鲁·梅恩: 但愿如此。 让手机如此普及的原因之一是,我可以在公共场合看屏幕。 我可以在私人场合打电话并与它交谈。 我认为,新设备面临的挑战之一就是如何弥合我们在公共和私人场合使用方式之间的差距。

萨姆·奥尔特曼: 手机是了不起的东西。 我的意思是,它们确实在很多方面都非常出色。 并且你可以想象一款可以在任何地方使用的新设备。 但同时,有些事情我在公开场合和私人场合确实会做得不一样,比如在家里,我有一套很棒的立体声音响系统来听音乐。 而当我在外面行走时,我使用AirPods,这并不困扰我。 所以我认为在公共和私人使用场景中,有些事情是不同的。 但我同意,通用性很重要。

安德鲁·梅恩: 是的,它会随身携带。 所以在明年之前可能都还没有。

萨姆·奥尔特曼: 还需要一段时间。 我希望等待是值得的,但还需要一段时间。

安德鲁·梅恩: 好的。 我很兴奋,也很好奇。 我有一些想法。

给未来一代的建议

萨姆·奥尔特曼: 我的意思是,那些显而易见的战术性内容可能正是你期望我说的,比如,学习如何使用人工智能工具。 有趣的是,世界如此之快地从告诉普通的二三十岁年轻人“学习编程”变成了“编程不重要,学习使用人工智能工具”。 我想知道接下来会是什么。 但当然,接下来肯定还会有新的事物。 但那是,那是很好的战术性建议。 然后在更广阔的层面上,我相信像韧性、适应能力、创造力以及洞察他人需求这样的技能,我认为这些都是出人意料地可以学会的。 而且这不像去练习使用ChatGPT那么容易,但它是可以做到的。 我认为这些技能在未来几十年内将带来丰厚的回报。

安德鲁·梅恩: 更多。 是的,我看到很多网民都在说:“哦,他们太厉害了。”他们为什么还在招人? 我说,因为电脑不能做所有事情。

萨姆·奥尔特曼: 它们也做不了所有事情。 稍长一点的、不止一个词的答案是,届时将会有更多的人,但他们每个人所能做到的将远超,你知道,在通用人工智能(AGI)问世之前一个人所能做到的。

安德鲁·梅恩: 对。 而这正是技术的目的。

本文转载自互联网,如有侵权,联系删除。

相关文章