AI不会消灭搜索,谷歌CEO皮查伊访谈:人形机器人的GPT时刻还有3年

送交者: gonewithsmoke [★★★★声望勋衔17★★★★] 于 2025-05-17 9:25 已读1607次 大字阅读 繁体
                

众所周知,马斯克和OpenAI CEO 山姆·奥特曼现在是直接对手,以至于奥特曼捧场特朗普宣布5000亿美金的星际之门,马斯克还直接讽刺对方没钱。但是想当年,他们也是亲密的盟友,而能让两人联手的原因,就是因为一家巨头公司:谷歌。

在他们创立OpenAI的时候,硅谷已经预计到了谷歌在AI领域的强大,无论是数据、算力还是算法人才几乎都无人可敌,所以马斯克和奥特曼决定联手应对。当然,OpenAI走到今天这一步也是无人能预计,甚至马斯克都不能,他早早退出,错过了ChatGPT时刻的到来。

但谷歌,却正如马斯克所预测的,确实在AI领域呼风唤雨了。虽然谷歌放走了写Transformer架构论文的八位作者,没能赶上大语言模型的第一波红利,但是随后Gemini等模型就在DeepMind创始人兼CEO哈萨比斯的带领上追了上来。

比如,谷歌最新发布的Gemini 2.5 Pro模型在多项AI能力上实现了重大突破,并在LMArena等权威基准测试中位居榜首,超越了OpenAI o3、Anthropic Claude 3.7 Sonnet等主流竞品(虽然个人使用角度,效果见仁见智)。

甚至,谷歌DeepMind昨天宣布的“进化式编码智能体AlphaEvolve,能通过进化算法不断筛选、评估和改进候选方案,最终产出超越人类专家的创新算法,反过来再去训练新一代的Gemini。用AI训练AI的预言,已经成真。


2025年谷歌I/O开发者大会将于5月20日至21日举行,Gemini模型家族预计又会成为大会的绝对主角(多讲一下,AI创业生态媒体“科技行者”已接到邀请,会去现场探访)。

在谷歌I/O前夕,知名科技播客《All-In Podcast》的联合主持人David Friedberg拜访了谷歌总部,与谷歌 CEO Sundar Pichai(桑达尔·皮查伊)做了一次深聊。准确的说,Pichai不应该被称作谷歌CEO,而是谷歌母公司Alphabet(字母表)的CEO。

也介绍一下David Friedberg。他是一位出生于南非的美籍企业家、商人和天使投资人,1980年出生,毕业于加州大学伯克利分校天体物理学专业。他早年在谷歌担任企业发展部门的创始成员,后于2006年创办了WeatherBill(后更名为The Climate Corporation),专注于为农业提供天气保险和数据分析服务。2013年,该公司以11亿美元被孟山都收购,成为农业科技领域的里程碑事件。

Pichai和Friedberg还有着特别的缘分——两人在2004年同一天加入谷歌,成为同一批"Noogler"(谷歌新人)。

访谈发生之际,其实也是Pichai担任谷歌/Alphabet CEO十周年之际。在他任CEO期间,公司股价上涨了4.5倍,季度收入从200亿美元增长至近1000亿美元。不过,更重要的是,这次对话发生在科技行业面临AI重大变革的关键时刻,围绕着谷歌是否会被新兴AI技术颠覆的讨论甚嚣尘上。甚至,苹果高管一句Safari浏览器上的搜索量首次下降,就让谷歌股价瞬间跌了5%。

一、AI会扼杀搜索吗?

于是,话题一开始就谈到了AI会否颠覆谷歌的搜索业务?这一问题确实尤为关键,因为搜索广告业务年收入高达2000亿美元,占谷歌3600亿美元总收入的大部分,也是公司利润的主要来源。

Pichai首先指出了谷歌长期以来的AI战略布局:"近十年来,我们一直将公司定位为'AI优先'。2012年我们启动了Google Brain项目,2014年收购了DeepMind,2015年我成为CEO时就明确表示,技术正在快速演变,我们认为AI将推动搜索领域取得最大进步。"

他解释道,谷歌在搜索上的AI应用早已深入:"Transformers技术通过Bert等模型显著提升了搜索质量。大约一年前,我们推出了AI概览(AI Overviews),现在已有超过15亿用户在150多个国家使用这项功能。"数据显示,AI概览扩展了用户可以输入的查询类型,为搜索带来了全新的使用场景,并且在触发AI概览的查询中,查询增长持续上升。

接下来,Pichai透露了谷歌搜索的重大更新:"我们正在实验室测试一种全新的AI体验,称为'AI模式'(AI Mode),即将推出。在AI模式中,用户可以在搜索中获得完整的AI体验,包括后续的对话式查询。我们在其中引入了最前沿的模型,这些模型实际上是在工作以回答用户问题,将搜索作为真正的原生工具。"他指出,在这种模式下,用户输入的查询长度是传统搜索的2-3倍,甚至输入整段文字。

当被问及谷歌是否面临克里斯坦森所定义的创新者困境(Innovator's Dilemma)时,Pichai表示:"困境只有在你把它当作困境时才存在。在技术领域,你会经历这些巨大的创新周期,你需要尽可能地投入其中,这是唯一的方法。"他以移动互联网时代为例:"当移动互联网兴起时,大家都担心屏幕空间减少,广告如何运作等问题。但移动互联网转型最终非常成功。"

Pichai还以YouTube为例说明谷歌拥抱新技术的态度:"当TikTok出现后,YouTube不仅没有受到冲击,反而蓬勃发展。我们推出的Shorts(短视频)最初的变现能力远不如长视频,但我们专注于用户体验,随着时间推移,变现自然跟上了。"

关于AI对搜索业务经济模型的影响,Pichai认为AI驱动的查询成本问题被过分担忧:"两年前人们对此非常担忧,但对于服务成本而言,我会赌谷歌的基础设施能力优于几乎任何其他公司。在过去18个月内,对给定查询的服务成本大幅下降。更具挑战性的约束是延迟而非成本——搜索一直是近乎即时的,我们需要在保持速度的同时提供AI体验。"

在广告收入方面,Pichai表示AI概览的广告收入已经达到了与传统搜索相同的水平:"广告之所以在搜索中行之有效,是因为商业信息也是信息。从第一原则来看,我认为AI将在这方面做得更好。我们有信心能够很好地完成这一转型。"

二、基础设施优势与基础模型的差异化

在讨论谷歌的基础设施优势时,Pichai强调了公司在芯片领域的长期投入。他指出,谷歌在性能和成本的帕累托前沿上占据领先地位:"我们以最具成本效益的价格提供最好的模型。我们的Flash系列模型在行业中是真正的主力军,我们之所以能够做到这一点,部分原因是我们在自己的基础设施上训练和部署模型,包括TPU。"

Pichai揭示了谷歌TPU(张量处理单元)的发展历程:"我们现在已经是第七代TPU了,第一版是在2017年推出的。我记得在Google I/O上谈论它时,人们可能没太在意,因为当时大家不理解为什么要构建专门的机器学习加速芯片。"他特别提到了最新的TPU系列Ironwood:"一个单独的Ironwood部件超过40 exaFLOPS,这些设备的规模令人难以置信。"


关于谷歌2025年750亿美元的资本支出计划,Pichai解释道:"显然,大部分资金投入服务器、数据中心等,其中服务器占据绝大部分。2025年,计算部分的支出中,一半将用于我们的云业务。"他强调这些投资不仅支持核心产品如搜索、YouTube和Gemini,还用于推动前沿创新,包括大型语言模型以及图像、视频等多模态AI技术,以及构建世界模型等。

当被问及TPU是否能完全替代对英伟达的需求时,Pichai表示:"首先,英伟达是一家非凡的公司,黄仁勋很棒,我们长期与英伟达合作,并将继续这样做。我们在GPU上也提供大量Gemini流量,为客户提供选择。"不过他同时指出:"在内部,我们在TPU上训练我们的#Gemini 模型,并在我们的产品中以这种方式提供服务。但我们两者都使用。"

在AI模型竞争格局方面,Pichai认为基础模型的性能可能存在波动性:"这可能就是Andrej Karpathy所说的AJI(artificial jagged intelligence,人工锯齿智能),也就是进步不会总是平滑的,有时看起来某些领域进展缓慢,然后突然出现范式突破。"

所以,他不同意基础LLM性能正在趋于平缓的观点:"过去几年,我们都在扩大预训练规模,然后在后训练和推理计算方面取得了很大进展,现在的进展是如何将所有这些组合在主动工作流程中。我认为仍然有很多进步,感觉对我来说相当连续。"

而对于谷歌是否拥有YouTube或其他产品的数据优势的问题?Pichai回应:"我认为我们有机会为用户创造更好的体验。用户使用Gmail、日历、文档、YouTube、搜索等产品,所以在获得他们许可的情况下,考虑这种个人上下文,我们可以提供更好的体验。我们正在努力,但这是我们需要交付的东西。我把这视为我们公司未来差异化创新机会之一。"

三、人机交互的未来图景、硬件布局与AI时代的竞争格局

当被问及5-10年后人机交互的未来时,Pichai提出了一个令人深思的观点:"人类一直在适应计算机,一直都是这样,但随着时间的推移,答案将是你需要做的困难工作更少,适应的程度更小,计算机在为你工作,这是圣杯所在。"

他认为技术正在朝着这个方向发展:"无论是触摸还是语音,一切都在向这个未来迈进。"Pichai特别提到AR眼镜的潜力:"我已经戴眼镜了,AR眼镜目前可能不如我的普通眼镜舒适,但它们正在接近。显然对我来说,这将把体验推向下一个无缝级别,让技术可以环境式地存在并为你做事。"


Pichai预测下一个重大飞跃可能来自于多模态AI与AR的结合:"考虑到你将拥有真正原生的多模态模型,可以接收音频、视觉、语言等所有信息,并出现在你的视线中。当AR真正发挥作用时,我认为这会让人们惊叹。"他澄清道:"我不是在谈论沉浸式显示器,而是更多关于AR眼镜。"

当被问及谷歌是否在硬件领域投入大量精力时,Pichai确认:"是的,我们对VR眼镜、下一代形态因素非常兴奋,机器人是另一个领域。我们还制造Pixel手机,数据中心...我们肯定在物理世界中。你可以把Waymo看作是我们到处开的一个大机器人。"

四、只要你关注AI研究,就不会低估中国

当讨论AI领域的竞争格局时,Pichai对几大竞争对手进行了评价。关于OpenAI的Sam Altman、XAI的Elon Musk、Meta的Mark Zuckerberg和微软的Satya Nadella,Pichai表示:"显然,这是一个非常令人印象深刻的群体。你谈论的是一些最好的公司、最优秀的企业家。这表明我们将看到多少进步,因为你基本上是在谈论许多努力推动进步的人。"

Pichai特别提到与Elon Musk的互动:"大约两周前我与Elon交谈,他将未来技术变为现实的能力无与伦比。这些都是非凡的人物。我尊重他们所有人。其中既有合作关系,也有竞争关系。"

他补充道:"在AI这个领域,所有人都可能做得很好。互联网出现时,谷歌甚至都还不存在。所以另一件你可以说的是,有些公司我们甚至不知道,还没有成立,他们的名字还不为人知,可能会在AI领域极其成功。AI是一个比我们所知道的所有以前的技术更大的机会领域。"

关于中国的AI崛起,特别是DeepSeek模型的出现,Pichai坦言:"如果你关注AI研究,浏览论文并阅读它们,没有人会低估中国。当你看到中国的研究产出量,他们有非凡的人才。DeepSeek的出现让所有人都必须调整我们的预期:比大多数人可能假设的更接近前沿。"

Pichai分享了内部评估结果:"有趣的是,对我们来说,我们将它与Flash进行了基准测试,Flash在效率上与之相当,甚至在某些方面可能更好。"他补充道:"这告诉你,前沿正在迅速发展,有比人们完全意识到的更多参与者接近它,这将是行业中一个非常动态的时刻。我认为中国在AI前沿将非常有能力,这是我一直假设的。"

五、AI发展面临的能源瓶颈

在谈到AI发展的实际约束时,Pichai直面能源问题的挑战。Friedberg提出,Elon Musk宣称需要1太瓦的计算能力,这大约相当于整个美国的电力生产能力,而美国的电力产能预计到2040年将从1太瓦增长到2太瓦,而中国则从3太瓦增长到8太瓦甚至更多。

Pichai承认这是一个真实的挑战:"当你看任何系统时,你想找出约束在哪里,因为那会影响整个系统。你正确地指出了AI问题最可能的约束,从而也是GDP增长和所有这些的约束。"

不过,他对这一问题持相对乐观的态度:"有时你会遇到必须解决的挑战,比如遇到物理障碍或类似的东西。这不是那种问题。我们已经知道可以满足我们需求的技术。所以对我来说,这更像是一个执行挑战。"

Pichai列举了几个关键解决方案方向:

"我们不应该在能源领域有创新者困境。我们应该全力拥抱所有可能的创新。"

"人们会永远低估太阳能。太阳能加电池最终将非常重要。"

"核能、地热等领域的创新正在涌现。"

"升级电网,解决输电问题,加快所有这些进展的许可。"

"我们可能会受到劳动力限制,如果你看电工离开劳动力市场的数量...我们需要确保有激励措施和劳动力发展来解决这类短缺。"

当被问及电力限制是否会影响谷歌业务的当前增长时,Pichai承认这已经是一个现实问题:"今年我们的云业务受到供应限制。当我们都同时寻求扩大数据中心规模时,我们确实遇到了真正的限制。限制的体现是项目延迟,原因是许可问题或无法获得足够的电工。这些都是我们所有人正在应对的现实。"

对于长期前景,Pichai表示:"如果这种趋势继续下去——我们都在以这种速度扩张——这些限制将变得更加明显。

当Friedberg提出15年后美国可能只有中国电力的25%时,Pichai表示:"这就是为什么人们正在努力建设小型模块化反应堆和核聚变等的原因。如果AI对经济的实质性影响持续扩大,这些制约因素将更加凸显。他相信美国将通过 Capitalism方式解决这个问题。"

六、谷歌在量子计算与机器人技术的前沿布局

谈到谷歌在量子计算领域的投资,Pichai表示这是公司长期战略的一部分,类似于之前被忽视但最终证明价值巨大的TPU和DeepMind投资。他将量子计算的当前阶段比作2015年左右的AI:"我认为在五年时间框架内,你会有那种时刻,一种真正有用的实用计算以量子方式完成,远优于经典计算机。这将是那种'啊哈'时刻,我认为这将真正展示该行业的前景。"

Pichai表示:"宇宙本质上是量子的。要以真正代表自然的方式进行任何大规模模拟,你需要某种版本的量子计算。"他对谷歌在量子领域的进展充满信心:"看到我们在其他基础领域的工作进展,我绝对确信我们会到达那里。"

虽然量子计算领域充满各种宣传和噪音,Pichai认为谷歌处于领先地位:"我认为我们处于那里的前沿。在三到五年的时间框架内,我对此相当兴奋,但我们会耐心地到达那里。"

当被问及量子计算的商业前景时,Pichai表示谷歌的目标是:"展示越来越多有用的实用算法,并通过云提供访问。"他强调创新的不可预测性:"很难预测平台之上的创新。没有人能说仅仅因为你有智能手机、GPS和支付系统,像Uber这样的东西就会被发明出来。你无法从底层创新线性地预测Uber。这就是世界运作的方式。对我来说,量子是那种基础,就像AI一样,将会有非凡的创新建立在其上。"

关于机器人技术,Pichai透露谷歌正在这一领域积极布局:"我们肯定拥有世界上最先进的前沿研发团队之一。Gemini机器人团队在视觉语言动作模型等方面的工作是世界一流的。"他解释道,谷歌现在正考虑如何通过合作或直接推出产品参与这一市场。

Pichai认为,与早期尝试不同,现在是AI与机器人结合的关键时刻:"过去我们可能过早地尝试了应用层,当时机器人技术并没有真正受到AI的影响。但现在正是AI加机器人技术带来下一个甜蜜点的时刻。"他表示谷歌正在这一领域制定计划,虽然目前没有具体消息可分享,但将会有更多公告。

关于人形机器人的进展,Pichai分享了他的观察:"当我看人形机器人的进展时,过去我会说,很明显它们看起来很笨拙。现在我必须仔细看五秒钟才能判断这是假的还是真实的机器人在做这件事。我们可能距离机器人领域的那个神奇时刻还有两到三年,这是下一个令人兴奋的阶段。"

当被问及谷歌是否可能开发机器人领域的"Android系统"时,Pichai确认:"是的,我们有Intrinsic,这是我们的一个投注,有效地在做这件事。所以我们支持机器人制造商。我们致力于让Gemini作为一个模型,将考虑所有的模态,对机器人技术非常有效。我们肯定致力于参与其中。至于我们如何实际推出产品,是第一方还是第三方等,这是我们正在思考的问题。"

七、AI时代的文化重塑、人才招募与Alphabet的未来航向

当谈到谷歌企业文化的演变时,Pichai反思了公司从提供免费食物、工作场所按摩和20%时间项目等福利,到如何平衡员工赋权与企业使命的发展历程。

Pichai强调了谷歌文化的根本理念:"文化的基础是真正投资于员工并赋予他们权力,甚至一些福利的目的是创造一种积极、乐观的文化,处于创新思维模式,人们相互交流。或许通过在这里提供午餐,人们都坐在一起通过午餐讨论想法,你在交叉授粉,想象一下。这是基本理念,而不是我们试图给人们提供午餐。"

他认为员工赋权仍然是谷歌的优势来源:"直到今天,我仍然感觉我们在公司各个层面都获得了大量创新。我认为人们醒来后会说,'好的,我可以去做NotebookLM(一个AI播客工具)等等',这些都是很好的例子。人们一直都这样做。所以我认为赋权员工一直是也将继续是谷歌的优势来源。我认为我们可以吸引更高水平的人才,他们感到他们有能力这样做。"

同时,Pichai也强调了领导的重要性:"这并不意味着,以Google DeepMind为例,从Demis到其他人,都有非凡的领导团队,如Corey、Jeff、Oriole、Nome等,所有这些领导者对如何推动前沿发展都有强烈的意见,这也在发生。所以我认为在两者之间取得平衡很重要。"

关于谷歌文化的一个常见误解,Pichai解释道:"当你大大赋权员工时,在某种程度上,我们允许比其他公司更多的自由,这是你可以考虑的一种方式。所以你会听到声音,有时你会听到实际上是公司中500人的声音,但这并不代表整个公司。所以在某些方面我们与其他公司不同,从外部看可能会造成混淆。"

谈到近年来公司文化的调整,Pichai承认:"作为一个行业,不仅仅是我们,我认为公司的使命和我们所有人在这里的原因有时会被其他事情所掩盖。我们在公司不是为了解决我们的个人分歧或什么。我们在这里是因为你对创新感到兴奋,为了公司的使命和你可以产生的影响。所以重新关注这一点,这是我在过去几年非常有意地做的事情。"

在人才市场方面,Pichai表示:"AI是激烈争夺人才的时刻之一。我们幸运地拥有一些最有才华的员工,所以我们是一个人才来源。我同样为谷歌员工离开创办了2000多家公司感到自豪。存在一个良性循环,人们回来,我们收购公司,所有这些让公司保持新鲜。在当前的AI时刻,我们既留住关键人才,也在招聘。我总是看树的顶端,我们能否吸引来自顶级项目的最佳博士研究人员?答案是肯定的。"

关于AI如何改变教育和人才培养,Pichai提出了有趣的观点:"人们会永远低估太阳能,我们可能都误解了大学的意义,也许大学是关于那种社区和人们聚在一起交流。可能仍有一些无形的东西,使得它比我们所有人认为的更有价值。"

他认为AI最大的影响可能是让人才更加全球化:"我认为你将在世界各地更多地方找到非凡的人才。有了AI,人们可以获得访问。所以你不需要在某几个特定地方就能成为那种伟大的人才。"

八、Alphabet的公司架构与未来愿景

在访谈的最后部分,Pichai回顾了Alphabet作为控股公司的架构与定位。David回忆了十年前与Larry Page的一次对话,当时Page谈到从Google到Alphabet的转变,Alphabet将成为一个控股公司,发现或开发下一个1000亿美元收入的业务。

对于Alphabet是否仍是一个控股公司的问题,Pichai澄清道:"我认为我们不是一个控股公司,就像我们不仅仅是寻求在其他有吸引力的业务中投资资金的意义上。那不是我们的身份。我们是从基础技术出发的。如果我们能够利用那项技术和我们所做的研发,并识别出我们可以创新并带来差异化价值主张的问题,我们就会这样做。这就是我们的方法。"

他解释说,这种结构是这种方法的结果:"这意味着你会有纸面上看起来非常不同的业务,但它们下面有一个共同的线索。所以Waymo将继续变得更好,因为我们在Gemini和AI方面所做的相同工作,随着时间的推移,谷歌云对搜索到YouTube到同构到机器人等等也是如此。这是统一层。"

Pichai将其描述为一个连续体:"谷歌云是谷歌业务还是Alphabet业务?我们将其分开。所以品牌意义较小,我认为。我们将拥有一系列公司。其中一些将离开IPO,因为也许这是他们取得进展的最佳方式。所有这些都是可能的。"

他强调,创始人关注的是底层创新:"我们从量子、AlphaFold(因此有同构)、自动驾驶和构建Waymo驱动程序等单元思考,因此所有业务都建立在其上。"

关于X实验室的角色,Pichai确认其继续在创新中发挥重要作用:"如果说有什么的话,X随着时间的推移,很多这些创新确实来自X,包括Waymo,Google Brain的早期化身。X作为一个孵化器让我们推动边界。他们正在思考Tapestry项目,思考电网问题。"

最后,当被问及作为CEO十年来最大的遗憾和最引以为豪的成就时,Pichai回答道:"我为公司能够推动技术前沿感到最自豪。没有多少公司能够推动技术前沿,你不经常听说公司获得诺贝尔奖。我们进行的那种基础研发,然后应用它来创造业务和价值,我认为我们在这方面做得非常出色,我们渴望这样做。我认为我们作为一家公司在这方面相当独特。"

至于遗憾,Pichai幽默地提到:"天生的小遗憾,我倾向于展望未来,我从我们犯的错误中学习。但是,有些收购我们激烈讨论,接近达成,然后...也许是Netflix吧?我们在某个时候内部非常激烈地讨论过Netflix。所以你经历这些时刻,我不会称之为遗憾,但你总是回顾,在蝴蝶效应的世界中,有替代路径,但也许它们在多元宇宙的不同部分。"

喜欢gonewithsmoke朋友的这个帖子的话,👍 请点这里投票,"赞" 助支持!

[举报反馈] [ gonewithsmoke的个人频道 ] [-->>参与评论回复] [用户前期主贴] [手机扫描浏览分享] [返回电脑前线首页]

帖子内容是网友自行贴上分享,如果您认为其中内容违规或者侵犯了您的权益,请与我们联系,我们核实后会第一时间删除。

所有跟帖: (主帖帖主有权删除不文明回复,拉黑不受欢迎的用户)

打开微信,扫一扫[Scan QR Code]

进入内容页点击屏幕右上分享按钮

楼主本月热帖推荐:

    >>>查看更多帖主社区动态...