支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


AI应该能让发达国家GDP增长10%,Meta创始人扎克伯格对话微软CEO萨提亚:文档、应用程序和网站之间的界限消失于模型时代

发布日期:2025-05-10 20:40:39 浏览次数: 1646 作者:高飞的电子替身
推荐语

AI技术如何重塑数字世界的边界?扎克伯格与萨提亚的深入对话揭示了未来工作的新形态。

核心内容:
1. 文档、应用程序和网站界限消失的趋势
2. AI时代对人类工作流程的连续性影响
3. 微软OLE技术对现代AI融合思想的贡献

杨芳贤
53A创始人/腾讯云(TVP)最具价值专家

虽然Llama4不尽如人意,但是Meta创始人兼CEO扎克伯格依然在一周多以前,领衔举办了首次Meta AI开发者大会——LlamaCon 2025扎克伯格也在会议期间,接受了播客专访。

而在大会上,他则邀请了微软CEO纳德拉·萨提亚 (Satya Nadella)等企业家做了系列对话。这场活动已经过了几天,但我依然选择发这期博客,是因为萨提亚在对话中分享了一个非常深刻的观点,值得记录:文档、应用程序和网站之间的界限正在消失

据萨提亚在对话中说,这实际上源自比尔·盖茨一直在微软内部推崇的思考:“比尔总是让我们思考文档、应用程序和网站之间的区别到底是什么。”这三者之间看起来区别很大,但是是否真的无法彼此融合?

萨提亚认为,在AI时代,它们的界限终于变得模糊了。接下来我展开讲解一下。

先假想一下,当你用计算机解决一个问题时——比如规划一次旅行——你的思维过程是怎样的?你会查找信息(阅读),进行计算(处理),与他人交流(互动),最后形成决策(输出)。在这个自然的认知流程中,其实并没有"现在我要打开文档"、"现在我要启动应用"、"现在我要访问网站"这样的断裂。你的意识是连续的,需求是流动的。

然而,在用计算机系统解决这个问题的真实场景中,我们会被迫将这个连续的过程切割成碎片:

  • 文档(Word):用于记录和阅读

  • 应用(Excel):用于计算和处理

  • 网站(Browser):用于搜索和交互

但这种分割不是因为它符合人类认知,而是因为早期计算机的技术限制。处理器速度有限,内存容量不足,网络带宽受限——我们不得不将复杂的人类需求简化为计算机能够处理的离散任务。

比尔·盖茨很早就意识到这个问题。所以微软在90年代推动了OLE技术时,本质上是在问:为什么一个销售报告(文档)不能包含实时更新的销售数据(应用)和客户反馈(网站)?

这里解释一下OLE(对象链接与嵌入)技术,这是微软在1990年第一次发布的组件技术,目的就是打破应用程序之间的障碍,实现"复合文档"的愿景。它允许用户在Word文档中嵌入Excel电子表格或PowerPoint幻灯片等活动对象,不仅能显示内容,还能保留原应用程序的功能。作为微软尝试模糊文档与应用界限的第一步,为后来的COM、ActiveX和.NET等技术也奠定了基础,也是萨提亚所描述的信息形态融合的思想源头。

萨提亚索认为,由于大模型这样的现代AI技术的出现,真正的突破终于来了。萨提亚描述了自己的个人数字体验:"我阅读关于Llama 4的资料时,实际上是通过一系列网络聊天会话完成的,然后我们可以把内容添加到文档中,而且有了代码补全功能,还可以把它(文档)很容易变成一个应用。"

这其中发生了什么?AI实际上成为了一个"通用转换器(transformer)”,它理解用户意图,而不是机械地执行命令。当你说"帮我了解Llama 4"时,AI其实能够无视"你想要文档、应用还是网页?”的传统问题,而是能够根据上下文,在对话中提供信息,组织结构化文档,甚至生成可执行的代码。

这种转变的本质是:我们终于从"面向工具的计算"走向了"面向意图的计算"。在新的范式中:

  • 信息的形态由使用场景决定,而非预设的容器

  • 转换是无缝的,因为AI理解上下文

  • 用户体验是连续的,就像人类自然的思维过程

当你可以在一个连续的工作流中,从构思(聊天)到研究(搜索和阅读)到计算(数据处理)到展示(可视化),所有这些传统上需要不同工具的任务都可以在一个统一的环境中完成。萨提亚提到的"为什么Word、Excel、PowerPoint要分开?”也就成了正在消失的问题。

文档、应用和网站由此走向融合——不是因为我们想要一个"超级应用",而是因为这种分割本来就是技术限制下的权宜之计。当AI消除了这些限制,信息终于可以按照人类认知的自然方式流动了。

当然,扎克伯格和萨提亚在对话中远不是只讲了这些,只是我对这个观点最感兴趣,更多内容,大家可以继续往下看,有更多有价值的信息。

一、 AI:定义新时代的颠覆性平台转型

对话一开始,扎克伯格便引导话题,提及萨提亚曾多次将当前AI的蓬勃发展与历史上重大的技术变革相提并论。萨提亚对此进行了深入阐释,他回顾了自己的职业生涯,亲历了从客户端-服务器(client-server)架构的诞生,到互联网(web)、移动(mobile)和云计算(cloud)的崛起。在他看来,当前的AI浪潮,可以视为第四次或第五次(取决于如何划分)重大的平台级转型 。   

萨提亚强调,每一次这样的平台转型,都会引发对整个技术堆栈(tech stack)的“重新审视”与“重新构建” 。他比喻:“你几乎可以回到第一性原理开始构建” 。

以云基础设施为例,他指出,为AI训练而设计的核心存储系统,与他大约在2007-2008年开始构建的传统云存储系统截然不同 。AI训练负载,尤其是数据并行同步负载(data parallel synchronous workload),也与早期的Hadoop等分布式计算框架有着本质的区别 。这种从底层硬件到上层应用的全面革新,正是平台级转变的核心特征。“事实在于,你必须在每一次平台转变中,自上而下地重新思考技术堆栈的每一环,这是我们时常面临的挑战。”  

他进一步补充道,虽然新技术往往孕育自现有基础(例如互联网诞生于Windows这样的操作系统之上),但其发展最终会远远超越其最初的载体 。这便是他对当前AI发展的宏观判断。   

二、 AI效率的“超级摩尔定律”与消费增长

扎克伯格接着关注到萨提亚曾多次提及的观点:随着技术效率的提升,服务成本下降,人们最终会消费更多的服务,这就是著名的杰文斯悖论。他询问萨提亚,在微软庞大的企业业务中,AI模型的效率提升是如何具体体现的,尤其是在各代模型能力飞速增强的背景下 。   

萨提亚对此回应道,几年前业界还在忧虑摩尔定律是否终结,而如今我们却仿佛进入了一个“疯狂的超光速摩尔定律(hyperdrive Moore's law)”时代 。他指出,任何技术平台的变革都不是单一S型曲线(S-curve)的演进,而是多条S型曲线的叠加复合效应。具体到AI领域,首先是芯片层面,像英伟达的Jensen(黄仁勋)和AMD的Lisa Su(苏姿丰)等行业领袖正在推动巨大的创新,芯片迭代周期不断缩短,这本身就是一种摩尔定律的体现。这也是萨提亚在自己的推文中表达过的观点:

但更重要的是,在此基础上,整个系统的优化也在同步发生:从数据中心的集群管理、系统软件优化,到模型架构的创新、推理内核的优化,乃至应用服务器和提示缓存(prompt caching)技术的进步,每一个环节都在快速迭代 。萨提亚总结说:“当你把所有这些因素叠加起来,可能每6到12个月,我们就能看到大约10倍的性能提升。”  这种能力和效率的指数级增长,伴随着价格的相应下降,从根本上驱动了消费量的激增 。因此,他对AI应用的深度发展非常乐观,认为我们正处在一个能够构建复杂、深度应用的阶段 。   

三、 多模型协同:构建复杂AI应用的未来

随着AI能力的增强和成本的降低,萨提亚预见到应用开发将从依赖单一模型转向更为复杂的“多模型应用(multi-model applications)” 。他解释说:“我们终于开始进入多模型应用的时代,在这里我可以编排一个基于某个模型构建的智能体(Agent)与另一个智能体进行确定的工作流交互。”   

他提到,为了实现这种多智能体、多模型之间的顺畅协作,一些标准化协议,如MCP或A2A,正扮演着越来越重要的角色。萨提亚认为:“如果我们能在一定程度上实现标准化,那么我们就能构建出能够充分利用这些能力增长但同时保持灵活性的应用程序。”    

扎克伯格对此深表认同,并引出了“蒸馏工厂(distillation factory)”的概念,认为微软在提供支持多模型协同的基础设施方面具有独特优势 。这预示着未来的AI应用将不再是单一庞大模型的简单调用,而是由多个经过优化的、可能功能各异的模型(智能体)通过精心设计的编排层(orchestration layer)协同工作,共同完成复杂任务 。这不仅提升了系统的灵活性和效率,也为开源模型提供了广阔的用武之地,因为开源模型更容易被定制和整合到这样的复杂系统中。   

四、 开源之道:微软的转型与AI时代的战略选择

既然是在Llama的开发者会议上,对话自然而然地转向了开源在AI生态中的地位和作用。

扎克伯格指出,微软在萨提亚的领导下,经历了一段有趣的开源之旅,从早期对开源的谨慎态度转变为积极拥抱(熟悉微软历史的朋友可能会知道,前微软CEO,现NBA快船队老板鲍尔默曾经在2001年接受采访时说,Linux是癌症)。微软不仅与OpenAI建立了早期的合作伙伴关系(尽管OpenAI的模型主要是闭源的),同时也明确表示要大力支持开源模型的发展 。扎克伯格非常好奇萨提亚是如何思考这一转变,以及他如何看待开源生态的演进,及其对微软客户和基础设施建设的重要性 。   

萨提亚坦诚地分享了他的心路历程。他回忆起在微软早期的一项重要工作,就是确保Windows NT系统与当时各种Unix变体之间的互操作性 。这段经历让他深刻体会到:“互操作性首先是客户的需求。如果你能在这方面做得很好,那对你的业务是有利的,而且显然你也在满足客户的实际需求。”  这一理念塑造了他对开源的态度。   

萨提亚强调,他对于闭源或开源并非采取教条主义的立场,“我并不固执于闭源或开源,世界上两者都需要。”  他认为,即使个体或公司有自己的偏好,市场最终会做出选择,客户的需求将决定一切 。他列举了SQL Server与MySQL/Postgres、Windows与Linux并存的例子,甚至提及了他个人非常喜欢的Windows Subsystem for Linux (WSL),因为它极大地便利了开发者在Windows上使用各种开发工具 。   

因此,他认为拥抱一种允许混合和匹配开源与闭源方案的姿态是极为有益的 。这与之前讨论的多模型协同和“蒸馏工厂”概念不谋而合。萨提亚指出,许多企业客户希望能够“蒸馏”他们自己的模型,因为这些模型承载着他们的知识产权(IP) 。

在这种场景下,“一个开放权重的模型(open-weight model)相比于闭源模型,具有巨大的结构性优势。”  他总结道:“所以我确实感觉到,当今世界,有了优秀的闭源前沿模型和优秀的开源前沿模型,会得到更好的服务。对我们这样的超大规模云服务商(hyperscaler)而言,这是一件大好事,因为归根结底,我们的工作就是服务。”  就像在Azure上客户既可以选择Postgres、Linux虚拟机,也可以选择SQL Server、Windows虚拟机一样,微软希望在AI模型领域也提供同样丰富的选择和完善的工具链支持 。  

五、 Azure赋能开发者:构建世界级AI基础设施与工具链

扎克伯格进一步追问,Azure平台对于支持开源(以及所有)AI开发者,其核心定位和差异化优势体现在哪些方面 。   

萨提亚首先强调,一个AI工作负载远不止AI加速器和推理时的模型那么简单 。其底层依赖于大量的存储、通用计算(而非仅仅AI加速器)、以及高性能网络等基础设施 。因此,Azure的首要任务是“构建世界级的计算、存储、网络以及AI加速器即服务(IaaS),为那些希望构建下一代智能体(agents)的开发者提供坚实基础。”    

在此之上,微软正通过其Foundry平台打造一个应用服务器(App Server)层 。萨提亚解释说,回顾微软的每一次平台转型,应用服务器都扮演了关键角色,它负责将各种服务(如搜索、记忆、安全评估等)打包起来,供开发者调用 。这些都是每个开发者在构建应用时所必需的组件 。将这些服务封装成框架和工具,是Azure的另一核心任务 。   

最后,GitHub Copilot作为开发工具,也是微软非常重视的一环,其进展令人鼓舞 。萨提亚总结道:“卓越的工具、优秀的应用服务器和强大的基础设施,这三者的结合,是我们认为加速应用开发所必需的。”    

六、 AI驱动生产力革命:从代码生成到知识工作重塑

接下来,他们的话题转向了AI智能体(agents)在提升生产力方面的巨大潜力,这无疑是整个AI生态系统和开发者社区的核心主题之一 。扎克伯格好奇地询问萨提亚,这一趋势在微软内部是如何体现的,以及在外部客户中,他看到了哪些最有趣的实例 。   

萨提亚表示,软件开发领域的变化是最直观的例证 。以GitHub Copilot的演进为例,它最初提供代码补全(code completions)功能;随后加入了聊天(chat)功能,使得开发者无需跳转到Reddit或Stack Overflow等外部网站寻求答案,保持了工作流的连贯性 ;再后来发展出智能体式工作流(agentic workflow),可以直接给AI分配任务 。如今,甚至出现了“初级软件工程师智能体(proto-SWE agent)”,可以直接通过高级提示(high-level prompt)或将拉取请求(PR)分配给AI来完成编码任务 。  

萨提亚强调,这些功能并非相互替代,而是开发者在日常工作中会同时使用到的 。而实现这些功能并带来生产力提升的关键在于,“你必须将所有这些与你现有的代码仓库(repo)和你当前的开发者工作流整合起来。”  

毕竟,大多数开发者并非总是在全新的“绿地项目(Greenfield app)”上工作,而是需要在一个庞大的代码库和复杂的流程中进行开发 。这种工具链的深度集成,正是工程团队需要完成的“系统性工作(systems work)”,也是看到实际生产力提升的前提 。   

同样的逻辑也适用于其他知识工作领域 。萨提亚以销售场景为例,描述了他准备客户会议的流程变化。过去,准备一次企业客户会议的流程自1992年他加入微软以来几乎没有改变:总会有人撰写一份报告,通过邮件发送或文档共享,他会在会议前夜阅读。而现在,“我只需使用Copilot中的研究功能,就能获得整合了网络信息、内部资料乃至CRM系统中所有相关数据的实时报告。”  这意味着不再需要有人专门准备这些材料,因为信息已经“触手可及(on tap)” 。这种转变“要求你改变工作方式、工作成果(work artifact)和工作流程(work flow)” 。萨提亚认为,这种变革起初可能缓慢,但随后会突然加速,就像个人电脑(PCs)的普及改变了企业做预测的方式一样——从传真和内部备忘录,到通过电子邮件发送电子表格 。他相信,我们正处在这场变革的开端,并且已经在客户服务、市场营销、内容创作等领域看到了切实的进展和生产力提升 。   

七、 AI编码占比与未来软件工程师的角色

扎克伯格对AI在微软内部编码的具体贡献比例非常感兴趣,他问道:“在微软内部,目前有多大比例的代码是由AI编写,而不是由工程师编写的?”    

萨提亚回应说,他们主要追踪两个指标。一是代码接受率(accept rates),这个数字大约在30-40%,并且在持续上升。这个比例也与编程语言有关,例如,微软内部仍有大量C++代码,而早期AI对C++的支持不如Python那么好,但现在情况已大有改善 。随着对更多语言支持的增强,代码补全功能也越来越好 。   

对于由AI智能体生成的代码,目前尚处于“萌芽阶段(nascent)” 。在全新的“绿地项目”中,AI编码的比例非常高,但如前所述,很多工作并非全新项目 。不过,萨提亚提到,AI在代码审查(code reviews)方面的应用增长显著 。他估计:“目前在我们的一些项目中,代码库中大约20-30%的代码可能是由软件(AI)编写的。”    

扎克伯格也分享了Meta的观察和目标。虽然他没有提供确切的AI编码比例数据,但他提到Meta内部许多团队(如动态消息排序、广告排序团队)正在特定领域内进行实验,通过分析历史变更来让AI自动生成代码 。Meta更宏大的目标是构建一个AI和机器学习工程师智能体,以加速Llama模型自身的开发 。

扎克伯格大胆预测:“我们认为,可能在未来一年内,大约一半的(Llama)开发工作将由AI完成,而不是人类,并且这个比例此后会持续增加。”  他关注的主要是优化、安全改进等类型的任务,认为这些领域AI大有可为 。   

两位CEO都预见到,未来软件工程师的角色可能会发生转变。扎克伯格形象地比喻道:“每一位工程师未来实际上更像是一个技术主管(tech lead),领导着一支由AI工程智能体组成的‘小分队’与他们协同工作。”  萨提亚也从工具和基础设施提供商的角度思考,认为未来微软的工具和基础设施,可能更多是为这些AI智能体本身服务的,包括为它们设计合适的工具、基础设施和沙箱环境,甚至重新定义GitHub代码仓库的形态以适应AI智能体的需求 。   

八、 “蒸馏工厂”:释放开源模型潜力,普及普惠AI

对话再次深入到“蒸馏工厂”(distillation factory)这一概念,探讨如何将大型、复杂的AI模型通过“蒸馏”技术,转化为更小、更专注、更高效,且易于部署和使用的模型 。萨提亚认为,这正是开源模型能够发挥巨大作用的领域之一 。   

他解释道:“例如,在Llama家族内部,将一个大型模型蒸馏成一个更小但保持相同模型结构的模型,就是一个非常重要的用例。”  微软的目标是为此构建工具和服务,降低开发者进行模型蒸馏的门槛 。他设想,如果Microsoft 365的每个租户都能方便地创建一个经过蒸馏的、针对特定任务的模型(作为智能体或工作流的一部分),并能从Copilot内部调用,这将是一个突破性的场景。   

扎克伯格对此表示强烈认同,并认为蒸馏是开源最强大的特性之一 。他坦言,Meta内部也在进行类似的工作。例如,他们正在研发一个代号为“巨兽(Behemoth)”的超大型模型,其主要用途就是通过蒸馏产生更实用的模型 。事实上,Meta的Maverick模型(一个领先的多模态模型,文本性能与顶级文本模型相当,但尺寸更小)的卓越性能,很大程度上就得益于从类似“巨兽”这样的预训练大模型中蒸馏而来 。扎克伯格兴奋地表示:“蒸馏简直就像魔法,你基本上可以用20分之一大小的模型,获得其90%或95%的智能,而这个小模型运行起来更便宜、更高效。”    

两位CEO都看到了普及这种能力的巨大价值。目前,能够进行复杂模型蒸馏或操作超大规模模型的实验室数量有限 。他们希望通过构建强大的基础设施和易用的工具,让全球更广泛的开发者都能从这项技术中受益,不仅能从单一模型蒸馏,未来甚至能混合匹配不同模型的优势,创造出前所未有的应用 。萨提亚强调,关键在于降低门槛,提升迭代速度,确保开发者能够快速适应和采用最新的模型进展,而不是被过去的成果所束缚 。   

扎克伯格还提到,模型形态(shape)的设计也与目标硬件和应用场景紧密相关。例如,Llama 4每个专家网络170亿参数的设定,就是为了在Meta广泛使用的H100芯片上高效运行 。而开源社区对更小模型的需求也非常旺盛,比如Llama 3的80亿参数版本(8B)就非常受欢迎 。Meta也在研发更小的“小小驼(Little Llama)”版本,以满足在笔记本电脑、手机等终端设备上运行的需求 。这种将大模型的智能灵活地灌注到各种形态因子(form factor)中的能力,被认为是未来AI发展的核心趋势之一 。

萨提亚也补充说,业界正在积极探索混合模型(如稀疏混合专家网络MOE与稠密模型的结合)以及能够根据需求调整思考时间/延迟的“思考模型(thinking models)”,以期达到性能与效率的最佳平衡 。   

九、 文档、应用与网站的界限消融:AI时代的新范式(这部分就是我们在开篇论述过的问题)

然后,萨提亚分享了一个非常深刻的洞察,源自比尔·盖茨一直在微软内部推崇的思考:"比尔总是让我们思考文档、应用程序和网站之间的区别到底是什么。"

在AI时代,这些界限正在迅速模糊。"现在当你使用Meta AI、ChatGPT、Copilot等工具时,很难分清聊天会话和文档之间的界限。"萨提亚以自己的工作流程为例:"就在今天,我阅读关于Llama 4所有模型的资料时,实际上是通过一系列聊天会话,然后把内容添加到Pages文档中保存。有了代码补全功能,你还可以把它变成一个应用。"

"这种从高层次意图开始,最终得到一个“有活力的产物”——过去我们会称之为应用程序——的过程,将对工作流程产生深远影响。"萨提亚认为,我们正处于这种转变的开端。"作为基础设施和工具的构建者,同时也是使用者,我的梦想是超越这些人为创造的类别界限。"

他进一步解释:"这些界限主要是因为软件工作方式的局限性而产生的。为什么Word、Excel、PowerPoint要分开?为什么不能是一个统一的东西?我们尝试过多次整合,但现在你真的可以想象这种统一了——你可以从Word开始,像Excel一样可视化数据,然后呈现出来。它们都可以作为一个数据结构持久化。这种过去不够强大的可塑性现在已经实现了。"

十、GDP增长的新引擎:AI作为生产要素的历史性机遇

当讨论转向AI的宏观经济影响时,他认为,如果AI要带来生产力的大幅提升,就必须反映在GDP的显著增长上。"对我们来说,这是一个相当关乎生存的优先事项。世界需要一种新的生产要素,让我们能够应对面临的诸多挑战。"

他提出了一个大胆的思考实验:"想象一下,如果发达国家能实现10%的增长率会怎样?这可能是工业革命高峰期才有的增速。"要实现这一目标,"你必须在每个领域都实现生产力提升:医疗保健、零售、广泛的知识工作,以及任何行业。"

萨提亚认为AI有这样的潜力,但真正的挑战在于实施:"这不仅需要软件创新,还需要管理变革。人们必须以不同的方式使用AI。"他引用了电力革命的经典案例:"电力存在了50年,人们才意识到必须真正改变工厂的设计才能充分利用电力。福特的案例研究就是著名的例子。"

"我们现在处于某个中间阶段,"萨提亚说,"我希望不会花50年时间。但如果我们只是把AI当作'无马马车'来思考,也无法实现真正的飞跃。这不仅仅是技术问题。技术必须进步,但你还需要将其整合到系统中,真正实现新的工作方式、工作产出和工作流程。"

扎克伯格幽默地回应:"我们都在投资,仿佛这不会花50年时间。所以我希望确实不会那么久。"

十一、 拥抱未来:AI时代的乐观精神与开发者使命

在对话的尾声,扎克伯格邀请萨提亚分享他对AI未来发展以及未来几年开发者机遇的展望,特别是他最为乐观和兴奋的方面 。   

萨提亚引用了鲍勃·迪伦的歌词:“你要么忙着生存,要么忙着消亡(either you're busy being born or you're busy dying)”,并表示“忙着新生总是更好” 。他认为,尤其在当前这个时代,最令人乐观的是,即使面临各种约束,软件,特别是以AI这种新形态出现的软件,依然是我们拥有的最具可塑性的资源,可以用来解决那些棘手的难题 。   

萨提亚鼓励开发者积极投身其中(用国内最近两年流行的话,就是躬身入局),并创造出实际的解决方案 。无论是企业内部积压的IT需求,还是现实世界中尚未解决的复杂问题,都需要新的方法来应对 。他认为:“这正是所有这些技术的最大益处所在,而这最终将取决于开发者们能否勇往直前地去实践。”    

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询