撰文:Techub News 整理
导语
近日,在云计算和数据平台公司 Databricks 组织的对话中,AI 前沿公司 Anthropic 的联合创始人兼 CEO Dario Amodei(达里奥·阿莫代)与 Databricks 的联合创始人兼 CEO Ali Ghodsi 展开了一场深度对谈。双方宣布了将 Claude 系列模型深度集成至 Databricks 平台的战略合作,并围绕企业如何利用 AI 构建竞争优势、AI 智能体(Agents)的未来形态、数据与模型的协同、以及行业共同关心的安全与治理问题进行了深入探讨。Amodei 不仅是 Anthropic 的掌舵人,也是 AI 安全与能力扩展领域的深度思考者,他的观点为理解下一代企业级 AI 应用提供了重要视角。
摘要
- AI 的未来形态将是智能体(Agents),它们能够主动操作工具、访问数据并完成任务。
- 企业专有数据是其在AI时代构建“不可替代价值”和竞争护城河的核心资产。
- 数据治理、安全和隐私是AI在企业落地,特别是在医疗等受监管行业的关键瓶颈。
- 开源与闭源模型将长期并存,模型本身的能力和伴随的风险比其开源属性更重要。
- 模型上下文协议(MCP)旨在成为连接AI模型与外部工具/数据的通用“粘合剂”或“USB-C”。
AI的宏伟蓝图:从治愈疾病到赋能经济
对话伊始,Ali Ghodsi 请 Dario Amodei(达里奥·阿莫代)分享他对AI未来的愿景。Amodei 提到了他此前撰写的文章《充满慈爱与恩典的机器》,并表示撰写此文源于一种“挫败感”——他认为许多人对AI积极面的想象不够具体和宏大。
Amodei 以其生物学背景为例,强调了生物医学创新将是AI产生最大影响的领域之一。他认为,当今人类面临的许多复杂疾病(如癌症、神经退行性疾病)本质上是“复杂系统疾病”,而AI在分析海量数据、模拟生物过程方面具有独特优势,有望帮助我们攻克这些难题。他提到,一家制药公司拥有的数据和待解问题,正是AI可以大显身手的领域。
当然,Amodei 相信AI的影响将遍及整个经济。通过与 Databricks 的合作,他们将接触到各行各业的公司,AI将得到广泛应用。他展望的未来是:社会不仅因生产效率提升而改变,更将因人类健康水平的飞跃和解决长期困扰问题的能力增强而发生根本性变革。
对于这一未来的时间表,Amodei 持审慎乐观态度。他认为,基础技术可能在“未来几年,甚至一两年内”就绪。真正的挑战在于,如何将这些技术和想法快速推广至全社会,尤其是让那些离技术创新较远的行业部门能够跟上并应用。这正是需要企业合作和市场推广的地方,也是 Anthropic 与 Databricks 此类合作的价值所在。
数据:企业AI时代的终极护城河
当话题转向企业如何为AI未来做准备时,两位CEO达成了强烈共识:数据是企业最关键的战略资产。
Amodei 区分了两种数据:一是用于训练基础模型的大型数据集,这显然至关重要;二是特定行业、公司或客户的专有数据。他认为后者同样,甚至更为关键。无论是制药、金融还是科技公司,它们都拥有大量外部无法获取的专有数据。AI模型无法知晓它未曾接触过的事实,因此,这些独家数据是模型为企业创造独特价值的源泉。
Amodei 列举了利用这些数据的多种方式:对模型进行微调;让模型直接在数据上操作和行动;通过检索增强生成(RAG)等技术将数据引入上下文;或者构建能在数据上运行的智能体(Agents)。他强调,正是这些专有数据,在AI公司与拥有数据的企业之间构建了“不可替代的价值”,这种价值无法被任何一方单独复制。Anthropic与Databricks的合作,核心之一就是更高效地将强大的模型与企业的数据资产结合起来。
Ali Ghodsi 对此深表赞同,并补充道,他观察到最有意思的企业AI用例,往往都围绕着客户独有的、长期积累的特殊数据展开。这些数据构成了企业的保护层,也是他们应该进行创新的地方——利用Anthropic提供的模型,结合自身数据,催生独特的创新。他总结道:“这就是AI将产生真正影响的领域。”
智能体(Agents)是AI的主流未来
Amodei 明确表达了他的观点:“AI的未来主要就是智能体。” 他认为,模型将越来越多地以智能体的形式运行。Anthropic已经在此方向进行了探索,例如去年发布的“计算机使用”演示,模型可以接收电脑截图并采取行动;以及最近发布的 Claude Code,一个专注于编程的早期智能体。
智能体将使用各种工具,其中之一便是以多种方式访问数据——通过数据库、各类搜索等。Amodei 预见,在双方的合作中,这将产生巨大的协同效应。Ali Ghodsi 分享了两个具体用例:电信巨头 AT&T 利用双方的技术,分析其海量无线用户数据来检测欺诈;支付公司 Block(原 Square)则利用生成式AI,让商户只需通过对话即可完成店铺配置,极大简化了流程。
Amodei 进一步介绍了 Claude Code。它本质上是使用 Claude 3.7 Sonnet 模型的一种特定方式,回归了命令行工具的理念,易于与 Git 等工具集成。用户可以要求 Claude 编写代码、创建拉取请求(PR)等。虽然它会请求用户许可才在电脑上执行操作,但已经展现了早期智能体的强大能力。发布仅数日,就有近十万人尝试使用,许多企业也表现出浓厚兴趣,这充分显示了编码模型和智能体的潜力。
模型上下文协议(MCP):AI的“通用连接器”
谈到如何让模型更好地获取上下文和数据时,Amodei 重点介绍了 Anthropic 推出的模型上下文协议(Model Context Protocol, MCP)。他们发现,在模型自身与它们需要完成的常见任务(如集成工具、访问数据)之间,似乎缺少一个标准的“连接件”。这些任务本质上相似,但具体实现每次都不同。于是他们思考:这不正是 Claude 自己可以解决的好问题吗?
因此,MCP 应运而生,它如同一种“粘合剂”,将模型与其需要访问和使用的事物(如数据、工具)连接起来。Amodei 透露了一个有趣的现象:MCP 在发布几个月后,最近几周兴趣度突然“爆炸式”增长,几乎成了社交媒体上的一个热门话题。他认为这说明了人们已经发现了它的实用性。
Ali Ghodsi 证实 Databricks 正在采用 MCP,将其平台内的所有信息通过此协议暴露给大语言模型(LLMs)。Amodei 将 MCP 比作“AI时代的USB-C”,一种灵活、可塑的通用连接器。他相信MCP将在双方的合作中扮演重要角色,因为它无缝连接了两家公司的技术栈,并希望它能被业界广泛采用。
治理、安全与信任:不可忽视的“非技术”瓶颈
随着AI深入企业核心业务,尤其是涉及敏感数据的医疗、金融等行业,数据治理、安全和隐私成为无法绕过的话题。Amodei 指出,虽然让模型达到足够的智能水平以辅助药物研发、分析临床试验数据是一大技术挑战,但往往阻碍进展的,是那些“在技术人员看来有点‘愚蠢’,但从商业角度却至关重要”的问题。
“我们能确保数据不泄露吗?我们能确保遵守所有必要的法规吗?”——Amodei 强调,如果这些问题得不到解决,它们可能会让整个进程停滞数年,从而也推迟了那些本可挽救生命的疾病疗法的问世。因此,以正确的方式治理数据至关重要。
Ali Ghodsi 分享了 Databricks 的相似经历:他们推出的数据治理产品 Unity Catalog 如今已成为公司的头号研发重点和人员投入最多的领域。他感慨道,任何涉及数据的业务,另一面必然是隐私和治理,因此 Databricks 在某种意义上也是一家隐私和安全公司。
Amodei 补充了至关重要的一点:信任。 客户必须信任合作伙伴会做正确的事,并值得托付他们的数据。Anthropic 和 Databricks 都致力于建立并维护“可信赖”的声誉,两家公司的联合提供的不仅仅是一个产品组合,更是一个客户可以信赖的解决方案。
开放与开源:能力与风险并存的世界
针对业界长期争论的开源与闭源模型之争,Amodei 提出了他的见解。他认为,无论是从商业还是安全角度,开放与封闭的区分都被“有点夸大”了。
他指出,当前的模型尚未具备他所担忧的那些重大风险(尽管他认为这些风险正在快速临近)。在现阶段,无论是闭源模型还是开源模型,都能繁荣发展,并以不同的方式推动科学和产业进步。当模型变得更为强大时,风险(如国家安全风险)将会显现。但关键在于模型本身非常强大,因此我们必须以某种方式应对这些风险,或许应对开源和闭源模型风险的方式略有不同,但开源与否从来不是他最看重的因素。
Ali Ghodsi 追问,既然开源模型可能持续存在(例如 DeepSeek 等),那么这些模型最好是在“这里”(意指在健康的监管和竞争环境下)被开发出来。Amodei 对此表示认同:“在所有条件相同的情况下,我认为这可能是正确的。”
推理模型与扩展定律的演进
最后,对话触及了AI前沿的技术话题。关于 Anthropic 近期强调的推理模型(Reasoning Models)与经典预训练扩展定律的关系,Amodei 表示两者都是公司的关注重点。
他提到,推理模型和普通预训练都显示出遵循扩展定律的强劲回报。Anthropic 在推理模型上并非第一个进入市场,但他们认为自己“做得正确”。他们引入了“混合推理模型”,用户可以告诉模型思考多长时间,可以在同一套模型权重上开启或关闭推理模式。“就像人类一样,”Amodei 比喻道,“我没有一个大脑用来回答简单问题,另一个大脑用来回答难题。我只有一个大脑,我只是根据问题决定需要思考多仔细、花多少时间。”
对于推理模型的扩展定律是否不同,Amodei 认为,扩展定律的基本动态保持不变,但所“扩展”的对象会随时间略有变化。无论是Transformer架构的微调,还是从人类反馈的强化学习(RLHF)变为现在的“推理训练”(本质上仍是具有不同目标的强化学习),扩展定律本身“未被击败”,它持续有效。如今,公司往往同时扩展多个方面,并将它们叠加起来。
关于推理能力的泛化性,Amodei 指出,这取决于扩展的是什么。Anthropic 在发布 Claude Sonnet 3.7 时,有意减少了在数学竞赛等狭窄、专业化任务上的投入,因为这些任务的泛化性不强。他们专注于更广泛的任务,发现虽然泛化并不完美,但这导致了比专注于数学竞赛更好的整体泛化能力。
在对话结尾,Ali Ghodsi 总结了此次合作的意义:企业用户现在可以在 Databricks 的模型服务、智能体框架、向量搜索和 RAG 等功能中,直接使用 Claude 模型。双方都对这一旨在加速企业AI创新与落地的伙伴关系充满期待。




