logo
咨询企业版

技术分享行业科普

Palantir 本体论爆火,图数据库成为工程实践的最佳技术

本文根据 NebulaGraph@方扬,在社区 AI+Data MeetUp 上的演讲整理。文末附 PPT 下载链接、直播回放。

✨推荐阅读

别再卷大模型了:Palantir 告诉我们,AI 的进阶是“本体论”


从去年 DeepSeek 发布到现在,基本上每天我们都能接收到新东西——AI的发展实在是太快了。作为一家数据库厂商,说实话我们自己也很焦虑。我们一直在想:在AI时代,我们应该做什么样的事情,才不至于落后?


01 图技术驱动 AI 理解世界

前几天我跟社区沟通时,发现了一个很神奇的事情:最近有非常多的大厂主动来找我们。我们一开始还以为,是我们的市场和运营突然做得特别好了。

后来一分析,原因很简单——这半年多,美国的 Palantir 太火了

这家公司最开始火,是因为帮助抓住了本拉登。而现在,它的市值已经达到了 3500 亿美金, 2025 年的营收大概是 40 多亿美金。

就是 Palantir 的爆火,带动了一大批SaaS公司都在向它靠齐。

那 Palantir 最核心的东西是什么呢?本体论。

所以我今天带来的话题就是:以本体论重构数据,通过图技术驱动 AI 理解世界。


02 数据才是企业真正的护城河

AI 领域现在无外乎几块:算力、模型、数据,还有一个最近很火的 Harness.

Harness‌ 直译为“马具”,在 AI 领域指包裹在大模型外围的一整套‌全链路执行与治理系统‌。

算力,基本上是一个资本问题——有钱就能用到很好的算力。模型,迭代非常快。对大多数企业来说,更多的是去用它,而不是自己去做它。

那对于企业来说,真正核心的是什么?是它的私有化数据。

为什么私有化数据这么重要?因为它有三个独特的特点:

  • 独占性:不可复制,每个行业的数据都不一样。
  • 累积性:越积越多,越积越好。
  • 反馈性:越用越好,可以不断完善。

所以,拥有好的数据,就能帮助企业持续领先。


03 AI 在生产制造环节的渗透率只有 24%

我们现在用AI,基本上是在两端:

  • 研发端:写代码非常爽
  • 营销端:写推文、写营销文案

但是到了生产制造环节,问题就来了——不确定性、幻觉问题、概率性问题、实时性问题

生产制造要求的是:高确定性、可重复、稳定、实时

前几天我参加了一个会议,华为分享了他们在AI领域的经验:AI目前主要应用在研发和销售两端,生产制造的比例只有24%。这个比例非常低。

为什么?核心原因我们认为还是数据的问题


04 拥有数据 ≠ 数据被组织好了

很多企业存在这些问题:

  • 碎片化:数据分散在不同系统,缺少统一视图。
  • 弱语义:字段含义需要人工解释,机器不理解。
  • 歧义性:同一个字段在不同系统中口径不一样。举个例子,我司常开玩笑说“我们的目标是 Be Rich”,但每个人对“富裕”的定义都不一样——我觉得 1000 万就富裕了,老板觉得得至少得有一个亿。
  • 随意性:同一个信息在不同系统里名字不一样。我们看过中国移动的系统,同一个客户 ID,有的地方叫 customer_id,有的叫 user_id,有的就叫 id.
  • 不显性:业务经过翻译和映射,难以直接关联。

所以,对企业来说,最难的不是有没有数据,而是数据有没有被组织成稳定的、含有业务语义的结构。


05 本体论到底是什么?

Siri 联合创始人 Tom Gruber 给出的定义:本体论是对某一领域共享概念模型的形式化、明确化描述。

左边是一堆数据——账户表、订单表、交易记录。右边通过本体论重新组织后,你看到的是:客户是什么样的、商品是什么样的、用户行为是什么样的。它把数据组织成了知识

以前你看到的是表,是系统中心的物理视角。现在你看到的是业务视角——工厂、人员、设备……它描述的是事理,而不只是事实。


06 本体论不新鲜,为什么现在突然火了?

本体论这个概念已经几十年了。金融行业的朋友可能知道,IBM 以前推过 FSDM,还有 FIBO——这些都是企业里数据组织的良好定义。

那为什么现在 AI 时代,本体论变得如此重要?

因为这是我们第一次进入了一个“必须让机器理解世界”的时代。

过去,语义被藏在了人脑里、藏在报表里、藏在流程里。搞不定的,我们可以靠人肉翻译、口口相传。

但现在完全不够了。我们不再需要机器只是计算,我们需要机器去理解。我们需要的不再是信息系统,而是认知系统——理解、推理、决策。

诉求变成了:从数据驱动到语义驱动,从能理解到机器理解,从预定义系统推理到开放、变化的系统推理。


07 Palantir 的操作本体论实践

Palantir 的核心架构分三层:

  • 底层:数据层
  • 中间层:Foundry——本体论的管理和抽象
  • 上层:AIP——AI应用的构建

它的核心思想是:让业务用户和系统以统一的「对象语言」操作数据,不需要理解底层数据库结构。

几个关键概念:

  • 对象类型:把数据表映射成“客户”“订单”“资产”,屏蔽技术细节
  • 关系链接:定义对象之间的关系,跨数据源自动关联
  • 操作动作:把业务操作绑定到本体对象,触发下游系统更新
  • AI 接入层:让大模型通过本体理解语义,Agent 用自然语言查询和操作知识图谱

Palantir 的 CEO 说:本体论是我们一切的核心,不可破坏。它的核心价值就是两个词:理解操作

  • 理解:统一语言、全景视图,打破部门壁垒,形成 360 度视图
  • 操作:不仅仅是查询,还允许回写(Write-Back)、决策编排、模拟仿真

08 透过现象看本质:本体就是图模型

我们做图的,看到这些东西非常兴奋。为什么?

本体论打通了业务模型与数学模型之间的语义鸿沟。图技术打通了数学模型与物理存储之间的实现鸿沟。

你看,哲学本体论里的实体、关系,对应到工程实践里的对象、链接,再对应到图数据库里的节点、边——完全是一一映射的。

所以,虽然很多人讲本体论下面不一定是图模型,但我认为:图的存储,是最好的能够承接本体论工程实践的存储系统。


09 图技术让本体可计算、可推理、可进化

那图数据库能做什么呢?以 NebulaGraph 为例:

  • 原生图存储:基于属性图模型,支持文本、时间、空间、向量等多种数据类型,天然承载本体中的类、实例和属性。
  • 多跳关系遍历:高效实现本体中的继承、传递等关系推导。
  • 动态 Schema:支持灵活演进,业务变了,Schema 跟着变,不需要迁移数据。
  • 推理集成:支持相似度计算、关系预测、标签传播,在本体之上实现隐式关系发现和知识补全。
  • GQL 模式查询:用(a)-[r]-(b)这种直觉化的方式查询,接近人类认知。
  • 实时更新:支持本体实例和关系的实时增量更新,保证推理和决策中的数据一致性。

10 哪些企业最迫切需要本体论破局?

不是所有企业都需要一股脑往上冲。但如果你在以下五项里命中三项以上,建议现在就开始考虑:

  1. 平台型企业:用户、商家、内容、行为在多个触点重复出现。
  2. 强监管行业:不仅要给结论,还必须解释对象关系、决策路径和责任边界。
  3. 复杂运营网络:上下游、事件流、规则层持续耦合,字段视角不够用了。
  4. 高异构系统:结构化数据、事件、文档、规则同时存在。
  5. 高推理成本:人能理解,但系统一直在拼写档案。

11 本体论的整体架构

这是一个简单的本体论整体架构图:最底层是数据源,上面通过抽取和映射进入原生图存储,再上面是本体层,接着是 API 接口,供给 AI、BI、决策引擎等使用。


12 企业本体论转型的四个阶段

第一阶段:业务本质建模梳理企业核心实体与承诺逻辑,建立初步的词汇一致性,补齐语义技术短板。关键是聚焦高价值业务域,做局部概念建模试点,消除多义词和同义词。

第二阶段:打破数据孤岛建立标准化知识工程流程,构建覆盖全企业的本体数据,建立数据映射,让数据流动起来。

第三阶段:知识迭代通过深度关联查询、链路预测、标签推导,自动化补全知识图谱,实现知识体系的持续更新。

第四阶段:智能化驱动对接大模型,支持可解释的企业级智能问答;配置推理规则引擎,实现全企业的隐形风险自动预警;建立闭环反馈机制,让 AI 生成的新知识沉淀回本体底座。


13 最后

我们最近还在探索基于本体的自动特征发现,结合大模型在做一些事情。随着本体论的不断演进,知识会越来越丰富,质量会越来越好,基于知识的业务决策也会越来越准、越来越高效。

祝愿大家的公司都能像 Palantir 一样,做到 3500 亿甚至更大的市值。

谢谢大家!


✨Q&A 精选

Q:图数据库跟关系型数据库、国产数据库相比,区别和好处是什么?

A:我认为,图数据库最核心的优势是,它是最贴近人的自然理解的

从哲学(研究世界本质)到工程实践,再到物理存储,图是一一映射的。这意味着你在解决业务问题时,不需要把业务逻辑拆解成各种表、各种 join,直接用“它是什么”来定义就好了。

另外,现在很多数据库都在往多模方向发展,PG 最新版本也在往图的方向走。这本身是对图的一个认可。但我们是图原生的分布式数据库,查询效率和分布式能力会比 PG 更强。

Q:除了风控、营销,有没有一些小众的场景?

A:我们看到的场景其实挺多的。金融领域做营销推荐和风控,互联网电商也是营销推荐,电信运营商做设备管理和数据血缘。

还有一个很有意思的能源行业。电网里有一个非常重要的计算叫潮流计算,用来解决电的调度问题。电越来越重要,建议大家以后买股票可以多看看能源方向。(仅为方老师推荐,本星云仔如实记录,不承担任何风险责任( ゚∀ ゚)o彡゚)


PPT下载💡

https://discuss.nebula-graph.com.cn/t/topic/17457

商务咨询☎️

联系我们 - 腾讯问卷