【从知识库到知识图谱的推理之路】第三章 知识抽取与图谱构建(Knowledge Extraction Graph Construction) (一)
3.1 结构化数据映射(RDB2RDF / ETL)关系型数据库(RDB)仍是企业核心数据的载体。将 RDB 数据映射为 RDF 知识图谱,是知识工程中最基础、规模最大的环节。该过程不仅涉及语法层的格式转换,更涉及语义层的模式对齐、实体消歧与增量维护。3.1.1 关系数据库到 RDF从关系模型到图模型的映射,国际标准化组织 W3C 提出了两条互补的技术路线:直接映射(Direct Mapping)与基于映射语言的自定义转换(R2RML/RML)。前者追求自动化与无配置,后者追求语义精确与可定制。3.1.1.1 直接映射(Direct Mapping):外键即边、表即类的自动转换核心思想W3C 的 Direct Mapping 规范(2012)定义了一种从关系数据库到 RDF 的默认、无配置转换规则:将表(Table)视为类(Class),将行(Row)视为资源实例,将列(Column)视为数据属性,将外键(Foreign Key)直接转化为对象属性(即图谱中的边)。形式化定义设关系数据库模式为 $S$ ,包含表集合 $\{T_1, T_2, \dots, T_n\}$ 。对任意表 $T$ 的一行 $r$ ,其主键为 $PK(T)$ ,则该行对应的 IRI 由如下模板生成:$$IRI(r) = \text{baseURI}/T/PK(T)/r[PK(T)]$$
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2570188.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!