数据、信息、知识:三者有什么区别
在人工智能、知识表示和知识图谱的学习中“数据”“信息”“知识”是三个最基础的概念。它们彼此相关但并不相同。只有区分这三者才能进一步理解为什么计算机不能只存储数据还需要组织信息、表达知识并最终构建知识图谱。一、什么是数据数据Data是对客观对象或现象的符号化记录是计算机可以直接存储和处理的内容。数字、字符、文本、图像、音频、表格记录等都可以看作数据。例如1872Claude MonetImpression, Sunrise一张数据表中的某一行记录这些内容都可以被采集、存储和传输但如果脱离具体语境它们本身未必能够直接说明自己表示什么。因此数据强调的是记录形式。它回答的是“记录了什么”而不是“它意味着什么”。二、什么是信息信息Information是具有明确语义Semantics的数据。当数据被放入一定语境能够表达某个对象、属性、状态或事件时数据就成为信息。例如1872 只是数据“莫奈于 1872 年创作《日出·印象》”则是信息。因为在后一句中数字、名称和对象之间形成了明确含义读者能够理解它所表达的内容。信息的特点主要有三点1有语义能够表达某种内容2可传递能够被记载、交流和传播3依赖语境同样的数据在不同场景中可能表示不同信息。因此信息比数据更进一步。数据只是被记录下来而信息则是在一定语境中可被解释的数据。三、什么是知识知识Knowledge是经过组织、关联和加工后的信息体系。如果说信息是“有意义的陈述”那么知识就是“彼此联系、能够被利用的陈述结构”。例如下面几条内容分别是信息梵高创作了《星夜》。《星夜》创作于 1889 年。《星夜》收藏于纽约现代艺术博物馆。梵高是后印象派画家。当这些信息围绕“梵高”“《星夜》”“后印象派”“博物馆”等对象被组织起来并形成较稳定的对象关系结构时它们就不再只是零散信息而构成了知识。知识的关键不在于“内容更多”而在于1信息之间存在联系2结构较为清楚3可以被检索、复用和利用4在一定条件下能够支持推理Reasoning。因此知识强调的是关系、结构和可用性而不只是信息数量的增加。四、数据、信息、知识之间的关系三者可以理解为一个逐层提升的关系数据 → 信息 → 知识它们之间的区别可概括如下1数据符号化记录2信息有语义的数据3知识被组织和关联的信息。下面这个例子可以直观看出三者差异• 数据Claude Monet、1872、Impression, Sunrise• 信息莫奈于 1872 年创作《日出·印象》• 知识莫奈 — 创作 — 《日出·印象》《日出·印象》 — 创作时间 — 1872 年莫奈 — 属于 — 印象派画家从这个过程可以看出数据是基础信息是带有意义的数据而知识是在信息基础上形成的结构化内容。需要注意的是这种递进关系并不是自动发生的。数据要转化为信息依赖语境解释信息要转化为知识依赖组织、关联和建模。五、知识不等于信息的堆积信息数量很多并不等于已经形成知识。如果若干条信息彼此孤立没有明确关系没有统一结构也没有组织方式那么它们仍然只是分散的信息而不是知识。知识之所以高于信息主要在于以下几点。1、关联性知识强调对象之间的联系而不是单条陈述的孤立存在。2、结构性知识不是杂乱堆积而是按照一定方式组织起来的内容体系。3、可利用性知识不仅能被读取还能被检索、比较、匹配和调用。4、可推理性当知识被清楚表示后系统可以在已有内容基础上发现新的关系或结论。因此知识不是“信息积累到一定数量后的自然结果”而是信息经过筛选、组织、关联和表示之后形成的更高层次内容。六、为什么人工智能更关心知识人工智能Artificial IntelligenceAI当然离不开数据但在许多智能任务中它真正需要的不只是大量原始记录而是能够支持理解、推理和决策的知识。原因主要有三点。1、机器需要结构化地表示对象只有把对象、属性和关系组织起来系统才能较稳定地表示和处理现实世界中的事物。2、机器需要依据知识进行推理知识不仅保存事实还能支持规则匹配、关系发现和结论生成。3、智能应用需要知识支撑搜索、问答、推荐、辅助决策等任务本质上都更依赖“有关联的知识”而不只是原始数据。也正因为如此现代人工智能系统越来越重视知识表示、知识组织和知识图谱构建。七、从数据到知识图谱知识图谱Knowledge Graph建立在“数据—信息—知识”的层次递进之上。它不是简单存储数据的仓库也不是零散信息的集合而是把信息组织为网络化知识体系的一种方式。在知识图谱中• 实体Entity表示对象• 属性Attribute表示对象特征• 关系Relation表示对象之间的联系这样分散的信息就被组织为可查询、可扩展、可推理的知识网络。这一递进关系可以用下图表示因此知识图谱并不是对数据的简单替代而是在数据、信息、知识逐层提升基础上的一种进一步形式化表达。 小结数据是符号化记录信息是有语义的数据知识是经过组织和关联的信息体系。数据强调可存储信息强调可理解知识强调可利用、可推理。知识图谱正是在此基础上把知识进一步结构化和网络化。“点赞有美意赞赏是鼓励”
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2498547.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!