云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

大带宽_数据库系统教程施伯乐_

小七 141 0

2001年,W3C财团之父timberners-Lee说:"语义网是当前网络的一个扩展,在这个扩展中,信息被赋予了明确的含义,使计算机和人们能够更好地协同工作。"。自论文发表以来,语义网的发展已经迈出了以网络标准的形式表示知识的第一步。下一个阶段,最近,随着机器学习方法的出现,正在启用大量的应用程序,大数据前景怎么样,同时保持知识与图形方面的概念:知识图形(KG)。

这些应用程序的共同点是它们从KG的表达能力中获得的杠杆和动力提供。在工业场景中,所谓的工业4.0,语义技术为流程自动化、风险管理甚至整个工厂的监控产生业务价值。Building DigitalTwin提到了一个用例,它使用KGs来集成和表示知识,以便创建真实建筑的完整虚拟副本,并最终运行用于设施管理的应用程序。外部知识的集成用于增加内部数据,以发现利益冲突,保持关键绩效指标的正常运行,通常用于检测前所未有的风险。工业制造的可靠性和安全性要求提高了对共享术语、标准和最佳实践的需求,这些术语、标准和最佳实践卷绕在一个巨大的国际机构(如ISO、IEC、ETSI)和国家组织的公认术语数据集(140千克)中,以及相应的一个在医疗保健或金融,似乎是全面的所有可能的知识结构,形成可能的所有方面的业务领域。退伍军人在运营、开发、销售和商业方面收集的专业知识(术语)以可计算的形式提供,下载返利,可用于机器学习、分析等。为了实用和实用,一公斤的质量之一是它的大小,越大越好。ETLs、BI系统被用来大规模地从不同的数据源中提取价值,但是遗留数据库中孤立的复杂性对这种集成来说是一个公开的挑战。特定于域的数据库可能包含数千个表,这些表具有复杂的关系和命名,这种情况并不少见,因为不可能理解。领域专家的不可用和文档的缺失,是其他一些因素,为新人物进入组织开辟了道路,知识专家,在业务需求、问题和数据之间架起桥梁的人程序集,但它们是从原始的非结构化数据中自动提取的。后者实际上是规范,提供了大部分免费和专有的数据量。例如,亚马逊Alexa和苹果Siri使用的有5500万个实体的Wikidata,完全是通过一系列信息检索技术挖掘Wikipedia建立起来的。图形数据库强调实体之间的关系,它们的排列非常简单。在它们的基础上只建立了一个单一的数据结构,三重:

一方面可以看作是表格数据的概括,另一方面可以看作是比键值存储更具表现力的语言。当关系数据库引用一个字段来表示其唯一的行标识符时,行业大数据,这种关系在图数据库中不会丢失任何语义,同时数据可以有目的地排列,而不需要任何预定义的模式。虽然在工业4.0本体中,共享模式非常受欢迎,但在更通用的KG(如DBPedia)中,底层模式还不是一个先决条件。简单的基于三元组的结构与软件原理有一些共同点,特别是与可组合性,或者换句话说,数据结构的充分性,以包括其他KG并扩展在其上运行的应用程序的范围。KG越包容越好。

订单元模型、订单实例和客户网络

闪光的不全是金子。维护一个可行的KG不仅仅是注入信息,还需要执行保持数据集一致性的特定例程。以一个国家的总统为例,他被指派给一个人一段有限的时间。曾经有好几个人当过总统,但现在,只有一个人负责,他/她将担任总统直到任期结束。KG维护人员应该使用一些限制或规则来确保这些约束。在不介绍与KGs推理相关的话题的情况下,我会提出这样一个想法,即除了上述基于时间的限制外,维护者还可以通过挑选在公共选举中得分最高的候选人来推断新总统,或者根据法规,在众议院进行封闭式选拔。由于维护时间序列数据在图形中可能看起来不自然,动态KG一点也不不同寻常。

我将提出一个关于KG的一般、简洁、非正式、非教条主义的定义:

概念是现实世界中感兴趣的实体,关系是这些实体之间的边界。

KG真正知道什么?

在这篇文章中,我简要介绍了什么是KG,它的范围以及为什么它对信息服务组织有用。但代表知识只是画面的一部分。我们应该更关心一个系统实际拥有多少知识,而不是如何表示这些知识,而不仅仅是把什么放到一个图中。当知识转向理解时,云从,它创造了可观察的行为,而这种行为是归因于该系统的解决问题的能力。

一个有趣的类比是乐谱,这是实际知识表示的样子。