阅读: 4
一、语义Web
1.1 语义Web
语义Web或语义网(Semantic Web)由WWW的创始人Tim Berners-Lee于2000提出[1][2],并于2001《科学美国人》杂志发表论文“ The Semantic Web”[3]。作者在文中这样描述“语义网不是一个独立的网络,而是当前的这个网络的显示的数据的能力将会大大提高,这样语义网建设的进展就将有助于创造出引人注目的全新功能。”
语义Web的提出,主要原因是HTML仅仅用以表示数据显示的布局,HTML所表达的页面信息和组织方式,主要面向用户直接阅读,没有将信息的表现形式、内在结构和表达内容相分离,没有提供计算机可读的语义信息,因而非常不利于计算机直接阅读和处理。到上世纪90年代中期,随着XML的出现,将数据的内容与布局区分开来,为语义更丰富、更自然的网上内容表达打开了新的局面。语义网的目标是:为Web上的信息提供具有计算机可以理解的语义,从而满足智能代理(Agent)对Web上异构、分布信息的有效检索和访问,实现网上信息资源在语义层上的全方位互联,并在此基础上,实现更高层的基于知识的智能应用。
目前,对于语义Web,已经形成一套较为完整的理论体系,Extended Semantic Web Conference国际会议从2004年开始第一届,一直延续到现在[4]。
上图中部分概念解释如下:
RDF (Resource Description Framework)资源描述框架
SPARQL (Query Language for RDF), 资源描述框架的查询语言
OWL (Ontology Web Language 本体网络语言
SKOS (Simple Knowledge Organization System)简单知识组织系统
这里,Ontology(本体,本体论)的概念很抽象,下面稍作解释(不感兴趣的读者请略过)。
1.2 Ontology(本体,本体论)
简单地说,本体Ontology是格式规范的、对客观实体本质的抽象描述, 是对某一领域可共享的、通用的理解,其目标是使知识能够在人与人之间、人和系统之间、以及各种异构系统之间进行广泛的交流。本体的形式化和结构化可以为交流、可重用性和知识组织提供了更好的工具和理解。
Ontology 的概念最早源于亚里士多德(公元前384-322年)对事物存在本质的研究,在哲学上的定义为“对世界上客观存在物的系统地描述,即存在论”,是客观存在的一个系统的解释或说明,关心客观现实的抽象本质[6].
在语义网中,Ontology可以起到如下的作用:
(1)本体可以在不同的建模方法、范式、语言和软件工具之间进行翻译和映射,以实现不同系统之间的互操作和继承。
(2)从功能上来讲,本体和数据库有些相似。但是本体比数据库表达的知识丰富得多。首先,定义本体的语言,在词法和语义上都比数据库所能表示的信息丰富得多;最重要的,本体提供的是一个领域严谨丰富的理论,而不单单是一个存放数据的结构。
(3)本体是领域内重要实体、属性、过程及其相互关系形式化描述的基础。这种形式化的描述可成为软件系统中可重用和共享的组件。
(4)本体可以为知识库的构建提供一个基本的结构。以描述对象的类型而言:有简单事实及抽象概念,这些可以描述成一个本体们主要描述的是事物或概念的条件,本部分别以这些组成部队之间静态联系;本体也可以描述事物或概念这类结构去表达现实世界中浩如烟海的知识和常识。
(5)对于知识管理系统来说,本体就是一个正式的词汇表。本体可以将对象知识的概念和相互间的关系进行较为精确的定义、在识积累、知识共享的效率将大大提高,真正意义上的知识重用和知识共享也能成为现实。
(6)本体适合表示抽象的描述。而企业模型是人们对企业或者企业的某些模型的抽象描述,因此在企业逻辑建模中,本体的使用可以帮助我们清楚地理解企业特定领域的相关元素、关系和概念,让知识表达更加准确便捷,帮助人们进行更好的企业决策。
二、基于语义Web的Web3.0
2006年,万维网的发明者伯纳斯·李(Tim Bernes-Lee)提出了Web 3.0的概念[7],他认为Web3.0的核心是“语义网”,其愿景是语义网能够使用本体论(Ontology)分析互联网上的所有数据,允许机器在没有人工干预的情况下处理许多任务,语义网是关于数据集成的。语义网通过使用元数据将“仅显示”数据转换为有意义的信息[8]。自2007年起,逐渐出现了基于语义网的Web3.0相关文献。而纽约时报记者John Markoff则提出,Web3.0应该是智能Web,相当于AI+Web2.0[9],这一说法也得到了一些人的认可。此后的一段时间,直到现在,学术界提到的Web3.0,大多是基于语义网的。一些基于语义网的Web3.0论著有:论文“Embracing ‘Web 3.0’”2007、专著“PULL- the power of the Semantic Web to transform your business” 2009出版(中译本《Web 3.0: 互联网的语义革命》,科学出版社2013)、论文集《Wisdom Web of Things》springer2016、《Knowledge Management and Web 3.0》德国de Gruyter出版社2022、2020年Future Generation Computer Systems期刊出版了名为“Data Exploration in the Web 3.0 Age”的特刊。
本文所讨论的Web3.0均指基于语义网的。
2.1 Web3.0特点
基于语义Web的Web3.0具有如下特点[10] [11]:
1) 语义Web——它是Web3.0的关键,使机器易于处理数据。
2) AI——AI是影响Web3.0技术流行的主要关键因素之一。它使机器通过大量的Web数据变得更加智能,以满足用户的需求。
3) 3D图形——Web3.0已经超越了它的前辈,因为它的三维技术,它提供了一个比2D更现实的三维在线世界。
4) 无处不在——同时存在或无处不在的概念,移动设备的兴起日益增加,许多人更容易随时随地访问互联网。
5) 开放性和互操作性,这指的是在应用程序编程接口、数据格式、协议和设备与平台之间的互操作性方面的开放性。
6) 全球数据存储库,这是一种跨程序和跨网络访问信息的能力。
一言以蔽之,基于语义Web的Web3.0的核心特点就是机器可以作为独立的参与者。在Web1.0和Web2.0,信息(内容)的生产者和消费者都是人,在Web3.0,机器也与人类一样成为了主体,成为了生产者和消费者。
2.2 Web3.0赋能
具备相关的技术和能力后,Web3.0可赋能如下应用[13]:
- Web服务
- 基于代理的信息收集和分发
- 搜索引擎
- 商业智能
- 电子化学习与研究
- 精准营销
这些应用,大多与知识(内容)相关,涉及到知识获取、知识管理、知识应用。
2.3 Web3.0面临的问题和挑战
如前述,Web3.0具有强大的功能,可以赋能很多的应用。但是其技术实现方面存在一些难点,如[13]:
- 本体的构建
- 证明和信任标准化(自动利用、整合数据抽取信息)
- 国际化(语言问题)
此外,技术也是双刃剑,它既可以被正当使用,也可能被攻击者恶意使用,因此,Web3的应用也会带来一些问题,如:
- 未经授权的访问敏感信息
- 超文本垃圾邮件
- 身份窃取和社交网络钓鱼
- 自动启动指令和恶意脚本注入
事实上,以语义网为基础的Web3.0,经过了10多年,依旧没有实现。主要原因是人工智能的发展还达不到相应的水平。
三、Web1-3演进
Web1-3演进,最明显的区别是,在Web1.0,用户只读静态网页;Web2.0,可读可写;而Web3.0,用户不仅可读、可写,而且可执行。另外,如前述,Web2.0时代,可以说是Web on Everything;到Web3.0时代,可以说是Web of Everything或Web of Things(有点类似于物联网Internet of things),因为机器也可以读、写和执行web内容,机器成为信息的生产者和消费者。表1列出了Web 1.0、Web 2.0和Web 3.0的简单对比。
表1 Web 1.0, Web 2.0, and Web 3.0特点对比[14]
Web 1.0 | Web 2.0 | Web 3.0 |
Read | Read and write | Read, write, and execute |
Client server | Peer to peer | Portable personal Web |
HTML portals | XML, RSS | RDF |
Companies own | Communities share | Individuals |
Web pages | Web applications | Semantic applications |
文献[15]对Web1-3进行了颇为详细的分析,图3为我们在文献[15]Fig.1基础上修改完善而成,(注:虽然文献[15]讨论的是基于区块链的去中心化Web,参见《去中心化Web,Web3流派二》,然其Fig.1中Web3部分基本不涉及区块链相关内容,更多的是语义Web相关,因此,我们将对比内容放在本节。)
参考文献
[1] The Semantic Web , https://www.w3.org/2000/Talks/0516-sWeb-tbl/all
[2] Tim Berners-Lee, Weaving the Web: The Original Design and Ultimate Destiny of the World Wide Web,ISBN-13 : 978-0062515872
[3] https://www.scientificamerican.com/article/the-semantic-Web/
[4]https://2022.eswc-conferences.org
[5] Mini research Semantic Web
[6]本体(Ontology)综述,http://imarine.blog.163.com/blog/static/51380183200861373316920
[7] Tim O’Reilly,December 13, 2021,https://www.oreilly.com/radar/why-its-too-early-to-get-excited-about-Web3/
[8] 蔡维德,Web 3.0:新型网络时代来临
[9]NYT Markoff: Web 3.0 = AI + Web 2.0,https://ebiquity.umbc.edu/blogger/2006/11/11/nyt-markoff-Web-30-ai-Web-20/
[10]《Knowledge Management and Web 3.0》P11, 2022
[11] E-LEARNING 3.0 = E-LEARNING 2.0 + WEB 3.0?
[12]《Knowledge Management and Web 3.0》ISBN 978-3-11-072264-2. 2022 ,P104
[13] Defining Web 3.0 opportunities and challenges2016
[14]《Knowledge Management and Web 3.0》ISBN 978-3-11-072264-2. 2022 ,P60
[15] Blockchain for decentralization of internet: prospects, trends, and challenges, Cluster Computing (2021) 24:2841–2866,https://doi.org/10.1007/s10586-021-03301-8
上述情形之外的任何使用形式,均需提前向绿盟科技(010-68438880-5462)申请版权授权。如擅自使用,绿盟科技保留追责权利。同时,如因擅自使用博客内容引发法律纠纷,由使用者自行承担全部法律责任,与绿盟科技无关。