以文本方式查看主题

-  计算机科学论坛  (http://bbs.xml.org.cn/index.asp)
--  『 Semantic Web(语义Web)/描述逻辑/本体 』  (http://bbs.xml.org.cn/list.asp?boardid=2)
----  语义网与伯纳斯·李  (http://bbs.xml.org.cn/dispbbs.asp?boardid=2&rootid=&id=27094)


--  作者:wnlyc
--  发布时间:2/9/2006 12:52:00 AM

--  语义网与伯纳斯·李
蒂姆·伯纳斯·李(Tim Berners-Lee),英国人,公认的互联网之父。1980年,当时在瑞士日内瓦欧洲粒子物理实验室(CERN)工作的伯纳斯·李,提出一个全球性的超文本系统,这个系统的前身是他在9年前所写的一个程序,程序只是用来连结文字、图像、音乐和活动影像,实现与同事相互交换资料,辅助他的物理研究;没想到后来竟成为网络上最受欢迎的传播应用方式,这就是我们熟知的万维网(World Wide Web)。

  伯纳斯·李现为麻省理工学院(MIT)的万维网(W3C)协会的主席,伯纳斯·李正致力于开发的新一代互联网叫做“语义网”(Semantic Web)。

  “60年代,国际象棋走第一步有10120种可能,用当时的计算机速度要1090年,而公认的宇宙年龄是1010年,所以有人讲,计算机下棋走第一步要走到‘世界的末日’”,现年47岁的伯纳斯·李经常向他咨询的人们阐述他最早研究人工智能的想法,“由此可见不能光靠把所有可能性存入计算机,而要研究人的思维方法,语义网络的发展是继万维网诞生后第二阶段的信息革命。”

  熟悉伯纳斯·李的人知道,他更喜欢别人称他为数学家。

  早期发展

  1968年,奎连(MR.Quillian)最早提出语义网表示法,创建解决记忆心理学模型;

  1973年,西蒙(R.F.Simon)研究小组将语义网络用来表达自然语言理解;

  直到现在,由伯纳斯·李牵头领军挚旗,语义网的发展整整35年。

  就连伯纳斯·李本人也承认,实现语义网要比万维网来得慢,“在某种程度上讲,我们也不需要走得太快,因为人们需要考虑以确定我们没有发疯,而另外的一些人们在语义网被采纳和广泛使用之前,需要在实际中对这些思想进行检验。”

  语义网,好比是数据库智能化、协调好的巨型大脑,可以解决各种难题。对“语义网”的解释,就是使机器做到人类才能做的事情。

  语义网的飞跃发展主要得益于其应用之一:机器翻译(machine translation)。

  自然语言理解研究同步于机器翻译。1946年,计算机诞生之时,美国人W.Weaver就开始研究机器翻译。最初采用依靠词典中词到词的简单映射翻译方法,实际过程中不同语言之间的翻译极其复杂,每种语言的句子的句法、语义、译词等都是多义,或有歧义,其中还有成语、熟语、习惯用法、指代、照应等,简单映射是无法解决问题,这是早期机器翻译失败的原因。

  70年代后期,语义网技术的被广泛在机器翻译中应用,首先通过分析源语歧义现象,依据平行的句法结构,等长的文本等是次要标准,然后借助语义数据库和比较词库进行消歧,使源语与目标语的语义一致,从而解决语义歧义问题,提高系统运行效率。

  2002年,机器翻译已经发展了五十六年,国际上通常以IBM公司Berger的研究报告为公认的机器翻译的译准率,该报告中,关于采用语义网表示法消歧篇章占30%左右。

  其实,语义网改变机器翻译历史进程作用也只是语义网应用的冰山一角,用伯纳斯·李的话来说,“机器翻译只是人们与语义网直接面对的一扇门,那门后将是无穷尽的数字财富。”

  初现端倪

  在语义网的构想里,网络可识别文件信息意义。例如:网页上的地方天气预报,用户一看就懂,可是机器并不知道在那么多的数字中,哪一个数字代表温度。语义网的含意就是在隐藏的编码中指明哪个数字代表温度,并且说明“温度”一词的含意。

  “近10年来,研究人员一直都在考虑这类问题,现在我们才有可能把它变成现实,”伯纳斯·李说,“语义网上的数据是真正的可以被机器处理的数据,这就是令人兴奋的所在。”

  尽管语义网主要停留在研究阶段,但在互联网上的表现是在搜索引擎中的应用。现有万维网是图像与文本的集合,语义学引入后从根本上改变万维网的性质,将信息进行解释、交换和处理,从搜索服务器端通过分散于各处理服务器中的语义分析搜索数据库,从多种来源收集机器可读数据,处理并推理出新的事实。语义网使分散于全球成百万的独立数据库融合,最终使用户独立运用在Internet上庞大的信息资源。

  就在评论家认为语义网面临永远不可能解决的社会和技术障碍的同时,智能搜索引擎的出现使他们的顾虑化为无形。其中比较典型的例子是斯坦福大学博士生Larry Page和Sergey Brin设计的GOOGLE搜索引擎,该搜索引擎技术将语义网功能发挥它最擅长的是易用性和高相关性,采用互联网综合智能来决定网页的重要性,而非传统搜索中人为主观判断。

  美国《Wired》杂志这样评价:“Google已成为用户的宠儿,因为它简单,且有效。”

  改变未来?

  虽然伯纳斯·李不宜于力的推广语义网,甚至有时歇斯底里的与不同意见者争论,持不同意见者这样形容他,“语义网已经成为他的人生目标,他在试图难翻自己的另一理论,很像抓着自己头发往上拎一样难”。

  他的同事说,“这项工作具有相当大的挑战性,这样的网如果存在的话就再好不过了,但是首先,有一些真正困难的研究问题需要被解决。”

  主要问题的是,随着系统中规则的变化,排列组合越来越多,计算机从互联网页面上数据做出推论所需要花费的时间就会急剧地增加。在数学界流传这样一个经典故事:一个推销人员确定一条穿过几个城市的最短路线,当只有极少的几个地方时,很快即可找出所有可行路线中最佳的一个,但当地点的数目变成仅仅15个城市时,可行路线将会增加为430亿条以上。同样的问题存在于利用计算机进行推断的情况,强力地搜索答案会导致陷入时间浪费的困境。

  所要解决的问题是使机器获得对储存在网络空间的数据进行智能评估的能力,为互联网上杂乱而庞大的信息设计一种架构,使它们易于查找和利用。

  即使技术问题可以解决,创建语义网的障碍仍然相当大。放在语义网开发者面前不可忽视的另一个问题是,语义网所带来的这些好处是否与付出的额外努力成正比,毕竟现在的Web已经非常地成功,

  在美国旧金山,当地互联网活跃分子把语义网称作没有社会意义的“一个有趣的学术游戏”,声称“语义网之所以引起很大的反响,仅仅是因为伯纳斯·李个人原因,因为他是万维网发明人,所以人们才会对语义网感兴趣,如果它只是由印第安纳州某个大学的一些不知名的家伙提出的话,没有人会去理睬这件事。”

  其路漫漫

  在美国,作为自然语言机器理解程序的知识表示方法,后来成为智能导师系统(CAI)的重要知识表示结构,传统教学设计专家们对语义网也很赞赏,认为十分有助于学生建立记忆结构。在医学界,语义网技术已经被应用于描述医学术语,针对各种编码方案从不同角度和目标,语义网语言对复杂的医学文档进行描述。

  另外,经过万维网协会和其他一些电脑组织推广,语义网初见成效。美国国防部高级研究计划局(DARPA)为语义网项目先后捐助了3500万美元,并为美国国防部开发了叫做DARPA代理标记语言(DARPA Agent Markup Language),这种基于语义网的语言允许用户往Web文件中加入其他类型数据,并把它连接到信息实体上。

  随着语义网基础结构的工具的出现,惠普、诺基亚等公司也加入语义网应用程序的开发。

“这是一项很具挑战性,十分困难而又具有重大意义的工作,”伯纳斯·李说,“很想尝试打败自己的感觉。”

来自http://column.bokee.com


W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
46.875ms