以文本方式查看主题

-  计算机科学论坛  (http://bbs.xml.org.cn/index.asp)
--  『 Semantic Web(语义Web)/描述逻辑/本体 』  (http://bbs.xml.org.cn/list.asp?boardid=2)
----  请问汉语语义标注的通行规范是什么?  (http://bbs.xml.org.cn/dispbbs.asp?boardid=2&rootid=&id=86581)


--  作者:viiola
--  发布时间:9/2/2010 10:09:00 AM

--  请问汉语语义标注的通行规范是什么?
现在的汉语语义标注有权威规范吗?还是各成一派没有定规?我比较迷惑,希望同学们指教。
--  作者:qxr777
--  发布时间:9/12/2010 10:12:00 PM

--  
个人觉得首先应该是中文分词组件进行分词,然后是能够从分出的词中识别出概念和实体。识别的过程中肯定会出现“歧义”,也就是一个词对应多个语义实体,这时候就需要进行“词义消歧”,从候选实体中选出标注的实体。
难点应该是在第三步,词义消歧。
一篇文档标注后的结果将是文档包含的若干个本体概念和实体作为特征项,供后续处理。
W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
31.250ms