分类法转本体,值得吗?
一个网友问了三个问题:
1)您觉得如何从中图法的角度去构建这个本体呢,这个本体构建要达到一个什么样的程度呢?
2)这个本体用在数字图书馆中查询检索中的效率能有所提高吗?我这个课题会不会太大了?
3)还有我现在也不太清楚国内关于这块的研究到了什么一个程度,我是不是在重复别人的工作?
由于时间关系,很随意地简答了一下,如果大家有评论可以留言:
1、就知识组织角度来说,本体与中图法的形式上的差别很大,应用环境与方法也可以说几乎完全不同,虽然可以借鉴,但是推荐的做法还是以本体为主,吸收中图法关于知识/学科分类的思想。把一个分类法原原本本地翻译成一个本体,不是说做不到,而是没有必要。
传统知识组织体系的设计思路、功能、对象、用法与现在的本体是有很大区别的,有些概念没法翻译成本体,每个概念、概念间的关系都需要定义,许多模糊的概念关系需要明确,这不是个人的力量所能完成的,也不符合本体的目的。本体就是领域内使用,满足领域内知识的组织,只要在高层本体和顶层本体遵循一定的原则,将来能够组合/映射到一个更大的本体体系中去(起码采用的本体编码语言要一致,最好工具也一致)就可以了。
所以我的建议是以开发你想要的本体为目的,抽取各种分类法、分类主题词表中相关的部分,建立你的本体,而不要进行所谓转换。那样做吃力不讨好。2、本体的作用与传统情报检索系统中分类法、主题法的作用有类似的地方,就是能对于信息体起到规范控制的作用,从而保证一定的查全率和查准率。当然本体还有许多其它作用,如知识关联作用、推理作用等等。但是对于提高查询效率我看不出会有什么大的作用,相反可能还会降低查询效率(当然你如果定义查询效率包括查全查准率的话,另当别论。在我看来查全率查准率是“查询效果”)。因为现在使用本体的基本上都采用基于XML的本体语言,越来越明显的趋势是采用OWL,OWL是基于RDF的,这方面的工具、算法等都还很初级,对于效率会有影响。据说Oracle最新版在内部支持RDF/RDFS了,也是刚刚开始。
3、国内有研究,但是研究不多,许多人一毕业就去了国外,所以国外搞语义Web的华人很多,有一些也蛮有名的。这方面研究我曾经看到别人搞过,但是搞的人不多,还是值得研究的,只是首先要占有文献,调研要周全一些。Kent大学曾蕾老师是这方面权威(搞NKOS),另外王军的报告和论文也算这方面的,应该多看看他们的东西。
今年清华将主办第一届亚洲语义万维网大会,值得关注。会议网站上也可以看到一些国内的牛人。另外这里经常会有一些讨论。







414 留言,
2006年04月14日 星期五 @ 9:09 pm
上任伊始,牛刀小试。厚积薄发,凯文阳春。
xueyun 留言,
2006年04月18日 星期二 @ 9:40 pm
呵呵,今天才看到这个,多谢刘老师了:)