论文检索方法——截词检索
专栏:论文写作
发布日期:2020-02-20
阅读量:24937
作者:第2导师
收藏:
截词检索就是用截断的词的一个局部进行的检索,并认为凡满足这个词局中的所有字符(串)的文献,都为命中的文献。下面以无限截词举例说明: (1)后截断,前方一致。原文检索的运算符可以通称为位置运算符。
截词检索就是用截断的词的一个局部进行的检索,并认为凡满足这个词局中的所有字符(串)的文献,都为命中的文献。按截断的位置来分,截词可有后截断、前截断、中截断三种类型。
不同的系统所用的截词符也不同,常用的有?、$、*等,大致可分为有限截词(即一个截词符只代表一个字符)和无限截词(一个截词符可代表多个字符)。下面以无限截词举例说明:
(1)后截断,前方一致。如: comput?表示 computer、 computersting
(2)前截断,后方一致。如:? computer表示 minicomputer、 microcomputers等。
(3)中截断,中间一致。如? comput?表示 minicomputer、 microcomput等
截词检索也是一种常用的检索技术,是防止漏检的有效工具,尤其在西文检索中,更是广泛应用。截断技术可以作为扩大检索范围的手段,具有方便用户增强检索效果的特点,但一定要合理使用,否则会造成误检。
3.原文检索
“原文”是指数据库中的原始记录,原文检索即以原始记录中的检索词与检索词间特定位置关系为对象的运算。原文检索可以说是一种不依赖叙词表而直接使用自由词的检索方法原文检索的运算方式,不同的检索系统有不同的规定,其差别是:规定的运算符不同;运算符的职能和使用范围不同。原文检索的运算符可以通称为位置运算符。从 RECON、ORB和 STAIRS三大软件对原文检索的规定,可以看出其运算符主要是以下四个级别
(1)记录级检索,要求检索词出现在同一记录中。
(2)字段级检索,要求检索词出现在同一字段中。
(3)子字段或自然句级检索,要求检索词出现在同一子字段或同一自然句
(4)词位置检索,要求检索词之间的相互位置满足某些条件
原文检索可以弥补布尔逻辑检索、截词检索的一些不足。运用原文检索方法,可以增强选词的灵活性,部分地解决布尔检索不能解决的问题,从而提高文献检索的水平和筛选能力。但是,原文检索的能力是有限的。从逻辑形式上看,它仅是更高级的布尔系统,因此存在着布尔逻辑本身的缺陷。