|
什么是文献的特征(1)
文献的外表特征与文献是一一对应的,即一组外表特征只对应一篇唯一的文献,而文献的内容特征与文献却是一种模糊的对应关系,即一篇文献有多个主题词(关键词)或分类号,一个主题词(关键词)或分类号也可对应多篇甚至几百篇文献。正因为存在这两种对应关系,使得两种特征的用途大不相同。利用外表特征只能检出很少的文献,有时只用于特定情况下(如已经知道作者名等)。利用内容特征一次能检出一批文献,这对研究者来说是极其有用的。
一篇文章、一本书、一份报告等一般都有以下特征:
(1)外表特征:题目、作者、作者工作单位,专利和科技报告还有专利号或报告号等,这些可以表征一篇特定文献的特征可以在文献的封面或扉页,即不打开书本,或不看文献的具体内容就可以确定一篇文献。
(2)内容特征:假如我们深入到文献内容中间,则可以发现还可用另外两种方法来表征它:
A. 一般,一篇文献都是论及某一方面的特定问题的,也就是说,与论题相关的词出现的频率较大。以前的研究表明,无论哪一种类型的文献,若对文献中出现的词进行频率统计的话,会发现所有的词可分为三类
- i. 文献中出现频率最高的词是冠词、介词和连词等,即其本身没有具体含义的词,如 a 、 an 、 the 、 this
、 that 、 or 、 and 、 in 、 on 、 with 等;
- ii. 绝大部分词在文献中出现的频率较低;
-
iii. 在文献中出现的频率既不高也不低的词,在文献中约 3-20 个之间,这些词恰恰是与文献的主题相关度较大的词,我们称之为文献的主题词或关键词。主题词或关键词即称为文献的主题特征
, 其与文献的关系可用下图示出:
(未完待续)
|