由于编制先组式的主题词表需要一段相当长的时间,同时还要编制一系列的标引细则,这将会影响报刊索引数据库主题标引工作的迅速展开。因此,可以采取后控式编制词表的方式,即首先应确定一段时间为实验期,先进行地方文献的标引工作,由标引人员直接从报刊所载的地方文献信息内容中,选取有检索意义的关键词作为主题词,这种主题词是未经过规范的自然语言,也无词间关系可言,待积累了一定数量之后,再对其进行修改、充实,并参照《汉语主题词表》使之规范化,确定好词间关系和基本范畴,从而形成适用的词表。采用这种方式编制词表,比较适合于特殊类型文献主题词表的编制,并且选词更直观、专指性强,还能使标引工作与编制、修改词表同时进行,标引时不用考虑词间关系及查表抽词,所以对标引人员的要求也相对较低。目前,广东省中山图书馆的地方文献数据库系统主题标引就采用了这种方法。
地方文献主题词表中所收录的主题词来源主要有:
(1)《汉语主题词表》中已有的词汇。这是地方文献与非地方文献都使用的综合性词汇,它占将来的西北地方文献主题词表所收录词汇的绝大部分,由于是从《汉语主题词表》中选词,所以它们是相对规范的。
(2)《汉语主题词表》中没有的、带有地方文献特征的词汇、这部分词汇在未来的西北地方文献主题词表中所占比例不会很大,但它们在西北地方文献标引中出现频率相对较高,对于这部分词汇必须经过一段时间的数量积累,再加以规范。
(3)《汉语主题词表》作为阶段性产品,它的编制受时间的限制,对于编表以后新产生的一些词汇它不可能收录。在编制西北地方文献主题词表时要收录这部分词汇,并加以规范。
2.2 主题词字段的设置
无论是先有词表,还是先进行标引工作,在报刊数据库中,都需要设置若干个主题词字段,以便展开具体的标引工作。在设置主题词字段时,一定要反映地方文献的时空特征。地方文献的基本性质是地方史料,即所有的历史事件都离不开时间、地点和人物这几个因素,为了强调这几个因素,也为了使不同标引人员在不同时期内具有相同的工作标准,因此设计了“非控主题词”、“年代主题词”、“地域主题词”、“个人主题词”和“团体主题词”字段。
2.2.1 非控主题词
为了充分揭示文献内容和满足用户的使用需求,西北地方文献报刊索引数据库的主题标引,应根据主题法的一般原则,对所有的款目进行主题标引。此字段选词灵活性大,标引内容十分广泛,可控性弱,故称“非控主题词”。非控主题词对所有地方文献信息的内容范畴进行涵盖,也是以后编制地方文献主题词表时确定词表基本范畴的依据。
非控主题的标引方法与其它非地方文献资料的标引并无本质的不同。在标引非控主题词的过程中,标引人员除从文献题名中选取词汇外,还有必要从文章内容中选取标引词,所选的标引词是一些名词及词组。由于所选的词汇不是从固有的词表中抽出来的,标引词汇的逻辑概念和词间关系都不用事先确定,故称自由词。
尽管非控主题标引时选用的是自由词,但也有一些问题需要明确,在某些词汇不能准确表达文献的内容时,可选用词组来做主题词增强其专指性,能明显反应地方文献特征的词首选,同时,一些无实际检索意义的词不选。
2.2.2 可控主题词
由于“年代主题词”、“地域主题词”、“个人主题词”、“团体主题词”这四个字段相对规范,所以称为“可控主题词”。
地域主题所标引的不是整体地方文献的地域,而是文章内容涉及的某一具体区域的名称,或者给文章内容带来影响的区域名称。在标引中,如遇到旧有的行政区划名称或旧地名时,为反映某一地区名称的历史发展沿革,应将现行行政区划名称与旧有行政名称同时标引作为检索点,现有行政区划名称或新地名标在前面,旧行政区划名称或地名注于其后,可用括号括起。
年代主题标引的是文献内容所涉及的时间范围,而不是文献撰写或出版发行的时间。清以前的历朝历代均可使用“朝代/年号”的方法标引,中华民国时期(1919年前)可标引成“民国时期”,到了1920年以后可标引成“二十年代”、“八十年代”等。
