3.2 非相关文献知识发现法及其在中医医案研究中的应用 由于中医医案是中医临床医师实施辨证论治过程的文字记录,相互之间几乎互不引用,两篇中医医案相互独立,也就是非相关的,这符合非相关文献的定义。但是其中蕴含的医理可能是一致的,这为非相关文献知识发现法在中医医案研究中的应用提供了基础。Arrowsmith系统是实现非相关文献知识发现的软件工具,其主要功能是:从两类非相关文献数据库记录的标题、主题词及文摘当中,提取自然语言并加以分析排列,找到能表达两类非相关文献间关联性的概念、词语等,供研究人员参考。我们完全可以借鉴和参照Arrowsmith系统,结合相关技术研究最新进展,研制可处理中医医案的软件系统。有研究者[23]提出了非相关文献知识发现法在中医研究中的应用需要依赖的几项关键技术。非相关文献知识发现软件系统本身并不复杂,但是实现在中医医案研究中的应用同样需要依赖几项关键技术。
3.2.1 中医医案数据库的建立 面对浩若烟海的中医医案文献,面对因时代变迁而造成众多歧义的中医药概念及词汇,中医医案数据库的建立是需要首先解决的问题。中医医案一般没有标题、主题词及摘要,甚至某些中医医案本身就带有摘要性质。同时中医医案形式、体裁、风格、内容的多样性也使中医医案数据库的建立成为困难。我们可以采用先易后难的策略,先从较规范的现代医家医案入手,最终建立中医医案数据库。
3.2.2 中医药学中文文本自动分词和词性标注系统研制 实施中医药古文献的自动切分与标注,需要一个高性能的切分标注软件。近年来,中文自动分词技术,无论是自动分词的算法方面,还是词表的研制方面,都取得较大进展,技术已经日益成熟。将这些技术应用于中医医案研究当中还需要做一些软件实现或集成的工作。但同时,中医疾病病名、药名、度量衡混乱,亟需稳定化、标准化[24],中医理论术语的模糊性等,也是软件设计中要解决的问题。
3.2.3 停用词表研制 因为中医语言的多义性与模糊性,有一些无意义的语词,或者是在特定研究领域内无意义的语词,应该列入停用词表,在抽词的过程加以删除,降低运算的复杂程度,提高结果的准确性。但停用词与停用范围的确定本身也是个要解决的问题。
4 结语
章太炎先生指出:“中医之成绩,医案最著。欲求前人之经验心得,医案最有线索可寻,循此钻研,事半功倍。”要挖掘中医宝库,就要总结前人经验,研究其学术思想;要提高临床疗效,要升华形成新的理论,以推动中医药学科的整体发展。因此,有必要认真研究中医医案。我们有理由相信,随着知识发现技术方法在中医医案研究中的应用,中医药学一定有着更广阔的未来。
【参考文献】
1 Zhang XP. Study on traditional Chinese medical case records. Beijing: China Press of Traditional Chinese Medicine. 1995: 1. Chinese.
张笑平. 中医病案学. 北京: 中国中医药出版社. 1995: 1.
2 Liu GS, Xu QH, Wang CM. Brief discussion on medical case records, medical saying and medical discussing. Shandong Zhong Yi Yao Da Xue Xue Bao. 1997; 21(5): 381?384. Chinese.
刘更生, 徐庆会, 王长美. 医案、医话、医论说略. 山东中医药大学学报. 1997; 21(5): 381?384.
3 Hu JB, He L. Effects of the changes of medical case records' content on the development of traditional Chinese medicine. Wannan Yi Xue Yuan Xue Bao. 1992; 11(1): 59?61. Chinese.
胡剑北, 何玲. 医案内容变化对中医学发展的影响. 皖南医学院学报. 1992; 11(1): 59?61.
4 Hu JB. Exploring the study of some problems in medical case records. Wannan Yi Xue Yuan Xue Bao. 1991; 10(4): 264?265. Chinese.
胡剑北. 医案中若干问题的讨论. 皖南医学院学报. 1991; 10(4): 264?265.
