当前位置:巨优公文网>范文大全 > 公文范文 > 数据挖掘技术在藏医中的研究综述

数据挖掘技术在藏医中的研究综述

时间:2022-11-26 10:05:10 公文范文 来源:网友投稿

摘要:藏医药学是我国极具民族特色的医药学科之一,在藏族人民漫长的生产、生活实践中,其系统的理论和独特的临床疗效及用药特色,为藏族人民繁衍生息、保障生命健康做出了重要贡献,越来越多的人开始注意到藏医药学科的发展。

但是由于藏医药事业发展起步晚、起点低、底子薄,和其他医药学科相比还存在很大的差距,所以对藏医药事业的科学化研究迫在眉睫。

虽然数据挖掘技术已经在传统医学如:中医药学科上得到了广泛地应用,如聚类算法、关联规则算法、分类算法。但由于藏医和中医有着诸多临床诊疗上的差距,使得对于藏医药的研究中不可完全套用中医数据挖掘的方法。文章主要总结常用的数据挖掘技术及近年来数据挖掘技术在藏医药上的发展及前景展望。

关键词:藏医诊疗 数据挖掘 分类聚类 关联规则

1常用的数据挖掘技术

1.1数据预处理

数据预处理占到数据挖掘60%的时间,良好的数据预处理是得到有效挖掘结果的重要前提。现有的数据预处理技术主要包括数据清洗、数据采样、特征处理、特征选择和降维。

由于医疗数据的特点,一方面数据获取比较困难,往往获得的数据往往会存在缺失、冗余等问题。另一方面,医疗数据中包含很多患者信息,需要做各种脱敏处理,否则会侵犯患者的个人隐私。

如对藏医中慢性萎缩性胃炎诊疗数据进行数据预处理,包括对数据中的缺失值进行填充、对不符合常理的数据进行删除,对样本数据进行采样,减少因数据类别不平衡对结果的影响。对特征进行处理,数据主要是数值型和类别型的数据,常用的方法有归一化和标准化、log数值域的变化、数据离散化、orie-hot编码等。对数据进行降维和特征提取等,从而达到压缩数据维度、减少规则冗余度的目的,从而提高症型分类和预测的准确率。

1.2关联分析算法

R.Agrawal等首先提出了经典的频繁项集挖掘方法AIS,Apriorl[6]算法;J.S.Park等对关联规则算法进行改进提出DHP算法有效的减小了频繁候选集的规模;同年,Savasere提出基于划分的关联规则算法减少算法对数据集的扫描次数,大大的提高了算法的效率;之后R .Wille提出了基于概念格的挖掘算法等,随着时代的变化关联规则算法也在不断地演变改进。

关联规则分析在医疗数据研究中发挥着重要的作用,用于挖掘症状和症型之间的潜在关系,发现“症状症状、症状 症型”等数据中的内在联系,寻找临床数据隐藏的价值,让医生能更好的对患者进行诊断,可以为分类和预测做辅助作用是症型的预测和分类研究中的重要环节。

1.3分类算法

目前数据挖掘中常用的分类算法有SVM算法(SupportVector Machine),决策树算法(Decision Tree),K近邻算法,朴素贝叶斯算法,神经网络算法,以及逻辑回归(LogisticRegression)等。但是鉴于目前需要解决的问题的难度和医疗数据维度的复杂性的不断增加,传统的数据挖掘算法已经不能满足需求,由此出现了多种集成学习算法,集成学习主要分为bagging和boosting两种方式,是将某些弱学习器通过投票的方式或者取平均值的方式得出最终的结果,从而使预测准确率得到很大的提升。

2数据挖掘在藏医中应用

2.1数据挖掘在藏医辅助决策诊疗中的应用

目前对常见的高原常见病(萎缩性胃炎),藏医主要依据个人经验来对患者进行诊断,包括对患者的脉象诊断,患者的舌苔情况,患者的尿液颜色和气味及患者的症状等。脉象下包括洪、滑、紧等十七个方面,舌苔的颜色和厚度等七个方面,而尿液的情况也比较复杂,包括尿液的颜色,尿液的气味等十七个方面的判断,对于同一种疾病症状也很复杂。拿萎缩性胃炎来说,在藏医中萎缩性胃炎一般分为四个症型,不同的症型及相同的症型患者的症状和体征表现往往有很大差距。所以仅通过个人经验判断比较容易出错,需要通过科学的手段对症型和症状进行判断。

可以利用数据挖掘中无监督学习的聚类算法结合临床诊疗数据对高原常见病(萎缩性胃炎)进行合理的分型,运用数据挖掘中的关联规则算法,发现藏因临床诊疗“症状症型,症状 症状”之间隐含的规则,寻找临床数据隐藏的价值,让医生能更好的对患者进行诊断,可以为分类和预测做辅助作用是症型的预测和分类研究中的重要环节。

据统计藏医中存在着针灸和放血治疗的疾病(证候)多达489种可以利用聚类分析和关联规则分析藏医中针灸的穴位定位、穴位主治病种等。在治疗方法上,藏族医学运用不同穴位治疗的相同的疾病最多的是癫狂、昏厥、气短的疾病,对于急性发作的神志疾病、呼吸系统疾病、心脑血管疾病能起到非常独特的疗效。

2.2数据挖掘在藏医用药规律的研究

目前藏药组方规律的研究主要是在临床藥物观察、大量文献整理研究、通过各种药理实验等方面。很少有通过数据挖掘的算法进行藏医组方规律的研究,目前聚类算法和关联规则算法在藏医用药规律研究中有很好的效果,在萎缩性胃炎用药方面主要采用apriori算法对每味药进行频繁项集,置信度和支持的的挖掘,得出可信的用药的组合规律。同时可以利用无监督的聚类算法对药物进行聚类可以新处方规律的挖掘。

张艺等人在藏医脾胃病研究中利用关联规则算法对脾胃病用药得出了置信度大于0.85的治疗藏医中脾胃病的新处方,利用层次聚类算法演化得出了新的核心用药组合。

药物可能会因为在是否饱腹或者是所处的时间对治疗效果有一定的影响,王明强等人在藏医隆滞布病的用药组方规律研究中加入了时序关系挖掘,利用关联规则算法得出效果明显的加入了时序关系的药物组方规律。

3总结

近几年来逐渐开始有研究者将数据挖掘算法应用于藏医的症状症型分析和药物组方规律的挖掘中,这对藏医药科学的发展起到了很大的推动作用,目前藏医在科学性和规范性上还处于初级阶段,在这方面的研究提高了藏医症型诊断的科学性,以及用药的规范性。慢慢的推动藏医由经验主义到科学主义的演变。

参考文献

[l]王培培,健康体检数据预处理方法研究与应用[D].郑州大学,2016.

[2] Han J,Kamber M. Data Mining: Concepts and "rechniques,Morgan Kaufmann[Jl. Machine Press, 2001 (in Chinese, 2006,1(4):394-395.

[3] Dunham M H. Data Mining: Introductory and AdvancedTopicsEMl// Data mining introductory and advanced topics/.Prentice Hall/Pearson Education, 2003.

[4] Zhi-Gang J, Xu J. Research on Data Preprocess inData Mining and Its Application[J]. Application Research ofComputers, 2004, 21(7):117-118.

[5]Agrawal R, Srikant R.Mining association rules between setsof items in large databases[Al.ProcACM SIG MOD Int"I ConfManagement of dataECl.Washington DC, May 1993.207-216

[6]Agrawal R, Srikant R.Fast algorithms for mining associatioules[A].Proc 20th In"t I Conf Very Large Database[Cl.Santiago,Chile, Sept 1994.487-499

[7] Park J S,Chen M S,Yu P S.An effective hash-basedalgorithm for mining association rules[J]. Acm Sigmod Record,1995, 24(2):175-186.

[8] Savasere A, Orniecinski E,Navathe S B. An EfficientAlgorithm for Mining Association Rules in Large Databases[C]//International Conference on Very Large Data Bases. MorganKaufmann Publishers Inc. 1995:432-444.

[9] Ganter B,Godin R. Formal Concept AnalysisLMl. SpringerBerlin Heidelberg, 1999.

[10] Joachims T. Transductive Inference for Text Classificationusing Support Vector MachinesECl// Sixteenth InternationalConference on Machine Learning. Morgan Kaufmann PublishersInc. 1999:200-209.

[11] Quinlan J R. C4.5: programs for machine learning[M].Morgan Kaufmann Publishers Inc. 1993.

[12] Cover T M, Hart P E. Nearest neighbor patternclassification. IEEE Trans Inf Theory IT-13(1):21-27[J]. IEEETransactions on Information Theory, 1967, 13(1):21-27.

[13] Mccallum A, Nigam K.A Comparison of Event Models forNaive Bayes Text Classification[J]. IN AAAI-98 WORKSHOP ONLEARNING FOR TEXT CATEGORIZATION, 1998, 62(2):4148.

[14] Hagan M.T., Demuth H.B., Beale M.H.: Neural NetworkDesign. PWS Publishing, Boston (1996)

[15] Hosmer D W, Lemeshow S.Applied logistic regression[M].Wiley, 2000.

[16]王世潁.基于医疗数据挖掘的高原常见病藏医诊疗决策支持技术研究[D]青海大学.

[17]欧阳波.基于数据挖掘的藏蒙放血和灸疗法比较研究[D]北京中医药大学.

[18]张艺.基于数据挖掘和整合药理学平台的藏医治疗脾胃病用药规律及作用机制[J]中国中药杂志2018,16.

[19]王明阳,基于数据挖掘的藏医隆滞布病症状、用药规律的探索与分析[D]北京中医药大学.

推荐访问:藏医 综述 数据挖掘 研究 技术

版权所有:巨优公文网 2018-2024 未经授权禁止复制或建立镜像[巨优公文网]所有资源完全免费共享

Powered by 巨优公文网 © All Rights Reserved.。备案号:沪ICP备18054162号-1