开题报告内容:(包括拟研究或解决的问题、采用的研究手段及文献综述,不少于2000字)
结核病是严重危害人民群众健康的呼吸道传染病,是全球性的重大公共卫生问题和社会问题。 1996 年卫生部将结核病例为乙类传染病进行管理,中央财政设立了结核病控制专项经费,各级人民政府积极履行职责,不断加大投入力度,取得了显著成效,我国结核病疫情上升势头得到有效遏制。 但是我国结核病疫情依然严重,结核感染、传播和发病风险普遍存在,结核病防治工作也面临诸多困难和挑战,防治形势不容乐观。 近年来,每年报告的肺结核发病人数仍位居全国法定报告传染病前列,流动人口结核病、耐药结核病、结核菌感染患者人数呈上升趋势。 加强结核感染控制工作,是防止结核分枝杆菌在医疗卫生机构、医疗卫生人员和患者间传播的一个重要措施,是我国结核病综合性防控策略的重要内容之一。在我国结核病又具有以下两点特点:(1)结核病患病率下降极为缓慢,15 岁及以上人群肺结核的患病率仅由 2000 年的 466 /10 万下降至 2010 年的 459 /10 万;(2)肺结核疫情地区间差异较大, 西部地区传染性肺结核患病率约为中部地区的1.7倍和东部地区的2.4倍;农村地区患病率约为城镇地区的1.6倍。积极发现和治愈传染性肺结核患者,是当今结核病控制最有效、最符合成本/效益的基本控制干预措施。控制和治愈结核病,使传染源短期内失去传染性,避免多种耐药患者发生,显著减少复发和得到彻底治愈。
结核病的防治是慢性病防治的工作重点 ,有效预测结核病的发病人数及发病率, 对结核病的防治有着重大意义。因此,在结核病不断发展消退的同时,需要我们能够更加深入的了解其发展的规律,加强对疾病流行的控制,对疾病发展的趋势做出正确的提前预测。
疾病模型的构建主要是对疾病的发病率、 死亡率以及流行趋势进行预测, 但疾病的发生发展是一种复杂的现象, 必须不断纳入新兴学科知识, 来探讨疾病系统的特殊内在规律和描述方法。 随着时间的推移, 模型所得的预测值不可能完全符合今后疾病发生的实际情况, 因此, 必须根据当时的客观情况, 不断更改模型。 模型研究的不断深入, 新的理论和方法被不断地引入, 同时也可以促进新方法的产生。对疾病发病率的预测是一种前瞻性研究 , 各种方法对疾病未来发病率的预测只是科学的估计 , 原因有三点 : 一方面每一种方法都是对事物发展过程的简化和抽象 ,只能从某个角度提供相应的信息 ,不能全面揭示疾病变化的信息 ; 另一方面建模用的资料大多来自流行病学调查 ,它们缺乏客观和特异的生物学指标 ; 再一方面有很多关系复杂的因素影响疾病发生发展与消退 ,当环境变化了 ,就会使原有模型的预测效果下降 。解析结核病流行过程,分析结核病控制中存在的主要问题。对结核病控制策略进行综合评价 ; 以及对结核病疫情发展趋势进行预测。在卫生防疫工作中, 疾病预测是非常重要的部分, 是将被动预防向主动预防转化的重要环节。 无论传染性还是非传染性疾病的预测, 对这些疾病的预防有着不可估量的作用。 国内外学者对此作了大量的研究。当前, 用于疾病预测的模型很多, 但对预测方法的选择是很困难的, 因为不同预测方法在复杂性、 数据要求以及准确程度上均不同, 因此对不同的问题应采用和自身相适应的预测方法。 能否准确地预测一种疾病的发病趋势, 需要建立多种模型, 从中选出预测精度最优者。近年来, 组合预测在我国得到了一定的发展, 也将是未来研究的热点, 它具有单个模型无法比拟的优点。 但是, 组合预测仍处在发展之中, 理论上还不够完善。
当前常用的疾病预测主要有以下几种模型:(一)回归模型。回归预测法就是运用回归分析的方法,通过对大量观察数据的统计处理与分析,找出预测对象与影响因素之间的数量关系。 建立回归模型并进行预测的研究方法,包括一元线性回归预测法、多元线性回归预测法和非线性回归预测法。有季节规律的时间序列用线性或非线性回归模型进行预测容易受到随机扰动和周期波动的影响,降低了预测的精度。(二)时间序列模型。它是指一系列反映包括时间动态依存关系的数学模型,不仅可以从数量上揭示某现象与其他现象的发展变化规律或从动态的角度刻画某现象与其他现象之间的内在数量关系及变化规律性,而且能够预测与控制现象的未来行为。它最大特点之一就是其对序列平稳性的要求。对于非平稳的时间序列, 通常采用对序列进行差分,以达到平稳。(三)灰色模型。是一种用时间数据序列建立系统的动态模型,灰色模型由于其预测效果好,适应性强,广泛应用于疾病流行趋势的预测。但由于灰色模型中的指数型变化是单调的(单调上升或下降),因此长期预测的预测值就会偏高或偏低,特别随着时间的推移, 未来一些拢动因素对系统的影响,对随机性、波动性较大的数据拟合较差, 预测精度降低,这是灰色预测的不足之处。(四)Markov模型。该模型过程简明,易于操作,短期预测精度高,特别适用于有波动性改变的资料。(五)神经网络模型。以模拟生物的神经网络结构和功能为出发点, 逐渐演变成为一门对信息处理的方法学。避开了复杂的参数估计过程, 直接给出结果,简单直观, 易于操作。人工神经网络模型对复杂的大规模数据,无先验知识的资料,资料不全、用传统统计学方法无法解决或解决效果不好的问题,提供了一个全新而有效的解决途径。
对疾病数据的统计分析,需要从表面上看起来杂乱无章的数据中发现和提炼出规律性的结论, MATLAB作为一个强有力的统计分析工具,提供了专用的统计学工具箱,还可以根据实际问题的需要,建立起相应的M文件,解决更加复杂的问题。MATLAB可以在最短的时间内实现和检验我们的计算方法,通过利用MATLAB仿真软件处理统计问题可以达到事半功倍的效果。
如何对一种疾病的发病率选用最合理的分析方法,达到最佳的拟合与预测效果,或是对一种疾病的发病率选用不同的分析方法 ,从多方面了解疾病发病率的变化动向。从而为各级卫生行政部门制定正确的预防和控制政策提供科学依据。数据统计分析的研究 ,应用领域非常广泛 ,就生物医学信息与统计分析的结合而言,必然能够带来巨大的社会效益和经济效益。
参考文献
[1] Organization W H. Global tuberculosis report 2013.[J]. Global Tuberculosis Report, 2013, 6(2).
[2] 李立, 杨召, 叶中辉,等. 灰色GM(1,1)模型在结核病发病率预测中应用[J]. 中国公共卫生, 2014, 30(4).
