目的:通过流行病学调查和卫生统计的方法分析福建省人群肝癌的主要危险因素,探索建立福建省肝癌危险因素的判别分析、神经网络和决策树预测模型,分析比较三种方法的优势与不足,为预防决策提供依据。
方法:
采用以医院为基础的病例对照研究。从福州市各大医院收集2007.10至2009.07之间的肝癌新发病例(经病理确诊),组成病例组(449例)。对照组来自于与病例同一级别的福州市各大医院的非肿瘤病人(388例)。采用统一编制的调查表。运用Logistic回归方法进行单因素和多因素分析,建立福建省肝癌危险因素的判别分析、神经网络和决策树模型。数据采用SPSS13.0、MATLAB7.2、clementine11.1软件进行分析。
结果:
1.病例对照研究结果显示:病毒肝炎史、一级亲属肝癌病史、饮用沟塘水、精神刺激、月饮酒大于60两、被动吸烟是肝癌的危险因素,其中病毒肝炎史是第一危险因素,而生活开心、易适应环境为肝癌的保护因素。
2.建立福建省肝癌危险因素的判别分析函数,交互验证分类符合率为83.2%。该判别模型能够在一定程度上帮助我们从一般人群中筛选高危个体,作为我们重点干预对象,对肝癌的预防具有重要意义。
3.BP神经网络法预测结果显示:预测符合率为84.62%。说明本次训练后的神经网络模型有良好的适应性、包容性和稳定性,体现了神经网络具有很好的应用价值。
4.决策树法预测结果显示:预测符合率为89.43%。说明本研究建立的决策树模型能够较好的根据肝癌危险因素对样本进行预测和分类。
结论:病毒肝炎史、一级亲属肝癌病史、饮用沟塘水、精神刺激、月饮酒大于60两、被动吸烟是福建省人群肝癌的危险因素,其中病毒肝炎史是第一危险因素。而生活开心、易适应环境为肝癌的保护因素。实例分析表明,判别分析、BP神经网络和决策树模型对具有肝癌危险因素的样本分类正确率分别为83.20%、84.62%和89.43 %。本研究认为,根据资料的特点,适当的将三种方法联合起来,能充分利用彼此的优点,提高预测的准确率,保证分析的准确和完善。