应用分类树模型筛选恶性肿瘤危险因素的研究

被引:23
作者
张勇晶
陈坤
金明娟
范春红
机构
[1] 浙江大学公共卫生学院流行病学与卫生统计学教研室
关键词
分类树模型; 乳腺肿瘤; 危险因素; 卡方自动交互检测法;
D O I
暂无
中图分类号
R73-31 [肿瘤学调查与统计];
学科分类号
摘要
目的介绍分类树模型筛选恶性肿瘤危险因素基本原理、运算法则和应用价值。方法以浙江省嘉善县乳腺癌现场调查数据为例,采用Exhaustive CHAID法建立分类树模型对调查结果进行危险因素筛选,使用错分概率Risk值和ROC曲线下面积对模型进行评价。结果分类树模型从全部105个候选变量中筛选出9个危险因素,其中职业是最重要的影响因素,工人、教师及退休人员的乳腺癌发生概率显著高于其他人员。另外,模型显示经常参加体育锻炼在不同人群中对乳腺癌的影响效果有所不同。模型错分概率Risk值为0.174,利用预测概率绘制的ROC曲线下面积为0.872,与0.5比较具有显著的统计学意义,模型拟合效果很好。结论分类树模型不仅可以有效挖掘筛选出主要的影响因素,还可以对研究变量科学定义分界点,展示变量间复杂的相互作用,在流行病学研究中具有较高的应用价值。
引用
收藏
页码:540 / 543
页数:4
相关论文
共 5 条
  • [1] 女性乳腺癌危险因素研究进展
    吴家刚
    方亚
    [J]. 医学与社会, 2005, (01) : 16 - 18
  • [2] 武汉地区女性乳腺癌危险因素的病例对照研究
    韩定芬
    马骏
    周新
    邱晖
    方黎
    黄姝
    [J]. 中华流行病学杂志, 2004, (03) : 78 - 82
  • [3] 体力活动与乳腺癌发生的关系
    张子豹
    高尔生
    武俊青
    De-kun LI
    [J]. 生殖与避孕, 2003, (05) : 291 - 298
  • [4] 乳腺癌危险因素综合评价及其趋势预测
    方亚
    施侣元
    [J]. 中华流行病学杂志, 2003, (07) : 79 - 82
  • [5] 婴幼儿死亡危险因素的研究——兼论CHAID方法的原理及应用
    石玲
    王燕
    [J]. 中国卫生统计, 2002, (05) : 28 - 30