共 20 条
大量网络游记文本中热度地名提取方法与实证研究
被引:24
作者:
李照航
[1
]
郭风华
[2
]
李仁杰
[1
,3
]
傅学庆
[1
,3
]
严正峰
[1
,3
]
机构:
[1] 不详
[2] 河北师范大学资源与环境科学学院
[3] 不详
[4] 河北省科学院地理科学研究所
[5] 河北省环境演变与生态建设实验室
[6] 不详
来源:
关键词:
网络游记文本;
热度地名;
ATF*PDF模型;
多样本集合共现;
D O I:
暂无
中图分类号:
F592 [中国旅游事业];
F224 [经济数学方法];
学科分类号:
0701 ;
070104 ;
摘要:
探讨网络游记文本中的地名使用特征及其研究意义,地名使用状态的定量特征能够反映游客对旅游地景观的认知结构与旅游行为的一般过程。在现有中文分词技术基础上,结合游记文本中的地名使用特点,选用ATF*PDF方法计算特征词汇在整个旅游文本集中使用状态的综合权重,设计了一种基于大量网络游记文本的热度地名自动提取方法,为不使用自定义地名库的旅游地理研究奠定了基础。以游客点评网游记为样本的实验证明,该方法能够实现旅游相关地名的快速提取,地名使用热度越高,提取准确率越高;对地名提取结果的类型结构分析发现了自然和人文旅游地游记在词汇使用方面的共性和差异,指示了旅游文本地名的分布意义及其对旅行过程其他信息解读的潜在价值,预示了网络游记文本在进一步解析旅游者的旅游地认知特征和旅游行为过程方面的科学意义。
引用
收藏
页码:68 / 73
页数:6
相关论文