共 15 条
中文网络聊天语言的奇异性与动态性研究
被引:8
作者:
夏云庆
[1
]
黄锦辉
[2
]
张普
[3
]
机构:
[1] 清华大学信息技术研究院
[2] 香港中文大学系统工程系
[3] 北京语言大学网络教育学院
来源:
关键词:
计算机应用;
中文信息处理;
网络聊天语言;
奇异性;
动态性;
语言信息处理;
D O I:
暂无
中图分类号:
TP3-05 [计算机与其他学科的关系];
学科分类号:
0812 ;
摘要:
随着互联网走入社会生活,网络聊天逐渐成为一种新的沟通渠道,网络聊天语言便应运而生。这类语言的日益丰富,给语言信息处理带来了新的挑战。研究发现,困难主要来自网络聊天语言的奇异性和动态性。本文借助真实网络聊天语言文本,对网络聊天语言的奇异性和动态性进行详细分析和归纳,并设计了面向解决奇异性和动态性问题的网络聊天语言文本识别与转换方法。我们先以网络聊天语言语料库为基础建立网络聊天语言模型和语言转换模型,通过信源?信道模型实现网络聊天语言向标准语言的转换。但该方法过于依赖网络聊天语言语料库,虽然能较好解决奇异性问题,但不能处理动态性问题。因此,我们进而以标准汉语语料库为基础建立文字语音映射模型,对信源?信道模型进行改进,最终有效解决了网络聊天语言的动态性问题。
引用
收藏
页码:83 / 91
页数:9
相关论文