学术探索
学术期刊
新闻热点
数据分析
智能评审
立即登录
深加工中古汉语语料库建设的若干问题
被引:10
作者
:
化振红
论文数:
0
引用数:
0
h-index:
0
机构:
南京师范大学文学院
化振红
机构
:
[1]
南京师范大学文学院
来源
:
西南大学学报(社会科学版)
|
2014年
/ 40卷
/ 03期
关键词
:
中古汉语;
汉语史;
语料库;
分词规范;
切分原则;
词类划分;
D O I
:
10.13718/j.cnki.xdsk.2014.03.004
中图分类号
:
H109.2 [古代汉语];
学科分类号
:
摘要
:
根据中古汉语的基本特点,结合现有语料库的建设经验,阐述中古汉语语料库选取语料的若干原则:语料样本的代表性、文本类型的平衡性、语料之间的关联性与区别度、入库文献的特色性;讨论建立中古汉语语料库分词规范、分词词表的可行性,初步构建"信息处理用中古汉语分词规范"的整体框架。
引用
收藏
页码:136 / 142+184 +184
页数:8
相关论文
共 8 条
[1]
中文分词十年回顾
黄昌宁
论文数:
0
引用数:
0
h-index:
0
机构:
微软亚洲研究院
微软亚洲研究院
黄昌宁
赵海
论文数:
0
引用数:
0
h-index:
0
机构:
香港城市大学
微软亚洲研究院
赵海
[J].
中文信息学报,
2007,
(03)
: 8
-
19
[2]
语料库加工中的规范问题——谈《信息处理用现代汉语词类标记集规范》
靳光瑾
论文数:
0
引用数:
0
h-index:
0
机构:
教育部语言文字应用研究所
靳光瑾
郭曙纶
论文数:
0
引用数:
0
h-index:
0
机构:
教育部语言文字应用研究所
郭曙纶
肖航
论文数:
0
引用数:
0
h-index:
0
机构:
教育部语言文字应用研究所
肖航
章云帆
论文数:
0
引用数:
0
h-index:
0
机构:
教育部语言文字应用研究所
章云帆
[J].
语言文字应用,
2003,
(04)
: 16
-
24
[3]
信息处理用现代汉语词类标记集规范
[J].
语言文字应用,
2001,
(03)
: 16
-
20
[4]
汉语语料库的建设及应用[M]. 上海外语教育出版社 , 郭曙纶, 2011
[5]
智能信息处理[M]. 科学出版社 , 郑家恒, 2010
[6]
吕氏春秋词类研究[M]. 华夏出版社 , 殷国光著, 1997
[7]
四时纂要校释[M]. 农业出版社 , 韩鄂 著, 1981
[8]
中文信息学报 . 2002
←
1
→
共 8 条
[1]
中文分词十年回顾
黄昌宁
论文数:
0
引用数:
0
h-index:
0
机构:
微软亚洲研究院
微软亚洲研究院
黄昌宁
赵海
论文数:
0
引用数:
0
h-index:
0
机构:
香港城市大学
微软亚洲研究院
赵海
[J].
中文信息学报,
2007,
(03)
: 8
-
19
[2]
语料库加工中的规范问题——谈《信息处理用现代汉语词类标记集规范》
靳光瑾
论文数:
0
引用数:
0
h-index:
0
机构:
教育部语言文字应用研究所
靳光瑾
郭曙纶
论文数:
0
引用数:
0
h-index:
0
机构:
教育部语言文字应用研究所
郭曙纶
肖航
论文数:
0
引用数:
0
h-index:
0
机构:
教育部语言文字应用研究所
肖航
章云帆
论文数:
0
引用数:
0
h-index:
0
机构:
教育部语言文字应用研究所
章云帆
[J].
语言文字应用,
2003,
(04)
: 16
-
24
[3]
信息处理用现代汉语词类标记集规范
[J].
语言文字应用,
2001,
(03)
: 16
-
20
[4]
汉语语料库的建设及应用[M]. 上海外语教育出版社 , 郭曙纶, 2011
[5]
智能信息处理[M]. 科学出版社 , 郑家恒, 2010
[6]
吕氏春秋词类研究[M]. 华夏出版社 , 殷国光著, 1997
[7]
四时纂要校释[M]. 农业出版社 , 韩鄂 著, 1981
[8]
中文信息学报 . 2002
←
1
→