学术探索
学术期刊
学术作者
新闻热点
数据分析
智能评审
中文歌词的统计特征及其检索应用
被引:18
作者
:
郑亚斌
论文数:
0
引用数:
0
h-index:
0
机构:
清华大学计算机科学与技术系
郑亚斌
论文数:
引用数:
h-index:
机构:
刘知远
论文数:
引用数:
h-index:
机构:
孙茂松
机构
:
[1]
清华大学计算机科学与技术系
来源
:
中文信息学报
|
2007年
/ 05期
关键词
:
计算机应用;
中文信息处理;
歌词;
齐夫定律;
k-近邻;
节奏;
D O I
:
暂无
中图分类号
:
TP391.1 [文字信息处理];
学科分类号
:
120506
[数字人文]
;
摘要
:
我们在歌词上做了一些传统的自然语言处理相关的实验。歌词是歌曲语义上的重要表达,因此,对歌词的分析可以作为歌曲音频处理的互补。我们利用齐夫定律对歌词语料库的字和词进行统计特征的考察,实验表明,其分布基本符合齐夫定律。利用向量空间模型的表示,我们可以找到比较相似的歌词集合。另外,我们探讨了如何利用歌词中的时间标注信息进行进一步的分析:例如发现歌曲中重复片段,节奏划分,检索等。初步的实验表明,我们的方法具有一定的效果。
引用
收藏
页码:61 / 67
页数:7
相关论文
共 2 条
[1]
用于文本分类的改进KNN算法
[J].
论文数:
引用数:
h-index:
机构:
王煜
;
论文数:
引用数:
h-index:
机构:
王正欧
;
白石
论文数:
0
引用数:
0
h-index:
0
机构:
沧州市城建档案馆
河北大学数学与计算机学院
白石
.
中文信息学报,
2007,
(03)
:76
-82
[2]
A vector space model for automatic indexing.[J].G. Salton;A. Wong;C. S. Yang.Communications of the ACM.1975, 11
←
1
→
共 2 条
[1]
用于文本分类的改进KNN算法
[J].
论文数:
引用数:
h-index:
机构:
王煜
;
论文数:
引用数:
h-index:
机构:
王正欧
;
白石
论文数:
0
引用数:
0
h-index:
0
机构:
沧州市城建档案馆
河北大学数学与计算机学院
白石
.
中文信息学报,
2007,
(03)
:76
-82
[2]
A vector space model for automatic indexing.[J].G. Salton;A. Wong;C. S. Yang.Communications of the ACM.1975, 11
←
1
→