中文歌词的统计特征及其检索应用

被引：18

作者：

郑亚斌

刘知远

孙茂松

机构：

[1] 清华大学计算机科学与技术系

来源：

中文信息学报 | 2007年 / 05期

关键词：

计算机应用; 中文信息处理; 歌词; 齐夫定律; k-近邻; 节奏;

D O I：

暂无

中图分类号：

TP391.1 [文字信息处理];

学科分类号：

120506 [数字人文];

摘要：

我们在歌词上做了一些传统的自然语言处理相关的实验。歌词是歌曲语义上的重要表达,因此,对歌词的分析可以作为歌曲音频处理的互补。我们利用齐夫定律对歌词语料库的字和词进行统计特征的考察,实验表明,其分布基本符合齐夫定律。利用向量空间模型的表示,我们可以找到比较相似的歌词集合。另外,我们探讨了如何利用歌词中的时间标注信息进行进一步的分析:例如发现歌曲中重复片段,节奏划分,检索等。初步的实验表明,我们的方法具有一定的效果。

引用

页码：61 / 67

页数：7