热词统计(TOP-N)

  之前有同学在讲关键词的时候,有同学提出热词怎么计算,遂将热词统计方法分享出来。
  Python热词统计程序如下:

import jieba
text="小明硕士毕业于中国科学院计算所"
seg_list = jieba.cut(text, cut_all = False)  
content = " ".join(seg_list)
print(content)

# 将文本拆分成列表
c = content.split(" ")
print(c)

# 读取列表,并计数
for i in c:
    print(i,c.count(i))

  Python热词统计结果如下:

小明 1
硕士 1
毕业 1
 1
中国科学院 1
计算所 1

分类: 自然语言处理