Python之 抽取式摘要

  关于摘要抽取共有两种研究方向:抽取式摘要和生成式摘要,现阶段市面上接触到的大多是抽取式摘要,而生成式摘要还属于实验室阶段。因此这里只介绍抽取式摘要的一种算法TextRank,我们之前了解过TextRank基于投票机制可以提取关键词,而这里我们可以想象利用投票机制提取关键句子从而形成摘要。
  语料下载地址:textrank_test.txt
  Python抽取式摘要(TextRank)程序如下:

from  textrank4zh import TextRank4Sentence   
  
text = open("d:\\textrank_test.txt","r",encoding="utf-8").read() 
sentence = TextRank4Sentence()  
sentence.analyze(text,lower = True)  
s_list = sentence.get_key_sentences(num = 3,sentence_min_len = 5)  
  
print('====== 抽取式摘要 ======')  
for s in s_list:  
    print(s.sentence,s.weight)  

分类: 自然语言处理