Python之 抽取式摘要
21 Apr 2018 关于摘要抽取共有两种研究方向:抽取式摘要和生成式摘要,现阶段市面上接触到的大多是抽取式摘要,而生成式摘要还属于实验室阶段。因此这里只介绍抽取式摘要的一种算法TextRank,我们之前了解过TextRank基于投票机制可以提取关键词,而这里我们可以想象利用投票机制提取关键句子从而形成摘要。
语料下载地址:textrank_test.txt
Python抽取式摘要(TextRank)程序如下:
from textrank4zh import TextRank4Sentence
text = open("d:\\textrank_test.txt","r",encoding="utf-8").read()
sentence = TextRank4Sentence()
sentence.analyze(text,lower = True)
s_list = sentence.get_key_sentences(num = 3,sentence_min_len = 5)
print('====== 抽取式摘要 ======')
for s in s_list:
print(s.sentence,s.weight)
分类: 自然语言处理