Python 特殊分组转置

图片名称

  在处理数据的过程中,我们会遇到各种各样关于转置的问题,今天讲一种特殊的分组转置需求:按行进行分组转置,要求从每行第2个词开始,与每行第1个词拼接成一个新行。
  数据样例如下:

#==== 原始数据样例 ====
人 士 人物 人氏	 																																																																	
人手 人员 人口
#==== 转置后数据样例 ====
人 士
人 人物
人 人氏
人手 人员
人手 人口

  原始数据下载地址:synonyms.txt
  Python实现代码如下:

infile=open("d:\\test.txt","r",encoding="utf-8").readlines()
for i in infile:
    _s = "\ufeff"
    if i.startswith(_s):
        i = i[len(_s):]
                
    _arr = i.strip().split("\t")
    for _s in _arr[1:]: #从每行第2个词开始循环遍历
        print("{0} {1}".format(_arr[0], _s)) #输出每行第1个词及对应词

分类: Python技术