脚本之家,脚本语言编程技术及教程分享平台!
分类导航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服务器之家 - 脚本之家 - Python - python excel多行合并的方法

python excel多行合并的方法

2021-08-11 00:38py3study Python

这篇文章主要介绍了python excel多行合并的方法,帮助大家更好的利用python处理excel表格,感兴趣的朋友可以了解下

一、概述
现有一个wenda1.xlsx文件,内容如下:

python excel多行合并的方法

需要将faq记录合并为一行,效果如下:

python excel多行合并的方法

注意:faq记录,每一行用||来拼接。

二、多行转换一行
新建test1.py,内容如下:

  1. # !/usr/bin/python3
  2. # -*- coding: utf-8 -*-
  3. import xlrd
  4.  
  5. # 打开excel文件,创建一个workbook对象
  6. rbook = xlrd.open_workbook('wenda1.xlsx')
  7. # sheets方法返回对象列表,[<xlrd.sheet.Sheet object at 0x103f147f0>]
  8. rbook.sheets()
  9. # xls默认有3个工作簿,Sheet1,Sheet2,Sheet3
  10. rsheet = rbook.sheet_by_index(0) # 取第一个工作簿
  11.  
  12. faq_tmp_dict = {} # FAQ临时字典
  13. faq_formal_list = [] # FAQ正式列表
  14. first_category_tag = "" # 一级分类标识
  15. index = 0 # 索引
  16.  
  17. #循环工作簿的所有行
  18. for row in rsheet.get_rows():
  19. index +=1
  20.  
  21. first_category_row = row[0] # 1级分类所在的列
  22. first_category_value = first_category_row.value # 1级分类的值
  23. if first_category_value != '1级分类': # 排除第一行,这些都是列名
  24. if first_category_value: # 当1级分类的值不为空时
  25. # 更新一级分类标识,用#连接
  26. first_category_tag = "%s#%s"%(first_category_value,index)
  27. faq_like_column = row[1] # FAQ相似句所在的列
  28. faq_like_value = faq_like_column.value # FAQ相似句的值
  29. # 更新临时字典,不存在默认值为空字典,否则追加到列表中
  30. faq_tmp_dict.setdefault(first_category_tag, []).append(faq_like_value)
  31. else:
  32. # 当1级分类的值为空时
  33. faq_like_column = row[1] # FAQ相似句所在的列
  34. faq_like_value = faq_like_column.value
  35. faq_tmp_dict.setdefault(first_category_tag, []).append(faq_like_value)
  36.  
  37. print(faq_tmp_dict)
  38. # 处理临时字典
  39. for i in faq_tmp_dict:
  40. tmp_dict = {}
  41. # 一级分类,切割#号,取第一个
  42. first_category = i.split('#')[0]
  43. # print("first_category",first_category)
  44. # faq所有记录,将faq列表转换为一行,用逗号拼接
  45. faq_like_all = "||".join(faq_tmp_dict[i])
  46. # print("faq_merge",faq_all)
  47. tmp_dict['first_category'] = first_category
  48. tmp_dict['faq_like_all'] = faq_like_all
  49. faq_formal_list.append(tmp_dict)
  50.  
  51. print(faq_formal_list)

执行输出:

  1. {'闲聊#2': ['不在吗?', '你好在吗?', '你在不在', '有人在么。', '你好?', '在么?说话啊', '客户在不在?'], '闲聊#9': ['你好', '客服你好', '你好,客服']}
  2. [{'first_category': '闲聊', 'faq_like_all': '不在吗?||你好在吗?||你在不在||有人在么。||你好?||在么?说话啊||客户在不在?'}, {'first_category': '闲聊', 'faq_like_all': '你好||客服你好||你好,客服'}]

从上面输出内容,可以看出。将多行合并为一行,并且将faq记录写入到一个字典里面了。接下来就可以写入到新表格了。

三、写入新表格
完整代码如下:

  1. # !/usr/bin/python3
  2. # -*- coding: utf-8 -*-
  3. import xlrd
  4.  
  5. # 打开excel文件,创建一个workbook对象
  6. rbook = xlrd.open_workbook('wenda1.xlsx')
  7. # sheets方法返回对象列表,[<xlrd.sheet.Sheet object at 0x103f147f0>]
  8. rbook.sheets()
  9. # xls默认有3个工作簿,Sheet1,Sheet2,Sheet3
  10. rsheet = rbook.sheet_by_index(0) # 取第一个工作簿
  11.  
  12. faq_tmp_dict = {} # FAQ临时字典
  13. faq_formal_list = [] # FAQ正式列表
  14. first_category_tag = "" # 一级分类标识
  15. index = 0 # 索引
  16.  
  17. #循环工作簿的所有行
  18. for row in rsheet.get_rows():
  19. index +=1
  20.  
  21. first_category_row = row[0] # 1级分类所在的列
  22. first_category_value = first_category_row.value # 1级分类的值
  23. if first_category_value != '1级分类': # 排除第一行,这些都是列名
  24. if first_category_value: # 当1级分类的值不为空时
  25. # 更新一级分类标识,用#连接
  26. first_category_tag = "%s#%s"%(first_category_value,index)
  27. faq_like_column = row[1] # FAQ相似句所在的列
  28. faq_like_value = faq_like_column.value # FAQ相似句的值
  29. # 更新临时字典,不存在默认值为空字典,否则追加到列表中
  30. faq_tmp_dict.setdefault(first_category_tag, []).append(faq_like_value)
  31. else:
  32. # 当1级分类的值为空时
  33. faq_like_column = row[1] # FAQ相似句所在的列
  34. faq_like_value = faq_like_column.value
  35. faq_tmp_dict.setdefault(first_category_tag, []).append(faq_like_value)
  36.  
  37. print(faq_tmp_dict)
  38. # 处理临时字典
  39. for i in faq_tmp_dict:
  40. tmp_dict = {}
  41. # 一级分类,切割#号,取第一个
  42. first_category = i.split('#')[0]
  43. # print("first_category",first_category)
  44. # faq所有记录,将faq列表转换为一行,用逗号拼接
  45. faq_like_all = "||".join(faq_tmp_dict[i])
  46. # print("faq_merge",faq_all)
  47. tmp_dict['first_category'] = first_category
  48. tmp_dict['faq_like_all'] = faq_like_all
  49. faq_formal_list.append(tmp_dict)
  50.  
  51. print(faq_formal_list)
  52.  
  53. import xlwt
  54. import json
  55. f = xlwt.Workbook()
  56. sheet1 = f.add_sheet('Sheet1', cell_overwrite_ok=True)
  57. row0 = ["1级分类", "faq记录"]
  58.  
  59. # 写第一行
  60. for i in range(0, len(row0)):
  61. sheet1.write(0, i, row0[i])
  62.  
  63. # # 加载json文件
  64. # with open("tj.json", 'r') as load_f:
  65. # load_dict = json.load(load_f) # 反序列化文件
  66. #
  67. num = 0 # 计数器
  68. max_length = 0 # 最大长度
  69. for i in faq_formal_list:
  70. num+=1 # 自增1
  71.  
  72. faq_col = sheet1.col(1) # faq记录所在的列
  73. length = len(i['faq_like_all']) # 计算长度
  74. # print("长度",length)
  75. # 更新最大长度
  76. if max_length < length:
  77. max_length = length
  78.  
  79. # 设置表格宽度
  80. faq_col.width = max_length * 20* 20
  81. # 写入库名
  82. sheet1.write(num, 0, i['first_category'])
  83. # faq_like_str = "||".join(i['faq_like_all'])
  84. sheet1.write(num, 1, i['faq_like_all'])
  85.  
  86. # 保存到表格
  87. f.save('test1.xls')

执行代码,它会生成一个test1.xlsx。

打开文件,效果如下:

python excel多行合并的方法

以上就是python excel多行合并的方法的详细内容,更多关于python excel多行合并的资料请关注服务器之家其它相关文章!

原文链接:https://cloud.tencent.com/developer/article/1754021

延伸 · 阅读

精彩推荐