脚本之家,脚本语言编程技术及教程分享平台!
分类导航

Python|VBS|Ruby|Lua|perl|VBA|Golang|PowerShell|Erlang|autoit|Dos|bat|

服务器之家 - 脚本之家 - Python - Python输出PowerPoint(ppt)文件中全部文字信息的方法

Python输出PowerPoint(ppt)文件中全部文字信息的方法

2020-06-16 09:31重负在身 Python

这篇文章主要介绍了Python输出PowerPoint(ppt)文件中全部文字信息的方法,涉及Python通过windows中com组件操作ppt的相关技巧,非常具有实用价值,需要的朋友可以参考下

本文实例讲述了Python输出PowerPoint(ppt)文件中全部文字信息的方法。分享给大家供大家参考。具体分析如下:

下面的代码依赖于windows com,所以必须在机器上安装PowerPoint才能用,可以将PPT文件中的所有纯文本信息进行输出到指定的文件,非常实用。

?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
import win32com
from win32com.client import Dispatch, constants
ppt = win32com.client.Dispatch('PowerPoint.Application')
ppt.Visible = 1
pptSel = ppt.Presentations.Open("c:\\1.ppt")
win32com.client.gencache.EnsureDispatch('PowerPoint.Application')
f = file("c:\\1.txt","w")
slide_count = pptSel.Slides.Count
for i in range(1,slide_count + 1):
  shape_count = pptSel.Slides(i).Shapes.Count
  print shape_count
  for j in range(1,shape_count + 1):
    if pptSel.Slides(i).Shapes(j).HasTextFrame:
      s = pptSel.Slides(i).Shapes(j).TextFrame.TextRange.Text
      f.write(s.encode('utf-8') + "\n")   
f.close()
ppt.Quit()

希望本文所述对大家的Python程序设计有所帮助。

延伸 · 阅读

精彩推荐