前言:
今天我们对“python word查找替换”大概比较看重,同学们都需要剖析一些“python word查找替换”的相关内容。那么小编也在网摘上搜集了一些关于“python word查找替换””的相关内容,希望各位老铁们能喜欢,看官们快快来了解一下吧!前言
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。
作者:多巴胺爱学习
PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取
为什么要这么干
万事皆有缘由,以下纯属YY,不想看的可以直接忽略。
OCR文字识别已经很流行了,我们做PPT的时候经常会用文字识别软件来获得内容(好吧,我经常这么干。。。)。OCR软件在识别文字上的准确性已经比较高了,但是标点符合却差强人意,逗号、分号、冒号之类的经常会被识别为半角,这个时候就需要改了。
当然,我们可以用ppt当中的替换功能手工替换。
再当然,我们还可以用ppt的宏功能实现,使用起来更方便。只是这个宏,目前我还没写出来,写出来后再另外分享了。
本次操作环境
操作系统:win10
Python版本:3.7
使用的第三方库:python-pptx
如果没有安装第三方库的话,需要先安装下:
Windows:pip install python-pptxMac:pip3 install python-pptxPPT科普
PPT是由许多页组成的,页叫做Slide;
每一页又包含了许多组件,像文本框、表格,这些组件叫做Shape。我们做PPT的时候,文字主要就是放在文本框或者表格中的;
文本框中的文字是以段落的形式存在的,段落叫做Paragraph;
表格是由单元格组成的,单元格叫做Cell,单元格中的文字,也是由段落组成的。如下图:
代码实现
代码实现的原理很简单,遍历Slide找Shape;遍历Shape找Paragraph;遍历Paragraph找run(run简单点理解就是文字块);在run中看看有没有需要替换的字符,有的话就替换了。
import pptxfromShao pptx import PresentationTEXT_NEED_REPLACE = [('概念', 'Concept'), ('企业', 'Enterprise')]#需要替换的内容,数据结构为“[(被替换内容1,替换内容1),(被替换内容2,替换内容2),……]”FILE_OPEN = r"c:/python/asoursefiles/00301.pptx"#需要打开的文件地址FILE_SAVE = r"c:/python/asoursefiles/demo.pptx"#需要保存的文件地址,不建议直接覆盖原文件,当然你非要覆盖原文件也拦不住。这里需要提示的是:需要保存的文件不能是打开的状态,否则会无法保存。def replace_text(text_frame):#该函数实现的是文本替换功能 for paragraph in text_frame.paragraphs: for run in paragraph.runs: for tt in TEXT_NEED_REPLACE: if tt[0] in run.text: run.text = run.text.replace(tt[0], tt[1])def process_ppt(filename_open, filename_save): prs = Presentation(filename_open) for slide in prs.slides: for shape in slide.shapes: if shape.has_text_frame:#判断Shape是否含有文本框 text_frame = shape.text_frame replace_text(text_frame)#调用replace_text函数实现文本替换 if shape.has_table:#判断Shape是否含有表格 table = shape.table for cell in table.iter_cells():#遍历表格的cell text_frame = cell.text_frame replace_text(text_frame))#调用replace_text函数实现文本替换 prs.save(filename_save)#保存process_ppt(FILE_OPEN, FILE_SAVE)后记
用Python与ppt、word进行交互是一个比较鸡肋的想法,99%的情况下,都是闲的无聊,微软的office功能已经不要太强大了。
用Python操作excel,相比于office,在个别情况(数据量大,或者需要实现的分析步骤太多,太复杂之类的)下可能具有优势,但通常情况下也用不到。
对于普通办公需求,从实用角度来说,学好office比学什么python,R,matlab,SPSS之类的有用多了。毕竟office的强大,只有你想不到的,没有它做不到的(安装包也够大的,打开之后电脑风扇转的哇哇哇的响)。
当然,会点Python,matlab之类的,你找工作的时候可以写在简历上。工作中真碰到坑了,也可以咬咬牙自己去填。
标签: #python word查找替换