Python docx学习笔记

个人学习笔记。

1 工具介绍

python-docx 是用于创建可修改 微软 Word 的一个 python 库,提供全套的 Word 操作,是最常用的 Word 工具。

1.1 基本概念

  • Document:是一个 Word 文档 对象,不同于 VBA 中 Worksheet 的概念,Document 是独立的,打开不同的Word 文档,就会有不同的 Document 对象,相互之间没有影响。
  • Paragraph:是段落,一个 Word 文档由多个段落组成,当在文档中输入一个回车键,就会成为新的段落,输入 shift + 回车,不会分段。
  • Run: 表示一个节段,每个段落由多个节段组成,一个段落中具有相同样式的连续文本,组成一个节段,所以一个 段落对象有多个 Run 列表。
    在这里插入图片描述

1.2 对象介绍

此处只列出部分,剩余的部分,见官方文档介绍。

1.2.1 Document objects

整篇word文档的对象,可以对该对象添加标题、段落、表格、图片等信息。

在这里插入图片描述

1.2.2 Paragraph objects

段落对象,可以在段落里面添加一个节段、段落前添加一个段落(不支持在后面添加)、设置格式等。
在这里插入图片描述

1.2.3 Table objects

表格对象,常规的添加行、列、合并单元格等。
在这里插入图片描述

2 实操

实现功能:在word文档的指定位置添加相应的宏定义和函数定义

2.1 准备材料

word文档模板:
在这里插入图片描述
备注:
1、需要现在word文档中设置好自动编号(关联到相应标题)
2、相应标题格式(字体颜色、大小等)需要提前调整,脚本只是应用,占时不修改属性

2.2 运行结果

在这里插入图片描述

2.3 代码

from docx import Document
from docx.enum.table import WD_ALIGN_VERTICAL  # 导入单元格垂直对齐
from docx.shared import Cm, Inches, Pt
import re

Column = 4   # 设置表格列数
# 这里添加表格内容,具体内容后期提取代码或提前PDF文档
EnumInfo = [{'Name': 'Crypto_AlgorithmFamilyType', 'kind': 'Enumeration',
             'Range': [['CRYPTO_ALGOFAM_NOT_SET', '0x00', 'Algorithm family is not set'],
                       ['CRYPTO_ALGOFAM_SHA1', '0x01', 'SHA1 hash'],
                       ['CRYPTO_ALGOFAM_SHA2_224', '0x01', 'SHA2-224 hash']],
             'Description': 'Enumeration of the algorithm family.', 'Availablevia': 'Crypto_GeneralTypes.h'},
            {'Name': 'Crypto_InputOutputRedirectionConfigType', 'kind': 'Enumeration',
             'Range': [['CRYPTO_REDIRECT_CONFIG_PRIMARY_INPUT', '0x01', '--'],
                       ['CRYPTO_REDIRECT_CONFIG_SECONDARY_INPUT', '0x02', '--']],
             'Description': 'Defines which of the input/output parameters are re-directed to a key element. Thevalues can be combined to define a bit field.',
             'Availablevia': 'Crypto_GeneralTypes.h'}
            ]

def addEnum(document, paragraph):
    for type in EnumInfo:
        paragraph1 = paragraph.insert_paragraph_before(type['Name'], style='Heading 3')
        lineNumber = 0
        table1 = document.add_table(4, Column, style='Table Grid')  # 添加一个4行4列的表格,表格样式为Table Grid
        table1.autofit = False
        table1.allow_autofit = False

    # 设置表格宽度
    table1.columns[0].width = Cm(2)
    table1.columns[1].width = Cm(4)
    table1.columns[2].width = Cm(1.5)
    table1.columns[3].width = Cm(8)
    # 设置第一行高度为1cm
    table1.rows[0].height = Cm(1)

    # 填充Name信息
    table1.cell(lineNumber, 0).text = 'Name'
    table1.cell(lineNumber, 1).merge(table1.cell(lineNumber, 2)).merge(table1.cell(lineNumber, 3))
    table1.cell(lineNumber, 1).text = type['Name']
    lineNumber = lineNumber + 1
    # 填充Kind信息
    table1.cell(lineNumber, 0).text = 'kind'
    table1.cell(lineNumber, 1).merge(table1.cell(lineNumber, 2)).merge(table1.cell(lineNumber, 3))
    table1.cell(lineNumber, 1).text = type['kind']
    lineNumber = lineNumber + 1
    # 填充具体的枚举数据
    for i in range(0, len(type['Range'])):
        table1.cell(lineNumber + i, 1).text = type['Range'][i][0]
        table1.cell(lineNumber + i, 2).text = type['Range'][i][1]
        table1.cell(lineNumber + i, 3).text = type['Range'][i][2]
        table1.add_row()
    lineNumber = lineNumber + len(type['Range'])  # 计算下一行的索引
    # 合并第一列表格(枚举相关的行)
    for i in range(2, lineNumber - 1):  # 总共需要合并lineNumber - 1次
        table1.cell(i, 0).merge(table1.cell(i + 1, 0))
    table1.cell(2, 0).text = 'Range'
    table1.cell(2, 0).vertical_alignment = WD_ALIGN_VERTICAL.CENTER  # 设置为水平居中

    # 填充Description、Availablevia信息
    table1.cell(lineNumber, 0).text = 'Description'
    table1.cell(lineNumber, 1).merge(table1.cell(lineNumber, 2)).merge(table1.cell(lineNumber, 3))
    table1.cell(lineNumber, 1).text = type['Description']
    lineNumber = lineNumber + 1
    table1.cell(lineNumber, 0).text = 'Availablevia'
    table1.cell(lineNumber, 1).merge(table1.cell(lineNumber, 2)).merge(table1.cell(lineNumber, 3))
    table1.cell(lineNumber, 1).text = type['Availablevia']

    move_table_after(table1, paragraph1)  # 移动到段落后面(表格只能创建到文档末尾)
# 函数功能:移动指定表格到段落后面
def move_table_after(table, paragraph): 
    tbl, p = table._tbl, paragraph._p
    p.addnext(tbl)


def main():
    # 实例化一个Document对象,相当于打开word软件,新建一个空白文件
    document = Document('test.docx')
    for paragraph in document.paragraphs:
        if (paragraph.style.name.startswith('Heading')):  # 识别标题,注意:这里是在标题前添加相关信息,若要在枚举章节添加枚举定义,则需要识别下一个章节标题
            if re.search('函数接口定义', paragraph.text):   # 实际是编辑上一个章节“枚举类型定义”的内容
                pass
            elif re.search('其他', paragraph.text):        # 编辑“函数接口定义内容”
                addEnum(document, paragraph)  # 添加枚举类型
    document.save(f"test.docx")


if __name__ == "__main__":
    main()

3 参考资料

3.1 官方链接

https://python-docx.readthedocs.io/en/latest/index.html#

在这里插入图片描述
刚入门可以看该章节快速上手,具体API和对象的熟悉可以看下面的“API Documentation”。
在这里插入图片描述

3.2 其他博主

强烈推荐学习此博主的博文,本文部分内容从中摘选。

https://blog.csdn.net/yuetaope/article/details/119444970

4. 其他

Python提取PDF表格(基于AUTOSAR_SWS_CANDriver.pdf

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/456167.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

基于HttpClient实现的微信用户登陆微信小程序

目录 HttpClient介绍 微信小程序登陆 代码编写 导入HttpClient的Maven坐标 微信小程序获得临时Code并将其传至开发者服务器 开发者服务器构建url,并获取openid,并传给微信小程序 HttpClientUtil的封装的doGet方法 参考链接 HttpClient介绍 httpC…

【Java - 框架 - Mybatis】(02) SpringBoot整合Mybatis操作Mysql - 快速上手

“SpringBoot"整合"Mybatis"操作"Mysql” - 快速上手; 环境 Java版本"1.8.0_202";Spring Boot版本"2.5.9";Windows 11 专业版_22621.2428;IntelliJ IDEA 2021.1.3(Ultimate Edition)&a…

[Java并发编程] Java开发必须知道的synchronized关键字

前言 在Java后台开发或者Android开发中,synchronized出现的频率并不算低。本文就什么是synchronized,如何使用synchronized以及synchronized的实现原理做深入的讲解,揭开synchronized神秘面纱,有助于大家掌握synchronized的用法并…

生成式AI来袭,FOSS全闪对象存储应时而生

AI大模型正飞速跃进,从引领文本生成革命的ChatGPT到开创文生视频新纪元的Sora,多模态交互技术连续迭代,促进了智算中心的快速落地。在这一过程中,算力的迅猛增长对存储系统提出了更高的要求和挑战。为满足这些日益增长的需求&…

校园生活信息平台:Java+Vue+MySQL全栈实践

✍✍计算机编程指导师 ⭐⭐个人介绍:自己非常喜欢研究技术问题!专业做Java、Python、微信小程序、安卓、大数据、爬虫、Golang、大屏等实战项目。 ⛽⛽实战项目:有源码或者技术上的问题欢迎在评论区一起讨论交流! ⚡⚡ Java实战 |…

机界先锋:Figure 01实现全面沟通与AGI通用人工智能的征途

✨✨ 欢迎大家来访Srlua的博文(づ ̄3 ̄)づ╭❤~✨✨ 🌟🌟 欢迎各位亲爱的读者,感谢你们抽出宝贵的时间来阅读我的文章。 我是Srlua小谢,在这里我会分享我的知识和经验。&am…

idea安装了某个插件之后启动报错打不开怎么办

刚才安装了个这个插件 然后重启的时候就报错了 如下 不用慌,看一下报错日志,找到插件的位置给他删了就行了,往下拉一点 找到这个文件给他删了,再启动就好了。记得删之前先把上面这个报错弹框关了,不然会提示文件占用不…

阿里云第一次面试记录

java多态? 多态表示一个对象具有多种的状态,具体表现为父类的引用指向子类的实例 Fu f Zi z(); 多态是同一个行为具有多个不同表现形式或形态的能力。 多态就是同一个接口,使用不同的实例而执行不同操作 特点: 对象类型和引用类型…

wordpress博客趣主题个人静态网页模板

博客趣页面模板适合个人博客,个人模板等内容分享。喜欢的可以下载套用自己熟悉的开源程序建站。 博客趣主题具有最小和清洁的设计,易于使用,并具有有趣的功能。bokequ主题简约干净的设计、在明暗风格之间进行现场切换。 下载地址 清新个人…

未来已来:科技驱动的教育变革

我们的基础教育数百年来一成不变。学生们齐聚在一个物理空间,听老师现场授课。每节课时长和节奏几乎一致,严格按照课表进行。老师就像“讲台上的圣人”。这种模式千篇一律,并不适用于所有人。学生遇到不懂的问题,只能自己摸索或者…

ctf_show笔记篇(web入门---代码审计)

301:多种方式进入 从index.php页面来看 只需要访问index.php时session[login]不为空就能访问 那么就在访问index.php的时候上传login 随机一个东西就能进去从checklogin页面来看sql注入没有任何过滤 直接联合绕过 密码随意 还有多种方式可以自己去看代码分析 30…

【OpenCV实战】基于OpenCV中DNN(深度神经网络)使用OpenPose模型实现手势识别详解

一、手部关键点检测 如图所示,为我们的手部关键点所在位置。第一步,我们需要检测手部21个关键点。我们使用深度神经网络DNN模块来完成这件事。通过使用DNN模块可以检测出手部21个关键点作为结果输出,具体请看源码。 二,openpose手势识别模型 OpenPose的原理基于卷积神经网…

购物平台为何要添增短视频部件?是应时代发展还是别有用心?

每天五分钟讲解一个商业模式,大家好我是模式设计啊浩。 不知道大家有在购物商城平台刷过短视频吗,不管怎么说啊浩是有这样做过的,甚至一度觉得还挺有意思的。有时候本来只是想去买件衣服,结果商城刷了五分钟,短视频就刷…

SpringBoot配置达梦数据库依赖(达梦8)

maven配置 <!-- 达梦数据库 --><dependency><groupId>com.dameng</groupId><artifactId>DmJdbcDriver18</artifactId><version>8.1.1.193</version></dependency><dependency><groupId>com.alibaba&l…

利用位运算符设置标志位

在写程序的过程中&#xff0c;会碰到需要修改标志位的情况。比如需要设置一个文件标识符可读或可写&#xff0c;首先想到的是利用int变量&#xff08;1表示不可读不可写 &#xff0c;2表示不可读可写&#xff0c;3表示可读不可写&#xff0c;4表示可读可写&#xff09;。但是这…

ChatGPT提问技巧——对话提示

ChatGPT提问技巧——对话提示 对话提示是一种允许模型生成模拟两个或多个实体之间对话的文本的技术。 通过向模型提供上下文和一组角色或实体&#xff0c;以及他们的角色和背景&#xff0c;并要求模型生成他们之间的对话。 因此&#xff0c;应向模型提供一个上下文和一组角色…

中国工程精英智创数字工厂——2023纵览基础设施大会暨光辉大奖赛观察 (下)

中国工程精英智创数字工厂 ——2023纵览基础设施大会暨光辉大奖赛观察 &#xff08;下&#xff09; 吴付标 中国制造的尽头是智能化、智慧化&#xff0c;这一趋势正在加速前进。2022年&#xff0c;中国以50座达沃斯论坛盖章认证的“灯塔工厂”数量冠绝全球&#xff0c;而“数…

Javascript的Execution Context

概要 本文主要通过一个实例&#xff0c;来理解什么是Javascript中的Execution Context&#xff0c;以及在JavaScript执行过程中&#xff0c;Execution Context是如何工作的。 基本概念 事实上&#xff0c;我们可以理解为JavaScript代码在一个盒子中执行&#xff0c;而这个盒…

Linux 建立链接(ln)

目录 1、ln命令 创建软链接&#xff1a; 创建硬链接&#xff1a; 2、输出重定向&#xff08;>/>>&#xff09; 3、管道&#xff08;|&#xff09; 1、ln命令 &#xff08;英文全拼&#xff1a;link files&#xff09;为某一个文件在另外一个位置建立一个同步的…

如何使用vue定义组件之——子组件调用父组件数据

1.定义父子模板template <div class"container"><my-father></my-father><my-father></my-father><my-father></my-father><!-- 此处无法调用子组件&#xff0c;子组件必须依赖于父组件进行展示 --><!-- <my-…