python读取word文档表格里的数据

安装

pip install python-docx

Example

import docx
from docx import Document #导入库

path = "E:/python_data/1234.docx" #文件路径
document = Document(path)   #读入文件
tables = document.tables   #获取文件中的表格集
table = tables[0]       #获取文件中的第一个表格
for i in range(1,len(table.rows)):  #从表格第二行开始循环读取表格数据
    result = table.cell(i,0).text + "" +table.cell(i,1).text+
    table.cell(i,2).text + table.cell(i,3).text
    #cell(i,0)表示第(i+1)行第1列数据,以此类推
    print(result)
        
len(table.rows)    #表格行数
len(table.columns) #表格列数
table.cell(i,2).text #表格内容