最近发现excel数据量极大,并且通过简单的数据操作不能提取到我需要的数据,如果单独操作,数据量太大耗时太长。
想着通过简单的方式,并且快速提取数据,就想到了Python。
python操作Excel使用的openyxl和pandas对Excel进行操作。
代码如下:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time : 2020-02-24 下午 03:43
# @Author : Zhanxing
# @Site :
# @File : 提取字段.py
# @Software: PyCharm
import openpyxl
import pandas as pd
from xlutils.copy import copy
df=pd.read_excel('222.xlsx',sheet_name='XXX')
data=(df[['XXX','XXX']])
data.to_excel("new.xlsx", index=False)
class Excel:
def __init__(self, excel_file):
self.excel = openpyxl.load_workbook(excel_file)
self.sheet_name = self.excel.get_sheet_names()
self.sheet = self.excel.get_sheet_by_name(self.sheet_name[0])
def excel_read(self):
"""
返回excel每一行的生成器对象
:return:
"""
yield from self.sheet.iter_rows(min_row=2)
def run(excel_file, new_excel):
"""
:param excel_file: 要处理的excel的路径
:param new_excel: 处理后要保存的文件名
:return:
"""
excel = Excel(excel_file)
excel_line = [line for line in excel.excel_read()]
for line in excel_line:
for cell in line:
if isinstance(cell.value, int):
continue
people_name = cell.value.strip('[]').split(',')
for num in range(len(people_name)):
if 'XX' in people_name[num]:
excel.sheet.cell(row=cell.row, column=cell.column, value=people_name[num])
break
excel.excel.save(new_excel)
if __name__ == '__main__':
run('new.xlsx','11.xlsx')
另外有需要云服务器可以了解下创新互联cdcxhl.cn,海内外云服务器15元起步,三天无理由+7*72小时售后在线,公司持有idc许可证,提供“云服务器、裸金属服务器、高防服务器、香港服务器、美国服务器、虚拟主机、免备案服务器”等云主机租用服务以及企业上云的综合解决方案,具有“安全稳定、简单易用、服务可用性高、性价比高”等特点与优势,专为企业上云打造定制,能够满足用户丰富、多元化的应用场景需求。
当前标题:Python如何提取Excel的数据?-创新互联
文章位置:https://www.cdcxhl.com/article22/pijcc.html
成都网站建设公司_创新互联,为您提供动态网站、Google、网站设计公司、网页设计公司、网站建设、网站导航
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联