精易论坛
标题: 使用python把Excel表格由一个分隔成多个 [打印本页]
作者: 爱易语言的傻蛋 时间: 2018-7-11 09:32
标题: 使用python把Excel表格由一个分隔成多个
最近经常用到Excel导入数据,公司的网站是PHP做的,型号价格的更新每次都是通过Excel导入。
一次性两万条记录的导入勉强可以,数据量再大就超时了。而有些产品的价格表格在5万以上,此时导入的时候就需要拆分成几个数据量少于2万的表格。每个类型码有多个Excel表,靠手工来操作不是程序员该干的事情,于是我用起了不是很熟练的Python来解决。
代码如下,希望给新手一个帮助。(其实我也是python新手^^)
Excel表格放在同目录下的file目录,并新建一个new文件夹存放拆分后的Excel表格。字段我是写死了两行的,实际使用需要修改。
# -*- coding: utf-8 -*-
import os
import math
import xlrd
import xlwt
dir = os.getcwd()+'\\file\\'
def get_file_list(file_dir):
for root,dirs,files in os.walk(file_dir):
return files
def split_xls(name):
limit = 10000
print(name)
limit = int(limit)
data = xlrd.open_workbook(dir+name)
# 获取sheet
table = data.sheets()[0]
# 行数
nrows = table.nrows
print('总行数{}'.format(nrows))
# 列数
ncols = table.ncols
sheets = math.ceil(nrows / limit)
print('拆分文件数量:{}'.format(sheets))
workbook = xlwt.Workbook(encoding='ascii')
for i in range(int(sheets)):
if i == 0:
start_row = 0
else:
start_row = i*limit
if i == sheets-1:
end_row = nrows
else:
end_row = (i+1)*limit
#print(start_row)
#print(end_row)
new_arr = []
new_arr.append(['型号','未含税价'])
for row in range(start_row,end_row):
if i == 0 and row == 0:
continue
sku = table.cell_value(row,0)
price = table.cell_value(row,1)
new_arr.append([sku,price])
#print(new_arr)
new_workbook = xlwt.Workbook()
new_worksheet = new_workbook.add_sheet('Sheet1',cell_overwrite_ok=True)
for new_row in range(0,len(new_arr)):
new_worksheet.write(new_row,0,new_arr[new_row][0])
new_worksheet.write(new_row,1,new_arr[new_row][1])
old_name = name.split('.')
new_name = old_name[0]+'-'+str(i)+'.xls'
new_workbook.save(os.getcwd()+'\\new\\'+new_name)
print('************************************')
if __name__ == '__main__':
file_list = get_file_list(dir)
for name in file_list:
split(name)
欢迎光临 精易论坛 (https://125.confly.eu.org/) |
Powered by Discuz! X3.4 |