基于Python實現(xiàn)對比Exce的工具
目的:設(shè)計一個應(yīng)用GUI用于對比兩個Excel文件
思路
1.參數(shù)
- 同一個excel文件兩個sheet頁其中一個ODS(老數(shù)據(jù)),一個DWH(新數(shù)據(jù))
- 生成對比文件
- 設(shè)計兩個主鍵 輸入主鍵1 輸入主鍵2
(默認(rèn)新舊文件列名一致)
2.效果
- 生成的文件
- 數(shù)據(jù)量一樣、取每個字段不一致的數(shù)據(jù)前10
- 數(shù)據(jù)量不一樣、取兩邊不一樣的數(shù)據(jù)前10、排除不一樣的數(shù)據(jù)、每個字段不一致的數(shù)據(jù)前10
3.實現(xiàn)
- 循環(huán)對比組合列(主鍵+對比列)
- pandas處理差異數(shù)據(jù)、openpyxl 處理生成的sheet的數(shù)據(jù)格式. (先生成數(shù)據(jù),然后調(diào)整格式)
配置
import pandas as pd
from openpyxl import load_workbook
#選擇文件路徑
path=r"C:\Users\小管同學(xué)\Desktop\Migration_Data_Compari\對比文件.xls" #input("選擇文件路徑:")
TargetPath=r"C:\Users\小管同學(xué)\Desktop\Migration_Data_Comparison_Tool\目標(biāo)文件\對比結(jié)果.xlsx"
DATA_ODS=pd.read_excel(r"C:\Users\小管同學(xué)\Desktop\Migration_Data_Comparison_Tool\對比文件.xls",sheet_name="ODS")
DATA_DWH=pd.read_excel(r"C:\Users\小管同學(xué)\Desktop\Migration_Data_Comparison_Tool\對比文件.xls",sheet_name="DWH")
#選擇主鍵
Primarykey="員工編號"#input("選擇主鍵1:")
Primarykey
# 員工編號
一、數(shù)據(jù)量
輸出表格1–數(shù)據(jù)量
def write_to_excel_DataVolume(Data,TargetPath): # cor_df 為要保存的 dataframe
writer = pd.ExcelWriter(TargetPath, engine='xlsxwriter') # 這里用
Data.to_excel(writer,sheet_name='Sheet1', encoding='utf8', header=False, startcol=0, startrow=2) # 把dataframe的數(shù)據(jù)從第2行開始
workbook = writer.book
format1 = workbook.add_format({ # 先把樣式打包,然后之后賦值即可
'bold': True, # 字體加粗
'text_wrap': True, # 是否自動換行
'valign': 'bottom', #垂直對齊方式
'align': 'center', # 水平對齊方式
'fg_color': '#C5D9F1', # 單元格背景顏色
'border': 1,# 邊框
})
writer_sheet = writer.sheets['Sheet1']
# 設(shè)置寬度
writer_sheet.set_column("A:I", 16)
writer_sheet.set_column('C:C',30)
writer_sheet.merge_range(0,0,0,2,'對比結(jié)果',format1)
writer_sheet.merge_range(4,2,4,0,'數(shù)據(jù)量差異',format1)
writer_sheet.write(1,0,'',format1)
writer_sheet.write(1,1,'ODS',format1)
writer_sheet.write(1,2,'DWH',format1)
writer.save()
writer.close()
DataFrame_DataVolume=pd.DataFrame([[DATA_ODS.shape[0]],[DATA_DWH.shape[0]]]).T
DataFrame_DataVolume.columns =["ODS","DWH"]
DataFrame_DataVolume.index=["數(shù)據(jù)量"]
DataFrame_DataVolume
#writeFileDataVolume(DataFrame_DataVolume,TargetPath)
write_to_excel_DataVolume(DataFrame_DataVolume,TargetPath)

輸出表格2–數(shù)據(jù)量差異合同
if DATA_ODS.shape[0]==DATA_DWH.shape[0]:
pass
else:
DATA_ODS_Primarykey=pd.DataFrame(DATA_ODS[Primarykey])
DATA_DWH_Primarykey=pd.DataFrame(DATA_DWH[Primarykey])
df_union = pd.concat([DATA_ODS_Primarykey,DATA_DWH_Primarykey])
# 實現(xiàn)1
df_diff_ODS = df_union.append(DATA_ODS_Primarykey).drop_duplicates(subset=df_union.columns.to_list(), keep=False)
df_diff_DWH = df_union.append(DATA_DWH_Primarykey).drop_duplicates(subset=df_union.columns.to_list(), keep=False)
#DWH多的合同
df_diff_ODS
#DWH少的合同
df_diff_DWH
df_diff_DWH_Data=[]
df_diff_ODS_Data=[]
for i in df_diff_ODS.head(10).values.tolist():
for n in i:
df_diff_ODS_Data.append(n)
for i in df_diff_DWH.head(10).values.tolist():
df_diff_DWH_Data.append(n)
while True:
if len(df_diff_DWH_Data)>len(df_diff_ODS_Data):
df_diff_ODS_Data.append("-")
elif len(df_diff_DWH_Data)< len(df_diff_ODS_Data):
df_diff_DWH_Data.append("-")
elif len(df_diff_DWH_Data)== len(df_diff_ODS_Data):
break
DataFrame_DataVolume_Count_result=pd.DataFrame(df_diff_DWH_Data,df_diff_ODS_Data).reset_index()
DataFrame_DataVolume_Count_result.columns=['DWH多的合同','DWH少的的合同']
DataFrame_DataVolume_Count_result=DataFrame_DataVolume_Count_result.reset_index()
DataFrame_DataVolume_Count_result.columns=['序號','DWH多的合同','DWH少的的合同']
DataFrame_DataVolume_Count_result
from openpyxl import load_workbook
def write_to_excel_Count_result(Data,TargetPath):
df_Old = pd.DataFrame(pd.read_excel(TargetPath)) #讀取原數(shù)據(jù)文件和表
writer = pd.ExcelWriter(TargetPath,engine='openpyxl')
book=load_workbook(TargetPath)
writer.book = book
writer.sheets = dict((ws.title, ws) for ws in book.worksheets)
df_rows = df_Old.shape[0] #獲取原數(shù)據(jù)的行數(shù)
Data.to_excel(writer,startrow=df_rows+1, index=False,startcol=0,header=True)#將數(shù)據(jù)寫入excel中的aa表,從第一個空行開始寫
writer.save()#保存
write_to_excel_Count_result(DataFrame_DataVolume_Count_result,TargetPath)

到此這篇關(guān)于基于Python實現(xiàn)對比Excel的小工具 【實現(xiàn)中】的文章就介紹到這了,更多相關(guān)Python對比Excel的小工具內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python3 設(shè)置多進程名稱并在ps命令中可見(Centos7 系統(tǒng))
setproctitle 是一個 Python 模塊,用于設(shè)置進程標(biāo)題(process title),通過設(shè)置進程標(biāo)題,可以讓進程在系統(tǒng)級的進程管理工具中展示自定義的名稱,方便用戶查看和管理進程,本文介紹python3 設(shè)置多進程名稱并在ps命令中可見,感興趣的朋友一起看看吧2024-03-03
使用Python創(chuàng)建多功能文件管理器的代碼示例
在本文中,我們將探索一個使用Python的wxPython庫開發(fā)的文件管理器應(yīng)用程序,這個應(yīng)用程序不僅能夠瀏覽和選擇文件,還支持文件預(yù)覽、壓縮、圖片轉(zhuǎn)換以及生成PPT演示文稿的功能,需要的朋友可以參考下2024-08-08
python把數(shù)據(jù)導(dǎo)出生成excel文件的方法小結(jié)
在Python中,將數(shù)據(jù)導(dǎo)出生成Excel文件,最常用的庫之一是openpyxl(用于處理.xlsx文件)和pandas,以下將分別介紹如何使用這兩個庫來生成Excel文件,感興趣的小伙伴跟著小編一起來看看吧2024-09-09
Python中PyQt5可視化界面通過拖拽來上傳文件的實現(xiàn)
本文主要介紹了Python中PyQt5可視化界面通過拖拽來上傳文件的實現(xiàn),通過構(gòu)建一個可接受拖拽的區(qū)域,并重寫相關(guān)事件處理函數(shù),可以方便地實現(xiàn)文件上傳功能,具有一定的參考價值,感興趣的可以了解一下2023-12-12
Selenium向iframe富文本框輸入內(nèi)容過程圖解
這篇文章主要介紹了Selenium向iframe富文本框輸入內(nèi)容過程圖解,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2020-04-04

