基于PyQt5制作Excel文件數(shù)據(jù)去重小工具
需求說明:將單個或者多個Excel文件數(shù)據(jù)進(jìn)行去重操作,去重的列可以通過自定義制定。
開始源碼說明之前,先說明一下工具的使用過程。
1、準(zhǔn)備需要去重的數(shù)據(jù)文件。


2、使用工具執(zhí)行去重操作。

3、處理完成后的結(jié)果文件。


PyQt5 界面UI相關(guān)的模塊引用
from PyQt5.QtWidgets import * from PyQt5.QtGui import *
核心組件
from PyQt5.QtCore import *
主題樣式模塊引用
from QCandyUi import CandyWindow
在這個應(yīng)用中使用一個默認(rèn)的楊氏模塊QCandyUi,可以改變整個應(yīng)用的主題顏色設(shè)計(jì)不用一個控件一個控件的去修改樣式。有一個不好的地方就是應(yīng)用本身設(shè)置的標(biāo)題和應(yīng)用圖標(biāo)不能生效,必須利用這個樣式控件CandyWindow來修改,就像下面這樣需要將我們自己寫的UI空間放到里面。
# w = CandyWindow.createWindow(EDataDel(), theme='blueGreen', title='Excel批數(shù)據(jù)去重器 公眾號:[Python 集中營]', # ico_path='數(shù)據(jù)去重.ico') # w.show()
應(yīng)用操作相關(guān)模塊
import sys import os
Excel數(shù)據(jù)處理模塊
import pandas as pd import openpyxl as pxl
UI界面布局設(shè)計(jì)、信號量槽函數(shù)綁定實(shí)現(xiàn)
class EDataDel(QWidget):
def __init__(self):
super(EDataDel, self).__init__()
self.init_ui()
def init_ui(self):
self.brower = QTextBrowser()
self.brower.setReadOnly(True)
self.brower.setFont(QFont('微軟雅黑', 8))
self.brower.setPlaceholderText('處理進(jìn)程展示區(qū)域...')
self.brower.ensureCursorVisible()
form = QFormLayout()
self.file_paths = QLineEdit()
self.file_paths.setReadOnly(True)
self.file_paths_btn = QPushButton()
self.file_paths_btn.setText('加載批文件')
self.file_paths_btn.clicked.connect(self.file_paths_btn_click)
self.colums_label = QLabel()
self.colums_label.setText('自定義去重復(fù)列')
self.colums_text = QLineEdit()
self.colums_text.setPlaceholderText('列名1,列名2,列名3,...')
form.addRow(self.file_paths, self.file_paths_btn)
form.addRow(self.colums_label, self.colums_text)
self.work = DataWork(self)
self.work.trigger.connect(self.update_log)
self.work.finished.connect(self.finished)
vbox = QVBoxLayout()
self.start_btn = QPushButton()
self.start_btn.setText('開始執(zhí)行')
self.start_btn.clicked.connect(self.start_btn_click)
vbox.addLayout(form)
vbox.addWidget(self.start_btn)
hbox = QHBoxLayout()
hbox.addWidget(self.brower)
hbox.addLayout(vbox)
self.setLayout(hbox)
def file_paths_btn_click(self):
paths = QFileDialog.getOpenFileNames(self, '選擇文件', os.getcwd(), 'Excel Files(*.xlsx)')
files = paths[0]
path_strs = ''
for file in files:
path_strs = path_strs + file + ';'
self.file_paths.setText(path_strs)
if self.file_paths.text().strip() != '':
self.update_log('已經(jīng)完成批文件路徑加載!')
else:
self.update_log('沒有選擇任何文件!')
def save_dir_btn_click(self):
directory = QFileDialog.getExistingDirectory(self, '選擇文件夾', os.getcwd())
self.save_dir.setText(directory)
def update_log(self, text):
cursor = self.brower.textCursor()
cursor.movePosition(QTextCursor.End)
self.brower.append(text)
self.brower.setTextCursor(cursor)
self.brower.ensureCursorVisible()
def start_btn_click(self):
self.start_btn.setEnabled(False)
self.work.start()
def finished(self, finished):
if finished is True:
self.start_btn.setEnabled(True)
創(chuàng)建子線程,處理業(yè)務(wù)邏輯(清理Excel重復(fù)文件)
class DataWork(QThread):
trigger = pyqtSignal(str)
finished = pyqtSignal(bool)
def __init__(self, parent=None):
super(DataWork, self).__init__(parent)
self.parent = parent
self.working = True
def __del__(self):
self.working = False
self.wait()
def run(self):
self.trigger.emit('啟動批量處理子線程...')
file_paths = self.parent.file_paths.text().strip()
colums_text = self.parent.colums_text.text().strip()
colums = []
if ',' in colums_text:
colums = colums_text.split(',')
else:
colums.append(colums_text)
self.trigger.emit('獲取配置項(xiàng)完成!')
for file in file_paths.split(';'):
if file.strip() != '':
web_sheet = pxl.load_workbook(file)
sheets = web_sheet.sheetnames
print(file)
new_file = file.split('.')[0] + '_已去重.' + file.split('.')[1]
print(new_file)
writer = pd.ExcelWriter(new_file)
for sheet in sheets:
sheet_name = sheet.title()
print(sheet_name)
self.trigger.emit('準(zhǔn)備處理工作表名稱:' + str(sheet.title()))
data_frame = pd.read_excel(file, sheet_name=sheet_name)
print(data_frame)
repe = data_frame.duplicated(subset=colums)
repe = repe[repe]
print(data_frame.iloc[repe.index])
res = data_frame.drop_duplicates(subset=colums)
print(res)
self.trigger.emit(str(sheet.title()) + ':已清除')
res.to_excel(writer, sheet_name, index=False)
writer.save()
else:
self.trigger.emit('當(dāng)前文件路徑為空,繼續(xù)...')
self.trigger.emit('數(shù)據(jù)處理完成...')
self.finished.emit(True)
使用主函數(shù)啟動整個應(yīng)用
if __name__ == '__main__':
app = QApplication(sys.argv)
w = CandyWindow.createWindow(EDataDel(), theme='blueGreen', title='Excel批數(shù)據(jù)去重器 公眾號:[Python 集中營]',
ico_path='數(shù)據(jù)去重.ico')
w.show()
sys.exit(app.exec_())以上就是基于PyQt5制作Excel文件數(shù)據(jù)去重小工具的詳細(xì)內(nèi)容,更多關(guān)于PyQt5數(shù)據(jù)去重的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
pandas對dataFrame中某一個列的數(shù)據(jù)進(jìn)行處理的方法
這篇文章主要介紹了pandas對dataFrame中某一個列的數(shù)據(jù)進(jìn)行處理的方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-07-07
用PyQt進(jìn)行Python圖形界面的程序的開發(fā)的入門指引
這篇文章主要介紹了用PyQt進(jìn)行Python圖形界面的程序的開發(fā)的入門指引,來自于IBM官方網(wǎng)站技術(shù)文檔,需要的朋友可以參考下2015-04-04
Python實(shí)現(xiàn)的科學(xué)計(jì)算器功能示例
這篇文章主要介紹了Python實(shí)現(xiàn)的科學(xué)計(jì)算器功能,涉及Python基于數(shù)值運(yùn)算與事件響應(yīng)實(shí)現(xiàn)科學(xué)計(jì)算器功能相關(guān)操作技巧,需要的朋友可以參考下2017-08-08
基于django 的orm中非主鍵自增的實(shí)現(xiàn)方式
這篇文章主要介紹了基于django 的orm中非主鍵自增的實(shí)現(xiàn)方式,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-05-05
Python matplotlib實(shí)現(xiàn)多重圖的繪制
Matplotlib作為Python的2D繪圖庫,它以各種硬拷貝格式和跨平臺的交互式環(huán)境生成出版質(zhì)量級別的圖形。本文將利用Matplotlib庫繪制多重圖,感興趣的可以了解一下2022-03-03
Python+gensim實(shí)現(xiàn)文本相似度分析詳解
這篇文章主要介紹了Python+gensim實(shí)現(xiàn)文本相似度分析詳解,在開發(fā)中我們會遇到進(jìn)行文本相似度分析的需求,計(jì)算文本相似度,用于鑒別文章是否存在抄襲,需要的朋友可以參考下2023-07-07
PyTorch中的參數(shù)類torch.nn.Parameter()詳解
這篇文章主要給大家介紹了關(guān)于PyTorch中torch.nn.Parameter()的相關(guān)資料,要內(nèi)容包括基礎(chǔ)應(yīng)用、實(shí)用技巧、原理機(jī)制等方面,文章通過實(shí)例介紹的非常詳細(xì),需要的朋友可以參考下2022-02-02

