Python增量循環(huán)刪除MySQL表數(shù)據(jù)的方法
需求場(chǎng)景:
有一業(yè)務(wù)數(shù)據(jù)庫(kù),使用MySQL 5.5版本,每天會(huì)寫(xiě)入大量數(shù)據(jù),需要不定期將多表中“指定時(shí)期前“的數(shù)據(jù)進(jìn)行刪除,在SQL SERVER中很容易實(shí)現(xiàn),寫(xiě)幾個(gè)WHILE循環(huán)就搞定,雖然MySQL中也存在類似功能,怎奈自己不精通,于是采用Python來(lái)實(shí)現(xiàn)
話不多少,上腳本:
# coding: utf-8
import MySQLdb
import time
# delete config
DELETE_DATETIME = '2016-08-31 23:59:59'
DELETE_ROWS = 10000
EXEC_DETAIL_FILE = 'exec_detail.txt'
SLEEP_SECOND_PER_BATCH = 0.5
DATETIME_FORMAT = '%Y-%m-%d %X'
# MySQL Connection Config
Default_MySQL_Host = 'localhost'
Default_MySQL_Port = 3358
Default_MySQL_User = "root"
Default_MySQL_Password = 'roo@01239876'
Default_MySQL_Charset = "utf8"
Default_MySQL_Connect_TimeOut = 120
Default_Database_Name = 'testdb001'
def get_time_string(dt_time):
"""
獲取指定格式的時(shí)間字符串
:param dt_time: 要轉(zhuǎn)換成字符串的時(shí)間
:return: 返回指定格式的字符串
"""
global DATETIME_FORMAT
return time.strftime(DATETIME_FORMAT, dt_time)
def print_info(message):
"""
將message輸出到控制臺(tái),并將message寫(xiě)入到日志文件
:param message: 要輸出的字符串
:return: 無(wú)返回
"""
print(message)
global EXEC_DETAIL_FILE
new_message = get_time_string(time.localtime()) + chr(13) + str(message)
write_file(EXEC_DETAIL_FILE, new_message)
def write_file(file_path, message):
"""
將傳入的message追加寫(xiě)入到file_path指定的文件中
請(qǐng)先創(chuàng)建文件所在的目錄
:param file_path: 要寫(xiě)入的文件路徑
:param message: 要寫(xiě)入的信息
:return:
"""
file_handle = open(file_path, 'a')
file_handle.writelines(message)
# 追加一個(gè)換行以方便瀏覽
file_handle.writelines(chr(13))
file_handle.close()
def get_mysql_connection():
"""
根據(jù)默認(rèn)配置返回?cái)?shù)據(jù)庫(kù)連接
:return: 數(shù)據(jù)庫(kù)連接
"""
conn = MySQLdb.connect(
host=Default_MySQL_Host,
port=Default_MySQL_Port,
user=Default_MySQL_User,
passwd=Default_MySQL_Password,
connect_timeout=Default_MySQL_Connect_TimeOut,
charset=Default_MySQL_Charset,
db=Default_Database_Name
)
return conn
def mysql_exec(sql_script, sql_param=None):
"""
執(zhí)行傳入的腳本,返回影響行數(shù)
:param sql_script:
:param sql_param:
:return: 腳本最后一條語(yǔ)句執(zhí)行影響行數(shù)
"""
try:
conn = get_mysql_connection()
print_info("在服務(wù)器{0}上執(zhí)行腳本:{1}".format(
conn.get_host_info(), sql_script))
cursor = conn.cursor()
if sql_param is not None:
cursor.execute(sql_script, sql_param)
row_count = cursor.rowcount
else:
cursor.execute(sql_script)
row_count = cursor.rowcount
conn.commit()
cursor.close()
conn.close()
except Exception, e:
print_info("execute exception:" + str(e))
row_count = 0
return row_count
def mysql_query(sql_script, sql_param=None):
"""
執(zhí)行傳入的SQL腳本,并返回查詢結(jié)果
:param sql_script:
:param sql_param:
:return: 返回SQL查詢結(jié)果
"""
try:
conn = get_mysql_connection()
print_info("在服務(wù)器{0}上執(zhí)行腳本:{1}".format(
conn.get_host_info(), sql_script))
cursor = conn.cursor()
if sql_param != '':
cursor.execute(sql_script, sql_param)
else:
cursor.execute(sql_script)
exec_result = cursor.fetchall()
cursor.close()
conn.close()
return exec_result
except Exception, e:
print_info("execute exception:" + str(e))
def get_id_range(table_name):
"""
按照傳入的表獲取要?jiǎng)h除數(shù)據(jù)最大ID、最小ID、刪除總行數(shù)
:param table_name: 要?jiǎng)h除的表
:return: 返回要?jiǎng)h除數(shù)據(jù)最大ID、最小ID、刪除總行數(shù)
"""
global DELETE_DATETIME
sql_script = """
SELECT
MAX(ID) AS MAX_ID,
MIN(ID) AS MIN_ID,
COUNT(1) AS Total_Count
FROM {0}
WHERE create_time <='{1}';
""".format(table_name, DELETE_DATETIME)
query_result = mysql_query(sql_script=sql_script, sql_param=None)
max_id, min_id, total_count = query_result[0]
# 此處有一坑,可能出現(xiàn)total_count不為0 但是max_id 和min_id 為None的情況
# 因此判斷max_id和min_id 是否為NULL
if (max_id is None) or (min_id is None):
max_id, min_id, total_count = 0, 0, 0
return max_id, min_id, total_count
def delete_data(table_name):
max_id, min_id, total_count = get_id_range(table_name)
temp_id = min_id
while temp_id <= max_id:
sql_script = """
DELETE FROM {0}
WHERE id <= {1}
and id >= {2}
AND create_time <='{3}';
""".format(table_name, temp_id + DELETE_ROWS, temp_id, DELETE_DATETIME)
temp_id += DELETE_ROWS
print(sql_script)
row_count = mysql_exec(sql_script)
print_info("影響行數(shù):{0}".format(row_count))
current_percent = (temp_id - min_id) * 1.0 / (max_id - min_id)
print_info("當(dāng)前進(jìn)度{0}/{1},剩余{2},進(jìn)度為{3}%".format(temp_id, max_id, max_id - temp_id, "%.2f" % current_percent))
time.sleep(SLEEP_SECOND_PER_BATCH)
print_info("當(dāng)前表{0}已無(wú)需要?jiǎng)h除的數(shù)據(jù)".format(table_name))
delete_data('TB001')
delete_data('TB002')
delete_data('TB003')
執(zhí)行效果:

實(shí)現(xiàn)原理:
由于表存在自增ID,于是給我們?cè)隽垦h(huán)刪除的機(jī)會(huì),查找出滿足刪除條件的最大值ID和最小值ID,然后按ID 依次遞增,每次小范圍內(nèi)(如10000條)進(jìn)行刪除。
實(shí)現(xiàn)優(yōu)點(diǎn):
實(shí)現(xiàn)“小斧子砍大柴”的效果,事務(wù)小,對(duì)線上影響較小,打印出當(dāng)前處理到的“ID”,可以隨時(shí)關(guān)閉,稍微修改下代碼便可以從該ID開(kāi)始,方便。
實(shí)現(xiàn)不足:
為防止主從延遲太高,采用每次刪除SLEEP1秒的方式,相對(duì)比較糙,最好的方式應(yīng)該是周期掃描這條復(fù)制鏈路,根據(jù)延遲調(diào)整SLEEP的周期,反正都腳本化,再智能化點(diǎn)又何妨!
以上所述是小編給大家介紹的Python增量循環(huán)刪除MySQL表數(shù)據(jù),希望對(duì)大家有所幫助,如果大家有任何疑問(wèn)請(qǐng)給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對(duì)腳本之家網(wǎng)站的支持!
相關(guān)文章
python subprocess 殺掉全部派生的子進(jìn)程方法
下面小編就為大家?guī)?lái)一篇python subprocess 殺掉全部派生的子進(jìn)程方法。小編覺(jué)得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2017-01-01
Django框架ORM操作數(shù)據(jù)庫(kù)不生效問(wèn)題示例解決方法
本文詳細(xì)描述使用Django 的ORM框架操作PostgreSQL數(shù)據(jù)庫(kù)刪除不生效問(wèn)題的定位過(guò)程及解決方案,并總結(jié)使用ORM框架操作數(shù)據(jù)庫(kù)不生效的問(wèn)題的通用定位方法,感興趣的朋友跟隨小編一起看看吧2023-01-01
Python爬蟲(chóng)之對(duì)CSDN榜單進(jìn)行分析
這篇文章主要介紹了Python爬蟲(chóng)之對(duì)CSDN榜單進(jìn)行分析,文章有詳細(xì)代碼,簡(jiǎn)單易懂,小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2023-01-01
Python minidom模塊用法示例【DOM寫(xiě)入和解析XML】
這篇文章主要介紹了Python minidom模塊用法,結(jié)合實(shí)例形式分析了Python DOM創(chuàng)建、寫(xiě)入和解析XML文件相關(guān)操作技巧,需要的朋友可以參考下2019-03-03
Python使用quote()函數(shù)對(duì)接口請(qǐng)求值進(jìn)行URL編碼
在接口測(cè)試自動(dòng)化中,我們經(jīng)常會(huì)遇到需要構(gòu)建HTTP請(qǐng)求的情況,尤其是POST請(qǐng)求,確保所有的參數(shù)都正確地進(jìn)行了URL編碼是非常重要的一步,Python標(biāo)準(zhǔn)庫(kù)中的urllib.parse.quote函數(shù)就是專門(mén)用來(lái)進(jìn)行這種轉(zhuǎn)碼的工具,所以本文介紹了使用quote()函數(shù)對(duì)接口請(qǐng)求值進(jìn)行URL編碼2024-08-08
Linux RedHat下安裝Python2.7開(kāi)發(fā)環(huán)境
這篇文章主要為大家詳細(xì)介紹了Linux RedHat下安裝Python2.7、pip、ipython環(huán)境、eclipse和PyDev環(huán)境,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2017-05-05

