解決python存數(shù)據(jù)庫速度太慢的問題
問題
在項目中遇到一個問題,需要從文本中讀取三萬條數(shù)據(jù)寫入mysql數(shù)據(jù)庫,文件中為用@分割的sql語句,但是在讀取的過程中發(fā)現(xiàn)速度過慢,三萬八千條數(shù)據(jù)需要220秒,問題代碼片段如下:
def read_to_mysql(filecata, targetDir):
'''
用來寫入數(shù)據(jù)庫,寫入后會剪貼掉文件
filecata 為保存有文件地址的list,已去掉尾部的空格
:param filecata: 文件目錄
:param targetDir: 要復(fù)制的目標目錄
:return:
'''
root_dir = os.path.abspath(os.path.join(os.getcwd(), "./"))
config = configparser.ConfigParser()
config.read(root_dir + "/config.ini")
__host = config.get("DatabaseOfWRT", "host")
__database_name = config.get("DatabaseOfWRT", "database")
__user_name = config.get("DatabaseOfWRT", "username")
__user_passwaord = config.get("DatabaseOfWRT", "password")
__charset = config.get("DatabaseOfWRT", "charset")
conn = pymysql.connect(
host=__host,
user=__user_name, password=__user_passwaord,
database=__database_name,
charset=__charset
)
cursor = conn.cursor()
with open(filecata, "r", encoding='utf-8') as f:
data = f.read() # 讀取文件
data_list = data.split('@')
del data_list[-1]
starttime = int(time.time())
for data_str in data_list:
data_str = str(data_str)
sql = data_str + ';'
cursor.execute(sql)
conn.commit()
print(flag)
copy_del_file(filecata, targetDir) # 用來剪切的函數(shù),此處不影響,因而省略
cursor.close()
conn.close()
解決方案
經(jīng)測試發(fā)現(xiàn),影響速度的主要原因是commit(),因為沒過幾秒提交一次即可,但是因為提交的字符長度有限制,所以要設(shè)置一個合理的時間讀取,代碼修改如下:
def read_to_mysql(filecata, targetDir):
'''
用來寫入數(shù)據(jù)庫,寫入后會剪貼掉文件
filecata 為保存有文件地址的list,已去掉尾部的空格
:param filecata:
:param targetDir: 要復(fù)制的目標目錄
:return:
'''
root_dir = os.path.abspath(os.path.join(os.getcwd(), "./"))
config = configparser.ConfigParser()
config.read(root_dir + "/config.ini")
__host = config.get("DatabaseOfWRT", "host")
__database_name = config.get("DatabaseOfWRT", "database")
__user_name = config.get("DatabaseOfWRT", "username")
__user_passwaord = config.get("DatabaseOfWRT", "password")
__charset = config.get("DatabaseOfWRT", "charset")
conn = pymysql.connect(
host=__host,
user=__user_name, password=__user_passwaord,
database=__database_name,
charset=__charset
)
cursor = conn.cursor()
with open(filecata, "r", encoding='utf-8') as f:
data = f.read() # 讀取文件
data_list = data.split('@')
del data_list[-1]
starttime = int(time.time())
for data_str in data_list:
endtime = int(time.time())
data_str = str(data_str)
sql = data_str + ';'
cursor.execute(sql)
if endtime - starttime ==10: # 每過十秒提交一次
starttime = int(time.time())
conn.commit()
conn.commit()
copy_del_file(filecata, targetDir)
cursor.close()
conn.close()
return flag
此時寫入三萬八千條數(shù)據(jù)需要9秒
補充:python 連數(shù)據(jù)庫cursur.fetchall ()速度慢的解決方案
解決游標遍歷慢的方法:
一行一行去遍歷,而不是一下全部讀取出來
將cursur.fetchall()更改為for i in cursur:
補充:python 讀取文件時速度的問題
"""舉例 讀取文件"""
# 第一種方式
with open('test.txt', 'r', encoding='utf-8') as f:
info = f.readlines()
for line in info:
pass
# 第二種方式
with open('test.txt', 'r', encoding='utf-8') as f:
for line in f:
pass
對于以上兩種方式讀取文件,各自有各自的用途,當用兩種方式都可以時,第二種方式的效率是第一種的幾個量級, readlines()將文件內(nèi)容讀取到內(nèi)存的list中,操作雖然方便,但是消耗內(nèi)存,運行效率慢。
原生的f是將文件內(nèi)容讀到生成器中, 當需要操作時,從生成器中循環(huán)出來,速度很快,操作大文件時建議用第二種方式!
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。
相關(guān)文章
python3 破解 geetest(極驗)的滑塊驗證碼功能
這篇文章主要介紹了python3 破解 geetest(極驗)的滑塊驗證碼功能,本文通過實例代碼給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2018-02-02
PyQt5中QPushButton的用法詳細解析與應(yīng)用實戰(zhàn)
PyQt5 是一個用于創(chuàng)建圖形用戶界面的 Python 綁定庫,它基于 Qt5 應(yīng)用程序框架,在 PyQt5 中,QPushButton 是一個常用的控件,用于創(chuàng)建按鈕,允許用戶通過點擊來觸發(fā)某些操作,本文將詳細介紹 QPushButton 的用法,并通過實際案例來展示其強大的功能2024-07-07
python?dowhy數(shù)據(jù)估計因果分析功能探索
這篇文章主要為大家介紹了python?dowhy數(shù)據(jù)估計因果分析功能實例探索,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2024-02-02
python3爬蟲獲取html內(nèi)容及各屬性值的方法
今天小編就為大家分享一篇python3爬蟲獲取html內(nèi)容及各屬性值的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-12-12
python 如何將兩個實數(shù)矩陣合并為一個復(fù)數(shù)矩陣
這篇文章主要介紹了使用python實現(xiàn)將兩個實數(shù)矩陣合并為一個復(fù)數(shù)矩陣的操作,具有很好的參考價值,希望對大家有所幫助。2021-05-05

