Python寫入MySQL數(shù)據(jù)庫的三種方式詳解
大家好,Python 讀取數(shù)據(jù)自動(dòng)寫入 MySQL 數(shù)據(jù)庫,這個(gè)需求在工作中是非常普遍的,主要涉及到 python 操作數(shù)據(jù)庫,讀寫更新等,數(shù)據(jù)庫可能是 mongodb、 es,他們的處理思路都是相似的,只需要將操作數(shù)據(jù)庫的語法更換即可。
本篇文章會(huì)給大家分享數(shù)據(jù)如何寫入到 mysql,分為兩個(gè)場景,三種方式。
場景一:數(shù)據(jù)不需要頻繁的寫入mysql
使用 navicat 工具的導(dǎo)入向?qū)Чδ?。支持多種文件格式,可以根據(jù)文件的字段自動(dòng)建表,也可以在已有表中插入數(shù)據(jù),非??旖莘奖?。


場景二:數(shù)據(jù)是增量的,需要自動(dòng)化并頻繁寫入mysql
測試數(shù)據(jù):csv 格式 ,大約 1200萬行
import pandas as pd
data = pd.read_csv('./tianchi_mobile_recommend_train_user.csv')
data.shape
打印結(jié)果

方式一
python + pymysql 庫
安裝 pymysql 命令
pip install pymysql
代碼實(shí)現(xiàn):
import pymysql
# 數(shù)據(jù)庫連接信息
conn = pymysql.connect(
host='127.0.0.1',
user='root',
passwd='wangyuqing',
db='test01',
port = 3306,
charset="utf8")
# 分塊處理
big_size = 100000
# 分塊遍歷寫入到 mysql
with pd.read_csv('./tianchi_mobile_recommend_train_user.csv',chunksize=big_size) as reader:
for df in reader:
datas = []
print('處理:',len(df))
# print(df)
for i ,j in df.iterrows():
data = (j['user_id'],j['item_id'],j['behavior_type'],
j['item_category'],j['time'])
datas.append(data)
_values = ",".join(['%s', ] * 5)
sql = """insert into users(user_id,item_id,behavior_type
,item_category,time) values(%s)""" % _values
cursor = conn.cursor()
cursor.executemany(sql,datas)
conn.commit()
# 關(guān)閉服務(wù)
conn.close()
cursor.close()
print('存入成功!')

方式二
pandas + sqlalchemy:pandas需要引入sqlalchemy來支持sql,在sqlalchemy的支持下,它可以實(shí)現(xiàn)所有常見數(shù)據(jù)庫類型的查詢、更新等操作。
代碼實(shí)現(xiàn):
from sqlalchemy import create_engine
engine = create_engine('mysql+pymysql://root:wangyuqing@localhost:3306/test01')
data = pd.read_csv('./tianchi_mobile_recommend_train_user.csv')
data.to_sql('user02',engine,chunksize=100000,index=None)
print('存入成功!')

總結(jié)
pymysql 方法用時(shí)12分47秒,耗時(shí)還是比較長的,代碼量大,而 pandas 僅需五行代碼就實(shí)現(xiàn)了這個(gè)需求,只用了4分鐘左右。
最后補(bǔ)充下,方式一需要提前建表,方式二則不需要。
所以推薦大家使用第二種方式,既方便又效率高。如果還覺得速度慢的小伙伴,可以考慮加入多進(jìn)程、多線程。
最全的三種將數(shù)據(jù)存入到 MySQL 數(shù)據(jù)庫方法:
- 直接存,利用 navicat 的導(dǎo)入向?qū)Чδ?/li>
- Python pymysql
- Pandas sqlalchemy
到此這篇關(guān)于Python寫入MySQL數(shù)據(jù)庫的三種方式詳解的文章就介紹到這了,更多相關(guān)Python寫入MySQL內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python Pygame實(shí)戰(zhàn)之塔防游戲的實(shí)現(xiàn)
這篇文章主要介紹了如何利用Python中的Pygame模塊制作簡單的塔防小游戲,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以跟隨小編一起動(dòng)手試一試2022-03-03
Django基礎(chǔ)知識 web框架的本質(zhì)詳解
這篇文章主要介紹了Django基礎(chǔ)知識 web框架的本質(zhì)詳解,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-07-07
Python使用ConfigParser模塊操作配置文件的方法
這篇文章主要介紹了Python使用ConfigParser模塊操作配置文件的方法,結(jié)合實(shí)例形式分析了Python基于ConfigParser模塊針對配置文件的創(chuàng)建、讀取、寫入、判斷等相關(guān)操作技巧,需要的朋友可以參考下2018-06-06
python函數(shù)的默認(rèn)參數(shù)請勿定義可變類型詳解
這篇文章主要介紹了python函數(shù)的默認(rèn)參數(shù)請勿定義可變類型詳解,具有很好的參考價(jià)值,希望對大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-02-02
Python利用FFT進(jìn)行簡單濾波的實(shí)現(xiàn)
今天小編就為大家分享一篇Python利用FFT進(jìn)行簡單濾波的實(shí)現(xiàn),具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-02-02
Python安裝時(shí)常見報(bào)錯(cuò)以及解決方案
這篇文章主要介紹了在安裝Python、配置環(huán)境變量、使用pip以及運(yùn)行Python腳本時(shí)常見的錯(cuò)誤及其解決方案,文中介紹的非常詳細(xì),需要的朋友可以參考下2025-02-02
python使用requests?POST提交一個(gè)鍵多個(gè)值方式
這篇文章主要介紹了python使用requests?POST提交一個(gè)鍵多個(gè)值方式,具有很好的參考價(jià)值,希望對大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-02-02
基于logstash實(shí)現(xiàn)日志文件同步elasticsearch
這篇文章主要介紹了基于logstash實(shí)現(xiàn)日志文件同步elasticsearch,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-08-08
keras實(shí)現(xiàn)多種分類網(wǎng)絡(luò)的方式
這篇文章主要介紹了keras實(shí)現(xiàn)多種分類網(wǎng)絡(luò)的方式,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-06-06
Python人工智能之混合高斯模型運(yùn)動(dòng)目標(biāo)檢測詳解分析
運(yùn)動(dòng)目標(biāo)檢測是計(jì)算機(jī)視覺領(lǐng)域中的一個(gè)重要內(nèi)容,其檢測效果將會(huì)對目標(biāo)跟蹤與識別造成一定的影響,本文將介紹用Python來進(jìn)行混合高斯模型運(yùn)動(dòng)目標(biāo)檢測,感興趣的朋友快來看看吧2021-11-11

