PHP開發(fā)者常犯的10個MySQL錯誤更正剖析
更新時間:2012年01月30日 16:16:48 作者:
最近看到一篇文章:《PHP開發(fā)者常犯的10個MySQL錯誤》,發(fā)現(xiàn)文中不少內(nèi)容陳舊,隨著時間推移技術(shù)發(fā)展變化而變得不適用。為了防止誤導(dǎo)新手,特本著與時俱進的精神寫出此文,絕非對原文作者的不尊重
1.使用MyISAM而不是InnoDB
完全錯誤,反駁理由:
首先原文說MyISAM是默認(rèn)使用的,而實際上到了MySQL 5.5.x,InnoDB已經(jīng)成為了默認(rèn)的表引擎。
另外,簡單的使用InnoDB不是解決所有問題的方法,盲目的使用甚至?xí)箲?yīng)用性能下降10%乃至40%。
最佳方法還是針對具體業(yè)務(wù)具體處理,例如論壇中版塊表,新聞分類表,各種碼表等長時間不操作的表,還是要用性能優(yōu)異的MyISAM引擎。
而需要用到事務(wù)處理的例如用戶、賬目、流水等嚴(yán)格要求數(shù)據(jù)完整性和時序性的,則需要用InnoDB引擎,并且應(yīng)用也要用好事務(wù)處理機制。當(dāng)然,事務(wù)處理必然要帶來大量的性能損耗,但是這在簡單高并發(fā)應(yīng)用上是必須的。
最后,外鍵約束在公共web互聯(lián)網(wǎng)應(yīng)用上一般是不用的,因為他會嚴(yán)重影響性能。數(shù)據(jù)完整性還是靠程序員或者應(yīng)用架構(gòu)本身的健壯來維護。而正規(guī)的第三范式只是在企業(yè)內(nèi)部MIS系統(tǒng)和12306這種網(wǎng)站上使用。
2.使用PHP的mysql方法
不完全錯,但要酌情選用:
mysqli固然好,但是不是所有的服務(wù)器都為PHP編譯了mysqli的支持。
當(dāng)你的應(yīng)用如果是能確定只用自己部署的服務(wù)器,而應(yīng)用也是完全自己開發(fā),則mysqli是最好的選擇。
但是一旦你的應(yīng)用有可能部署在虛擬主機或者由其他人部署(例如分布式項目),還是老老實實使用mysql函數(shù)集吧,好好封裝一下或者使用成熟框架杜絕sql注入。
3.不過濾用戶輸入
這一點不用說了,要么MagicQuote,要么選用成熟框架。sql注入老話題了。
4.不使用UTF-8
大部分情況下對,但也要認(rèn)真考慮:
要知道,一個UTF-8字符占3個字節(jié),所以比GBK等其他編碼的文件大33%。換句話說,相同的網(wǎng)頁用UTF-8編碼如果是100KB,那么換成GBK編碼則只有66KB。所以即便你的PHP確定要用UTF-8,那么前端頁面也要根據(jù)情況選擇需要的編碼。但是,如果PHP用UTF-8,前端模版是GBK,再加上模版引擎不強大,那么轉(zhuǎn)碼工作夠你受的。所以盡可能的選用自己需要的編碼,而不是簡單的選擇UTF-8了事。
最后啰嗦一句:UTF-8下:strlen("我")=3,而GBK下:strlen("我")=2
5.該用SQL的地方使用PHP
同樣酌情考慮:
例如,有些人習(xí)慣在建表時,默認(rèn)值填寫CURRENT_TIMESTAMP,用來達(dá)到注冊時間、發(fā)帖時間的效果。 或者在時間判斷的SQL語句中,寫類似SELECT x FROM tab1 WHERE regdate 正確做法是:不要使用MySQL的任何時間函數(shù),而是在應(yīng)用里計算時間。如果是分布式應(yīng)用,一定要有時間服務(wù)器來統(tǒng)一管理時間。
而文中說的一些MySQL數(shù)學(xué)函數(shù) ,也是要慎用。因為在大型應(yīng)用中,數(shù)據(jù)庫的負(fù)擔(dān)往往是最大的,而復(fù)雜的WHERE語句又是造成慢查詢的元兇。所以,要把計算盡可能的放在廉價的、不影響全局穩(wěn)定的應(yīng)用服務(wù)器上,而不是核心數(shù)據(jù)庫上。
6.不優(yōu)化查詢
這點也不用說了,大型應(yīng)用上甚至不允許使用各種JOIN,哪怕生寫兩條查詢,查回來在用PHP合并數(shù)據(jù)。
7.使用錯誤的數(shù)據(jù)類型
INT,TinyINT,VARCHAR,CHAR,TEXT這些字段類型的合理選用無可厚非。
而Date、DateTime、TIMESTAMP這三種類型,在大型應(yīng)用中是絕對不可以使用的,而是要用INT(10) UNSIGNED代替。
一個是性能,另外就是應(yīng)用中尤其是PHP對UNIX_TIMESTAMP時間戳的轉(zhuǎn)化實在太方便了。用Date要輸出各種時間格式反而麻煩。
8.在SELECT查詢中使用*
共勉
9.索引不足或者過度索引
索引是必須的,但是如果索引都解決不了的查詢,考慮memcache或者nosql解決方案吧。
10.不備份
這條是作者湊數(shù)么?
11.另外:不考慮其他數(shù)據(jù)庫
這條相當(dāng)正確。應(yīng)用中不僅要針對應(yīng)用選擇其他數(shù)據(jù)庫,甚至還要針對具體的業(yè)務(wù)類型,在同一套應(yīng)用中并行使用多種數(shù)據(jù)庫。哪怕不是數(shù)據(jù)庫,而是其他各種緩存、內(nèi)存存儲等解決方案。
完全錯誤,反駁理由:
首先原文說MyISAM是默認(rèn)使用的,而實際上到了MySQL 5.5.x,InnoDB已經(jīng)成為了默認(rèn)的表引擎。
另外,簡單的使用InnoDB不是解決所有問題的方法,盲目的使用甚至?xí)箲?yīng)用性能下降10%乃至40%。
最佳方法還是針對具體業(yè)務(wù)具體處理,例如論壇中版塊表,新聞分類表,各種碼表等長時間不操作的表,還是要用性能優(yōu)異的MyISAM引擎。
而需要用到事務(wù)處理的例如用戶、賬目、流水等嚴(yán)格要求數(shù)據(jù)完整性和時序性的,則需要用InnoDB引擎,并且應(yīng)用也要用好事務(wù)處理機制。當(dāng)然,事務(wù)處理必然要帶來大量的性能損耗,但是這在簡單高并發(fā)應(yīng)用上是必須的。
最后,外鍵約束在公共web互聯(lián)網(wǎng)應(yīng)用上一般是不用的,因為他會嚴(yán)重影響性能。數(shù)據(jù)完整性還是靠程序員或者應(yīng)用架構(gòu)本身的健壯來維護。而正規(guī)的第三范式只是在企業(yè)內(nèi)部MIS系統(tǒng)和12306這種網(wǎng)站上使用。
2.使用PHP的mysql方法
不完全錯,但要酌情選用:
mysqli固然好,但是不是所有的服務(wù)器都為PHP編譯了mysqli的支持。
當(dāng)你的應(yīng)用如果是能確定只用自己部署的服務(wù)器,而應(yīng)用也是完全自己開發(fā),則mysqli是最好的選擇。
但是一旦你的應(yīng)用有可能部署在虛擬主機或者由其他人部署(例如分布式項目),還是老老實實使用mysql函數(shù)集吧,好好封裝一下或者使用成熟框架杜絕sql注入。
3.不過濾用戶輸入
這一點不用說了,要么MagicQuote,要么選用成熟框架。sql注入老話題了。
4.不使用UTF-8
大部分情況下對,但也要認(rèn)真考慮:
要知道,一個UTF-8字符占3個字節(jié),所以比GBK等其他編碼的文件大33%。換句話說,相同的網(wǎng)頁用UTF-8編碼如果是100KB,那么換成GBK編碼則只有66KB。所以即便你的PHP確定要用UTF-8,那么前端頁面也要根據(jù)情況選擇需要的編碼。但是,如果PHP用UTF-8,前端模版是GBK,再加上模版引擎不強大,那么轉(zhuǎn)碼工作夠你受的。所以盡可能的選用自己需要的編碼,而不是簡單的選擇UTF-8了事。
最后啰嗦一句:UTF-8下:strlen("我")=3,而GBK下:strlen("我")=2
5.該用SQL的地方使用PHP
同樣酌情考慮:
例如,有些人習(xí)慣在建表時,默認(rèn)值填寫CURRENT_TIMESTAMP,用來達(dá)到注冊時間、發(fā)帖時間的效果。 或者在時間判斷的SQL語句中,寫類似SELECT x FROM tab1 WHERE regdate 正確做法是:不要使用MySQL的任何時間函數(shù),而是在應(yīng)用里計算時間。如果是分布式應(yīng)用,一定要有時間服務(wù)器來統(tǒng)一管理時間。
而文中說的一些MySQL數(shù)學(xué)函數(shù) ,也是要慎用。因為在大型應(yīng)用中,數(shù)據(jù)庫的負(fù)擔(dān)往往是最大的,而復(fù)雜的WHERE語句又是造成慢查詢的元兇。所以,要把計算盡可能的放在廉價的、不影響全局穩(wěn)定的應(yīng)用服務(wù)器上,而不是核心數(shù)據(jù)庫上。
6.不優(yōu)化查詢
這點也不用說了,大型應(yīng)用上甚至不允許使用各種JOIN,哪怕生寫兩條查詢,查回來在用PHP合并數(shù)據(jù)。
7.使用錯誤的數(shù)據(jù)類型
INT,TinyINT,VARCHAR,CHAR,TEXT這些字段類型的合理選用無可厚非。
而Date、DateTime、TIMESTAMP這三種類型,在大型應(yīng)用中是絕對不可以使用的,而是要用INT(10) UNSIGNED代替。
一個是性能,另外就是應(yīng)用中尤其是PHP對UNIX_TIMESTAMP時間戳的轉(zhuǎn)化實在太方便了。用Date要輸出各種時間格式反而麻煩。
8.在SELECT查詢中使用*
共勉
9.索引不足或者過度索引
索引是必須的,但是如果索引都解決不了的查詢,考慮memcache或者nosql解決方案吧。
10.不備份
這條是作者湊數(shù)么?
11.另外:不考慮其他數(shù)據(jù)庫
這條相當(dāng)正確。應(yīng)用中不僅要針對應(yīng)用選擇其他數(shù)據(jù)庫,甚至還要針對具體的業(yè)務(wù)類型,在同一套應(yīng)用中并行使用多種數(shù)據(jù)庫。哪怕不是數(shù)據(jù)庫,而是其他各種緩存、內(nèi)存存儲等解決方案。
相關(guān)文章
PHP字符轉(zhuǎn)義相關(guān)函數(shù)小結(jié)(php下的轉(zhuǎn)義字符串)
PHP字符轉(zhuǎn)義相關(guān)函數(shù)小結(jié),有時候為了安全起見,我們需要對用戶輸入的字符串進行轉(zhuǎn)義2007-04-04
PHP建立MySQL與MySQLi持久化連接(長連接)區(qū)別
MySQL是一種流行的關(guān)系型數(shù)據(jù)庫,而PHP為其提供了兩種不同的API,即MySQL和MySQLi,在使用這兩個API時,我們可以選擇使用持久連接或非持久連接,MySQL的持久連接需使用`mysql_pconnect`,而MySQLi持久連接默認(rèn)啟用,使用持久連接時應(yīng)注意服務(wù)器連接限制和資源占用問題2025-02-02
php關(guān)于array_multisort多維數(shù)組排序的使用說明
對于PHP語言中的多維數(shù)組排序時最為復(fù)雜的一個排序方式。我們在實際編碼中將會用到PHP函數(shù)array_multisort()來實現(xiàn)這一復(fù)雜的排序。2011-01-01

