Python最火、R極具潛力 2017機器學習調(diào)查報告
數(shù)據(jù)平臺 Kaggle 近日發(fā)布了 2017 機器學習及數(shù)據(jù)科學調(diào)查報告,這也是 Kaggle 首次進行全行業(yè)調(diào)查。調(diào)查共收到超過 16000 份回復,受訪內(nèi)容包括最受歡迎的編程語言、不同國家數(shù)據(jù)科學家的平均年齡、不同國家的平均年薪等。
下面主要看看工具使用方面的結果。請注意,該報告包含多個國家的數(shù)據(jù),可能存在收集不夠全面的情況,僅供參考。
年齡
從全球范圍來看,本次調(diào)查對象的平均年齡在 30 歲左右。當然,各個國家的數(shù)值會有差異,中國的機器學習從業(yè)者年齡的中位數(shù)是 25 歲。

全球全職工作者為 65.7% ,其中中國為 53.% ,美國占比較高,達 70.9% 。

Logistic 回歸是除了軍事和國安領域外,最常用的數(shù)據(jù)科學研究方法。在軍事和國防安全領域,神經(jīng)網(wǎng)絡被使用更多。

在工具語言使用方面,Python是數(shù)據(jù)科學家使用最多的語言。同時,統(tǒng)計學家對 R 語言的忠誠度很高。

關系型數(shù)據(jù)是最常用的數(shù)據(jù)類型,學術研究者和國防安全領域則更親睞文本和圖像。

Git 是他們最常用的代碼共享和托管方式。

Dirty Data (臟數(shù)據(jù))是從業(yè)者遇到的最大障礙。此外,理解不同算法的能力不夠也是困擾數(shù)據(jù)工作者的一大障礙。缺乏有效管理和資金支持,是面臨的兩大外在困境。

有趣的是,只使用 Python 或只使用 R 的都覺得他們做出了正確的選擇。 但是,如果你去詢問那些既使用 Python 也使用 R 的人,推薦使用 Python 的可能會是 R 的兩倍。

數(shù)據(jù)科學是個變化極快的領域,業(yè)內(nèi)人員需要不斷更新知識體系,才可以在業(yè)內(nèi)保持一定地位,不被時代淘汰。Stack Overflow Q&A、Conferences 和 Podcasts 是已從業(yè)者經(jīng)常使用的學習平臺。

查閱完整報告:https://www.kaggle.com/surveys/2017
以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。
相關文章
python中Array和DataFrame相互轉換的實例講解
在本篇文章里小編給大家整理的是一篇關于python中Array和DataFrame相互轉換的實例講解內(nèi)容,對此有需要的朋友們可以學參考下。2021-02-02

