【算法】機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)最常用到的TOP10算法
數(shù)據(jù)科學(xué)的實(shí)踐,需要使用算法和數(shù)據(jù)科學(xué)方法,來(lái)幫助數(shù)據(jù)專業(yè)人員從數(shù)據(jù)中提取洞察力和價(jià)值。Kaggle最近的一項(xiàng)調(diào)查顯示,數(shù)據(jù)專家在2017年比其他數(shù)據(jù)科學(xué)方法更多地使用數(shù)據(jù)可視化、邏輯回歸、交叉驗(yàn)證和決策樹(shù)技術(shù)。展望2018年,數(shù)據(jù)專業(yè)人員對(duì)學(xué)習(xí)深度學(xué)習(xí)(41%)最感興趣。
Kaggle于2017年8月對(duì)16,000多名數(shù)據(jù)專業(yè)人員進(jìn)行了調(diào)查。 他們的調(diào)查包括數(shù)據(jù)科學(xué),機(jī)器學(xué)習(xí),教育等方面的各種問(wèn)題。 Kaggle發(fā)布了原始調(diào)查數(shù)據(jù),根據(jù)這些調(diào)查數(shù)據(jù),我發(fā)現(xiàn)一些有趣的東西。今天的文章是關(guān)于2017年數(shù)據(jù)專業(yè)人員使用的數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)方法,以及2018年最令他們興奮的機(jī)器學(xué)習(xí)/數(shù)據(jù)科學(xué)方法。
1. 2017年最受歡迎的數(shù)據(jù)科學(xué)/分析工具,技術(shù)和語(yǔ)言
調(diào)查包括一個(gè)針對(duì)數(shù)據(jù)專業(yè)從業(yè)人員的問(wèn)題,“在工作中,你經(jīng)常使用以下數(shù)據(jù)科學(xué)方法? (選擇所有使用的)”。平均而言,數(shù)據(jù)專家在2017年使用了5種(中值)數(shù)據(jù)科學(xué)方法。2017年使用的前5種數(shù)據(jù)科學(xué)方法是(見(jiàn)圖1):
- 數(shù)據(jù)可視化(49%)
- Logistic回歸(42%)
- 交叉驗(yàn)證(38%)
- 決策樹(shù)(36%)
- 隨機(jī)森林(34%)
- 時(shí)間序列分析(31%)
- 神經(jīng)網(wǎng)絡(luò)(28%)
- PCA和維度降低(27%)
- kNN和其他聚類算法(26%)
- 文本分析(25%)
對(duì)于自稱為“數(shù)據(jù)科學(xué)家”的數(shù)據(jù)專業(yè)人員,這些方法的使用率更高。這些數(shù)據(jù)科學(xué)家的采用率大約高出15-20個(gè)百分點(diǎn)(例如,66%用于數(shù)據(jù)可視化,61%用于邏輯回歸, 56%為決策樹(shù),56%為隨機(jī)森林)。
KDNuggets最近的一項(xiàng)調(diào)查發(fā)現(xiàn),與目前的研究結(jié)果類似。在他們的研究中,頂級(jí)數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)方法還包括回歸(60%),聚類(55%),可視化(51%),決策樹(shù)/規(guī)則(51%)和隨機(jī)森林(46%)。
2. 哪些2018年學(xué)習(xí)最為興奮的機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)方法?
另一個(gè)調(diào)查是,所有數(shù)據(jù)專業(yè)人士(不管是否正在工作),了解他們?cè)谙乱荒曜钆d奮的機(jī)器學(xué)習(xí)/數(shù)據(jù)科學(xué)方法。結(jié)果顯示,數(shù)據(jù)專業(yè)人員對(duì)深度學(xué)習(xí)最感興趣:
- 深度學(xué)習(xí)(41%)
- 神經(jīng)網(wǎng)絡(luò)(13%)
- 時(shí)間序列分析(6%)
- 貝葉斯方法(5%)
- 文本挖掘(5%)
3. 小結(jié)
Kaggle對(duì)16,000多名數(shù)據(jù)專家的調(diào)查結(jié)果,揭示了工作中使用的最流行的數(shù)據(jù)科學(xué)方法。數(shù)據(jù)可視化和邏輯回歸列在首位。
毫不奇怪,10位數(shù)據(jù)專業(yè)人士中有4位表示,他們非常高興在明年學(xué)習(xí)深度學(xué)習(xí)。
深度學(xué)習(xí)是一類機(jī)器學(xué)習(xí)算法,它是根據(jù)大腦的信息處理和通信模式建模的。
深度學(xué)習(xí)使用單位層或節(jié)點(diǎn)進(jìn)行特征提取和轉(zhuǎn)換,每層使用前一層的輸出作為輸入。
深度學(xué)習(xí)方法可用于營(yíng)銷,汽車,語(yǔ)音識(shí)別等領(lǐng)域。
這種對(duì)學(xué)習(xí)深度學(xué)習(xí)興趣的同時(shí),調(diào)查結(jié)果還表明,用于深度學(xué)習(xí)的流行的開(kāi)源軟件TensorFlow是專業(yè)人士有興趣學(xué)習(xí)的頂級(jí)工具數(shù)據(jù)。
本文翻譯自:
http://businessoverbroadway.com/top-machine-learning-and-data-science-methods-used-at-work
責(zé)任編輯:售電衡衡
-
權(quán)威發(fā)布 | 新能源汽車產(chǎn)業(yè)頂層設(shè)計(jì)落地:鼓勵(lì)“光儲(chǔ)充放”,有序推進(jìn)氫燃料供給體系建設(shè)
2020-11-03新能源,汽車,產(chǎn)業(yè),設(shè)計(jì) -
中國(guó)自主研制的“人造太陽(yáng)”重力支撐設(shè)備正式啟運(yùn)
2020-09-14核聚變,ITER,核電 -
探索 | 既耗能又可供能的數(shù)據(jù)中心 打造融合型綜合能源系統(tǒng)
2020-06-16綜合能源服務(wù),新能源消納,能源互聯(lián)網(wǎng)
-
新基建助推 數(shù)據(jù)中心建設(shè)將迎爆發(fā)期
2020-06-16數(shù)據(jù)中心,能源互聯(lián)網(wǎng),電力新基建 -
泛在電力物聯(lián)網(wǎng)建設(shè)下看電網(wǎng)企業(yè)數(shù)據(jù)變現(xiàn)之路
2019-11-12泛在電力物聯(lián)網(wǎng) -
泛在電力物聯(lián)網(wǎng)建設(shè)典型實(shí)踐案例
2019-10-15泛在電力物聯(lián)網(wǎng)案例
-
新基建之充電樁“火”了 想進(jìn)這個(gè)行業(yè)要“心里有底”
2020-06-16充電樁,充電基礎(chǔ)設(shè)施,電力新基建 -
燃料電池汽車駛?cè)雽こ0傩占疫€要多久?
-
備戰(zhàn)全面電動(dòng)化 多部委及央企“定調(diào)”充電樁配套節(jié)奏
-
權(quán)威發(fā)布 | 新能源汽車產(chǎn)業(yè)頂層設(shè)計(jì)落地:鼓勵(lì)“光儲(chǔ)充放”,有序推進(jìn)氫燃料供給體系建設(shè)
2020-11-03新能源,汽車,產(chǎn)業(yè),設(shè)計(jì) -
中國(guó)自主研制的“人造太陽(yáng)”重力支撐設(shè)備正式啟運(yùn)
2020-09-14核聚變,ITER,核電 -
能源革命和電改政策紅利將長(zhǎng)期助力儲(chǔ)能行業(yè)發(fā)展
-
探索 | 既耗能又可供能的數(shù)據(jù)中心 打造融合型綜合能源系統(tǒng)
2020-06-16綜合能源服務(wù),新能源消納,能源互聯(lián)網(wǎng) -
5G新基建助力智能電網(wǎng)發(fā)展
2020-06-125G,智能電網(wǎng),配電網(wǎng) -
從智能電網(wǎng)到智能城市
-
山西省首座電力與通信共享電力鐵塔試點(diǎn)成功
-
中國(guó)電建公司公共資源交易服務(wù)平臺(tái)摘得電力創(chuàng)新大獎(jiǎng)
-
電力系統(tǒng)對(duì)UPS的技術(shù)要求