a&s專業(yè)的自動化&安全生態(tài)服務(wù)平臺

公眾號

安全自動化

安防知識網(wǎng)

手機(jī)站

大安防供需平臺

搜索
登錄
|
注冊

搜索

全站搜索
AI應(yīng)用搜索

首頁 > 資訊 > 正文

機(jī)器學(xué)習(xí)新技術(shù)如何助力大數(shù)據(jù)創(chuàng)新應(yīng)用

作者：SAS 2016-12-29 14:33 閱讀 2736 來源：智能電子集成評論區(qū)

隨著數(shù)據(jù)存儲成本下降、分布式處理、更強(qiáng)大的計算機(jī)和出現(xiàn)的分析機(jī)會，人們對于機(jī)器學(xué)習(xí)系統(tǒng)的興趣愈加強(qiáng)烈，本文主要介紹了機(jī)器學(xué)習(xí)新技術(shù)如何助力大數(shù)據(jù)的創(chuàng)新應(yīng)用。

　　機(jī)器學(xué)習(xí)的概念有幾十年，已經(jīng)在金融風(fēng)險控制、患者癥狀識別及治療建議、識別恐怖分子等領(lǐng)域得到應(yīng)用，目前最新進(jìn)展即是用于大數(shù)據(jù)分析，隨著數(shù)據(jù)存儲成本下降、分布式處理、更強(qiáng)大的計算機(jī)和出現(xiàn)的分析機(jī)會，人們對于機(jī)器學(xué)習(xí)系統(tǒng)的興趣愈加強(qiáng)烈。本文主要介紹了機(jī)器學(xué)習(xí)新技術(shù)如何助力大數(shù)據(jù)的創(chuàng)新應(yīng)用。

數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)和統(tǒng)計

　　隨著企業(yè)收集大數(shù)據(jù)，他們開始采用數(shù)據(jù)科學(xué)從中提取知識和重要含義。數(shù)據(jù)科學(xué)是在許多學(xué)科技術(shù)和理論基礎(chǔ)上建立形成的，包括統(tǒng)計、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、人工智能等。數(shù)據(jù)科學(xué)跨學(xué)科性質(zhì)意味著團(tuán)隊成員需要掌握各種學(xué)科的專業(yè)知識。

　　在數(shù)據(jù)科學(xué)領(lǐng)域中，機(jī)器學(xué)習(xí)是人工智能的一個分支，重點實現(xiàn)計算機(jī)工作不用明確編程。這個概念是利用交互式數(shù)據(jù)學(xué)習(xí)算法自動構(gòu)建分析模型。通過選擇更好的模型不斷改進(jìn)結(jié)果，減少人工干預(yù)。然后，利用這些模型做出可靠、可重復(fù)的決定。

　　SAS數(shù)據(jù)科學(xué)部經(jīng)理Thompson指出：“機(jī)器學(xué)習(xí)以構(gòu)建和研究系統(tǒng)為重點，通過數(shù)據(jù)學(xué)習(xí)優(yōu)化性能函數(shù)，如優(yōu)化預(yù)期回報或減少損失函數(shù)。目的是更快地獲得數(shù)據(jù)資源的深入洞察，更加精確地提取數(shù)據(jù)中的知識，提高利潤并降低風(fēng)險。”

　　統(tǒng)計和機(jī)器學(xué)習(xí)在很大程度上存在重疊。這兩個學(xué)科均著重于研究數(shù)據(jù)概括(或預(yù)測)。“統(tǒng)計和機(jī)器學(xué)習(xí)之間的最大區(qū)別是，”Thompson說，“統(tǒng)計更側(cè)重于推理分析或假設(shè)檢驗，從而對規(guī)模遠(yuǎn)大于樣本的數(shù)據(jù)全體進(jìn)行預(yù)測。統(tǒng)計還研究參數(shù)估計、錯誤率、分布假設(shè)等，了解具有隨機(jī)成分的經(jīng)驗數(shù)據(jù)。

　　Thompson補(bǔ)充道：“機(jī)器學(xué)習(xí)使用海量觀測數(shù)據(jù)，作為人工智能的一個分支，專注于自動化。[它側(cè)重于]算法，如隨機(jī)森林或梯度上升，自動處理缺失值、發(fā)現(xiàn)相互作用關(guān)系等。”

　　機(jī)器學(xué)習(xí)的核心概念是算法通過每次迭代，從數(shù)據(jù)中學(xué)習(xí)。Thompson說，“要衡量是否改進(jìn)性能，可以看目標(biāo)函數(shù)，如減少損失函數(shù)。算法通過數(shù)據(jù)迭代，直至符合收斂準(zhǔn)則。通?？梢杂帽Ａ魯?shù)據(jù)驗證是否過度擬合。”

機(jī)器學(xué)習(xí)的算法類型

　　機(jī)器學(xué)習(xí)算法有四種不同類型，可根據(jù)所需算法的結(jié)果或訓(xùn)練機(jī)器輸入的變量類型進(jìn)行分類。Thompson指出，“機(jī)器學(xué)習(xí)中使用的術(shù)語不同于統(tǒng)計。例如，機(jī)器學(xué)習(xí)中目標(biāo)稱為標(biāo)簽，而在統(tǒng)計中，稱為因變量。”四種機(jī)器學(xué)習(xí)類型包監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)及增強(qiáng)學(xué)習(xí)。

　　1.監(jiān)督學(xué)習(xí)

　　“大多數(shù)機(jī)器學(xué)習(xí)是監(jiān)督學(xué)習(xí)–約占70%，” Thompson說。監(jiān)督學(xué)習(xí)算法采用已知預(yù)期結(jié)果的標(biāo)記樣本進(jìn)行“訓(xùn)練”。監(jiān)督學(xué)習(xí)通常用于利用歷史數(shù)據(jù)預(yù)測未來可能出現(xiàn)事件的應(yīng)用。

　　例如，它可以預(yù)測哪些信用卡交易很可能欺詐，哪個保險客戶可能提出索賠。發(fā)生欺詐的情況下，您已經(jīng)知道客戶欺詐，不屬于訓(xùn)練數(shù)據(jù)。學(xué)習(xí)算法接收一組輸入以及相應(yīng)的正確輸出，算法學(xué)習(xí)過程中比較正確輸出與實際輸出，因此可以找出錯誤并相應(yīng)修改模型。輸入在機(jī)器學(xué)習(xí)稱為特征。發(fā)生欺詐的情況下，樣本特征可以是帳戶余額、每日交易金額等。通過分類、回歸、預(yù)測和梯度上升等方法，監(jiān)督學(xué)習(xí)利用輸入預(yù)測標(biāo)簽值。這種模型適用于稱為評分的新場景，無論交易是否欺詐。

　　2.無監(jiān)督學(xué)習(xí)

　　約10%至20%的機(jī)器學(xué)習(xí)是無監(jiān)督學(xué)習(xí)，雖然這方面正在迅速增長。無監(jiān)督學(xué)習(xí)是一種系統(tǒng)采用未標(biāo)記樣本運算的機(jī)器學(xué)習(xí)。這種情況下，系統(tǒng)不告訴“正確答案”。算法找出未標(biāo)記數(shù)據(jù)中的隱藏結(jié)構(gòu)或流形結(jié)構(gòu)。與監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)相比，學(xué)習(xí)器的給定樣本沒有明確目標(biāo)輸出，或每個輸入相關(guān)的回報信號。

　　Thompson指出：“無監(jiān)督學(xué)習(xí)的目標(biāo)是探索數(shù)據(jù)，采用聚類或降維等方法發(fā)現(xiàn)其中的內(nèi)在結(jié)構(gòu)。[無監(jiān)督學(xué)習(xí)] 特別適合用于交易型數(shù)據(jù)。”

　　內(nèi)在結(jié)構(gòu)和無監(jiān)督學(xué)習(xí)相關(guān)方法依數(shù)據(jù)性質(zhì)而不同。例如，歐幾里得空間中的數(shù)據(jù)可按概率、密度進(jìn)行結(jié)構(gòu)建模，并可采用k均值聚類、高斯混合模型和主成分分析 (PCA) 等方法降維;而一般拓?fù)淇臻g中的數(shù)據(jù)只是局部歐幾里德，其結(jié)構(gòu)最好按非線性流形建模，可通過 ISOMAP、局部線性嵌入 (LLE)、拉普拉斯特征映射、核PCA和其他方法實現(xiàn)降維。此外，矩陣分解、主題模型和圖形是文本、圖像和社交媒體數(shù)據(jù)無監(jiān)督學(xué)習(xí)流行的結(jié)構(gòu)模型。

　　3.半監(jiān)督學(xué)習(xí)

　　半監(jiān)督學(xué)習(xí)用于監(jiān)督學(xué)習(xí)相同的應(yīng)用。但這種技術(shù)使用標(biāo)記和未標(biāo)記數(shù)據(jù)進(jìn)行訓(xùn)練–通常標(biāo)記數(shù)據(jù)數(shù)量小，未標(biāo)記數(shù)據(jù)數(shù)量大。

　　這種學(xué)習(xí)與分類、回歸和預(yù)測等方法結(jié)合使用。當(dāng)標(biāo)記數(shù)據(jù)成本過高，無法全部采用標(biāo)記數(shù)據(jù)進(jìn)行訓(xùn)練，而獲取未標(biāo)記數(shù)據(jù)相對廉價的情況下，適合采用半監(jiān)督學(xué)習(xí)。

　　半監(jiān)督學(xué)習(xí)至少有兩種不同方式的解釋。第一種解釋，使用未標(biāo)記數(shù)據(jù)通知計算機(jī)算法監(jiān)督學(xué)習(xí)相關(guān)的結(jié)構(gòu)化數(shù)據(jù)信息，這被認(rèn)為是主要目的。這種觀點認(rèn)為，當(dāng)標(biāo)簽不足時，無標(biāo)記數(shù)據(jù)提供輔助信息有助于強(qiáng)化監(jiān)督學(xué)習(xí)。第二種解釋，主要目的是將無監(jiān)督學(xué)習(xí)(例如聚類)，以及標(biāo)簽視為輔助信息 (聚類情況下的聚類指標(biāo))，幫助算法找到正確的內(nèi)在數(shù)據(jù)結(jié)構(gòu)。這種情況下，當(dāng)內(nèi)在數(shù)據(jù)結(jié)構(gòu)不是很清楚，對常規(guī)無監(jiān)督學(xué)習(xí)方法構(gòu)成挑戰(zhàn)時，標(biāo)簽特別有用。

　　這方面早期例子包括圖像分析 –如攝像頭人臉識別–文本分析和

　　疾病檢測。

　　4.增強(qiáng)學(xué)習(xí)

　　采用增強(qiáng)學(xué)習(xí)，算法通過試驗和錯誤發(fā)現(xiàn)產(chǎn)生最大回報的動作。增強(qiáng)學(xué)習(xí)三個主要組成部分：代理(學(xué)習(xí)者或決策者)、環(huán)境（代理交互的所有系統(tǒng)）、動作（代理可以做的動作）。

　　Thompson指出：“目的是支持代理選擇給定時間周期內(nèi)實現(xiàn)最大預(yù)期回報的動作。代理遵守良好策略可以更快地實現(xiàn)目標(biāo)，因此增強(qiáng)學(xué)習(xí)的目的是學(xué)習(xí)最佳策略。”增強(qiáng)學(xué)習(xí)通用于機(jī)器人和導(dǎo)航。

　　增強(qiáng)學(xué)習(xí)與最優(yōu)控制、統(tǒng)計及運籌學(xué)具有緊密聯(lián)系。馬爾可夫決策過程 (MDP) 是增強(qiáng)學(xué)習(xí)常用模型。MDP假設(shè)代理觀測的是理想環(huán)境狀態(tài)。如果不是這樣，可以使用一種叫做部分觀測馬爾可夫決策過程 (或POMDP) 更普通的模型，查找解決狀態(tài)不確定性、同時最大化長期回報的策略。

1 2 3 下一頁

免責(zé)聲明：本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的，皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方，且不允許本站使用您的字體和圖片文字等素材，請聯(lián)系我們，本站核實后將立即刪除！任何版權(quán)方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網(wǎng)絡(luò)碰瓷及敲詐勒索，將不予任何的法律和經(jīng)濟(jì)賠償！敬請諒解！

您可能也喜歡這些文章

參與評論

回復(fù)：

0/300

文明上網(wǎng)理性發(fā)言，評論區(qū)僅供其表達(dá)個人看法，并不表明a&s觀點。

0

推薦專題

熱門排行

關(guān)于我們

a&s傳媒是全球知名展覽公司法蘭克福展覽集團(tuán)旗下的專業(yè)媒體平臺，自1994年品牌成立以來，一直專注于安全&自動化產(chǎn)業(yè)前沿產(chǎn)品、技術(shù)及市場趨勢的專業(yè)媒體傳播和品牌服務(wù)。從安全管理到產(chǎn)業(yè)數(shù)字化，a&s傳媒擁有首屈一指的國際行業(yè)展覽會資源以及豐富的媒體經(jīng)驗，提供媒體、活動、展會等整合營銷服務(wù)。

全球網(wǎng)站
法蘭克福
asmag.com
asmag.com.cn
中國臺灣智慧安防網(wǎng)

免責(zé)聲明：本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的，皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方，且不允許本站使用您的字體和圖片文字等素材，請聯(lián)系我們，本站核實后將立即刪除！任何版權(quán)方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網(wǎng)絡(luò)碰瓷及敲詐勒索，將不予任何的法律和經(jīng)濟(jì)賠償！敬請諒解！

粵公網(wǎng)安備 44030402000264號

用戶
反饋

久久久18,天天躁夜夜躁狠狠躁婷婷,国产成人三级一区二区在线观看一,最近的2019中文字幕视频 ,最新免费av在线观看

機(jī)器學(xué)習(xí)新技術(shù)如何助力大數(shù)據(jù)創(chuàng)新應(yīng)用

數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)和統(tǒng)計