【安防知識(shí)網(wǎng)】聲音識(shí)別系統(tǒng)可應(yīng)用的范圍很廣,如可用于電話(huà)與通信網(wǎng)絡(luò)、人機(jī)接口、安防監(jiān)控、股票交易與銀行取款、智能玩具、刑偵破案、罪犯跟蹤、國(guó)防監(jiān)聽(tīng)、財(cái)產(chǎn)保護(hù)等方面。
用于電話(huà)與通信網(wǎng)絡(luò)
如在電話(huà)機(jī)、手機(jī)中已經(jīng)包含了語(yǔ)音識(shí)別撥號(hào)功能,人們可以通過(guò)語(yǔ)音命令方便地從遠(yuǎn)端的數(shù)據(jù)庫(kù)系統(tǒng)中查詢(xún)與提取有關(guān)的信息。如人們可以通過(guò)電話(huà)網(wǎng)絡(luò),用語(yǔ)音識(shí)別口語(yǔ)對(duì)話(huà)系統(tǒng)查詢(xún)有關(guān)的機(jī)票、旅游、銀行等信息。
美國(guó)主要電信運(yùn)營(yíng)商Sprint的PCS部門(mén),自2000年以來(lái)為客戶(hù)開(kāi)通了語(yǔ)音驅(qū)動(dòng)系統(tǒng),提供客戶(hù)服務(wù)、語(yǔ)音撥號(hào)、查號(hào)和更改地址等業(yè)務(wù)。2001年9月開(kāi)通的可以自然方式對(duì)話(huà)的咨詢(xún)系統(tǒng),更實(shí)現(xiàn)了以自然、開(kāi)放的詢(xún)問(wèn)方式實(shí)時(shí)獲得所需要的信息。加拿大最大的電信運(yùn)營(yíng)商,也擁有多個(gè)語(yǔ)音驅(qū)動(dòng)系統(tǒng),提供從客戶(hù)服務(wù),增值業(yè)務(wù)和資訊服務(wù)多種功能。這些系統(tǒng)不但減少了用戶(hù)的投訴,并為無(wú)線(xiàn)網(wǎng)絡(luò)服務(wù)增值,從而增強(qiáng)了客戶(hù)的誠(chéng)信度,也開(kāi)辟了新的收入來(lái)源。
用于人機(jī)接口
現(xiàn)在,聲音識(shí)別正逐步成為信息技術(shù)中人機(jī)接口的關(guān)鍵技術(shù),聲音識(shí)別技術(shù)與語(yǔ)音合成技術(shù)結(jié)合使人們能夠甩掉鍵盤(pán),通過(guò)語(yǔ)音命令進(jìn)行操作。因?yàn)殡S著計(jì)算機(jī)的小型化,鍵盤(pán)已經(jīng)成為移動(dòng)平臺(tái)的一個(gè)很大障礙,如果手機(jī)僅僅只有一個(gè)手表那么大,再用鍵盤(pán)進(jìn)行撥號(hào)操作已經(jīng)是不可能的。所以,聲音識(shí)別技術(shù)的研發(fā)與應(yīng)用,已經(jīng)成為一個(gè)具有競(jìng)爭(zhēng)性的新興高科技術(shù)產(chǎn)業(yè)。
用于股票交易與銀行取款物
1996年9月,Charles Schwab開(kāi)通了首個(gè)大規(guī)模商用語(yǔ)音識(shí)別應(yīng)用系統(tǒng),股票報(bào)價(jià)系統(tǒng)與語(yǔ)音股票交易系統(tǒng)。該系統(tǒng)有效地提高了服務(wù)質(zhì)量和客戶(hù)滿(mǎn)意度,并減少了呼叫中心的費(fèi)用。
尤其在銀行的應(yīng)用上,還可同密碼一同打開(kāi)保險(xiǎn)箱柜與儲(chǔ)蓄取款,既方便又可靠。
用于刑偵破案、打擊恐怖分子
公安刑警采用聲音識(shí)別技術(shù),可利用暗藏在犯罪分子的電話(huà)、錄像或者其他證據(jù)中的聲音資料,和嫌疑人的聲音進(jìn)行對(duì)比,以尋找到真正的兇手。
實(shí)施綁架的罪犯往往會(huì)通過(guò)電話(huà)向被害者的家屬索要贖金,警方可通過(guò)聲音識(shí)別從數(shù)個(gè)嫌疑人中認(rèn)出罪犯。如日本曾經(jīng)發(fā)生一起綁架少女案。女孩的父親接到一個(gè)人打來(lái)的電話(huà),要他用重金贖回女兒。警方作了電話(huà)錄音,然后在廣播電臺(tái)和電視臺(tái)播放了這次電話(huà)錄音。經(jīng)群眾檢舉,有10多個(gè)人被警方列為嫌疑人,并通過(guò)各種渠道錄下嫌疑人的聲音。經(jīng)過(guò)聲紋鑒定,終于從這些嫌疑人中找到了真正的罪犯。
此外,現(xiàn)代的恐怖分子有恃無(wú)恐,制造恐怖事件后往往還會(huì)拍下一段錄像宣稱(chēng)為某事件負(fù)責(zé),安全局的特警就可以根據(jù)這些聲音資料,分析錄像中的聲音是否為恐怖分子本人的聲音,從而可以為追查恐怖分子獲得新的線(xiàn)索。
用于法庭作證
因辦案講究的是證據(jù),而聲音也是偵查犯罪的一項(xiàng)有力證據(jù)。為此,研究聲音證據(jù)的“法庭語(yǔ)音學(xué)”(Forensic Phonetics)成為了法庭醫(yī)學(xué)的一門(mén)重要的分支學(xué)科。除了聲紋技術(shù)外,法庭語(yǔ)音學(xué)的研究方法還包括制作聲譜圖和進(jìn)行聲音比較聲譜圖,對(duì)聲音加以記錄,并將其轉(zhuǎn)變?yōu)槁曌V圖或聲紋的直觀(guān)形式。在進(jìn)行聲音比較時(shí),聲音識(shí)別專(zhuān)家會(huì)對(duì)聲音的相似之處以及不同之處加以辨別,這些相似或不同之處涉及呼吸方式、語(yǔ)調(diào)的抑揚(yáng)變化、不尋常的語(yǔ)音習(xí)慣方言等。因此,要利用“法庭語(yǔ)音學(xué)”成為偵查犯罪的有利幫手,就需要建立一套像指紋系統(tǒng)那樣的自動(dòng)化的語(yǔ)音鑒定系統(tǒng)。
到了20世紀(jì)70年代,日本、羅馬尼亞、德國(guó)等國(guó)家都相繼開(kāi)展了聲紋鑒定技術(shù),以對(duì)付恐怖犯罪活動(dòng)。最近幾年來(lái),世界各國(guó)的司法機(jī)構(gòu)都開(kāi)始接受聲紋證據(jù)。在美國(guó),已有八分之七的州上訴法院承認(rèn)聲紋可作為法庭證據(jù),美國(guó)的軍事法庭也采用聲紋作為證據(jù)。隨著科學(xué)技術(shù)的進(jìn)步,聲紋鑒定手段也日益先進(jìn)。
用于國(guó)防監(jiān)聽(tīng)
聲音識(shí)別用于國(guó)防監(jiān)聽(tīng),從下述的例證就知其重要性。如美軍在近幾年使用的EP-3偵察機(jī)上,安裝了最先進(jìn)的聲音識(shí)別系統(tǒng)。這種聲音自動(dòng)識(shí)別系統(tǒng)功能強(qiáng)大,只要被偵察者通過(guò)無(wú)線(xiàn)電進(jìn)行對(duì)話(huà),系統(tǒng)便能查明通話(huà)者的身份,尤其是高層領(lǐng)導(dǎo)者的身份更是全在識(shí)別之列,從而判斷出從中掌握到的情報(bào)的價(jià)值到底有多大。要做到這一點(diǎn)在以前是一件難以想像的事,因?yàn)樵胍魡?wèn)題無(wú)法解決?,F(xiàn)在,監(jiān)聽(tīng)系統(tǒng)能自己刪除靜電等其他雜音,然后通過(guò)與聲音數(shù)據(jù)庫(kù)相對(duì)照,就能識(shí)別出通話(huà)者的身份。
多年來(lái),美國(guó)建有一個(gè)功能強(qiáng)大的資料數(shù)據(jù)系統(tǒng),儲(chǔ)存有世界上幾乎所有領(lǐng)導(dǎo)人的各種相關(guān)資料。所有的國(guó)家領(lǐng)導(dǎo)人由于其口音、停頓、用詞或表達(dá)習(xí)慣不同,因此都有著特定的識(shí)別方式。對(duì)于采集到的各國(guó)領(lǐng)導(dǎo)人的聲音資料,為便于使用,美國(guó)中央情報(bào)局對(duì)聲音加以記錄,并將其轉(zhuǎn)變?yōu)槁曌V圖或聲紋的直觀(guān)形式。當(dāng)卡塔爾電視臺(tái)播出薩達(dá)姆的講話(huà)錄音后,他們首先將錄音帶中的聲音與資料庫(kù)中存儲(chǔ)的聲音進(jìn)行對(duì)比,辨別出其相似之處及不同之處,這些相似或不同之處涉及呼吸方式、語(yǔ)調(diào)的抑揚(yáng)變化、不尋常的語(yǔ)音習(xí)慣以及地方方言等。從而發(fā)現(xiàn)資料庫(kù)中的聲紋與錄音帶中的聲紋基本一致,而且包含有部分相同的單詞。所以,美國(guó)中央情報(bào)局當(dāng)時(shí)認(rèn)定錄音帶中的聲音“十有八九是薩達(dá)姆本人”。
美國(guó)國(guó)家安全局還把聲音識(shí)別技術(shù)用于辨別“榜上有名”的恐怖分子,如本·拉登。美軍只有把其新舊講話(huà)的聲音作對(duì)比,借此來(lái)判斷他是否真的還存活人世。日本聲響實(shí)驗(yàn)室的研究人員甚至能根據(jù)拉登的聲紋來(lái)判斷他的健康狀況,并發(fā)現(xiàn)拉登在逃亡過(guò)程中的健康狀況持續(xù)惡化等。
用于保護(hù)人民財(cái)產(chǎn)
聲音識(shí)別技術(shù)可以用于保護(hù)人民的財(cái)產(chǎn)不受非法侵犯,人們?cè)谥匾呢?cái)產(chǎn)(比如住房、汽車(chē)、電器)上,可安裝聲音識(shí)別系統(tǒng),只有用戶(hù)本人的聲音可以啟動(dòng)這些財(cái)產(chǎn),而違法分子則對(duì)之束手無(wú)策。
由于聲紋具有不會(huì)遺失或忘記、不需記憶、使用方便等優(yōu)點(diǎn),因此在保護(hù)人們的財(cái)產(chǎn)、防止盜竊或者其他經(jīng)濟(jì)犯罪方面會(huì)有更大的用途。它更適用于電話(huà)銀行、電話(huà)炒股、電子購(gòu)物等領(lǐng)域。
最近,美國(guó)加利福尼亞州一家信用卡公司發(fā)明了一種帶有聲音識(shí)別功能的信用卡,這種信用卡只有在識(shí)別出主人的聲音后才能正常操作,可以有效打擊那些偷取信用卡進(jìn)行消費(fèi)的小偷。信用卡中安裝有一個(gè)小麥克風(fēng)、一個(gè)揚(yáng)聲器和一個(gè)具有聲音識(shí)別功能的芯片。在使用信用卡之前,用戶(hù)必須說(shuō)出密碼,芯片將有聲密碼與事先錄下的密碼相比較,如果密碼符合,卡片將發(fā)出一串“嗶嗶”的聲音,表示可以通過(guò)電話(huà)或商店計(jì)算機(jī)的麥克風(fēng)進(jìn)行交易。如果聲音不符合,則不會(huì)發(fā)聲。目前這一設(shè)備仍在樣品測(cè)試階段,一旦面世它將被用于在電話(huà)和網(wǎng)絡(luò)上驗(yàn)證信用卡用戶(hù)的身份,從而減少信用卡欺詐導(dǎo)致的商家和消費(fèi)者的交易成本。
用于安防監(jiān)聽(tīng),以阻止罪犯繼續(xù)作案
在安防監(jiān)控領(lǐng)域,通常還有監(jiān)聽(tīng),如果安裝有聲音識(shí)別的智能化功能,就可以尋找到通輯逃犯、慣犯以及一切留有聲音檔案的罪犯,從而可及時(shí)阻止這些罪犯繼續(xù)作案。
此外,聲音識(shí)別技術(shù)還可用于門(mén)禁系統(tǒng)及各種鎖具中,使“芝麻開(kāi)門(mén)”變成現(xiàn)實(shí)。
用于智能玩具等
聲音識(shí)別技術(shù)還可用于玩具中,以形成語(yǔ)音智能玩具等產(chǎn)品。