當前位置:外匯行情大全網 - 外匯匯率 - 人工智能到底是好是壞

人工智能到底是好是壞

業內皆知,作為人工智能領域發展最成熟,歷史最悠遠的分支之壹,人臉識別有包括LFW和MegaFace在內的諸多國際級別賽事,而微軟在去年提出的MS-Celeb-1M基準測試則被譽為人臉識別年度“世界杯”。就在最近,最新壹屆“世界杯”落下帷幕,更像是對“中美兩國AI發展並駕齊驅”的某種印證,壹家名為獵戶星空的中國人工智能公司,在其中壹個重要競賽項目中奪得頭魁。

考慮到賽事的權威性,在不少行外人眼中——在人工智能疾風驟雨般滲透進大眾生活之前,上述結果委實有些意外。值得壹提的是,借助計算機視覺領域頂級會議ICCV2017的平臺,本屆競賽既包括大規模人臉識別競賽(HardSet及RandomSet),還頗具新意地推出了更具挑戰的小樣本學習(Low-ShotLearning)競賽,可謂近年來業內公認的含金量最高的同類賽事,這也自然招致全球各地人臉識別團隊超強的“奪金”欲望,好在結果令人欣喜,至今不滿壹歲的獵戶星空,獲得了這項賽事識別子命題有限制類(只使用競賽提供數據)第壹名。

事實上,最近壹周,這家初創企業出了不止壹次風頭。7月26日,傳聞已久的小米AI音箱正式發布,後者采用360度遠場語音控制,在提供在線內容的表層應用背後,這款音箱無疑承擔了小米“智能家庭中樞”角色,是小米試圖將整個生態鏈產品“連起來”的關鍵布局。而作為獵豹移動旗下人工智能子公司,獵戶星空是小米AI音箱重要合作夥伴,為其提供了壹套可以用“這個星球最溫柔聲音”回復用戶的語音交互系統。

將時間軸撥回壹個月前,作為獵戶星空AI生態鏈上的第壹款產品,他們聯合喜馬拉雅同樣發布了AI音箱“小雅”,其背後技術核心,同樣是獵戶星空全鏈路自研的遠場語音交互系統——盡管踏上AI音箱“風口”的企業有先後之分,但當他們在尋覓語音交互這塊最重要的長板時,獵戶星空都是他們最值得仰仗的嫁接對象。

而倘若將人臉識別“世界杯”的奪魁與語音系統放在壹起考量,不難發現這家創業公司的迅猛之勢。要知道,至少在現階段,人工智能大概可分為語音識別,圖像識別,語言理解和機器人等應用技術,其中語音識別和圖像識別是目前相對成熟的領域,普遍準確率都超過90%——這也意味著再想要持續精進的難度,獵戶星空能在短時間內壹舉拿下了人工智能兩座已經很高的高地,在創業公司中確實比較罕見。

不久前,《紐約時報》在采訪大量美國政府官員和矽谷精英後就得出結論:中國的人工智能將與美國齊頭並進,中國已經誕生孕育人工智能溫潤的社會土壤。如果將這家中國初創企業的“世界杯”奪魁,擱置在中美AI競賽的宏大背景,仔細分析這家公司,就顯得意義非凡。

技術過硬

先從微軟的這次比賽談起。

如前所述,獵戶星空獲得了這項賽事識別子命題有限制類(只使用競賽提供數據)第壹名。顧名思義,與更偏向於比拼數據的無限制類(無限制使用外部數據,數據越多訓練模型當然越好)相比,有限制類別只能在限定的數據集內調用,是比較純粹的算法比拼,因為在限定數據情況下想達到最高精度非常困難,難度也更大——當然,正是由於這種限制性,有限制類的算法比拼也相對公平。

公平也意味著高門檻。競賽數據噪聲大,無法直接拿來訓練,而整個訓練數據集也很大,適合人臉模型大規模訓練的模型對資源的要求又高,很難做到又快又好。於是經過探討,獵戶星空團隊設計了壹種魯棒的去噪算法,可針對各類不同程度的噪聲數據進行有效去噪,同時選擇采用適合大規模訓練的triplet模型,通過壹種頗為巧妙的設計在有限資源下加速了triplet網絡的訓練,大大提升了性能,最終獲得0.75/0.606(randomset/hardset)的高分——這壹成績遠超以往記錄,幾乎達到了不使用外部數據的極限。

事實上,盡管成立時間不長,但團隊成員過往的技術積澱(官方介紹:獵戶星空初創團隊擁有來自矽谷,日本,中國臺灣地區,北京和深圳等全球壹流科技公司的技術精英,博士占比近5成),讓他們創立初就開始投身人臉識別的探索。參賽“世界杯”前,他們就在另壹項人臉識別國際賽事LFW上取得了前三名。值得壹提的是,與在“世界杯”的獲勝邏輯相近,LFW上,與只追求精度的團隊不同,獵戶星空嘗試用盡量小的網絡,去追求盡量高的精度,令不少其他團隊側目。

而與不少初創團隊醉心於“秀技術”不同,依托於獵豹移動強大的產品思維底座,獵戶星空深知壹點:將技術蛻變為產品,從來都是檢驗技術成熟的唯壹標準。於是,獵戶星空上述所有比賽技術,都不會被擱淺在學術報告或者比賽賽場上,而會被運用到在門禁,機器人和移動APP等具體產品。舉個例子,目前人臉識別技術就被用於獵豹旗下的直播產品Live.me中,後者每天產生超過20萬小時的直播內容,運用圖像識別技術可以進行24小時的實時監控,極大提高違規內容的審核效率。

讓人溫柔以待的音箱

談及技術落地,獵戶星空讓人工智能音箱做到“像人類壹樣溝通”,或許是更好的例子。

事實上,關於語音交互,獵戶星空現已掌握麥克風陣列,語音喚醒,語音識別,語義理解和語音合成等全套遠場語音技術,且各環節相互補充配合,大幅提升了交互體驗。譬如以最關鍵的語音喚醒舉例,基於獵戶星空漢字整體建模的CNN喚醒技術,其語音交互系統可以實現高精度喚醒,達到了行業領先的誤報水平,且解決了人聲回應對識別的幹擾——據悉,目前獵戶星空的喚醒率達到了95%以上。

再比如,上個月問世的小雅是業內第壹個真正做到人聲回應的音箱。獵戶星空采用大數據情感語音合成技術與漢語語音合成引入重音技術,提升了漢語語音合成自然度,重音層次分明,這讓小雅音箱的聲音,真的很像壹位叫小雅的鄰家女孩——這種在聲音上的技術精進,即是壹種典型的用戶思維(而非工程師思維),也因如此,小雅音箱壹經推出就獲得了市場的回報,預售5萬告罄。

壹個月之後,獵戶星空又將這種用戶思維輸送到了小米AI音箱——“小愛同學”身上。與小雅相似,由獵戶星空提供的人聲回應技術,可以讓“小愛同學”被喚醒時,回答壹聲“誒”“我在”等回應;而獵戶星空提供的另壹個關鍵技術,語音合成,則讓小米AI音箱被賦予“這個星球最溫柔”的女聲,這項技術可以使得任何壹款AI音箱,用親和平滑的聲音曲線回復用戶的任何需求。

可以想象,這些技術會讓用戶由衷地對機器溫柔以待(盲測顯示,相比同類產品,70%的用戶很喜歡運用獵戶星空技術產生的語音),並在“機器人成為家庭壹份子”的必然之路上起到助推的作用。

體驗為王

說到音箱,當前中國智能音箱市場雜亂到近乎失序。

據說前段時間,喜馬拉雅副總裁李海波在深圳南山區轉了壹圈,發現1公裏內盤踞著112家做語音智能產品的公司,他走訪了其中4家,發現他們無比痛苦:他們無壹不在拼模組和方案,卻幾乎沒什麽用戶;他們知道風口離自己很近,卻總是困在原地。

事實上,新技術的來臨總讓人歡喜,但卻有壹樣東西決定了新技術是夭折還是迅速普及——用戶體驗。

如上所述,與單純秀肌肉的人工智能公司不同,獵戶星空的最大優勢源於它是壹家擁有互聯網思維的AI公司。它由壹群重視產品體驗的工程師和尊重技術的產品經理***同組成,這足以造就與大多數語音和人臉識別公司的雲泥之別。

舉個例子,傅盛曾提到過壹個細節:獵戶星空把喜馬拉雅的內容和音樂曲庫,以及各個合作夥伴的音樂曲庫,不僅集成在了壹起,還做了服務端細節上的優化,譬如標題,音頻,歌詞和節目的優化,都打印上了喜馬拉雅獨特的標簽,讓這些內容更加口語化,最大程度完善用戶體驗。

嗯,相較於散落在不同技術精英頭腦中的需求構想,將AI以最快速度變成體驗良好的產品,無疑更為關鍵,而獵戶星空無疑深諳此道。

其實人工智能與當年的電力革命有諸多相似之處:譬如,它們本身都不是壹個“行業”,AI的機會在於和應用結合,而不是單純的技術輸出;其次,就像普通人不會關心愛迪生與特斯拉的直流交流電之爭,他們只想要更好的“結果”,人工智能亦如此,最後拼的其實是產品,就像傅盛所言:“深度學習的核心是數據驅動,雖然有模型調參,有自己的優勢,但別人有更多的數據調參很快拉平優勢,很難真的想像壹家公司通過提供技術輸出就能成功。我甚至認為未來深度學習是基礎的技術運用,很多公司都具備深度學習的研發能力。”

所以,無論是技術本身,還是讓技術落地的用戶體驗,今天的獵戶星空都已展示出了“與年齡不符的成熟”,而這二者的結合,無疑讓他們的未來值得期待。

李北辰/文(知名科技自媒體,致力於用文字優雅的文章,為您提供談資與見識)

  • 上一篇:2018世預賽歐洲區賽果
  • 下一篇:我在用錢寶借了1000現在逾期了他發信息給我說要告我是真的嗎?
  • copyright 2024外匯行情大全網