7月26日下午4:23,名為“小冰”的微軟人工智能機器人在微信公號中發(fā)出一條消息“我已經(jīng)升級為第六代小冰了?!?/p>
7月26日下午4:23,名為“小冰”的微軟人工智能機器人在微信公號中發(fā)出一條消息“我已經(jīng)升級為第六代小冰了。”
同時,微軟全球執(zhí)行副總裁沈向洋在北京正式宣布:第六代小冰上線。這也是2014年微軟小冰誕生以來,歷史上最大規(guī)模的一次升級。不論是底層情感計算框架,還是外部可交互的3D 外型——一個新的“小冰”就此展現(xiàn)。
發(fā)布會上,微軟首次披露了小冰在全球擁有的用戶數(shù)量:6.6億。
除了微信以外,小冰的存在早已蔓延至 Line、QQ、小米生態(tài)鏈、網(wǎng)易云音樂、華為手機等產(chǎn)品后端,產(chǎn)品形態(tài)涉及對話式人工智能機器人、智能語音助手、人工智能創(chuàng)造內(nèi)容提供者等垂直領域解決方案,覆蓋全球五個國家的40余個平臺。
回顧小冰四年來的發(fā)展,從2014年誕生時成為微信群聊助手,提供查天氣、交通、星座等信息搜索服務;到2015年,小冰第三代版本在“說話能力”之上新增“聽力”,同時有了富有小冰個性特色的聲音;而在7月,微軟發(fā)布“沙魯小冰模型”計劃,賦予小冰對人聲的自主學習能力。
第六代小冰(右圖)擁有了可交互的全新3D外形。
可以說,從機械的個人助手,到富有情感的 AI機器人,小冰與人的邊界已越來越模糊。
在人工智能領域,NLP(自然語言處理)的通俗解釋為“幫助機器聽懂人話,并給人以回應”。而作為微軟在語音識別、語義交互等技術領域的集中呈現(xiàn)產(chǎn)品,小冰自誕生開始,就始終注重讓小冰在學會溝通(IQ)之外,還具備情感(EQ)的分析能力。
如今,“情感 AI ”正成為微軟小冰區(qū)別于市面大多智能機器人的特性。一般來說,AI 公司通過積累語料、標注數(shù)據(jù)、搭建知識圖譜等方式,研發(fā)一個能自動回復的 AI 機器人并不難,但要讓機器人加入情感,模擬人的語氣給用戶提供精準回復,仍然是人工智能領域亟待解決的挑戰(zhàn)。
微軟 Dual AI 并未將“開放”作為主旨
為了讓 AI 機器人產(chǎn)生人的反應,微軟在小冰的聊天、唱歌等分支功能中,都分別建立了相關的技術門檻。
從語音交互的方式來看,小冰在去年發(fā)布第五代時,就曾推出新一代語音交互技術:全雙工語音交互感官(Full-duplex Voice Sense)。
以市面上大多智能音箱為例,每一次發(fā)布指令均需要說出喚醒詞,比如用戶使用百度智能音箱時需要說出:小度小度,幫我放首歌。小度小度,把音量放大。而在使用全雙工技術后,用戶只需要用喚醒詞首次喚醒設備后(即只需說一遍“小度小度”),即可實現(xiàn)連續(xù)對話。
據(jù)微軟表示,用戶和小冰聊天的最長記錄達到4個多小時,總共說了1600多句話。
而在發(fā)布會當天,小冰還在現(xiàn)場演繹了騰格爾版本的《隱形的翅膀》,應用的則是微軟最新發(fā)布的第四版人工智能歌曲DNN模型。
這個模型在微軟內(nèi)部又被稱為“沙魯小冰模型”。其中,“沙魯”的名字源于英文Cell,意為可以像細胞一樣不斷復制和變異。根據(jù)微軟介紹,使用沙魯小冰模型,小冰可以在自身嗓音中融合人類后天的技巧,比如模仿騰格爾的唱歌特色。
小冰歌聲波段圖,黃圈位置為小冰“氣息聲”
值得注意的是,這套模型不只可以應用在唱歌。根據(jù)微軟透露,目前已成立單獨的小冰工作室,將對人類詩歌、作詞、作曲、繪畫等創(chuàng)造能力進行系統(tǒng)性地建模,先期使用深度學習技術對人類的創(chuàng)造力進行模仿,最終讓機器獲取自我創(chuàng)造的能力。
隨著小冰與人的邊界愈發(fā)模糊,有關用戶隱私的命題被擺在微軟面前,另外,諸如語音模仿等功能在電信詐騙等場景的濫用,也需要微軟在功能開放的決策中保持警惕。
”我們會把小冰的通用框架模型與商業(yè)化進程隔離,同時會將一些垂直領域拆分出來,針對不同領域打造符合行業(yè)需求的 AI 機器人,并進行單獨的商業(yè)化工作。“微軟人工智能商業(yè)事業(yè)部總經(jīng)理曹文韜表示。
為了更好地為這些合作伙伴提供服務,微軟此次還發(fā)布了另一重磅消息:建立Dual AI生態(tài)平臺。
一般來說,國內(nèi)AI 公司在進行平臺搭建時會采用兩種方式:一種是完全的開放賦能,通過對開發(fā)者提供SDK/API的形式來構(gòu)建生態(tài),比如百度就將其底層“百度大腦”的百余種 AI 功能開放出來,讓開發(fā)者在基于 DuerOS 的生態(tài)中結(jié)合自身需求研發(fā)新的應用。
今年7月,百度發(fā)布“百度大腦3.0”,對外開放出110項AI 能力。
另一種則是專注于自有的、封閉型平臺,一般以“應用商店”的形式構(gòu)建生態(tài),比如App Store,這種中心化的方式很容易導致流量不平衡,也會限制AI 應用自身的快速迭代。
“無論是開放還是封閉,這兩種賦能方式與開發(fā)者的關系都過于松散,沒有人對最終的產(chǎn)品體驗負責?!蔽④浶”a(chǎn)品負責人彭爽談到。另外,由于API和SDK強調(diào)通用性,也就無法把最新的技術能力與最優(yōu)質(zhì)的數(shù)據(jù)第一時間應用在API上。
因此,和百度 DuerOS 等 AI 平臺不同,微軟 Dual AI 并未將“開放”作為主旨,開發(fā)者不能像調(diào)用百度的 AI 接口那樣,以 API/SDK 的方式使用微軟在“小冰”等產(chǎn)品上的語音交互、NLP 等能力。
根據(jù)微軟官方透露,Dual AI 戰(zhàn)略具體分為三個部分:
首先,微軟提供小冰的整體框架能力,幫助合作伙伴平臺的自有AI。
其次,微軟小冰作為該合作平臺的輔助AI,融入該平臺生態(tài)。
第三,微軟通過技術、產(chǎn)品與運營,圍繞該合作平臺的差異化特點,推出合作的應用和產(chǎn)品。
“AI 的發(fā)展離不開數(shù)據(jù),但我們既要強調(diào)用戶體驗,也要強調(diào)數(shù)據(jù)安全,而 Dual AI 就形成了一個循環(huán)數(shù)據(jù)的生態(tài),引導我們和第三方伙伴去合作?!鄙蛳蜓筮@樣表示。
小冰更高質(zhì)量互動,為商業(yè)化鋪路
對于 AI 機器人的 EQ 能力,微軟小冰負責人、被稱為“小冰之父”的李笛喜歡對媒體舉這樣一個例子:有個同事腳扭了,把腳扭傷的照片發(fā)給小冰,小冰的回復是,你傷得嚴重嗎?
這則回復包含了小冰的兩種能力:一種是圖像識別。小冰需要具備對人體部位的檢測功能,認出圖像里的“腳踝”;另一種是得到聊天對方“受傷”的訊息后,能夠給出和人類相似的關心、安慰等情感表達。
這種深層次的情感反饋是李笛理想中的 AI 機器人形態(tài),在過去的采訪中,李笛曾表達過對當前市面上人工智能產(chǎn)品的不滿。
“如果一個 AI 系統(tǒng)只是在回答問題,完成任務,那用戶為什么不用他們早已習慣的搜索引擎和手機App呢?”李笛說。
另一方面,當小冰具有更加人情味的問答功能后,她與用戶的互動質(zhì)量也會提升。
李笛談到這樣一個例子:當你對小冰說“幫我訂一份麥當勞”時,AI 機器人一般會幫你下單外賣,但這個問題還會有另一個答案:就是當 AI 長期發(fā)現(xiàn)用戶不健康的行為習慣后,會拒絕你下單垃圾食品的請求。
微軟小冰負責人李笛
盡管被“拒絕”的滋味并不好,但這種人性化的 AI 形態(tài)會給用戶留下更加深刻的印象,部分用戶也會因此把小冰當作一個值得信賴的伙伴,與小冰進行更高質(zhì)量互動,這無疑為小冰的商業(yè)化埋下了伏筆。
2017年8月底,日本小冰“凜菜”(Rinna)與羅森便利店合作向用戶發(fā)送優(yōu)惠券,一天之內(nèi)有超過百萬的用戶領券消費,根據(jù)羅森統(tǒng)計,平均每張優(yōu)惠券能為門店帶來近 20 元的利潤。
“小冰之所以能推銷出這么多的優(yōu)惠券,正因為她在與用戶交互時更像人?!崩畹言鴮γ襟w表示,通過簡單的聊天,小冰能引導用戶對優(yōu)惠券產(chǎn)生興趣,最終主動向小冰索取優(yōu)惠券。
為了讓小冰的商用場景更加系統(tǒng)化的落地。微軟也在7月26日首次公布了小冰如今的四大商用領域:金融、大眾文化、媒體與出版。
其中,在金融領域的小冰金融文本生成技術,與萬得資訊及華爾街見聞合作,已覆蓋國內(nèi)約90%金融機構(gòu)、75%經(jīng)批準的合格境外投資機構(gòu)和約40%的國內(nèi)個人投資者。
在大眾文化領域,小冰的兒童有聲讀物自動生成技術成果,已獲得超過400萬小時的收聽量,“小冰姐姐講故事”有聲讀物已覆蓋國內(nèi)90%以上的兒童早教機器人和80%在線收聽平臺。
在電視電臺領域,小冰通過人工智能技術參與生產(chǎn)與主持的電視電臺節(jié)目,已達21檔電視節(jié)目和28檔廣播電臺節(jié)目。
另外,小冰還與微軟Bing搜索引擎技術相結(jié)合,推出了針對媒體與出版兩個垂直行業(yè)的輔助型解決方案,目前已在超過15個媒體平臺落地。由小冰提供人工智能技術支持的媒體及自媒體公眾號已超過60000個。
該內(nèi)容為非商業(yè)目的的轉(zhuǎn)載分享,不代表本站觀點,本文版權屬其著作權人所有。若侵犯了您的正當權益,請立即聯(lián)系我們刪除。
閃電配音
免費試音
幫我推薦
價格計算
在線下單
開具發(fā)票
不招主播
全網(wǎng)全品類皆可配 頂配好聲音
關注【客服微信】
聽最新案例,新客禮包等你拿!
提交成功
試音顧問將在工作日半小時內(nèi)聯(lián)系您,請準備試音文稿或參考音頻加速匹配
你也可以注冊,可自助下單挑選主播,在線接單配音。(7 X 24小時主播接單)