將想法與焦點(diǎn)和您一起共享

網(wǎng)站建設中以語(yǔ)音交互為核心功能的智能產(chǎn)品設計發(fā)布者:本站     時(shí)間:2022-05-05 09:05:50

我們終將以自然的方式與機器交流
在2012年圣丹斯獨立電影節上,影片《機器人與弗蘭克》贏(yíng)得特別獎,該片講述機器人Robot照顧患有老年癡呆癥弗蘭克的故事,選取影片中兩張圖,一張是人與人的交流,另一張是人與機器的交流,在2017年AI大熱之年,人們能否像電影里的弗蘭克那樣,以人對人的方式與機器交流,這在人機交互學(xué)科里定義為“人機自然交互”。

何為自然交互?簡(jiǎn)而言之就是以日常交流方式與計算機進(jìn)行交互,何為日常交流方式?就是人們通過(guò)語(yǔ)音、肢體、手勢、眼神、表情等形式進(jìn)行交流互動(dòng)。

以語(yǔ)音交互為核心功能的智能產(chǎn)品設計建議

人機交互正邁上新臺階
人機交互(HCI – Human Computer Interaction)的發(fā)展是從人類(lèi)適應計算機到計算機不斷適應人類(lèi)的過(guò)程,劃分四個(gè)階段:代碼指令交互、圖形用戶(hù)界面交互、人機自然交互和人機情感交互?!疽浴度藱C情感交互》】

每個(gè)階段的發(fā)展都是以技術(shù)作為基石,以此帶來(lái)的人機交互更為直觀(guān),也更趨近于人與人的自然交互,同時(shí)會(huì )拓寬更多的使用場(chǎng)景,會(huì )覆蓋全年齡段的所有人。如下圖所示,指令 – 專(zhuān)業(yè)技術(shù)人員操作早期計算機;鼠標鍵盤(pán) – 受過(guò)教育的普通人使用PC機進(jìn)行學(xué)習工作;觸屏 – 更廣泛的人群使用智能手機進(jìn)行社交、資訊、娛樂(lè )等;自然交互 – 所有人將以自然的行為方式與智能產(chǎn)品互動(dòng)。

以語(yǔ)音交互為核心功能的智能產(chǎn)品設計建議

隨著(zhù)AI技術(shù)的發(fā)展,智能產(chǎn)品在感知層面的能力正在變強,它能感知人們的語(yǔ)音、肢體語(yǔ)言、手勢動(dòng)作、表情眼神等,實(shí)現了人機自然交互的可能性,這是正在發(fā)生的事情。

未來(lái)智能產(chǎn)品的趨勢是將擁有情感計算能力(Affective Computing),通過(guò)認知人類(lèi)的語(yǔ)音信息、人臉表情、肢體動(dòng)作等,從而調整自身的反饋來(lái)適應人們那一刻提出的需求,交互會(huì )變得越來(lái)越容易,它會(huì )更懂你。

智能產(chǎn)品能感知人的自然動(dòng)作和讀懂人的情感,都屬于信息輸入層面。在信息輸出層面,智能產(chǎn)品如何設計才能達到“人與人自然交流”的感覺(jué),為此我們將從六個(gè)維度給出設計建議,分別是人物設定、外觀(guān)造型、語(yǔ)音、動(dòng)作、界面和光效。正如同人與人交流時(shí)對方的脾氣性格、外貌印象、聲音特點(diǎn)、肢體語(yǔ)言、表情和眼神。

以語(yǔ)音交互為核心功能的智能產(chǎn)品設計建議

以語(yǔ)音交互為核心功能的智能產(chǎn)品設計建議
1. 人物設定的設計建議

①人設是要為用戶(hù)服務(wù);

人設是高級的虛擬形象設計,不由設計師的個(gè)人喜好來(lái)擬定,要充分考慮產(chǎn)品所服務(wù)的目標用戶(hù),譬如病人希望看見(jiàn)的是專(zhuān)家級醫生,旅客希望能獲得空姐甜美的服務(wù),食客希望迎賓的店小二是熱情好客的,這些形象在我們的腦海里栩栩如生。比如Amazon Echo是成熟職業(yè)女性的形象(類(lèi)似有Google Home、天貓精靈、京東叮咚等),Olly給人潮流的設計感,它們?yōu)楦髯缘哪繕耸鼙娙后w去設定形象。

②人設可以通過(guò)抽象的方法進(jìn)行傳達,并非一定要具象化;

比如小米智能音箱定義的“小愛(ài)同學(xué)”是二次元形象,在今年11月底做出限量版手辦,把形象落地到成具象的實(shí)體物品。對此,仁者見(jiàn)仁智者見(jiàn)智,有人說(shuō)她不是心目中的“小愛(ài)”,所以在人設形象的傳達上,我們建議可以通過(guò)藝術(shù)的手法達到目的,比方說(shuō)用音樂(lè )、繪畫(huà)、文學(xué)、電影等藝術(shù)進(jìn)行包裝抽象成一套視覺(jué)來(lái)傳達,達到“空山不見(jiàn)人,但聞人語(yǔ)響”的境界。

③人設與產(chǎn)品要融為一體的進(jìn)行考慮;

以語(yǔ)音交互為核心功能的智能產(chǎn)品,其“人聲”會(huì )讓用戶(hù)自動(dòng)的聯(lián)想與之對應的形象,同時(shí)需考慮與外觀(guān)造型相匹配,才能符合用戶(hù)預期。有些智能產(chǎn)品有動(dòng)作輸出,例如人設定義為蠢萌的jibo,它的動(dòng)作就要顯得有趣可愛(ài)。如果考慮不周全,就會(huì )導致認知失調產(chǎn)生落差,比如小魚(yú)在家,當用戶(hù)問(wèn)它幾歲時(shí),它卻用其成熟女性的聲音回答“我今年兩歲了”,而Amazon Echo的回答是“按照人類(lèi)的出生年齡計算我今年兩歲”,后者更能讓人接受與理解,即使是微不足道的一句文本都可能會(huì )讓用戶(hù)“出戲”,所以人設要與整個(gè)產(chǎn)品的信息輸出層面融為一體的去考慮。

以語(yǔ)音交互為核心功能的智能產(chǎn)品設計建議2. 外觀(guān)造型的設計建議

①充分考慮目標用戶(hù)的審美與喜好;

根據目標客群打造其喜歡的外觀(guān)造型,比如小朋友會(huì )喜歡jibo勝過(guò)Echo,追求新潮的人更喜歡raven R,因為能與之載歌載舞。與以屏幕為主的智能手機不同,用戶(hù)可不能更換主題皮膚找到自己的喜好,而Google Home也只能是通過(guò)“換褲子”來(lái)迎合用戶(hù)偏好與家居風(fēng)格。

以語(yǔ)音交互為核心功能的智能產(chǎn)品設計建議

②基于使用場(chǎng)景考慮造型設計;

要考慮用戶(hù)會(huì )在哪種現實(shí)環(huán)境的場(chǎng)景下使用,目前市面上的智能語(yǔ)音產(chǎn)品多數放置在桌面上,體積大小就要認真思考,比如大了點(diǎn)、重了些,就不方便自由移動(dòng)隨處擺放,如果定義為多個(gè)使用場(chǎng)景,那便攜上得做到位。比如raven H頂部的“點(diǎn)陣觸控屏”蓋子,用戶(hù)能輕松取下進(jìn)行語(yǔ)音和指觸交互,于是不受固定位置的限制。

以語(yǔ)音交互為核心功能的智能產(chǎn)品設計建議

③避免掉進(jìn)恐怖谷;

避免與人全特征的過(guò)度相似,建議采用抽象的方法提取擬人元素進(jìn)行設計表達,這有助于產(chǎn)品向用戶(hù)傳達情感信息,從而有效的提升用戶(hù)好感度。例如蔚來(lái)ES8搭載的人工智能nomi,還有百度的度秘,都是通過(guò)此類(lèi)設計方法打造智能情感的交互,讓一個(gè)工業(yè)產(chǎn)品,升級成一個(gè)有生命,有情感的新伙伴。

但如果與人的特征過(guò)度相似,現階段的技術(shù)能力,造型上做不到寫(xiě)實(shí)逼真像人,同時(shí)語(yǔ)音、表情、動(dòng)作也無(wú)法達到自然完美的匹配,所以這不倫不類(lèi)的設計會(huì )給用戶(hù)帶來(lái)糟心的體驗,例如Blue Frog Robotics公司推出的Buddy,很容易讓用戶(hù)掉進(jìn)“恐怖谷”。

以語(yǔ)音交互為核心功能的智能產(chǎn)品設計建議

“恐怖谷理論”是由日本機器人專(zhuān)家森昌弘提出, 他認為,人形玩具或機器人的仿真度越高人們越有好感,但當達到一個(gè)臨界點(diǎn)時(shí),這種好感度會(huì )突然降低,越像人越反感恐懼,直至谷底,稱(chēng)之為恐怖谷。如圖所示,谷底處能動(dòng)的僵尸比靜止的尸體更恐怖,雖然尸體已經(jīng)夠恐怖的了。

以語(yǔ)音交互為核心功能的智能產(chǎn)品設計建議

 

3. 語(yǔ)音的設計建議

①自然感;

避免單調乏味,做到像人說(shuō)話(huà)一樣的自然,語(yǔ)氣上聽(tīng)起來(lái)積極主動(dòng),有意愿的感覺(jué),每一個(gè)音素合成的詞句清晰可辨,自然流暢。人類(lèi)語(yǔ)音的信息含有語(yǔ)音聲學(xué)特征和文本語(yǔ)義,語(yǔ)音聲學(xué)特征主要是韻律特征(指音素組合成語(yǔ)句的方式),包括聲調、重音、停頓、語(yǔ)速等,漢語(yǔ)是一種有調語(yǔ)言,聲調攜帶非常重要的情感信息。語(yǔ)音屬于自然交互的一種,它需要達到“自然”的感覺(jué),才能讓用戶(hù)感知可用。

如何讓Siri聽(tīng)起來(lái)更像人那般自然?

iOS11版本關(guān)于Siri的升級目標是“讓Siri聽(tīng)起來(lái)更像人那般自然”,實(shí)現方法是通過(guò)深度學(xué)習,每一種表達都有略微不同的聲波,每一句話(huà)都包含幾十或者幾百個(gè)音素,Siri為每一次發(fā)聲找出完美的聲音組合,其中音素是由蘋(píng)果挑選出的候選人進(jìn)行發(fā)音采集,情感語(yǔ)料的獲取是蘋(píng)果以匿名的方式進(jìn)行收聽(tīng),然后用于深度學(xué)習進(jìn)行Siri的訓練。

②一旦確定“人聲”不宜隨意更改;

一旦人設的聲音已根植在用戶(hù)的耳朵里,不宜隨意更改,如果說(shuō)手機界面換背景圖就像人換一身新衣裳,而以語(yǔ)音交互為核心功能的智能產(chǎn)品更換“人聲”,就像重新認識一位陌生人,古語(yǔ)說(shuō)“如聞其聲,如見(jiàn)其人”,人們會(huì )很自然的把聲音與某個(gè)人進(jìn)行關(guān)聯(lián),新的聲音是誰(shuí),就會(huì )重新進(jìn)行“人物建?!?。

③像人和人那樣進(jìn)行對話(huà);

首先是對話(huà)流暢,做到及時(shí)反饋,如有停頓,不宜過(guò)長(cháng)。話(huà)術(shù)簡(jiǎn)短而有效,不要主動(dòng)終止對話(huà),盡可能的推動(dòng)持續交流,當然不能以命令的形式讓用戶(hù)去完成某個(gè)任務(wù),這不是一個(gè)合適的對話(huà),它或許有點(diǎn)像上下級的關(guān)系,會(huì )導致用戶(hù)帶來(lái)反感和抵制。

④在感知用戶(hù)后嘗試主動(dòng)發(fā)起對話(huà);

再過(guò)些時(shí)日,可能Amazon Echo它能夠根據說(shuō)話(huà)者的語(yǔ)音情感進(jìn)行識別計算,通過(guò)韻律學(xué)特征(語(yǔ)調、響度、節奏、語(yǔ)音質(zhì)量等)更懂用戶(hù)說(shuō)這句話(huà)的此刻心境,就像電影《Her》里的那句臺詞“你今天聽(tīng)起來(lái)有點(diǎn)不開(kāi)心”,它能感知你,試著(zhù)主動(dòng)發(fā)起一次對話(huà)。



選擇我們,優(yōu)質(zhì)服務(wù),不容錯過(guò)
1. 優(yōu)秀的網(wǎng)絡(luò )資源,強大的網(wǎng)站優(yōu)化技術(shù),穩定的網(wǎng)站和速度保證
2. 15年上海網(wǎng)站建設經(jīng)驗,優(yōu)秀的技術(shù)和設計水平,更放心
3. 全程省心服務(wù),不必擔心自己不懂網(wǎng)絡(luò ),更省心。
------------------------------------------------------------
24小時(shí)聯(lián)系電話(huà):021-58370032
關(guān)鍵詞標簽:上海網(wǎng)站建設 上海網(wǎng)站制作 網(wǎng)站優(yōu)化 小程序開(kāi)發(fā)
最新国产精品第二页_色资源av中文无码先锋_中国xx爽69护士_日韩欧美亚洲每日更新在线观看