2021年4月13日,由蓋世汽車、慕尼黑上海電子展聯(lián)合主辦的“2021中國汽車人機交互HMI創(chuàng)新大會”隆重召開。本次大會旨在聚集汽車HMI領域的杰出人才、UX/UI設計師以及前瞻規(guī)劃研究人員分享全方位汽車人機交互領域的創(chuàng)新理念、技術趨勢、行業(yè)焦點、現(xiàn)實挑戰(zhàn)及應用解決方案。會議期間,摩斯智聯(lián)產(chǎn)品與運營高級總監(jiān)周陽霖發(fā)表了“智能時代下場景化HMI交互設計思考”的主題演講。
以下為演講實錄:
感謝主辦方的盛情邀請,我是摩斯智聯(lián)的周陽霖,今天我給大家?guī)淼姆窒眍}目是《智能時代下場景化HMI交互設計思考》。
在主題演講開始之前,我簡要為大家介紹一下摩斯智聯(lián)。
摩斯智聯(lián)科技有限公司是一汽-大眾與大眾中國合資成立、由一汽-大眾控股的、從事智能網(wǎng)聯(lián)產(chǎn)品研發(fā)的科技公司。公司自2019年4月落戶成都天府新區(qū)以來,目前正在承擔一汽-大眾多個智能網(wǎng)聯(lián)產(chǎn)品的研發(fā)工作。接下來,我們進入到演講的第一部分內(nèi)容:智能時代的新挑戰(zhàn)。
今天人類社會已經(jīng)邁入人工智能時代,在這個無比精彩的時代,我們面臨著怎樣的挑戰(zhàn)呢?
在回答這個問題之前,我們先簡要回顧一下人工智能的發(fā)展歷史。自1956年第一次提出“人工智能”概念以來,人工智能一共經(jīng)歷了三次浪潮。當前,我們正處在開始于2007年的第三次人工智能浪潮中。那么回溯2007年,那一年發(fā)生了哪些事情,又給我們帶來了什么呢?
2007年1月9日蘋果公司發(fā)布了第一代iphone、2007年11月5日谷歌正式向外界展示安卓操作系統(tǒng),同樣是2007年,比特幣開始研究數(shù)字貨幣和支付系統(tǒng)。學術界與產(chǎn)業(yè)界把2007年定義為移動互聯(lián)網(wǎng)和第三次人工智能浪潮的元年,這一年,人類正式跨入全球數(shù)字經(jīng)濟。新經(jīng)濟模式帶來了新的挑戰(zhàn),讓我們一同看看這個新挑戰(zhàn)是什么?
三度普利策獎得主,托馬斯.弗里德曼用右邊這張圖為我們描繪了人類適應性與科技發(fā)展的關系,我們看到,數(shù)萬年以來人類的適應性一直在平穩(wěn)地進化,但是自從2007年第三次人工智能浪潮興起,科技的發(fā)展呈現(xiàn)加速狀態(tài),人類適應性與科技之間形成了越來越大的逆差,兩者的背離趨勢帶來了難以熨平的數(shù)字鴻溝,這就是智能時代下人類面臨的最大挑戰(zhàn)。面對新挑戰(zhàn),我們怎么辦?
為什么是交互設計來回答智能時代的新挑戰(zhàn)呢?我們先來看看交互設計的發(fā)展歷史。
整個交互設計的發(fā)展分為四個階段:
1、前交互是交互設計的史前時代,此時沒有交互設計的概念。人們通常使用工業(yè)設計與人機工程去解決相關的問題,如按鍵、旋鈕。
2、伴隨著計算機技術的發(fā)展,人們完成了最初的交互設計定義。通過提供簡單易懂的圖形界面使計算機等數(shù)字產(chǎn)品能夠與人類交互。
3、實體交互,通過物理實體和物理環(huán)境,與數(shù)字信息進行交流互動的界面,這里的介質主要是物理層面的交流互動,如鼠標、觸屏。
4、智能交互,運用智能傳感設備與算法,通過語音、手勢、表情等自然交互方式,突破硬件界限,實現(xiàn)人與機器之間的交流與溝通。
通過回顧看到,交互設計發(fā)展是伴隨著科技發(fā)展衍生的介質改變而演進。
(動效切換)
因此,設計哲學家理查德.布坎南將交互設計定義為:通過產(chǎn)品的媒介(實體的、虛擬的、服務、甚至是系統(tǒng))來策劃和支持人的行為。
通過交互設計的定義,我們會發(fā)現(xiàn)交互設計由傳統(tǒng)的對實物的設計轉換為對用戶行為的非物質設計;與此同時人與設備溝通的主題也從功能邏輯轉換為行為邏輯。
那功能邏輯與行為邏輯有什么不同之處呢?
那么功能邏輯與行為邏輯有何區(qū)別?交互設計之父阿蘭庫珀提到過一個比喻:想象有一架客機,客機有兩個艙門,左邊是飛行員的駕駛艙,右邊是乘客艙。
機組需要了解復雜狀況下的所有功能,應對各種突發(fā)局面;而乘客只想簡單渡過幾小時后安全舒適抵達目的地,雖然機組和乘客的目的地是相同的,但是涉及不同的是決策復雜度及復雜度背后的心智模型。機組與乘客可以喻指功能邏輯與行為邏輯,功能邏輯復雜強大,強調(diào)面面俱到;行為邏輯則在意降低認知成本,關注用戶易用愛用。
認知心理學將人類決策過程歸納為自主心智、算法心智和反省心智三種。對心智模型的充分了解可以幫助我們理解如何降低認知成本。
第一個問題,用戶的決策幾乎是無意識的,不需要消耗注意力,憑直覺做出反應;
第二個問題,用戶根據(jù)經(jīng)驗,有意識的去分析解決,并且一次只能專注一個任務;
第三個問題,用戶無法直接做出決策,需要研究一定的規(guī)則、知識,尋求外界手段輔助決策過程。
這三類問題對應了自主心智、算法心智和反省心智
大腦最喜歡自主心智,它有最好的人類適應性
交互設計是通過對行為的設計,以更低認知資源消耗達成用戶目標的設計方法。
面對智能時代,交互設計著重關注人類適應性、讓人們以更輕松的心智模型應對復雜的科技變化,熨平巨大的數(shù)字鴻溝,從而回答了這個時代的挑戰(zhàn)。
接下來我們進入場景化HMI交互設計探索
一般而言交互設計一定是在具體場景下進行的,為何格外強調(diào)場景化,這就需要從交互設計五要素談起。
左圖是辛向陽博士提出的交互設計五要素。
為了便于理解,我們將交互五要素整合為右圖。
這里的主線是用戶采取什么樣的行為、利用什么樣的媒介與工具,在什么樣的場景下達成目的。
我們看到,用戶與用戶目的是相對固定,而行為因場景、媒介的改變而有所不同。
在智能座艙領域,因密閉性、復雜性與多樣性,場景因素顯得尤為突出。
實事求是的講,因人類活動的復雜性與多樣性,場景化分類遠不止以上幾種。
在智能座艙的交互設計探索過程中,我們發(fā)現(xiàn)需要特別關注這三個場景——駕駛場景、路況場景與乘員場景。前兩者關乎注意力,后者關乎用戶隱私。
為什么智能交互的時代需要特別關注注意力與隱私呢?這源于智能交互的特征?
多模態(tài)、主被動響應、擬人化與個性化是智能交互的3個重要特征。稍加思索就能發(fā)現(xiàn),在不同的場景下,注意力與隱私對這幾個特征影響深遠。
比如說沒有人希望在商務出行的場景下暴露過多個人隱私。
接下來,我們談一下對這些特征的具體探索。
多模態(tài)交互設計的目的是幫助駕駛者降低認知載荷,改善人車交互體驗。
多模態(tài)設計實踐的核心在于注意力帶寬的最大節(jié)約與重新分配。
因此,與注意力密切相關的駕駛場景和路況場景就顯得格外重要。
尤其是在座艙內(nèi)屏幕顯示權重日益增長的今天,顯示什么信息、如何顯示信息,成為無法回避的重點問題。
接下來,我們先從與顯示密切相關的視覺說起。
與互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)等領域已經(jīng)存在較為統(tǒng)一、成熟的設計標準相比,車內(nèi)屏幕的顯示規(guī)范仍在探索發(fā)展之中。
但是,共性的理論原則依然可以遵循。
接下來,我們看兩個視覺設計實踐。
PPI在150以上的液晶儀表與中控屏幕可以帶給用戶精致感,雙屏布局在124°雙眼視角之內(nèi)可以讓用戶感到一目了然;這些都屬于視覺感知原則的實現(xiàn);
再向細節(jié)深挖,我們發(fā)現(xiàn)這兩塊顯示屏上的視覺流動也有所不同。
(翻頁動畫)
左邊是液晶儀表遵循的古騰堡圖表模式;人類視覺流動從左上至右下,液晶儀表的設計中將重要信息按照這條動線排布,會讓用戶更快速的獲取信息。
右邊是中控屏遵循的是F模式和Z路徑,中控屏幕的設計把菜單集中在左側以提升視覺聚焦速度。
以上努力可以有效降低用戶認知成本,但駕駛者視線仍難免脫離路面。面對這種情況,讓我們進入AR-HUD探索。
AR-HUD的出現(xiàn)是為了幫助駕駛者減輕認知負荷,提高態(tài)勢感知能力。它秉持“少即是多”的設計原則,簡化信息層級,減輕視覺重量。
1、在信息布局上,根據(jù)米勒組塊理論與希克定律,AR-HUD所呈現(xiàn)的主要設計元素應保持在3個以內(nèi)
2、在導航信息上,應用格式塔連續(xù)性法則,使用視覺重量較輕的藍色虛線,具備較好的用戶體驗。
3、在限速與速度信息方面,依據(jù)最小努力原則,限速信息使用圖標,速度使用文本數(shù)字。
接下來我們談談聽覺這個模態(tài)
這里和大家分享一下,聽覺交互設計中需要重視的兩個方面:語音技能設計和聲音情感化設計
在語音技能設計時,需要重視這三點:
1、關注語音的參數(shù)設置細節(jié),比如語音終止超時一般是1.5秒,而當用戶開始念“手機號碼”時,可以將語音終止超時設置的長一些,甚至可以根據(jù)不同年齡段的用戶設置不同的語音終止超時。
2、常用表達提供的越多,意圖理解越準確,我們在設計探索中發(fā)現(xiàn),意圖的常用表達下限是30條,上限當然越多越好。
3、有了豐富的技能,還要教會用戶怎么說,說什么,關于這點,不僅取決于產(chǎn)品設計,也是一項運營工作。
在聲音情感化方面,我們有如下探索發(fā)現(xiàn):
1、在語調(diào)方面,30歲左右的女性,柔和、親切、干練的聲音,聽感最佳。
2、在語速方面,238-248的字數(shù)為舒適區(qū)間
3、在語句間停頓方面,0.3-0.4秒讓用戶感覺最為舒適的。
在我們把視覺和聽覺的單一模態(tài)做了詳盡分析以后,接下來探討基于不同模態(tài)組合的多模態(tài)交互設計。
我們將多模態(tài)交互分為兩大類——融合型多模態(tài)交互和遞進型多模態(tài)交互。
融合型多模態(tài)交互指的是多種模態(tài)同步協(xié)同工作,如聽覺+視覺方式。該形式通過對語音和唇語的融合分析,可以降低誤喚醒率。同時因視覺識別的引入,人們可以用手指、眼動進行更好的指代,如人們經(jīng)常說的“這邊的空調(diào)風小一點,關上那邊的窗戶”
遞進型多模態(tài)交互指的是某一模態(tài)在前,另一模態(tài)在后。比如先監(jiān)控到駕駛人疲勞,再釋放清新香氛。
進行多模態(tài)交互設計,必須要了解人類器官的五感能力
左圖是來自美國哈佛大學的研究,人的大腦通過五感接受外部信息的比例是不同的,我們看到視覺占比最高。右圖顯示的是人類對五感的大腦反應速度也是不等的,語音反應最快
多模交互需要多感官協(xié)同,這必然導致設計復雜化,那么如何管理這種復雜呢?
第一種方法是感官任務能力分析,我們將感官設計的任務類型分為五類。
在不同任務類型下,感官能力有不同的精度,利用這個框架找到最適合任務的模態(tài)通道或模態(tài)通道組合。但是,這種方法僅是一個定性的框架,對設計者經(jīng)驗要求較高。下面我們介紹另外一種基于定量的方法。
第二種方法多模態(tài)平衡設計,通過VACP模型進行評估計算.
VACP模型是基于人們的視覺、聽覺、認知與運動構建的一個數(shù)據(jù)模型。每一個字母代表不同的通道,V代表是視覺、A代表聽覺、C代表認知、P代表運動,每一個通道中有0-7分,分數(shù)越高代表占用通道越高。
以分析開車場景為例,駕駛員需要通過視覺來判斷目前的方位,通過聽覺判斷后方是否有鳴笛,在通過認知分析前方交通標記,通過動作進行行車操作。根據(jù)這個分析可以充分利用占用級別低的通道進行方案設計。
通過這兩個方法可以幫助我們良好的管理客觀世界中的復雜場景。
簡單小節(jié)一下,多模態(tài)的交互是基于場景,基于人類生理適應性邊界的交互。
接下來我們進行主動響應式交互探索。
先來看看幾個主動響應交互的例子。
左圖,人們走向車輛,汽車以語音、燈光、全息影像、車外屏等形式來給我們來打招呼,這是迎賓場景
中圖,當檢測到我們情緒低落時,主動播放有趣的內(nèi)容;這是心情場景
右圖,當監(jiān)控到我們疲勞時,會發(fā)出蜂鳴,利用聽覺提醒刺激;這是安全場景
這些場景下的交互存在一個共性——即關懷;體現(xiàn)關懷的主動響應本質上是感知智能,基本對隱私脫敏,也是從業(yè)者比較易于發(fā)揮的方向。
然而,人工智能更大的舞臺是認知智能——即預測,精準的預測推薦需要用戶的個性化數(shù)據(jù),而這類數(shù)據(jù)恰恰與隱私高度重合,完善個性化數(shù)據(jù)才是主動響應交互的深水區(qū)。
接下來我們看看如何完善個性化數(shù)據(jù)。
這是一個關于加油推薦的理想預測模型,梳理一下可以得知,在這個完美案例中,除了油量預警閥值,系統(tǒng)還要知道用戶品牌偏好、優(yōu)惠偏好和時間靈活度。但實事求是的講,在初始訓練樣本有限、個性化數(shù)據(jù)積累困難的實際條件下,這樣的主動響應交互很難實現(xiàn)。
為此同濟大學的孫效華教授優(yōu)化了預測模型,將矛盾聚焦在 “用戶使用習慣與行為偏好” 、“上下文語境”、“預測正誤反饋” 這三類信息獲取上。
(過場動效)
其主要思路為:通過多模態(tài)交互與擬人化交互,在保證低打擾性的前提下,避免用戶一次經(jīng)歷過多交互流程,逐次引導積累用戶的偏好輸入。把每一次交互,當做人工智能學習的一次起點。
最后我們看一下擬人化與個性化探索
沒有人格的語音界面是不存在的,但是在考慮如何設計人格之前,首先要回答三個問題
1、你會讓用戶問系統(tǒng)自身相關的問題嗎 ?(例如:“你最喜歡的是什么顏色”)
2、你如何處理粗魯和粗俗的行為?
3、你介意打破用戶把VUI看作人類的幻想嗎?
認真對待這三個問題,一方面它支撐著人格設定的一些原則,更為重要的是,其背后不但有產(chǎn)品和公司目標,也存在道德和社會目標。
人物模型設計是擬人化交互的關鍵所在,一般說來分為助手型與伴侶型。助手型的特征是提供便捷高效的服務,伴侶型的特征是提供更多知心關懷。設計中選取哪個類型的擬人化隱喻,需要結合品牌調(diào)性、企業(yè)形象、產(chǎn)品定位來選擇,需要注意的是不同類型的人物模型,在對話腳本、語氣、語調(diào)、語速、停頓等方面都有明顯差異
VUI提供何種可視化反饋,是在設計探索中經(jīng)常遇到的問題對于一個成功的語音交互而言,虛擬形象并不是一個必選項,亞馬遜、谷歌都使用了比較簡單抽象的圖形表達,抽象圖形同樣可以產(chǎn)生移情,提供視覺動效反饋。當然,也不是說虛擬角色一無是處,虛擬角色的引入會增強用戶的參與度,但凡事有兩面性,可視化形象的個性越鮮明,用戶反應也會越極端。此外虛擬角色的設計和開發(fā)需要投入大量精力,還得謹防掉進恐怖谷陷阱,因此要慎重。
個性化設計是我們本次探索的最后方向。個性化交互不再是所有人學習使用同一系統(tǒng),而是系統(tǒng)學習不同用戶的需求。在智能汽車時代,用戶身份識別已成為基礎能力。因此,座艙環(huán)境、界面展示、交互邏輯、甚至語音語調(diào)都將展示出用戶的個性化特征。
回顧汽車誕生的一百多年來,個性化一直都是用戶需求,并引領設計趨勢。在智能時代隨著燈語、全息影像、車外屏、智能表面等技術的逐漸普及,越來越個性化的展示也正在實現(xiàn)。右側這兩個概念車,個性化所展示的是車輛與環(huán)境交互。人類正在進入自動駕駛的XMI設計時代。
XMI設計是HMI與EMI設計融合。對于下一代自動駕駛汽車,需要將駕駛狀態(tài)信息傳遞給環(huán)境,從而確保其他車輛和周圍的行人也可以對其作出恰當反應,此時整個交互過程就包含了XMI設計。XMI設計對整個交互系統(tǒng)提出了更廣泛的要求,如何應對這種要求并將設計體驗推向新的高度,這是智能時代留給我們的一個至關重要的思考。
最后總結一下,交互設計是系統(tǒng)設計的頂層,在技術飛速發(fā)展的今天,它越來越融入生理學、心理學、AI算法、軟件邏輯等各個專業(yè)的知識,今天在這里拋磚引玉,期望和大家共同研討,一起努力把產(chǎn)品做的更好,滿足客戶對我們的期望,不負這個變革的時代。
我的演講到此結束,謝謝大家!
來源:蓋世汽車
作者:忻文
本文地址:http://www.vlxuusu.cn/news/qiye/144428
以上內(nèi)容轉載自蓋世汽車,目的在于傳播更多信息,如有侵僅請聯(lián)系admin#d1ev.com(#替換成@)刪除,轉載內(nèi)容并不代表第一電動網(wǎng)(www.vlxuusu.cn)立場。
文中圖片源自互聯(lián)網(wǎng),如有侵權請聯(lián)系admin#d1ev.com(#替換成@)刪除。