999国内精品永久免费视频,色偷偷9999www,亚洲国产成人爱av在线播放,6080亚洲人久久精品,欧美超高清xxxhd

中國自動化學會專家咨詢工作委員會指定宣傳媒體
新聞詳情

人機交互將徹底變革計算機的未來

http://www.bfqmb.cn 2011-05-26 17:14 來源:《周末畫報》

  這不是夢想。

  一場由自然用戶界面帶來的革命,

  不僅改變我們和計算機交互的方式,

  更將徹底變革計算機的未來。

   想想當你拿起鋼筆記筆記、拿起鉛筆畫素描、拿起刀刻下字母的時候,手里怎么握觸這些工具?微軟亞洲研究院的年輕研究員曹翔發(fā)現(xiàn)其中的差異很有門道,人們使用不同工具的握姿各不相同,有可能改變長期以來困擾計算機輸入的一個問題。

  這位專門從事人機交互研究的小伙子制造了一個數字筆,上面附加了多點觸摸和方向感應,可以識別用戶握持筆的方式。于是,在用戶變換握持數字筆的方式時,這支筆可以根據其手勢,自然而然地實現(xiàn)鋼筆、畫筆、素描鉛筆、刀和圓規(guī)等不同工具、不同功能之間的切換,無需切換按鈕,如同使用實際工具一樣自然。

  在一年一度素有“計算機研究領域的盛宴”之稱的微軟技術節(jié)上,計算機領域內的各路專家圍著曹翔這個簡單又巧妙的項目嘖嘖稱贊。曹翔則稱自己的點子來自人們的實際需求。盡管如曹自己坦承,這個被稱為“所握即所得的數字筆”的小項目尚不能被稱為“革命”,但是無數類似的,從人的本身需求出發(fā)、強調人與計算機進行更自然互動的交互方式,正推動計算機科學處在一場徹底變革的前夕。

  感同身受

  “計算機領域的下一個重大趨勢和革命將會是自然用戶界面(Natural User Interface,簡稱NUI)。”微軟首席研究及戰(zhàn)略官Craig Mundie最近在清華大學發(fā)表演講時指出。Mundie所言的“自然用戶界面”,其宗旨是讓計算機用戶能夠綜合地使用語音、觸摸和手勢等行為與計算機進行更自然的交互。

  這確實是一場歷時長久的發(fā)展。計算機行業(yè)一直積極開發(fā)一種更加自然的用戶界面,來取代統(tǒng)治這個行業(yè)已十多年的圖形用戶界面(GUI)。在圖形界面時代,人們利用鍵盤和鼠標實現(xiàn)與計算機間的互動。而在自然用戶界面時代,人們與計算機的互動,應該像人與人打交道一樣親切而自然,可以是手勢、語音或者簡單的觸摸。

  Mundie在清華大學演講時,現(xiàn)場布置了一臺演示樣機。Mundie通過樣機演示了在自然用戶界面下,未來的建筑設計師的工作界面:建筑設計圖紙投影在桌面,設計師可以用手隨意翻動投影在桌面的“圖紙”,用手撥動圖紙上的線條來改變設計,甚至可以隨手“拽取”部分數據,組成圖表,用三維的形式投影在工作臺上。一切宛如《少數派報告》里的場景。

  盡管這臺樣機更多用于虛擬演示,但其中很多技術已經得以實現(xiàn)。Mundie訪問中國前不久,微軟剛剛慶祝體感游戲設備Kinect銷售突破1000萬臺,成為微軟旗下新的一個銷售額超過10億美元的產品,也是迄今為止整個科技行業(yè)銷售速度最快的消費類電子產品。

  Kinect體感控制游戲(圖片來自網絡)

  這個產品突破了以往的游戲機都要求游戲人通過手柄控制游戲的模式,轉而讓游戲參與者通過簡單的手勢與動作參與游戲。例如,在賽車游戲中,游戲人只需模擬握著方向盤,做出相應的轉動方向盤的動作,就可實現(xiàn)在游戲中操控汽車的轉向;在球類游戲中,游戲人只需做出撲地動作,便可以在游戲中救起排球,或揮動手臂,便可以在游戲中舉拍擊球。

  利用手勢和語音這種自然的行為控制游戲機,顯然已經是人機互動一個巨大的突破。Kinect采用的自然用戶界面技術不僅能夠運用到各種類型的產品中,而且也能實現(xiàn)計算機感知、互動和預測的新方式。

  從“感”到“知”

  讓計算機擁有像人類一樣的“感覺”,只是自然用戶界面需要解決的一部分內容。更關鍵的,是計算機如何對從各種傳感器獲得的信息進行分析,從而像人類一樣可以“識別”和“理解”各種信息。

  “以Kinect為例,最困難的部分不是獲取3D圖像信息,而是如何處理這些信息,如何界定這些3D信息代表什么意思。”微軟高級副總裁、微軟研究院院長Rick Rashid對《周末畫報》說,“人們往往把目光集中到Kinect的3D攝像頭上,但這個攝像頭是不能獨立工作的。”在他看來,Kinect這種用手勢及體感與計算機交互的方式,實質是一種實時3D計算機視覺技術。

  幾年前,來自微軟Xbox游戲機產品組的同事找到Rashid。他們希望利用微軟研究院的一些技術雛形,把3D攝像頭投入使用,使之成為游戲控制器,開發(fā)一種新型的體感游戲機。但他們面對一個難題:如何將來自3D攝像頭的原始圖像信息轉化成可靠的控制器用于視頻游戲,而且下至兒童上至老人都能使用。

  這其中的技術難點在于,如何界定這些3D信息:是誰站在3D信息系統(tǒng)之前?他身體的哪一部分在做何種動作?如果家里的小狗突然跳到游戲者面前,系統(tǒng)能否正確判斷它是不是游戲者身體的一部分?如果只考察其底層的3D信息,是無法區(qū)分各種情景的。“這實際上是一個非常復雜的機器學習問題。”Rashid介紹說,因為它必須識別身體的不同部分、處于游戲場景中的玩家身份、連續(xù)不斷地實時跟蹤身體各個部位的運動狀態(tài),并且不被其他物體干擾。

  例如,微軟亞洲研究院在身份識別方面的技術,讓3D攝像頭識別出游戲人成為可能。“其中不僅靠人臉來識別,我們還要考慮到穿著的衣服、身高等信息。”微軟亞洲研究院院長洪小文介紹說,目前正式發(fā)布的Kinect已經可以在同一場景下識別出4個不同的游戲者,但實際上,微軟亞洲研究院的技術可以讓同一場景下識別8個不同人成為可能。

  “我們大量運用機器學習的技術才能讓Kinect如此成功。而也正是這些能夠讓計算機像人類一樣看得見、聽得到的技術讓計算機識別出不同的場景和情境,從而讓計算機擁有人類的感官,能夠像我們一樣互動和思考。”Rashid說。

  “想”你所想

  從“識別”和“感知”出發(fā),計算機除了能提供自然互動之外,微軟的研究團隊希望走得更遠,讓計算機的角色越來越多地從“執(zhí)行你的命令”,轉變?yōu)?ldquo;代表你來工作”。

  Eric Horvitz是微軟研究院從事人工智能研究的工程師,在他位于微軟總部雷德蒙的辦公室外有一個機器“助理”。那看上去是一臺顯示器,顯示的是一個3D模擬的女性形象——關鍵是,“她”可以和前來拜訪Horvitz博士的每個人自如對話,和你談論天氣、確認與Horvitz博士約定的會議是否準時。更神奇的是,如果是多人一同到達前臺,“她”甚至可以從人們的行為舉止判斷出其中幾個人是否是同伴,把來客區(qū)分成不同的組別,依次問候并安排相應的事務——這儼然具有人類的模糊判斷能力。

  “很多人一談到自然用戶界面,就認為他們需要明確地指示計算機去做某些事情,或者去控制什么設備。一直以來,計算機的主要任務是執(zhí)行人們的直接命令。”微軟高級副總裁Rashid說,“實際上,我們可以通過提高計算機對人類意圖的理解能力,使它們的行為更像人類的‘助手’,甚至接近人類本身——能夠了解人們的想法,預測人們的需求,并妥善執(zhí)行任務。”而這一切隨著計算機計算能力的極大提升,以及云計算和社交計算的普及而成為可能。

  微軟亞洲研究院院長洪小文指出,計算機有可能從收集到的大量用戶行為、習慣信息和數據上進行分析和判斷,從而識別出特定請求是在何種情境下提出的,并根據這種情境,預想到用戶的需要,做出適當的反應。

  “人機一體”正逐漸成為現(xiàn)實。微軟有一個研究小組專門考察人們的駕駛習慣。研究人員發(fā)給測試者GPS定位器,用于跟蹤他們駕駛汽車的動向等信息。在獲得這些信息的基礎上,研究人員開發(fā)出了一套系統(tǒng),當用戶啟動車輛后,系統(tǒng)就能迅速推測出用戶想去的地方。其實原理并不復雜,就如同一對夫婦共乘一輛汽車,即便開車的丈夫不告訴乘車的妻子汽車開向何方,通過汽車經過的橋梁、高速公路等標志性地標,并結合丈夫的駕車習慣,妻子通??梢酝茰y出目的地是哪里。

  研究人員開發(fā)的這套系統(tǒng)正是這樣,通過各種信息及用戶習慣判斷出用戶想去的地方。在分析出目的地這個關鍵信息之后,系統(tǒng)很容易根據實時交通信息,向駕駛者推薦最佳路線——在今天顯然是種非常成熟的應用,但是對于主動判斷出目的地方向,則是一個極大的進步。

  在Rashid看來,“如果我們能夠讓系統(tǒng)更聰明地理解用戶,并建立良好的人類行為模型,系統(tǒng)就能夠更好地執(zhí)行使命,為人類服務,這樣自然用戶界面也會有更顯著的現(xiàn)實意義。

版權所有 工控網 Copyright?2025 Gkong.com, All Rights Reserved