您的位置:網(wǎng)站首頁 > 電器維修資料網(wǎng) > 正文 >
電腦讀懂肢體語言——體感操控技術(shù)的全面認(rèn)識(shí)
★★★★★【文章導(dǎo)讀】:電腦讀懂肢體語言——體感操控技術(shù)的全面認(rèn)識(shí)具體內(nèi)容是:重力監(jiān)控,走出體感的第一步手,是人類各種創(chuàng)造性活動(dòng)的天然工具,而自古以來手勢(shì)就是一套特定的語言系統(tǒng),在人的交流中發(fā)揮著重要的作用。不過要單純的電腦識(shí)別一個(gè)看似簡(jiǎn)單動(dòng)作卻是一個(gè)很復(fù)雜的過程。體感控制技術(shù)…
來源: 日期:2013-11-17 19:40:16 人氣:標(biāo)簽:
重力監(jiān)控,走出體感的第一步
手,是人類各種創(chuàng)造性活動(dòng)的天然工具,而自古以來手勢(shì)就是一套特定的語言系統(tǒng),在人的交流中發(fā)揮著重要的作用。不過要單純的電腦識(shí)別一個(gè)看似簡(jiǎn)單動(dòng)作卻是一個(gè)很復(fù)雜的過程。體感控制技術(shù)的工作就是讓電腦要能在這些眾多可能性中識(shí)別動(dòng)作的 終含義——讓電腦理解你!
那么怎么才能做到這一點(diǎn)呢?我們都知道,一個(gè)初生嬰兒很難區(qū)分出一個(gè)手語的含義,但我們通過多年的學(xué)習(xí)和訓(xùn)練可以在幾分之一秒內(nèi)做到。而體感控制技術(shù)也以類似的方法被創(chuàng)造出來,陀螺儀就是其中技術(shù)關(guān)鍵的突破點(diǎn),它觀察身邊的世界,注意你的動(dòng)作變化。借助重力監(jiān)控,讓系統(tǒng)來通過手勢(shì)的“力度”識(shí)別手語:借助“加速度計(jì)-陀螺儀”組合,再通過測(cè)量設(shè)備的位移變化結(jié)合軟件實(shí)現(xiàn)指令操作。
如wii remote手柄、一些支持體感操作的電視遙控器、智能手機(jī)就是采用這種方式來讀懂你的手語。不過,這種手勢(shì)輸入控制方式只能提供簡(jiǎn)單的指令操作,嚴(yán)格來說并不是人機(jī)交互范疇—一因?yàn)橄到y(tǒng)只會(huì)進(jìn)行簡(jiǎn)單“識(shí)別”而不是“思考”。這時(shí)以微軟kinect為代表的新一代手勢(shì)控制方式的出現(xiàn)向傳統(tǒng)智慧提出了挑戰(zhàn)——從感應(yīng)向感觀方向過渡。
結(jié)構(gòu)光模式,讓體感系統(tǒng)長(zhǎng)眼睛
直接讓電腦“看見”手勢(shì)無疑是 直接的指令控制方式。為了實(shí)現(xiàn)這一目標(biāo),計(jì)算機(jī)視覺技術(shù)一直在努力向堪比人類大腦的智能方向發(fā)展,以更好地了解場(chǎng)景,因?yàn)槿绻荒芙忉屩車氖澜纾?jì)算機(jī)就無法與人實(shí)現(xiàn)自然交流對(duì)接。不過讓電腦看見很容易,但如何感受到動(dòng)作的意思就相對(duì)復(fù)雜得多。人眼能看到3d對(duì)象,能自然識(shí)別(x,v,z)坐標(biāo)軸,從而能夠看到一切事物,而大腦能夠以3d影像的形式表達(dá)這些坐標(biāo)軸。機(jī)器無法獲得3d視覺的一大挑戰(zhàn)就是第三坐標(biāo)——z軸坐標(biāo)的獲取。
針對(duì)這個(gè)問題,開發(fā)人員開發(fā)出了結(jié)構(gòu)光模式用來測(cè)量或掃描3d對(duì)象,讓電腦像人一樣擁有3d視覺。在該類系統(tǒng)中,可在整個(gè)對(duì)象上照射結(jié)構(gòu)光模式,光模式可使用激光照明干擾創(chuàng)建,也可使用投影影像創(chuàng)建。一旦系統(tǒng)捕捉到操作者的肢體動(dòng)作,就會(huì)進(jìn)行分析與比較,一旦與設(shè)定的動(dòng)作相一致,就執(zhí)行已設(shè)定的操作。不過結(jié)構(gòu)光模式的結(jié)構(gòu)復(fù)雜、成本高的缺點(diǎn)讓它難以在消費(fèi)級(jí)市場(chǎng)普及,后來開發(fā)人員在這基礎(chǔ)上推出了成本更低的“light coding”掃描模式。
light coding,顧名思義就是用光源照明給需要測(cè)量的空間編上碼,說到底還是結(jié)構(gòu)光技術(shù)。但與傳統(tǒng)的結(jié)構(gòu)光方法不同的是,他的光源打出去的并不是一副周期性變化的二維的圖像編碼,而是一個(gè)具有三維縱深的“體編碼”。這種光源叫做激光散斑(laserspeckle),是當(dāng)激光照射到粗糙物體或穿透毛玻璃后形成的隨機(jī)衍射斑點(diǎn)。這些散斑具有高度的隨機(jī)性,而且會(huì)隨著距離的不同變換圖案,這樣識(shí)別設(shè)備就可以輕易判定出圖像中哪部分才是移動(dòng)物體,并進(jìn)行分析與比較。
kinect引出的人機(jī)交互方式
微軟正是在light coding這種技術(shù)基礎(chǔ)上,推出了基于xbox360游戲主機(jī)的體感設(shè)備——kinect。
為了教會(huì)kinect辨識(shí),微軟專門開發(fā)了一個(gè)復(fù)雜的人工智能系統(tǒng):數(shù)以tb計(jì)的數(shù)據(jù)被輸入到集群系統(tǒng)中來教會(huì)kinect以像素級(jí)技術(shù)來辨認(rèn)手、腳以及它看到的其他身體部位。kinect會(huì)評(píng)估模型輸出的每一個(gè)可能的像素來確定關(guān)節(jié)點(diǎn),通過這種方式kinect能夠基于充分的信息 準(zhǔn)確地評(píng)估人體實(shí)際所處位置,然后利用對(duì)用戶動(dòng)作的 佳推測(cè)來作出相應(yīng)操作。
目前微軟正在努力重塑現(xiàn)有計(jì)算機(jī)上的人機(jī)交互方式,其中的一個(gè)目標(biāo)是把kinect該款成功的游戲外設(shè)部署在他們無所不在的視窗操作系統(tǒng)上面,微軟稱為“kinect for windows”。
不過,基于light coding技術(shù)仍無法完全擺脫固有的缺點(diǎn)——受攝像頭及設(shè)備性能的制約,分辨率和精度都不太理想,如kinect的識(shí)別精度在4mm左右、分辨率在160×120像素~640×480像素之間,這就要求使用者在控制時(shí)需要有較大的動(dòng)作幅度。這時(shí)時(shí)差測(cè)距傳感器技術(shù)(tof)的出現(xiàn),為體感控制的發(fā)展提供了新的思路。
tof傳感,體感控制的第六感官
時(shí)差測(cè)距傳感器系統(tǒng)是一種光雷達(dá)(lidar)系統(tǒng),同樣可從發(fā)射極向?qū)ο蟀l(fā)射光脈沖。接收器則可通過計(jì)算光脈沖從發(fā)射器到對(duì)象,再以像素格式返回到接收器的運(yùn)行時(shí)間來確定被測(cè)量對(duì)象的距離,并通過相應(yīng)運(yùn)算來獲得整個(gè)場(chǎng)景,確定3d范圍影像。這種不用“看”就能知道手語的方式,似乎讓電腦等設(shè)備擁了的第六感觀,更為神奇。
近期受大家關(guān)注的leapmotion leap3d手控設(shè)備就采用tof系統(tǒng)。該產(chǎn)品內(nèi)置cmos傳感器和紅外線led,利用cmos傳感器捕捉物體反射的紅外線來實(shí)現(xiàn)動(dòng)作檢測(cè):led光掃描系統(tǒng),就像是超市的掃描槍一樣,形成一個(gè)光線網(wǎng),一旦光網(wǎng)內(nèi)的手指移動(dòng)就會(huì)引起紅外線反射,leap3d探知手指所在位置和移動(dòng)方向的同時(shí),利用雙攝像頭進(jìn)行立體拍攝,這就可以對(duì)紅外區(qū)域探知的移動(dòng)進(jìn)行重點(diǎn)分析和檢測(cè)出三維動(dòng)作。tof系統(tǒng)除了可以光波掃描外,聲波也是其中一個(gè)采樣方式。微軟研究院聯(lián)合華盛頓大學(xué)研發(fā)的“soundwave”系統(tǒng)就是利用聲波代替光波來實(shí)現(xiàn)手勢(shì)識(shí)別的。
相對(duì)于kinect這類采用結(jié)構(gòu)光技術(shù)方案,tof系統(tǒng)軟件復(fù)雜程度通常較低,很容易利用已有的、已經(jīng)商品化的硬件將電腦變成手勢(shì)識(shí)別接口。不過這種控制方式也存在一個(gè)缺點(diǎn),那就是手勢(shì)操控距離較短,如leapmotion的leap只有在50厘米以內(nèi)才能夠?qū)崿F(xiàn)手勢(shì)操控,這就意味著失去了“遠(yuǎn)程手勢(shì)操控”的能力。
從市場(chǎng)來看,windows版kinect設(shè)備預(yù)計(jì)將在今年上半年上市,售價(jià)為249美元。如果你認(rèn)為微軟不夠厚道,那么leapmotion所推出的leap 3d或許就是不錯(cuò)的選擇。這臺(tái)小巧的設(shè)備可以感應(yīng)8立方英尺內(nèi)的任何動(dòng)作,甚至可以同時(shí)識(shí)別不同手指間以及鉛筆的差別,即便是0.01毫米的細(xì)微動(dòng)作變化也能被leap捕捉到, 重要的是售價(jià)僅70美元。
【看看這篇文章在百度的收錄情況】
相關(guān)文章
- 上一篇: DLNA不能用?PSV繞道無線看高清
- 下一篇: MD的中文解釋