您的位置: 首頁(yè) >互聯(lián)網(wǎng) >

通過(guò)手勢(shì)引導(dǎo)的2-D顯示設(shè)備上的形狀的視覺(jué)呈現(xiàn)

2019-06-06 17:00:11 編輯: 來(lái)源:
導(dǎo)讀 NIT Kurukshetra,IIT Roorkee和IIT Bhubaneswar的研究人員開(kāi)發(fā)了一種新的基于Leap Motion控制器的方法,可以改善顯示設(shè)備上二維和三維

NIT Kurukshetra,IIT Roorkee和IIT Bhubaneswar的研究人員開(kāi)發(fā)了一種新的基于Leap Motion控制器的方法,可以改善顯示設(shè)備上二維和三維形狀的渲染。在arXiv上發(fā)表的一篇論文中概述的這種新方法跟蹤手指運(yùn)動(dòng),同時(shí)用戶(hù)在傳感器視野內(nèi)執(zhí)行自然手勢(shì)。

近年來(lái),研究人員一直在嘗試設(shè)計(jì)創(chuàng)新的非接觸式用戶(hù)界面。這樣的接口可以允許用戶(hù)即使在他們的手臟或不導(dǎo)電時(shí)也與電子設(shè)備交互,同時(shí)還幫助人們部分身體殘疾。低成本傳感器的出現(xiàn)增強(qiáng)了探索這些可能性的研究,例如Leap Motion,Kinect和RealSense器件所使用的傳感器。

“我們希望開(kāi)發(fā)一種能夠?yàn)閷W(xué)習(xí)粘土藝術(shù)的學(xué)生提供引人入勝的教學(xué)體驗(yàn)的技術(shù),甚至是學(xué)習(xí)基本字母的孩子,”進(jìn)行這項(xiàng)研究的研究人員Debi Prosad Dogra博士告訴TechXplore。“了解兒童從視覺(jué)刺激中學(xué)習(xí)得更好的事實(shí),我們利用著名的手部動(dòng)作捕捉設(shè)備來(lái)提供這種體驗(yàn)。我們想設(shè)計(jì)一個(gè)框架,可以識(shí)別教師的手勢(shì)并在屏幕上呈現(xiàn)視覺(jué)效果。設(shè)置可以是用于需要手勢(shì)引導(dǎo)的視覺(jué)渲染的應(yīng)用程序。“

Dogra博士及其同事提出的框架有兩個(gè)不同的部分。在第一部分中,用戶(hù)從Leap Motion設(shè)備的視野內(nèi)可用的36種類(lèi)型的手勢(shì)中執(zhí)行自然手勢(shì)。

“傳感器內(nèi)的兩個(gè)紅外攝像機(jī)可以記錄手勢(shì)序列,”Dogra博士說(shuō)。“提議的機(jī)器學(xué)習(xí)模塊可以預(yù)測(cè)手勢(shì)類(lèi),渲染單元在屏幕上呈現(xiàn)相應(yīng)的形狀。”

分析用戶(hù)的手部軌跡以提取3-D中的擴(kuò)展Npen ++特征。表示用戶(hù)在手勢(shì)期間的手指運(yùn)動(dòng)的這些特征被饋送到用于訓(xùn)練的單向從左到右的隱馬爾可夫模型(HMM)。然后,系統(tǒng)在手勢(shì)和形狀之間執(zhí)行一對(duì)一的映射。最后,使用MuPad界面在顯示器上呈現(xiàn)與這些手勢(shì)對(duì)應(yīng)的形狀。

“從開(kāi)發(fā)人員的角度來(lái)看,擬議的框架是一個(gè)典型的開(kāi)放式框架,”Dogra博士解釋說(shuō)。“為了增加更多的手勢(shì),開(kāi)發(fā)人員只需要從一些志愿者那里收集手勢(shì)序列數(shù)據(jù),并為新課程重新訓(xùn)練機(jī)器學(xué)習(xí)(ML)模型。這個(gè)ML模型可以學(xué)習(xí)一個(gè)廣義的表示。”

作為他們研究的一部分,研究人員創(chuàng)建了一個(gè)由10名志愿者記錄的5400個(gè)樣本的數(shù)據(jù)集。他們的數(shù)據(jù)集包含18種幾何形狀和18種非幾何形狀,包括圓形,矩形,花形,圓錐形,球形等等。

“特征選擇是典型機(jī)器學(xué)習(xí)應(yīng)用的重要部分之一,”Dogra博士說(shuō)。“在我們的工作中,我們已經(jīng)擴(kuò)展了3-D中現(xiàn)??有的2-D Npen ++功能。已經(jīng)證明擴(kuò)展功能可以顯著提高性能.3-D Npen ++功能也可以用于其他類(lèi)型的信號(hào),例如正文 - 檢測(cè),活動(dòng)識(shí)別等。“

Dogra博士及其同事用五重交叉驗(yàn)證評(píng)估了他們的方法,發(fā)現(xiàn)它的準(zhǔn)確率達(dá)到了92.87%。它們擴(kuò)展的3-D特征優(yōu)于現(xiàn)有的3-D特征,用于形狀表示和分類(lèi)。將來(lái),研究人員設(shè)計(jì)的方法可以幫助開(kāi)發(fā)智能顯示設(shè)備的有用的人機(jī)交互(HCI)應(yīng)用程序。

“我們的手勢(shì)識(shí)別方法非常普遍,”Dogra博士補(bǔ)充道。“我們將這項(xiàng)技術(shù)視為聾人和殘疾人溝通的工具。我們現(xiàn)在希望利用該系統(tǒng)來(lái)理解手勢(shì)并將其轉(zhuǎn)換成書(shū)面形式或形狀,以協(xié)助人們進(jìn)行日常生活對(duì)話(huà)。隨著先進(jìn)的機(jī)器學(xué)習(xí)的出現(xiàn)像遞歸神經(jīng)網(wǎng)絡(luò)(RNN)和長(zhǎng)期短期記憶(LSTM)這樣的模型,時(shí)間信號(hào)分類(lèi)也有很多范圍。“


免責(zé)聲明:本文由用戶(hù)上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

最新文章

精彩推薦

圖文推薦

點(diǎn)擊排行

2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號(hào):閩ICP備19027007號(hào)-6

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。