“啪嗒啪嗒……”一只機(jī)器狗在街上邁著規(guī)律的步伐,拉著牽引繩的盲人,在它的帶領(lǐng)下越過沿路障礙平穩(wěn)地行走著。這個(gè)場景是不是很溫馨?當(dāng)智能導(dǎo)盲犬可脫離互聯(lián)網(wǎng)且越來越“聰明”,盲人出行和生活必將越來越順暢。
電子導(dǎo)盲犬能否取代傳統(tǒng)導(dǎo)盲犬,解決視障人士一犬難求的困境?西工大團(tuán)隊(duì)在此方面開展研究攻關(guān)并取得了新的突破。近日,西北工業(yè)大學(xué)光電與智能研究院聯(lián)合中國電信人工智能研究院在探索離線具身智能應(yīng)用方面取得階段性進(jìn)展。
具身智能,即具有物理實(shí)體,能夠通過傳感器和執(zhí)行器與環(huán)境進(jìn)行實(shí)時(shí)互動(dòng),執(zhí)行相應(yīng)指令或進(jìn)行決策的智能機(jī)器。李學(xué)龍教授團(tuán)隊(duì)將機(jī)器狗搭載離線大模型,應(yīng)用在智能導(dǎo)盲場景,開發(fā)出大模型離線具身智能導(dǎo)盲犬,并實(shí)現(xiàn)了其智能人機(jī)交互、智能乘梯引導(dǎo)、智能過街引導(dǎo)、智能室內(nèi)引導(dǎo)等功能。
這一成果進(jìn)一步展示了使用離線具身智能導(dǎo)盲犬代替?zhèn)鹘y(tǒng)導(dǎo)盲犬的可能性,同時(shí)驗(yàn)證了離線具身智能范式的可行性,使大模型具身智能機(jī)器人可以脫離互聯(lián)網(wǎng)環(huán)境,應(yīng)用在無網(wǎng)或網(wǎng)絡(luò)信號不佳的工況環(huán)境,進(jìn)一步拓展了臨地安防的應(yīng)用場景。
近年來,隨著機(jī)器人技術(shù)和SLAM導(dǎo)航技術(shù)的快速發(fā)展,針對電子導(dǎo)盲犬的探索也層出不窮。然而受制于自然語言處理技術(shù)的限制,上一代電子導(dǎo)盲犬仍然欠缺和人類“自由對話”的能力,也難以為視障人士提供情感陪伴。
大模型及具身智能技術(shù)的出現(xiàn),使電子導(dǎo)盲犬實(shí)現(xiàn)這種高級能力成為可能。但機(jī)器狗的低算力計(jì)算平臺難以支撐大模型運(yùn)行所需的海量計(jì)算資源,通常只能通過請求云服務(wù)的“在線具身智能”范式獲得大模型的高級能力,這嚴(yán)重限制了電子導(dǎo)盲犬的場景應(yīng)用范圍。
6865736_2b3bbde3-e881-4948-ad0c-df370a037e0b.gif (4.38 MB, 下載次數(shù): 9)
下載附件
2024-3-22 17:19 上傳
電子導(dǎo)盲犬
為此,李學(xué)龍教授團(tuán)隊(duì)結(jié)合目前最新的大模型量化壓縮和加速推理技術(shù),成功將大模型部署至機(jī)器狗的低算力計(jì)算平臺,驗(yàn)證了“離線具身智能”范式的可行性。
據(jù)介紹,目前通過實(shí)驗(yàn),團(tuán)隊(duì)開發(fā)的離線具身智能導(dǎo)盲犬已能夠與視障人士流暢溝通指令,并帶領(lǐng)其通過馬路、樓梯、電梯等多樣復(fù)雜環(huán)境,驗(yàn)證了離線具身智能導(dǎo)盲犬的智能人機(jī)交互能力、電梯弱網(wǎng)絡(luò)環(huán)境下的智能乘梯引導(dǎo)能力、實(shí)時(shí)性要求較高的智能過街引導(dǎo)能力和智能室內(nèi)引導(dǎo)能力等。
6865736_d3738394-b461-4dcd-8a43-b0eee015d879.gif (5.66 MB, 下載次數(shù): 7)
下載附件
2024-3-22 17:19 上傳
離線具身智能導(dǎo)盲犬指引視障人士進(jìn)電梯
6865736_0ec3d11c-effd-4dfc-88f3-b9118c621f6e.gif (8.02 MB, 下載次數(shù): 9)
下載附件
2024-3-22 17:19 上傳
離線具身智能導(dǎo)盲犬指引視障人士過馬路
該成果證明了離線具身智能導(dǎo)盲犬代替?zhèn)鹘y(tǒng)導(dǎo)盲犬的可能性,同時(shí)驗(yàn)證了離線具身智能范式的可行性,使大模型具身智能機(jī)器人可以脫離互聯(lián)網(wǎng),應(yīng)用在無網(wǎng)或網(wǎng)絡(luò)信號不佳的工況環(huán)境,提供更加實(shí)時(shí)的智能響應(yīng)以及更好的人機(jī)交互體驗(yàn)。
未來,團(tuán)隊(duì)將進(jìn)一步優(yōu)化具身智能導(dǎo)盲犬技術(shù)方案,與電信星辰大模型相結(jié)合,探索在線與離線相融合的分布式異構(gòu)具身智能方案,進(jìn)一步拓寬離線具身智能導(dǎo)盲犬及更多智能機(jī)器人平臺的應(yīng)用場景,有效賦能工業(yè)生產(chǎn)智能化,加快形成新質(zhì)生產(chǎn)力。
任娜 西工大供圖、視頻
|