其他優勝作品包括 AI 驅動的虛擬試衣應用和一款能夠尋找遺失物品的機器人等。
YouTube 機器人技術主播 Dave Niewinski 開發的機器人五花八門,從可駕駛的“La-Z-Boy”椅子到由 AI 引導的扔沙包機器人、馬車比賽機器人等。
他最近的交互式電子動畫 GLaDOS 項目成為了 Hackster AI 創新挑戰賽的九個優勝作品之一。約 100 名參賽者通過創建開源項目、推動 AI 在邊緣計算、機器人和物聯網領域的應用,來角逐由 NVIDIA 與 Sparkfun 提供的獎品。
Niewinski 根據視頻游戲開發商 Valve 的第一人稱解謎系列游戲《傳送門》(Portal)中的 GLaDOS 向導,設計出了一個創新機器人,該機器人贏得了生成式 AI 應用組第一名。
另兩位優勝者 Andrei Ciobanu 和 Allen Tao 分別獲得了邊緣生成式 AI 模型和邊緣 AI 應用組的一等獎。Ciobanu 利用生成式 AI 幫助實現虛擬試衣,而 Tao 所開發的基于 ROS 的機器人可通過繪制家庭內部地圖來幫助尋找物品。
將 LLM 應用于機器人
Niewinski 在其位于加拿大安大略省滑鐵盧的 Armoury Labs 開發定制化的機器人應用。他使用 NVIDIA Jetson 平臺開發邊緣 AI 和機器人技術,并根據自己的經驗創建開源教程和 YouTube 視頻。
為了給自己配備一名實驗室私人助理,他制作了一個自己的 GLaDOS 交互機器人。該機器人使用基于 Transformer 的語音識別、文本轉語音和大語言模型(LLM)處理查詢,這些功能與模型均在 NVIDIA Jetson AGX Orin 上運行,可與機械臂和攝像頭進行交互。
GLaDOS 可以追蹤 Niewinski 在實驗室中的行蹤,能夠朝不同的方向移動來面對他,并對詢問作出快速反應。
Niewinski 表示:“我喜歡用機器人做一些出乎人們意料的事情。”
他希望這個助手的聲音能像《傳送門》中的原版 GLaDOS 一樣,并且能夠迅速作出反應。幸運的是,游戲公司 Valve 把《傳送門》和《傳送門 2》中的所有語音臺詞都放在了自己的網站上,Niewinski 可以下載該音頻來訓練模型。
他提到:“使用 Jetson 的話,一般的問答語音都能快速運行。”
Niewinski 利用 NVIDIA 的開源 NeMo 套件對 GLaDOS 的語音進行了微調,訓練出一個名為 FastPitch 的頻譜生成器網絡和一個名為 HiFiGAN 的聲碼器網絡來提高音頻質量。
這兩個網絡都被部署到搭載 NVIDIA Riva 的 Orin 上,將語音識別與合成功能的運行速度優化到數倍于語音的實時速度,使其能夠與 LLM 同步運行并保持流暢的交互傳輸。
為了讓 GLaDOS 生成符合現實的回答,Niewinski 使用了一個名為 OpenChat 的本地托管 LLM,該模型在 Docker 中運行,來自 jetson-containers。所有這些 AI 都在 Jetson 模塊上運行,使用的是由 CUDA 和 JetPack 構建的最新開源 ML 軟件堆棧。
為了讓 GLaDOS 能夠移動,Niewinski 專門為宇樹科技 Z1 機械臂開發了交互功能。GLaDOS 可以通過一個立體攝像頭和多個模型來觀察和追蹤人類語言,其機械臂周圍裝上了 3D 打印的 GLaDOS 頭部和身體外殼。
借助生成式 AI 試遍新款服裝
來自羅馬尼亞的 Winner Ciobanu 希望借助生成式 AI 提升虛擬試衣體驗,他的作品 EdgeStyle: Fashion Preview at the Edge 奪得了第一名。
他使用 YOLOv5、SAM、OpenPose 等 AI 模型,從圖像和視頻中提取并完善數據,然后使用 Stable Diffusion 生成圖像,他表示Stable Diffusion是實現精準虛擬試穿的關鍵所在。
Ciobanu 提到,這個系統教會了模型如何將衣服“穿”在不同姿勢的人身上,從而增強了試穿的真實感。
“這個系統非常方便,可以讓用戶不用真的去實際試穿,就能看到衣服穿在身上的效果。”
他表示,NVIDIA JetPack SDK 提供了在 Jetson Orin 上順利運行 AI 模型所需的所有工具。
“AI 技術日新月異,擁有一套穩定的工具非常有用。它確實為我們這些開發者節約了時間,減少了麻煩,讓我們能夠擺脫技術問題的困擾,把更多精力放在構建很酷的東西上。”
讓機器人幫助尋找遺失物品
加拿大安大略省的獲獎者 Winner Tao 創造的機器人可以幫助人們在家中尋找遺失物品。他的 An Eye for an Item 項目贏得了 Hackster 挑戰賽的第一名。
Tao 提到:“尋找丟失的物品是一件苦差事,而近期零樣本物體檢測和 LLM 領域的最新進展使計算機可以根據文字或圖片描述為我們檢測任意物體,這帶來了實現自動化的可能性。”
Tao 表示自己需要機器人的計算能力來對任何非結構化環境中的物體進行分類,比如客廳、大型倉庫等。他還需要機器人執行實時計算以進行導航定位,并在更大規模的物體檢測模型上進行推理。
他表示:“Jetson Orin 是一個絕佳的選擇,它支持從使用 NanoDB 查詢文本和圖像到實時里程反饋等一切功能,包括使用 Isaac ROS 的硬件來加速 AprilTag 檢測進行漂移校正。”
審核編輯:劉清
-
機器人
+關注
關注
211文章
28646瀏覽量
208439 -
語音識別
+關注
關注
38文章
1742瀏覽量
112933 -
ROS
+關注
關注
1文章
280瀏覽量
17102 -
邊緣計算
+關注
關注
22文章
3122瀏覽量
49531 -
ai技術
+關注
關注
1文章
1290瀏覽量
24462
原文標題:AI 大顯身手:GLaDOS 交互機器人入選 Hackster.io 挑戰賽 9 個優勝作品之一
文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業解決方案】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
【「具身智能機器人系統」閱讀體驗】2.具身智能機器人的基礎模塊
【「具身智能機器人系統」閱讀體驗】1.初步理解具身智能
【「具身智能機器人系統」閱讀體驗】1.全書概覽與第一章學習
【「具身智能機器人系統」閱讀體驗】+數據在具身人工智能中的價值
EDA精英挑戰賽賽果公布!思爾芯“戰隊”薪火相承斬獲“麒麟杯”
![EDA精英<b class='flag-5'>挑戰賽</b><b class='flag-5'>賽</b>果公布!思爾芯“戰隊”薪火相承斬獲“麒麟杯”](https://file.elecfans.com/web2/M00/4B/6A/pYYBAGKoTXWAFdqwAAAWmg44LUs841.png)
2024年ICPC與華為挑戰賽冠軍杯圓滿落幕
開源項目!用ESP32做一個可愛的無用機器人
開源項目!用ESP32做一個可愛的無用機器人
AI4Science黑客松光子計算挑戰賽成功舉辦
思爾芯賽題正式發布,邀你共戰EDA精英挑戰賽!
![思爾芯<b class='flag-5'>賽</b>題正式發布,邀你共戰EDA精英<b class='flag-5'>挑戰賽</b>!](https://file.elecfans.com/web2/M00/4B/6A/pYYBAGKoTXWAFdqwAAAWmg44LUs841.png)
abb機器人的io通信和信號設置過程
入圍全球機器人頂會ICRA 2024!毫末在RoboDrive2024挑戰賽嶄露頭角
![入圍全球<b class='flag-5'>機器人</b>頂會ICRA 2024!毫末在RoboDrive2024<b class='flag-5'>挑戰賽</b>嶄露頭角](https://file1.elecfans.com/web2/M00/E6/55/wKgZomZGwa6AVt0GAAKRYfwigDA137.png)
人形機器人場景應用全解析,2024睿抗 AI ROBOT創新挑戰賽火熱報名中!
![人形<b class='flag-5'>機器人</b>場景應用全解析,2024睿抗 AI ROBOT創新<b class='flag-5'>挑戰賽</b>火熱報名中!](https://file1.elecfans.com/web2/M00/E5/4C/wKgZomZCzV2AWntGAAfPSa65weM446.png)
評論