91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

研究人員們提出了一種新的導(dǎo)航工具SafeRoute

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-11-24 09:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

最近的研究表明,85%的女性會在外出時特意避開危險區(qū)域,選擇相對安全的道路,防止受到騷擾或傷害。盡管如此,現(xiàn)有的導(dǎo)航工具并不能給用戶提供安全性指數(shù)。在這篇論文中,研究人員們提出了一種新的導(dǎo)航工具SafeRoute,它借助深度強化學(xué)習工具,能顯示城市街道中潛在的犯罪概率。以下是論智對論文的介紹:

康奈爾大學(xué)和Hollaback公司2014年調(diào)查了美國4872名女性,其中85%的人會為了避免潛在的危險而選擇繞路,67%的調(diào)查對象會改變出行時間確保安全。或許當?shù)厝藭煜に麄兊木幼…h(huán)境,知道哪里危險、哪里相對安全。可是對第一次來某地的人來說,環(huán)境的陌生會大大增加危險發(fā)生的概率。隨著犯罪率的上升,我們在想,是否能創(chuàng)建一款安全道路導(dǎo)航應(yīng)用,讓更多人能保護自己呢?

在這篇論文中,我們的研究對象僅限于非機動車道(例如可以走路或騎自行車的區(qū)域)。在美國,想紐約、波士頓、舊金山這樣的城市,通常有很多步行街道。我們想計算出到達目的地的最短距離,并且危險系數(shù)低的步行方案。現(xiàn)有的導(dǎo)航方法也能覆蓋大城市,但他們沒有考慮犯罪率的問題,忽略了小范圍的犯罪區(qū)域。

另外,最接近也有很多有關(guān)深度強化學(xué)習進行最短路徑導(dǎo)航的成果出現(xiàn),但我們的模型不僅僅是為了規(guī)劃路徑,而是要加入安全因素。于是我們選擇了基于深度強化學(xué)習的解決方案,這在很多數(shù)據(jù)挖掘問題中都是常用方法。

SafeRoute介紹

我們可以將路徑選擇的過程看作是馬爾科夫決策過程,在每個步驟,智能體都要決定下一步的方向,最終到達目的地。首先會向模型輸入開始和結(jié)束點的坐標,模型會返回智能體做出的決策坐標列表,同時對智能體進行獎勵,避免道路上遇到犯罪事件。

模型架構(gòu)

SafeRoute系統(tǒng)主要有兩大部分:強化學(xué)習智能體可以交互的環(huán)境,以及智能體進行表示并做決定的策略網(wǎng)絡(luò)。主要架構(gòu)如下圖:

環(huán)境是用具有< S, A, P, R >元組的馬爾科夫決策過程表示。S表示環(huán)境持續(xù)的狀態(tài),A={a1,a2,…,aN},定義了智能體可能做出的所有動作。P(St+1= s0|St= s,At= a)表示從一個狀態(tài)轉(zhuǎn)移到另一個狀態(tài)的概率。R(s, a)是智能體在狀態(tài)s下做出動作a時的獎勵函數(shù)。

在我們的模型中,智能體的狀態(tài)表示目前在地圖上的位置以及目標位置。如果目標位置和此前訓(xùn)練時的目標位置很接近,那么智能體會采取相似行動靠近該目標。為了表示狀態(tài),地圖信息被轉(zhuǎn)換成有節(jié)點和線條的圖,其中圖嵌入用來表示強化學(xué)習智能體的連續(xù)狀態(tài),這些嵌入用node2vec來生成。用圖嵌入而不用坐標的原因是,坐標不能體現(xiàn)地圖上的交互是如何連接的任何信息。狀態(tài)從智能體目前的節(jié)點和目標節(jié)點中使用的嵌入如下所示:

其中et表示當前節(jié)點的嵌入,etarget表示目標節(jié)點的嵌入。

另外,策略網(wǎng)絡(luò)表示強化學(xué)習智能體使用的隨機策略,用πθ(s, a) = p(a|s;θ)表示,其中θ是神經(jīng)網(wǎng)絡(luò)的參數(shù)列表,會用Adam優(yōu)化器進行更新。系統(tǒng)使用隨機梯度而不是貪婪策略,是為了防止智能體在地圖上循環(huán)前進,停滯不前。運用隨機梯度,智能體可以打破循環(huán)(例如向死路前進或選擇可能會通向死路的道路)。神經(jīng)網(wǎng)絡(luò)包含兩個隱藏層,每一層都有一個ReLU激活函數(shù)。輸出使用一個softmax函數(shù),可以返回所有行為的概率分布。

至于獎勵,智能體要考慮多方面優(yōu)化,所以獎勵函數(shù)也必須包含多種因素。由于SafeRoute的一個重要特征就是躲避犯罪區(qū)域,所以我們將安全性添加到獎勵中,用函數(shù)表示坐標到此前有過犯罪記錄坐標的平均距離。

雖然SafeRoute的主要目標是增加安全性,但是我們還想盡量選擇較短路線。路徑沿線距離犯罪現(xiàn)場的所有平均距離都要計算,如果附近沒有發(fā)生過犯罪事件,那么就得到獎勵k。最終的獎勵函數(shù)定義如下:

其中n是路徑中線條的數(shù)量,m是每個節(jié)點一定半徑內(nèi)的犯罪事件數(shù)量,x是路線中線段的中點,c是每個半徑上發(fā)生的犯罪事件,p是路線,k是超參數(shù)。

訓(xùn)練

訓(xùn)練SafeRoute也分為兩部分:監(jiān)督訓(xùn)練和用獎勵進行重復(fù)訓(xùn)練。在最初不使用監(jiān)督訓(xùn)練的情況下,智能體在找尋目標節(jié)點時很困難,最終可能會隨意尋找方向。AlphaGo在訓(xùn)練時用了模擬學(xué)習的方法,讓智能體在最初能夠找到正確方法。同樣,我們也在訓(xùn)練開始時用監(jiān)督學(xué)習進行模擬學(xué)習。經(jīng)過監(jiān)督學(xué)習之后,智能體還會再次訓(xùn)練,避開犯罪率高的區(qū)域。再次訓(xùn)練的算法過程如下:

實驗過程

由于此前沒有類似的實驗,所以我們創(chuàng)建了自己的SafeRoute數(shù)據(jù)集。我們從OpenStreetMap中收集了地圖信息,這是一個免費的協(xié)作世界地圖,我們選擇了波士頓、紐約和舊金山的市區(qū),這是很多游客會去的地方,也是繁華的市中心。最終,波士頓和舊金山的圖在訓(xùn)練時每個epoch會歐2000個episode,而紐約的更大,可以達到4000個episode。三個模型都經(jīng)過了60epoch的訓(xùn)練。

犯罪數(shù)據(jù)從Spotcrime中收集,其中包括了最近有關(guān)犯罪的類型和地理坐標。我們只選擇了槍擊、騷擾和搶劫三類。

另外,我們在多種尺度上對SafeRoute進行了評估,路線的質(zhì)量有三個方面:距離犯罪點的平均距離(包括局部和全局兩種)以及路線長短。局部犯罪平均距離只考慮當智能體走在路上時,附近的犯罪活動。而全局的平均距離會考慮該路線上所有發(fā)生過的犯罪活動。其中局部平均距離是重點考量因素。

可以看到,在我們的評估前兩個因素的值越高并且路線距離越短的選擇更好。并且在波士頓遵循了離犯罪地點距離最短的原則,但是紐約的案例中,離犯罪地點遠的路線卻很長。

為了減少我們模型結(jié)果的多樣性,我們?yōu)槊總€城市創(chuàng)建了三種模型,并對結(jié)果進行了平均。下表表現(xiàn)了SafeRoute和SafePath最安全的路線相比,增加或減少的百分比。

經(jīng)過測試,SafeRoute能在大多情況下生成合適的結(jié)果,未來,我們打算讓SafeRoute作用于更長路徑和更大的地圖。除此之外,我們還會研究模型的可攜帶型。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4814

    瀏覽量

    103707
  • 智能體
    +關(guān)注

    關(guān)注

    1

    文章

    311

    瀏覽量

    11084
  • 強化學(xué)習
    +關(guān)注

    關(guān)注

    4

    文章

    269

    瀏覽量

    11607

原文標題:強化學(xué)習加持,這個導(dǎo)航不僅能計算路線,還能遠離危險犯罪

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    美國普渡大學(xué)和哈佛大學(xué)的研究人員出了項新發(fā)明 新...

    據(jù)物理學(xué)家組織網(wǎng)報道,美國普渡大學(xué)和哈佛大學(xué)的研究人員出了項極為應(yīng)景的新發(fā)明:一種外形如同顆圣誕樹
    發(fā)表于 02-03 20:30

    研究人員提出了一種柔性可拉伸擴展的多功能集成傳感器陣列

    研究人員提出了一種柔性可拉伸擴展的多功能集成傳感器陣列,成功將電子皮膚的探測能力擴展到7,實現(xiàn)溫度、濕度、紫外光、磁、應(yīng)變、壓力和接近等多種外界刺激的實時同步監(jiān)測。
    的頭像 發(fā)表于 01-24 15:15 ?7629次閱讀
    <b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b><b class='flag-5'>一種</b>柔性可拉伸擴展的多功能集成傳感器陣列

    以色列研究人員開發(fā)出了一種能夠識別不同刺激的新型傳感系統(tǒng)

    據(jù)麥姆斯咨詢報道,海法以色列理工學(xué)院的研究人員開發(fā)出了一種能夠識別并區(qū)分不同刺激的創(chuàng)新型傳感系統(tǒng)。該系統(tǒng)基于折紙藝術(shù),結(jié)合了以色列理工學(xué)院開發(fā)的智能墨水材料。
    發(fā)表于 05-21 08:45 ?1043次閱讀

    哈佛大學(xué)研究人員提出一種用寡肽分子存儲信息的新方法

    Cafferty的分子存儲工具可能無法取代云,但可以為DNA等生物儲存工具提供一種誘人的替代方案。最近,科學(xué)家發(fā)現(xiàn)了DNA編碼的不僅僅是眼睛的顏色。
    的頭像 發(fā)表于 05-05 09:58 ?3922次閱讀

    研究人員提出了系列新的點云處理模塊

    為了探索這些問題的解決辦法、來自倫敦大學(xué)學(xué)院的研究人員提出了系列新的點云處理模塊,從效率、信息共享和點云卷積操作等方面進行了研究,得到了
    的頭像 發(fā)表于 08-02 14:44 ?3336次閱讀
    <b class='flag-5'>研究人員</b><b class='flag-5'>們</b><b class='flag-5'>提出了</b><b class='flag-5'>一</b>系列新的點云處理模塊

    JD和OPPO的研究人員提出了一種姿勢引導(dǎo)的時尚圖像生成模型

    研究人員的主要目的在于訓(xùn)練個生成模型,將模特在當前姿勢上的圖像遷移到其他的目標姿勢上去,實現(xiàn)對于衣著等商品的全面展示。
    的頭像 發(fā)表于 08-02 14:50 ?2787次閱讀

    Facebook的研究人員提出了Mesh R-CNN模型

    研究的目標是通過單張圖像輸入,對圖像中的物體進行檢測、獲取不同物體的類別、掩膜和對應(yīng)的三維網(wǎng)格,并對真實世界中的復(fù)雜模型進行有效處理。在2D深度網(wǎng)絡(luò)的基礎(chǔ)上,研究人員改進并提出了
    的頭像 發(fā)表于 08-02 15:51 ?4274次閱讀
    Facebook的<b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b>Mesh R-CNN模型

    瑞士研究人員研發(fā)出了一種可以躲閃障礙物的無人機

    近日,來自瑞士蘇黎世大學(xué)的研究人員在最新期的《科學(xué)· 機器人》(Science Robotics)雜志上發(fā)表了研究成果,他們設(shè)計出一種
    發(fā)表于 03-23 14:07 ?847次閱讀

    研究人員出了一種新的基于深度學(xué)習的策略

    蘇黎世聯(lián)邦理工學(xué)院的研究人員最近推出了一種新的基于深度學(xué)習的策略,該策略可以在不需要大量真實數(shù)據(jù)的情況下在機器人中實現(xiàn)觸覺傳感。在arXiv上預(yù)先發(fā)表的篇論文中概述了他們的方法,該方
    的頭像 發(fā)表于 03-26 15:47 ?2872次閱讀

    中美研究人員合作開發(fā)出了一種可以預(yù)測新冠肺炎病情的AI工具

    中美兩國研究人員合作,開發(fā)出一種實驗性AI工具,可以準確預(yù)測哪些新冠肺炎(COVID-19)患者的病情會發(fā)展成嚴重的呼吸系統(tǒng)疾病。
    發(fā)表于 04-01 14:30 ?733次閱讀

    研究人員開發(fā)出了一種稱為LB-WayPtNav-DH的機器人導(dǎo)航新框架

    加州大學(xué)伯克利分校的研究人員最近開發(fā)了一種新的框架,該框架可以增強辦公室,房屋或博物館等室內(nèi)環(huán)境中人類的機器人導(dǎo)航能力。他們的模型在arXiv上預(yù)先發(fā)表的篇論文中
    發(fā)表于 04-09 11:18 ?1055次閱讀

    麥克斯·德爾布呂克分子醫(yī)學(xué)中心的研究人員開發(fā)了一種工具

    為了簡化此過程,MDC的研究人員開發(fā)了一種通用的編程工具,該工具可將各種基因組數(shù)據(jù)轉(zhuǎn)換為所需的格式,以供深度學(xué)習模型進行分析。
    的頭像 發(fā)表于 07-16 14:47 ?2273次閱讀

    微軟亞洲研究院的研究提出了一種模型壓縮的新思路

    近日,來自微軟亞洲研究院自然語言計算組的研究提出了一種與顯式地利用蒸餾損失函數(shù)來最小化教師模型與學(xué)生模型距離的知識蒸餾不同的模型壓縮新方
    的頭像 發(fā)表于 11-24 09:48 ?1940次閱讀

    MIT研究人員提出了一種制造軟氣動執(zhí)行器的新方法

    麻省理工學(xué)院 (MIT) 的研究人員創(chuàng)造了一種新的制造技術(shù),可以制造出更具成本效益的軟氣動執(zhí)行器。
    的頭像 發(fā)表于 05-06 16:38 ?1970次閱讀
    MIT<b class='flag-5'>研究人員</b><b class='flag-5'>提出了</b><b class='flag-5'>一種</b>制造軟氣動執(zhí)行器的新方法

    研究人員開發(fā)出了一種超級半導(dǎo)體材料

    研究人員正在探索用于紅外探測器應(yīng)用的鋁和碳納米管。他們知道,在小的貴金屬顆粒(例如,金,銀,鉑)上照射光會引起所謂的等離子體效應(yīng),其中材料上的電荷以一種導(dǎo)致電子積聚在顆粒表面上的方式分布。
    的頭像 發(fā)表于 07-31 12:10 ?1975次閱讀
    主站蜘蛛池模板: 亚洲欧美在线播放 | 美女视频很黄很a免费国产 美女视频很黄很暴黄是免费的 | 精品少妇一区二区三区视频 | 久久久99精品免费观看精品 | 青青热久免费精品视频在线观看 | 九九国产精品视频 | 五月婷婷激情五月 | 色淫阁色九九 | 最新欧美伦理网 | 成人18视频拍拍拍拍拍拍 | 午夜免费啪在线观看视频网站 | 日韩一级欧美一级 | 97影院理论 | 男女一进一出抽搐免费视频 | 久久婷婷五综合一区二区 | 天堂影院jav成人天堂免费观看 | 国产精品一区在线观看你懂的 | 日本在线播放一区 | 2023天天操| 日韩一级在线 | 欧美成人a视频 | 激情综合婷婷 | 国产女人在线视频 | 国内精品手机在线观看视频 | 性爽爽| 亚洲第一视频网 | 人人公开免费超级碰碰碰视频 | 天天操中文字幕 | 天天看天天操 | 无遮挡很污很爽很黄的网站 | 国产精品 视频一区 二区三区 | 女人张开腿让男人桶免费网站 | 午夜不卡影院 | 久久国产精品免费专区 | 婷婷六月久久综合丁香一二 | 中文在线 | 中文 | 四月婷婷七月婷婷综合 | 成人毛片一区二区三区 | 亚洲高清成人 | 色视频综合 | 婷婷 色天使 |