據(jù)統(tǒng)計(jì),全世界有數(shù)億人乘坐公交車進(jìn)行日常通勤,世界上一半以上的交通都涉及公交,與地鐵等出行方式不同,雖然公交運(yùn)輸公司有提供公交線路的發(fā)車時(shí)間表,但是公交車的運(yùn)行時(shí)間會(huì)受限于實(shí)時(shí)的路況、路面上的交通指示燈等。這對(duì)于依靠公交車通勤的人來(lái)說(shuō),不確定的等待時(shí)間無(wú)疑會(huì)影響乘車的心情。
近日,谷歌地圖的附加功能做到了!在之前應(yīng)用的基礎(chǔ)上引入了公交車的實(shí)時(shí)交通延誤,預(yù)測(cè)了全球數(shù)百個(gè)城市的公交車延誤情況,從亞特蘭大到薩格勒布,從伊斯坦布爾到馬尼拉等等,這提高了六千多萬(wàn)人的通勤時(shí)間準(zhǔn)確性。
在了解原理前,隨文摘菌看下這款附加功能的演示吧!
印度首發(fā)!公交延遲實(shí)時(shí)了解
該系統(tǒng)于三周前首次在印度推出,由機(jī)器學(xué)習(xí)模型驅(qū)動(dòng),該模型將實(shí)時(shí)汽車交通預(yù)測(cè)與公交線路和站點(diǎn)數(shù)據(jù)相結(jié)合,以更好地預(yù)測(cè)公交車行程需要多長(zhǎng)時(shí)間。以下的動(dòng)圖很好地演示了谷歌地圖中的這項(xiàng)附加功能:
動(dòng)圖中展示了從當(dāng)前位置到arsd(印度地名)的實(shí)時(shí)公交狀況,與以往的搜索結(jié)果不同的是,在首頁(yè)中,添加了紅色字體的延遲時(shí)間。
點(diǎn)開之后可以看到公交線路情況,紅色的部分表示有延遲,藍(lán)色部分表示正常通行,后續(xù)其他演示功能,詳見下方鏈接:
https://india.googleblog.com/2019/06/stay-informed-about-local-bus-and-long.html
數(shù)據(jù)從哪來(lái)?沒(méi)有公交實(shí)時(shí)數(shù)據(jù)也可以!
在沒(méi)有來(lái)自公交機(jī)構(gòu)實(shí)時(shí)預(yù)測(cè)數(shù)據(jù)的許多城市中,開發(fā)者借鑒了用戶采用的一種巧妙的解決方法——使用谷歌地圖的行車路線,考慮到公交運(yùn)輸?shù)奶厥庑裕杭铀?,減速和轉(zhuǎn)彎需要更長(zhǎng)時(shí)間; 有時(shí)候甚至還有特殊的道路特權(quán),比如公共汽車專用車道,所以此方法只適合粗略估計(jì)。另外研究者還結(jié)合了之前項(xiàng)目的數(shù)據(jù)庫(kù)和來(lái)自用戶提供的數(shù)據(jù)來(lái)擴(kuò)充訓(xùn)練語(yǔ)料庫(kù),使得模型能夠擴(kuò)充到多個(gè)城市更加細(xì)粒度的公交線路。
如何建立模型?
為了構(gòu)建開發(fā)模型,在參照公交機(jī)構(gòu)發(fā)布的信息基礎(chǔ)上,開發(fā)人員結(jié)合了一段時(shí)間內(nèi)從公交車位置序列中提取的數(shù)據(jù),同時(shí)也有考慮到公交線路上其他車輛的行進(jìn)速度。
整個(gè)模型分為一系列時(shí)間軸單元 - 途經(jīng)的街道路線和??空?- 每個(gè)單元對(duì)應(yīng)一條公交車的時(shí)間線,獨(dú)立地預(yù)測(cè)一段延遲,最后的輸出是每個(gè)單元預(yù)測(cè)的邏輯求和。其次考慮到一些特殊情況,如:站點(diǎn)之間不頻繁的通信、公交車車速較快、較短的街道路線和??奎c(diǎn)等,所以相鄰站點(diǎn)之間的預(yù)測(cè)通常要跨越多個(gè)時(shí)間單元,以便綜合考慮到各方面的因素,下面的圖片很好地詮釋了建立模型的過(guò)程:
(a)圖中藍(lán)色的圖標(biāo)表示站點(diǎn),公交車在此開始啟動(dòng),在(b)圖中將藍(lán)色的站點(diǎn)抽象成Stop unit的時(shí)間單元,包括發(fā)車時(shí)間表Time、位置信息Location、站點(diǎn)周圍的狀況Stop features以及向前行進(jìn)Feed-forward等一系列特征;
(a)圖中的紅色、黃色和綠色的線路表示公交車的行進(jìn)路線,同理每個(gè)路線抽象建模成Road Unit,除了一些共有的Time、Lacation、Feed-forward特征外,還加入了路況信息Road features、以及路線上的其他車輛的速度預(yù)測(cè)Car forecast等信息。
模型包含了上下文場(chǎng)景的預(yù)測(cè)信息,最終的結(jié)果是這些時(shí)間單元的邏輯求和。這種時(shí)間序列的建模結(jié)構(gòu)非常適合neural sequence model(神經(jīng)網(wǎng)絡(luò)中的序列模型),最近成功應(yīng)用于語(yǔ)音處理、機(jī)器翻譯等。一般情況下使用標(biāo)簽數(shù)據(jù)(X,Y)(輸入數(shù)據(jù)為X,輸出數(shù)據(jù)為Y)的監(jiān)督學(xué)習(xí)任務(wù)都需要使用序列模型,如在NLP領(lǐng)域內(nèi)大放光彩的RNN模型,也是序列模型的應(yīng)用。
考慮到汽車速度的影響
舉例說(shuō)明Car forecast對(duì)Road unit時(shí)間單元的影響,我們以周三下午乘坐Sydney(悉尼)的巴士為例。 公交車的實(shí)際運(yùn)行狀況(藍(lán)色的線路)比公交運(yùn)輸機(jī)構(gòu)公布的時(shí)間表(黑色的線路)滯后幾分鐘,從下圖可以看到, 紅色的線路也就是汽車的運(yùn)動(dòng)狀態(tài)確確實(shí)實(shí)地影響了公交車的前行。
例如,明顯看到圖中紅色標(biāo)記在2000米處的斷層和斜率的變化,這預(yù)示著汽車2000米處的減速,這一減速也同樣體現(xiàn)在了藍(lán)色的公交線路上,同樣地,800米處的暫停,公交的停滯時(shí)間要比汽車長(zhǎng)很多。
上文已經(jīng)舉例說(shuō)明了汽車車速對(duì)公交車行進(jìn)途中造成的影響,那么,如何將Car Speed(汽車速度)轉(zhuǎn)換為公交速度呢?
在下圖的左側(cè)部分,模型對(duì)公交車行駛速度和汽車速度之間的預(yù)測(cè)比率進(jìn)行了顏色編碼。 較慢的紅色部分,對(duì)應(yīng)于??奎c(diǎn)附近的公共汽車減速。 至于速度較快的綠色部分,我們從右圖StreetView中看到了一個(gè)只有公交車的轉(zhuǎn)彎車道。(附:這條路線在澳大利亞,右轉(zhuǎn)彎比左轉(zhuǎn)慢,其他模型可能會(huì)欠缺這些細(xì)節(jié)方面的考量)
捕捉不同地區(qū)線路的差異
不同城市、社區(qū)和街道都有其獨(dú)特性,那么模型如何捕捉這些差異呢?
為了使模型捕捉到更加細(xì)節(jié)的信息,開發(fā)者讓模型學(xué)習(xí)不同大小區(qū)域的表示層次結(jié)構(gòu),以及每個(gè)時(shí)間軸單元的地理位置(道路或站點(diǎn)的精確位置),這些位置的表達(dá),通過(guò)在時(shí)間軸單元中嵌入不同大小區(qū)域的位置表示,最終邏輯求和得到。
剛開始模型的訓(xùn)練,對(duì)特殊情況下的細(xì)粒度位置進(jìn)行強(qiáng)化學(xué)習(xí)(對(duì)模型預(yù)測(cè)結(jié)果進(jìn)行反饋評(píng)估),調(diào)整模型參數(shù),使得模型能夠更好地學(xué)習(xí)特征,并使用結(jié)果進(jìn)行特征選擇。 這樣就可以確??紤]到百米內(nèi)的更加全面的道路信息。
位置和時(shí)間相結(jié)合:適應(yīng)不同城市的“節(jié)奏”
除了考慮到不同位置線路的獨(dú)特性外,每個(gè)城市都有其不同的節(jié)奏,對(duì)于節(jié)奏較慢的小鎮(zhèn),下午6:30到下午6:45可能是偏安靜的黃昏與日落,對(duì)于其他的城市可能是下班高峰期或用餐時(shí)間,因此需要在模型中嵌入時(shí)間表示。
在模型中嵌入當(dāng)?shù)貢r(shí)間和星期幾這些時(shí)間表示,同時(shí)結(jié)合地理位置,可以捕捉到各城市高峰時(shí)段的公交線路,這是之前模型的又一個(gè)擴(kuò)充。
這種擴(kuò)充使得數(shù)據(jù)變成四維(星期幾,幾時(shí),城市名稱,站點(diǎn)),四維的數(shù)據(jù)很難可視化,為了更直觀地解釋,利用下圖藝術(shù)家Will Cassella設(shè)計(jì)的圖片,來(lái)講解四維中的其中三維數(shù)據(jù):
晝夜更替,這種循環(huán)往復(fù),使得模型的時(shí)間表示為一個(gè)類似鐘表的“Loop”結(jié)構(gòu),但是細(xì)心地讀者可能會(huì)發(fā)現(xiàn)這種鐘表的盤面形成了很多的“褶皺”,這也是時(shí)間模型設(shè)計(jì)的精髓。這種“褶皺”結(jié)構(gòu)可以在神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程中,讓神經(jīng)元區(qū)分“半夜”“深夜”這樣的概念。除此外,鐘表盤面上16到21的刻度上有很大的“彎曲”,而2到5的刻度則表現(xiàn)的很“平坦”,這也體現(xiàn)著不同時(shí)段公交的擁堵情況,16到21的刻度代表著下午4點(diǎn)到晚上9點(diǎn),而2到5的刻度則表示半夜或者是下午的時(shí)間。
這種時(shí)間結(jié)構(gòu)的設(shè)計(jì),使得汽車速度是常量時(shí),設(shè)計(jì)的模型也能感知到公交車的高峰擁堵情況,以New Jersey乘坐10km的公交巴士為例,模型呈現(xiàn)的效果如下圖,從圖中可以看到周一到周日每天特定時(shí)刻的公交運(yùn)行時(shí)長(zhǎng),耗時(shí)較多的時(shí)刻集中在一天的7點(diǎn)到8點(diǎn),也就是早高峰,同時(shí)17點(diǎn)到18點(diǎn)的Bus travel time也稍有上浮。
模型效果:讓數(shù)據(jù)“開口”證明
在訓(xùn)練好模型后,模型對(duì)Sydney(悉尼)的公交擁堵情況進(jìn)行了實(shí)時(shí)的預(yù)測(cè):
圖中藍(lán)色的線路是真實(shí)的公交行進(jìn)狀況,綠色的線路是預(yù)測(cè)后的公交運(yùn)動(dòng)路線,可以看到真實(shí)情況下,公交在800米處有大約半分鐘(30s)左右的停車,預(yù)測(cè)模型有感知到差不多10s的停車,這有些許的誤差,統(tǒng)計(jì)完后,整個(gè)模型的預(yù)測(cè)結(jié)果與真實(shí)的效果只差1.5分鐘,這已經(jīng)非常貼近真實(shí)值了。
預(yù)測(cè)不同城市的高峰時(shí)段
除了對(duì)Sydney(悉尼)的預(yù)測(cè)外,模型也對(duì)全世界各大城市的交通擁堵狀況做了統(tǒng)計(jì)。
下圖是對(duì)Chicago最擁堵的公交線路和經(jīng)停站的統(tǒng)計(jì):
-
谷歌
+關(guān)注
關(guān)注
27文章
6220瀏覽量
107362 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8485瀏覽量
133973
原文標(biāo)題:機(jī)器學(xué)習(xí)實(shí)時(shí)預(yù)測(cè)公交延遲!谷歌地圖附加功能上線全球
文章出處:【微信號(hào):BigDataDigest,微信公眾號(hào):大數(shù)據(jù)文摘】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
【「# ROS 2智能機(jī)器人開發(fā)實(shí)踐」閱讀體驗(yàn)】視覺實(shí)現(xiàn)的基礎(chǔ)算法的應(yīng)用
預(yù)測(cè)性運(yùn)維管理平臺(tái)是什么?有什么功能?
英特爾酷睿Ultra處理器助力亦心AI閃繪本地功能上線
微軟預(yù)覽版Copilot Vision AI功能上線
聲智AI播客功能上線
飛凌嵌入式「在線文檔」功能上線 | 開放靈活,盡在掌握

電子地圖的主要功能與應(yīng)用

3MOS和4MOS在功能上有什么區(qū)別
谷歌發(fā)布革命性AI天氣預(yù)測(cè)模型NeuralGCM
機(jī)器人主控器的主控芯片在功能上與什么相似

物聯(lián)網(wǎng)云平臺(tái) 地圖可視化功能上線 #plc #物聯(lián)網(wǎng) #人工智能
6芯M16公頭在汽車功能上的應(yīng)用

評(píng)論