資料介紹
針對數(shù)字城市研究手段不足,尤其在收集大量研究文獻(xiàn)的基礎(chǔ)上對數(shù)字城市進(jìn)行整體研究上的欠缺,本文基于R語言和Selenium框架設(shè)計了穩(wěn)定、高效的爬蟲程序,獲取了中國知網(wǎng)2018年5月前收錄的數(shù)字城市為主題的研究文獻(xiàn),并建立了數(shù)字城市文獻(xiàn)數(shù)據(jù)庫和數(shù)字城市自動分詞模型。通過分析數(shù)字城市研究的時序性、空間分布特征和研究熱點,揭示了數(shù)字城市研究的發(fā)展歷程、現(xiàn)狀、發(fā)展趨勢和研究熱點。結(jié)果表明本文設(shè)計的網(wǎng)絡(luò)爬蟲程序在數(shù)字城市研究文獻(xiàn)的收集方面具有可行性和有效性。
數(shù)字城市源自“數(shù)字地球”的概念,是把城市的地理信息和其他與城市相關(guān)的信息結(jié)合并存儲在計算機(jī)網(wǎng)絡(luò)中,讓城市和城市外空間連接在一起的虛擬空間[1]。目前數(shù)字城市的建設(shè)在全國多個省份、城市中展開,行業(yè)應(yīng)用深入城市的各個領(lǐng)域。關(guān)于數(shù)字城市的研究,近年來雖然不乏技術(shù)和理論等方面的研究,但從獲取大量的數(shù)字城市研究文獻(xiàn)的角度對數(shù)字城市研究的發(fā)展歷程、現(xiàn)狀、發(fā)展趨勢、研究熱點的研究目前還沒有。
?
網(wǎng)絡(luò)爬蟲是依據(jù)程序,模擬訪問網(wǎng)頁、自動化提取網(wǎng)頁信息的腳本,是快速獲取網(wǎng)頁信息的一種方式。網(wǎng)絡(luò)爬蟲按照類型主要分為通用型爬蟲、面向主題爬蟲、分布式爬蟲三種,相比較而言面向主題爬蟲應(yīng)用廣泛,形式較為靈活,可針對特定的網(wǎng)頁數(shù)據(jù)進(jìn)行設(shè)計高效的爬蟲程序。
本文采用面向主題的網(wǎng)絡(luò)爬蟲方法,以中國知網(wǎng)(National Knowledge Infrastructure, CNKI) 2018 年5 月前收錄的以數(shù)字城市為主題的文獻(xiàn)為研究對象,基于R 語言和Selenium 網(wǎng)絡(luò)框架設(shè)計出網(wǎng)絡(luò)爬蟲程序。該程序?qū)χ袊W(wǎng)的網(wǎng)頁進(jìn)行分析,獲取網(wǎng)頁請求參數(shù),模擬瀏覽器請求和響應(yīng)服務(wù)器,最終獲取了數(shù)字城市研究文獻(xiàn)信息,將獲取到的數(shù)據(jù)同步保存到本地,構(gòu)建數(shù)字城市文獻(xiàn)數(shù)據(jù)庫(包括:編號、題名、作者、來源、發(fā)表時間、數(shù)據(jù)庫、被引、下載次數(shù)、作者單位、摘要、關(guān)鍵詞、資助基金共12 個字段)。并以數(shù)字城市文獻(xiàn)數(shù)據(jù)庫為數(shù)據(jù)基礎(chǔ),基于文本挖掘技術(shù)構(gòu)建了數(shù)字城市自動分詞模型,通過分析數(shù)字城市研究的時序性、空間分布特征和研究熱點,揭示了數(shù)字城市研究的發(fā)展歷程、現(xiàn)狀、發(fā)展趨勢和熱點。
數(shù)字城市源自“數(shù)字地球”的概念,是把城市的地理信息和其他與城市相關(guān)的信息結(jié)合并存儲在計算機(jī)網(wǎng)絡(luò)中,讓城市和城市外空間連接在一起的虛擬空間[1]。目前數(shù)字城市的建設(shè)在全國多個省份、城市中展開,行業(yè)應(yīng)用深入城市的各個領(lǐng)域。關(guān)于數(shù)字城市的研究,近年來雖然不乏技術(shù)和理論等方面的研究,但從獲取大量的數(shù)字城市研究文獻(xiàn)的角度對數(shù)字城市研究的發(fā)展歷程、現(xiàn)狀、發(fā)展趨勢、研究熱點的研究目前還沒有。
網(wǎng)絡(luò)爬蟲是依據(jù)程序,模擬訪問網(wǎng)頁、自動化提取網(wǎng)頁信息的腳本,是快速獲取網(wǎng)頁信息的一種方式。網(wǎng)絡(luò)爬蟲按照類型主要分為通用型爬蟲、面向主題爬蟲、分布式爬蟲三種,相比較而言面向主題爬蟲應(yīng)用廣泛,形式較為靈活,可針對特定的網(wǎng)頁數(shù)據(jù)進(jìn)行設(shè)計高效的爬蟲程序。
本文采用面向主題的網(wǎng)絡(luò)爬蟲方法,以中國知網(wǎng)(National Knowledge Infrastructure, CNKI) 2018 年5 月前收錄的以數(shù)字城市為主題的文獻(xiàn)為研究對象,基于R 語言和Selenium 網(wǎng)絡(luò)框架設(shè)計出網(wǎng)絡(luò)爬蟲程序。該程序?qū)χ袊W(wǎng)的網(wǎng)頁進(jìn)行分析,獲取網(wǎng)頁請求參數(shù),模擬瀏覽器請求和響應(yīng)服務(wù)器,最終獲取了數(shù)字城市研究文獻(xiàn)信息,將獲取到的數(shù)據(jù)同步保存到本地,構(gòu)建數(shù)字城市文獻(xiàn)數(shù)據(jù)庫(包括:編號、題名、作者、來源、發(fā)表時間、數(shù)據(jù)庫、被引、下載次數(shù)、作者單位、摘要、關(guān)鍵詞、資助基金共12 個字段)。并以數(shù)字城市文獻(xiàn)數(shù)據(jù)庫為數(shù)據(jù)基礎(chǔ),基于文本挖掘技術(shù)構(gòu)建了數(shù)字城市自動分詞模型,通過分析數(shù)字城市研究的時序性、空間分布特征和研究熱點,揭示了數(shù)字城市研究的發(fā)展歷程、現(xiàn)狀、發(fā)展趨勢和熱點。
- 網(wǎng)絡(luò)爬蟲,Python和數(shù)據(jù)分析 2次下載
- 用Python寫網(wǎng)絡(luò)爬蟲 21次下載
- 什么是網(wǎng)絡(luò)爬蟲使用Python寫網(wǎng)絡(luò)爬蟲的教程說明 3次下載
- 用Python寫網(wǎng)絡(luò)爬蟲的PDF電子書免費下載 9次下載
- 爬蟲是如何實現(xiàn)數(shù)據(jù)的獲取爬蟲程序如何實現(xiàn) 10次下載
- 如何設(shè)計一個網(wǎng)絡(luò)爬蟲程序進(jìn)行智慧城市研究的獲取與分析 9次下載
- 如何使用大數(shù)據(jù)技術(shù)進(jìn)行居民在夜間的情感變化研究資料分析 5次下載
- python爬蟲入門教程之python爬蟲視頻教程分布式爬蟲打造搜索引擎 29次下載
- 應(yīng)用Verilog HDL進(jìn)行數(shù)字系統(tǒng)設(shè)計實例 88次下載
- 一種新型網(wǎng)絡(luò)爬蟲的設(shè)計與實現(xiàn)
- 一種新的網(wǎng)絡(luò)爬蟲帶寬控制策略
- 一種維護(hù)WAP網(wǎng)站的網(wǎng)絡(luò)爬蟲的設(shè)計
- 基于HTMLParser 信息提取的網(wǎng)絡(luò)爬蟲設(shè)計Design
- 用MatLab進(jìn)行數(shù)字信號處理
- “數(shù)字城市”初步研究
- 如何使用 Verilog 進(jìn)行數(shù)字電路設(shè)計 307次閱讀
- 如何看待Python爬蟲的合法性? 669次閱讀
- 網(wǎng)絡(luò)封包分析軟件——Wireshark抓包教程 1376次閱讀
- 爬蟲的學(xué)習(xí)方法 877次閱讀
- Python-爬蟲開發(fā)01 617次閱讀
- 網(wǎng)絡(luò)數(shù)據(jù)包分析軟件wireshark的基本使用 3060次閱讀
- 爬蟲技術(shù)為什么變成了害蟲?爬蟲技術(shù)到底犯了什么錯? 4276次閱讀
- 如何解決爬蟲被封的問題 5326次閱讀
- Python爬蟲8個常用的爬蟲技巧分析總結(jié) 5120次閱讀
- Python3網(wǎng)絡(luò)爬蟲入門實戰(zhàn)解析 5557次閱讀
- Python爬蟲速成指南讓你快速的學(xué)會寫一個最簡單的爬蟲 7115次閱讀
- Python學(xué)習(xí)爬蟲掌握的庫資料大全和框架的選擇的分析 5227次閱讀
- 網(wǎng)絡(luò)爬蟲教程(1):音樂歌單編寫 1171次閱讀
- 初學(xué)者寫Python爬蟲的四大工具 5849次閱讀
- 針對中小城市GSM網(wǎng)絡(luò)的網(wǎng)絡(luò)規(guī)劃和整治流程及方案分析 714次閱讀
下載排行
本周
- 1AN-1267: 使用ADSP-CM408F ADC控制器的電機(jī)控制反饋采樣時序
- 1.41MB | 3次下載 | 免費
- 2AN158 GD32VW553 Wi-Fi開發(fā)指南
- 1.51MB | 2次下載 | 免費
- 3AN148 GD32VW553射頻硬件開發(fā)指南
- 2.07MB | 1次下載 | 免費
- 4AN-282: 采樣數(shù)據(jù)系統(tǒng)基本原理[中文版]
- 1.52MB | 次下載 | 免費
- 5AN-1390:手動選擇頻段以縮短PLL鎖定時間
- 310.58KB | 次下載 | 免費
- 6AN-1321:電流檢測應(yīng)用中的共模瞬態(tài)
- 246.83KB | 次下載 | 免費
- 7AN-620:將AD1836和AD1953用于帶DSP的4輸入/9輸出模擬系統(tǒng)
- 66.76KB | 次下載 | 免費
- 8EE-170:估算ADSP-TS201S TigerSHARC處理器的功耗
- 372.77KB | 次下載 | 免費
本月
- 1ADI高性能電源管理解決方案
- 2.43 MB | 450次下載 | 免費
- 2免費開源CC3D飛控資料(電路圖&PCB源文件、BOM、
- 5.67 MB | 138次下載 | 1 積分
- 3基于STM32單片機(jī)智能手環(huán)心率計步器體溫顯示設(shè)計
- 0.10 MB | 130次下載 | 免費
- 4使用單片機(jī)實現(xiàn)七人表決器的程序和仿真資料免費下載
- 2.96 MB | 44次下載 | 免費
- 5美的電磁爐維修手冊大全
- 1.56 MB | 24次下載 | 5 積分
- 6如何正確測試電源的紋波
- 0.36 MB | 18次下載 | 免費
- 7感應(yīng)筆電路圖
- 0.06 MB | 10次下載 | 免費
- 8萬用表UT58A原理圖
- 0.09 MB | 9次下載 | 5 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935121次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計
- 1.48MB | 420062次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233088次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191367次下載 | 10 積分
- 5十天學(xué)會AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183335次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81581次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費下載
- 0.02 MB | 73810次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評論