現(xiàn)有研究方法存在哪些問題?
“大數(shù)據(jù)”已儼然成為時代熱詞,社會學(xué)家說它是一座蘊含了大量信息的富礦,統(tǒng)計學(xué)家卻認(rèn)為龐雜的結(jié)構(gòu)為數(shù)據(jù)分析帶來了巨大的挑戰(zhàn),從中提取有用信息猶如大海撈針。
相比于傳統(tǒng)數(shù)據(jù)類型,大數(shù)據(jù)的分析難度不言而喻。
如何用好這些數(shù)據(jù),高效提取有價值的信息,是在數(shù)據(jù)豐富的今天需要探討的話題。
大數(shù)據(jù)輿情分析面臨著數(shù)據(jù)量大、維度多樣、結(jié)構(gòu)復(fù)雜等問題。研究對象也從受眾個體發(fā)展到了受眾之間、傳受之間的復(fù)雜網(wǎng)絡(luò)關(guān)系,甚至雜糅了時間、空間維度等場景化信息。但現(xiàn)有的研究仍以數(shù)量統(tǒng)計和詞頻分析為主,難以深入挖掘大數(shù)據(jù)的潛在價值。
不同維度的數(shù)據(jù)都需要專業(yè)的分析方法,繼而革新了輿情研究的思維方式。基于豐富的輿情分析理論和經(jīng)驗,科學(xué)研究方法才能使輿情研究如虎添翼。
科學(xué)分析大數(shù)據(jù)有助于研究者打開視野,從更開闊的角度切入研究。根據(jù)不同研究意圖搭建復(fù)雜模型檢驗,深入因果推論,可以實現(xiàn)輿情研究的數(shù)據(jù)化、動態(tài)化,也可以加強趨勢研判的延展性、科學(xué)性。
采用科學(xué)的研究方法、納入大數(shù)據(jù)模型,也是互聯(lián)網(wǎng)環(huán)境下輿情研究的發(fā)展趨勢,為更加全面立體地掌握輿情動態(tài)奠定了科學(xué)基礎(chǔ)。
科學(xué)研究方法的3大“用武之地”
筆者結(jié)合日常實踐,梳理了科學(xué)輿情研究方法在大數(shù)據(jù)層面的具體運用。
1、基礎(chǔ)統(tǒng)計分析方法:掌握輿情全貌
基礎(chǔ)統(tǒng)計分析方法是掌握輿情全貌的重要基礎(chǔ)。
輿情發(fā)展是一個分階段的動態(tài)過程,通過對數(shù)據(jù)所包含的維度進行基礎(chǔ)統(tǒng)計計算,能夠獲得橫向切面和縱向發(fā)展的雙向描述,進而掌握輿情全貌。
一是橫向比較橫截面數(shù)據(jù),描繪當(dāng)下輿論情況。
例如,在國際傳播研究中,首先要了解國際輿情。通過統(tǒng)計給定時間內(nèi)的輿情數(shù)量規(guī)模、情感傾向、話題細(xì)分等數(shù)據(jù),能夠快速勾勒基本輪廓,便于研究者了解某一時段的靜態(tài)輿情特征。
二是縱向?qū)Ρ葧r間序列數(shù)據(jù),動態(tài)追蹤輿情態(tài)勢。
為深入研究國際輿情,還需長期追蹤基礎(chǔ)統(tǒng)計量。持續(xù)累積同口徑數(shù)據(jù)列,便能回溯其發(fā)展趨勢,并通過時間序列模型預(yù)測輿情發(fā)展態(tài)勢。
2、傳統(tǒng)量化研究方法:推動輿情研判
傳統(tǒng)量化研究方法是推動輿情研判的重要保障。
輿情研判是指通過特定方法對輿情信息的特性、態(tài)勢、走向進行研究判斷的專業(yè)工作。大數(shù)據(jù)輿情研判需要借力傳統(tǒng)量化研究方法,采用相關(guān)分析探索不同變量間相互作用的關(guān)系,采用回歸分析探索變量間的依賴關(guān)系,并預(yù)測變量的發(fā)展趨勢。
一方面,將相關(guān)分析用于輿情研究,適用于分辨看似無關(guān)的信息間潛在的相互關(guān)聯(lián),能夠從龐雜的數(shù)據(jù)中發(fā)掘足以影響全局的非確定關(guān)系,從而確定如何在復(fù)雜環(huán)境中精準(zhǔn)研判輿情態(tài)勢。
2018年6月23日,泰國一支青少年足球隊被困洞穴,7月10日獲救。該事件引發(fā)全球媒體和公眾廣泛持續(xù)的關(guān)注。筆者在分析該事件時發(fā)現(xiàn),傳統(tǒng)媒體報道和社交平臺熱議話題間存在相關(guān)關(guān)系,兩個輿論場相互影響的復(fù)雜漸變關(guān)系還原了輿論觸發(fā)和影響機制。
另一方面,回歸分析應(yīng)用到輿情分析領(lǐng)域,能夠探究相關(guān)變量間的因果關(guān)系及發(fā)展走勢,尋找輿情演變規(guī)律模型。通過建模分析,不僅可以判斷不同議題、國家、媒體間的關(guān)系,還能進一步探究相關(guān)輿論的未來走勢。
例如,以各國媒體就新冠肺炎疫情的報道為素材建模,能夠從宏觀角度把握國際輿論,并直觀展現(xiàn)各國媒體新聞敘事的關(guān)系,探明媒體報道與國際輿論的相互影響,找到國際輿情的演變路徑。
3、量化文本分析方法:深度挖掘輿情
量化文本分析方法是深度挖掘輿情的重要助力。
大數(shù)據(jù)背后隱藏著肉眼難以識別的深層信息,尤其是在面對大量文本數(shù)據(jù)時,難以靠傳統(tǒng)分析方法直接獲得全面信息。
以往針對文本的分析方法分析周期長、研究耗時長、人工工作量大,難以適應(yīng)輿情研究求快求全的現(xiàn)實要求。因此便需借力量化文本分析方法,集中處理數(shù)十萬乃至數(shù)千萬量級的文本內(nèi)容。
筆者在實踐中總結(jié)了適用于輿情研究的部分量化文本分析方法:
LDA主題模型算法
LDA(Latent Dirichlet Allocation)是統(tǒng)計學(xué)中常用的一種降維分析方法,即降低復(fù)雜的文本數(shù)據(jù)包含的維度。通過運算歸類,具有相同特性的文本被識別為一組,進而實現(xiàn)文本主題的機器分類。這一算法常用來提取子話題。
這種方法能夠大大縮短文本處理時間,通過計算實現(xiàn)文本內(nèi)容歸類,提高輿情子話題提取效率。
文本位置估計模型
文本位置估計模型是政治學(xué)領(lǐng)域的成熟算法,旨在通過計算文本中包含的政治學(xué)詞匯特征,判斷文本的左右派傾向。輿情研究可以借用該算法原理,通過計算詞頻、詞距、詞語間共現(xiàn)關(guān)系等信息,計算特定文本的相對位置,判斷研究對象的態(tài)度傾向差異。
例如,以此分析中美關(guān)系輿情,可以直觀看到中美受眾的不同立場表達,并根據(jù)文本位置距離判斷未來發(fā)展趨勢。
基于社會網(wǎng)絡(luò)分析方法的詞語共現(xiàn)關(guān)系分析
如前文所述,文本之中也隱藏著復(fù)雜的詞語網(wǎng)絡(luò)。探詢文本的共現(xiàn)網(wǎng)絡(luò),是還原語境的重要路徑。
前文的分析方法多將文本分裂為詞組,計算使用的矩陣也常常忽略了語句連接在一起的整體含義。采用社會網(wǎng)絡(luò)分析方法,可以描繪出詞語間的距離與聯(lián)系,可以在一定程度上探索其出現(xiàn)的語境,還原斷裂的文本。
數(shù)據(jù)輿情時代,研究方法的3大變遷
把握輿論脈搏,洞悉輿情走向,是信息化社會了解民意的重要因素。數(shù)據(jù)與輿情結(jié)合的產(chǎn)物——數(shù)據(jù)輿情也已應(yīng)時代要求而生,亟待從業(yè)人員理論結(jié)合實踐,吸納科學(xué)分析方法,提升數(shù)據(jù)處理和輿情研判能力。
1、加強數(shù)據(jù)挖掘能力
數(shù)據(jù)是所有分析的原材料,沒有數(shù)據(jù)再精巧的方法也難為無米之炊。
數(shù)據(jù)輿情行業(yè)研究,需要以數(shù)據(jù)積累為目的長期挖掘和存儲,注重日常數(shù)據(jù)的挖掘和積累,不斷拓展數(shù)據(jù)邊緣。搭建龐大的數(shù)據(jù)倉庫,提升數(shù)據(jù)使用效率,是發(fā)展數(shù)據(jù)輿情的首要條件。
2、提升數(shù)據(jù)分析能力
在掌握了大量數(shù)據(jù)之后,分析能力便成為了挖掘輿情的主要難題。
在輿情研究領(lǐng)域,數(shù)據(jù)分析能力具體體現(xiàn)為科學(xué)研究方法的掌握和使用能力。為進一步提高輿情分析的效率和質(zhì)量,強化量化研判與輿情工作的深度融合,提升數(shù)據(jù)分析能力,是發(fā)展數(shù)據(jù)輿情的必要條件。
3、強化數(shù)據(jù)合作共享
數(shù)據(jù)是取之不盡的可再生資源,研究者根據(jù)日常工作的專長和角度不同,掌握的數(shù)據(jù)形式大為不同。
因此,強化以行業(yè)實踐為基礎(chǔ)的合作機制,是推動數(shù)據(jù)輿情化和輿情數(shù)據(jù)化的大勢所趨。
-
互聯(lián)網(wǎng)
+關(guān)注
關(guān)注
54文章
11215瀏覽量
105002 -
數(shù)據(jù)分析
+關(guān)注
關(guān)注
2文章
1469瀏覽量
34662 -
大數(shù)據(jù)
+關(guān)注
關(guān)注
64文章
8940瀏覽量
139051
發(fā)布評論請先 登錄
相關(guān)推薦
永磁同步電機二階迭代學(xué)習(xí)控制
中科曙光旗下中科天璣推出全要素AI輿情系統(tǒng)
充電樁“耐力大考驗”:老化負(fù)載研究,為持久續(xù)航保駕護航
TXB0108輸入數(shù)據(jù)為100Mbps時會存在什么問題?
工程大數(shù)據(jù)平臺

緩存對大數(shù)據(jù)處理的影響分析
數(shù)據(jù)驅(qū)動AI工具在哪
raid 在大數(shù)據(jù)分析中的應(yīng)用
智慧城市與大數(shù)據(jù)的關(guān)系
RF功率檢波器芯片都存在哪些噪聲?
大數(shù)據(jù)在軍事方面的應(yīng)用
地物光譜儀:礦山環(huán)境土壤重金屬污染狀況監(jiān)測方法研究

大數(shù)據(jù)采集系統(tǒng)分為幾類
“Spark+Hive”在DPU環(huán)境下的性能測評 | OLAP數(shù)據(jù)庫引擎選型白皮書(24版)DPU部分節(jié)選

評論