在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

深度挖掘大數據現狀分析

454398 ? 來源:ST社區 ? 作者:ST社區 ? 2022-12-13 11:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:ST社區

技術型的高科技創業公司都喜歡閃閃發光的新東西,而“大數據”跟3年前火熱程度相比反而有些凄慘。雖然Hadoop創建于2006年,在“大數據”的概念興起到達白熱化是在2011年至2014年期間,當時在媒體和行業面前,大數據就是“黑金石油”。2015年數據世界中時尚年輕人喜歡轉移到AI的相關概念,他們口味變成:機器智能深度學習等。

企業級技術 = 艱苦的工作

其實大數據有趣的是它不是直接可以炒作的東西。

能夠獲得廣泛興趣的產品和服務往往是那些人們可以觸摸和感受到的,比如:移動應用,社交網絡,可穿戴設備,虛擬現實等。

但大數據,從根本上說是“管道”。當然,大數據支持許多消費者或企業用戶體驗,但其核心是企業的技術:數據庫,分析等:而這后面幾乎沒人能看到東西運行。

而且如果大家真正工作過的都知道,在企業中改造新技術并不大可能在一夜之間發生。

早年的大數據是在大型互聯網公司中(特別是谷歌,雅虎,Facebook,Twitter,LinkedIn等),它們重度使用和推動大數據技術。這些公司突然面臨著前所未有的數據量,沒有以前的基礎設施,并能招到一些最好的工程師,所以他們基本上是從零開始搭建他們所需要的技術。開源的風氣迅速蔓延,大量的新技術與更廣闊的世界共享。隨著時間推移,其中一些工程師離開了大型網絡公司,開始自己的大數據初創公司。其他的“數字原生”的公司,其中包括許多獨角獸,開始面臨跟大型互聯網公司同樣需求,無論有沒有基礎設施,它們都是這些大數據技術的早期采用者。而早期的成功導致更多的創業和風險投資。

現在一晃幾年了,我們現在是有大得多而棘手的機會:數據技術通過更廣泛從中型企業到非常大的跨國公司。不同的是“數字原生”的公司,不必從頭開始做。他們也有很多損失:在絕大多數的公司,現有的技術基礎設施“夠用”。這些組織也明白,宜早不宜遲需要進化,但他們不會一夜之間淘汰并更換關鍵任務的系統。任何發展都需要過程,預算,項目管理,導航,部門部署,全面的安全審計等。大型企業會小心謹慎地讓年輕的創業公司處理他們的基礎設施的關鍵部分。而且,一些(大多數?)企業家壓根不想把他們的數據遷移到云中,至少不是公有云。

大數據分析的基本流程

從另一個關鍵點大家就明白了:大數據的成功是不是實現一小片技術(如Hadoop的或其他任何東西),而是需要放在一起的技術,人員,流程的流水線。你需要采集數據,存儲數據,清理數據,查詢數據,分析數據,可視化數據。這將由產品來完成,有些由人力來完成。一切都需要無縫集成。歸根結底,對于這一切工作,整個公司,從高級管理人員開始,需要致力于建立一個數據驅動的文化,大數據不是小事,而是全局的事。

換句話說:這是大量艱苦的工作。

部署階段

以上解釋了為什么幾年后,雖然很多高調的創業公司上線也拿到引人注目的風險投資,但只是到達大數據部署和早期成熟階段。

更有遠見的大公司(稱他們為“嘗鮮者”在傳統的技術采用周期),在2011 - 2013年開始早期實驗大數據技術,推出Hadoop系統,或嘗試單點解決方案。他們招聘了形形色色的人,可能工作頭銜以前不存在(如“數據科學家”或“首席數據官”)。他們通過各種努力,包括在一個中央儲存庫或“數據湖”傾倒所有的數據,有時希望魔術隨之而來(通常沒有)。他們逐步建立內部競爭力,與不同廠商嘗試,部署到線上,討論在企業范圍內實施推廣。在許多情況下,他們不知道下一個重要的拐點在哪里,經過幾年建設大數據基礎架構,從他們公司業務用戶的角度來看,也沒有那么多東西去顯示它。但很多吃力不討好的工作已經完成,而部署在核心架構之上的應用程序又要開始做了。

下一組的大公司(稱他們為“早期大眾”在傳統的技術采用周期)一直呆在場邊,還在迷惑的望著這整個大數據這玩意。直到最近,他們希望大供應商(例如IBM)提供一個一站式的解決方案,但它們知道不會很快出現。他們看大數據全局圖很恐怖,就真的想知道是否要跟那些經常發音相同,也就湊齊解決方案的創業公司一起做。他們試圖弄清楚他們是否應該按順序并逐步工作,首先構建基礎設施,然后再分析應用層,或在同一時間做所有的,還是等到更容易做的東西出現。

生態系統正在走向成熟

同時,創業公司/供應商方面,大數據公司整體第一波(那些成立于2009年至2013)現在已經融資多輪,擴大他們的規模,積累了早期部署的成功與失敗教訓,也提供更成熟,久經考驗的產品。現在有少數是上市公司(包括HortonWorks和New Relic 它們的IPO在2014年12月),而其他(Cloudera,MongoDB的,等等)都融了數億美元。

VC投資仍然充滿活力,2016年前幾個星期看到一些巨額融資的晚期大數據初創公司:DataDog(9400萬),BloomReach(5600萬),Qubole(3000萬), PlaceIQ( 2500萬)這些大數據初創公司在2015年收到的$ 66.4億創業投資,占高科技投資總額的11%。

并購活動仍然不高(35次)。

隨創業活動和資金的持續涌入,有些不錯的資本退出,日益活躍的高科技巨頭(亞馬遜,谷歌和IBM),公司數量不斷增加

很顯然這里密密麻麻很多公司,從基本走勢方面,動態的(創新,推出新的產品和公司)已逐漸從左向右移動,從基礎設施層(開發人員/工程師)到分析層(數據科學家和分析師的世界)到應用層(商業用戶和消費者),其中“大數據的本地應用程序”已經迅速崛起- 這是我們預計的格局。

大數據基礎架構:創新仍然有很多

正是因為谷歌十年前的MapReduce和BigTable的論文,Doug Cutting, Mike Cafarella開發 創建Hadoop的,所以大數據的基礎架構層成熟了,也解決了一些關鍵問題。

而基礎設施領域的不斷創新蓬勃發展還是通過大量的開源活動。

Spark帶著Hadoop飛

2015年毫無疑問是Apache Spark最火的一年,這是一個開源框架,利用內存中做處理。這開始得到了不少爭論,從我們發布了前一版本以來,Spark被各個對手采納,從IBM到Cloudera都給它相當的支持。 Spark的意義在于它有效地解決了一些使用Hadoop很慢的關鍵問題:它的速度要快得多(基準測試表明:Spark比Hadoop的MapReduce的快10到100倍),更容易編寫,并非常適用于機器學習

其他令人興奮的框架的不斷涌現,并獲得新的動力,如Flink,Ignite,Samza,Kudu等。一些思想領袖認為Mesos的出現(一個框架以“對你的數據中心編程就像是單一的資源池”),不需要完全的Hadoop。即使是在數據庫的世界,這似乎已經看到了更多的新興的玩家讓市場持續,大量令人興奮的事情正在發生,從圖形數據庫的成熟(Neo4j),此次推出的專業數據庫(時間序列數據庫InfluxDB),CockroachDB,(受到谷歌Spanner啟發出現,號稱提供二者最好的SQL和NoSQL),數據倉庫演變(Snowflake)。

大數據分析:現在的AI

在過去幾個月的大趨勢上,大數據分析已經越來越注重人工智能(各種形式和接口),去幫助分析海量數據,得出預測的見解。

最近AI的復活就好比大數據生的一個孩子。深度學習(獲取了最多的人工智能關注的領域)背后的算法大部分在幾十年前,但直到他們可以應用于代價便宜而速度夠快的大量數據來充分發揮其潛力(Yann LeCun, Facebook深度學習研究員主管)。 AI和大數據之間的關系是如此密切,一些業內專家現在認為,AI已經遺憾地“愛上了大數據”(Geometric Intelligence)。

反過來,AI現在正在幫助大數據實現承諾。AI /機器學習的分析重點變成大數據進化邏輯的下一步:現在我有這些數據,我該怎么從中提取哪些洞察?當然,這其中的數據科學家們 - 從一開始他們的作用就是實現機器學習和做出有意義的數據模型。但漸漸地機器智能正在通過獲得數據去協助數據科學家。新興產品可以提取數學公式(Context Relevant)或自動構建和建議數據的科學模式,有可能產生最好的結果(DataRobot)。新的AI公司提供自動完成復雜的實體的標識(MetaMind,Clarifai,Dextro),或者提供強大預測分析(HyperScience)。

由于無監督學習的產品傳播和提升,我們有趣的想知道AI與數據科學家的關系如何演變 - 朋友還是敵人? AI是肯定不會在短期內很快取代數據科學家,而是希望看到數據科學家通常執行的簡單任務日益自動化,最后生產率大幅提高。

通過一切手段,AI /機器學習不是大數據分析的唯一趨勢。令人興奮的趨勢是大數據BI平臺的成熟及其日益增強的實時能力(SiSense,Arcadia)。

大數據應用:一個真正的加速度

由于一些核心基礎架構難題都已解決,大數據的應用層迅速建立。

在企業內部,各種工具已經出現,以幫助企業用戶操作核心功能。例如,大數據通過大量的內部和外部的數據,實時更新數據,可以幫助銷售和市場營銷弄清楚哪些客戶最有可能購買。客戶服務應用可以幫助個性化服務; HR應用程序可幫助找出如何吸引和留住最優秀的員工;等

專業大數據應用已經在幾乎任何垂直領域都很出色,從醫療保健(特別是在基因組學和藥物研究),到財經到時尚到司法(Mark43)。

兩個趨勢值得關注。

首先,很多這些應用都是“大數據同鄉”,因為他們本身就是建立在最新的大數據技術,并代表客戶能夠充分利用大數據的有效方式,無需部署底層的大數據技術,因為這些已“在一個盒子“,至少是對于那些特定功能 - 例如,ActionIQ是建立在Spark上,因此它的客戶可以充分利用他們的營銷部門Spark的權力,而無需實際部署Spark自己 - 在這種情況下,沒有“流水線”。

第二,人工智能同樣在應用程序級別有強大吸引力。例如,在貓捉老鼠的游戲,安全上,AI被廣泛利用,它可以識別黑客和打擊網絡攻擊。 “人工智能”對沖基金也開始出現。全部由AI驅動數字助理行業已經去年出現,從自動安排會議(x.ai)任務,到購物為您帶來一切。這些解決方案依賴人工智能的程度差別很大,從接近100%的自動化,到個人的能力被AI增強 - 但是,趨勢是明確的。

在許多方面,我們仍處于大數據的早期。盡管它發展了幾年,建設存儲和數據的過程只是第一階段的基礎設施。 AI /機器學習出現在大數據的應用層的趨勢。大數據和AI的結合將推動幾乎每一個行業的創新,這令人難以置信。從這個角度來看,大數據機會甚至可能比人們認為的還大。

審核編輯黃昊宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 大數據
    +關注

    關注

    64

    文章

    8955

    瀏覽量

    139885
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    存儲示波器的存儲深度對信號分析有什么影響?

    ) 采樣率:≥6.4GS/s(數據速率×2)。 存儲深度:≥10Mpts(記錄時間≥1.56μs,支持突發信號)。 優化:啟用分段存儲(如1000段×10kpts)或外部觸發。 3. 電源紋波分析(如
    發表于 05-27 14:39

    工業電機行業現狀及未來發展趨勢分析

    引言:工業電機行業作為現代制造業的核心動力設備之一,具有廣闊的發展前景和巨大的市場潛力。隨著技術的不斷進步和市場需求的持續增長,工業電機行業將迎來更多的發展機遇和挑戰。以下是中研網通過大數據分析
    發表于 03-31 14:35

    易華錄智慧交管大模型實現交通數據價值的深度挖掘與應用

    易華錄將多年積累的數據治理經驗與DeepSeek卓越的推理能力深度融合,實現了交通數據價值的深度挖掘與應用。“DeepSeek+小易”智能引
    的頭像 發表于 03-08 13:48 ?1058次閱讀

    大數據與云計算是干嘛的?

    大數據與云計算是支撐現代數字化技術的兩大核心。大數據專注于海量數據的采集、存儲、分析與價值挖掘;云計算通過虛擬化資源池提供彈性計算、存儲及服
    的頭像 發表于 02-20 14:48 ?560次閱讀

    汽車焊接數據深度分析:提升工藝與質量的關鍵

    在現代汽車制造業中,焊接技術作為連接車身各部件的核心工藝,其重要性不言而喻。焊接質量直接影響到汽車的整體性能和安全性,因此,對焊接過程的數據進行深度分析,不僅能夠幫助制造商優化生產工藝,提高生產效率
    的頭像 發表于 01-21 15:53 ?392次閱讀

    緩存對大數據處理的影響分析

    緩存對大數據處理的影響顯著且重要,主要體現在以下幾個方面: 一、提高數據訪問速度 在大數據環境中,數據存儲通常采用分布式存儲系統,數據量龐大
    的頭像 發表于 12-18 09:45 ?728次閱讀

    bds 行業發展趨勢分析 bds在大數據中的應用

    BDS(大數據分析技術)作為一種通過收集、處理和分析大量數據以提取有價值信息和洞察力的技術,在當前數字化時代發揮著至關重要的作用。 一、BDS行業發展趨勢分析 技術創新與融合 : 隨著
    的頭像 發表于 11-22 15:47 ?1428次閱讀

    raid 在大數據分析中的應用

    RAID(Redundant Array of Independent Disks,獨立磁盤冗余陣列)在大數據分析中的應用主要體現在提高存儲系統的性能、可靠性和容量上。以下是RAID在大數據分析
    的頭像 發表于 11-12 09:44 ?699次閱讀

    emc技術在大數據分析中的角色

    在當今這個數據驅動的世界中,大數據分析已經成為企業獲取洞察力、優化業務流程和提高競爭力的關鍵工具。隨著數據量的爆炸性增長,企業面臨著如何有效存儲、處理和分析這些
    的頭像 發表于 11-01 15:22 ?661次閱讀

    智慧城市與大數據的關系

    的建設需要對海量的數據資源進行收集、整合、存儲與分析大數據技術的應用,如智能感知、分布式存儲等,使得這些數據能夠被高效地處理和利用。 決策支持 : 在智慧城市的建設和運行過程中,
    的頭像 發表于 10-24 15:27 ?1270次閱讀

    云計算在大數據分析中的應用

    云計算在大數據分析中的應用廣泛且深入,它為用戶提供了存儲、計算、分析和預測的強大能力。以下是對云計算在大數據分析中應用的介紹: 一、存儲和處理海量數據 云計算提供了強大的存儲和計算能力
    的頭像 發表于 10-24 09:18 ?1078次閱讀

    IP 地址大數據分析如何進行網絡優化?

    一、大數據分析在網絡優化中的作用 1.流量分析 大數據分析可以對網絡中的流量進行實時監測和分析,了解網絡的使用情況和流量趨勢。通過對流量數據
    的頭像 發表于 10-09 15:32 ?543次閱讀
    IP 地址<b class='flag-5'>大數據分析</b>如何進行網絡優化?

    基于Kepware的Hadoop大數據應用構建-提升數據價值利用效能

    處理超大數據集。 Hadoop的生態系統非常豐富,包括許多相關工具和技術,如Hive、Pig、HBase等,這些工具可以方便地構建復雜的大數據應用。Hadoop廣泛應用于各種場景,包括數據處理和
    的頭像 發表于 10-08 15:12 ?335次閱讀
    基于Kepware的Hadoop<b class='flag-5'>大數據</b>應用構建-提升<b class='flag-5'>數據</b>價值利用效能

    基于大數據深度學習的穿戴式運動心率算法

    性能的關鍵手段。然而,在復雜多變的運動環境中,準確測量心率數據對于傳統算法而言具有較大的技術瓶頂。本文將探討如何運用大數據深度學習技術來開發創新的穿戴式運動心率算
    的頭像 發表于 09-10 08:03 ?617次閱讀
    基于<b class='flag-5'>大數據</b>與<b class='flag-5'>深度</b>學習的穿戴式運動心率算法

    深度分析智慧樓宇管理平臺

    智慧樓宇管理平臺是一項專業性強、邏輯性強的解決方案,融合了物聯網、大數據和人工智能等前沿技術,為建筑物運營提供全面的管理和優化。以下是對智慧樓宇管理平臺的深度分析: 1.設備互聯與遠程監控: 通過
    的頭像 發表于 07-08 14:52 ?465次閱讀
    主站蜘蛛池模板: 亚洲黄色官网 | 精品三级国产精品经典三 | 国产亚洲婷婷香蕉久久精品 | 国产欧美网站 | 在线免费观看一级片 | 日韩a级毛片免费观看 | 一级黄色毛片播放 | 九色综合久久综合欧美97 | 日本高清视频色视频kk266 | 好黄好硬好爽好刺激 | 亚洲视频一区二区在线观看 | 久久综合狠狠综合狠狠 | 男男gay污小黄文 | 欧美深夜 | 婷婷精品视频 | 午夜在线观看网站 | 激情福利网| nxgx欧美| 日韩毛片免费 | 一级在线观看视频 | 精品一区亚洲 | 欧美精品一区二区三区视频 | 欧美亚洲综合另类型色妞 | 国产成人黄网址在线视频 | 成人黄色在线网站 | 爱爱的免费视频 | 国产精品久久久久久久午夜片 | 天堂视频在线视频观看2018 | 亚洲高清在线视频 | 国产一二三区在线观看 | 啪啪免费看视频 | 免费91视频 | 欧美黑人换爱交换乱理伦片 | 性夜影院爽黄e爽在线观看 羞羞色院91精品网站 | 亚洲久优优色优在线播放 | 久久久久久久成人午夜精品福利 | 亚洲三级成人 | 色老头一区二区三区在线观看 | 精品香港经典三级在线看 | 波多野结衣久久国产精品 | 国产精品理论片在线观看 |