91在线观看视频-91在线观看视频-91在线观看免费视频-91在线观看免费-欧美第二页-欧美第1页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Spark SQL性能實現(xiàn)17.7倍的提升,是如何做到的

獨愛72H ? 來源:砍柴網(wǎng) ? 作者:砍柴網(wǎng) ? 2019-11-14 16:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

(文章來源:砍柴網(wǎng))

Apache Spark是專為大規(guī)模數(shù)據(jù)處理而設(shè)計的快速通用的計算引擎,常用來構(gòu)建大型、低延遲的數(shù)據(jù)分析應(yīng)用程序。Spark一個主要特點在于,其能夠在內(nèi)存中進行計算,這使得其數(shù)據(jù)分析效率往往高于其它計算引擎,但是,服務(wù)器內(nèi)存資源的限制也使得其性能的擴展存在著一定的瓶頸,在超大規(guī)模負載中無法充分發(fā)揮其利用內(nèi)存進行計算的性能優(yōu)勢。

某全球領(lǐng)先的語音識別服務(wù)提供商是最早將Spark應(yīng)用到生產(chǎn)環(huán)境的團隊之一,該公司的語音云通過幾千臺服務(wù)器構(gòu)成的云計算平臺向用戶提供多樣的、實時語音處理能力,日均服務(wù)終端用戶超過15億,日增數(shù)據(jù)超過100TB。2014年該公司基于Spark和AI技術(shù)構(gòu)建了DMP大數(shù)據(jù)平臺(用戶數(shù)據(jù)管理平臺)。DMP平臺的主要功能就是收集、存儲、分析和挖掘龐大的用戶數(shù)據(jù),以實現(xiàn)廣告精準投放。

Spark在該公司的大數(shù)據(jù)平臺中主要用于海量用戶數(shù)據(jù)分析,每天支撐穩(wěn)定運行的Spark SQL統(tǒng)計分析指標(biāo)和SQL腳本有幾千個。但是在將Spark SQL用于海量用戶數(shù)據(jù)分析的過程中,仍然面臨著一些痛點,這些都限制了該公司語音云的數(shù)據(jù)分析能力。

Spark的性能不僅受到CPU、內(nèi)存、網(wǎng)絡(luò)、磁盤等硬件設(shè)備的制約,而且Spark SQL目前還不支持索引,也嚴重影響了Spark SQL在進行大規(guī)模數(shù)據(jù)分析時的性能,索引能夠提升數(shù)據(jù)檢索的效率,降低硬盤的IO瓶頸。

隨著數(shù)據(jù)量越來越大,即席分析的需求越來越強烈,即席查詢是用戶根據(jù)用戶自己的需求,靈活選擇查詢條件,系統(tǒng)能夠根據(jù)用戶的選擇生成響應(yīng)的統(tǒng)計報表和結(jié)果集;在數(shù)據(jù)倉庫和大數(shù)據(jù)分析系統(tǒng)中,即席查詢使用的越多,對系統(tǒng)的性能要求也就越高,如果內(nèi)存能夠緩存更多的熱點數(shù)據(jù),能夠極大的提升即席查詢處理速度并降低響應(yīng)延遲。

數(shù)據(jù)既有隨機讀的需求(即席查詢-Ad-hoc),又有全表掃描的需求(機器學(xué)習(xí));機器學(xué)習(xí)就是通過特定算法從海量的歷史數(shù)據(jù)中學(xué)習(xí)規(guī)律,從而對新的樣本進行分析并對未來做出預(yù)測,在模型訓(xùn)練的過程中會產(chǎn)生大量的中間結(jié)果數(shù)據(jù),通常情況下需要將中間結(jié)果數(shù)據(jù)持久化到文件系統(tǒng)上,如果內(nèi)存能夠緩存更多的中間結(jié)果數(shù)據(jù),可以提升模型訓(xùn)練的速度。
(責(zé)任編輯:fqj)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 互聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    55

    文章

    11251

    瀏覽量

    106521
  • ai技術(shù)
    +關(guān)注

    關(guān)注

    1

    文章

    1308

    瀏覽量

    25174
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    1.9性能提升!英特爾至強6在MLPerf基準測試中表現(xiàn)卓越

    關(guān)鍵項目中,性能表現(xiàn)卓越。測試結(jié)果顯示,相較于上一代產(chǎn)品,該處理器的AI性能實現(xiàn)了高達1.9的顯著提升,這也充分顯示了至強6處理器作為現(xiàn)代
    的頭像 發(fā)表于 04-07 10:58 ?283次閱讀

    產(chǎn)品如何做到可靠的防靜電設(shè)計

    眾所周知,工業(yè)產(chǎn)品所應(yīng)用的電磁環(huán)境之惡劣。要想產(chǎn)品在如此惡劣的電磁環(huán)境下正常工作,需要具備強大的抗干擾能力方能勝任。其中以靜電干擾最為常見且棘手。本文將手把手教你如何將工業(yè)產(chǎn)品做到可靠的防靜電
    的頭像 發(fā)表于 01-16 09:16 ?768次閱讀
    產(chǎn)品<b class='flag-5'>如何做到</b>可靠的防靜電設(shè)計

    SSM框架的性能優(yōu)化技巧 SSM框架中RESTful API的實現(xiàn)

    SSM框架的性能優(yōu)化技巧 SSM(Spring + Spring MVC + MyBatis)框架的性能優(yōu)化是提升Java Web應(yīng)用性能的關(guān)鍵環(huán)節(jié)。以下是一些常用的
    的頭像 發(fā)表于 12-17 09:10 ?799次閱讀

    藍牙AOA定位系統(tǒng)如何做到高精準度?

    藍牙AOA定位系統(tǒng)是一種高精度的室內(nèi)定位技術(shù),其高精準度是通過一系列高科技的技術(shù)和方法實現(xiàn)的。以下是給大家分析的幾點關(guān)于如何做到高精準度的幾個關(guān)鍵點:
    的頭像 發(fā)表于 12-13 11:42 ?636次閱讀

    谷歌正式發(fā)布Gemini 2.0 性能提升近兩

    2.0在關(guān)鍵基準測試中相比前代產(chǎn)品Gemini 1.5 Pro的性能提升了近兩。該模型支持圖像、視頻和音頻等多種輸入與輸出形式,例如可以實現(xiàn)文本與圖像的混合生成以及自定義的多語言文
    的頭像 發(fā)表于 12-12 14:22 ?831次閱讀

    ADC7846如何做到使用手指觸摸有效?

    ADC7846芯片觸摸轉(zhuǎn)換時候,不準,能否通過配置,如何做到使用手指觸摸有效?
    發(fā)表于 12-04 06:47

    兩個高速ADC的CLK時鐘如何做到同步無相位差?

    如何做到同步無相位差,兩個ADC使用同一個時鐘發(fā)生器是否可以滿足同步問題? 2、兩個高速ADC的CLKOUT是否存在時延,如果存在那相位差是多少?我再規(guī)格書中沒有看到CLKOUT引腳關(guān)于這方面的描述
    發(fā)表于 11-18 06:47

    高通驍龍汽車新方案:CPU性能躍升3,AI性能狂飆12

    。   據(jù)了解,驍龍座艙至尊版平臺作為驍龍8295的升級版,被命名為Elite。該平臺搭載了高通專為汽車行業(yè)設(shè)計的自研Oryon CPU架構(gòu),其性能相較于8295提升了3,并集成了最新的NPU,使得AI
    的頭像 發(fā)表于 10-23 14:50 ?1073次閱讀

    工程行業(yè)中如何做到低碳甚至零碳

    低碳的生活方式越來越多地融入我們的日常習(xí)慣當(dāng)中。但是在工程行業(yè)中如何做到低碳甚至零碳呢?
    的頭像 發(fā)表于 10-14 10:31 ?835次閱讀

    TPA3251如何做到180W的功率,電壓12V,電流應(yīng)該多少?

    TPA3251如何做到180W的功率,電壓12V,電流應(yīng)該多少,請推薦DCDC
    發(fā)表于 10-11 06:54

    寫 Verilog 如何做到心中有電路?

    ,共同進步。 歡迎加入FPGA技術(shù)微信交流群14群! 交流問題(一) Q:寫 Verilog 如何做到心中有電路?老師說沒電路就不要寫代碼,但我寫個乘法器在綜合前都想不出它電路啥樣,全加器還行。 A
    發(fā)表于 09-26 20:30

    大數(shù)據(jù)從業(yè)者必知必會的Hive SQL調(diào)優(yōu)技巧

    不盡人意。本文針對Hive SQL性能優(yōu)化進行深入研究,提出了一系列可行的調(diào)優(yōu)方案,并給出了相應(yīng)的優(yōu)化案例和優(yōu)化前后的SQL代碼。通過合理的優(yōu)化策略和技巧,能夠顯著提升Hive
    的頭像 發(fā)表于 09-24 13:30 ?704次閱讀

    spark為什么比mapreduce快?

    spark為什么比mapreduce快? 首先澄清幾個誤區(qū): 1:兩者都是基于內(nèi)存計算的,任何計算框架都肯定是基于內(nèi)存的,所以網(wǎng)上說的spark是基于內(nèi)存計算所以快,顯然是錯誤的 2;DAG計算模型
    的頭像 發(fā)表于 09-06 09:45 ?525次閱讀

    QPS提升10sql優(yōu)化

    本次慢sql優(yōu)化是大促準備時的一個優(yōu)化,優(yōu)化4c16g單實例mysql支持QPS從437到4610,今天發(fā)文時618大促已經(jīng)順利結(jié)束,該mysql庫和應(yīng)用在整個大促期間運行也非常穩(wěn)定。本文復(fù)盤一下
    的頭像 發(fā)表于 08-21 11:12 ?619次閱讀
    QPS<b class='flag-5'>提升</b>10<b class='flag-5'>倍</b>的<b class='flag-5'>sql</b>優(yōu)化

    使用PYNQ訓(xùn)練和實現(xiàn)BNN

    使用 PYNQ 可以輕松在 FPGA 上實現(xiàn)加速 AI/ML,而無需編寫一行 HDL!讓我們看看如何做到這一點。
    的頭像 發(fā)表于 08-05 17:15 ?1086次閱讀
    使用PYNQ訓(xùn)練和<b class='flag-5'>實現(xiàn)</b>BNN
    主站蜘蛛池模板: 亚洲激情婷婷 | 欧美精品网 | 日韩免费毛片全部不收费 | 午夜合集| 老熟女毛片 | 欧美极品第1页专区 | 国产主播在线播放 | 人人精品 | 午夜啪啪福利视频 | 一级片黄色免费 | 中文字幕在线一区 | 国产三级一区 | 色爱区综合激月婷婷激情五月 | 亚洲伊人精品综合在合线 | 夜夜做夜夜爽 | 久久六月丁香婷婷婷 | 日日操夜夜爱 | 超h 高h 污肉男男 | 欧美性猛交xxxx乱大交中文 | 夜夜春夜夜爽 | 97狠狠操 | 欧美黄色片在线观看 | ww欧洲ww在线视频看 | 日本免费成人 | 日韩一级在线观看 | 中文字幕1区 | 一区二区三区无码高清视频 | 国产精品入口免费视频 | 午夜欧美精品久久久久久久久 | 最新在线视频 | 国产精品久久久久久久免费大片 | 卡1卡2卡3精品推荐老狼 | 免费看三级黄色片 | 老熟女毛片 | 天天挨操 | 成人免费看片视频色多多 | 免费看大美女大黄大色 | 午夜影院毛片 | 日本一区二区免费在线观看 | 欧美三级视频在线 | 综合五月激情 |