在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從搜索引擎到人工智能看大數(shù)據(jù)應(yīng)用發(fā)展史

OaXG_jingzhengl ? 來源:cg ? 2019-01-08 16:33 ? 次閱讀

我們對大數(shù)據(jù)技術(shù)的使用也經(jīng)歷了一個發(fā)展過程。從最開始的 Google 在搜索引擎中開始使用大數(shù)據(jù)技術(shù),到現(xiàn)在無處不在的各種人工智能應(yīng)用,伴隨著大數(shù)據(jù)技術(shù)的發(fā)展,大數(shù)據(jù)應(yīng)用也從曲高和寡走到了今天的遍地開花。

Google 從最開始發(fā)表大數(shù)據(jù)劃時代論文的時候,也許自己也沒有想到,自己開啟了一個大數(shù)據(jù)的新時代。今天大數(shù)據(jù)和人工智能的種種成就,離不開全球數(shù)百萬大數(shù)據(jù)從業(yè)者的努力,這其中也包括你和我。歷史也許由天才開啟,但終究還是由人民創(chuàng)造,作為大數(shù)據(jù)時代的參與者,我們正在創(chuàng)造歷史。

大數(shù)據(jù)應(yīng)用的搜索引擎時代

作為全球最大的搜索引擎公司,Google 也是我們公認的大數(shù)據(jù)鼻祖,它存儲著全世界幾乎所有可訪問的網(wǎng)頁,數(shù)目可能超過萬億規(guī)模,全部存儲起來大約需要數(shù)萬塊磁盤。為了將這些文件存儲起來,Google 開發(fā)了 GFS(Google 文件系統(tǒng)),將數(shù)千臺服務(wù)器上的數(shù)萬塊磁盤統(tǒng)一管理起來,然后當(dāng)作一個文件系統(tǒng),統(tǒng)一存儲所有這些網(wǎng)頁文件。

你可能會覺得,如果只是簡單地將所有網(wǎng)頁存儲起來,好像也沒什么太了不起的。沒錯,但是 Google 得到這些網(wǎng)頁文件是要構(gòu)建搜索引擎,需要對所有文件中的單詞進行詞頻統(tǒng)計,然后根據(jù) PageRank 算法計算網(wǎng)頁排名。這中間,Google 需要對這數(shù)萬塊磁盤上的文件進行計算處理,這聽上去就很了不起了吧。當(dāng)然,也正是基于這些需求,Google 又開發(fā)了 MapReduce 大數(shù)據(jù)計算框架。

其實在 Google 之前,世界上最知名的搜索引擎是 Yahoo。但是 Google 憑借自己的大數(shù)據(jù)技術(shù)和 PageRank 算法,使搜索引擎的搜索體驗得到了質(zhì)的飛躍,人們紛紛棄 Yahoo 而轉(zhuǎn)投 Google。所以當(dāng) Google 發(fā)表了自己的 GFS 和 MapReduce 論文后,Yahoo 應(yīng)該是最早關(guān)注這些論文的公司。

Doug Cutting 率先根據(jù) Google 論文做了 Hadoop,于是 Yahoo 就把 Doug Cutting 挖了過去,專職開發(fā) Hadoop。可是 Yahoo 和 Doug Cutting 的蜜月也沒有持續(xù)多久,Doug Cutting 不堪 Yahoo 的內(nèi)部斗爭,跳槽到專職做 Hadoop 商業(yè)化的公司 Cloudera,而 Yahoo 則投資了 Cloudera 的競爭對手 HortonWorks。

頂尖的公司和頂尖的高手一樣,做事有一種優(yōu)雅的美感。你可以看 Google 一路走來,從搜索引擎、Gmail、地圖、Android無人駕駛,每一步都將人類的技術(shù)邊界推向更高的高度。而差一點的公司即使也曾經(jīng)獲得過顯赫的地位,但是一旦失去做事的美感和節(jié)奏感,在這個快速變革的時代,隕落得比流星還快。

大數(shù)據(jù)應(yīng)用的數(shù)據(jù)倉庫時代

Google 的論文剛發(fā)表的時候,吸引的是 Yahoo 這樣的搜索引擎公司和 Doug Cutting 這樣的開源搜索引擎開發(fā)者,其他公司還只是吃瓜群眾。但是當(dāng) Facebook 推出 Hive 的時候,嗅覺敏感的科技公司都不淡定了,他們開始意識到,大數(shù)據(jù)的時代真正開啟了。

曾經(jīng)我們在進行數(shù)據(jù)分析與統(tǒng)計時,僅僅局限于數(shù)據(jù)庫,在數(shù)據(jù)庫的計算環(huán)境中對數(shù)據(jù)庫中的數(shù)據(jù)表進行統(tǒng)計分析。并且受數(shù)據(jù)量和計算能力的限制,我們只能對最重要的數(shù)據(jù)進行統(tǒng)計和分析。這里所謂最重要的數(shù)據(jù),通常指的都是給老板看的數(shù)據(jù)和財務(wù)相關(guān)的數(shù)據(jù)。

而 Hive 可以在 Hadoop 上進行 SQL 操作,實現(xiàn)數(shù)據(jù)統(tǒng)計與分析。也就是說,我們可以用更低廉的價格獲得比以往多得多的數(shù)據(jù)存儲與計算能力。我們可以把運行日志、應(yīng)用采集數(shù)據(jù)、數(shù)據(jù)庫數(shù)據(jù)放到一起進行計算分析,獲得以前無法得到的數(shù)據(jù)結(jié)果,企業(yè)的數(shù)據(jù)倉庫也隨之呈指數(shù)級膨脹。

不僅是老板,公司中每個普通員工比如產(chǎn)品經(jīng)理、運營人員、工程師,只要有數(shù)據(jù)訪問權(quán)限,都可以提出分析需求,從大數(shù)據(jù)倉庫中獲得自己想要了解的數(shù)據(jù)分析結(jié)果。

你看,在數(shù)據(jù)倉庫時代,只要有數(shù)據(jù),幾乎就一定要進行統(tǒng)計分析,如果數(shù)據(jù)規(guī)模比較大,我們就會想到要用 Hadoop 大數(shù)據(jù)技術(shù),這也是 Hadoop 在這個時期發(fā)展特別快的一個原因。技術(shù)的發(fā)展同時又促進了技術(shù)應(yīng)用,這也為接下來大數(shù)據(jù)應(yīng)用走進數(shù)據(jù)挖掘時代埋下伏筆。

大數(shù)據(jù)應(yīng)用的數(shù)據(jù)挖掘時代

大數(shù)據(jù)一旦進入更多的企業(yè),我們就會對大數(shù)據(jù)提出更多期望,除了數(shù)據(jù)統(tǒng)計,我們還希望發(fā)掘出更多數(shù)據(jù)的價值,大數(shù)據(jù)隨之進入數(shù)據(jù)挖掘時代。

講個真實的案例,很早以前商家就通過數(shù)據(jù)發(fā)現(xiàn),買尿不濕的人通常也會買啤酒,于是精明的商家就把這兩樣商品放在一起,以促進銷售。啤酒和尿不濕的關(guān)系,你可以有各種解讀,但是如果不是通過數(shù)據(jù)挖掘,可能打破腦袋也想不出它們之間會有關(guān)系。在商業(yè)環(huán)境中,如何解讀這種關(guān)系并不重要,重要的是它們之間只要存在關(guān)聯(lián),就可以進行關(guān)聯(lián)分析,最終目的是讓用戶盡可能看到想購買的商品。

除了商品和商品有關(guān)系,還可以利用人和人之間的關(guān)系推薦商品。如果兩個人購買的商品有很多都是類似甚至相同的,不管這兩個人天南海北相隔多遠,他們一定有某種關(guān)系,比如可能有差不多的教育背景、經(jīng)濟收入、興趣愛好。根據(jù)這種關(guān)系,可以進行關(guān)聯(lián)推薦,讓他們看到自己感興趣的商品。

更進一步,大數(shù)據(jù)還可以將每個人身上的不同特性挖掘出來,打上各種各樣的標(biāo)簽:90 后、生活在一線城市、月收入 1~2 萬、宅……這些標(biāo)簽組成了用戶畫像,并且只要這樣的標(biāo)簽足夠多,就可以完整描繪出一個人,甚至比你最親近的人對你的描述還要完整、準(zhǔn)確。

除了商品銷售,數(shù)據(jù)挖掘還可以用于人際關(guān)系挖掘。你聽過“六度分隔理論”嗎,它認為世界上兩個互不認識的人,只需要很少的中間人就能把他們聯(lián)系起來。這個理論在美國的實驗結(jié)果是,通過六步就能聯(lián)系上兩個不認識的美國人。也是基于這個理論,F(xiàn)acebook 研究了十幾億用戶的數(shù)據(jù),試圖找到關(guān)聯(lián)兩個陌生人之間的數(shù)字,答案是驚人的 3.57。你可以看到,各種各樣的社交軟件記錄著我們的好友關(guān)系,通過關(guān)系圖譜挖掘,幾乎可以把世界上所有的人際關(guān)系網(wǎng)都描繪出來。

現(xiàn)代生活幾乎離不開互聯(lián)網(wǎng),各種各樣的應(yīng)用無時不刻不在收集數(shù)據(jù),這些數(shù)據(jù)在后臺的大數(shù)據(jù)集群中一刻不停地在被進行各種分析與挖掘。這些分析和挖掘帶給我們的是美好還是恐懼,依賴大數(shù)據(jù)從業(yè)人員的努力。但是可以肯定,不管最后結(jié)果如何,這個進程只會加速不會停止,你我只能投入其中。

大數(shù)據(jù)應(yīng)用的機器學(xué)習(xí)時代

我們很早就發(fā)現(xiàn),數(shù)據(jù)中蘊藏著規(guī)律,這個規(guī)律是所有數(shù)據(jù)都遵循的,過去發(fā)生的事情遵循這個規(guī)律,將來要發(fā)生的事情也遵循這個規(guī)律。一旦找到了這個規(guī)律,對于正在發(fā)生的事情,就可以按照這個規(guī)律進行預(yù)測。

在過去,我們受數(shù)據(jù)采集、存儲、計算能力的限制,只能通過抽樣的方式獲取小部分數(shù)據(jù),無法得到完整的、全局的、細節(jié)的規(guī)律。而現(xiàn)在有了大數(shù)據(jù),可以把全部的歷史數(shù)據(jù)都收集起來,統(tǒng)計其規(guī)律,進而預(yù)測正在發(fā)生的事情。

這就是機器學(xué)習(xí)。

把歷史上人類圍棋對弈的棋譜數(shù)據(jù)都存儲起來,針對每一種盤面記錄何種落子可以得到更高的贏面。得到這個統(tǒng)計規(guī)律以后,就可以利用這個規(guī)律和人下棋,每一步都計算落在何處將得到更大的贏面,于是我們就得到了一個會下棋的機器人,這就是前兩年轟動一時的 AlphaGo,以壓倒性優(yōu)勢下贏了人類的頂尖棋手。

再舉個和我們生活更近的例子。把人聊天的對話數(shù)據(jù)都收集起來,記錄每一次對話的上下文,如果上一句是是問今天過得怎么樣,那么下一句該如何應(yīng)對,通過機器學(xué)習(xí)可以統(tǒng)計出來。將來有人再問今天過得怎么樣,就可以自動回復(fù)下一句話,于是我們就得到一個會聊天的機器人。Siri、天貓精靈、小愛同學(xué),這樣的語音聊天機器人在機器學(xué)習(xí)時代已經(jīng)滿大街都是了。

將人類活動產(chǎn)生的數(shù)據(jù),通過機器學(xué)習(xí)得到統(tǒng)計規(guī)律,進而可以模擬人的行為,使機器表現(xiàn)出人類特有的智能,這就是人工智能 AI

現(xiàn)在我們對待人工智能還有些不理智的態(tài)度,有的人認為人工智能會越來越強大,將來會統(tǒng)治人類。實際上,稍微了解一點人工智能的原理就會發(fā)現(xiàn),這只是大數(shù)據(jù)計算出來的統(tǒng)計規(guī)律而已,表現(xiàn)的再智能,也不可能理解這樣做的意義,而有意義才是人類智能的源泉。按目前人工智能的發(fā)展思路,永遠不可能出現(xiàn)超越人類的智能,更不可能統(tǒng)治人類。

寫在最后

大數(shù)據(jù)從搜索引擎到機器學(xué)習(xí),發(fā)展思路其實是一脈相承的,就是想發(fā)現(xiàn)數(shù)據(jù)中的規(guī)律并為我們所用。所以很多人把數(shù)據(jù)稱作金礦,大數(shù)據(jù)應(yīng)用就是從這座蘊含知識寶藏的金礦中發(fā)掘中有商業(yè)價值的真金白銀出來。

數(shù)據(jù)中蘊藏著價值已經(jīng)是眾所周知的事情了,那么如何從這些龐大的數(shù)據(jù)中發(fā)掘出我們想要的知識價值,這正是大數(shù)據(jù)技術(shù)目前正在解決的事情,包括大數(shù)據(jù)存儲與計算,也包括大數(shù)據(jù)分析、挖掘、機器學(xué)習(xí)等應(yīng)用。

美國的西部淘金運動帶來了美國的大拓荒時代,來自全世界各地的人涌向美國西部,將人口、資源、生產(chǎn)力帶到了荒蠻的西部地帶,一條條鐵路也將美國的東西海岸連接起來,整個美國也隨之繁榮起來。大數(shù)據(jù)這座更加龐大的金礦目前也正發(fā)揮著同樣的作用,全世界無數(shù)的政府、企業(yè)、個人正在關(guān)注著這座金礦,無數(shù)的資源正在向這里涌來。

我們不曾生活在美國西部淘金的繁榮時代,錯過了那個光榮與夢想、自由與激情的個人英雄主義時代。但是現(xiàn)在,一個更具劃時代意義的大數(shù)據(jù)淘金時代正在到來,而你我正身處其中。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1796

    文章

    47780

    瀏覽量

    240520
  • 搜索引擎
    +關(guān)注

    關(guān)注

    0

    文章

    119

    瀏覽量

    13397

原文標(biāo)題:大數(shù)據(jù)應(yīng)用發(fā)展史:從搜索引擎到人工智能

文章出處:【微信號:jingzhenglizixun,微信公眾號:機器人博覽】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    阿里國際推出全球首個B2B AI搜索引擎Accio

    近日,在歐洲科技峰會Web Summit上,阿里國際正式推出了全球首個B2B領(lǐng)域的AI搜索引擎——Accio。這一創(chuàng)新產(chǎn)品面向全球商家開放,標(biāo)志著阿里國際正式入局當(dāng)前備受矚目的AI Search賽道。
    的頭像 發(fā)表于 11-15 16:53 ?767次閱讀

    阿里國際推出B2B領(lǐng)域AI搜索引擎Accio

    近日,阿里國際宣布正式進軍AI搜索領(lǐng)域,并面向全球商家推出了首個B2B領(lǐng)域的AI搜索引擎——Accio。這一創(chuàng)新產(chǎn)品的推出,標(biāo)志著阿里國際在電子商務(wù)和人工智能技術(shù)結(jié)合方面邁出了重要一步。 Accio
    的頭像 發(fā)表于 11-14 11:47 ?500次閱讀

    Meta開發(fā)新搜索引擎,減少對谷歌和必應(yīng)的依賴

    近日,Meta正在積極進軍人工智能領(lǐng)域,并試圖跟上OpenAI的發(fā)展步伐。為實現(xiàn)這一目標(biāo),Meta正在開發(fā)一款全新的搜索引擎,該搜索引擎具備網(wǎng)絡(luò)爬蟲功能,能夠為用戶提供有關(guān)時事的對話答
    的頭像 發(fā)表于 10-29 11:49 ?458次閱讀

    月訪問量超2億,增速113%!360AI搜索成為全球增速最快的AI搜索引擎

    與傳統(tǒng)搜索引擎不同,作為AI原生搜索引擎的360AI搜索基于公開網(wǎng)絡(luò)、知識庫、大模型三大支柱。借助首創(chuàng)的 CoE 技術(shù)架構(gòu),360AI搜索整合了國內(nèi)主流的16家廠商51款大模型,支持用
    的頭像 發(fā)表于 09-09 13:44 ?587次閱讀
    月訪問量超2億,增速113%!360AI<b class='flag-5'>搜索</b>成為全球增速最快的AI<b class='flag-5'>搜索引擎</b>

    OpenAI推出SearchGPT原型,正式向Google搜索引擎發(fā)起挑戰(zhàn)

    人工智能領(lǐng)域的持續(xù)探索中,OpenAI 邁出了重大一步,發(fā)布了其最新的 SearchGPT 原型,直接瞄準(zhǔn)了 Google 的核心業(yè)務(wù)——搜索引擎。這一舉動不僅標(biāo)志著 OpenAI 在技術(shù)上的又一次飛躍,也預(yù)示著搜索引擎市場即
    的頭像 發(fā)表于 07-26 15:11 ?617次閱讀

    微軟計劃在搜索引擎Bing中引入AI摘要功能

    近期,科技界傳來新動向,微軟緊隨百度與谷歌的步伐,宣布計劃在其搜索引擎Bing中引入先進的AI摘要功能,旨在為用戶帶來更加智能、豐富的搜索體驗。
    的頭像 發(fā)表于 07-26 14:23 ?514次閱讀

    AI搜索挑戰(zhàn)百度谷歌,重塑信息檢索的市場?

    自然語言處理技術(shù)理解用戶的復(fù)雜查詢,從而提供更為豐富和個性化的搜索結(jié)果。就像搜索引擎在過去幾十年里徹底改變了我們獲取信息的方式一樣,AI搜索現(xiàn)在正站在一個新的技術(shù)革命的前沿。 搜索引擎
    的頭像 發(fā)表于 07-04 21:15 ?298次閱讀
    AI<b class='flag-5'>搜索</b>挑戰(zhàn)百度谷歌,重塑信息檢索的市場?

    OpenAI下周或推人工智能搜索挑戰(zhàn)谷歌

    The Information此前曾在今年2月份報道,OpenAI正在秘密研發(fā)自己的網(wǎng)絡(luò)搜索服務(wù),并得到了微軟Bing搜索引擎的支持。微軟自去年起便在Bing中融入了OpenAI的技術(shù)。
    的頭像 發(fā)表于 05-10 11:27 ?328次閱讀

    OpenAI注冊新域名,準(zhǔn)備推出結(jié)合AI技術(shù)的搜索引擎挑戰(zhàn)谷歌

    OpenAI最近注冊了“search.chatgpt.com”域名,看起來是要推出一款新的搜索引擎
    的頭像 發(fā)表于 05-08 10:41 ?524次閱讀

    OpenAI或?qū)⑼瞥鯟hatGPT搜索引擎

    據(jù)可靠消息透露,OpenAI正秘密研發(fā)一款以ChatGPT為基礎(chǔ)的大型產(chǎn)品,其核心功能將是一款新型搜索引擎,旨在為用戶提供更便捷的上網(wǎng)體驗。
    的頭像 發(fā)表于 05-08 10:19 ?545次閱讀

    OpenAI或?qū)⒃?月9日發(fā)布ChatGPT版搜索引擎

    OpenAI可能即將與谷歌展開正面競爭,推出基于ChatGPT的搜索引擎。根據(jù)Reddit網(wǎng)友的最新爆料,OpenAI有望在5月9日公布其全新的搜索產(chǎn)品。據(jù)悉,與這一新產(chǎn)品相對應(yīng)的搜索網(wǎng)頁search.chatgpt.com的域
    的頭像 發(fā)表于 05-07 09:28 ?671次閱讀

    潤和軟件與新財富聯(lián)合發(fā)布金融AI對話式搜索引擎“金融搜一搜”產(chǎn)品

    3月29日,新財富投顧嘉年華活動中,江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)與深圳市新財富數(shù)字科技有限責(zé)任公司(以下簡稱“新財富”)聯(lián)合發(fā)布了金融AI對話式搜索引擎——“金融搜一搜”產(chǎn)品,助力金融投資場景智能化升級。
    的頭像 發(fā)表于 04-02 10:15 ?565次閱讀
    潤和軟件與新財富聯(lián)合發(fā)布金融AI對話式<b class='flag-5'>搜索引擎</b>“金融搜一搜”產(chǎn)品

    微軟向Windows 10/11推送更新,建議將Bing設(shè)為Chrome默認搜索引擎

    微軟通過提示窗口表示,只要將Bing設(shè)為Chrome瀏覽器的默認搜索引擎,即可免費享用ChatGPT-4,且每天可與Bing人工智能進行數(shù)百次的對話交流。
    的頭像 發(fā)表于 03-15 14:32 ?1409次閱讀

    電阻柜的發(fā)展史

    電阻柜發(fā)展史
    的頭像 發(fā)表于 03-08 15:22 ?519次閱讀

    生成式AI恐使搜索引擎衰退,預(yù)計2026年搜索量將下滑25%

    據(jù)市場分析機構(gòu)Gartner報道,生成式AI對傳統(tǒng)搜索引擎構(gòu)成重大威脅,預(yù)計至2026年搜索量將降低25%。為此,企業(yè)需調(diào)整營銷策略。
    的頭像 發(fā)表于 02-20 10:04 ?781次閱讀
    主站蜘蛛池模板: 亚洲经典一区二区三区 | 亚洲一区二区三区在线网站 | 成人性欧美丨区二区三区 | 日本韩国三级视频 | 女人张开腿 让男人桶个爽 免费观看 | 国产人成午夜免视频网站 | 操一操干一干 | 成人久久网站 | 四虎影院久久 | 天天操天天添 | 老色批在线播放视频网站免费 | 四虎东方va私人影库在线观看 | 黄色爽视频| 色香欲综合成人免费视频 | 欧美亚洲h在线一区二区 | 久久夜色撩人精品国产 | 激情婷婷 | 国产深夜福利在线观看网站 | 四虎影视最新网址 | 色色色色色色色色色色色色色色 | 色一欲一性一乱一区二区三区 | 一区 | 国产人成精品香港三级古代 | 亚洲综合在线一区 | 91夜夜人人揉人人捏人人添 | 亚洲插| 日本一卡二卡3卡四卡网站精品 | 黄色大片在线免费观看 | 手机看片国产在线 | 夜恋秀场欧美成人影院 | 欧美一区亚洲二区 | haodiaose在线精品免费观看 | 欧美黄色性 | 又黑又长黑人欧美三级 | 一级特黄a大片免费 | 日本免费黄色片 | 亚洲精品久 | 神马午夜第九 | 日本高清中文字幕在线观穿线视频 | 天天摸天天干天天操 | 色成网 |