要問(wèn)當(dāng)前什么BI工具最熱門(mén),肯定非PowerBI莫屬,堪比BI界的Python。對(duì)于我這種用慣了Tableau來(lái)說(shuō),確實(shí)會(huì)眼紅PowerBI某些特性。
但PowerBI和Tableau都有一個(gè)問(wèn)題:使用成本高,需要花很多時(shí)間去研究才能做出像樣的企業(yè)級(jí)報(bào)表。
前幾天,老板讓我做個(gè)部門(mén)內(nèi)部的數(shù)據(jù)看板,用來(lái)監(jiān)視用戶留存及下單情況,還會(huì)涉及到回歸、聚類的算法,對(duì)用戶進(jìn)行定期的分類。
我分析了這個(gè)需求,有三個(gè)問(wèn)題要解決:
一是數(shù)據(jù)量比較大,一天有幾百萬(wàn)用戶的訪問(wèn)數(shù)據(jù);
二是支持部門(mén)同事提取數(shù)據(jù)的需求,盡可能要簡(jiǎn)單易用;
三是可以自定義算法,實(shí)現(xiàn)多元回歸、分類、聚類的功能。
旁邊座位的李大頭湊過(guò)來(lái),說(shuō)你可以試試國(guó)產(chǎn)BI,大屏做起來(lái)杠杠的,不信你看我之前搞的一個(gè)項(xiàng)目,十五天開(kāi)發(fā)周期,七天搞完。
他用的是Yonghong Desktop,和Power BI、Tableau處于不同賽道。關(guān)鍵這個(gè)軟件是免費(fèi)的,對(duì)部門(mén)級(jí)數(shù)據(jù)部署來(lái)說(shuō),這很重要。
他先給我看了永洪BI的一些案例,典型的國(guó)內(nèi)企業(yè)大屏,領(lǐng)導(dǎo)肯定喜歡。
水務(wù)集團(tuán)數(shù)據(jù)可視化分析
展會(huì)客流量可視化分析
還有輕量化的企業(yè)報(bào)表,圖表形式和頁(yè)面布局看著清爽舒服。
保險(xiǎn)行業(yè)-業(yè)務(wù)結(jié)構(gòu)
可視化分析
看了永洪BI的產(chǎn)品形態(tài),它和Tableau的主要差異在于,前者更注重報(bào)表、大屏的開(kāi)發(fā),簡(jiǎn)單直接,后者更側(cè)重商業(yè)分析、可視化表達(dá)。
永洪BI直接在dashboard頁(yè)面制作報(bào)表和大屏,沒(méi)有了單獨(dú)的sheet,這樣雖然功能豐富性上打了折扣,但縮短了開(kāi)發(fā)路徑,效率得到大大提升。
李大頭雖懶,但對(duì)同事很有耐心,他把安裝到使用的全部步驟都展示了一遍。
Yonghong Desktop直接在永洪官網(wǎng)下載。
桌面軟件大概950M,下載很快,需要預(yù)留2GB的安裝空間。
下載完成后,一路next就能完成安裝,然后打開(kāi)幾秒鐘后就能進(jìn)入軟件主界面。
前面說(shuō)過(guò),永洪BI制作報(bào)告的步驟很簡(jiǎn)潔,加載數(shù)據(jù)源后直接在dashboard界面制作圖表即可。大頭梳理好了使用步驟,真的用心。
永洪BI支持幾乎所有的主流數(shù)據(jù)庫(kù),包括MySQL、Oracle、SQLServer等傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù),還有HIVE、HBASE等大數(shù)據(jù)系統(tǒng)。
添加數(shù)據(jù)源操作非常簡(jiǎn)單,一般我們可以導(dǎo)入excel和文本文件。
或者連接MYSQL數(shù)據(jù)庫(kù),然后通過(guò)SQL去抽取數(shù)據(jù)。
加載完數(shù)據(jù)后,就可以制作報(bào)告了,從右邊的組件區(qū),挑選合適的圖表組件到左邊dashboard空白區(qū),開(kāi)始制作第一張圖表。
大頭用永洪BI自帶的咖啡店數(shù)據(jù)集示范了如何拖拽數(shù)據(jù),實(shí)現(xiàn)一張可視化圖表。
上面是分區(qū)域的咖啡種類銷量柱狀圖,先選取柱狀圖組件,接著只需要把維度(市場(chǎng)分布、產(chǎn)品種類)拖到列,把度量(銷量)拖到行即可完成圖表制作。
除了常規(guī)圖表外,這款BI還能傻瓜式的制作南丁格爾玫瑰圖、儀表圖、軌跡圖等較為復(fù)雜的圖表。
大頭演示了南丁格爾玫瑰圖、儀表圖的制作過(guò)程,幾秒鐘完成,讓我驚訝到。
上面這些圖表都支持?jǐn)?shù)據(jù)導(dǎo)出,導(dǎo)出的形式有PDF、EXCEL、Word、PNG、CSV,我們特意看了下導(dǎo)出EXCEL的形式,交差表會(huì)有數(shù)據(jù),如果是圖表直接是高清圖片形式。
接著,他說(shuō)厲害的來(lái)了,永洪BI可以用R或者Python寫(xiě)算法模型,來(lái)實(shí)現(xiàn)機(jī)器學(xué)習(xí)、商業(yè)模型、復(fù)雜可視化等。
里面自帶了幾個(gè)經(jīng)典的模型,可以直接用,用戶也可以自己新建。
看下客戶流失模型,通過(guò)邏輯回歸模型來(lái)預(yù)測(cè)。
使用R進(jìn)行定制可視化:
使用Python定制可視化:
Tableau和PowerBI也支持Python、R進(jìn)行深度開(kāi)發(fā),但用起來(lái)似乎不那么方便,需要配置。
大頭說(shuō)完后,我拍了拍他的肩膀,調(diào)侃道你小子是會(huì)想辦法哈,這種敏捷、輕量的BI工具可以省很多事,等我把這個(gè)活搞定得請(qǐng)你吃個(gè)飯。
接下來(lái)干活,開(kāi)始搭建用戶數(shù)據(jù)看板,這塊總共分為三大部分:
1、用戶留存看板,顯示用戶的注冊(cè)、登入、使用、流失、分享等情況。
2、用戶畫(huà)像看板,根據(jù)用戶的使用習(xí)慣和靜態(tài)標(biāo)簽,對(duì)用戶進(jìn)行分群。
3、用戶下單看板,展示不同產(chǎn)品的下單情況,包括訂單金額、成本、利潤(rùn)等。
這里選擇第三個(gè)簡(jiǎn)單展示下我做的一個(gè)看板模塊,功能還在完善。
整體分布比較簡(jiǎn)單,包括標(biāo)題、訂單數(shù)據(jù)、訂單金額走勢(shì)、訂單金額類型分布、訂單金額平臺(tái)分布等。
經(jīng)過(guò)處理的底表數(shù)據(jù)共有14個(gè)字段,每一行代表一個(gè)訂單,具體如下:
接下來(lái)就是導(dǎo)入數(shù)據(jù)到永洪BI中,然后制作相應(yīng)的圖表。
制作圖表的過(guò)程之前也說(shuō)過(guò)了,并不難,只要選好合適的圖表組件,放入數(shù)據(jù)字段就可以。
當(dāng)然,排版和配色對(duì)數(shù)據(jù)看板來(lái)說(shuō)也是一個(gè)很重要的因素,需要符合使用場(chǎng)景,好的UI會(huì)讓你的作品看起來(lái)會(huì)更加讓人信服。
我覺(jué)得看板制作需要注意三點(diǎn):
1、選擇合理的維度,哪些數(shù)據(jù)是你要展示的?
2、選擇合適的圖表,力求表達(dá)簡(jiǎn)潔明了。
3、選擇合情的布局,讓人看起來(lái)詳略得當(dāng),不違和。
這個(gè)Demo級(jí)的報(bào)表總共花了我兩小時(shí),從剛上手到完成一個(gè)dashboard,已經(jīng)算非常快了。
主要是因?yàn)橛篮锽I的功能區(qū)比較分明,掌握整個(gè)布局,就能很容易完成一個(gè)圖表。
? ? ? ? ymf
評(píng)論