大數(shù)據(jù)分析

2016年6月13日來源：科工網(wǎng)-國際互聯(lián)網(wǎng)+生態(tài)服務(wù)平臺瀏覽 1637 次評論（0）

大數(shù)據(jù)分析是指對規(guī)模巨大的數(shù)據(jù)進行分析。大數(shù)據(jù)可以概括為5個V，數(shù)據(jù)量大(Volume)、速度快(Velocity)、類型多(Variety)、Value（價值）、真實性(Veracity)。大數(shù)據(jù)作為時下火熱的IT行業(yè)的詞匯，隨之而來的數(shù)據(jù)倉庫、數(shù)據(jù)、數(shù)據(jù)分析、數(shù)據(jù)挖掘等等圍繞大數(shù)據(jù)的商業(yè)價值的利用逐漸成為行業(yè)人士爭相追捧的利潤焦點。隨著大數(shù)據(jù)時代的來臨，大數(shù)據(jù)分析也應(yīng)運而生。

前端展現(xiàn)

用于展現(xiàn)分析的前端開源工具有JasperSoft，Pentaho, Spagobi, Openi, Birt等等。

用于展現(xiàn)分析商用分析工具有Style Intelligence、RapidMiner Radoop、Cognos, BO, Microsoft, Oracle,Microstrategy,QlikView、 Tableau 。

國內(nèi)的有國云數(shù)據(jù)（大數(shù)據(jù)魔鏡），F(xiàn)ineBI等等。

數(shù)據(jù)倉庫有

Teradata AsterData, EMC GreenPlum, HP Vertica 等等。

數(shù)據(jù)集市有

QlikView、 Tableau 、Style Intelligence等等。

大數(shù)據(jù)分析的五個基本方面

1. Analytic Visualizations（可視化分析）

不管是對數(shù)據(jù)分析專家還是普通用戶，數(shù)據(jù)可視化是數(shù)據(jù)分析工具基本的要求。可視化可以直觀的展示數(shù)據(jù)，讓數(shù)據(jù)自己說話，讓觀眾聽到結(jié)果。

2. Data Mining Algorithms（數(shù)據(jù)挖掘算法）

可視化是給人看的，數(shù)據(jù)挖掘就是給機器看的。集群、分割、孤立點分析還有其他的算法讓我們深入數(shù)據(jù)內(nèi)部，挖掘價值。這些算法不僅要處理大數(shù)據(jù)的量，也要處理大數(shù)據(jù)的速度。

3. Predictive Analytic Capabilities（預(yù)測性分析能力）

數(shù)據(jù)挖掘可以讓分析員更好的理解數(shù)據(jù)，而預(yù)測性分析可以讓分析員根據(jù)可視化分析和數(shù)據(jù)挖掘的結(jié)果做出一些預(yù)測性的判斷。

4. Semantic Engines（語義引擎）

我們知道由于非結(jié)構(gòu)化數(shù)據(jù)的多樣性帶來了數(shù)據(jù)分析的新的挑戰(zhàn)，我們需要一系列的工具去解析，提取，分析數(shù)據(jù)。語義引擎需要被設(shè)計成能夠從“文檔”中智能提取信息。

5. Data Quality and Master Data Management（數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理）

數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理是一些管理方面的實踐。通過標準化的流程和工具對數(shù)據(jù)進行處理可以保證一個預(yù)先定義好的高質(zhì)量的分析結(jié)果。

假如大數(shù)據(jù)真的是下一個重要的技術(shù)革新的話，我們把精力關(guān)注在大數(shù)據(jù)能給我們帶來的好處，而不僅僅是挑戰(zhàn)。

開源大數(shù)據(jù)

1. Hadoop HDFS、Hadoop MapReduce, HBase、Hive 漸次誕生，早期Hadoop生態(tài)圈逐步形成。

2. Hypertable是另類。它存在于Hadoop生態(tài)圈之外，但也曾經(jīng)有一些用戶。

一體機數(shù)據(jù)倉庫

IBM PureData(Netezza), OracleExadata, SAP Hana等等。

異步大數(shù)據(jù)分析：

異步處理的大數(shù)據(jù)分析中遵守了捕獲、存儲加分析的流程，過程中數(shù)據(jù)由傳感器、網(wǎng)頁服務(wù)器、銷售終端、移動設(shè)備等獲取，之后再存儲到相應(yīng)設(shè)備上，之后再進行分析。由于這些類型的分析都是通過傳統(tǒng)的關(guān)系型數(shù)據(jù)庫管理系統(tǒng)(RDBMS)進行的，數(shù)據(jù)形式都需要轉(zhuǎn)換或者轉(zhuǎn)型成為RDBMS能夠使用的結(jié)構(gòu)類型，例如行或者列的形式，并且需要和其它的數(shù)據(jù)相連續(xù)。

處理的過程被稱之為提取、轉(zhuǎn)移、加載或者稱為ETL。首先將數(shù)據(jù)從源系統(tǒng)中提取處理，再將數(shù)據(jù)標準化處理且將數(shù)據(jù)發(fā)往相應(yīng)的數(shù)據(jù)倉儲等待進一步分析。在傳統(tǒng)數(shù)據(jù)庫環(huán)境中，這種ETL步驟相對直接，因為分析的對象往往是為人們熟知的金融報告、銷售或者市場報表、企業(yè)資源規(guī)劃等等。然而在大數(shù)據(jù)環(huán)境下，ETL可能會變得相對復(fù)雜，因此轉(zhuǎn)型過程對于不同類型的數(shù)據(jù)源之間處理方式是不同的。

當分析開始的時候，數(shù)據(jù)首先從數(shù)據(jù)倉儲中會被抽出來，被放進RDBMS里以產(chǎn)生需要的報告或者支撐相應(yīng)的商業(yè)智能應(yīng)用。在大數(shù)據(jù)分析的環(huán)節(jié)中，裸數(shù)據(jù)以及經(jīng)轉(zhuǎn)換了的數(shù)據(jù)大都會被保存下來，因為可能在后面還需要再次轉(zhuǎn)換。

評論列表

每頁 10 條，共 0 條

歡迎投稿

郵箱：15236061639@163.com

QQ：60298351

微信：a18137798589

習(xí)近平告訴你經(jīng)濟應(yīng)該這么抓:堅定不移推進供給側(cè)改革

展會

更多展會

人物觀點

更多人物

MES系統(tǒng)設(shè)計-機床聯(lián)網(wǎng)與MES系統(tǒng)集成

1.需求背景1）建立覆蓋加工車間的分布式控制網(wǎng)絡(luò)，實現(xiàn)NC程序的有效調(diào)用、穩(wěn)定有效傳輸和在線加工等，
中國機器人產(chǎn)業(yè)格局突變！最新30強名單泄露，三大黑馬殺出重圍

上周《2025年國產(chǎn)智能機器人企業(yè)競爭力報告》（瞭望財經(jīng)快思慢想研究院）突然刷屏朋友圈。這份報告直接
【深度解析】人形機器人產(chǎn)業(yè)與汽車行業(yè)的協(xié)同發(fā)展核心梳理（附名單）

汽車行業(yè)與人形機器人產(chǎn)業(yè)的協(xié)同發(fā)展確實正在形成一條高潛力的產(chǎn)業(yè)鏈，兩者的技術(shù)共享、供應(yīng)鏈整合和市場聯(lián)

成人A片高潮痉挛,精品无码一区二区三区爱欲,盛夏晚晴天在线观看 ,男女啪啪

大數(shù)據(jù)分析

熱門標簽

微信掃一掃關(guān)注我們

歡迎投稿

習(xí)近平告訴你經(jīng)濟應(yīng)該這么抓:堅定不移推進供給側(cè)改革

展會

人物觀點

MES系統(tǒng)設(shè)計-機床聯(lián)網(wǎng)與MES系統(tǒng)集成

中國機器人產(chǎn)業(yè)格局突變！最新30強名單泄露，三大黑馬殺出重圍

【深度解析】人形機器人產(chǎn)業(yè)與汽車行業(yè)的協(xié)同發(fā)展核心梳理（附名單）

推薦品牌

購物指南

配送與支付

服務(wù)保障

商家服務(wù)

關(guān)于我們

關(guān)注我們