183.17.231.* 2020-12-29 13:48:46 |
大數(shù)據(jù),指無法在一定時間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。
大數(shù)據(jù)的四大特點:
一、大量
大數(shù)據(jù)的特征首先就體現(xiàn)為“大”,從先Map3時代,一個小小的MB級別的Map3就可以滿足很多人的需求,然而隨著時間的推移,存儲單位從過去的GB到TB,乃至現(xiàn)在的PB、EB級別。只有數(shù)據(jù)體量達(dá)到了PB級別以上,才能被稱為大數(shù)據(jù)。隨著信息技術(shù)的高速發(fā)展,數(shù)據(jù)開始爆發(fā)性增長。社交網(wǎng)絡(luò)、移動網(wǎng)絡(luò)、各種智能工具等,都成為數(shù)據(jù)的來源。淘寶網(wǎng)近4億的會員每天產(chǎn)生的商品交易數(shù)據(jù)約20TB。迫切需要智能的算法、強(qiáng)大的數(shù)據(jù)處理平臺和新的數(shù)據(jù)處理技術(shù),來統(tǒng)計、分析、預(yù)測和實時處理如此大規(guī)模的數(shù)據(jù)。
二、高速
就是通過算法對數(shù)據(jù)的邏輯處理速度非常快,1秒定律,可從各種類型的數(shù)據(jù)中快速獲得高價值的信息,這一點也是和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同。并且這些數(shù)據(jù)是需要及時處理的,因為花費大量資本去存儲作用較小的歷史數(shù)據(jù)是非常不劃算的。基于這種情況,大數(shù)據(jù)對處理速度有非常嚴(yán)格的要求,服務(wù)器中大量的資源都用于處理和計算數(shù)據(jù),很多平臺都需要做到實時分析。數(shù)據(jù)無時無刻不在產(chǎn)生,誰的速度更快,誰就有優(yōu)勢。
三、多樣
如果只有單一的數(shù)據(jù),那么這些數(shù)據(jù)就沒有了價值。廣泛的數(shù)據(jù)來源,決定了大數(shù)據(jù)形式的多樣性。任何形式的數(shù)據(jù)都可以產(chǎn)生作用,目前應(yīng)用最廣泛的就是推薦系統(tǒng),如淘寶,網(wǎng)易云音樂、今日頭條等,這些平臺都會通過對用戶的日志數(shù)據(jù)進(jìn)行分析,從而進(jìn)一步推薦用戶喜歡的東西。日志數(shù)據(jù)是結(jié)構(gòu)化明顯的數(shù)據(jù),還有一些數(shù)據(jù)結(jié)構(gòu)化不明顯,例如圖片、音頻、視頻等,這些數(shù)據(jù)因果關(guān)系弱,就需要人工對其進(jìn)行標(biāo)注。
四、價值
這也是大數(shù)據(jù)的核心特征。現(xiàn)實世界所產(chǎn)生的數(shù)據(jù)中,有價值的數(shù)據(jù)所占比例很小。你如果有1PB以上的全國所有20-35年輕人的上網(wǎng)數(shù)據(jù)的時候,那么它自然就有了商業(yè)價值,比如通過分析這些數(shù)據(jù),我們就知道這些人的愛好,進(jìn)而指導(dǎo)產(chǎn)品的發(fā)展方向等等。如果有了全國幾百萬病人的數(shù)據(jù),根據(jù)這些數(shù)據(jù)進(jìn)行分析就能預(yù)測疾病的發(fā)生,這些都是大數(shù)據(jù)的價值。大數(shù)據(jù)運用之廣泛,如運用于農(nóng)業(yè)、金融、醫(yī)療等各個領(lǐng)域,從而最終達(dá)到改善社會治理、提高生產(chǎn)效率、推進(jìn)科學(xué)研究的效果。
大數(shù)據(jù)分析有哪些特征.中琛魔方大數(shù)據(jù)平臺(www.zcmorefun.com)表示大數(shù)據(jù)的主要特征就是大量、高速、多樣、價值,這些特征正體現(xiàn)了大數(shù)據(jù)在當(dāng)今社會發(fā)展,以及科學(xué)進(jìn)步,人民生活等鐘,體現(xiàn)了巨大的作用,同時,也體現(xiàn)了大數(shù)據(jù)未來的無限前景。
|