2016年新年伊始,在主題為Hello,DT World的論壇上,阿里云發布了大數據開發平臺:數加。這是一個包含計算引擎、開發組件、可視化工具在內的一站式開發平臺,將大大降低開發者使用大數據的門檻,同時也將讓數據分析和數據預測的成本降至10%。 大數據的口號
2016年新年伊始,在主題為“Hello,DT World”的論壇上,阿里云發布了大數據開發平臺:“數加”。這是一個包含計算引擎、開發組件、可視化工具在內的一站式開發平臺,將大大降低開發者使用大數據的門檻,同時也將讓數據分析和數據預測的成本降至10%。
大數據的口號喊了多年,到如今依然熱度不減,哪怕在2015年資本市場的“寒冬”下,中國大數據領域的創新公司仍獲得近50億人民幣的投資。可實際上,大數據在開發層面和應用層面一直未有本質的創新,人類已挖掘的數據財富更是不到百萬分之一。
“數加”的發布,對阿里云來說,無疑是對數據和計算本質的重新思考:把云計算的“云”和大數據“大”去掉,讓數據被更好地計算,從而創造出經濟和社會價值。
事實上,人類社會的發展自始至終離不開數據與計算工具的進化。
在《人類簡史》這本書里,歷史學家尤瓦爾·赫拉利描述了的“智人”的進化過程,很大程度上源自計數工具的推動,即便是麻繩、石頭這樣簡陋的計數工具。到了公元前2700年,古蘇美爾人發明了算盤,開創了世界上首批先進的計算系統。而利用算盤,古蘇美爾人和古巴比倫人在天文、航海方面有了深刻研究,這些由算盤計算出來的天文、航海數據也成為早年商貿活動的重要參考。
如果把歷史鏡頭拉近,當1946年馮·諾伊曼推出**臺現代意義的計數設備——計算機的時候,人類的又一場變革大幕正在開啟。正是在計算機強大計算能力的幫助下,登月計劃才會成為現實,也正是利用計算機,人類對于生命科學的研究才能在過去二十年取得突飛猛進的發展。
從互聯網時代開始,尤其到了移動互聯網以及社交媒體時代,人類社會的數據增長進入到一個前所未有的爆發階段。根據IDC的數字世界研究報告顯示,僅僅在2013年,人類產生、復制和消費的數據量達到4.4ZB。而到2020年,數據量將增長10倍,達到44ZB。
如此海量數據的增長,勢必需要更**的數據解決方案。
長期以來,企業數據處理的**結果往往就是商務智能,但一張所謂的智能報表由于無法實現實時計算,并不能真正代表企業的運營情況。其次,數據存儲的成本并不低,倘若無法從數據中挖掘出核心價值,那么數據不但不會是企業發展的動能,還將成為企業的重要成本。第三,即便是Hadoop平臺出現之后,雖然擁有了開放、廉價、基于普通商業硬件的平臺,但大數據應用的開發成本,無論是技術門檻還是價格都讓很多普通開發者望而卻步。
在這樣的產業發展背景之下,“數加”這樣一個分布式大數據開發平臺的推出引人關注。
首先,作為“一個數據公司”(馬云語),阿里巴巴擁有著處理大數據的豐富經驗。單就2015年的雙十一來說,淘寶/天貓訂單的創建峰值能力突破了每秒鐘14萬筆,支付寶的支付峰值達到了每秒8.59萬筆,遠高于Visa實驗室測試數據的每秒5.6萬筆以及MasterCard實驗室測試數據的每秒4萬筆,這些數據處理經驗都將反映到“數加”的產品中。
其次,“數加”并非一款單獨的產品,而是一條完整的大數據開發鏈條。當天發布的20款產品,覆蓋了數據采集、計算引擎、數據加工、數據分析、機器學習、數據應用等數據生產全鏈條。
其中,由大數據計算服務(MaxCompute)、分析型數據庫(Analytic DB)、流計算(StreamCompute)共同組成的底層計算引擎,速度快且成本低。測算數據顯示,自建Hadoop集群的成本是“數加”的1.5倍,國外計算廠商AWS 的EMR成本更是“數加”的5倍。
另外,“數加”的云端數據開發套件,包括數據集成、數據開發、調度系統、數據管理、運維視屏、數據質量、任務監控,能夠幫助開發者快速部署相關產品。則通過視化產品DataV的數據分析,開發者可以一星期做出阿里雙十一的數據監控大屏。同樣基于DataV,“數加”還發布了面向政府的行業應用產品“郡縣圖治”。通過這款產品,縣長可以在一個屏幕下統覽全縣各項經濟民生數據,為政府決策提供輔助。
“數加”推出的機器學習工具,可基于海量數據實現對用戶行為、行業走勢、天氣、交通等的預測。圖形化編程讓用戶無需編碼、只需用鼠標拖拽標準化組件即可完成開發。產品還集成了阿里巴巴核心算法庫,包括特征工程、大規模機器學習、深度學習等。
而在應用層面,支撐阿里巴巴客服系統的智能語言交互和文字識別OCR也即將上線。開發者可以利用這兩個應用開發更具人工智能的大數據產品,比如搭建智能化的客服體系,利用文字識別OCR快速推出掃描類的應用,保障用戶體驗,節約成本。
**,在一個軟件即服務的時代,“數加”要做的也不僅僅是完整的數據開發工具,而是一項數據增值服務。大數據行業的進步不僅需要底層技術尤其是開發技術的發展,以降低技術門檻和資金門檻,還需要大量數據分析人才、數據科學家。
阿里云大數據事業部**總監徐常亮表示,阿里云將通過天池大數據競賽的平臺,發現、培養更多數據分析人才,比如在2015年就發掘出一位年齡僅有15歲的數據分析的獲獎者。同時計劃與各大高校合作,合辦數據相關的課程等。同時,徐常亮還透露,“數加”平臺將計劃在3年內吸引1000家合作伙伴加入,共同構筑大數據生態圈。
正如科幻小說家威廉·吉布森所言:未來已經到來,只是分布還不均衡。我們已經看到整個社會都在轉向數據層面的運作。據
石家莊網站建設了解,而當互聯網成為像水、電一樣的基礎設施時,產生于互聯網(包括但不限于桌面互聯網、移動互聯網、物聯網等)的數據也成為一種新型的生產資料,在云計算的大背景下,分布式的數據分析計算平臺將創造更多的創業機會,讓數據能夠互聯互通,數據驅動的創業變革也已在發生。正如阿里云總裁胡曉明曾預測的:2016年將成為數據創業的**年,這將是創業領域的全新的一個開始。