<fieldset id="6wgag"></fieldset>

  • <strike id="6wgag"></strike><samp id="6wgag"><tbody id="6wgag"></tbody></samp>
    
  • <strike id="6wgag"></strike>
  • 首頁 » 創新資訊 » 行業新聞

    聯合實驗室能否解開大數據難題

    來源:中國電子報、電子信息產業網   作者:李佳師  發布時間:2014-08-29

      近來,大數據被炒得熱得發“燙”,只要和數據有關的事情全部都被冠以了“大數據”之名。從目前在中國開展大數據服務的情況來看,投身其中最積極、見效最快的是互聯網公司,尤其是BAT,因為互聯網服務提供商擁有龐大的數據,是天然的大數據服務提供商。從大數據應用來看,精準營銷是目前用得最多也是最成功的大數據服務。但應該說我們今天所看到的僅僅是大數據應用這個汪洋大海中的冰山一角,甚至可以說是滄海一粟,我們要打開大數據應用的大門,讓大數據真正成為我們經濟社會轉型升級的“石油”,需要各界機構勇敢地聯姻ICT公司,需要大家跨界融合。

      眼下,最值得關注的事情,是各種與大數據相關的聯合實驗室的建立。不久前百度與聯合國開發署建立了大數據聯合實驗室,研究的領域是環保健康,未來還會拓展到教育和災害管理等。首個項目是設立“百度回收站”應用,讓用戶手機一拍廢舊電器,就能夠顯示電子垃圾類別和回收價格,用戶填寫準確信息,就會有回收廠商進行聯系,破解電子垃圾回收難的問題。也是在最近,北京市環境保護科學研究院與IBM建立了聯合實驗室,目標是利用認知計算、大數據分析、物聯網等相關技術,助力北京市加速霧霾治理。同樣是在最近,浪潮集團與交通運輸部公路科學院建立“現代物流大數據應用實驗室”,目標是運用大數據加速物流的智能化轉型。還是在不久前,電子科技大學與朗瑪信息公司建立醫療大數據聯合實驗室,目標是利用大數據破解健康難題。如此多大數據聯合實驗室的建立,說明一個重要的事實,即大數據利用需要“融合智慧”。大數據之難事實上是難在對數據的理解和分析上,如何建立每一個領域的大數據分析模型,如何獲得大數據的洞察,既需懂“數學”又需要懂“行業”,二者缺一不可,也只有各個行業與ICT企業融合才有可能真正找到大數據中蘊含的“智慧”。而聯合實驗室的建立正是孵化“你中有我”、“我中有你”的“融合智慧”最有效的路徑。

      大數據是一個真正“融合”的產業,無論是傳統產業還是ICT產業都需要融合其他領域的智慧。而搶占融合的機會,也是需要趁早行動的,也是需要占位的。也許大家還記得當年阿里巴巴聯合天弘基金推出“余額寶”的事,就在他們聯手推出余額寶后不久,各種理財的“寶”、各種消費的“白條”紛紛推出,向市場拋出了高回報的理財產品,但是誰也搶不走“余額寶”的頭籌,無論是用戶數還是資金量或是市場號召力和影響力,都沒能敵過他們,就因為他們是進入市場的第一個。在這個到處是“融合”和“混搭”的移動互聯時代,你必須成為第一,才能摘得最大的果子,移動互聯網如此,大數據的利用同樣如此。要想搶占某個領域的大數據“山頭”,必須動手,現在就要動手。

      在剛剛舉行的中國互聯網大會的大數據論壇上,盡管有很多業內人士看到目前中國的大數據應用,也潑出了很多的涼水,但就和所有的產業啟動一樣,每一個產業的開啟一定會遇到各種各樣的問題,用戶接受度、數據共享、標準、缺位等等,而這些問題一定是在產業不斷推進、演進的過程中不斷克服,不斷解決的。只有走出去、邁開步子,才有可能知道路上的絆腳石,先搬哪一塊,用什么方法搬,走一步解決一步,大家一起探索,大家一起推動,才有可能真正迎來大數據應用的春天。而要擁抱大數據,推動大數據的發展,現在需要讓ICT與其他各個產業界都勇敢地擁抱對方,大家一起來“跨界”。

      百度大數據部總經理陶海亮

      百度大數據應用已有很多落地成果

      百度已發布了大數據引擎戰略,把百度的大數據應用技術能力開放出來,讓各行各業都可以去使用。

      今年4月份,百度發布了大數據引擎戰略,把百度多年來積累的大數據應用技術能力開放出來,讓各行各業都可以去使用。這個大數據引擎包括了三個部分,最底層叫做開放云,大家理解為云計算,但是百度的云的規模更大一些,因為我們有一些獨有的技術。在開放云上面我們還有數據工廠,數據工廠是新一代數據庫管理的技術,還有挖掘方法。數據工廠的上面是百度技術核心,叫做百度的大腦。百度大腦已經達到了非常先進的程度。

      今年我們推出了一些大數據的應用產品。比如旅游預測。旅游預測有兩個部分,一個部分叫景點預測,這是我們跟旅游局和各地的旅游管理機構合作,對未來一周,或者是幾天,每一個景點的人流情況進行預測。另一個是基于我們旅游的數據去對道路和城市、旅游的出發地的預測,這個預測結果對于我們的旅行社和管理部門很有價值。疾病預測,是6月份上線的,我們從中國疾病控制中心拿到了一些數據,將這些數據跟我們百度的數據相結合,我們可以對全國所有的地級市,以及全國2800個縣區的多種疾病的發病態勢進行預測。高考預測,這是我們今年高考之前上線的產品,這個高考預測產品有很多的內容,比如作文高考命題在什么方向,我們給出了六個方向,每個方向給出了三套題,給出了內容和范文。百度司南,這是我們基于大數據的商業決策平臺,我們的司南能夠對市場行為進行評估,對消費者動態進行洞察,比如我們知道很多的企業會請代言人,什么樣的代言人跟你產品比較吻合,過去沒有一個很好的基于數據的指標。我們的司南這個產品,可以直接給出答案,你的產品跟哪一個代言人比較匹配,如果你是賣“馬自達6”的話可能請吳莫愁和王菲比較合適,請周杰倫不太合適,我們的產品可以數據化告訴你營銷應該怎么做,客戶是什么樣的,市場格局是什么樣的。

      締元信網絡數據CEO秦雯

      技術倫理不解決中國大數據永遠有泡沫

      大數據領域面臨很多問題,包括企業深受其害的廣告虛假點擊等,這些問題不解決大數據永遠有泡沫。

      目前大數據領域存在認知混亂問題。首先是很多做數據中心的公司號稱自己是大數據公司,我們知道數據中心是所有互聯網業務的網絡基礎設施,大數據只是他要支撐的業務的一部分。其次做云計算的,也認為自己是大數據公司。云計算是大數據的系統基礎設施,當然海量數據的處理,沒有云計算是不可能實現的。但云計算只是大數據整個產業或者說是應用的組成部分。但是云計算不等于大數據。再者,很多人把大數據等同于數字化信息,并不是所有的數字化信息一定產生大數據。我們認為大數據是數字化信息的生產和被消費的過程數據。最后的一個誤區是認為大數據就是海量數據。究竟什么是大數據,我們認為大數據是行為環境的過程記錄數據。

      大數據的發展有兩個關鍵都與互聯網有關。一個是因為有互聯網,所以我們能搜集到非常細致的數據。第二個是互聯網技術能夠以非常低的成本采集和使用大數據。

      數據應用存在生態環境問題,我想講幾個方面,第一個是公共數據,公關數據涉及幾個層面,一個是用戶隱私,一個是數據開放,一個是技術倫理。我想講一下公共數據問題,很多人認為中國政府擁有最多的數據,但是我們細看其實有很多的問題,首先絕大部分政府在業務上的數據都是統計數據。另外數據質量有很大的問題,因為中國全社會沒有養成數據培育和數據管理的習慣,政府部門也不例外。另外很多數據是缺位的,我舉一個例子我相信今天做的互聯網的相關業務人員都有感觸,中國的IP地址數和IP地址分布情況,現在市場上流行的是民間整理的,這個事情應該由政府來做,并且作為公共數據開放出來,這些方面現在是缺失的。技術的倫理問題,我們知道互聯網技術能做很多的事情,而且這樣技術工作常常是道高一尺,魔高一丈。我們大家都熟悉的,很多企業身受其害的廣告虛假點擊等問題,給我們帶來的思考是我們的技術應用是不是需要講究商業道德和倫理,如果這個問題不解決,說實話在中國大數據落地永遠是泡沫。

      北京航空航天大學計算機學院副院長胡春明

      大數據處理要“3I”

      每次講大數據的特征我們都講4V,對于大數據的處理我們認為也存在三個特征,叫做3I。

      大數據鏈條中仍然存在一些問題,比如很多人認為多元的大數據集就代表了真實的世界,但是實際上是嗎?我們觀察發現其實在采樣的過程中就有偏差,所以從這個角度講,數據是有質量的問題。第二個問題是我們講了大數據之大,大到我們處理不了,我們應該如何來處理大數據?在處理的過程中我們需要把大變小,就會要丟掉一部分的數據,這是第二個面臨的問題。第三個問題是如何從數據中尋找知識和預測。這個預測的方法比之前的數據挖掘更進一步,需要新的統計理論和數學工具,新的計算理論和算法、設計方法,新的大數據分布式計算機基礎設施找到知識和預測,這是第三個問題。

      每次講大數據的特征我們都講4V,對于大數據的處理我們認為也存在三個特征,叫做3I。第一個I叫做非精確。第一個層面是我們今天做的很多的計算或數值、術語不一樣,不需要那么精確,我們往往需要知道的是一個大的方向和態勢。另一方面是我們面臨的環境沒有辦法做得那么精確,數據在不斷的變化,沒有辦法得到一個穩定的視圖,所以沒有辦法嚴格地去做,我們就放松要求,我們在計算里面堅持非精確的一個思路,當然非精確不意味著隨便去做,我們仍然需要有一些最基本的服務質量的保證。需要有一些辦法來避免這個通過非精確來減少計算成本的同時,保證一定的服務質量,這是我們認為的第一個I的特征。第二個I的特征可能和大數據里的動態持續變化緊密相關。數據因為是持續變化的,可能新來的數據占到過去歷史上所有數據的很小比例。如果我們能夠把我們的計算變得增量化,我只是針對新到來的比較小的數據塊做計算,然后能把這個計算的結果融合到已有的計算結果里面,這樣的話我們就在一定程度上減輕我們講的大數據之大的影響。當然這個增量本身依賴一些前提條件,有一些算法或者是問題適合增量處理,有一些算法并不一定適合。所以說從這個角度來講,我們可能要運用一些新的思想和方法來設計,支持增量的算法,同時我們在分布式的計算系統里面支持這樣一種增量計算的處理的能力,這是我們認為三個I里面的第二個I。第三個I叫做歸納性。大數據是多元融合的數據,這些數據代表了現實世界,代表了我們統計學上所謂的總體。那么從這個角度來講我們往往會有這樣的思想,我們如果能夠把來自不同源的數據,及時相互參照,有所發現,就會給我們帶來機會,這是我們利用一種相互的參照來簡化計算,同時能夠解決前面兩個非精確帶來的誤差。這是我們人為的大數據計算的三個I。

    責任編輯:李尚峰
    相關評論
    新產品展示
    促進會會員征集
    設為首頁  |  關于我們  |  會員服務  |  友情鏈接  |  聯系我們
    中國·廣西工業創新促進會 ©版權所有  桂ICP備14000625號-2
    中日韩精品视频在线观看| 久久久久久极精品久久久| 米奇777四色精品人人爽| 亚洲一区爱区精品无码| 日韩成人在线网站| 在线视频精品免费| 亚洲国语精品自产拍在线观看 | 91大神精品全国在线观看| 精品国产综合成人亚洲区| 精品视频在线观看一区二区三区| 国产精品免费综合一区视频| 久久精品国产2020| 久久国产精品99久久小说| 日本道免费精品一区二区| 亚洲欧美日韩中文字幕一区二区三区| 精品国产中文字幕| 亚洲精品无码你懂的| 亚洲精品高清国产麻豆专区| 久久精品夜色国产亚洲av| 99精品国产自在现线观看| 亚洲国产精品一区二区九九 | 国产精品白浆在线观看无码专区| 国产精品久久久久久久人人看| 99精品视频在线视频免费观看| 国产三级精品三级在线专区1| 香蕉在线精品一区二区| 2022年国产精品久久久久| 青草国产精品视频。| 欧美日韩精品一区二区在线观看 | 亚洲日韩精品A∨片无码加勒比| 亚洲熟妇无码久久精品| 99热这里只有精品6免费| 久久久久亚洲精品美女| 亚洲AV永久无码精品成人| 中文成人无码精品久久久不卡| 久久综合精品国产一区二区三区| 日韩中文在线视频| 99精品国产免费久久久久久下载| 亚洲欧美国产精品专区久久| 精品国产一区二区三区麻豆 | 亚洲日韩精品无码专区加勒比☆|