主頁(http://www.by236.com):鄔賀銓:大數據挖掘是智慧城市建設與管理的無形生產資料 ![]() 十八大提出堅持走中國特色新型工業化、城鎮化、農業現代化的道路,推動信息化與工業化的深度融合,工業化與城鎮化的良性互動,城鎮化與農業現代化的相互協調,促進工業化、城鎮化、信息化、農業現代化的同步發展,這標志著我國城鎮化發展進入了新時期,智慧城市是城鎮化發展的一個新時期,推動城鎮化的發展。什么是智慧城市?我認為智慧城市是對人力與社會資源和傳統及現代設施的投資,促進可持續經濟發展和高質量生活,同時通過提供參與治理的機會實現對自然資源聰明的管理,這時一個城市就被稱為智慧城市。"Smart city"如果準確的翻譯應該是聰明的城市,智慧城市應該具有以下四個要素:一、可測量的, 可監控的以及可分析的,也就是說通過分析服務于個人, 企業及政府的系統所產生的數據流, 提供新的洞察力和機會, 提高效率,測量的數據要整合和創新,提供市機關,企業,教育機構和個人共同創造城市的構想藍圖及實施方案,提高生活質量。 從歐盟智慧城市評價體系看大數據應用現狀 歐盟對智慧城市的評價分為六個方面:智慧經濟、智慧治理、智慧生活、智慧人民、智慧環境、智慧移動性。也就是說智慧城市要促進經濟的發展,要改進和幫助更多大眾的參與,讓老百姓享受智慧的生活,人民得到更好的服務,居住環境更加優化。智慧城市的應用很廣泛,我們都知道有物流、交通、電網、工業、農業、建筑、環境、醫療等方面。現在我要講的是,智慧城市本身會催生大數據,我們可以看到一個企業會涉及到很多環境,管理環境,開放環境,知識環境、服務環境,過去這些環境的關聯度不夠,那么現在通過數據庫使得這些環境能夠聯合起來,使得企業的效率提高40%-60%,根據賽門鐵克的一份最新調研報告,今天全世界所有企業的信息存儲總量已達2.2ZB,企業平均10PB,大企業更大點,小企業小點。一般企業都會建立數據庫,必須進行數據的集資和數據的挖掘,企業的數據在企業內部已經占有很重要的位置。 剛剛提到歐盟有幾個標準,在智慧經濟方面,首先大數據在商業上怎么能很好運用,它會分析用戶的購物行為,什么商品搭配在一起會賣得更好,還有很多公司通過分析找到最佳客戶,淘寶數據魔方則是淘寶平臺上的大數據應用方案。那么商家可以了解淘寶平臺上的行業宏觀情況、自己品牌的市場狀況、消費者行為情況等,并可以據此作出經營決策。美國有個投資公司分析了全球3.4億微博賬戶留言,判斷民眾情緒,人們高興的時候會買股票,而焦慮的時候會拋售股票,依此決定公司股票的買入或賣出,該公司今年第一季度獲得7%的收益率。阿里公司根據在淘寶網上中小企業的交易狀況篩選出財務健康和誠信的企業,從而無需擔保來放貸,目前已放貸300多億元,壞帳率僅0.3%,大大低于商業銀行。企業通過信息收集很好的掌握企業的運營狀況,分析居民與財務有關的記錄包括貸款申請、租賃、房地產、購買零售商品、納稅申報、水電費繳付、有線電視繳費、電話繳費、報紙與雜志訂閱、機動車檔案等,能夠得出消費者的個人信用評分,從而推斷客戶支付意向與支付能力,發現潛在的欺詐。IBM日本公司建立了一個經濟指標預測系統,從互聯網新聞中搜索影響制造業的480項經濟數據,計算出采購經理人指數PMI預測值。印第安納大學學者利用Google提供的心情分析工具,對270萬用戶在2008年3~12月所張貼的970萬條留言,挖掘出用戶happiness、kindness、 alertness、sureness、 vitality 和calmness等六種心情,進而對道瓊斯工業指數的變化進行預測,準確率達到87%。利用大數據分析可實現對合理庫存量的管理,華爾街對沖基金依據購物網站顧客評論分析企業產品銷售狀況,華爾街銀行根據求職網站崗位數量推斷就業率。 智慧治理方面,美國紐約的警察分析交通擁堵與犯罪發生地點的關系,有效改進治安。美國紐約的交通部門從交通違規和事故的統計數據中發現規律,改進了道路設計。利用短信、微博、微信和搜索引擎可以收集熱點事件與輿情挖掘。電信運營商擁有大量的手機數據,通過對手機數據的挖掘,不針對個人而是著眼于群體行為,可從中分析:實時動態的流動人口的來源及分布情況;出行和實時交通客流信息及擁塞情況。利用手機用戶身份和位置的檢測可了解突發性事件的聚集情況。MIT的Reality Mining項目,通過對10萬多人手機的通話、短信和空間位置等信息進行處理,提取人們行為的時空規則性和重復性,進行流行病預警和犯罪預測。 倫敦200個交通攝像頭一天就產生8TB,中國的交通哪只200個,可以想象我們產生的數據量比它多得多,另外環境監測對城市的河流進行采樣,通過衛星發布,收集產量的數據,這個數據非常大,通過這個數據分析能夠判別城市中有沒有污染。智慧醫療方面,無論是藥品的研發還是商業模式的開發運用數據分析都能夠得到很好的分析,我們醫院里有大量的病例,這里有大量的數據,傳統的普通病例很難挖掘數據,現在變成電子化有利于更高數據挖掘,數據的挖掘有利于發現醫療知識,由于醫療資源的分配不均,因此遠程醫療十分必要,另外,居家監護很重要,谷歌公司與美國疾病控制和預防中心等機構合作,依據網民搜索內容分析全球范圍內流感等病疫傳播狀況,谷歌的判斷與疾控中心的判斷是一致的。社交網絡為許多慢性病患者提供了臨床癥狀交流和診治經驗分享平臺,醫院借此可獲得足夠多的臨床效果統計。個性化的醫療同樣很重要,我們發現,同樣的治療對一些病人無效,75%癌癥病人,70%的老年癡呆者、50%的關節炎病人、43%的糖尿病患者、40%的哮喘病患者,38%的抑郁癥病人。因為人體對藥品代謝方式的差異取決于個體特定的基因、酶和蛋白質組合,因此基因信息對選擇最優治療非常關鍵。對人體個性體質的挖掘會做到真正意義上的對癥下藥,一個人的基因信息大概1GB。 除此之外,我們還通過網絡進行學習,早期的網絡學習是通過網站專業人員編制的內容,如今我們希望能夠實現更加智能的搜索。隨著移動互聯網的出現,搜索引擎會變成基于語音的智能搜索;基于位置的搜索;基于個性化搜索。大眾傳播發展的很快,這里包含著大量的數據,例如微博傳播具有裂變性、主動性、即時性、便捷性、交互性、草根性,跟進性和臨場感,每一個微博用戶既是"服務器",也是"受眾"。中國的微博比社交網絡更熱,因為140個字符的微博在英文和中為分別約等于25個和85個英語單詞,即中文微博的信息量是Twitter的3~4倍。最近兩個月在YouTube上上載的視頻超過了ABC、 NBC和 CBS 電視臺自1948年以來24/7/365 連續播出的內容,而"云平臺+多屏融合"模式已成為智能家居和智能車載等的發展方向。 大數據挖掘是智慧城市建設與管理的無形生產資料 支撐智慧城市的大數據技術是什么?物聯網不能基于單個事件(單個觀察或傳感器的讀數)來觸發活動。需要利用專家系統和數學模型,綜合異構來源的多種信息,對觀察到的數據進行過濾、匯聚和數據挖掘,參考歷史數據,考慮事件間的相關性和上下文感知,進行分析推理,給出決策。大數據的挑戰,數據管理,數據來自不同地方和不同標準,數據量大小、結構形式、實時性等要求不同,增加采集、編索與整合的困難,需要對傳統的數據傳輸工具ETL(提取、轉換和加載)流程進行重新設計。數據存儲,傳統的集中式數據庫、數據倉庫系統已經不能有效的處理大數據的存儲和分析,需要分布式處理;數據計算,大量的仿真和計算任務必須協調數百個參數,為了處理具有高維特征的圖像等多媒體數據,將高維數據看成位于一個相對低維子流形(局部具有歐氏空間性質的空間)上,利用流形的性質將數據降維后度量與處理。壓縮感知利用"數據是稀疏可壓縮"的先驗知識,使大數據轉換為更有效的"稀疏表達"。數據的呈現需要可視化最終甚至是中間的計算結果,可能需要腦機工程技術,以便組合自動計算(機器)和高級智能獲得更直覺的洞察力。數據分享與訪問控制,安全與隱私保護。 智慧城市有大量的數據,電力、交通、通信、消防、工業等等,這些行業產生了大量的數據,關鍵是能不能共享,我們現在建立了很多垂直系統和應用,我們最大的問題是不能實現共享,這就影響到我們對智慧城市的管理,未來城市本身基礎設施建設比較容易,關鍵是怎么能把這些數據應用起來,所以智慧城市更需要管理者的大智慧。現在很多的智慧城市都和云城市聯系在一起,北京有祥云工程、上海由云海計劃,都是,最后無線城市、數字城市、寬帶城市、感知城市是智慧城市的必要條件;智慧城市是城鎮化進程的下一階段,是城市信息化的新高度,是現代城市發展的愿景;智慧城市每天產生大量的數據,大數據的收集、存儲和分析處理及使用對智慧城市是很大的挑戰,這不僅是技術也是法律和政策需要關注的問題;大數據的挖掘對智慧城市的經濟發展和社會管理是無形的生產資料,大數據價值的合理共享和利用將創造巨大的財富;創新智慧城市的數據管理,從數據管理中打造智慧城市新興產業和服務業! (中國集群通信網 | 責任編輯:陳曉亮) |




