四人麻将|上海四人麻将单机版
首頁 > 大數據 > 正文

大數據分析及其建模應用

2019-08-01 17:45:39  來源:今日頭條

摘要:在數字經濟時代,互聯網、物聯網、5G、大數據、智慧城市等各類形式的信息技術呈爆炸式增長,使得數據以令人難以想象的速度不斷增長,企業經營的各個階段都可以被記錄下來,產品銷售的各個環節也被記錄下來,客戶的消費行為和網上行為,智能設備的信息都被采集下來。
關鍵詞: 大數據
  在數字經濟時代,互聯網、物聯網、5G、大數據、智慧城市等各類形式的信息技術呈爆炸式增長,使得數據以令人難以想象的速度不斷增長,企業經營的各個階段都可以被記錄下來,產品銷售的各個環節也被記錄下來,客戶的消費行為和網上行為,智能設備的信息都被采集下來。數據已成為一種重要的生產要素,通過對數據的收集、存儲、再組織和分析建模,隱藏在數據中的重要價值及規律被客觀的挖掘展現出來,成為企業和社會升級及可持續發展的重要推動力量。而然這些技術應用的發展,基礎是數據治理和大數據分析建模,大數據分析建模也成為了大數據應用的核心和關鍵環節,也成為科技界和企業界關注的熱點話題。如何進行大數據的建模分析呢,本文帶領大家,了解大數據分析建模的思路。
\
 
  大數據分析建模的背景
 
  隨著企業信息化的逐步深入,大量信息系統在企業中廣泛應用,物聯網、云計算、工業互聯網等技術與企業經營生產緊密結合,設備運行、生產加工、測試試驗等數據采集過程更加自動化,企業積累了大量的數據,包括產品銷售數據、客戶消費數據、客戶行為數據、企業運營數據等,企業經營生產的各個階段都可以被記錄下來,產品銷售的各個環節也被記錄下來,客戶的消費行為和網上行為都被采集下來,這些數據隱藏著大量的有價值的規律和信息,是企業的重要資產。
 
  另一方面,傳統的數據報表、即席查詢等簡單分析手段已無法滿足企業對于深層次信息的挖掘需求,大數據融合、大數據分析、大數據挖掘等技術不斷發展,漏斗分析、事件分析、行為分析、留存分析、屬性分析等模型不斷完善,神經網絡、決策樹、關聯規則等挖掘算法不斷成熟,基于Hadoop、HDFS的分布式存儲技術以及基于Storm、Spark、MapReduce等分布式計算技術迅猛發展,為大數據分析處理及分析建模提供了堅實的技術支撐。
 
  大數據分析建模步驟
 
  企業開展大數據分析,首先應開展業務調研和數據調研工作,明確分析需求,其次應開展數據準備工作,即選擇數據源、進行數據抽樣選擇、數據類型選擇、缺失值處理、異常值檢測和處理、數據標準化、數據簇分類、變量選擇等,再次應進行數據處理工作,即進行數據采集、數據清洗、數據轉換等工作,最后開展數據分析建模及展現工作。大數據分析建模需要進行5個步驟,即選擇模型、訓練模型、評估模型、應用模型、優化模型結構。
 
  選擇模型----訓練模型-----評估模型----應用模型----優化模型
 
  ·選擇分析模型:基于收集到的業務需求、數據需求等信息,研究決定選擇具體的模型,如行為事件分析、漏斗分析、留存分析、分布分析、點擊分析、用戶行為分析、分群分析、屬性分析等模型,以便更好地切合具體的應用場景和分析需求。
 
  ·訓練分析模型:每個數據分析模型的模式基本是固定的,但其中存在一些不確定的參數變量或要素在里面,通過其中的變量或要素適應變化多端的應用需求,這樣模型才會有通用性。企業需要通過訓練模型找到最合適的參數或變量要素,并基于真實的業務數據來確定最合適的模型參數。
 
  ·評估分析模型:需要將具體的數據分析模型放在其特定的業務應用場景下(如物資采購、產品銷售、生產制造等)對數據分析模型進行評估,評價模型質量的常用指標包括平均誤差率、判定系數,評估分類預測模型質量的常用指標包括正確率、查全率、查準率、ROC曲線和AUC值等。
 
  ·應用分析模型:對數據分析模型評估測量完成后,需要將此模型應用于業務基礎的實踐中去,從分布式數據倉庫中加載主數據、主題數據等,通過數據展現等方式將各類結構化和非結構化數據中隱含的信息顯示出來,用于解決工作中的業務問題的,比如預測客戶行為、科學劃分客戶群等。
 
  ·優化分析模型:企業在評估數據分析模型中,如果發現模型欠擬合或過擬合,說明這個模型有待優化;在真實應用場景中,定期進行優化,或者當發現模型在真實的業務場景中效果不好時,也要啟動優化,具體優化的措施可考慮重新選擇模型、調整模型參數、增加變量因子等。
 
  大數據分析建模建議
 
  數據分析建模是企業大數據應用的重要基礎,通過建模不僅有效地組織了原始數據,而且為數據展現提供了重要支撐,企業在開展數據分析建模過程中應注意以下幾點:
 
  1. 重視需求牽引作用,深化業務問題解決
 
  企業應結合業務發展目標,梳理經營生產過程中的瓶頸問題,以問題為導向,重視業務需求調研工作,清理業務流程和業務數據,研究數據來源、采集通道和映射關系,深入梳理數據基礎,不斷推進業務問題的解決并構建合理的業務架構。
 
  2. 加大數據積累力度,夯實數據體系基礎
 
  企業應深化信息系統應用,提升業務流程和業務數據上線力度,深化物聯網、云計算等新興技術應用,提高數據采集效率,豐富數據積累力度;完善主數據、主題數據、數據建模等標準規范,構建包含業務、指標、報表等的數據體系,夯實數據體系基礎。
 
  3. 加大人員隊伍建設,提高技術支撐能力
 
  大數據分析建模是數據到信息轉變的重要支撐,也是凸顯數據價值實現的重要環節,企業應加強業務需求調研與業務架構優化,夯實數據基礎和應用基礎,不斷選擇、訓練、評估、應用和優化模型,不斷推進大數據分析建模的應用,為轉型升級奠定堅實基礎。
 
  企業應加大技術專家、業務專家、數據分析師、數據管理員、運營專家等專業人員的培養,調動業務部門參與數據分析的積極性和主動性。同時加大數據分析、數據建模、數據挖掘技術儲備、技術工具庫和模型庫建設,提高技術支撐能力。

第二十九屆CIO班招生
法國布雷斯特商學院MBA班招生
法國布雷斯特商學院碩士班招生
法國布雷斯特商學院DBA班招生
責編:yangjl