數(shù)據(jù)分析
講師: 瀏覽次數(shù):2537
課程描述INTRODUCTION
數(shù)據(jù)分析公開課
日程安排SCHEDULE
課程大綱Syllabus
數(shù)據(jù)分析公開課
課程大綱:
第一部分、數(shù)據(jù)分析
商業(yè)數(shù)據(jù)分析
數(shù)據(jù)挖掘Road Maps
R、python簡單介紹
數(shù)據(jù)探索
數(shù)據(jù)預處理
構建新的變量
異常值處理
數(shù)據(jù)可視化
數(shù)據(jù)分析應用流程
第二部分、分類方法
回歸分析
相關性
線性回歸與擬合
最小二乘法的幾何解釋
線性回歸中的變量選擇
回歸算法的評估與選擇
KNN 分類器
確定相鄰的樣本數(shù)據(jù)
分類規(guī)則
參數(shù)K的選擇
算法優(yōu)缺點
案例分析:如何選擇相似用戶?
邏輯回歸
邏輯回歸模型
分類算法的評估
案例分析:用戶借貸能力判定
決策樹
迭代分割
純度的計算
決策樹的使用效果
如何避免過擬合
剪枝與終止條件
案例分析:如何利用決策樹的提取出業(yè)務規(guī)則?
(補充)樹模型應用——隨機森林
案例分析:如何幫助業(yè)務方篩選出重要的業(yè)務變量?
第三部分、聚類算法
聚類問題介紹
兩條數(shù)據(jù)之間的距離
歐式距離
數(shù)值型數(shù)據(jù)處理與距離函數(shù)
類別型數(shù)據(jù)的距離計算
混合類型數(shù)據(jù)的距離計算
兩個類別之間的距離
*距離、最小聚類、中心距離
K-means
如何選擇參數(shù)K
層次聚類
案例分析:如何選擇相似用戶?
第四部分、異常檢測
異常值檢測
異常團體識別
案例分析:無監(jiān)督反欺詐方案應用
業(yè)務思考:如何構建一個反欺詐系統(tǒng)?
第五部分、時間序列預測
時間序列回歸模型
預測變量篩選
回歸預測
非線性回歸
相關、因果和預測
時間序列分解
時間序列成分
移動平均
經(jīng)典時間序列分解
ST分解法
趨勢性、季節(jié)性判定
業(yè)務思考:如何對時間序列進行聚類?
分解法預測
時間序列類異常值檢測
業(yè)務思考:如何評估促銷活動效果?
ARIMA模型
平穩(wěn)性和差分
延遲算子
自回歸與移動平均
非季節(jié)性arima
參數(shù)估計與選擇
季節(jié)性arima
高級預測方法
復雜的季節(jié)性
向量自回歸
神經(jīng)網(wǎng)絡
實際預測問題
周數(shù)據(jù)、天粒度數(shù)據(jù)以及小時數(shù)據(jù)預測
預測組合
長序列與短序列預測
訓練集與測試集
缺失值與異常值
案例分享:共享單車Daiy天粒度需求預測
數(shù)據(jù)分析公開課
轉載:http://www.nywlwx.com/gkk_detail/229458.html
已開課時間Have start time
大數(shù)據(jù)課程內(nèi)訓
- 《小紅書運營策劃與執(zhí)行》 黃光偉
- 數(shù)字經(jīng)濟基礎和企業(yè)數(shù)字化轉 盧森煌
- 數(shù)字金融與智能金融下的智慧 盧森煌
- 商業(yè)銀行數(shù)據(jù)治理體系建設實 馬慶
- 企業(yè)區(qū)塊鏈技術的應用場景與 李璐
- 管理者數(shù)據(jù)能力晉級 宋致旸
- 《企業(yè)數(shù)據(jù)管理與數(shù)據(jù)資產(chǎn)化 張光利
- 數(shù)字化轉型與新質(zhì)生產(chǎn)力 盧森煌
- 《零售行業(yè)社群團購運營》 陳蕊
- 大數(shù)據(jù)時代下服務營銷新思維 秦超
- 大數(shù)據(jù)行業(yè)的現(xiàn)狀與熱點 徐全
- 數(shù)字媒體和數(shù)字教學 鐘理勇