課程描述INTRODUCTION
大數(shù)據(jù) 人工智能
· 技術(shù)總監(jiān)· 儲備干部· 一線員工· IT人士· 其他人員
日程安排SCHEDULE
課程大綱Syllabus
(一)統(tǒng)計分析、數(shù)據(jù)倉庫與可視化表達(dá)
1、 綜述(大數(shù)據(jù)、人工智能、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí):這些詞的確切含義)
2、 假設(shè)檢驗:“小數(shù)據(jù)”時代是怎么玩的?
3、 “回歸”是數(shù)據(jù)挖掘算法嗎?
4、 度量、指標(biāo)與維度
5、 星型模型與雪花模型
6、 下鉆與上卷
7、 數(shù)據(jù)倉庫的應(yīng)用案例
8、 圖表該怎么畫才對?
(二)大數(shù)據(jù)相關(guān)技術(shù)綜述
1、 hadoop:HDFS、Map-Reduce、Hbase、Hive、sqoop、pig、oozie等
2、 spark:scala、spark-SQL、spark-Streaming等
3、 搜索引擎:lucene(solr)、ES
4、 并發(fā)的機(jī)器學(xué)習(xí)工具:R-hadoop、spark-MLLIB、 spark-R、pyspark
(三)存儲在hbase中的數(shù)據(jù)
1、 NoSQL(key-value)
2、 Hbase:安裝
3、 行鍵與列簇
4、 如何利用Hbase的特點存儲行業(yè)數(shù)據(jù)
5、 應(yīng)用程序如何訪問Hbase中的數(shù)據(jù)
6、 數(shù)據(jù)遷移工具:sqoop
7、 Hbase的應(yīng)用場景
(四)Hive:為SQL開發(fā)者留的活路
1、 Hive:安裝(單用戶與多用戶)
2、 Hive:基本操作
3、 Hive:與典型的關(guān)系型數(shù)據(jù)庫的區(qū)別
4、 存儲業(yè)務(wù)數(shù)據(jù)時的注意點
5、 如果“想慢”,你還可以這樣…(不恰當(dāng)使用hive的案例介紹)
6、 Hive的應(yīng)用場景
(六)Spark各組件的應(yīng)用
1、 Hadoop*的特點是什么?
2、 Spark概述與安裝
3、 Scala:你可以一直“點”下去
4、 RDD:“映射”、“轉(zhuǎn)換”解決一切
5、 spark-SQL
6、 spark-streaming
7、 spark-graphX
8、 spark-MLLIB
9、 應(yīng)用場景
(七)機(jī)器學(xué)習(xí)-1
1、 數(shù)據(jù)挖掘、知識發(fā)現(xiàn)與機(jī)器學(xué)習(xí)
2、 工具:(早期)SPSS、SAS;
3、 目前流行的工具R、Python等
4、 決策樹(熵、貪心法、連續(xù)的和離散的)
5、 聚類(k-means、k-medoid)
6、 監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)的差異
7、 機(jī)器學(xué)習(xí)性能評價指標(biāo)
(八)機(jī)器學(xué)習(xí)-2
1、 KNN
2、 關(guān)聯(lián)規(guī)則(頻繁項集、Apriori、支持度、置信度、提升度)
3、 神經(jīng)網(wǎng)絡(luò)(神經(jīng)元、激勵函數(shù)、前饋神經(jīng)網(wǎng)絡(luò)的BP算法)
4、 SVM(*間隔、核函數(shù)、多分類的支持向量機(jī))
(九)機(jī)器學(xué)習(xí)-3
1、 “概率派”與“貝葉斯派”
2、 樸素貝葉斯模型(皮馬印第安人患糖尿病風(fēng)險預(yù)測)
3、 極大似然估計與EM算法
4、 HMM(三個基本問題:評估、解碼、學(xué)習(xí))
(十)機(jī)器學(xué)習(xí)-4
1、 遺傳算法 (交叉、選擇、變異,“同宿舍”問題)
2、 無監(jiān)督學(xué)習(xí)
3、 集成學(xué)習(xí)(adaboost、RF)
4、 強(qiáng)化學(xué)習(xí)
(十一)深度學(xué)習(xí)-1
1、 連接主義的興衰
2、 地形要更陡:改進(jìn)的目標(biāo)函數(shù)
3、 0.9的100次方等于幾?克服梯度消散的方法(改進(jìn)的激勵函數(shù)、BN)
4、 利用“慣性”下山:改進(jìn)的優(yōu)化算法(Adagrad、RMSprop、Adam)
5、 防止“大鍋飯”:dropout
6、 記憶的關(guān)鍵是“合理的忘記”:weight decay
(十二)深度學(xué)習(xí)-2
1、 讓AI理解圖像:典型CNN
2、 各種CNN
3、 讓AI理解語言:RNN與LSTM、GRU
4、 左右互搏術(shù):GAN
5、 電子游戲的新玩法:DQN
轉(zhuǎn)載:http://www.nywlwx.com/gkk_detail/65025.html
已開課時間Have start time
- 葉梓