課程描述INTRODUCTION
Python語(yǔ)言與數(shù)據(jù)挖掘
日程安排SCHEDULE
課程大綱Syllabus
Python語(yǔ)言與數(shù)據(jù)挖掘
對(duì)象
大數(shù)據(jù)系統(tǒng)開(kāi)發(fā)部、大數(shù)據(jù)分析中心、業(yè)務(wù)支撐部、IT系統(tǒng)部等相關(guān)技術(shù)人員。
目的
掌握Python語(yǔ)言,以及在數(shù)據(jù)挖掘中的應(yīng)用
內(nèi)容
Python是一門(mén)解釋性語(yǔ)言,僅次于JAVA/C/C++/C#*的語(yǔ)言,可應(yīng)用在大數(shù)據(jù)語(yǔ)言。易學(xué),易懂,功能強(qiáng)大。其中有著大量的擴(kuò)展庫(kù)來(lái)實(shí)現(xiàn)數(shù)據(jù)分析與數(shù)據(jù)挖掘功能。
第一部分:Python語(yǔ)言基礎(chǔ)
目的:掌握基本的Python編程思想與編程語(yǔ)句,熟悉常用數(shù)據(jù)結(jié)構(gòu)的操作
1、Python簡(jiǎn)介
2、開(kāi)發(fā)環(huán)境搭建
Python的安裝
擴(kuò)展庫(kù)的安裝
3、掌握Python的簡(jiǎn)單數(shù)據(jù)類(lèi)型
字符串的使用及操作
整數(shù)、浮點(diǎn)數(shù)
4、掌握基本語(yǔ)句:
if、while、for、print等
基本運(yùn)算:
函數(shù)定義、參數(shù)傳遞、返回值
5、掌握復(fù)雜的數(shù)據(jù)類(lèi)型:列表/元組
列表操作:訪(fǎng)問(wèn)、添加、修改、刪除、排序
列表切片、復(fù)制等
列表相關(guān)的函數(shù)、方法
元組的應(yīng)用
6、復(fù)雜數(shù)據(jù)類(lèi)型:字典
創(chuàng)建、訪(fǎng)問(wèn)、修改、刪除、遍歷
字典函數(shù)和方法
7、復(fù)雜數(shù)據(jù)類(lèi)型:集合
8、掌握面向?qū)ο缶幊趟枷?br />
創(chuàng)建類(lèi)、繼承類(lèi)
模塊
9、函數(shù)定義、參數(shù)傳遞、返回值
10、 標(biāo)準(zhǔn)庫(kù)與擴(kuò)展庫(kù)的導(dǎo)入
11、 異常處理:try-except塊
演練:基本的Python編程語(yǔ)句
第二部分:Python語(yǔ)言與數(shù)據(jù)挖掘庫(kù)
目的:掌握數(shù)據(jù)集結(jié)構(gòu)及基本處理方法,進(jìn)一步鞏固Python語(yǔ)言
1、數(shù)據(jù)挖掘常用擴(kuò)展庫(kù)介紹
Numpy數(shù)組處理支持
Scipy矩陣計(jì)算模塊
Matplotlib數(shù)據(jù)可視化工具庫(kù)
Pandas數(shù)據(jù)分析和探索工具
StatsModels統(tǒng)計(jì)建模庫(kù)
Scikit-Learn機(jī)器學(xué)習(xí)庫(kù)
Keras深度學(xué)習(xí)(神經(jīng)網(wǎng)絡(luò))庫(kù)
Gensim文本挖掘庫(kù)
2、數(shù)據(jù)集讀取與操作:讀取、寫(xiě)入
讀寫(xiě)文本文件
讀寫(xiě)CSV文件
讀寫(xiě)Excel文件
從數(shù)據(jù)庫(kù)獲取數(shù)據(jù)集
3、數(shù)據(jù)集的核心數(shù)據(jù)結(jié)構(gòu)(Pandas數(shù)據(jù)結(jié)構(gòu))
Dataframe對(duì)象及處理方法
Series對(duì)象及處理方法
演練:用Python實(shí)現(xiàn)數(shù)據(jù)的基本統(tǒng)計(jì)分析功能
第三部分:數(shù)據(jù)可視化處理
目的:掌握作圖擴(kuò)展庫(kù),實(shí)現(xiàn)數(shù)據(jù)可視化
1、常用的Python作圖庫(kù)
Matplotlib庫(kù)
Pygal庫(kù)
2、實(shí)現(xiàn)分類(lèi)匯總
演練:按性別統(tǒng)計(jì)用戶(hù)人數(shù)
演練:按產(chǎn)品+日期統(tǒng)計(jì)各產(chǎn)品銷(xiāo)售金額
3、各種圖形的畫(huà)法
直方圖
餅圖
折線(xiàn)圖
散點(diǎn)圖
4、繪圖的美化技巧
演練:用Python庫(kù)作圖來(lái)實(shí)現(xiàn)產(chǎn)品銷(xiāo)量分析,并可視化
第四部分:數(shù)據(jù)挖掘基礎(chǔ)
目的:掌握數(shù)據(jù)挖掘標(biāo)準(zhǔn)流程
1、數(shù)據(jù)挖掘概述
2、數(shù)據(jù)挖掘的標(biāo)準(zhǔn)流程(CRISP-DM)
商業(yè)理解
數(shù)據(jù)準(zhǔn)備
數(shù)據(jù)理解
模型建立
模型評(píng)估
模型應(yīng)用
3、數(shù)據(jù)挖掘常用任務(wù)與算法
案例:用大數(shù)據(jù)實(shí)現(xiàn)精準(zhǔn)營(yíng)銷(xiāo)的項(xiàng)目過(guò)程
第五部分:數(shù)據(jù)理解和數(shù)據(jù)準(zhǔn)備
目的:掌握數(shù)據(jù)預(yù)處理的基本環(huán)節(jié),以及Python的實(shí)現(xiàn)
1、數(shù)據(jù)預(yù)處理
異常值處理:3σ準(zhǔn)則,IQR準(zhǔn)則
缺失值插補(bǔ):均值、拉格朗日插補(bǔ)
數(shù)據(jù)篩選/抽樣
數(shù)據(jù)的離散化處理
變量變換、變量派生
2、數(shù)據(jù)的基本分析
相關(guān)分析:原理、公式、應(yīng)用
方差分析:原理、公式、應(yīng)用
卡方分析:原理、公式、應(yīng)用
主成分分析:降維
案例:用Python實(shí)現(xiàn)數(shù)據(jù)預(yù)處理及數(shù)據(jù)準(zhǔn)備
第六部分:分類(lèi)預(yù)測(cè)模型實(shí)戰(zhàn)
1、常見(jiàn)分類(lèi)預(yù)測(cè)的模型與算法
2、如何評(píng)估分類(lèi)預(yù)測(cè)模型的質(zhì)量
查準(zhǔn)率
查全率
ROC曲線(xiàn)
3、邏輯回歸分析模型
邏輯回歸的原理
邏輯回歸建模的步驟
邏輯回歸結(jié)果解讀
案例:用sklearn庫(kù)實(shí)現(xiàn)銀行貸款違約預(yù)測(cè)
4、決策樹(shù)模型
決策樹(shù)分類(lèi)的原理
決策樹(shù)的三個(gè)關(guān)鍵問(wèn)題
決策樹(shù)算法與實(shí)現(xiàn)
案例:電力竊漏用戶(hù)自動(dòng)識(shí)別
5、人工神經(jīng)網(wǎng)絡(luò)模型(ANN)
神經(jīng)網(wǎng)絡(luò)概述
神經(jīng)元工作原理
常見(jiàn)神經(jīng)網(wǎng)絡(luò)算法(BP、LM、RBF、FNN等)
案例:神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)產(chǎn)品銷(xiāo)量
6、支持向量機(jī)(SVM)
SVM基本原理
維災(zāi)難與核心函數(shù)
案例:基于水質(zhì)圖像的水質(zhì)評(píng)價(jià)
7、貝葉斯分析
條件概率
常見(jiàn)貝葉斯網(wǎng)絡(luò)
第七部分:數(shù)值預(yù)測(cè)模型實(shí)戰(zhàn)
1、常用數(shù)值預(yù)測(cè)的模型
通用預(yù)測(cè)模型:回歸模型
季節(jié)性預(yù)測(cè)模型:相加、相乘模型
新產(chǎn)品預(yù)測(cè)模型:珀?duì)柷€(xiàn)與龔鉑茲曲線(xiàn)
2、回歸分析概念
3、常見(jiàn)回歸分析類(lèi)別
第八部分:聚類(lèi)分析(客戶(hù)細(xì)分)實(shí)戰(zhàn)
1、客戶(hù)細(xì)分常用方法
2、聚類(lèi)分析(Clustering)
聚類(lèi)方法原理介紹及適用場(chǎng)景
常用聚類(lèi)分析算法
聚類(lèi)算法的評(píng)價(jià)
案例:使用SKLearn實(shí)現(xiàn)K均值聚類(lèi)
案例:使用TSNE實(shí)現(xiàn)聚類(lèi)可視化
3、RFM模型分析
RFM模型,更深入了解你的客戶(hù)價(jià)值
RFM模型與市場(chǎng)策略
案例:航空公司客戶(hù)價(jià)值分析
第九部分:關(guān)聯(lián)規(guī)則分析實(shí)戰(zhàn)
1、關(guān)聯(lián)規(guī)則概述
2、常用關(guān)聯(lián)規(guī)則算法
3、時(shí)間序列分析
案例:使用apriori庫(kù)實(shí)現(xiàn)關(guān)聯(lián)分析
案例:中醫(yī)證型關(guān)聯(lián)規(guī)則挖掘
第十部分:案例實(shí)戰(zhàn)(學(xué)員主導(dǎo),老師現(xiàn)場(chǎng)指導(dǎo))
1、實(shí)戰(zhàn)1:電商用戶(hù)行為分析及服務(wù)推薦
2、實(shí)戰(zhàn)2:基于基站定位數(shù)據(jù)的商圈分析
結(jié)束:課程總結(jié)與問(wèn)題答疑。
Python語(yǔ)言與數(shù)據(jù)挖掘
轉(zhuǎn)載:http://yniwn.cn/gkk_detail/257452.html
已開(kāi)課時(shí)間Have start time
- 張曉誠(chéng)
IT相關(guān)內(nèi)訓(xùn)
- 6G技術(shù)與發(fā)展趨勢(shì) 楓影
- 業(yè)務(wù)與IT融合創(chuàng)新的方法與 李福東
- 數(shù)據(jù)庫(kù)基礎(chǔ)及實(shí)操(MySQ 郭振杰
- 前沿信息技術(shù)解析與應(yīng)用創(chuàng)新 張世民
- IPA應(yīng)用實(shí)戰(zhàn) 郭振杰
- 金融科技賦能業(yè)務(wù) 李福東
- Python基礎(chǔ)與基礎(chǔ)應(yīng)用 郭振杰
- Java微服務(wù)開(kāi)發(fā) 郭振杰
- 自智網(wǎng)絡(luò) 楓影
- SQL語(yǔ)句基礎(chǔ)使用 郭振杰
- Java企業(yè)級(jí)后臺(tái)開(kāi)發(fā) 郭振杰
- Mysql基礎(chǔ)使用 郭振杰