
只要學員不放棄,我們
一定管到底
一定管到底
武漢大數(shù)據(jù)分析培訓班,課程培養(yǎng)專門從事數(shù)據(jù)搜集、整理、分析,并依據(jù)數(shù)據(jù)做出行業(yè)研究、評估和預(yù)測的專業(yè)人才,課程內(nèi)容:據(jù)分析入門——數(shù)據(jù)分析的【道】與【術(shù)】、數(shù)據(jù)分析入門——邏輯為先——XMIND、數(shù)據(jù)分析入門——專業(yè)展現(xiàn)——PPT、數(shù)據(jù)分析工具安裝與環(huán)璄配置等等
1、數(shù)據(jù)分析入門
2、數(shù)據(jù)分析的意義
3、數(shù)據(jù)分析的流程控制
4、數(shù)據(jù)分析的思路與方法
數(shù)據(jù)分析入門——邏輯為先——XMIND
1、xmind簡介與基本使用
2、學習方法課堂案例
3、滴答拼車實戰(zhàn)演練
4、其他思維導圖介紹
數(shù)據(jù)分析入門——專業(yè)展現(xiàn)——PPT
1、專業(yè)展現(xiàn)——PPT
2、基本簡介
3、幾個不得不說的真相
4、經(jīng)驗分享
5、實戰(zhàn)動畫
數(shù)據(jù)分析工具安裝與環(huán)璄配置
1、Excel工具的安裝、配置與環(huán)璄測試
2、Power BI工具的安裝、配置與環(huán)璄測試
3、Tableau工具的安裝、配置與環(huán)璄測試
4、MySQL數(shù)據(jù)庫的安裝、配置與環(huán)璄測試
5、SPSS數(shù)據(jù)挖掘工具安裝、配置與環(huán)璄測試
6、SAS數(shù)據(jù)挖掘工具安裝、配置與環(huán)璄測試
7、Python開發(fā)工具的安裝、配置與開發(fā)環(huán)璄測試
Linux基礎(chǔ)應(yīng)用之大數(shù)據(jù)必知必會
1、虛擬機的安裝配置
2、虛擬機網(wǎng)絡(luò)配置
3、安裝Linux
4、利用SSH連結(jié)Linux
5、Linux基礎(chǔ)命令
6、Linux系統(tǒng)管理
數(shù)據(jù)分析的Python語言基礎(chǔ)
1、python課程的目的
2、使用JupyterLab
3、python數(shù)據(jù)類型
4、元組、列表、字典
5、python分支結(jié)構(gòu)
6、python字符串處理+隨機函數(shù)
7、pthon循環(huán)結(jié)構(gòu)
8、python面向過程函數(shù)操作
9、python面向?qū)ο?/p>
數(shù)據(jù)分析項目流程
問題界定
問題拆分
指標確定
數(shù)據(jù)收集
報告方案
趨勢預(yù)測
數(shù)據(jù)分析
趨勢預(yù)測
報告方案
問題的定義
邊界:明確問題的邊界
邏輯:確定業(yè)務(wù)的關(guān)鍵指標和邏輯
定性分析與定量分析
分析問題的模型 基于經(jīng)典的模型-1:5W2H、SWORT、4P管理模型、CATWOE、STAR原則、波士頓5力模型
基于業(yè)務(wù)的模型-2:用戶畫像、銷售影響因素、市場變化因素、AARRR流量模型、金定塔思考方法
數(shù)據(jù)清洗與處理
數(shù)據(jù)科學過程
數(shù)據(jù)清洗定義
數(shù)據(jù)清洗任務(wù)
數(shù)據(jù)清洗流程
數(shù)據(jù)清洗環(huán)境
數(shù)據(jù)清洗實例說明
數(shù)據(jù)標準化
數(shù)據(jù)格式與編碼
數(shù)據(jù)清洗常用工具
數(shù)據(jù)清洗基本技術(shù)方法
數(shù)據(jù)抽取
數(shù)據(jù)轉(zhuǎn)換與加載
內(nèi)部數(shù)據(jù)的獲取
產(chǎn)品數(shù)據(jù)
用戶數(shù)據(jù)
行為數(shù)據(jù)
訂單數(shù)據(jù)
外部公開數(shù)據(jù)
開放網(wǎng)站
政務(wù)公開數(shù)據(jù)
數(shù)據(jù)科學競賽
數(shù)據(jù)交易平臺
行業(yè)報告
指數(shù)平臺
Web網(wǎng)站數(shù)據(jù)抓取
財經(jīng)數(shù)據(jù)抓取
投資數(shù)據(jù)抓取
房產(chǎn)數(shù)據(jù)抓取
輿情數(shù)據(jù)抓取
娛樂數(shù)據(jù)抓取
新媒體數(shù)據(jù)抓取
實戰(zhàn)-1:51job招聘網(wǎng)站數(shù)據(jù)抓取與清洗
實戰(zhàn)-2:鏈家網(wǎng)數(shù)據(jù)的抓取與數(shù)據(jù)清洗
SQL基礎(chǔ)操作
建庫
建表
建約束
創(chuàng)建索引
添加、刪除、修改數(shù)據(jù)
利用SQL完成數(shù)據(jù)的預(yù)處理
缺失值處理:對缺失數(shù)據(jù)行進行刪除或填充
重復值處理:重復值的判斷與刪除
異常值處理:清除不必要的空格和極端、異常數(shù)據(jù)
利用SQL進行業(yè)務(wù)數(shù)據(jù)查詢
利用SQL進行簡單的業(yè)務(wù)數(shù)據(jù)查詢
利用SQL完成復雜條件查詢
利用多表關(guān)聯(lián)完成復雜業(yè)務(wù)查詢
利用嵌套子查詢完成復雜業(yè)務(wù)數(shù)據(jù)分析
高級SQL分析
聚合、分組、排序
函數(shù)
行列切換
視圖與存儲過程
業(yè)務(wù)指標統(tǒng)計分析
業(yè)務(wù)數(shù)據(jù)表關(guān)聯(lián)查詢及查詢
結(jié)果縱向融合
?常業(yè)務(wù)需求數(shù)據(jù)寬表構(gòu)建
應(yīng)??查詢處理復雜業(yè)務(wù)
數(shù)據(jù)分析的統(tǒng)計學基礎(chǔ)
基本統(tǒng)計量-1:均值、中位數(shù)、眾數(shù)、異常值 .......
概率論基礎(chǔ)-2:獨立事件、條件概率、全概率公式、貝葉斯定律 ......
數(shù)據(jù)分布-3:幾何分布、正態(tài)分布、二項分布、泊松分布.....
統(tǒng)計抽樣
置信區(qū)間
假設(shè)檢驗
數(shù)據(jù)分析的數(shù)學基礎(chǔ)
極限的計算和連續(xù)函數(shù)的性質(zhì)
導數(shù)/微分的概念和運算法則
積分的概念和運算法則
冪級數(shù)、泰勒級數(shù)、傅里葉級數(shù)、傅里葉變換
向量的概念和運算
矩陣的轉(zhuǎn)置、乘法、逆矩陣、正交矩陣、SVD奇異值分解、特征值
行列式的計算和性質(zhì)
凸優(yōu)化
基于Numpy庫的Python數(shù)據(jù)科學計算
創(chuàng)建數(shù)組
切片索引
數(shù)組操作
字符串函數(shù)
數(shù)學函數(shù)
統(tǒng)計函數(shù)
......
案例-1:Numpy在金融領(lǐng)域中的分析應(yīng)用
案例-2:基于Numpy的股價統(tǒng)計分析應(yīng)用
基于Pandas庫的Python數(shù)據(jù)處理與分析
利用Pandas重成數(shù)據(jù)表
利用Pandas進行數(shù)據(jù)查看
Pandas數(shù)據(jù)清洗
基于Pandas的數(shù)據(jù)預(yù)處理:數(shù)據(jù)表合并、數(shù)據(jù)表拆分與排序
利用Pandas進行數(shù)據(jù)提取
Pandas數(shù)據(jù)統(tǒng)計
......
案例-1:抖音用戶行為分析
案例-2:淘寶天貓樂高的全國銷售情況分析
利用Matplotlib/Seaborn/pyechart進行Python數(shù)據(jù)可視化
直方圖:探索變量的分布規(guī)律
條形圖:展示數(shù)值變量的集中趨勢
散點圖:表示整體數(shù)據(jù)的分布規(guī)律
箱線圖:表示數(shù)據(jù)分散性,極值,中位數(shù)
提琴圖:分位數(shù)的位置及數(shù)據(jù)密度
回歸圖:尋找數(shù)據(jù)之間的線性關(guān)系
熱力圖:表未數(shù)值的大小或者相關(guān)性的高低
案例-1:抖音用戶行為可視化分析
案例-2:淘寶天貓樂高的全國銷售情況可視化分析
實戰(zhàn)-1:基于Python實現(xiàn)的鏈家網(wǎng)業(yè)務(wù)數(shù)據(jù)分析
實戰(zhàn)-2:基于Python實現(xiàn)的51JOB簡歷分析
HIVE大數(shù)據(jù)查詢平臺搭建 大數(shù)據(jù)概述
?數(shù)據(jù)集群 Hadoop 架構(gòu)
Hive開發(fā)環(huán)璄搭建
HIVE與MySQL進行數(shù)據(jù)交換
從MySQL中導入數(shù)據(jù)到Hive
從Hive導出數(shù)據(jù)到MySQL
HQL 海量業(yè)務(wù)數(shù)據(jù)需求查詢
Hive數(shù)倉
HQL 數(shù)據(jù)查詢基礎(chǔ)語法
HQL 海量業(yè)務(wù)數(shù)據(jù)需求查詢
從MySQL中導入數(shù)據(jù)到Hive
從Hive導出數(shù)據(jù)到MySQL
HQL 業(yè)務(wù)數(shù)據(jù)指標統(tǒng)計分析
分區(qū)表
分桶表
關(guān)聯(lián)表
數(shù)據(jù)查詢
HQL 海量數(shù)據(jù)查詢優(yōu)化
常?內(nèi)置函數(shù)及開窗函數(shù)
特殊類型數(shù)組查詢?式
HQL 查詢語句優(yōu)化技巧
實戰(zhàn)-1:基于Hive的電商日志點擊流量分析案例
實戰(zhàn)-2:基于Hive的企業(yè)員工行為大數(shù)據(jù)分析
數(shù)據(jù)挖掘與分析算法
描述統(tǒng)計
相關(guān)分析
判別分析
方差分析
時間序列分析
主成分分析
信度分析
因子分析
回歸分析
對應(yīng)分析
列聯(lián)表分析
聚類分析
數(shù)據(jù)挖掘工具——SPSS
課程規(guī)劃與簡介
數(shù)據(jù)挖掘項目生命周期
簡單必備的統(tǒng)計學基礎(chǔ)
用Modeler試手挖掘流程
數(shù)據(jù)挖掘的知識類型
商業(yè)分析基礎(chǔ)簡介
回歸模型
決策樹模型
支持向量機
聚類模型
關(guān)聯(lián)規(guī)則
數(shù)據(jù)挖掘工具——SAS SAS概述:SAS簡介與教育版安裝
SAS概述:教育版基本使用
SAS編程基礎(chǔ)
SAS編程基礎(chǔ)7-循環(huán)
SAS數(shù)據(jù)集操作1-合并
SAS數(shù)據(jù)集操作2-排序與對比
SAS數(shù)據(jù)集操作3-查重與篩選
練習-斐波那契數(shù)列
練習-百元百雞問題
實戰(zhàn):證券業(yè)市場績效與市場結(jié)構(gòu)關(guān)系的實證分析
人工智能:實戰(zhàn)十大預(yù)測數(shù)據(jù)算法
機器學習入門
sk-learn機器學習庫
十大預(yù)測算法原理與使用場景
算法調(diào)用、參數(shù)設(shè)置
特征選擇、特征工程
回歸預(yù)測模型實戰(zhàn)
分類預(yù)測試模型實戰(zhàn)
聚類模型實戰(zhàn)
集成學習
模型優(yōu)化
數(shù)據(jù)可視化的概念
數(shù)據(jù)可視化的意義
數(shù)據(jù)可視化的對比
數(shù)據(jù)可視化的分類
數(shù)據(jù)可視化圖表舉例
數(shù)據(jù)可視化應(yīng)用領(lǐng)域
數(shù)據(jù)可視化步驟
數(shù)據(jù)可視化工具梯度
圖標呈現(xiàn)流程
數(shù)據(jù)報告撰寫
資深教育專家
中科大計算機專業(yè),工信部大數(shù)據(jù)專家評委,十年技術(shù)開發(fā)經(jīng)驗,十年教學管理經(jīng)驗,中國最早的一批在線教育踐行者。近些年專注于大數(shù)據(jù)、人工智能及區(qū)塊鏈等方面的研究與落地教學實踐工作。長期與企業(yè)一線技術(shù)總監(jiān)、項目經(jīng)理,互聯(lián)網(wǎng)企業(yè)接觸合作進行課程聯(lián)合研制,產(chǎn)品的落地實踐工作,對技術(shù)、架構(gòu)和教育與商業(yè)有極深的理解和敏銳洞察力。
博為峰,中國職業(yè)人才培訓領(lǐng)域的先行者,隸屬于上海博為峰軟件技術(shù)股份有限公司(股票代碼:836392,2020年4月入選新三板創(chuàng)新層)。 公司總部位于上海,在北京、深圳、廣州、成都、南京、西安、武漢、杭州、重慶、濟南、合肥、蘇州、長沙、南昌、石家莊、濟南、鄭州、昆山等地均設(shè)有分支服務(wù)機構(gòu)。十數(shù)年來,博為峰始終堅守教學品質(zhì),真誠服務(wù)學員,發(fā)展至今,每年畢業(yè)學員10000+,就業(yè)率長期保持在99%以上。博為峰已先后為7000多家國內(nèi)外 企業(yè)輸送軟件技術(shù)精英,未來還將根據(jù)產(chǎn)業(yè)變遷和技術(shù)革新開設(shè)更多的緊缺人才實訓項目:幫助更多的應(yīng)屆畢業(yè)生和職場新人找到滿意工作,實現(xiàn)職業(yè)夢想;幫助更多 的用人單位輕松招到可用之才,推動企業(yè)發(fā)展和產(chǎn)業(yè)進步。孵化出國內(nèi)最 大的軟件測試品牌、社區(qū)-51testing,是中國軟件測試人才的搖籃。博為峰累計已畢業(yè)50000+學員,開班上千期,就業(yè)率99%以上,學員入職7000多家企業(yè),為1000+家企業(yè)提供服務(wù),舉辦90場公益沙龍,出版16本叢書,發(fā)型電子雜志57期,網(wǎng)站注冊會員金百萬。
70000+學員入職7000+國內(nèi)外企業(yè)