零基礎數據分析與挖掘R語言實戰課程(R語言)
  完畢
收藏課程
9999+

零基礎數據分析與挖掘R語言實戰課程(R語言)

本課程面向從未接觸過數據分析的學員,從基礎的R語法開始講起,逐步進入到目前各行業流行的各種分析模型。整個課程分為基礎和實戰兩個單元。

適合人群:初級
課時數量:20課時
用到技術:數據清洗、數據歸約、一元線性回歸、多元線性回歸、多項式回歸、層次聚類、k-means聚類、主成分分析、因子分析、逐步回歸、關聯規則、購物車分析、ID3、C4.5、CART模型
涉及項目:廣告費和銷量提升關系分析、用戶細分、有上百個屬性的數據的簡化、高風險貸款識別、購物車分析

  • 課程顧問貼心解答

    為你推薦精品課程,無論就業還是升職加薪,毫無壓力。

  • 名企定制緊隨大流

    量身打造緊貼企業需求的實用性課程。

  • 系統教學把控效果

    集學、測、練為一體的學習系統為你科學的安排學習進度,提高效率。

  • 一線大師1對1指導

    課程研發團隊內一線資深講師一對一指導,手把手教學,直到學會。

  • 點播答疑完美結合

    每周2-3次直播解答,保證學員日常學習問題能得到解決。

  • 量身定制學習計劃

    告別雜亂的學習方式,我們會根據你的情況定制學習計劃。

 

隨著大數據在各行業的落地生根和蓬勃發展,能從數據中挖金子的數據分析人員越來越寶貝,于是很多的程序員都想轉行到數據分析,挖掘技術哪家強?當然是R語言了,R語言的火熱程度,從TIOBE上編程語言排名情況可見一斑。于是善于學習的程序員們開始了R語言的學習之旅。對于有其他語言背景的程序員來說,學習R的語法小菜一碟,因為它的語法的確太簡了,甚至有的同學說1周就能掌握R語言,的確如此。但是之后呢?……好像進行不下去了!死記硬背記住了兩個分析模型卻不明其意,輸出結果如同天書不會解讀,各種參數全部使用缺省值,任何調整都是戰戰兢兢、如履薄冰…

 

在大數據的生態系統中,很多技能是可以自學的,唯有數據分析是個異數,因為它要求一定的數學知識,比如高等數學、線性代數、概率統計學。而對于大多數同學來說,這些知識都是面目可憎的。

 

講師本人之前和大部分同學都有著同樣的經歷,曾經做過開發、運維、管理,后因緣際會接觸到數據分析行業并對此情有獨鐘,在十余年的工作、學習過程中經歷過各種折磨并有了一定積累。最清楚真正用得著的知識是哪些、學員最喜歡的講解風格是什么樣的,對于有志于從事數據分析的同學來說,相信此視頻能幫助你們快速跨過數據分析的門檻,預祝每位學員都能成為數據挖掘的行家里手。

 

 

1。課程研發環境 

開發環境:R3.2 

IDE:RStudio

    

2.內容簡介

本課程面向從未接觸過數據分析的學員,從最基礎的R語法開始講起,逐步進入到目前各行業流行的各種分析模型。整個課程分為基礎和實戰兩個單元。

基礎部分包括R語法和統計思維兩個主題,R語法單元會介紹R語言中的各種特色數據結構,以及如何從外部抓去數據,如何使用包和函數,幫助同學快速通過語法關。統計思維單元會指導如何用統計學的思想快速的發現數據特點或者模式,并利用R強大的繪圖能力做可視化展現。

在實戰部分選擇了回歸、聚類、數據降維、關聯規則、決策樹這5中最基礎的數據分析模型,詳細介紹其思想原理,并通過案例講解R中的實現方案,尤其是詳細的介紹了對各種參數和輸出結果的解讀,讓學員真正達到融會貫通、舉一反三的效果。并應用到自己的工作環境中。

 

 

大圣,16年IT工作經驗,10年的數據分析經驗,曾就職阿里巴巴、雅虎,現為大數據獨立顧問、北風網兼職講師。

擅長技術:Hadoop、Oracle、R、Linux等。

 

 

一、R語法詳解:

第一講:R的核心數據結構之向量、因子的區別和使用技巧

第二講:R的核心數據結構之矩陣、數據框、數組、列表的區別和使用技巧

第三講:R的控制結構(包括分支結構和循環結構)、函數和包、以及向量化計算

 

二、數據組織和整理:

第四講:數據導入,從多種數據源導入數據

第五講:數據預處理之缺失值的處理

第六講:數據預處理之數據轉換,數據篩選

 

三、建立數據分析的統計思維和可視化探索:

第七講:單變量數據特點的描述方法

第八講:多變量數據特點的描述方法

第九講:借助分組發現數據中的模式

第十講:數據可視化建立對數據的感性認識

 

四、用回歸預測未來:

第十一講:線性回歸的思想,代碼、結果的詳細解讀;

第十二講:多項式回歸、多元線性回歸

 

五、聚類方法:

第十三講:層次聚類和k-means聚類方法

 

六、數據降維——主成分分析和因子分析:

第十四講:維度過多會導致哪些問題

第十五講:用逐步回歸法篩除無用變量

第十六講:用主成分分析法解決多重共線性問題

第十七講:用因子分析法獲得有業務意義的變量

 

七、關聯規則:

第十八講:用關聯規則做購物車分析

 

八、決策樹:

第十九講、決策樹算法ID。3、C4。5、CART算法區別和演示

第二十講、分類效果的評價方式

 

 

 

 

 

 

 

 

 

目標一:熟練掌握R語言語法知識和使用技巧

 

目標二:全面掌握回歸方法的背景知識和使用技巧,并知道如何評價回歸模型的效果;

 

目標三:掌握兩種典型的聚類方法包括層次聚類和k-means聚類原理、使用過程、注意事項和技巧

 

目標四:掌握決策樹算法的原理和使用技巧,為以后學習高階的組合算法奠定基礎。

 

目標五:深刻理解數據降維的重要性和處理方法,掌握三種常用的降維方法。

 

目標六:掌握關聯規則購物籃分析。

 

 

亮點一:本課程不要求學員有任何數學統計背景,課程中會對必須的數學知識會用最通俗的方式進行講解,保證學員掌握其原理,即知其然也知其所以然。 

 

亮點二:理論與實戰相結合,由淺入深。即照顧到基礎學員,又照顧到有一定經驗的學員,講解過程中遇到難點會用板書的方式講解。

 

亮點三:對于涉及到的分析模型R函數,會給出詳細的參數說明和模型解讀,不僅要讓學員知道如何使用,還要知道如何解讀、如何調整模型,做到手中有劍,心中也有。

 

亮點四:所有案例提供原始數據集,保證學員能夠拷貝復現。

 

亮點五:個課程的選擇的分析模型實用性超強.,都是目前互聯網行業經典模型。也是很容易移植到大數據環境的算法。

 

 

1.課程針對人群:

本課程針對有志于從事數據分析的學員,不要求有任何數學背景(加減乘除能力還是要的)、統計學背景,對編程經驗無要求。  

 

2.我該怎么學,如何才能學好這門課程,給些建議。

 4.1、時間上的安排建議:

 本課程共20講,如果您時間上充分,建議以每周3-5講的進度往前學習。 

 4。2、學習要求:

 如果您沒有基礎,建議還是中規中矩的按照課程進度一點一點仔細觀看學習,并一定要把看完的視頻中的代碼自己手敲一遍,以加深理解和記憶

 如果您有基礎,可不必按步就搬進行,可以拿你感興趣的部分去學習,但一定要注意實踐,并學會舉一反三 

 4.3、講師建議:

1.第6課《數據降維》的數學知識相對較有難度的,建議聽不懂的同學多聽幾遍,或者也可以跳過,只弄明白其使用場景和R函數用法,但老師鼓勵同學們掌握其數學背景,  因為是很多高級算法比如推薦算法的思想基礎。

2.第4課的《回歸分析》也涉及一點數學知識,這部分知識不難但是很基礎,同學們一定要掌握。

3.其他單元涉及到的數學知識難度系數為加減乘除級別,學員們可以放心享用。

4。R中建模函數的使用都非常簡單,最重要的是參數調整和模型結果的解讀,同學們不要以會使用函數為目標,一定要把重點放在這兩部分。

5.如果學習過程中遇到吃力的地方,多和老師或同學交流,自己鉆牛角尖是很痛苦的事情。

6. 最后祝您學有所成

什么网赚真实啊 速发彩票开户 2019年捞金网赚 北京赛车pk10投注 江苏快三走势图 北京赛车pk10玩法 盛源彩票注册 163网赚网 2019免费网赚挂机 秒速时时彩