跳至主內容區
Hsuan
  •  程式與統計
  • 旅遊
  • 美食
  • 關於我
  •  程式與統計
  • 旅遊
  • 美食
  • 關於我

分類: 統計模型

ben-neale-193521-unsplash

Gradient Boosting Machines GBM | gbm, xgboost, h2o | R語言

發表於 2019-04-14 jamleecute1 則留言分類為《 程式與統計, 統計模型》

Gradient Boosting Machines 是一個超級受歡迎的機器學習法,在許多領域上都有非常成功的表現,也是Kaggle競賽時常勝出的主要演算法之一 […]

aldino-hartan-putra-540980-unsplash

Random Forests 隨機森林 | randomForest, ranger, h2o | R語言

發表於 2019-03-192019-04-14 jamleecute2 則留言分類為《 程式與統計, 統計模型》

Bagging法綜合多個樹模型結果,可以降低單一樹模型的高變異性並提升預測正確率。但Bagging法中樹與樹之間的相關性會降低模型整體的表現。隨機森林 Rand […]

j-kelly-brito-256889-unsplash

Regularized Regression | 正規化迴歸 – Ridge, Lasso, Elastic Net | R語言

發表於 2019-01-042020-07-03 jamleecute5 則留言分類為《 程式與統計, 統計模型》

在線性回歸模型中,為了最佳化目標函式(最小化誤差平方和),資料需符合許多假設,才能得到不偏回歸係數,使得模型變異量最低。可現實中數據非常可能有多個特徵變數,使得 […]

element5-digital-352043-unsplash

Regression Tree | 迴歸樹, Bagging, Bootstrap Aggregation | R語言

發表於 2019-01-022020-07-03 jamleecute1 則留言分類為《 程式與統計, 統計模型》

有別於「分類」樹(classification tree)是用來找尋「最能區分標籤資料類別」的一系列變數,「迴歸」樹(regression tree)則是用來找 […]

資料標準化 data scaling

資料標準化(Data Scaling)對複回歸分析(Mutiple Regression)的影響 | R統計

發表於 2018-09-252020-07-03 jamleecute留下留言分類為《 程式與統計, 統計模型》

在進行多元線性回歸分時,會遇到多變數彼此單位標準不一致的情況,如果想要比較回歸方程式不同解釋變數的估計參數彼此間的大小關係時,若沒有進行-資料標準化-之處理,是 […]

rawpixel-602145-unsplash

Principal Components Analysis (PCA) | 主成份分析 | R 統計

發表於 2018-09-102020-07-03 jamleecute1 則留言分類為《 程式與統計, 統計模型》

主成份分析(principal components analysis, PCA)的應用非常廣泛,可以簡化資料維度資訊,用最精簡的主成份特徵來解釋目標變數的最大 […]

rawpixel-604745-unsplash

Partitional Clustering 切割式分群 | Kmeans, Kmedoid | Clustering 資料分群

發表於 2018-09-072019-04-14 jamleecute4 則留言分類為《 程式與統計, 統計模型》

Partitional Clustering, 切割式分群,屬於資料分群屬的一種方法。資料分群屬於非監督式學習,所處理的資料是沒有正確答案/標籤/目標變數可參考 […]

kyle-glenn-686350-unsplash

Hierarchical Clustering 階層式分群 | Clustering 資料分群 | R 統計

發表於 2018-09-052020-07-03 jamleecute6 則留言分類為《 程式與統計, 統計模型》

Hierarchical Clustering, 屬於資料分群的一種方法。資料分群屬於非監督式學習,處理的資料是沒有正確答案/標籤/目標變數可參考的。常見的分群 […]

markus-spiske-187777-unsplash

Tree Surrogate | Tree Surrogate Variables in CART | R 統計

發表於 2018-09-022019-04-14 jamleecute留下留言分類為《 程式與統計, 統計模型》

Tree Surrogate 樹替代是決策樹CART演算法裡面內建的處理遺失值的一個很棒的演算法。只要資料列有目標變數搭配只少一個未遺失的特徵值,即可進行遺失值 […]

文章導覽

1 2 下一頁

Instagram

近期文章

  • JB’s Diner | 陽光、綠意、自然度假風美式早午餐 | 台北 天母
  • 邀月兒 | 適合放鬆小酌的迷人高級餐酒館 | 台北 民生社區 富錦街
  • 信義誠品咖啡 Eslite Café | 美美的 優雅的 文青咖啡廳 | 台北 信義區
  • 小鼎膾 | 新鮮美味的高品質日式丼飯、海鮮料理 | 台北信義 Bellavita B2
  • Gradient Boosting Machines GBM | gbm, xgboost, h2o | R語言

彙整

  • 2019 年 8 月
  • 2019 年 4 月
  • 2019 年 3 月
  • 2019 年 2 月
  • 2019 年 1 月
  • 2018 年 12 月
  • 2018 年 10 月
  • 2018 年 9 月
  • 2018 年 8 月
  • 2018 年 7 月
  • 2018 年 5 月
本站採用 WordPress 建置 | 佈景主題採用由 aThemes 所設計的 Sydney。