Decision Tree 決策樹 | CART, Conditional Inference Tree, RandomForest
Decision Tree 決策樹模型是一個不受資料分配限制的模型,模型結果以樹狀呈現,簡單易懂,解釋性極高,且模型同時兼具變數挑選與遺失值填補的機制,並能處理 […]
Decision Tree 決策樹模型是一個不受資料分配限制的模型,模型結果以樹狀呈現,簡單易懂,解釋性極高,且模型同時兼具變數挑選與遺失值填補的機制,並能處理 […]
本篇筆記主要介紹簡單基礎 Summarize categorical variables 摘要類別變數的方法。包括類別次數或百分比交叉表/聯列表,以及將結果視覺 […]
在進行資料分析時,常遇到的問題就是遺失值處理(Missing Value Treatment)。特別是重要特徵變數有遺失值時,是無法輕易忽略的。比如說,在進行回 […]
Logistic Regression, 羅吉斯回歸模型,適用於預測二元類別目標變數的發生機率(p),和線性回歸模型類似,與線性回歸主要不同之處在於:(1) 目 […]
Logistic Regression, 羅吉斯回歸模型,適用於預測二元類別目標變數的發生機率(p),和線性回歸模型類似,與線性回歸主要不同之處在於:(1) 目 […]
Linear Regression 線性迴歸模型是用來預測連續型目標變數與預測變數間的線性關係,並存在許多資料符合常態分佈與線性關係等基本假設。預測變數可以是數 […]
本篇學習筆記主要介紹如何使用R ggplot2 套件的圖層概念來進行資料視覺化 Data Visualization,使用數據則為透過R連接SQLite 資料庫 […]
料理一道菜必須要有好的食材,就像豐富有趣的資料是好的資料分析基礎。有時為了有效蒐集我們感興趣的資料,我們得自己寫網路爬蟲(web crawler)。本篇文章將示 […]