XGBoostのパラメータ解説(回帰問題):数式、図から理解する

概要 XGBoostのパラメータをまとめる。ただし、回帰分析を行う際に重要なパラメータのみを考える。基本的には公式に書かれていることをまとめるが、わかりずらいところも多く適宜補足を加える。パラメータの説明を数式を行うので、XGBoostの原理を先に勉強し…

XGBoost:学習曲線と検証曲線

概要 学習曲線とは学習の進行過程を数量的にプロットしたもの。DeepLearning等の 勾配法を利用した機械学習アルゴリズムを利用する際に、ステップ数毎の評価をするために使われる。同様に、検証データに対しては検証曲線(validation curve)と言われる。そ…

初めてのXGBoost

概要 xgboostの使える環境を構築し、必要最低限の流れを確認する。pythonの環境が整っていない場合はこちら。 環境 macOS Mojave 10.14.5 pyenv 1.2.13 anaconda3-5.3.0 conda 4.5.11 python 3.7.4 XGBoostのインストール 公式サイトではpipを使用してのイン…

XGBoostのfeature_importantの計算方法

概要 xgboostのfeature_importantについて。公式サイトに詳しく書かれれておらず、検索してもなかなかヒットしなかったので、メモ。 環境 macOS Mojave 10.14.5 python 3.7.4 xgboost 0.90 feature_importantの分類 feature_importantの計算方法は大きく分け…