banner
Fight4354

Fight4354

AI,Chem,Science,Study,Share,Hobby,LLM,Life,Sport

Autoluon自動機械学習

自動化プロセス:
モデル選択
特徴エンジニアリング
ハイパーパラメータ調整
モデル融合

TobularDataset#

Tobular 表形式の

from autogluon.tabular import TabularDataset, TabularPredictor

data_root = 'https://autogluon.s3.amazonaws.com/datasets/Inc/'

# data_root + 'train.csv' = 'https://autogluon.s3.amazonaws.com/datasets/Inc/train.csv' からリンクでデータを取得
train_data = TabularDataset(data_root + 'train.csv')
test_data = TabularDataset(data_root + 'test.csv')

# モデルを訓練
predictor = TabularPredictor(label='class').fit(train_data=train_data, presets = 'high_quality')
# preset デフォルトは medium_quality で、異なるパラメータに変更可能で、計算性能に関係する

# テストセット予測
predictions = predictor.predict(test_data)

# 評価
predictor.evaluate(test_data, silent=True)

TabularPredictor 重要なパラメータ

  • label:予測対象の変数の列名
  • problem_type :予測問題のタイプ、二項 / 多クラス分類または回帰問題 (binary, multiclass, regression, quantile)。もし problem_type = None の場合、提供されたデータセットのラベル値に基づいて予測問題のタイプを推測します。
  • eval_metric :評価指標。もし eval_metric = None の場合、problem_type に基づいて自動的に選択されます。デフォルトは二項および多クラス分類の ' accuracy '、回帰の ' root_mean_squared_error '、分位数の ' pinball_loss ' です。
    • 分類:[‘accuracy’, ‘balanced_accuracy’, ‘f1’, ‘f1_macro’, ‘f1_micro’, ‘f1_weighted’, ‘roc_auc’, ‘roc_auc_ovo_macro’, ‘average_precision’, ‘precision’, ‘precision_macro’, ‘precision_micro’, ‘precision_weighted’, ‘recall’, ‘recall_macro’, ‘recall_micro’, ‘recall_weighted’, ‘log_loss’, ‘pac_score’]
    • 回帰:[‘root_mean_squared_error’, ‘mean_squared_error’, ‘mean_absolute_error’, ‘median_absolute_error’, ‘mean_absolute_percentage_error’, ‘r2’]

Fit 重要なパラメータ

  • train_data (str または TabularDataset または pd.DataFrame) - 訓練データの表
  • time_limit (int, default = None) - fit () がどれくらいの時間(秒単位)実行されるべきか
  • presets :モデルのパフォーマンス。パフォーマンスが良いほど、時間がかかります。[‘best_quality’, ‘high_quality’, ‘good_quality’, ‘medium_quality’, ‘optimize_for_deployment’, ‘interpretable’, ‘ignore_text’]
  • num_bag_folds:K 分割交差検証の分割数
  • excluded_model_types:使用しないモデルの種類 excluded_model_types=[‘KNN’, ‘custom’]
  • num_stack_levels:スタックの層数 通常 0-3
読み込み中...
文章は、創作者によって署名され、ブロックチェーンに安全に保存されています。