注目キーワード
  1. Python
  2. コンペ
YEAR

2023年

  • 2023年7月19日
  • 2023年7月19日

scikit-learnを活用したデータ前処理の実践:標準化、正規化、ラベルエンコード、ワンホットエンコード

はじめに 機械学習の世界では、データの前処理は成功の鍵となる重要なステップです。前処理が適切に行われていないと、どんなに優れたアルゴリズムを用いても、モデルの性能は大きく低下します。今回の記事では、Pythonのライブラリであるscikit-lear […]

  • 2023年7月16日
  • 2023年7月29日

教師あり学習の実装:Scikit-learnを使った単回帰、重回帰、ロジスティック回帰、ランダムフォレスト、サポートベクターマシン(SVM)、K近傍法

PythonのライブラリであるScikit-learnは、機械学習の実装を簡単に行うことができる強力なツールです。この記事では、Scikit-learnを使用して教師あり学習を実装する方法をステップバイステップで解説します。 scikit-learn […]

  • 2023年7月9日
  • 2023年7月9日

ダイナミックプライシングとブッキングカーブ:価格戦略の最適化

はじめに 今日のビジネス環境では、データサイエンスが企業の価格戦略を形成する上で重要な役割を果たしています。その一例がダイナミックプライシングです。この記事では、ダイナミックプライシングの基本と、それを実現するための重要なツールであるブッキングカーブ […]

  • 2023年7月7日
  • 2023年7月28日

SIGNATE 【練習問題】「銀行の顧客ターゲティング」への挑戦

SIGNATEの学習コースQuest「金融機関におけるテレマーケティングの効率化」の総仕上げとして、コンペの練習問題「銀行の顧客ターゲティング」に取り組みました。 コンペの概要 実際のビジネス環境で得られたデータを用いて、マーケティングキャンペーンの […]

  • 2023年7月4日

Pythonとsklearnを使って最適なモデルパラメータを発見!:グリッドサーチの実装ガイド

機械学習のモデルを作成する際、最も重要なステップの一つがハイパーパラメータの調整です。ハイパーパラメータは、モデルの学習に影響を与える設定値で、これを適切に設定することでモデルの性能を大きく向上させることができます。しかし、ハイパーパラメータの最適な […]

  • 2023年7月3日
  • 2023年7月3日

export_graphvizによる決定木の可視化の手順

「決定木」は機械学習のアルゴリズムの一つで、その名の通り木のような構造を持つモデルです。この記事では、決定木の視覚化について解説します。視覚化は、モデルの動作を理解し結果を解釈するための強力なツールですのでぜひご参考にしてください。 まず、決定木の視 […]

  • 2023年7月1日
  • 2023年7月3日

機械学習入門:二値分類モデルの作成から評価まで

この記事では、二値分類の機械学習モデル作成の基本的な流れを解説します。データの理解から始め、特徴量の選択、モデルの作成と学習、そしてモデルの評価まで、一連のステップを具体的なコード例とともに説明します。この記事に沿って進めれば、最低限の二値分類モデル […]

  • 2023年6月23日
  • 2023年6月23日

Pythonを使ったテキストデータの前処理と可視化

今日はPythonを使ってテキストデータの前処理を行い、その結果を可視化する方法についてまとめます。具体的には、元首相の安倍晋三氏のツイートデータを使って、その内容を分析し、ワードクラウドを作成します。データはこちらのKaggleサイトからダウンロー […]