- 2023年7月22日
- 2025年10月4日
scikit-learnのtrain_test_split使い方まとめ|データ分割手法とサンプルコード
機械学習モデルの開発では、モデルの訓練と評価を適切に行うためにデータの分割が必要となります。この記事では、機械学習モデルの評価に使用される主要なデータ分割手法について、具体的なコード例とともに解説します。 train_test_splitとは tra […]
機械学習モデルの開発では、モデルの訓練と評価を適切に行うためにデータの分割が必要となります。この記事では、機械学習モデルの評価に使用される主要なデータ分割手法について、具体的なコード例とともに解説します。 train_test_splitとは tra […]
はじめに 機械学習の世界では、データの前処理は成功の鍵となる重要なステップです。前処理が適切に行われていないと、どんなに優れたアルゴリズムを用いても、モデルの性能は大きく低下します。今回の記事では、Pythonのライブラリであるscikit-lear […]
PythonのライブラリであるScikit-learnは、機械学習の実装を簡単に行うことができる強力なツールです。この記事では、Scikit-learnを使用して教師あり学習を実装する方法をステップバイステップで解説します。 scikit-learn […]
scikit-learnはPythonの機械学習ライブラリの一つで、その中にはDataset-APIという便利な機能が含まれています。このAPIを活用することで、機械学習アルゴリズムを試験的に使ってみる際に必要なテストデータセットを簡単に取得すること […]
はじめに 今日のビジネス環境では、データサイエンスが企業の価格戦略を形成する上で重要な役割を果たしています。その一例がダイナミックプライシングです。この記事では、ダイナミックプライシングの基本と、それを実現するための重要なツールであるブッキングカーブ […]
SIGNATEの学習コースQuest「金融機関におけるテレマーケティングの効率化」の総仕上げとして、コンペの練習問題「銀行の顧客ターゲティング」に取り組みました。 コンペの概要 実際のビジネス環境で得られたデータを用いて、マーケティングキャンペーンの […]
機械学習モデルの性能を最大化するために欠かせないのがGridSearchCV(グリッドサーチ)を使ったハイパーパラメータの最適化です。 本記事では、PythonのsciKit-learnライブラリを使って、GridSearchCVの使い方を初心者でも […]
「決定木」は機械学習のアルゴリズムの一つで、その名の通り木のような構造を持つモデルです。この記事では、決定木の視覚化について解説します。視覚化は、モデルの動作を理解し結果を解釈するための強力なツールですのでぜひご参考にしてください。 まず、決定木の視 […]
この記事で学べること 機械学習の二値分類の基本概念と実装方法 Pythonとscikit-learnを使った実践的なコーディング データ前処理から評価まで一連の流れ 複数の分類手法の比較と選び方 実務で使える評価指標の使い分け 対象読者 Python […]
今日はPythonを使ったウェブスクレイピングデータの前処理についてのまとめです。 例として警視庁の公式ウェブサイトから反則行為のデータを取得し、その前処理を行う方法について手順を追っていきます。 Pythonとウェブスクレイピング Pythonでウ […]