- 2023年8月30日
Pandasの重複行の扱い:カウント、削除、結合の手法を解説
この記事では、Pandasにおけるデータフレーム内の重複行に対する操作として、カウント、削除、結合の3つについて解説します。 重複行をカウントする 基本的なカウント方法 Pandasのduplicated()メソッドを使うと、データフレーム内の重複行 […]
この記事では、Pandasにおけるデータフレーム内の重複行に対する操作として、カウント、削除、結合の3つについて解説します。 重複行をカウントする 基本的なカウント方法 Pandasのduplicated()メソッドを使うと、データフレーム内の重複行 […]
Pandasのマルチインデックスは、データ分析の際に非常に強力なツールとなります。この記事では、マルチインデックスの基本的な作成方法から、列名の変更、データの取得、そして不要なインデックスの削除方法まで、詳しく解説します。 マルチインデックスの基本 […]
Pandasのagg関数は強力なデータ集計のツールです。この記事では、agg関数の基本的な使い方から、apply関数との違い、条件に基づくカウント方法、そしてグループごとの最初の値の取得方法まで、具体的なコード例とともに解説します。 agg関数の基本 […]
Pandasのrank関数は、データの順位を簡単に計算できる便利なツールです。この記事では基本的なランクの計算方法から、整数での表示、特定の列を指定したランクの計算方法まで、rank関数の使い方を解説します。 Pandasのrank関数の基本的な使い […]
pandasのDataFrameには、特定の条件を満たす行を抽出するための多くの方法があります。この記事では、その中でも特によく使われる方法をいくつか紹介します。 基本的な条件抽出 # A列の値が5である行を抽出 df[df['A' […]
近年DXを推進する人材として「ビジネスアーキテクト」という言葉が聞かれるようになってきました。そこでビジネスアーキテクトがどのような人材なのか、その役割や求められるスキル、そしてビジネスアーキテクトになった場合の年収イメージについて簡単にまとめます。 […]
2023年度の「マナビDX Quest」に参加することにしました。 マナビDX Questというのは、経済産業省が開設したデジタル人材育成のためのプログラムです。実践的なケーススタディや地域企業との協働を通じて、デジタル技術の活用やDX推進の考え方を […]
SIGNATEの学習コースQuest「スポーツのチケット価格の最適化」の総仕上げとして、コンペの練習問題「Jリーグの観客動員数予測」に取り組みました。 回帰モデルの作成手順をまとめたこちらの記事に沿って作業を進めましたので、適宜ご参照ください。 コン […]
この記事では、機械学習の回帰モデル作成の基本的な流れを解説します。対象データの理解から始め、特徴量の選択、モデルの作成と学習、そしてモデルの評価まで、一連のステップを具体的なコード例とともに説明します。この記事に沿って進めれば、回帰モデルを作成し、評 […]
機械学習モデルの評価は、モデルの性能を理解し改善するために不可欠なプロセスです。Pythonの機械学習ライブラリであるscikit-learnは、モデルの評価を行うための便利な関数を提供しています。この記事では、scikit-learnを使用して機械 […]