注目キーワード
  1. Python
  2. コンペ
CATEGORY

Python

  • 2023年8月19日
  • 2023年8月23日

Pandasのaggによる集計テクニック: 基本的な使い方、applyとの違い、条件付きカウント (count ifのような使い方)、最初の値の取得 (first value)など

Pandasのagg関数は強力なデータ集計のツールです。この記事では、agg関数の基本的な使い方から、apply関数との違い、条件に基づくカウント方法、そしてグループごとの最初の値の取得方法まで、具体的なコード例とともに解説します。 agg関数の基本 […]

  • 2023年8月17日
  • 2023年8月17日

Pandasのrank関数の使い方:ランクの計算から整数表示、列指定まで

Pandasのrank関数は、データの順位を簡単に計算できる便利なツールです。この記事では基本的なランクの計算方法から、整数での表示、特定の列を指定したランクの計算方法まで、rank関数の使い方を解説します。 Pandasのrank関数の基本的な使い […]

  • 2023年8月15日
  • 2023年8月16日

Pandasの列を複数条件で抽出: query、inなどのメソッドも解説

pandasのDataFrameには、特定の条件を満たす行を抽出するための多くの方法があります。この記事では、その中でも特によく使われる方法をいくつか紹介します。 基本的な条件抽出 # A列の値が5である行を抽出 df[df['A' […]

  • 2023年8月15日
  • 2023年8月15日

Pandasで列名を効率的に変更する方法:一部の列名の変更から一括変更、インデックス名の変更まで

Pandaswにてデータの整形や分析を行う際、列名を変更する必要が出てくることはよくあります。この記事では、Pandasを使用して列名を変更するさまざまな方法を解説します。 一部の列名を変更する方法 リスト内包表記を使用した方法: renameメソッ […]

  • 2023年7月3日
  • 2023年7月3日

export_graphvizによる決定木の可視化の手順

「決定木」は機械学習のアルゴリズムの一つで、その名の通り木のような構造を持つモデルです。この記事では、決定木の視覚化について解説します。視覚化は、モデルの動作を理解し結果を解釈するための強力なツールですのでぜひご参考にしてください。 まず、決定木の視 […]

  • 2023年6月23日
  • 2023年6月23日

Pythonを使ったテキストデータの前処理と可視化

今日はPythonを使ってテキストデータの前処理を行い、その結果を可視化する方法についてまとめます。具体的には、元首相の安倍晋三氏のツイートデータを使って、その内容を分析し、ワードクラウドを作成します。データはこちらのKaggleサイトからダウンロー […]

  • 2023年6月20日
  • 2023年6月20日

Pandasを使ってExcel表形式データを読み込み、前処理する方法

今日はPythonのライブラリであるPandasを使ってExcel表データを読み込み、前処理を行う方法について学んだことを共有します。 データコンペやAIの講義などではcsvで整形されたデータを読み込むところから前処理を始めるケースも多いですが、実際 […]