pandas

Pythonのpandasでcsvファイルを読み込む

882 views17 Jun 2019

Pythonのpandasでcsvファイルを読み込むにはread_csvという関数を使う。import pandas as pd...

pandasのread_csvで日本語の表示がうまくいかないときはencoding=SHIFT-JISを指定してみる

1756 views20 Jun 2019

pandas で csv ファイルを開くとき、日本語が混ざっているとエラーになることがある。おかしいなと思ったら encodin...

pandas で Excel ファイルを読み書きする（openpyxl 連携）

20 views22 Dec 2025

業務では Excel ファイルでデータをやり取りする機会が多いです。pandas は Excel ファイルの読み書きに対応してい...

pandasでDataFrameをcsvファイルに書き出す（to_csv）：インデックスのありなしに注意しよう

12310 views17 Jun 2019

pandas で DataFrame を csv ファイルに書き出すには to_csv という関数を使う。次のコードがシンプルな...

pandasのto_csvでindex=Falseを指定するとインデックスが書き込まれない

13518 views20 Jun 2019

pandas の DataFrame をインデックスなしで csv に書き込むとき方法。 import pandas as p...

pandasのto_csvでカンマ区切りの数値を出力する：applyを使ってフォーマットを指定する

2753 views23 Jun 2019

数値をカンマ区切りで書き出すときは、列全体に apply を適用させる。 df['人口'] = df['人口'].apply(...

Pythonのpandasで特定のカラムのみを選択する

745 views17 Jun 2019

pandas の DataFrame から特定の列を選択してみよう。 import pandas as pd df = pd...

PythonのpandasでDataFrameから複数の行を選択する

531 views17 Jun 2019

pandas（Python）の使い方。pandasのDataFrameから複数行を選択するにはlocを使う。import pan...

pandasで条件に合う行を選択する（locの使い方と条件のand）

9177 views17 Jun 2019

pandas の DataFrame から条件に合う列のみを選択してみよう。今回も東京都の自治体別人口データを使う。 impo...

pandasのDataFrameで条件の否定を指定する（~で否定を表す）

8266 views23 Jun 2019

pandas の DataFrame から特定の行を除く方法。今回はあるカラム名の要素が「〜で終わっている」という条件を満たす行...

pandasの条件にendswithやstartswithなどを指定する（str.endswithを使う）

2417 views20 Jun 2019

pandas の loc などを使うとき、条件に endswith を指定するには次のようにする。 import pandas...

pandas の query メソッドで条件抽出を簡潔に書く

15 views22 Dec 2025

pandas で条件抽出するとき、通常は `df[df['col'] > 0]` のようにブールインデックスを使います。quer...

pandasのDataFrameを昇順・降順に並び替える方法（sort_valuesを使う）

4320 views20 Jun 2019

pandas の DataFrame をソートするには sort_values を使う。 rows = df.sort_val...

pandasのDataFrameで特定の列だけ浮動小数点数から整数に変える：.astype(int)を使う

4451 views23 Jun 2019

pandas の read_csv で csv ファイルのデータを読みこむと、場合によって数値が浮動小数点数と扱われる。これを整...

pandas で欠損値（NaN）を補間する方法まとめ

18 views22 Dec 2025

実データには欠損値（NaN）がつきものです。センサーの故障、通信エラー、データ収集の失敗など、さまざまな理由でデータが欠落します...

Pythonのpandasで列データの最大値・最小値・平均・分散・標準偏差を求める（read_csvのオプション引数thousandsに注意しよう）

8532 views17 Jun 2019

はじめに結論を述べる。 * pandas の Series には max や std などの標準的な関数がある * カンマ区切り...

pandas で時系列データをリサンプリングする

43 views22 Dec 2025

時系列データを扱う際、データの粒度を変換したいことがよくあります。1 分ごとのデータを 1 時間単位に集約したり、日次データを月...

pandas の rolling で移動平均・移動標準偏差を計算する

12 views22 Dec 2025

時系列データの分析では、ノイズを除去したりトレンドを把握したりするために「移動平均」をよく使います。pandas の rolli...

pandas の MultiIndex を使いこなす

18 views22 Dec 2025

pandas の MultiIndex（階層的インデックス）を使うと、複数の軸を持つデータを 2 次元の DataFrame で...

pandas でダミー変数を作成する（get_dummies と OneHotEncoder）

15 views22 Dec 2025

機械学習ではカテゴリカル変数を数値に変換する必要があります。「ダミー変数」や「One-Hot エンコーディング」と呼ばれるこの処...

pandas の apply は遅い：ベクトル化で高速化する

10 views22 Dec 2025

pandas の apply は便利なメソッドですが、大きなデータセットでは非常に遅くなります。多くの場合、ベクトル化された操作...

pandas の DataFrame を matplotlib で図にするときに legend を消す

6075 views17 Jan 2026

pandas の DataFrame を `plot` メソッドで図にすると、デフォルトで凡例（legend）が表示されます。下...

pandas の merge でデータフレームを結合する（inner / left / right / outer）

14 views17 Jan 2026

pandas でデータ分析をしていると、複数のデータフレームを結合したい場面がよくあります。`merge` 関数を使えば、SQL...

pandas の concat で複数のデータフレームを縦・横に連結する

20 views17 Jan 2026

pandas でデータフレームを結合する方法には `merge` と `concat` があります。`merge` が列の値をキ...

pandas の groupby でグループごとに集計する

17 views17 Jan 2026

データ分析では「部署ごとの売上合計」「年代別の平均点」のように、グループごとに集計したい場面がよくあります。pandas の `...

pandas の pivot_table でクロス集計表を作る

16 views17 Jan 2026

Excel のピボットテーブルに相当する機能が pandas にもあります。`pivot_table` を使えば、行と列でグルー...

pandas の melt で縦持ち・横持ちを変換する

16 views18 Jan 2026

データの形式には「縦持ち」と「横持ち」があります。pandas の `melt` を使うと、横持ちのデータを縦持ちに変換できます...

pandas で重複行を削除する（drop_duplicates）

19 views18 Jan 2026

データに重複した行が含まれていることがあります。pandas の `drop_duplicates` を使えば、重複行を簡単に削...

pandas で列名を変更する（rename）

14 views18 Jan 2026

データを読み込んだとき、列名がわかりにくかったり、日本語に変えたかったりすることがあります。pandas の `rename` ...

pandas の map と replace で値を置換する

21 views18 Jan 2026

データの値を別の値に置き換えたいことがあります。pandas では `map` と `replace` を使って値を置換できます...

pandas の cut でビニング（階級分け）する

14 views19 Jan 2026

連続値を区間に分けてカテゴリ化することを「ビニング」や「階級分け」といいます。pandas の `cut` を使えば、数値データ...

pandas の set_index と reset_index でインデックスを操作する

19 views19 Jan 2026

pandas のデータフレームには、行を識別するためのインデックスがあります。`set_index` と `reset_inde...

pandas の value_counts で値の出現回数を数える

15 views20 Jan 2026

データ分析で「この値は何回出てくるか」を調べたいことがよくあります。pandas の `value_counts` を使えば、値...

pandas のカテゴリ型でメモリを節約する

26 views20 Jan 2026

pandas でカテゴリデータを扱うとき、文字列のまま保持するとメモリを大量に消費します。`category` 型を使えば、メモ...

pandas の iterrows は遅い：なぜループを避けるべきか

17 views21 Jan 2026

pandas で DataFrame を行ごとに処理したいとき、`iterrows` を使う人がいます。しかし、iterrows...

pandas の str アクセサで文字列を一括処理する

21 views22 Jan 2026

pandas で文字列データを扱うとき、`str` アクセサを使うと列全体に文字列メソッドを一括適用できます。ループを書かずに済...

pandas の DataFrame を作成する基本的な方法まとめ

15 views02 Feb 2026

pandas を使ううえで最初に覚えるのが DataFrame の作成方法だ。データの形式に応じていくつかの手段が用意されており...

pandas の info と describe でデータの概要をつかむ

22 views02 Feb 2026

データ分析の第一歩は、手元のデータがどんな構造をしているかを把握することです。pandas には DataFrame の概要を素...

pandas の dtypes で列の型を確認・変換する

21 views02 Feb 2026

pandas でデータを正しく処理するには、各列がどのデータ型（dtype）を持っているかを把握しておく必要があります。型が意図...

pandas の isna と notna で欠損値を検出する

25 views03 Feb 2026

実データにはたいてい欠損値が含まれています。欠損値を放置したまま集計や分析を進めると、結果が歪んでしまうことがあるため、まずはど...

pandas の dropna で欠損値を含む行・列を削除する

14 views04 Feb 2026

欠損値を含む行や列をそのまま使うと、集計結果や機械学習モデルの精度に悪影響を及ぼすことがあります。pandas の dropna...

pandas の to_datetime で文字列を日時に変換する

26 views04 Feb 2026

CSV から読み込んだ日付データが文字列のままになっていて、日時として扱えないという経験は多いはずです。pandas の to_...

pandas の dt アクセサで年・月・曜日を取り出す

16 views05 Feb 2026

datetime64 型の列を持つ DataFrame では、dt アクセサを使って年・月・日・曜日などの情報を手軽に取り出せま...

pandas で JSON を読み書きする（read_json / to_json）

19 views05 Feb 2026

CSV と並んでよく使われるデータ形式に JSON があります。Web API のレスポンスや設定ファイルなどで広く使われており...

pandas で SQL データベースと連携する（read_sql / to_sql）

16 views05 Feb 2026

pandas は SQL データベースとの連携機能を備えており、SQL を書いてデータを取得したり、DataFrame をテーブ...

pandas の assign で新しい列を追加する

21 views05 Feb 2026

DataFrame に新しい列を追加するとき、直接代入する方法がもっとも一般的ですが、assign メソッドを使うとメソッドチェ...

pandas の pipe でメソッドチェーンを見やすくする

15 views07 Feb 2026

pandas のメソッドチェーンが長くなると、途中の処理が読みにくくなることがあります。pipe メソッドを使えば、独自の関数を...

pandas の where と mask で条件付きの値置換をする

12 views07 Feb 2026

条件に応じて値を書き換えたいとき、apply でラムダ式を書くことが多いかもしれません。しかし pandas には where ...

pandas の explode でリスト列を行に展開する

14 views07 Feb 2026

DataFrame の列にリストが格納されていることがあります。たとえばタグや複数カテゴリなど、1 つのセルに複数の値が入ってい...

pandas の expanding と ewm で累積・指数移動平均を計算する

14 views07 Feb 2026

時系列データの分析では、移動平均のほかに累積統計量や指数加重移動平均を計算したい場面があります。pandas の expandi...

pandas で大きな CSV を chunksize で分割読み込みする

17 views08 Feb 2026

数 GB を超える CSV ファイルを丸ごと読み込もうとすると、メモリ不足でエラーになることがあります。pandas の rea...

pandas と Parquet で高速にデータを保存・読み込みする

13 views08 Feb 2026

CSV はテキストベースのフォーマットなので、ファイルサイズが大きくなりがちで、読み書きの速度も遅くなります。Parquet（パ...

pandas の agg で複数の集計を一度に行う

17 views08 Feb 2026

groupby で集計するとき、sum や mean だけでなく複数の統計量を同時に計算したい場面があります。pandas の ...

pandas の crosstab でクロス集計を手軽に作る

17 views09 Feb 2026

2 つのカテゴリ変数の組み合わせごとに集計したいとき、pivot_table を使う方法が一般的ですが、pandas の cro...

pandas の nlargest と nsmallest で上位・下位を素早く取得する

13 views09 Feb 2026

データの中から上位や下位の値を取り出したいとき、sort_values してから head を使う方法が一般的です。しかし pa...

pandas の clip で値の範囲を制限する

12 views09 Feb 2026

データの中に極端な外れ値が含まれていると、集計や可視化の結果が歪んでしまうことがあります。pandas の clip メソッドを...