中学理科1626207 views
高校化学2913383 views
MathPython491378 views
高校倫理1433119 views
世界の国560595 views
英語607877 views
高校国語785655 views
高校日本史189857 views
高校物理158224 views
LaTeX957300 views
Help
Tools

English

pandas

878 views17 Jun 2019

Pythonのpandasでcsvファイルを読み込むにはread_csvという関数を使う。import pandas as pd...

1749 views20 Jun 2019

pandas で csv ファイルを開くとき、日本語が混ざっているとエラーになることがある。おかしいなと思ったら encodin...

15 views22 Dec 2025

業務では Excel ファイルでデータをやり取りする機会が多いです。pandas は Excel ファイルの読み書きに対応してい...

12303 views17 Jun 2019

pandas で DataFrame を csv ファイルに書き出すには to_csv という関数を使う。次のコードがシンプルな...

13514 views20 Jun 2019

pandas の DataFrame をインデックスなしで csv に書き込むとき方法。 import pandas as p...

2744 views23 Jun 2019

数値をカンマ区切りで書き出すときは、列全体に apply を適用させる。 df['人口'] = df['人口'].apply(...

739 views17 Jun 2019

pandas の DataFrame から特定の列を選択してみよう。 import pandas as pd df = pd...

526 views17 Jun 2019

pandas(Python)の使い方。pandasのDataFrameから複数行を選択するにはlocを使う。import pan...

9166 views17 Jun 2019

pandas の DataFrame から条件に合う列のみを選択してみよう。今回も東京都の自治体別人口データを使う。 impo...

8263 views23 Jun 2019

pandas の DataFrame から特定の行を除く方法。今回はあるカラム名の要素が「〜で終わっている」という条件を満たす行...

2411 views20 Jun 2019

pandas の loc などを使うとき、条件に endswith を指定するには次のようにする。 import pandas...

10 views22 Dec 2025

pandas で条件抽出するとき、通常は `df[df['col'] > 0]` のようにブールインデックスを使います。quer...

4309 views20 Jun 2019

pandas の DataFrame をソートするには sort_values を使う。 rows = df.sort_val...

4444 views23 Jun 2019

pandas の read_csv で csv ファイルのデータを読みこむと、場合によって数値が浮動小数点数と扱われる。これを整...

12 views22 Dec 2025

実データには欠損値(NaN)がつきものです。センサーの故障、通信エラー、データ収集の失敗など、さまざまな理由でデータが欠落します...

8524 views17 Jun 2019

はじめに結論を述べる。 * pandas の Series には max や std などの標準的な関数がある * カンマ区切り...

26 views22 Dec 2025

時系列データを扱う際、データの粒度を変換したいことがよくあります。1 分ごとのデータを 1 時間単位に集約したり、日次データを月...

9 views22 Dec 2025

時系列データの分析では、ノイズを除去したりトレンドを把握したりするために「移動平均」をよく使います。pandas の rolli...

15 views22 Dec 2025

pandas の MultiIndex(階層的インデックス)を使うと、複数の軸を持つデータを 2 次元の DataFrame で...

10 views22 Dec 2025

機械学習ではカテゴリカル変数を数値に変換する必要があります。「ダミー変数」や「One-Hot エンコーディング」と呼ばれるこの処...

8 views22 Dec 2025

pandas の apply は便利なメソッドですが、大きなデータセットでは非常に遅くなります。多くの場合、ベクトル化された操作...

6071 views17 Jan 2026

pandas の DataFrame を `plot` メソッドで図にすると、デフォルトで凡例(legend)が表示されます。下...

10 views17 Jan 2026

pandas でデータ分析をしていると、複数のデータフレームを結合したい場面がよくあります。`merge` 関数を使えば、SQL...

17 views17 Jan 2026

pandas でデータフレームを結合する方法には `merge` と `concat` があります。`merge` が列の値をキ...

12 views17 Jan 2026

データ分析では「部署ごとの売上合計」「年代別の平均点」のように、グループごとに集計したい場面がよくあります。pandas の `...

12 views17 Jan 2026

Excel のピボットテーブルに相当する機能が pandas にもあります。`pivot_table` を使えば、行と列でグルー...

12 views18 Jan 2026

データの形式には「縦持ち」と「横持ち」があります。pandas の `melt` を使うと、横持ちのデータを縦持ちに変換できます...

15 views18 Jan 2026

データに重複した行が含まれていることがあります。pandas の `drop_duplicates` を使えば、重複行を簡単に削...

11 views18 Jan 2026

データを読み込んだとき、列名がわかりにくかったり、日本語に変えたかったりすることがあります。pandas の `rename` ...

18 views18 Jan 2026

データの値を別の値に置き換えたいことがあります。pandas では `map` と `replace` を使って値を置換できます...

8 views19 Jan 2026

連続値を区間に分けてカテゴリ化することを「ビニング」や「階級分け」といいます。pandas の `cut` を使えば、数値データ...

15 views19 Jan 2026

pandas のデータフレームには、行を識別するためのインデックスがあります。`set_index` と `reset_inde...

10 views20 Jan 2026

データ分析で「この値は何回出てくるか」を調べたいことがよくあります。pandas の `value_counts` を使えば、値...

21 views20 Jan 2026

pandas でカテゴリデータを扱うとき、文字列のまま保持するとメモリを大量に消費します。`category` 型を使えば、メモ...

10 views21 Jan 2026

pandas で DataFrame を行ごとに処理したいとき、`iterrows` を使う人がいます。しかし、iterrows...

11 views22 Jan 2026

pandas で文字列データを扱うとき、`str` アクセサを使うと列全体に文字列メソッドを一括適用できます。ループを書かずに済...

13 views02 Feb 2026

pandas を使ううえで最初に覚えるのが DataFrame の作成方法だ。データの形式に応じていくつかの手段が用意されており...

16 views02 Feb 2026

データ分析の第一歩は、手元のデータがどんな構造をしているかを把握することです。pandas には DataFrame の概要を素...

16 views02 Feb 2026

pandas でデータを正しく処理するには、各列がどのデータ型(dtype)を持っているかを把握しておく必要があります。型が意図...

20 views03 Feb 2026

実データにはたいてい欠損値が含まれています。欠損値を放置したまま集計や分析を進めると、結果が歪んでしまうことがあるため、まずはど...

11 views04 Feb 2026

欠損値を含む行や列をそのまま使うと、集計結果や機械学習モデルの精度に悪影響を及ぼすことがあります。pandas の dropna...

23 views04 Feb 2026

CSV から読み込んだ日付データが文字列のままになっていて、日時として扱えないという経験は多いはずです。pandas の to_...

14 views05 Feb 2026

datetime64 型の列を持つ DataFrame では、dt アクセサを使って年・月・日・曜日などの情報を手軽に取り出せま...

13 views05 Feb 2026

CSV と並んでよく使われるデータ形式に JSON があります。Web API のレスポンスや設定ファイルなどで広く使われており...

12 views05 Feb 2026

pandas は SQL データベースとの連携機能を備えており、SQL を書いてデータを取得したり、DataFrame をテーブ...

17 views05 Feb 2026

DataFrame に新しい列を追加するとき、直接代入する方法がもっとも一般的ですが、assign メソッドを使うとメソッドチェ...

10 views07 Feb 2026

pandas のメソッドチェーンが長くなると、途中の処理が読みにくくなることがあります。pipe メソッドを使えば、独自の関数を...

9 views07 Feb 2026

条件に応じて値を書き換えたいとき、apply でラムダ式を書くことが多いかもしれません。しかし pandas には where ...

10 views07 Feb 2026

DataFrame の列にリストが格納されていることがあります。たとえばタグや複数カテゴリなど、1 つのセルに複数の値が入ってい...

11 views07 Feb 2026

時系列データの分析では、移動平均のほかに累積統計量や指数加重移動平均を計算したい場面があります。pandas の expandi...

11 views08 Feb 2026

数 GB を超える CSV ファイルを丸ごと読み込もうとすると、メモリ不足でエラーになることがあります。pandas の rea...

12 views08 Feb 2026

CSV はテキストベースのフォーマットなので、ファイルサイズが大きくなりがちで、読み書きの速度も遅くなります。Parquet(パ...

12 views08 Feb 2026

groupby で集計するとき、sum や mean だけでなく複数の統計量を同時に計算したい場面があります。pandas の ...

11 views09 Feb 2026

2 つのカテゴリ変数の組み合わせごとに集計したいとき、pivot_table を使う方法が一般的ですが、pandas の cro...

9 views09 Feb 2026

データの中から上位や下位の値を取り出したいとき、sort_values してから head を使う方法が一般的です。しかし pa...

8 views09 Feb 2026

データの中に極端な外れ値が含まれていると、集計や可視化の結果が歪んでしまうことがあります。pandas の clip メソッドを...