
pandas でデータフレームを結合する方法には `merge` と `concat` があります。`merge` が列の値をキ...
pandas でデータ分析をしていると、複数のデータフレームを結合したい場面がよくあります。`merge` 関数を使えば、SQL...
ヒストグラムは、データの分布を視覚化するための図です。NumPy の `histogram` 関数を使うと、データをビン(区間)...
相関係数は、2つの変数の間にどの程度の関連性があるかを表す指標です。NumPy では `corrcoef` で計算できます。 c...
パーセンタイルは、データを小さい順に並べたとき「下から何%の位置にある値か」を表す指標です。NumPy では `percenti...
累積和と累積積は、配列の先頭から順番に値を足したり掛けたりしていく計算です。NumPy では `cumsum` と `cumpr...
データの最大値・最小値を求める `max`、`min` と、その位置(インデックス)を求める `argmax`、`argmin`...
データのばらつきを測る指標として、分散と標準偏差があります。NumPy では `var()` と `std()` で簡単に計算で...
NumPy では、配列を操作したときにコピーが作られる場合とビュー(元データへの参照)が作られる場合があります。この違いを理解し...
NumPy では、形状の異なる配列同士でも計算ができることがあります。これをブロードキャスティングと呼びます。明示的にループを書...
NumPy 配列から特定の要素を取り出すには、スライシングとインデックス指定を使います。Python のリストと似ていますが、多...
配列を複数の部分に分けたいとき、`split`、`vsplit`、`hsplit` を使います。結合の `vstack`、`hs...
複数の配列を1つにまとめたいとき、`concatenate`、`vstack`、`hstack` を使います。それぞれ結合の方向...
NumPy の配列は、要素数を変えずに形状だけを変更できます。`reshape`、`flatten`、`ravel` の3つの方...
数値が規則的に並んだ配列を作りたいとき、`arange` と `linspace` が便利です。どちらも連続した数値を生成します...
NumPy で配列を作成する方法はいくつかありますが、最も基本的なのが `zeros`、`ones`、`empty`、`full...
Python では `a < b < c` のように比較演算子を連鎖させて書ける。これは `a < b and b < c` と...
gunicorn を長期間運用していると、メモリ使用量が徐々に増加し、最終的に OOM Killer に殺されるという報告が後を...
ファイル I/O はプログラムのボトルネックになりやすい。適切なテクニックを使えば、読み書きの速度を大幅に改善できる。 バッファ...
Python で最も有名なアンチパターンの一つが、ミュータブルなデフォルト引数だ。特にクラスの `__init__` で発生しや...
Python でパッケージを配布するには、ディレクトリを「パッケージ」として認識させる必要がある。従来、この役割を担っていたのが...
Python でファイルを開いているときに例外が発生したら、そのファイルはどうなるのか。メモリリークは起きるのか。with 文を...
Python では `try-except` を条件分岐の代わりに使うパターンがある。特に「許可を求めるより許しを請う方が簡単」...












