(python-備忘録)データフレームにおける重複の削除・重複をなくす”drop_duplicates()”

IT系知識

データフレームにおいて、重複を排除したデータフレームを作成するときに便利な関数の使い方を備忘録として残します。

drop_duplicates()を使うだけでOK

import pandas as pd

df = pd.DataFrame(
    {'col_1': ['A', 'B', 'B', 'C', 'C', 'C'], 
     'col_2': ['A', 'A', 'A', 'B', 'B', 'B'],
     'col_3': [10, 10, 10, 10, 30, 30]},
     index=[1, 2, 3, 4, 5, 6])
 
df
df.drop_duplicates()

上記の”drop_duplicates()”を使うだけで重複なくせます!!

ぜひ参考にしてみてください!!

コメント

タイトルとURLをコピーしました