データフレームにおいて、重複を排除したデータフレームを作成するときに便利な関数の使い方を備忘録として残します。
drop_duplicates()を使うだけでOK
import pandas as pd
df = pd.DataFrame(
{'col_1': ['A', 'B', 'B', 'C', 'C', 'C'],
'col_2': ['A', 'A', 'A', 'B', 'B', 'B'],
'col_3': [10, 10, 10, 10, 30, 30]},
index=[1, 2, 3, 4, 5, 6])
df
df.drop_duplicates()
上記の”drop_duplicates()”を使うだけで重複なくせます!!
ぜひ参考にしてみてください!!
コメント