データフレームにおいて、重複を排除したデータフレームを作成するときに便利な関数の使い方を備忘録として残します。
drop_duplicates()を使うだけでOK
import pandas as pd
df = pd.DataFrame(
{'col_1': ['A', 'B', 'B', 'C', 'C', 'C'],
'col_2': ['A', 'A', 'A', 'B', 'B', 'B'],
'col_3': [10, 10, 10, 10, 30, 30]},
index=[1, 2, 3, 4, 5, 6])
df
![](https://i0.wp.com/nlab-notebook.com/wp-content/uploads/2023/10/image-3.png?resize=148%2C190&ssl=1)
df.drop_duplicates()
![](https://i0.wp.com/nlab-notebook.com/wp-content/uploads/2023/10/image-2.png?resize=155%2C145&ssl=1)
上記の”drop_duplicates()”を使うだけで重複なくせます!!
ぜひ参考にしてみてください!!
コメント