PYTHON DATAFRAME УДАЛИТЬ ДУБЛИКАТЫ
Python pandas
библиотека предоставляет возможность для работы с dataframe - таблицами с данными. Часто возникает задача удаления дубликатов строк таблицы. Для этого существует метод drop_duplicates()
, который удаляет все полные дубликаты строк таблицы. Обратите внимание, что метод drop_duplicates()
возвращает копию таблицы, а не изменяет исходную таблицу:
import pandas as pd
data = pd.read_csv('example_data.csv')
data_without_duplicates = data.drop_duplicates()
Метод drop_duplicates()
также позволяет указать столбцы, по которым нужно искать дубликаты. Например, если нужно удалить строки, которые дублируются только по значениям столбца "name", то можно написать следующий код:
data_without_duplicates = data.drop_duplicates(subset=['name'])
Можно также указать несколько столбцов для поиска дубликатов:
data_without_duplicates = data.drop_duplicates(subset=['name', 'age'])
Кроме того, метод drop_duplicates()
позволяет изменять исходную таблицу, используя параметр inplace=True
:
data.drop_duplicates(inplace=True)
Семинар 1 - удаление дубликатов из списка
Удаление дубликатов строк на Python 3
Pandas Базовый №4. Операции со столбцами DataFrame
Датафреймы pandas. Удаление строк
Решение задачи «978A. Удаление дубликатов» с сайта pygame.ru на python
Пишу реальную программу. Парсинг текстового файла. Python + Pandas + Excel.
001 pandas - сильные стороны: удаление дубликатов, вычисляемые поля, объединение таблиц
Как удалить строки файла с отсутствующими данными по одному столбцу? (Анализ данных в Python)
Как определить и удалить дупликацию строк? (Анализ данных в Python)
Фильтрация данных в Pandas - Анатолий Карпов - pygame.rus
Новые материалы:
- Мемоизация в python
- Поворот спрайта pygame
- Python как выйти из виртуального окружения
- Две гистограммы на одном графике python
- Как из списка сделать список списков python
- Как посчитать количество элементов в списке python
- Хакинг на python
- Python классификация временных рядов
- Персептрон многослойный python
- Beautifulsoup python 3 xml парсинг
- Найдите сумму и произведение элементов массива python
- Переименовать столбец в датафрейм python
- Бесконечность в python