Pandas: Структурні операції та мультиіндексні об'єкти у DataFrame

Pandas.isnull(“DataFrame Name”) or DataFrame.isnull() Pandas.notnull(“DataFrame Name”) or DataFrame.notnull() Методи Pandas isnull() і notnull() використовуються для перевірки та керування значеннями NULL у кадрі даних. DataFrame.dropna(*, axis=0, how=_NoDefault.no_default, thresh=_NoDefault.no_default, subset=None, inplace=False, ignore_index=False) Параметри функції dropna(): axis({0 or ‘index’, 1 or ‘columns’}, default 0) - Визначте, чи видалено рядки або стовпці, які містять відсутні значення.

0 або «індекс»: видалення рядків, які містять відсутні значення.
1, або «стовпці»: видаліть стовпці, які містять відсутнє значення.

Передайте кортеж або список для розміщення на кількох осях. Допускається лише одна вісь. how({‘any’, ‘all’}, default ‘any’) - Визначте, видалено рядок або стовпець з DataFrame, якщо ми маємо принаймні одну NA або всі NA.

‘any’: якщо наявні будь-які значення NA, видаліть цей рядок або стовпець.
‘all’: якщо всі значення є NA, видаліть цей рядок або стовпець.

thresh(int, optional) - Вимагайте стільки значень, які не є NA. Не можна поєднувати з як. subset(column label or sequence of labels, optional) - Мітки вздовж іншої осі, яку слід враховувати, напр. якщо ви відкидаєте рядки, це буде список стовпців для включення. inplace(bool, default False) - Чи змінювати DataFrame замість створення нового. ignore_index(bool, default) - Якщо значення True, отримана вісь буде позначена 0, 1, …, n - 1. DataFrame.fillna(value=None, *, method=None, axis=None, inplace=False, limit=None, downcast=None) Параметри функції fillna(): value(scalar, dict, Series, or DataFrame) - Значення, яке потрібно використовувати для заповнення дірок (наприклад, 0), по черзі dict/Series/DataFrame значень, які вказують, яке значення використовувати для кожного індексу (для Series) або стовпця (для DataFrame). Значення не в dict/Series/DataFrame не будуть заповнені. Це значення не може бути списком. method({‘backfill’, ‘bfill’, ‘ffill’, None}, default None) - Спосіб використання для заповнення отворів у переіндексованих серіях:

ffill: передавати останнє дійсне спостереження до наступного дійсного.
backfill / bfill: використовуйте наступне дійсне спостереження, щоб заповнити прогалину.

axis({0 or ‘index’, 1 or ‘columns’}) - Вісь, уздовж якої потрібно заповнити відсутні значення. Для серії цей параметр не використовується і за умовчанням дорівнює 0. inplace(bool, default False) - Якщо True, заповніть на місці. Примітка: це призведе до зміни будь-яких інших переглядів цього об’єкта (наприклад, зріз без копіювання для стовпця в DataFrame). limit(int, default None) - Якщо вказано метод, це максимальна кількість послідовних значень NaN для заповнення вперед/назад. Іншими словами, якщо є проміжок із більшою кількістю послідовних NaN, він буде заповнений лише частково. Якщо метод не вказано, це максимальна кількість записів уздовж всієї осі, де будуть заповнені NaN. Має бути більше 0, якщо немає. downcast(dict, default is None) - Команда item->dtype того, що потрібно перетворити, якщо це можливо, або рядок «infer», який спробує привести до відповідного рівного типу (наприклад, float64 до int64, якщо це можливо). DataFrame.reset_index(level=None, *, drop=False, inplace=False, col_level=0, col_fill='', allow_duplicates=_NoDefault.no_default, names=None) Параметри функції reset_index(): level(int, str, tuple, or list, default None) - З індексу видаляйте лише вказані рівні. За замовчуванням видаляє всі рівні. drop(bool, default False) - Не намагайтеся вставити індекс у стовпці DataFrame. Це скидає індекс до стандартного цілого індексу. inplace(bool, default False) - Чи змінювати DataFrame замість створення нового. col_level(int or str, default 0) - Якщо стовпці мають кілька рівнів, визначає, на який рівень вставляються мітки. За замовчуванням він вставляється на перший рівень. col_fill(object, default) - Якщо стовпці мають кілька рівнів, визначає, як називаються інші рівні. Якщо немає, тоді ім’я індексу повторюється. allow_duplicates(bool, optional, default lib.no_default) - Дозволити створення дублікатів міток стовпців. names(int, str or 1-dimensional list, default None) - Використовуючи вказаний рядок, перейменуйте стовпець DataFrame, який містить дані індексу. Якщо DataFrame має MultiIndex, це має бути список або кортеж, довжина якого дорівнює кількості рівнів. MultiIndex.from_tuples(tuples, sortorder=None, names=None) Параметри функції from_tuples(): tuples(list / sequence of tuple-likes) - Кожен кортеж є індексом одного рядка/стовпця. sortorder(int or None) - Рівень упорядкованості (повинен бути відсортований лексикографічно за цим рівнем). names(list / sequence of str, optional) - Назви рівнів в індексі. DataFrame.xs(key, axis=0, level=None, drop_level=True) Параметри функції xs(): key(label or tuple of label) - Мітка міститься в індексі або частково в MultiIndex. axis({0 or ‘index’, 1 or ‘columns’}, default 0) - Вісь для отримання поперечного перерізу. level(object, defaults to first n levels (n=1 or len(key))) - Якщо ключ частково міститься в MultiIndex, укажіть, які рівні використовуються. Рівні можна посилатися за міткою або позицією. drop_level(bool, default True) - Якщо False, повертає об’єкт із тим самим рівнем, що й self.