Pandas: Структурна конкатенація операцій

pandas.concat(objs, *, axis=0, join='outer', ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, sort=False, copy=None) Параметри функції concat(): objs(Series or DataFrame) - Якщо передано відображення, відсортовані ключі використовуватимуться як аргумент ключів, якщо воно не передано, у цьому випадку значення будуть вибрані (див. нижче). Будь-які об’єкти None буде скинуто мовчки, якщо всі вони не є None, у цьому випадку буде викликано ValueError. axis({0/’index’, 1/’columns’}, default 0) - Вісь для об’єднання. join({‘inner’, ‘outer’}, default ‘outer’) - Як обробляти індекси на іншій осі (або осях). ignore_index(bool, default False) - Якщо True, не використовуйте значення індексу вздовж осі конкатенації. Отримана вісь буде позначена 0, …, n - 1. Це корисно, якщо ви об’єднуєте об’єкти, де вісь об’єднання не має значущої інформації про індексування. Зверніть увагу, що значення індексів на інших осях все ще враховуються в об’єднанні. keys(sequence, default None) - Якщо пройдено кілька рівнів, має містити кортежі. Побудуйте ієрархічний індекс, використовуючи передані ключі як крайній рівень. levels(list of sequences, default None) - Конкретні рівні (унікальні значення), які використовуються для побудови MultiIndex. Інакше вони будуть виведені з ключів. names(list, default None) - Назви рівнів у результуючому ієрархічному індексі. verify_integrity(bool, default False) - Перевірте, чи нова об’єднана вісь містить дублікати. Це може бути дуже дорогим порівняно з фактичним об’єднанням даних. sort(bool, default False) - Сортувати вісь без конкатенації, якщо вона ще не вирівняна. copy(bool, default True) - Якщо False, не копіюйте дані без потреби. pandas.merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=('_x', '_y'), copy=None, indicator=False, validate=None)

Параметри функції merge():

left(DataFrame or named Series) - Об’єкт для об’єднання.

right(DataFrame or named Series) - Об’єкт для об’єднання.

how({‘left’, ‘right’, ‘outer’, ‘inner’, ‘cross’}, default ‘inner’) - Тип злиття, яке буде виконано.

● left: використовуйте лише ключі з лівого кадру, подібно до лівого зовнішнього об’єднання SQL; зберегти порядок ключів.

● right: використовуйте лише ключі з правого кадру, подібно до правого зовнішнього об’єднання SQL; зберегти порядок ключів.

● outer: використовувати об’єднання ключів з обох фреймів, подібно до повного зовнішнього об’єднання SQL; сортувати ключі лексикографічно.

● inner: використовувати перетин ключів з обох кадрів, подібно до внутрішнього з’єднання SQL; зберегти порядок лівих клавіш.

● cross: створює декартовий добуток з обох кадрів, зберігає порядок лівих клавіш. on(label or list) - Назви рівнів стовпців або індексів для приєднання.

Вони повинні бути знайдені в обох DataFrames. Якщо on має значення None і індекси не об’єднуються, тоді за замовчуванням буде перетин стовпців в обох DataFrames. left_on(label or list, or array-like) - Назви рівнів стовпців або індексів для об’єднання в лівому DataFrame. Також може бути масивом або списком масивів довжини лівого DataFrame. Ці масиви розглядаються як стовпці. right_on(label or list, or array-like) - Назви рівнів стовпців або індексів для об’єднання в правому DataFrame. Також може бути масивом або списком масивів довжини правого DataFrame. Ці масиви розглядаються як стовпці. left_index(bool, default False) - Використовуйте індекс з лівого DataFrame як ключ(и) об’єднання. Якщо це MultiIndex, кількість ключів в іншому DataFrame (або індекс, або кількість стовпців) має відповідати кількості рівнів. right_index(bool, default False) - Використовуйте індекс із правого DataFrame як ключ об’єднання. Ті самі застереження, що й left_index. sort(bool, default False) - Відсортуйте ключі об’єднання за лексикографією в отриманому DataFrame. Якщо значення False, порядок ключів об’єднання залежить від типу об’єднання (ключове слово how). suffixes(list-like, default is (“_x”, “_y”)) - Послідовність довжини 2, де кожен елемент необов’язково є рядком, що вказує суфікс, який потрібно додати до імен стовпців, що перекриваються, ліворуч і праворуч відповідно. Передайте значення None замість рядка, щоб вказати, що ім’я стовпця зліва чи справа слід залишити без суфікса. Принаймні одне зі значень не має бути жодним. copy(bool, default True) - Якщо False, уникайте копіювання, якщо це можливо. indicator(bool or str, default False) - Якщо True, додає стовпець до вихідного DataFrame під назвою «_merge» з інформацією про джерело кожного рядка. Стовпцю можна дати іншу назву, надавши рядковий аргумент. Стовпець матиме категорійний тип зі значенням «left_only» для спостережень, чий ключ злиття відображається лише в лівому DataFrame, «right_only» для спостережень, чий ключ злиття відображається лише в правому DataFrame, і «both», якщо ключ злиття спостереження знаходиться в обох DataFrames. validate(str, optional) - Якщо вказано, перевіряє, чи злиття має вказаний тип.

● «one_to_one» або «1:1»: перевірте, чи унікальні ключі злиття в лівому та правому наборах даних.

● «one_to_many» або «1:m»: перевірте, чи унікальні ключі злиття в лівому наборі даних.

● “many_to_one” або “m:1”: перевірте, чи унікальні ключі злиття в правильному наборі даних.

● “many_to_many” або “m:m”: дозволено, але не призводить до перевірок.

DataFrame.join(other, on=None, how='left', lsuffix='', rsuffix='', sort=False, validate=None) Параметри функції join(): other(DataFrame, Series або список, що містить будь-яку їх комбінацію) - Індекс має бути схожим на один зі стовпців цього. Якщо серія передана, її атрибут name має бути встановлено, і це буде використано як ім’я стовпця в результуючому об’єднаному DataFrame. on(str, list of str, or array-like, optional) - Ім’я (імена) рівня стовпця або індексу в абоненті для приєднання до індексу в іншому, інакше об’єднується індекс за індексом. Якщо подано кілька значень, інший DataFrame повинен мати MultiIndex. Може передати масив як ключ об’єднання, якщо він ще не міститься у викликаючому DataFrame. Як операція Excel VLOOKUP. how({‘left’, ‘right’, ‘outer’, ‘inner’, ‘cross’}, default ‘left’) - Як керувати роботою двох об'єктів.

● left: використовувати індекс кадру виклику (або стовпець, якщо вказано on)

● right: використовувати чужий індекс.

● outer: формує об’єднання індексу кадру виклику (або стовпця, якщо вказано on) з індексом іншого та сортує його. лексикографічно.

● inner: утворює перетин індексу викликаючого кадру (або стовпця, якщо вказано on) з індексом іншого, зберігаючи порядок викликаючого.

● cross: створює декартовий добуток з обох кадрів, зберігає порядок лівих клавіш.

lsuffix(str, default ‘’) - Суфікс для використання з стовпців лівого фрейму, що перекриваються.

rsuffix(str, default ‘’) - Суфікс для використання з стовпців правого фрейму, що перекриваються.

sort(bool, default False) - Упорядкуйте результат DataFrame лексикографічно за ключем об’єднання. Якщо False, порядок ключа об’єднання залежить від типу об’єднання (ключове слово how).

validate(str, optional) - Якщо вказано, перевіряє, чи об’єднання має вказаний тип.

● «one_to_one» або «1:1»: перевірте, чи унікальні ключі об’єднання в лівому та правому наборах даних.

● «one_to_many» або «1:m»: перевірте, чи унікальні ключі об’єднання в лівому наборі даних.

● «many_to_one» або «m:1»: перевірте, чи унікальні ключі об’єднання в правильному наборі даних.

● «many_to_many» або «m:m»: дозволено, але не призводить до перевірок.