Pandas: Обʼєкт DataFrame

DataFrame - Двовимірні табличні дані зі змінним розміром, потенційно різнорідні. Структура даних також містить позначені осі (рядки та стовпці). Арифметичні операції вирівнюються на мітках рядків і стовпців. Можна розглядати як dict-подібний контейнер для об’єктів Series. Основна структура даних pandas. pandas.DataFrame(data=None, index=None, columns=None, dtype=None, copy=None) Параметри функції DataFrame(): data(ndarray (structured or homogeneous), Iterable, dict, or DataFrame) - Dict може містити ряди, масиви, константи, класи даних або спискові об’єкти. Якщо дані є dict, порядок стовпців відповідає порядку вставки. Якщо dict містить ряди, які мають визначений індекс, він вирівнюється за його індексом. Це вирівнювання також відбувається, якщо дані є серією або самим DataFrame. Вирівнювання виконується на входах Series/DataFrame. Якщо дані є списком dicts, порядок стовпців відповідає порядку вставки. index(Index or array-like) - Індекс для кінцевого кадру. За замовчуванням буде використано RangeIndex, якщо у вхідних даних немає інформації про індексування та не надано індекс. columns(Index or array-like) - Мітки стовпців для результуючого кадру, якщо їх немає в даних, за замовчуванням RangeIndex(0, 1, 2, …, n). Якщо дані містять мітки стовпців, натомість буде виконано вибір стовпців. dtype(dtype, default None) - Примусовий тип даних. Дозволяється лише один dtype. copy(bool or None, default None) - Копіювати дані з вхідних даних. Для даних dict стандартне значення None поводиться як copy=True. Для вхідних даних DataFrame або 2d ndarray значення за умовчанням None поводиться як copy=False. Якщо дані є dict, що містить одну або більше серій (можливо, різних dtypes), copy=False гарантує, що ці вхідні дані не копіюються. DataFrame.loc Доступ до групи рядків і стовпців за мітками або логічним масивом. .loc[] переважно базується на мітках, але також може використовуватися з логічним масивом. Дозволені вхідні дані: Одна мітка, напр. 5 або «a» (зверніть увагу, що 5 інтерпретується як мітка індексу, а не як ціла позиція в індексі). Список або масив міток, напр. ['a', 'b', 'c']. Об’єкт фрагмента з мітками, напр. 'a':'f'. Логічний масив такої ж довжини, що й вісь, яку розрізають, наприклад. [True, False, True]. Логічний ряд, який можна вирівняти. Індекс ключа буде вирівняно перед маскуванням. Вирівнюваний індекс. Індекс повернутого вибору буде вхідним. Callable функція з одним аргументом (серія виклику або DataFrame), яка повертає дійсний вихід для індексування (один із наведених вище) DataFrame.iloc Індексація на основі цілого розташування для вибору за позицією. .iloc[] переважно базується на позиції цілого числа (від 0 до довжини-1 осі), але також може використовуватися з булевим масивом. Дозволені вхідні дані: Ціле число, напр. 5. Список або масив цілих чисел, напр. [4, 3, 0]. Об’єкт фрагмента з ints, напр. 1:7. Логічний масив. Callable функція з одним аргументом (серія виклику або DataFrame), яка повертає дійсний вихід для індексування (один із наведених вище). Це корисно в ланцюжках методів, коли у вас немає посилання на об’єкт, що викликає, але ви бажаєте базувати свій вибір на якомусь значенні. Набір індексів рядків і стовпців. Елементи набору складаються з одного з наведених вище входів, наприклад. (0, 1). .iloc викличе IndexError, якщо запитуваний індексатор знаходиться поза межами, за винятком індексаторів фрагментів, які дозволяють індексувати поза межами (це відповідає семантиці фрагментів python/numpy).