Перетворення текстового рядка на масив слів – це фундаментальна операція в програмуванні, яка відкриває двері до широкого спектру можливостей обробки та аналізу тексту. Від простих завдань, таких як підрахунок слів або пошук певних фраз, до складніших алгоритмів обробки природної мови, ця операція є невід'ємною частиною багатьох програмних рішень.
У сучасному світі, де обсяги текстових даних зростають експоненціально, здатність ефективно розбивати текст на окремі складові є критично важливою. Це дозволяє нам видобувати цінну інформацію з текстів, аналізувати настрої, класифікувати документи, перекладати мови та багато іншого.
Перетворення текстового рядка на масив слів – це поширена задача в програмуванні, яка дозволяє розбити текст на окремі складові для подальшого аналізу або обробки.
Це найбільш універсальний і часто використовуваний метод. Він розбиває рядок на підрядки на основі заданого роздільника.
Роздільником можуть бути пробіли, коми, крапки, символи нового рядка або будь-які інші символи чи послідовності символів.
#ПРИКЛАД ПРОГРАМИ
string1 = "Це приклад рядка для розбиття на слова."
word1 = string1.split()
print(word1) # Виведе: ['Це', 'приклад', 'рядка', 'для', 'розбиття', 'на', 'слова.']
string2 = "яблуко,банан,груша"
word2 = string2.split(",")
print(word2) #Виведе: ['яблуко', 'банан', 'груша']
Один із найуніверсальніших способів поділу рядка за декількома роздільниками — використання регулярних виразів. Для цього потрібно застосувати модуль re та функцію re.split().
Наприклад, щоб розділити рядок за комами та крапками, можна використати наступний код:
import re
string = "Петренко,Зубицький.Селезньва,Протасевич"
words = re.split("[,.]", string)
print(words) # ['Петренко', 'Зубицький', 'Селезньова', 'Протасевич']
У цьому прикладі ми застосували регулярний вираз [,.], який означає «розділювачі — коми та крапки». Функція re.split() розділяє рядок string на підрядки за цими роздільниками та повертає список рядків.
Якщо потрібно розділити рядок за кількома роздільниками, які відомі заздалегідь, можна скористатися методом replace(). Спочатку потрібно замінити всі роздільники на той самий символ, а потім застосувати метод split() для розділення рядка по цьому символу.
Наприклад, щоб розділити рядок за комами та крапками, можна використати наступний код:
string = "Петренко,Зубицький.Селезньва,Протасевич"
s = string.replace("," , ".") # замінюємо коми на крапки
words = s.split(".")
print(words) # ['Петренко', 'Зубицький', 'Селезньова', 'Протасевич']
У цьому прикладі ми замінюємо всі коми на крапки за допомогою методу replace(), а потім розділяємо рядок по крапках за допомогою методу split().
Створіть програму, де необхідно з клавіатури вводити рядок. Поділіть рядок за одним роздільником.
Створіть програму, де необхідно з клавіатури вводити рядок. Поділіть рядок за декількома роздільниками.
Розв’язати 3 задачі з блоку «Виконайте самостійно». Результат надіслати на електронну пошту вчителя: voronenko@54.edu.ks.ua