Программа сравнения частей текстовых фрагментов
Алгоритм работы программы следующий:
текстовые фрагменты загружаются и хранятся в БД;
текст для сравнения вводится в поле на форме;
перед проверкой введенный для поиска текст разбивается на шинглы указанной длины (шингл - несколько следующих друг за другом слов);
для каждого шингла считается КС (контрольная сумма);
на форме выводится количество шинглов во фрагменте в соответствии с указанной длиной шингла;
из БД фрагментов последовательно берутся фрагменты, делятся на шинглы указанной длины, считаются КС каждого шингла и сравниваются с КС шинглов введенного текста;
найденные совпадения так же выводятся на форму.