Информацио́нный по́иск (англ. information retrieval) — процесс поиска неструктурированной документальной информации, удовлетворяющей информационные потребности.
Виды поиска информации
Полнотекстовый поиск — поиск по всему содержимому документа. Пример полнотекстового поиска — любой интернет-поисковик, например www.yandex.ru, www.google.com. Как правило, полнотекстовый поиск для ускорения поиска использует предварительно построенные индексы. Наиболее распространенной технологией для индексов полнотекстового поиска являются инвертированные индексы.
Поиск по метаданным — это поиск по неким атрибутам документа, поддерживаемым системой — название документа, дата создания, размер, автор и т. д. Пример поиска по реквизитам — диалог поиска в файловой системе (например, MS Windows).
Поиск изображений — поиск по содержанию изображения. Поисковая система распознает содержание фотографии (загружена пользователем или добавлен URL изображения). В результатах поиска пользователь получает похожие изображения. Так работают поисковые системы: Polar Rose, Picollator и др.
Методы поиска
Адресный поиск
Процесс поиска документов по чисто формальным признакам, указанным в запросе.
Семантический поиск - процесс поиска документов по их содержанию.
Документальный поиск
Процесс поиска в хранилище информационно-поисковой системы первичных документов или в базе данных вторичных документов, соответствующих запросу пользователя.
Фактографический поиск
Процесс поиска фактов, соответствующих информационному запросу.
Что такое компьютерная лингвистика и как технологии на её основе помогают людям с ограниченными возможностями здоровья
За последние 200 лет человечество успешно автоматизировало многие задачи с помощью механических и электрических устройств, которые продолжают служить обществу в повседневной жизни. Во второй половине XX века внимание людей переключилось на автоматизацию обработки естественного языка (Natural Language Processing, NLP). С тех пор устройства выполняют не только механические функции, но и интеллектуальные.
Компьютерная лингвистика — это область знаний, которая занимается компьютерным моделированием владения естественным языком и решением прикладных задач автоматической обработки текстов и речи.
решением прикладных задач автоматической обработки текстов и речи.
Синтез речи и генерирование текста — ключевые задачи компьютерной лингвистики
Перед компьютерной лингвистикой стоят задачи лингвистического обеспечения процессов сбора, накопления, обработки и поиска информации. Самые важные из них:
Распознавание и синтез речи.
Генерирование текста.
Автоматический перевод текстов.
Создание и использование электронных корпусов текстов.
Извлечение информации из текста.
Автореферирование.
Автоматическое обнаружение и исправление ошибок при вводе текста на компьютере.
Создание вопросно-ответных систем.
Создание электронных словарей, тезаурусов, онтологий.
Очки для незрячих и гайд по цифровой доступности: разработки, которые уже помогают людям с ограниченными возможностями
Американская компания LC Technologies изобрела устройство, которое даёт людям возможность управлять компьютером одними глазами. Eyegaze Edge помогает пользователям с церебральным параличом, мышечной дистрофией, синдромом Ретта и другими обездвиживающими нарушениями писать сообщения, генерировать речь и пользоваться интернетом.
Euphonia — исследовательская инициатива по сбору и анализу образцов голоса людей с нарушением речи. В рамках проекта корпорация планирует создать систему машинного обучения, распознающую речь, а также индивидуальные технологии воспроизведения голоса.
Ещё одна инициатива Google призвана помочь глухим или слабослышащим людям. Во время телефонного разговора программа преобразует речь собеседника в текст и говорит от имени пользователя, пока тот набирает сообщение. Для применения инструмента не требуется подключение к интернету.
При помощи очков Voice vision любой незрячий человек может воспринимать пространство через звук. Разработка дополняет традиционные методы вроде белой трости, ультразвуковых фонариков и глазных имплантов, чтобы человек мог свободно перемещаться по городу, быть активным и самостоятельным членом общества.
Калифорнийский стартап Cognixion разрабатывает гарнитуру дополненной реальности для людей с нарушением речи. Устройство будет обладать нейронным интерфейсом и сможет считывать мысли, после чего воспроизводить их в виде понятной речи.
Livox
Разработка Livox — коммуникационное приложение на основе пиктограмм, которое помогает людям с широким спектром визуальных и двигательных нарушений участвовать в разговоре. С помощью классификатора на основе машинного обучения и NLP сервис определяет конкретные вопросы и предлагает пользователям наиболее актуальные пиктограммы.