Следопыт 1.3 для Windows 95

Программа для смыслового поиска документов

Программа «Следопыт» предназначена для «смыслового» поиска информации в русских и английских текстах по запросам на естественном языке. Программа основана на технологии нечёткого поиска текстовой информации, разработанной компанией «МедиаЛингва».

Поиск документов нужен всем. Как найти нужный документ на жёстком диске, если он был создан несколько месяцев назад? В принципе, можно запустить Norton Commander™ или Explorer™ и просто поискать нужный файл. Если Вы не гений делопроизводства и не держите в голове развитую и логичную структуру всех своих документов за последние два года, скорее всего, Вы потратите массу времени с неопределённым результатом, особенно, если имя нужного файла не прямо связано с его содержанием. Очевидно, хотелось бы находить документы каким-нибудь автоматическим способом.

Чем плохи стандартные средства поиска? Средства поиска документов по содержанию, конечно,существуют. Можно, например, запустить функцию поиска документов, входящую в состав Microsoft Word™. Многие из нас пробовали это делать; результат, увы, часто неутешительный. Как и большинство других стандартных средств, эта функция ищет заданный текст только буквально, как строку символов, и при этом ничего не знает о высоком разнообразии форм русских слов. В случае, когда Вы помните содержание нужного документа только в общем, подобные средства поиска практически бесполезны. 

Что умеет «Следопыт». «Следопыт» обеспечивает удобный и эффективный поиск документов по их содержанию в среде Microsoft Word™ версий 6.0 или 7.0, а также MS Office 97. Достаточно выделить фрагмент текста в окне Microsoft Word и нажать кнопку на Панели инструментов, чтобы «Следопыт» нашел все близкие по содержанию документы. Найденные документы не обязательно содержат те же слова в том же порядке и в тех же грамматических формах.

Вы можете ввести запрос и с клавиатуры, при этом нет никаких ограничений на форму запроса (кроме, конечно, рамок общественных приличий). Запрос может содержать русские, английские и немецкие слова в любых грамматических формах.

Дополнительное удобство заключается в том, что «Следопыт» предъявляет найденные документы в порядке их соответствия теме запроса, то есть наиболее важным для Вас в большинстве случаев будет первый из найденных документов.

Как это делается. Программа выполняет нечёткий поиск, вычисляя степень близости документов и запроса. Применяется ряд специальных вероятностных моделей, словари шумовых слов, машинная морфология русского, английского и немецкого языка и другие интеллектуальные средства. Эффективность поиска не зависит от лексики предметной области и одинакова как для газетных и деловых текстов, так и для документов по узким тематическим направлениям.

Технические подробности. При поиске поддерживаются текстовые форматы Word 2.0, Word 6.0 / 7.0, HTML и ASCII. Скорость обработки документов примерно 35 миллионов символов в минуту (для компьютера типа 486DX4-100).

Пример использования технологии «Следопыт» для поиска информации в Интернет - Интеллектуальная метапоисковая машина «Следопыт».