В SearchInform обновлён алгоритм индексации компьютеров в сети.

01.01.2009

Вернуться к списку новостей Компания «СофтИнформ» объявляет о выходе новой версии программы SearchInform, корпоративной системы, предназначенной для полнотекстового поиска и поиска похожих по содержанию документов в больших объёмах данных.
Был принципиально переделан алгоритм индексации данных, находящихся в локальной сети предприятия, а также была ускорена индексация файлов в формате DjVu .

Новые функции SearchInform 4.0.01

В алгоритм индексации компьютеров, находящихся в локальной сети, были внесены принципиальные изменения. Теперь на каждом из компьютеров устанавливается программа агент, которая отслеживает все изменения, происходящие с файлами на данном компьютере. Все данные фиксируются в лог-файл. Ранее сканирование всех файлов на предмет изменений занимало много времени. Теперь же сканируется только лог файл, созданный программой-агентом, вследствие скорость обновления индекса была резко увеличена.

Также важной особенностью является то, что при установленном на рабочей станции программе-агенте данные теперь индексируются вне зависимости от того, какие папки находятся в общем доступе, а какие нет.

Вся проиндексированная информация помещается в хранилище, расположенное на сервере. Это позволяет производить поиск по всей информации независимо от того, на каком компьютере она была проиндексирована, и даже если компьютер на котором находится искомая информация будет выключен – она будет найдена. Размеры хранилища и временной интервал, на протяжении которого информация будет в нем сохраняться определяются пользователем.

Также была увеличена скорость индексации файлов в формате DjVu. Кроме этого была значительно улучшена русская морфология, что позволило повысить качество поисковой выдачи результатов для русскоязычных пользователей.

Основные возможности SearchInform:
- Фразовый поиск с учетом морфологии и словаря синонимов
- Новая технология поиска похожих документов SoftInform Search Technology
- Высокая скорость индексирования (от 15 до 30 Гб/час)
- Клиент-серверная архитектура
- Масштабируемость решения
- Функция кэширования запросов
- Поддержка более 60 распространенных текстовых форматов файлов, электронных сообщений Outlook и TheBat, тэгов mp3 и avi и логов программ мгновенного обмена сообщениями ICQ 99-2005 и Microsoft Messenger)
- Индексирование полей СУБД (Lotus, SQL, Oracle)