Конфигурация «Каталог файлов» с полнотекстовым поиском по содержимому



Возможности программы позволяют создавать каталог и осуществлять полнотекстовый поиск по любым типам файлов, которые умеет индексировать операционная система(txt, doc, pdf, html, медиафайлы, архивы и многие другие). Кроме того, дополнительно можно расширить эту функцию с помощью соответствующего внешнего консольного приложения.

1С:Предприятие не имеет возможности осуществлять полнотекстовый поиск по текстам из внешних файлов, а только по информации, содержащейся внутри объектов своей системы. Чтобы такая возможность появилась были проведены описанные ниже работы.

В конфигурации был добавлен справочник «Файлы», для которого был добавлен реквизит «ТекстФайла» В этот реквизит при добавлении файла в программу автоматически или вручную, загружается текст файла, очищенный от всего лишнего – тегов оформления, картинок и т.п. И уже по этому реквизиту будет осуществляться полнотекстовый поиск.

Для извлечения текста из файлов используется интерфейс IFilter. Он является расширяемым. Можно установить дополнительные модули, чтобы появилась возможность извлекать текст из еще одного типа файлов. По умолчанию текст извлекается из файлов следующих типов (имеющих расширение): ASCX, ASP, ASPX, CSS, HHC, HTA, HTM, HTML, HHT, HTW, HTX, ODC, STM, DOC, DOT, POT, PPS, PPT, XLB, XLC, XLS, XLT, TXT, EML. Подразумевается, что файлы с расширением TXT — это текстовые файлы в кодировке ANSI или UNICODE (UTF-16).

Плагины IFilter позволяют службе индексирования Windows(и Windows Desktop Search) индексировать различные форматы так, чтобы они стали доступными для поиска. Без соответствующего IFilter, содержимое файла не может быть прочитано и проиндексировано поисковой системой. IFilters также используются SQL Server в качестве компонента SQL Server Full Text Search.

Для работы программы с форматом PDF необходимо установить расширение PDF IFilter, с CHM — расширение CHM IFilter.

Чтобы узнать, какие расширения для IFilter уже установлены на вашем компьютере, можно скачать и установить программу IFilter Explorer.

То есть возможности программы позволяют создавать каталог и осуществлять полнотекстовый поиск по любым типам файлов, которые умеет индексировать операционная система. В этом списке присутствуют даже архивы. Это без учета того, что можно расширить эту функцию с помощью внешнего приложения.

В конфигурации используются (большое спасибо авторам):

//infostart.ru/public/121926/

//infostart.ru/public/105063/

Ссылка на страничку автора с более подробным описанием: Конфигурация «Каталог файлов» с полнотекстовым поиском

Leave a Comment

Ваш адрес email не будет опубликован. Обязательные поля помечены *