Периодическая загрузка событий из журналов регистрации в базу MS SQL Server (с исходниками)

Еще один вариант парсера файлов журнала регистрации для 8.2.
Преимущества:
1) Читает файлы напрямую, что дает высокую скорость.
2) Знает, где остановилось чтение в прошлый раз, и начинает с этого места при следующем запуске.
3) Может работать и как windows-служба, и как обычное приложение.

Приложение написано на .NET 2.0.

Порядок работы:

1) На сервере MS SQL создать пустую базу данных.

2) На сервере приложений 1С, из БД которого нужно грузить события, под административными правами запустить EventLogLoaderManager.exe

3) Указать строку соединения с базой.

Можно использовать шаблоны:
для windows-авторизации Data Source=MSSQL1;Server=имя сервера;Database=имя базы;Integrated Security=true;
для обычной авторизации  Data Source=MSSQL1;Server=имя сервера;Database=имя базы;Password=Пароль;User ID=Имя пользователя;

4) Указать интервал между циклами чтения событий из ЖР. Допустимо ставить несколько секунд — на производительности сервера не скажется.

5) Отметить те БД, события из которых необходимо периодически загружать в базу.

6) Нажать «Сохранить параметры», при этом в каталоге программы создается файл настроек setting.ini

7) Если нужна периодическая загрузка – нажимаем «Установить службу», ищем в списке служб «EventLog loader service» и исправляем аккаунт, от имени которого будет работать служба. Если строка соединения содержит логин и пароль, то можно ничего не менять, если нет, то службу нужно запускать от имени правильной учетной записи windows, которая имеет полные права на SQL-базу с событиями.

8) Если нужна разовая загрузка – запускаем из каталога программы EventLogLoader.exe. Следует учесть, что это приложение, как и служба, работает в бесконечном цикле (проверяет новые события, пишет их в базу, делает паузу, затем повторяет заново), поэтому прерывается она при нажатии любой кнопки мыши.

 

 

Некоторые особенности

1)      Для каждой ИБ журнал регистрации грузится в отдельном потоке. Если начнете грузить по сотне баз, то велика вероятность на начальном этапе повесить сервер. В дальнейшем, если проверять новые события достаточно часто (например, каждые 10 секунд), то служба быстро их записывает в базу без особой загрузки сервера.

2)      Если загрузку прервать, то при повторном запуске она продолжится с места остановки (позиция сохраняется в БД).

3)      Таблицы в БД создаются автоматически. Если вы удалили какая-нибудь таблицу — надо перезапустить службу.

4)      Все события по всем ИБ хранятся в одной таблице. Разделитель – колонка «Код информационной базы».

5)      Логи с ошибками хранятся в каталоге программы в папке «log».

6)      Работает только с платформой 8.2 (файлами lgf и lgp).

7)      В таблицах созданы только основные кластерные индексы по полю «Код информационной базы». Для ускорения запросов, которые вам требуются регулярно, нужно добавлять свои индексы.

8)      Несколько полей осталось нераспознанными (Field2, Field7, Field8). Если вам известно их назначение — сообщите, пожалуйста.

 

Описание таблиц

 

1) Infobases — список обрабатываемых ИБ. Код генерируется автоматически при добавлении новой базы в этот список. Эти же коды определяют принадлежность записей в определенной ИБ во всех других таблицах.

2) Params — хранит последние прочитанные файлы и позиции в них.

3) Назначение остальных таблиц понятно из их названия. Итоговая таблица  с событиями с присоединенными справочниками

SELECT     TOP (1000) Infobases.Name, Events.DateTime, Events.TransactionStatus, Events.TransactionStartTime, Events.TransactionMark,
                     
Users.Name AS [User], Computers.Name AS Computer, Applications.Name AS App, Events.Field2, EventsType.Name AS EventType,
                     
Events.EventType, Events.Comment, Metadata.Name AS Metadata, Events.DataStructure, Events.DataString,
                     
Servers.Name AS [Server], MainPorts.Name AS MainPort, SecondPorts.Name AS SecondPort, Events.Seance
FROM         Events INNER JOIN
                     
Applications ON Events.InfobaseCode = Applications.InfobaseCode AND Events.AppName = Applications.Code INNER JOIN
                     
Computers ON Events.InfobaseCode = Computers.InfobaseCode AND Events.ComputerName = Computers.Code INNER JOIN
                     
EventsType ON Events.InfobaseCode = EventsType.InfobaseCode AND Events.EventID = EventsType.Code INNER JOIN
                     
Infobases ON Events.InfobaseCode = Infobases.Code INNER JOIN
                     
Users ON Events.InfobaseCode = Users.InfobaseCode AND Events.UserName = Users.Code INNER JOIN
                     
SecondPorts ON Events.InfobaseCode = SecondPorts.InfobaseCode AND Events.SecondPortID = SecondPorts.Code INNER JOIN
                     
Servers ON Events.ServerID = Servers.Code AND Events.InfobaseCode = Servers.InfobaseCode INNER JOIN
                     
MainPorts ON Events.InfobaseCode = MainPorts.InfobaseCode AND Events.MainPortID = MainPorts.Code INNER JOIN
                     
Metadata ON Events.InfobaseCode = Metadata.InfobaseCode AND Events.MetadataID = Metadata.Code

 

Объемы получаемой информации

Хранение структурированных данных более затратное с точки зрения требуемого места на дисках.
Иными словами — объем базы данных будет существенно больше суммы объемов всех ЖР, которые были обработаны и загружены.

Реальный пример:

2 информационные базы с объемом ЖР 2132 Мб (1192+971).  Время первичного разбора в 2 потока (т.к. базы 2) — около 1,5 часов.

Общее количество событий — 19’507’484 млн.

Объем базы на MS SQL Server — 12879 Мб, т.е. примерно в 6 раз больше!

НО — если применить сжатие таблиц, как, например, описано здесь, то получим 1610 Мб, т.е. даже меньше исходных данных.
К сожалению, не все версии MS SQL Server поддерживают сжатие.

 

39 Comments

  1. aspirator23

    Спасибо, как всегда интересная нестандартная публикация.

    Работа с журналами в больших базах — это всегда хлопотное дело.

    Reply
  2. Aleksey.Bochkov

    (2) — программа была разработана ранее ваших публикаций, но только сейчас дошли руки оформить ее в нормальном виде. Плюс — она же бесплатная.

    Вот если бы я использовал ваши разработки для коммерческой версии, тогда претензия была бы обоснована.

    Reply
  3. cool.vlad4

    (3) с вашими знаниями вы вполне могли использовать File.SetCreationTime 😉

    Reply
  4. Aleksey.Bochkov

    (4) вот предыстория. Так убедительнее? 🙂

    Reply
  5. Антон Ширяев

    (3)

    тогда претензия была бы обоснована

    Претензии не было, было указано лишь на то, что некорректно не ссылаться на публикации которые перекликаются с вашей, т.к. до этого на Инфостарте не было публикаций где применялось прямое чтение файлов журнала регистрации.

    Ну и конечно же это ваше дело, но раз уже был разобран формат файлов журнала регистрации, то могли бы и оставить свои комментарии к моим публикациям, например что в 8.2 значат справочники 11, 12 и 13, встречаются ли другие справочники, всегда ли последней колонке {0}, как корректно разбирать {«P»,…

    Reply
  6. Valet

    (0)Приложите обработку для просмотра ЖР на SQL из 1С, тогда это будет законченное решение.

    Да, многим не составит труда её саму написать, но лень/некогда/немогу(нужное подчеркнуть) и другие причины уменьшают количество потенциальных пользователей.

    Reply
  7. kiruha

    Насколько сказывается работа этой программы на производительности основной базы ?

    Возможен ли вариант блокировок и т.п. ?

    Reply
  8. Aleksey.Bochkov

    (8) kiruha,

    Насколько сказывается работа этой программы на производительности основной базы ?

    Приложение никак не взаимодействует с основной базой. Данные читаются из файлов на сервере приложений 1С.

    Но вычислительная нагрузка, конечно присутствует. Если баз несколько, то ее будет незаметно. Если же запустить загрузка ЖР сразу из сотни — какую-то существенную долю процессора и дисков приложение съест.

    Возможен ли вариант блокировок и т.п. ?

    Нет.

    Reply
  9. adapter

    А что потом делать с этими данными в SQL ? как отобрать все записи об изменении приходной накладной №000345 ? или выбрать все что ввела за сегодня Маша Иванова? Сравнить с Таней Петровой? Информация имеет смысл если ее можно легко обработать.

    Reply
  10. Aleksey.Bochkov

    (10) adapter,

    Алгоритм тут будет очень похож на тот, который вы бы сделали для решения аналогичной задачи с журналом регистрации внутри 1С.

    Идентификаторы пользователей и объектов метаданных есть. ГУИДы объектов также. Пишите правильный запрос и получите правильные данные :).

    Вот тут есть хороший вариант применения — http://infostart.ru/public/182833/. Решается, казалось бы, легкая задача, но на самом деле совсем нетривиальная (т.к. в 1С до сих пор нет нормальных штатных инструментов для получения реальной длительности записи и проведения документов, точнее, длительности транзакций).

    Но я бы сказал так — инструмент предназначен скорее всего для тех, кто понимает — что потом с этими данными в SQL делать :).

    Reply
  11. chmv

    Тормозит?

    Reply
  12. newgluk

    в MS SQL 2012: (ERROR): Ошибка получения ID ИБ из БД (mybase). System.Data.SqlClient.SqlException: Invalid object name ‘dbo.Infobases’.

    Или это я с правами не разобрался?

    Reply
  13. vis_tmp

    (11) Алексей, будет ли программа корректно отрабатывать в случае удаления файла журнала регистрации.

    Ситуация следующая: имеем файл журнала регистрации большого объёма, начали пользоваться вашей программой.

    Потом решили этот большой файл удалить, чтобы он начался заново.

    Программа будет переносить записи уже из нового файла и добавлять их к уже имеющимся в SQL ?

    Reply
  14. Aleksey.Bochkov

    (14) vis_tmp,

    Позиция, с которой необходимо продолжать чтение в журнале регистрации, хранится в разрезе имен файлов.

    Т.е. если файл будет удален то 1С создаст новый с новым именем, а чтение начнется с начала и записи будут добавляться к уже имеющимся.

    Кстати, у меня уже новая версия есть.

    — добавил загрузку из нового формата журнала регистрации 8.3 (SQLite)

    — добавил возможность загрузки событий в MySQL базу данных.

    — менеджер настроек теперь отображает файловые базы пользователя, также можно добавить путь вручную.

    — исправил пару ошибок в загрузке событий.

    Бинарники во вложении, публикацию обновлю позже.

    Но я не тестировал на 32-разрядной системе..

    Reply
  15. dimon_upi

    Спасибо большое. Очень полезно, давно сам хотел сделать, но уж больно много вкусностей вы положили в свою работу.

    Reply
  16. xinex

    Алексей, периодически останавливается загрузка данных ЖР в базу.

    ПО EventLogLoader грузит ядро процессора на 100%, но данные в SQL не пишет.

    Спасибо за данное ПО, сильно помогает в работе.

    upd:

    Нашел причину. EventLogLoader не может корректно обработать события, где очень большой коментарий:

    {20140917161102,N,

    {0,0},129,1377,4,5280,32,E,»{ОбщийМодуль.Название.Модуль(1467)}: {«»#»»,e199ca70-93cf-46ce-a54b-6edc88c3a296,

    {#base64: здесь 323КБ символов в 9800 строках

    }

    }»,0,

    {«S»,»Расчет завершен.»},»»,1,14,2,10485,0,

    {0}

    }

    Reply
  17. milanse

    Привет.

    У меня сейчас реализован сбор данных через ком, на основании местной же разработки, хотел переписывать через вебсервис, но это, походу не нужно 😉

    Работает весьма и весьма шустро. не нужно парсить гигабайтные xml выгрузки журналов.

    Сейчас тестирую параллельную загрузку журнала 1 базы из 3-х источников — работающая база, 2 файла журнала, которые в один прекрасный момент пришли в негодность. Пока все работает

    Использую бинарник 1.1.2.1.zip т.к. журналы в формате sqlight — не заполняется колонка [MetadataID] видимо metadataCodes в базе там ид метаданных через запятую, а для связи используется таблица EventLogMetadata, не смотрел еще, но скорее всего когда в metadataCodes несколько кодов (типа события регистрации ошибок доступа) то в ней на каждую запись события несколько записей кодов метаданных.

    сырцов нет, поправить особо возможности тоже, если есть возможность сделать в [MetadataID] первый по счету ИД — было бы здорово.

    Со своей стороны выложу обработку для открытия событий по объекту с обращением к базе журнала. т.к. буду использовать сие в своих конфах.

    Reply
  18. Aleksey.Bochkov

    (18)

    Исходники есть тут — https://github.com/alekseybochkov/EventLogLoader

    Reply
  19. nwomib

    Очень большая просьба, там же выкладывать скомпилированные варианты т.к. уже немного запарился компилировать, вечные ошибки.

    Будет ли фича очистки за собой логов с настройкой глубины чистки?

    Reply
  20. nwomib

    Имеется в виду, прочёл лог 1ски , прошло 5 дней и почистил лог 1ски.

    Reply
  21. Aleksey.Bochkov

    Попробовал собрать актуальную версию… не уверен, что все правильно сделал, т.к. давно не занимался.

    Скачать можно здесь: https://github.com/alekseybochkov/EventLogLoader/releases/tag/1.0.0.2

    Если будут проблемы — попробую поправить.

    Reply
  22. Oleg1978

    Алексей, добрый день!

    Я правильно понимаю, что журнал регистрации 1С отображать на Microsoft SQL Server штатными настройками невозможно (по аналогии со всеми другими таблицами информационной базы)? А Ваша обработка как раз и формирует на SQL необходимые таблицы и загружает в нее данные из файла ? Подскажите, пожалуйста, Ваша обработка может работать с версией Предприятия 1С 8.3.7 и файлом .lgf ? Спасибо!

    Reply
  23. farukshin

    (10) adapter,

    А что потом делать с этими данными в SQL ?

    Как вариант — анализ и визуализация данных в ElasticSearch http://infostart.ru/public/545895/

    Reply
  24. zarucheisky

    (24) Oleg1978, с версией Предприятия 1С 8.3.7 ЖР хранится в формате SQLite — можно поставить ODBC драйвер.

    Reply
  25. alyaev.a.v

    Хорошо бы кто поправил ошибку при загрузке, например такая запись останавливает загрузку и сервис тупо висит:

    {20160418154655,N,

    {0,0},63,1,4,113934,75,E,»»,98,

    {«S»,»{ОбщийМодуль.ОбщегоНазначения.Модуль(6907)}: Не удалось записать «»Документ 0001834 от 07.11.2015 13:45:11″»!(ТУТ ПЕРЕВОД НА СЛЕД СТРОКУ)

    Для документа договор обязательно должен быть заполнен!!!(ТУТ ПЕРЕВОД НА СЛЕД СТРОКУ)

    ВызватьИсключение СокрЛП(КраткоеПредставлениеОшибки(Информация) + Символы.ПС + СокрЛП(ТекстИсключения));»},»»,1,8,0,21665,0,

    {2,1,1,2,1}

    }

    если в тексте убрать перевод строки и сделать так(удалить переводы строк в описании сообщения)то все работает :

    {20160418154655,N,

    {0,0},63,1,4,113934,75,E,»»,98,

    {«S»,»{ОбщийМодуль.ОбщегоНазначения.Модуль(6907)}: Не удалось записать «»Документ 0001834 от 07.11.2015 13:45:11″»!Для документа договор обязательно должен быть заполнен!!! ВызватьИсключение СокрЛП(КраткоеПредставлениеОшибки(Информация) + Символы.ПС + СокрЛП(ТекстИсключения));»},»»,1,8,0,21665,0,

    {2,1,1,2,1}

    }

    Reply
  26. baton_pk
  27. zzz_natali

    (23) Ваш запрос T-SQL не выводит данные. Формируются заголовки столбцов и всё. Данные в базе есть(ибо если ручками делать select top 1000, то выводит потроха). В чём может быть прикол? Спасибо.

    Reply
  28. JohnyDeath

    (29) какой формат лога? Текст?

    Reply
  29. zzz_natali

    (30) Формат lgf/lgp. Текст чего, запроса? — взят с публикации.

    Reply
  30. SashkaIvanov

    Произошел какой-то сбой, в таблице Events выдаются записи которые не от этой базы, не к тому пользователю. Если сравнивать файловый, и то что в БД, имеется запись с датой и id но пользователь не тот, и событие не то. как будто что-то перепуталось (сервис работает сразу с 3 базами) и чать данных от одной базы, а часть от другой. Если ли возможность как-то исправить данную ошибку. И есть ли возможность например вызвать что-то чтобы удалить записи по последнему лог файлу, и запустить повторный экспорт.(Пойдет ли вариант удаления в params и зачистка всех таблиц от данного кода Infobases?)

    Reply
  31. SashkaIvanov

    Новая версия к старой базе БД не создает колонку в params LastEventID из-за этого запись не создается

    Reply
  32. SashkaIvanov

    Сейчас пытаюсь все таки понять что произошло, произошло что-то с бд. Таблица User заполнена криво, то есть коды пользователей в таблице EVENTS соответствуют кодам USER, но в таблице USER какие-то левые пользователи под этими кодами. Пробовал по ГУИДУ искать пользователей в базе,(Гуид который указан в колонке GUIS , ничего не находит.) откуда тогда они взялись. Сразу скажу в базе Гуиды не поменялись, ну даже если и поменялись, ведь загрузка должна была создать новую строку, чего не произошло. В общем на текущий момент пока что ошибка в том что таблица USER кривая, и не понятно как ее перезаполнить, ведь удалив из таблицы все, и затем запустив загрузчик, User приедут с новыми кодами, и все предыдущие логи будут утерены!

    Reply
  33. alyaev.a.v

    Предыдущий коммент не правильно описал исправить нет возможности, вот так правильно:

    1.Если винда где стоит сервер 1с русская и файл в новом формате, в базу с логами попадает не читаемый текст.

    2.Если настроено на онлайн чтение лога(база активно работает логи в старом формате, режутся по дням) периодически загрузка логов останавливается, хотя база активно пишет в файл и получается что часть данных до окончания текущего дня теряется, на след день создается новый файл лога, программа считает что старый файл прочитан полностью и начинает чтение нового файла. Выяснить удалось что номер последнего символа который сохранен в файле загрузчика указывает на конец строки, хотя в процессе чтения обычно указывает на начало строки например:

    {20180515000000,C,

    {2430080b7a000,2cf},101,161,3,235565,1,I,»»,0,

    {«U»},»»,2,10,0,4885,0,

    {2,1,1,2,1}

    },КОГДА СЛУЧАЕТСЯ ОСТАНОВКА И ЧТЕНИЕ ПРЕКРАЩАЕТСЯ НОМЕР ПОЗИЦИИ УКАЗЫВАЕТ СЮДА

    ОБЫЧНО НОМЕР ПОЗИЦИИ УКАЗЫВАЕТ СЮДА И ВСЕ РАБОТАЕТ ХОРОШО{20180515000000,C,

    {2430080b7a000,2cf},101,161,3,235565,2,I,»»,0,

    {«U»},»»,2,10,0,4885,0,

    {2,1,1,2,1}

    },

    Если руками в файле поправить позицию, установить на начало строки то чтение возобновляется и файл дочитывается нормально.

    Reply
  34. Noxie41

    (29) Проблема во внутреннем соединении в запросе по таблице дополнительного ip порта.

    Исправленный запрос ниже:

    SELECT TOP (1000) Infobases.Name,
    Events.DateTime,
    Events.TransactionStatus,
    Events.TransactionStartTime,
    Events.TransactionMark,
    Users.Name AS [User],
    Computers.Name AS Computer,
    Applications.Name AS App,
    Events.Field2,
    EventsType.Name AS EventType,
    Events.EventType,
    Events.Comment,
    Metadata.Name AS Metadata,
    Events.DataStructure,
    Events.DataString,
    Servers.Name AS [Server],
    MainPorts.Name AS MainPort,
    SecondPorts.Name AS SecondPort,
    Events.Seance
    FROM EVENTS
    INNER JOIN Applications ON Events.InfobaseCode = Applications.InfobaseCode
    AND Events.AppName = Applications.Code
    INNER JOIN Computers ON Events.InfobaseCode = Computers.InfobaseCode
    AND Events.ComputerName = Computers.Code
    INNER JOIN EventsType ON Events.InfobaseCode = EventsType.InfobaseCode
    AND Events.EventID = EventsType.Code
    INNER JOIN Infobases ON Events.InfobaseCode = Infobases.Code
    INNER JOIN Users ON Events.InfobaseCode = Users.InfobaseCode
    AND Events.UserName = Users.Code
    LEFT JOIN SecondPorts ON Events.InfobaseCode = SecondPorts.InfobaseCode
    AND Events.SecondPortID = SecondPorts.Code
    INNER JOIN Servers ON Events.ServerID = Servers.Code
    AND Events.InfobaseCode = Servers.InfobaseCode
    INNER JOIN MainPorts ON Events.InfobaseCode = MainPorts.InfobaseCode
    AND Events.MainPortID = MainPorts.Code
    INNER JOIN Metadata ON Events.InfobaseCode = Metadata.InfobaseCode
    AND Events.MetadataID = Metadata.Code
    

    Показать

    Reply
  35. dimkakopylow001

    Откуда подтягивается список баз данных ?

    Reply
  36. Aleksey.Bochkov

    (38) Список баз читается из конфигурационных файлов кластера 1С (1CV8Reg.lst для 8.2, 1CV8Clst.lst для 8.3) — будут отображены все текущие рабочие базы.

    Reply
  37. _KUL

    Алексей, здравствуйте!

    Подскажите пожалуйста, как вы получаете данные о именах пользователей, компьютерах и т.д., для ассоциации с id номерами в логах? Или укажите ссылочку на блоки кода на гитхабе. В таком масштабном проекте для такой маленькой задачи и на таком не особо популярном ЯП написано, тяжко вникать … 🙂

    Reply
  38. Aleksey.Bochkov

    (40) если ЖР в файловом формате, то справочники хранятся в отдельном файле. Парсер тут — https://github.com/alekseybochkov/EventLogLoader/blob/master/EventLogLoader­Service/EventLogProcessor.vb#L1168

    В SQLite формате для каждого справочника создана отдельная таблица. Запросы тут — https://github.com/alekseybochkov/EventLogLoader/blob/master/EventLogLoader­Service/EventLogProcessor.vb#L1095

    А вообще вопрос не очень понятен…

    Reply
  39. _KUL

    (41)

    Большое Вам спасибо за ответ! Как то упустил из виду файлик 1Cv8.lgf … Делаю распределённую систему с хранением в SQL, пока для 8.2, ваши исходники как «библия» :), но логику всё равно немного по другому сделал …

    Reply

Leave a Comment

Ваш адрес email не будет опубликован. Обязательные поля помечены *