Пример механизма параллельной обработки данных




Принцип обмена данными из 1С с сайтом (на MySQL) и выдачи (публикации) этих данных по запросу.
PHP-Скрипт автоматической загрузки данных из файла данных в формате CSV в базу данных сайта работающего на WordPress.

В продолжение моей темы: 1С:Альфа-Авто Автосалон Автосервис: обмен с сайтом.
С помощью данного скрипта можно загружать в автоматическом режиме, по расписанию, данные сервисных книжек (ремонтов авто) из 1С:Альфа-Авто Автосалон Автосервис.
Также можно загружать данные в ручном режиме: для этого делается скрытая страница, где размещается специальная кнопка.
Комментарии размещенные внутри скрипта разъяснят логику и порядок действия.
Комментарии с "/////    echo" использовались для отладки.
Дополнительно создана таблица для журналирования результатов загрузки данных.
Скрипт включает в себя защиту от SQL инъекций (думаю безопасность соблюдена в полной мере).
В кратце:
1. Пишется скрипт, который запускает этот.
2. Создается регламентное задание в WordPress, по которому запускается скрипт из п.1. 
3. Этот скрипт осуществляет проверку на существование файла обмена в папке.
4. Если данные не новые, загрузка не производится.
5. Если данные новые, очищается таблица сервисных книжек.
6. Загружаются новые данные.

Собственно сам скрипт:

<?php // Полная загрузка сервисных книжек, создан 2024-01-05 12:44:55

global $wpdb2;
global $failure;
global $file_hist;

/////  echo '<H2><b>Старт загрузки</b></H2><br>';

$failure=FALSE;
//подключаемся к базе
$wpdb2 = include_once 'connection.php'; ; // подключаемся к MySQL
// если не удалось подключиться, и нужно оборвать PHP с сообщением об этой ошибке
if (!empty($wpdb2->error))
{
/////   echo '<H2><b>Ошибка подключения к БД, завершение.</b></H2><br>';
$failure=TRUE;
wp_die( $wpdb2->error );
}

$m_size_file=0;
$m_mtime_file=0;
$m_comment='';
/////проверка существования файлов выгрузки из 1С
////файл выгрузки сервисных книжек
$file_hist = ABSPATH.'/_1c_alfa_exchange/AA_hist.csv';
if (!file_exists($file_hist))
{
/////   echo '<H2><b>Файл обмена с сервисными книжками не существует.</b></H2><br>';
$m_comment='Файл обмена с сервисными книжками не существует';
$failure=TRUE;
}

/////инициируем таблицу лога
/////если не существует файла то возврат и ничего не делаем
if ($failure){
///включает защиту от SQL инъекций и данные можно передавать как есть, например: $_GET['foo']
/////   echo '<H2><b>Попытка вставить запись в лог таблицу</b></H2><br>';
$insert_fail_zapros=$wpdb2->insert('vin_logs', array('time_stamp'=>time(),'last_mtime_upload'=>$m_mtime_file,'last_size_upload'=>$m_size_file,'comment'=>$m_comment));
wp_die();
/////    echo '<H2><b>Возврат в начало.</b></H2><br>';
return $failure;
}
/////проверка лога загрузки, что бы не загружать тоже самое
$masiv_data_file=stat($file_hist);   ////передаем в массив свойство файла
$m_size_file=$masiv_data_file[7];    ////получаем размер файла
$m_mtime_file=$masiv_data_file[9];   ////получаем дату модификации файла
////создаем запрос на получение последней удачной загрузки
////выбираем по штампу времени создания (редактирования) файла загрузки AA_hist.csv, $m_mtime_file

/////   echo '<H2><b>Размер файла: '.$m_size_file.'</b></H2><br>';
/////   echo '<H2><b>Штамп времени файла: '.$m_mtime_file.'</b></H2><br>';
/////   echo '<H2><b>Формирование запроса на выборку из лога</b></H2><br>';
////препарируем запрос
$text_zaprosa=$wpdb2->prepare("SELECT * FROM `vin_logs` WHERE `last_mtime_upload` = %s", $m_mtime_file);
$results=$wpdb2->get_results($text_zaprosa);

if ($results)
{   foreach ( $results as $r)
{
////если штамп времени и размер файла совпадают, возврат
if (($r->last_mtime_upload==$m_mtime_file) && ($r->last_size_upload==$m_size_file))
{////echo '<H2><b>Возврат в начало, т.к. найдена запись в логе.</b></H2><br>';
$insert_fail_zapros=$wpdb2->insert('vin_logs', array('time_stamp'=>time(),'last_mtime_upload'=>$m_mtime_file,'last_size_upload'=>$m_size_file,'comment'=>'Загрузка отменена, новых данных нет, т.к. найдена запись в логе.'));
wp_die();
return $failure;
}
}
}
////если данные новые, пишем в лог запись о начале загрузки
/////echo '<H2><b>Попытка вставить запись о начале загрузки в лог таблицу</b></H2><br>';
$insert_fail_zapros=$wpdb2->insert('vin_logs', array('time_stamp'=>time(),'last_mtime_upload'=>0, 'last_size_upload'=>$m_size_file, 'comment'=>'Начало загрузки'));

////очищаем таблицу
$clear_tbl_zap=$wpdb2->prepare("TRUNCATE TABLE %s", 'vin_history');
$clear_tbl_zap_repl=str_replace("'","`",$clear_tbl_zap);
$results=$wpdb2->query($clear_tbl_zap_repl);
/////   echo '<H2><b>Очистка таблицы сервисных книжек</b></H2><br>';
if (empty($results))
{
/////   echo '<H2><b>Ошибка очистки таблицы книжек, завершение.</b></H2><br>';
//// если очистка не удалась, возврат
$failure=TRUE;
wp_die();
return $failure;
}

////загружаем данные
$table='vin_history';         // Имя таблицы для импорта
//$file_hist Имя CSV файла, откуда берется информация     // (путь от корня web-сервера)
$delim=';';          // Разделитель полей в CSV файле
$enclosed='"';      // Кавычки для содержимого полей
$escaped='\

12 Comments

  1. starik-2005

    А блокировку соседних заданий по критическому коду можно в 1С сделать?

    Reply
  2. Идальго

    (1) starik-2005, думаю, что реализовать паузу в запуске соседних заданий совсем просто, но вот для того, чтобы уже выполняющиеся задания стопарнуть на время — тут сложнее )))

    Reply
  3. starik-2005

    (2) тогда Вам следует прочитать это.

    Reply
  4. Идальго

    (3) starik-2005, спасибо, я прочитал. Я подобные вещи тоже давно использую (и этого всегда 100% хватало). В вышеприведенном комментарии я немного другое имел в виду, ведь если делать так, как предложено у вас, то для того, чтобы метод стал универсальным, то нужно либо в каждом задании прописывать подобный код, либо делать вызов какой-то общей процедуры, которая будет проверять мьютекс. Однако это не совсем универсально и удобно, т.к. этот код проверки выполняется каждым из заданий, а я подразумевал использование более универсальной штуки, которая бы подключалась к каждому из заданий и получала текущий статус его выполнения, и в случае ошибки, как-то это дело переваривала. Ну и в целом, у меня же здесь просто пример — основа, на которую можно посложнее штучки навернуть (кому нужно).

    Reply
  5. artbear

    (0) А почему не взял готовый пример подсистемы от автора статьи с Хабра?

    Код реально рабочий, проверен на нескольких системах в разных организациях.

    Код открыт на Гитхабе, есть поддержка продукта.

    Тем более, что в подсистеме использованы приемы, позволяющие решить некоторые возникающие проблемы с фоновыми заданиями.

    Зачем тратить время на написание велосипедов?

    Reply
  6. Идальго

    (5) artbear, Ну там немного по-другому сделано, но суть конечно та же самая. Вообще у всех подобных решений реализация очень похожа. Кроме того, в той статье сделано вроде на УФ, а мне нужно было на обычных. Да и Господи там писать то на пару-тройку часов, когда логику представляешь (собственно её я и подглядел на гитхабе, хотя потом ещё кучу мест нашел). Мучиться с разбором чужого кода не хотелось, да и просто интересно было))) Плюс, у меня же раскидывание по приоритетам и свободным потокам и т.п. есть, а на гитхабе не было (точно не помню уже). Да и вообще моя для понимания механизма, или как основа для более сложного продукта попроще и поудобнее будет, как мне кажется.

    Reply
  7. starik-2005

    Я как-то многопоточный код замутил через произвольный алгоритм и функцию общего модуля «ВыполнитьАлгоритм». Если разобраться в механизме, то никаких подсистем не надо — все делается на коленке за двадцать минут.

    Reply
  8. artbear

    (6) (7)

    Если организовывать гарантированную доставку/выполнение, то пятью/двадцатью минутами не обойдешься.

    Задумайтесь о следующем: как правило, все усложнения алгоритма/ПО возникают не из воздуха, а как результат решения каких-то бизнес-задач.

    Например, в продукте Гитхаба решались задачи — гарантированная доставка, выполнение в высоконагруженной среде, блокировки/конфликты и т.п.

    ЗЫ напомню, что я не автор продукта/статьи на Гитхабе/Хабре.

    Reply
  9. artbear

    (6)

    Кроме того, в той статье сделано вроде на УФ, а мне нужно было на обычных

    В «той статье» на УФ сделано буквально 2 простые формы, практически без кода или только вызов серверных методов. Весь остальной код — это серверный код, работающий как в ОФ, так и в УФ.

    Reply
  10. Идальго

    (8) artbear, Да никаких в той обработке (на гитхабе) особых штучек в плане работы с нагруженностью и гарантированностью нет. Как и в моей обработке, там есть ограничение на количество потоков и, вроде была удалялка зависших заданий. У меня же по части распределения задач — больше настроек. Работа по разруливанию блокировок(н-р регистров) и т.п., как я полагаю, также должна осуществляться со стороны кода запущенной обработки (т.е. это не менеджер очереди делает). Что касается сложности кода и времени разработки — обработки почти одинаковые, хотя мне мой код конечно понятнее))) Давайте закончим уже про ту обработку (обработки конечно похожи, но отличия тем не менее есть и я их описывал выше)?

    Reply
  11. MikeLetto

    Выходит ошибка: {ВнешняяОбработка.ФоновоеЗаданиеСИндикацией.Форма.Форма.Форма(58)}: Метод объекта не обнаружен (ВыгрузитьОстатки)

    ОбработкаОбъект.ВыгрузитьОстатки(СтруктураПараметров, АдресРезультата);

    Версия БСП: «2.1.1.18»

    Reply
  12. Идальго

    (11)

    Выходит ошибка: {ВнешняяОбработка.ФоновоеЗаданиеСИндикацией.Форма.Форма.Форма(58)}: Метод объекта не обнаружен (ВыгрузитьОстатки)

    ОбработкаОбъект.ВыгрузитьОстатки(СтруктураПараметров, АдресРезультата);

    Версия БСП: «2.1.1.18»

    Эта ошибка у вас к моей программке, вроде, не имеет никакого отношения. В моей программе нет ВыгрузитьОстатки и т.п.

    Reply

Leave a Comment

Ваш адрес email не будет опубликован. Обязательные поля помечены *