XML-парсер "от О-Планета"




Принцип обмена данными из 1С с сайтом (на MySQL) и выдачи (публикации) этих данных по запросу.
PHP-Скрипт автоматической загрузки данных из файла данных в формате CSV в базу данных сайта работающего на WordPress.

В продолжение моей темы: 1С:Альфа-Авто Автосалон Автосервис: обмен с сайтом.
С помощью данного скрипта можно загружать в автоматическом режиме, по расписанию, данные сервисных книжек (ремонтов авто) из 1С:Альфа-Авто Автосалон Автосервис.
Также можно загружать данные в ручном режиме: для этого делается скрытая страница, где размещается специальная кнопка.
Комментарии размещенные внутри скрипта разъяснят логику и порядок действия.
Комментарии с "/////    echo" использовались для отладки.
Дополнительно создана таблица для журналирования результатов загрузки данных.
Скрипт включает в себя защиту от SQL инъекций (думаю безопасность соблюдена в полной мере).
В кратце:
1. Пишется скрипт, который запускает этот.
2. Создается регламентное задание в WordPress, по которому запускается скрипт из п.1. 
3. Этот скрипт осуществляет проверку на существование файла обмена в папке.
4. Если данные не новые, загрузка не производится.
5. Если данные новые, очищается таблица сервисных книжек.
6. Загружаются новые данные.

Собственно сам скрипт:

<?php // Полная загрузка сервисных книжек, создан 2024-01-05 12:44:55

global $wpdb2;
global $failure;
global $file_hist;

/////  echo '<H2><b>Старт загрузки</b></H2><br>';

$failure=FALSE;
//подключаемся к базе
$wpdb2 = include_once 'connection.php'; ; // подключаемся к MySQL
// если не удалось подключиться, и нужно оборвать PHP с сообщением об этой ошибке
if (!empty($wpdb2->error))
{
/////   echo '<H2><b>Ошибка подключения к БД, завершение.</b></H2><br>';
$failure=TRUE;
wp_die( $wpdb2->error );
}

$m_size_file=0;
$m_mtime_file=0;
$m_comment='';
/////проверка существования файлов выгрузки из 1С
////файл выгрузки сервисных книжек
$file_hist = ABSPATH.'/_1c_alfa_exchange/AA_hist.csv';
if (!file_exists($file_hist))
{
/////   echo '<H2><b>Файл обмена с сервисными книжками не существует.</b></H2><br>';
$m_comment='Файл обмена с сервисными книжками не существует';
$failure=TRUE;
}

/////инициируем таблицу лога
/////если не существует файла то возврат и ничего не делаем
if ($failure){
///включает защиту от SQL инъекций и данные можно передавать как есть, например: $_GET['foo']
/////   echo '<H2><b>Попытка вставить запись в лог таблицу</b></H2><br>';
$insert_fail_zapros=$wpdb2->insert('vin_logs', array('time_stamp'=>time(),'last_mtime_upload'=>$m_mtime_file,'last_size_upload'=>$m_size_file,'comment'=>$m_comment));
wp_die();
/////    echo '<H2><b>Возврат в начало.</b></H2><br>';
return $failure;
}
/////проверка лога загрузки, что бы не загружать тоже самое
$masiv_data_file=stat($file_hist);   ////передаем в массив свойство файла
$m_size_file=$masiv_data_file[7];    ////получаем размер файла
$m_mtime_file=$masiv_data_file[9];   ////получаем дату модификации файла
////создаем запрос на получение последней удачной загрузки
////выбираем по штампу времени создания (редактирования) файла загрузки AA_hist.csv, $m_mtime_file

/////   echo '<H2><b>Размер файла: '.$m_size_file.'</b></H2><br>';
/////   echo '<H2><b>Штамп времени файла: '.$m_mtime_file.'</b></H2><br>';
/////   echo '<H2><b>Формирование запроса на выборку из лога</b></H2><br>';
////препарируем запрос
$text_zaprosa=$wpdb2->prepare("SELECT * FROM `vin_logs` WHERE `last_mtime_upload` = %s", $m_mtime_file);
$results=$wpdb2->get_results($text_zaprosa);

if ($results)
{   foreach ( $results as $r)
{
////если штамп времени и размер файла совпадают, возврат
if (($r->last_mtime_upload==$m_mtime_file) && ($r->last_size_upload==$m_size_file))
{////echo '<H2><b>Возврат в начало, т.к. найдена запись в логе.</b></H2><br>';
$insert_fail_zapros=$wpdb2->insert('vin_logs', array('time_stamp'=>time(),'last_mtime_upload'=>$m_mtime_file,'last_size_upload'=>$m_size_file,'comment'=>'Загрузка отменена, новых данных нет, т.к. найдена запись в логе.'));
wp_die();
return $failure;
}
}
}
////если данные новые, пишем в лог запись о начале загрузки
/////echo '<H2><b>Попытка вставить запись о начале загрузки в лог таблицу</b></H2><br>';
$insert_fail_zapros=$wpdb2->insert('vin_logs', array('time_stamp'=>time(),'last_mtime_upload'=>0, 'last_size_upload'=>$m_size_file, 'comment'=>'Начало загрузки'));

////очищаем таблицу
$clear_tbl_zap=$wpdb2->prepare("TRUNCATE TABLE %s", 'vin_history');
$clear_tbl_zap_repl=str_replace("'","`",$clear_tbl_zap);
$results=$wpdb2->query($clear_tbl_zap_repl);
/////   echo '<H2><b>Очистка таблицы сервисных книжек</b></H2><br>';
if (empty($results))
{
/////   echo '<H2><b>Ошибка очистки таблицы книжек, завершение.</b></H2><br>';
//// если очистка не удалась, возврат
$failure=TRUE;
wp_die();
return $failure;
}

////загружаем данные
$table='vin_history';         // Имя таблицы для импорта
//$file_hist Имя CSV файла, откуда берется информация     // (путь от корня web-сервера)
$delim=';';          // Разделитель полей в CSV файле
$enclosed='"';      // Кавычки для содержимого полей
$escaped='\

41 Comments

  1. Bambrlog

    «Молок» клева вещь.

    Reply
  2. I_G_O_R

    ну раз такая любовь, жду компилятор 😉

    Reply
  3. biv75

    Отличная вещь, на этапе отладки не заменима, поддерживаю (2)

    Reply
  4. elizarovs

    С собственно парсером понятно. Вопрос по форме, в смысле по ее функционалу. По скриншоту, вроде, при выборе файла в рабочем поле должна была раскрыться структура выбранного файла. С кодом подробно не разбирался пока, но несколько наугад выбранных файлов XML, в том числе выгруженный из 1С для обмена «по правилам», оставили окно пустым.

    В модуле объекта в функции ХМЛПрочитать() (стр.183) при проверке

    Если ХМЛ[«Поз»]>ХМЛ[«Текст»].КоличествоСтрок() Тогда

    сразу оказывается, что ушли за конец документа

    😥

    Reply
  5. Minotavrik

    Как раз нужно, а то глаза режет уже xml теги глазками смотреть 😉

    Reply
  6. CheBurator

    эээ не понял… народ угается на тормознутость мелкомягкого парсера, а парсер на 8-ке — он что БЫСТРЕЕ БУДЕТ??? или я не в теме?

    Reply
  7. CheBurator

    или это просто смотрелка очередная..???

    Reply
  8. Поручик

    Автор, а обработка-то рабочая? Перепробовал несколько разных файликов xml, окно тэгов пустое. Или ей какие-то особые файлы нужны?

    Reply
  9. awa

    Странно не хотеть (не мочь, бояться) использовать типовые функции работы с xml (проверенные и оттестированные тысячами программистов), но при этом хотеть (мочь, не бояться) использовать «парсер от планета»…

    Беглый взгляд на код, говорит о том, что обрабатываются только файлы в кодировке «windows-1251». Означает это только одно, что «парсер» очень сырой, и лично я боюсь его использовать.

    Reply
  10. CheBurator

    есть хороший нормальный быстрый редактор эксемеля, написанный 1сником, есть разработки позволяющие посмотреть структуру иксемеля — то есть построить дерево используемых тегов

    .

    — а сабж — это что???

    Reply
  11. O-Planet

    Отвечаю. Не тестировал на «неправильных» xml. Не знаю, какие «неправильные» xml бываю. Свой парсер использую при разных выгрузках/загрузках, когда нужно быстро сохранить в файл параметры настройки и потом их прочитать. Парсит документы следующей структуры:

    <?xml … ?>

    <тег>

    <тег>



    </тег>

    </тег>

    <тег>

    <тег>



    </тег>

    </тег>

    Про windows-1251 не загружался. Выбор кодировки можно добавить парой строк. Но, думаю, не нужно. Если у кого-то что-то не отпарсило, то буду признателен за примеры xml в личку.

    Reply
  12. O-Planet

    О как!!! Порезались теги ))

    Reply
  13. O-Planet

    Обновил обработку. Добавил возможность выбора кодировки при чтении и записи файла. Также нашелпримеры нестандартных xml, которые тоже теперь отрабатываются корректно.



    Не отрабатывались xml без отдельного закрывающего тега. Такие xml — не есть канон. Но теперь и они нормально воспринимаются парсером. Качайте.

    Reply
  14. O-Planet

    Чой-то мну осенило… Добавил командную панельку на форму, привязал ее к дереву и получился xml-редактор. Разумеется, все, что наредактировано, можно снова записать в xml-файл.

    Reply
  15. Поручик

    Лажа какая-то. Опять попробовал разные файлы, хрен эффекта.

    Reply
  16. O-Planet

    (15) Действительно, лажа. Вышли хоть один. У меня все летает.

    Reply
  17. Поручик

    Куда выслать? Напиши в приват.

    Reply
  18. Re:аниматор

    Создал в обработке файл, сохранил. кодировка UTF8 !

    открываю через IE

    Не удается отобразить страницу XML

    Не удается просмотреть ввод XML с использованием списка стилей . Исправьте ошибку и затем нажмите кнопку «Обновить»или повторите попытку позднее.

    ———————————————————————————

    Переключение с текущей кодировки на указанную не поддерживается. Ошибка при обработке ресурса »file:///C:/OBMEN/2.xml». …

    <?xml version=»1.0″ encoding=»windows-1251″ ?>

    Reply
  19. O-Planet

    (17) Твой файл просто грузится жутко медленно. И он — в UTF-8. Т.е., нужно выбирать кодировку. Вобщем, подумал немного, и кое-что там подправил. xml теперь парсится в … десятки тысяч раз быстрее. (Видишь, как ты реально помог 🙂 ) Качай, проверяй. Не забудь выбрать правильную кодировку. Смотри скрин. Там как раз твой файл с правилами.

    Кстати, отключил автозагрузку файла при выборе. Нужно теперь жать кнопку в меню.

    (18) Исправил.

    Reply
  20. O-Planet

    Всем, кто скачал до этого момента, рекомендую скачать обновление.

    Reply
  21. Поручик

    (19) вот теперь зачёт. 😀

    Особенно за скрин с названием нашей конторы. Пусть мои «друзья» знают, откуда я что беру.

    Reply
  22. O-Planet

    (21) Убрать скрин с названием конторы? ))

    Reply
  23. O-Planet

    + еще поймал ошибку, связанную со специальными символами. Теперь полностью файл Поручика читает.

    Reply
  24. Поручик

    зачем, пусть будет. бояться мне нечего.

    Reply
  25. O-Planet

    Ы. А я убрал.

    Хотел бы спросить тех, кто с аналогичными парсерами работал. Как оно по скорости? Удобству? Приемлемо?

    Reply
  26. Поручик

    Я некоторое время плотно работал с

    http://infostart.ru/public/15835/ — (вогнал в базу во внешние обработки)

    http://infostart.ru/public/15464/

    Эти быстрее, но с закрытым кодом. А по удобству почему-то ни один не устроил, постоянно переключался между ними.

    Reply
  27. O-Planet

    (26) Ага. Посмотрел первый. Хороший. По ходу, использует функции среды, а не собственные.

    Reply
  28. elizarovs

    (20) Ну, слава Богу! +. А то уж минусовать собирался )

    Reply
  29. strange2007

    Что-то ошибка при удалении элемента

    {Форма.Форма(77)}: Ошибка при установке значения атрибута контекста (Теги): Выполнение операции невозможно, т.к. строка была удалена.

    БылаСтрока[«Теги»]=Редактор;

    по причине:

    Выполнение операции невозможно, т.к. строка была удалена.

    Может что не так делаю?

    Reply
  30. O-Planet

    (29) Исправил

    Reply
  31. Паро цёра
    // Открыть ХМЛ файл для чтения
    // Возвращает переменную открытого файла (соответствие)
    Функция ХМЛОткрыть(ИмяФайла,Знач Кодировка=Истина) Экспорт
    Если ТипЗнч(Кодировка)=Тип(«Булево») Тогда
    Кодировка=КодировкаТекста.ANSI;
    КонецЕсли;
    Текст=Новый ТекстовыйДокумент;
    Попытка
    Текст.Прочитать(ИмяФайла,Кодировка);
    Исключение
    Возврат Неопределено;
    КонецПопытки;
    
    Кол  = Текст.КоличествоСтрок();
    П  = 0;
    Стр  = «»;
    Ост  = «»;
    Найд = Ложь;
    Пока П < Кол Цикл
    П = П + 1;
    Стр = НРег(СокрЛП(Текст.ПолучитьСтроку(П)));
    Если Найти(Стр,»<?xml») <> 0 Тогда
    Найд = Истина;
    Прервать;
    КонецЕсли;
    КонецЦикла;
    Если Найд Тогда
    ПП=Найти(Стр,»?>»);
    Если ПП>0 Тогда
    Ост=Сред(Стр,ПП+2);
    Иначе
    Ост=»»;
    КонецЕсли;
    Иначе
    П = 0;//в выгрузках правил из КД 2.0 например именно этот случай
    КонецЕсли;
    
    ХМЛ=Новый Соответствие;
    ХМЛ.Вставить(«Текст»,Текст);
    ХМЛ.Вставить(«КоличествоСтрок»,Текст.КоличествоСтрок());
    ХМЛ.Вставить(«Режим»,»Чтение»);
    ХМЛ.Вставить(«КонецФайла»,Ложь);
    ХМЛ.Вставить(«Поз»,П);
    ХМЛ.Вставить(«__ОстатокСтроки»,Ост);
    ХМЛ.Вставить(«__Читать»,(П<=Кол));
    Возврат ХМЛ;
    КонецФункции
    

    Показать

    так лучше

    Reply
  32. tormozit

    А че на файл то все заточено? А ежели у меня строка?)

    Reply
  33. lame

    ну у меня не хотит разбирать мой хмл … вот структура

    <?xml version="1.0" encoding="windows-1251"?>

    <jcanswer>

    <message>

    <result >SUCCESS</result >

    Код
    N0407_BILLING_SUCCESS

    Показать полностью

    <action >detail</action >

    <group id="billing" area="none"><![CDATA[Обработка данных биллинга]]></group >

    <datetime >2009-10-14 18:05:44</datetime >

    <text ><![CDATA[Данные о возможности проведения операции получены]]></text >

    <techinfo >

    <summary>

    <parts>

    <free>

    <count>0</count >

    <atom_cost>0</atom_cost >

    <cost>0</cost >

    </free>

    <cash>

    <count>100</count >

    <atom_cost>0.525</atom_cost >

    <cost>52.5</cost >

    </cash>

    </parts>

    </summary>

    <result>1</result >

    <posible>yes</posible >

    <cost>52.5</cost >

    <currency_id>4</currency_id >

    </techinfo >

    </message>

    </jcanswer>

    Reply
  34. Паро цёра

    CDATA, Comment, Processing Instruction — не обрабатывает.

    Reply
  35. sbv2005

    Файл так и не показывается в поле … (( Почти минус

    Reply
  36. AlexO

    (35) artbear,

    есть ли еще какие-то обработки с открытым кодом, которые собирают дерево 1С из хмл-файла?

    есть.

    У гения1С есть разработка «Сборка-разборка XML», собирает в дерево — но она не работает с большими файлами.

    Вообще, на инфострате нет даже «просто посмотреть XML» достаточно законченных разработок по XML — все сыроваты.

    Сам пользуюсь разработкой с другого ресурса.

    Но все это — никак не работает с данными, содержащимся в XML, поэтому для поиска (а во многих и поиска-то никакого нет) и обработки ошибок все эти вьюверы бесполезны.

    Reply
  37. AlexO

    (36) sbv2005,

    по-моему, это вы рекомендовали там что-то из SQL использовать для обоработки XML… из IBM разработок…

    так что — ждем подробного отчета 🙂

    Reply
  38. sbv2005

    (38) Или вы меня с кем то путаете, или можно поподробней.

    Reply
  39. gull22

    Конвертировал под 8.2.Запустил в Комплексной конфигурации,попытался исправить значение. Поправить то поправил,но вот сохранить не удалось.Значок записи изменений не активен.

    Reply
  40. Жернов Виктор

    Хорошая вещь. Молодец. Конвертировал в 8.3. Работает.

    Reply
  41. WKBAPKA

    Скормил один файлjavascript:void(0);, закрывающий тег ищет до не приличия долго 🙁

    Reply

Leave a Comment

Ваш адрес email не будет опубликован. Обязательные поля помечены *