Нечеткий поиск в справочнике. Версия 1.02

Принцип обмена данными из 1С с сайтом (на MySQL) и выдачи (публикации) этих данных по запросу.
PHP-Скрипт автоматической загрузки данных из файла данных в формате CSV в базу данных сайта работающего на WordPress.

В продолжение моей темы: 1С:Альфа-Авто Автосалон Автосервис: обмен с сайтом.
С помощью данного скрипта можно загружать в автоматическом режиме, по расписанию, данные сервисных книжек (ремонтов авто) из 1С:Альфа-Авто Автосалон Автосервис.
Также можно загружать данные в ручном режиме: для этого делается скрытая страница, где размещается специальная кнопка.
Комментарии размещенные внутри скрипта разъяснят логику и порядок действия.
Комментарии с "///// echo" использовались для отладки.
Дополнительно создана таблица для журналирования результатов загрузки данных.
Скрипт включает в себя защиту от SQL инъекций (думаю безопасность соблюдена в полной мере).
В кратце:
1. Пишется скрипт, который запускает этот.
2. Создается регламентное задание в WordPress, по которому запускается скрипт из п.1.
3. Этот скрипт осуществляет проверку на существование файла обмена в папке.
4. Если данные не новые, загрузка не производится.
5. Если данные новые, очищается таблица сервисных книжек.
6. Загружаются новые данные.

Собственно сам скрипт:

<?php // Полная загрузка сервисных книжек, создан 2026-01-05 12:44:55
global $wpdb2;

global $failure;

global $file_hist;




/////  echo '<H2><b>Старт загрузки</b></H2><br>';
$failure=FALSE;

//подключаемся к базе

$wpdb2 = include_once 'connection.php'; ; // подключаемся к MySQL

// если не удалось подключиться, и нужно оборвать PHP с сообщением об этой ошибке

if (!empty($wpdb2->error))

{

/////   echo '<H2><b>Ошибка подключения к БД, завершение.</b></H2><br>';

$failure=TRUE;

wp_die( $wpdb2->error );

}
$m_size_file=0;

$m_mtime_file=0;

$m_comment='';

/////проверка существования файлов выгрузки из 1С

////файл выгрузки сервисных книжек

$file_hist = ABSPATH.'/_1c_alfa_exchange/AA_hist.csv';

if (!file_exists($file_hist))

{

/////   echo '<H2><b>Файл обмена с сервисными книжками не существует.</b></H2><br>';

$m_comment='Файл обмена с сервисными книжками не существует';

$failure=TRUE;

}
/////инициируем таблицу лога

/////если не существует файла то возврат и ничего не делаем

if ($failure){

///включает защиту от SQL инъекций и данные можно передавать как есть, например: $_GET['foo']

/////   echo '<H2><b>Попытка вставить запись в лог таблицу</b></H2><br>';

$insert_fail_zapros=$wpdb2->insert('vin_logs', array('time_stamp'=>time(),'last_mtime_upload'=>$m_mtime_file,'last_size_upload'=>$m_size_file,'comment'=>$m_comment));

wp_die();

/////    echo '<H2><b>Возврат в начало.</b></H2><br>';

return $failure;

}

/////проверка лога загрузки, что бы не загружать тоже самое

$masiv_data_file=stat($file_hist);   ////передаем в массив свойство файла

$m_size_file=$masiv_data_file[7];    ////получаем размер файла

$m_mtime_file=$masiv_data_file[9];   ////получаем дату модификации файла

////создаем запрос на получение последней удачной загрузки

////выбираем по штампу времени создания (редактирования) файла загрузки AA_hist.csv, $m_mtime_file
/////   echo '<H2><b>Размер файла: '.$m_size_file.'</b></H2><br>';

/////   echo '<H2><b>Штамп времени файла: '.$m_mtime_file.'</b></H2><br>';

/////   echo '<H2><b>Формирование запроса на выборку из лога</b></H2><br>';

////препарируем запрос

$text_zaprosa=$wpdb2->prepare("SELECT * FROM `vin_logs` WHERE `last_mtime_upload` = %s", $m_mtime_file);

$results=$wpdb2->get_results($text_zaprosa);
if ($results)

{   foreach ( $results as $r)

{

////если штамп времени и размер файла совпадают, возврат

if (($r->last_mtime_upload==$m_mtime_file) && ($r->last_size_upload==$m_size_file))

{////echo '<H2><b>Возврат в начало, т.к. найдена запись в логе.</b></H2><br>';

$insert_fail_zapros=$wpdb2->insert('vin_logs', array('time_stamp'=>time(),'last_mtime_upload'=>$m_mtime_file,'last_size_upload'=>$m_size_file,'comment'=>'Загрузка отменена, новых данных нет, т.к. найдена запись в логе.'));

wp_die();

return $failure;

}

}

}

////если данные новые, пишем в лог запись о начале загрузки

/////echo '<H2><b>Попытка вставить запись о начале загрузки в лог таблицу</b></H2><br>';

$insert_fail_zapros=$wpdb2->insert('vin_logs', array('time_stamp'=>time(),'last_mtime_upload'=>0, 'last_size_upload'=>$m_size_file, 'comment'=>'Начало загрузки'));




////очищаем таблицу

$clear_tbl_zap=$wpdb2->prepare("TRUNCATE TABLE %s", 'vin_history');

$clear_tbl_zap_repl=str_replace("'","`",$clear_tbl_zap);

$results=$wpdb2->query($clear_tbl_zap_repl);

/////   echo '<H2><b>Очистка таблицы сервисных книжек</b></H2><br>';

if (empty($results))

{

/////   echo '<H2><b>Ошибка очистки таблицы книжек, завершение.</b></H2><br>';

//// если очистка не удалась, возврат

$failure=TRUE;

wp_die();

return $failure;

}
////загружаем данные

$table='vin_history';         // Имя таблицы для импорта

//$file_hist Имя CSV файла, откуда берется информация     // (путь от корня web-сервера)

$delim=';';          // Разделитель полей в CSV файле

$enclosed='"';      // Кавычки для содержимого полей

$escaped='\

	
  ← Previous post
	Next post →
   


      Related Posts  
            
        
	       Восстановление последовательности документов при закрытии месяца в Бухгалтерия 3.0 не завершается
	       Заполнение табличных частей
	       Формирование сводных актов выполненных работ
	       Ввод поступления в переработку на основании передачи сырья (между организациями)
	       Конспект по установке сервера 1С на linux
	       Получение имени компьютера и его IP локально и в терминале
        
      







	    18 Comments

		
				
		
			
				karpik666 20.01.2016 at 07:48			


			
			
				А замер времени такой операции производился?
			 
			   Reply ↓			

			   			

		

	

	
		
			
				sleeping07 20.01.2016 at 08:00			


			
			
				Ну, по факту — конечно. Зависит от размера справочника линейно и в большей степени от длины строки сравнения. Запрос оптимизирован для ускоренного поиска по подобию началу строки поиска, в реальных условиях это помогает в большинстве случаев, тогда скорость поиска в пределах единиц секунд, если же случай сложный, то перебираются все остальные варианты, время в таком случае может достигать десятков секунд. Запрос выглядит так:


 Запрос=Новый Запрос(«ВЫБРАТЬ


               | Справочник.Наименование КАК Наименование,


               | Справочник.Ссылка,


   | Выбор Когда (Справочник.Наименование Подобно &Начало)


               |             Тогда 0 Иначе 1 Конец КАК Подобие


   |     ИЗ Справочник.»+Справочник+» КАК Справочник


               |    ГДЕ


               | НЕ Справочник.ПометкаУдаления


               | И НЕ Справочник.ЭтоГруппа


               |УПОРЯДОЧИТЬ ПО


               | Подобие, Наименование»);


  Запрос.УстановитьПараметр(«Начало»,»%»+Сред(Искомое,1,5)+»%»);
			 
			   Reply ↓			

			   			

		

	

	
		
			
				karpik666 20.01.2016 at 08:11			


			
			
				(2)  ааа, то есть просто запрос на подобно, а если в фразе несколько слов, то вначале разбиваете строку на слова, и каждое слово ищете на подобно, а затем получаете результат, который соответствует обоим вариантам?
			 
			   Reply ↓			

			   			

		

	

	
		
			
				sleeping07 20.01.2016 at 08:19			


			
			
				Нет, процедура сравнения всегда одинаковая — с разбиением на части (не на слова, перед сравнением все пробелы, спецсимволы убираются), просто из предположения, что совпадающие с началом строки поиска более вероятны, позволяет поиск ускорить в большинстве случаев.
			 
			   Reply ↓			

			   			

		

	

	
		
			
				V.Nikonov 22.01.2016 at 12:40			


			
			
				Что то при поиске Номенклатуры выглядит неубедительно…


Хочется получить статистику сравнительного анализа способов поиска…
			 
			   Reply ↓			

			   			

		

	

	
		
			
				sleeping07 22.01.2016 at 13:03			


			
			
				V.Nikonov, какую достоверность ставите? У меня все находило на автомате при значении порядка 60% при загрузке табличной части из другой базы с похожей, но все же местами отличающейся наименованиями номенлатурой.


UPD: вот попробовал с номенклатурой
			 
			   Reply ↓			

			   			

		

	

	
		
			
				CheBurator 24.01.2016 at 20:19			


			
			
				А почему бы не было сделать с использованием проверенной и зарекомендовавшей себя strmatch.dll..?
			 
			   Reply ↓			

			   			

		

	

	
		
			
				sleeping07 24.01.2016 at 20:57			


			
			
				(7) CheBurator, а зачем,  собственно? Интересно было реализовать именно на языке 1С. Сама функция сравнения небольшая,  симпатичная, рекурсивная. Не черный ящик, все можно подстроить. Это приложение конечно малоприменимо на практике, только для демонстрации, но и в реале функция уже поработала, и сейчас на ее основе закончил  обработку сравнения-сопоставления таблиц — весьма работоспособна.
			 
			   Reply ↓			

			   			

		

	

	
		
			
				kn 19.02.2016 at 11:32			


			
			
				Добрый день.


1. При поиске в демо базе Ботинки женские обработка находит только в справочнике Номенклатура Ботинки женские демисезонные, хотя в справочнике есть и Ботинки женские натуральная кожа, т.е не совсем рабочий алгоритм.


2. При вводе в поле Ищем данных пишет Ошибка деления на ноль.
			 
			   Reply ↓			

			   			

		

	

	
		
			
				sleeping07 19.02.2016 at 12:52			


			
			
				(9) kn,  спасибо за замечание! Устранил, сейчас выложу изменения. Дело в том, что изначально поиск предназначался для поиска одного подходящего значения, поэтому при 100% совпадении с поисковой строкой поиск прерывается. Для данной демонстрации это неверно, потому следует в процедуре «НечеткийПоиск» закомментировать строчку


     Если Рез=100 Тогда Прервать КонецЕсли;


Ошибка деления на 0 — очевидно при 0 достоверности, также поправил — по умолчанию устанавливается значение 80%.
			 
			   Reply ↓			

			   			

		

	

	
		
			
				sommid 03.03.2017 at 17:43			


			
			
				Описанный алгоритм может искажать результат, т.к. найденный кусок «вырывается» и остаток строки «склеивается» для продолжения поиска в ней.


Например, ищем » кдличному» в строке «+ 10% кличномудисконту»: находим сразу кусок «личному» и получаем на следующем шаге, что ищем «кд» в строке «+ 10% кдисконту» и находим кусок «кд», хотя в исходной строке, где ищем, такого сочетания не было.
Пример не очень красивый ), просто как наглядная демонстрация.


Может как-то совершенствовали алгоритм, чтобы учесть это?
А вообще за алгоритм спасибо.
			 
			   Reply ↓			

			   			

		

	

	
		
			
				sleeping07 03.03.2017 at 18:17			


			
			
				(11) Спасибо за замечание. Согласен. Алгоритм не совершенствовал, но в данном случае могу предложить навскидку на место вырезанного фрагмента вставить какой нибудь спецсимвол, и сравнивать дальше. Это надо пробовать, конечно…
			 
			   Reply ↓			

			   			

		

	

	
		
			
				sommid 05.03.2017 at 13:29			


			
			
				(12) — тоже думал про этот вариант, но тогда надо и в строку поиска и в искомую вставлять.. да и символ должен гарантированно отсутствовать в этих строках + потребуется корректировать определение рейтинга, т.к. искусственно увеличиваем длину строк
Можете пояснить смысл и назначение переменной «Огр»?


А еще лучше, если есть какая ссылка на описание метода или название используемого метода поиска..(12)
			 
			   Reply ↓			

			   			

		

	

	
		
			
				sleeping07 05.03.2017 at 15:30			


			
			
				(13)  Рейтинг придется считать по-другому, исключая вставленные спецсимволы, которые кстати друг за дружкой подряд наверно идти не должны — можно лишние убирать.


Огр — порог длины осмысленной подстроки для сравнения, 2 символа и короче — уже не сравниваются. А  «Длина/10» — это похоже атавизм, можно убрать из кода.


Метод сравнения источника не имел, так что все здесь 🙂


На днях попробую добавить в алгоритм замену на подстроку…
			 
			   Reply ↓			

			   			

		

	

	
		
			
				sleeping07 05.03.2017 at 16:01			


			
			
				Попробовал, не удержался. Просто вместо пустой строки вставил спецсимвол с кодом 27


 Стр1=СтрЗаменить(Строка1,Иск,Символ(27));


 Стр2=СтрЗаменить(Строка2,Иск,Символ(27));


Алгоритм не сломался, рейтинг тоже работает, если ли от этого толк — не понять без хорошего примера.
			 
			   Reply ↓			

			   			

		

	

	
		
			
				sommid 07.03.2017 at 14:32			


			
			
				Еще из пожеланий: как по мне было бы логичнее, чтобы найденные кусочки были в порядке их следования в исходной строке


(15) — ок, спасибо, буду иметь ввиду
			 
			   Reply ↓			

			   			

		

	

	
		
			
				Scottlinch 22.08.2017 at 02:06			


			
			
				Можно было все намного быстрее и правильнее сделать через регулярные выражения. Если конечно вам более необходимо точное 100 % совпадение.
			 
			   Reply ↓			

			   			

		

	

	
		
			
				sleeping07 22.08.2017 at 05:59			


			
			
				(17) Спасибо! На самом деле этот демо интерфейс не показывает настоящую цель обработки — она делалась для сравнения похожих справочников и подбора наиболее подходящего элемента, пример — отождествление сходных справочников номенклатуры разных предприятий. Пока не увидел возможности с помощью регулярных выражений решить эту задачу точнее и быстрее.
			 
			   Reply ↓			

			   			

		

	

		


		
		
	
		
		Leave a Comment Отменить ответ
Ваш адрес email не будет опубликован. Обязательные поля помечены *