Функция Русский MetaPhone для 1С:Предприятия любой платформы и конфигурации




Принцип обмена данными из 1С с сайтом (на MySQL) и выдачи (публикации) этих данных по запросу.
PHP-Скрипт автоматической загрузки данных из файла данных в формате CSV в базу данных сайта работающего на WordPress.

В продолжение моей темы: 1С:Альфа-Авто Автосалон Автосервис: обмен с сайтом.
С помощью данного скрипта можно загружать в автоматическом режиме, по расписанию, данные сервисных книжек (ремонтов авто) из 1С:Альфа-Авто Автосалон Автосервис.
Также можно загружать данные в ручном режиме: для этого делается скрытая страница, где размещается специальная кнопка.
Комментарии размещенные внутри скрипта разъяснят логику и порядок действия.
Комментарии с "/////    echo" использовались для отладки.
Дополнительно создана таблица для журналирования результатов загрузки данных.
Скрипт включает в себя защиту от SQL инъекций (думаю безопасность соблюдена в полной мере).
В кратце:
1. Пишется скрипт, который запускает этот.
2. Создается регламентное задание в WordPress, по которому запускается скрипт из п.1. 
3. Этот скрипт осуществляет проверку на существование файла обмена в папке.
4. Если данные не новые, загрузка не производится.
5. Если данные новые, очищается таблица сервисных книжек.
6. Загружаются новые данные.

Собственно сам скрипт:

<?php // Полная загрузка сервисных книжек, создан 2025-01-05 12:44:55

global $wpdb2;
global $failure;
global $file_hist;

/////  echo '<H2><b>Старт загрузки</b></H2><br>';

$failure=FALSE;
//подключаемся к базе
$wpdb2 = include_once 'connection.php'; ; // подключаемся к MySQL
// если не удалось подключиться, и нужно оборвать PHP с сообщением об этой ошибке
if (!empty($wpdb2->error))
{
/////   echo '<H2><b>Ошибка подключения к БД, завершение.</b></H2><br>';
$failure=TRUE;
wp_die( $wpdb2->error );
}

$m_size_file=0;
$m_mtime_file=0;
$m_comment='';
/////проверка существования файлов выгрузки из 1С
////файл выгрузки сервисных книжек
$file_hist = ABSPATH.'/_1c_alfa_exchange/AA_hist.csv';
if (!file_exists($file_hist))
{
/////   echo '<H2><b>Файл обмена с сервисными книжками не существует.</b></H2><br>';
$m_comment='Файл обмена с сервисными книжками не существует';
$failure=TRUE;
}

/////инициируем таблицу лога
/////если не существует файла то возврат и ничего не делаем
if ($failure){
///включает защиту от SQL инъекций и данные можно передавать как есть, например: $_GET['foo']
/////   echo '<H2><b>Попытка вставить запись в лог таблицу</b></H2><br>';
$insert_fail_zapros=$wpdb2->insert('vin_logs', array('time_stamp'=>time(),'last_mtime_upload'=>$m_mtime_file,'last_size_upload'=>$m_size_file,'comment'=>$m_comment));
wp_die();
/////    echo '<H2><b>Возврат в начало.</b></H2><br>';
return $failure;
}
/////проверка лога загрузки, что бы не загружать тоже самое
$masiv_data_file=stat($file_hist);   ////передаем в массив свойство файла
$m_size_file=$masiv_data_file[7];    ////получаем размер файла
$m_mtime_file=$masiv_data_file[9];   ////получаем дату модификации файла
////создаем запрос на получение последней удачной загрузки
////выбираем по штампу времени создания (редактирования) файла загрузки AA_hist.csv, $m_mtime_file

/////   echo '<H2><b>Размер файла: '.$m_size_file.'</b></H2><br>';
/////   echo '<H2><b>Штамп времени файла: '.$m_mtime_file.'</b></H2><br>';
/////   echo '<H2><b>Формирование запроса на выборку из лога</b></H2><br>';
////препарируем запрос
$text_zaprosa=$wpdb2->prepare("SELECT * FROM `vin_logs` WHERE `last_mtime_upload` = %s", $m_mtime_file);
$results=$wpdb2->get_results($text_zaprosa);

if ($results)
{   foreach ( $results as $r)
{
////если штамп времени и размер файла совпадают, возврат
if (($r->last_mtime_upload==$m_mtime_file) && ($r->last_size_upload==$m_size_file))
{////echo '<H2><b>Возврат в начало, т.к. найдена запись в логе.</b></H2><br>';
$insert_fail_zapros=$wpdb2->insert('vin_logs', array('time_stamp'=>time(),'last_mtime_upload'=>$m_mtime_file,'last_size_upload'=>$m_size_file,'comment'=>'Загрузка отменена, новых данных нет, т.к. найдена запись в логе.'));
wp_die();
return $failure;
}
}
}
////если данные новые, пишем в лог запись о начале загрузки
/////echo '<H2><b>Попытка вставить запись о начале загрузки в лог таблицу</b></H2><br>';
$insert_fail_zapros=$wpdb2->insert('vin_logs', array('time_stamp'=>time(),'last_mtime_upload'=>0, 'last_size_upload'=>$m_size_file, 'comment'=>'Начало загрузки'));

////очищаем таблицу
$clear_tbl_zap=$wpdb2->prepare("TRUNCATE TABLE %s", 'vin_history');
$clear_tbl_zap_repl=str_replace("'","`",$clear_tbl_zap);
$results=$wpdb2->query($clear_tbl_zap_repl);
/////   echo '<H2><b>Очистка таблицы сервисных книжек</b></H2><br>';
if (empty($results))
{
/////   echo '<H2><b>Ошибка очистки таблицы книжек, завершение.</b></H2><br>';
//// если очистка не удалась, возврат
$failure=TRUE;
wp_die();
return $failure;
}

////загружаем данные
$table='vin_history';         // Имя таблицы для импорта
//$file_hist Имя CSV файла, откуда берется информация     // (путь от корня web-сервера)
$delim=';';          // Разделитель полей в CSV файле
$enclosed='"';      // Кавычки для содержимого полей
$escaped='\

20 Comments

  1. Арчибальд

    Может, пригодится 8)

    Reply
  2. JohnyDeath

    strmatch.dll

    Reply
  3. Поручик

    (2) если вы про это http://infostart.ru/public/15765/, но я никогда не был любителем ВК.

    Reply
  4. JohnyDeath

    (3) я про ВК. по ссылке выше она используется. Также она используется не только мной. Все очень довольны. Если же нет желания использовать ВК, тогда ДА

    Reply
  5. Поручик

    (4)

    >>> Также она используется не только мной.

    Знавал её ещё с клюшечных времён, так как тоже один или пару раз воспользовался, но потом по каким-то причинам отказался и забыл напрочь.

    Reply
  6. Sk0rp

    StrMatch использует алгоритмы MetaPhone

    Reply
  7. Поручик

    К сожалению, ссылка http://www.kankowski.narod.ru/dev/metaphoneru.htm и сам сайт благополучно скончались. А жаль. Многие материалы там до сих пор были актуальными.

    Есть мысль реанимировать статью «Как ваша фамилия», или Русский MetaPhone, сохранилась на диске. Стоит ли?

    Reply
  8. mikeA

    (7) Выкладывай, интересно будет прочитать.

    Может быть есть ещё что-то на тему нечёткого поиска для ФИО?

    Reply
  9. Поручик

    (8) Ну вот один отозвался. Хорошо, сегодня вывалю на своём сайте, да простит меня автор статьи.

    Reply
  10. Поручик

    Выложил здесь.

    Reply
  11. Поручик

    (8)

    Ещё одна прикольная штука на тему нечёткого поиска. 😀

    Soundex на 1С: Предприятии

    Сразу предупреждаю, тесты показали неожиданные результаты.

    Reply
  12. mikeA

    Вот тогда до кучи функция для вычисления расстояния Левенштейна.

    Взято отсюда.

    Вроде бы больше похоже на правду — для Иванов и Иваноф метафон даёт разницу в два последних символа, расстояние Левенштейна единица.

    Теперь осталось проверить как будет работать СписокПолнотекстовогоПоиска 🙂

    Reply
  13. Поручик

    (12) Молодец!

    О расстоянии Левенштейна думал раньше, руки не дошли.

    Можно опубликую у себя? Только английские термины заменю на русские. Так гламурнее будет.

    Кстати, ещё есть similar_text

    http://ru2.php.net/manual/en/function.similar-text.php

    Где бы найти описание алгоритма Оливера? Перетряхнул гугл, ничего внятного.

    Reply
  14. Поручик

    >>> Иванов и Иваноф, Васильев и Васильефф

    Я бы сказал, логично что метафон в реализации Каньковского даёт различия, всё-таки окончание -оф, -еф для русских фамилий нехарактерно, скорее так напишут за бугром, причём с двумя -фф.

    Хотя можно попробовать подправить алгоритм

    [FIND]
    Если (Врем = «ОВ») ИЛИ (Врем = «ЕВ») Тогда
    
    [REPLACE WITH]
    
    Если (Врем = «ОВ») ИЛИ (Врем = «ЕВ») ИЛИ (Врем = «ОФ»)  ИЛИ (Врем = «ЕФ») Тогда
    
    Reply
  15. artbear

    Данную задачу было бы интересно покрыть тестами для разных вариантов фамилий и звуковых сочетаний.

    ИМХО это совсем несложно

    Кстати, для имен, не фамилий, алгоритмы нормально работают?

    Reply
  16. Поручик

    (15)

    Были у меня подобные тесты в 2006 г, когда сливал данные из базы бухгалтерии и ИНЭК-Страховщика в одну на 1С Страхование или что-то в этом роде. Базы были примерно тысяч по 10 записей физлиц. Насколько помню, процент попадания для разных вариантов составил 90-95.

    Reply
  17. mikeA

    (13)

    > Можно опубликую у себя?

    Да без проблем.

    Вот ещё материал: Sam’s String Metrics — библиотека java, больше десятка подобных функций, с описанием.

    Reply
  18. Поручик

    Спасибо за ссылку, хотя цветовая гамма там аж глаза режет.

    Это всё хорошо (библиотека), но вот формализованное или авторское описание алгоритма Оливера покоя не даёт :)))) Сырцы php смотрел, но в сях не особо силён.

    Reply
  19. Поручик

    (17)

    Кстати, твоё творчество здесь разместил.

    Reply
  20. KAV2

    По хорошему такое бы надо на уровне СУБД писать ((

    Reply

Leave a Comment

Ваш адрес email не будет опубликован. Обязательные поля помечены *