Как сделать csv-файл согласно RFC4180




Принцип обмена данными из 1С с сайтом (на MySQL) и выдачи (публикации) этих данных по запросу.
PHP-Скрипт автоматической загрузки данных из файла данных в формате CSV в базу данных сайта работающего на WordPress.

В продолжение моей темы: 1С:Альфа-Авто Автосалон Автосервис: обмен с сайтом.
С помощью данного скрипта можно загружать в автоматическом режиме, по расписанию, данные сервисных книжек (ремонтов авто) из 1С:Альфа-Авто Автосалон Автосервис.
Также можно загружать данные в ручном режиме: для этого делается скрытая страница, где размещается специальная кнопка.
Комментарии размещенные внутри скрипта разъяснят логику и порядок действия.
Комментарии с "/////    echo" использовались для отладки.
Дополнительно создана таблица для журналирования результатов загрузки данных.
Скрипт включает в себя защиту от SQL инъекций (думаю безопасность соблюдена в полной мере).
В кратце:
1. Пишется скрипт, который запускает этот.
2. Создается регламентное задание в WordPress, по которому запускается скрипт из п.1. 
3. Этот скрипт осуществляет проверку на существование файла обмена в папке.
4. Если данные не новые, загрузка не производится.
5. Если данные новые, очищается таблица сервисных книжек.
6. Загружаются новые данные.

Собственно сам скрипт:

<?php // Полная загрузка сервисных книжек, создан 2025-01-05 12:44:55

global $wpdb2;
global $failure;
global $file_hist;

/////  echo '<H2><b>Старт загрузки</b></H2><br>';

$failure=FALSE;
//подключаемся к базе
$wpdb2 = include_once 'connection.php'; ; // подключаемся к MySQL
// если не удалось подключиться, и нужно оборвать PHP с сообщением об этой ошибке
if (!empty($wpdb2->error))
{
/////   echo '<H2><b>Ошибка подключения к БД, завершение.</b></H2><br>';
$failure=TRUE;
wp_die( $wpdb2->error );
}

$m_size_file=0;
$m_mtime_file=0;
$m_comment='';
/////проверка существования файлов выгрузки из 1С
////файл выгрузки сервисных книжек
$file_hist = ABSPATH.'/_1c_alfa_exchange/AA_hist.csv';
if (!file_exists($file_hist))
{
/////   echo '<H2><b>Файл обмена с сервисными книжками не существует.</b></H2><br>';
$m_comment='Файл обмена с сервисными книжками не существует';
$failure=TRUE;
}

/////инициируем таблицу лога
/////если не существует файла то возврат и ничего не делаем
if ($failure){
///включает защиту от SQL инъекций и данные можно передавать как есть, например: $_GET['foo']
/////   echo '<H2><b>Попытка вставить запись в лог таблицу</b></H2><br>';
$insert_fail_zapros=$wpdb2->insert('vin_logs', array('time_stamp'=>time(),'last_mtime_upload'=>$m_mtime_file,'last_size_upload'=>$m_size_file,'comment'=>$m_comment));
wp_die();
/////    echo '<H2><b>Возврат в начало.</b></H2><br>';
return $failure;
}
/////проверка лога загрузки, что бы не загружать тоже самое
$masiv_data_file=stat($file_hist);   ////передаем в массив свойство файла
$m_size_file=$masiv_data_file[7];    ////получаем размер файла
$m_mtime_file=$masiv_data_file[9];   ////получаем дату модификации файла
////создаем запрос на получение последней удачной загрузки
////выбираем по штампу времени создания (редактирования) файла загрузки AA_hist.csv, $m_mtime_file

/////   echo '<H2><b>Размер файла: '.$m_size_file.'</b></H2><br>';
/////   echo '<H2><b>Штамп времени файла: '.$m_mtime_file.'</b></H2><br>';
/////   echo '<H2><b>Формирование запроса на выборку из лога</b></H2><br>';
////препарируем запрос
$text_zaprosa=$wpdb2->prepare("SELECT * FROM `vin_logs` WHERE `last_mtime_upload` = %s", $m_mtime_file);
$results=$wpdb2->get_results($text_zaprosa);

if ($results)
{   foreach ( $results as $r)
{
////если штамп времени и размер файла совпадают, возврат
if (($r->last_mtime_upload==$m_mtime_file) && ($r->last_size_upload==$m_size_file))
{////echo '<H2><b>Возврат в начало, т.к. найдена запись в логе.</b></H2><br>';
$insert_fail_zapros=$wpdb2->insert('vin_logs', array('time_stamp'=>time(),'last_mtime_upload'=>$m_mtime_file,'last_size_upload'=>$m_size_file,'comment'=>'Загрузка отменена, новых данных нет, т.к. найдена запись в логе.'));
wp_die();
return $failure;
}
}
}
////если данные новые, пишем в лог запись о начале загрузки
/////echo '<H2><b>Попытка вставить запись о начале загрузки в лог таблицу</b></H2><br>';
$insert_fail_zapros=$wpdb2->insert('vin_logs', array('time_stamp'=>time(),'last_mtime_upload'=>0, 'last_size_upload'=>$m_size_file, 'comment'=>'Начало загрузки'));

////очищаем таблицу
$clear_tbl_zap=$wpdb2->prepare("TRUNCATE TABLE %s", 'vin_history');
$clear_tbl_zap_repl=str_replace("'","`",$clear_tbl_zap);
$results=$wpdb2->query($clear_tbl_zap_repl);
/////   echo '<H2><b>Очистка таблицы сервисных книжек</b></H2><br>';
if (empty($results))
{
/////   echo '<H2><b>Ошибка очистки таблицы книжек, завершение.</b></H2><br>';
//// если очистка не удалась, возврат
$failure=TRUE;
wp_die();
return $failure;
}

////загружаем данные
$table='vin_history';         // Имя таблицы для импорта
//$file_hist Имя CSV файла, откуда берется информация     // (путь от корня web-сервера)
$delim=';';          // Разделитель полей в CSV файле
$enclosed='"';      // Кавычки для содержимого полей
$escaped='\

20 Comments

  1. kuzyara

    Хоть бы RFC привели, интересно же

    Reply
  2. Nati4ka

    И можно еще чуть модифицировать и получится универcальный код для создания .csv и .tsv =)

    Reply
  3. pit201201

    (1) kuzyara,

    привел, RFC4180, гугл знает где взять и даже переводит сносно

    Reply
  4. pit201201

    (2) Nati4ka,

    вроде ничего не надо там модифицировать, только поменять на разделитель = Символ.Таб

    Reply
  5. it-on

    Боюсь ошибку выдаст программа сия, о достопочтенный учитель, в случае когда надо вывести заголовки.

    В функции СоздатьЗаголовкиCSV нет начального описания переменной стрКолонки.

    Reply
  6. pit201201

    (5) it-on,

    Ну зачем так сразу-то, на весь класс. Решил — поднял руку, получил пять.

    Reply
  7. it-on

    (6) Прости учитель. С первого класса у меня так — сначала скажу, потом подумаю, а часто и не подумаю — скажу. Из-за чего часто выгоняли в коридор…

    Reply
  8. speshuric

    На длинных таблицах код будет быстро деградировать по производительности. И только эта деградация спасёт от переполнения памяти. Тут либо уж сразу в файл писать, либо использовать ЗаписьXML как StringBuilder.

    Вот пример. Учтите только, что этому коду уже 6 лет.

    Reply
  9. starik-2005

    А так-то. батенька, зачем:

    стрПоле = ?(ЗначениеЗаполнено(поле),Формат(поле,»ЧРД=.»),»0″);

    Ну есть же в формате вариант для описания нулевого значения!

    Дальше если в поле есть символ ( » ), то вы такое поле помещаете в кавычки:

    стрПоле = «»»»+стрПоле+»»»»;

    Если на входе будет такая строка, то что получится:

    «Вася»,»Петя»»,»»»Саша»»»»,»»»»Миша»»»»»

    В итоге все преобразуется в строку:

    «»Вася»,»Петя»»,»»»Саша»»»»,»»»»Миша»»»»»»

    Как это распарсится при чтении? Хреново. В действительности, надо все символы ( » ) заменить на символы ( «» ), т.е. так:

    стрПоле = «»»»+СтрЗаменить(СтрПоле,»»»»,»»»»»»)+»»»»

    Что, я один это увидел?

    Reply
  10. pit201201

    (10) starik-2005,

    чуть выше проверки на кавычку в строке есть строка, предлагаемый Вами вариантом с заменой кавычки на пару кавычек

    стрПоле = СтрЗаменить(Строка(поле),»»»»,»»»»»»);

    так-что вроде все справедливо.

    А насчет 0 у числового значения: у 1С трудно понять в числовом значении где 0, а где NULL.Поэтому и проверяю если тип = ЧИСЛО и пусто, то пусть будет 0, а не пустое значение. Хотя вопрос интересный. Или имелось ввиду

    Формат(поле,»ЧРД=.; ЧН=0″)

    ?

    Reply
  11. pit201201

    (8) speshuric,

    Все так. Нужно будет выгрузить большие объемы — деградируем. Хотя csv и большие объемы — сомнительный союз.

    Reply
  12. speshuric

    (12)

    Не соглашусь. Именно CSV нереально рулит на больших объёмах. Какие другие варианты в родном 1С-коде? XML — это вообще нецензурно. DBF — ограничение в сколько-то гигов (то ли 2 то ли 4 то ли еще что-то подобное). JSON — слишком молодо и оверхэд всё равно заметный. Табличный документ (в MXL или XLSX) сдохнут в районе миллиона строк. Остаются только внешние источники данных (или сразу ADO), там можно по частям запихивать, но не все получатели могут через ODBC/ADO. Все остальные средства — неродные вроде бы. И вот — единственный финалист CSV — благо во всех языках, в том числе 1С, его прочитать можно последовательно. Но и CSV в памяти тогда весь держать не следует, конечно же.

    Reply
  13. starik-2005

    (12) скажите это тем, кто выгружает файл о недействительных паспортах — там 1 гиг в CSV.

    Reply
  14. kuzyara
    Reply
  15. pit201201

    (13) speshuric,

    Ok, прозвучало убедительно, после праздников выпущу в свет второй комплект процедур и функций для больших массивов.

    Reply
  16. pit201201

    (14) starik-2005,

    про паспорта мне комментировать сложно, не тот профиль. Но есть предположение что, что-то не то в регламенте обмена. У меня получается на 1 недействительный паспорт 4+6+6 символов, плюсом 3 запятых. Итого 20(21) символ на запись с учетом ПС. 1073741824 /21=51130563 паспортов. Каждый третий в стране поменял паспорт. Интересно за какой период эта выборка?

    Reply
  17. starik-2005

    (17) за все периоды, как я понял. Это официальная открытая информация в целях соблюдения закона 115-ФЗ. Вот еще ссылка интересная. В 1 ГиБ данных 96 млн с лишним паспортов. На каждый паспорт 4+»,»+6+#13#10 = 13 символов. Откуда Вы насчитали три запятых — я ума не приложу.

    Reply
  18. pit201201

    (18) starik-2005,

    добавил еще код подразделения, выдававшего паспорт, но видимо лишнее

    Reply
  19. kuzyara

    Смотри как надо http://infostart.ru/public/541555/

    Reply
  20. ZLENKO

    Реализовано в версии 8.3.6.1977 функции: СтрРазделить(), СтрСоединить()

    Читаем тут: https://infostart.ru/public/366865/

    Reply

Leave a Comment

Ваш адрес email не будет опубликован. Обязательные поля помечены *