Особенности
Парсер и сериализатор поддерживают два режима (формата) работы:
- Стандартный – полная поддержка стандарта JSON;
- Альтернативный – направлен на применение в проектах подразумевающих постоянный двусторонний обмен данными и требующих повышенную скорость парсинга, минимизацию пересылаемых пакетов и однозначную идентификацию ссылочных типов во входящих данных.
Независимо от режима работы сериализатор, по требованию, позволяет автоматически передавать не только уникальный идентификатор ссылки, но и ее представление, а парсер в свою очередь, анализируя входные данные, опускает представления ссылок, не включая их в результирующий набор данных.
При необходимости, сериализатор может маскировать кириллические символы современных алфавитов славянских языков “АБВГҐДЂЃЕf4;ЁЄЖЗЅИg7;ІЇЙЈКЛЉМНЊОПРСТЋЌУЎФХЦЧЏШЩЪЫЬЭЮЯ”.
Поддерживаются все среды исполнения с ограничением сериализуемых типов. Используется кроссплатформенный код.
Альтернативный режим
- Не поддерживается форматирование, как во входящих, так и в исходящих данных;
- Сериализация ссылочных типов в строковое служебное представление.
Приятности
Парсер
- Устойчивость к некорректным данным и не подверженность injection атакам;
- Продвинутый синтаксический анализатор (указывает место и тип ошибки в данных);
- Поддержка форматирования во входящих данных (только стандартный режим);
- Безопасный разбор форматирования — незамаскированные символы форматирования в строковых значениях не будут утеряны;
- Поддержка строк в одинарных и в двойных кавычках;
- Автоматическое приведение объекта к структуре или соответствию в зависимости от имен свойств;
- Автоматическое преобразование к типу Дата строки вида “9999-99-99T99:99:99Z”;
- Автоматическое преобразование к типу УникальныйИдентификатор строки вида “xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx”;
- Автоматического определение режима (стандартного или альтернативного) входящих данных;
- Автоматического определение необходимости отсечения представления ссылок;
- Однозначная идентификация ссылок (только альтернативный режим).
Сериализатор
- Поддержка форматирования исходящих данных (только стандартный режим);
- Широкий состав сериализуемых типов данных, в том числе ссылок;
- Автоматическое приведение значений ключей соответствий к строковому представлению 1C;
- Автоматическое преобразование неподдерживаемых типов к строке;
- Нечувствительность к локализации.
Неприятности
- Нестандартно форматированный код (Alt+Shift+F в помощь) на грани читаемости;
- Сериализатор ориентирован на средние-крупные пакеты данных.
Сериализуемые типы
- Неопределено;
- Null;
- Примитивные типы (все);
- Универсальные коллекции значений (все);
- УникальныйИдентификатор;
- ЛюбаяСсылка;
- Запрос;
- РезультатЗапроса;
- ВыборкаИзРезультатаЗапроса;
- ПостроительЗапроса;
- ПостроительОтчета;
- ДанныеФормыКоллекция (только 8.2);
- ДанныеФормыСтруктураСКоллекцией (только 8.2);
- ДанныеФормыДерево (только 8.2)
- ДвоичныеДанные;
- Картинка;
- ХранилищеЗначения.
Порядок сериализации типов
- Неопределено – сериализуется как Null;
- Null – согласно стандарту;
- Примитивные типы – согласно стандарту;
- Массивы и COMSafeArray – массив, согласно стандарту:
[ Значение, … ]
- Структуры и соответствия – объект, согласно стандарту;
{ Ключ:Значение, … }
- СписокЗначений – массив объектов с тремя свойствами “Значение”, “Представление” и “Пометка”;
[ { "Значение":Значение, "Представление":Представление, "Пометка":Пометка }, … ]
- КлючИЗначение – объект с двумя свойствами “Ключ” и “Значение”;
{ "Ключ":Ключ, "Значение":Значение }
- ТаблицаЗначений – массив объектов:
[ { Колонка:Значение, … }, … ]
- ДеревоЗначений – массив объектов с обязательным свойством “Строки”:
[ { Колонка:Значение, … , "Строки":[ { Колонка:Значение, … , "Строки":[ … ] } , … ] }, … ]
- УникальныйИдентификатор – приведение к строке вида “xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx”;
- ЛюбаяСсылка:
- – Стандартный режим – получение уникального идентификатора ссылки и его сериализация;
- – Альтернативный режим – приведение к строке служебного вида “¦ref¦ … ¦”.
При сериализации ссылок в режиме автоматически передачи не только сериализованного значения ссылки, но и ее представления. Каждая ссылка передается как объект с двумя свойствами “Ссылка” и “Представление”.
{ "Ссылка":Ссылка, "Представление":Представление }
- Запрос – автоматически выполняется и сериализуется как таблица значений;
- РезультатЗапроса – сериализуется как таблица значений;
- ВыборкаИзРезультатаЗапроса – сериализуется как структура значений текущей запись результата запроса;
- ПостроительЗапроса – автоматически выполняется и сериализуется как таблица значений;
- ПостроительОтчета – автоматически выполняется и сериализуется как таблица значений;
- ДанныеФормыКоллекция – сериализуется как таблица значений;
- ДанныеФормыСтруктураСКоллекцией – сериализуется как таблица значений;
- ДанныеФормыДерево – сериализуется как дерево значений;
- ДвоичныеДанные – кодируется по алгоритму base64 и сериализуется как строка;
- Картинка – автоматически преобразуется и сериализуется как двоичные данные;
- ХранилищеЗначения – автоматически извлекается сохраненное значение и сериализуется в зависимости от типа извлеченного значения.
Рекомендация
При работе с проектами, в исходящих строковых данных которых не гарантируется отсутствие символов из диапазонов:
- [0x007f, 0x009f], 0x00ad, [0x0600, 0x0604], 0x070f, [0x17b4, 0x17b5],
- [0x200c, 0x200f], [0x2028, 0x202f] [0x2060, 0x206f], 0xfeff, [0xfff0, 0xffff]
рекомендуется не отключать настройку полного маскирования символов.
Производительность
Производительность парсера исключительно зависит от набора входящих данных, а также от наличия форматирования. Наихудшим вариантом является форматированный массив чисел, наилучшим – неформатированный массив строк.
Intel Core 2 Duo T5870 @ 2GHz – форматированный массив со всеми приблизительно равномерно встречающимися типами данных:
Парсер: 35 Кбайт/с.
Сериализатор: 165 Кбайт/с.
История изменений
- Версия 2.0.0.18:
- – (Изменение) При сериализации строк специальный символ бекслеш ( ) более не маскируется;
- – (Оптимизация) Устранена существенная деградация производительности при парсинге JSON большого размера;
- – (Исправление) Исправлены опечатки.
- Версия 2.0.0.17:
- – (Новое) Маскирование кириллических символов современных алфавитов славянских языков (по требованию);
- – (Новое) Поддержка сериализатором типов: ДвоичныеДанные, Картинка, ХранилищеЗначения;
- – (Изменение) Рефакторинг переменных и процедур;
- – (Исправление) Сериализация типа COMSafeArray;
- – (Исправление) Удалены лишние ключевые слова "Экспорт".
- – (Оптимизация) Уменьшение проверок связанных с режимом и параметрами парсинга и сериализцаии;
- – (Оптимизация) Проверка необходимости анализа форматирования вынесена из процедуры анализа форматирования;
- – (Оптимизация) Изменен алгоритм автоматического приведение объекта к структуре или соответствию в зависимости от имен свойств;
- – (Оптимизация) Отказ от явного приведения типов в пользу неявного в операторах условий;
- – (Оптимизация) Отказ от оператора "Попытка Исключение" при преобразовании строки к уникальному идентификатору;
- – (Оптимизация) Изменен порядок проверки типов при парсинге.
- Версия 2.0.0.15:
- – Релиз.
Очень хорошо оформлена публикация!
Лицензия я так понимаю BSD?
(1) stal76, Спасибо, первая публикация — старался 🙂
(2) pumbaE, Лицензия —MIT
Хм, а почему не Regexp -ами? Думаю быстрее было бы…
(5) pumbaE, Regexp -ами на больших пакетах однозначно быстрее бы было; выбор был сделан осознано в пользу использования только нативных средств, со всеми вытекающими от сюда достоинствами и недостатками. Из моей практики — перекос по объему идет в сторону исходящих данных, что хорошо гармонирует с данной реализацией.
Прикрути опрос сверху: кто знает что такое JSON, где он используется и зачем он нужен 1Снику.
(7) JSON (англ. JavaScript Object Notation) — текстовый формат обмена данными, основанный на JavaScript и обычно используемый именно с этим языком. Как и многие другие текстовые форматы, JSON легко читается людьми.
Несмотря на происхождение от JavaScript (точнее, от подмножества языка стандарта ECMA-262 1999 года), формат считается языконезависимым и может использоваться практически с любым языком программирования. Для многих языков существует готовый код для создания и обработки данных в формате JSON.
За счёт своей лаконичности по сравнению с XML, формат JSON может быть более подходящим для сериализации сложных структур. Если говорить о веб-приложениях, в таком ключе он уместен в задачах обмена данными как между браузером и сервером (AJAX), так и между самими серверами (программные HTTP-интерфейсы). Формат JSON также хорошо подходит для хранения сложных динамических структур в реляционных базах данных или файловом кэше.
Подписался.
Автор спасибо!
Реально это кто то использует для обмена данными между базами 1С ?
А то я 2 года назад месяц промучился (пока нашел как «обмануть» 1С чтобы для баз с разной конфигурацией использовать) над созданием обмена между похожими базами 1С через XDTO — работает ужасно быстро, но внутри реализация очень «некрасивая» получилась: сериализация XDTO полностью средствами платформы (практически мгновенно), а вот с десериализацией пришлось поморочиться.
(7) я столкнулся с JSON в трекере REDMINE. Посмотрел, подумал что это что-то вроде XML и забил на это дело.
Вот когда сериализация и десериализация будет по скорости сравнима с xml, будет и предмет для разговора.
Что такое JSON, знаю, но вот куда его в 1С пристроить, ума не приложу. Всё как-то XML.
Кстати, автор забыл упомянуть аналогичичные работы, выложенные на сайте.
JSON и UnJSON в 1Сhttp://infostart.ru/public/61194/
http://infostart.ru/public/60611/
http://infostart.ru/public/59535/
Развитие темы JSON в 1С
JSON в 1С
(0) слишком много конструкций Попытка — Исключение. Тормозить будет страшно. Посмотри вот тутhttp://infostart.ru/public/61194/ (без единой конструкции Попытка — Исключение).
(11) розница.net, (14) Поручик, использование JSON при обмене данными непосредственно между базами 1С вряд ли имеет практический смысл.
клиентской части Интернет-ресурса).
Но когда возникает необходимость интеграции с Интернет-ресурсом, может оказаться, что передача данных в формате JSON наиболее удачное (компромисное) решение для обеих сторон (особенно если речь идет о
Наиболее простойпример применения JSON — использование Google API .
P.S. Про аналогичные работы — учту на будущее. Спасибо.
(15) BigB, использование в коде конструкций Попытка — Исключение всегда обусловлено теми или иными причинами (в данном случае положением — валидность входящих данных не гарантирована).
При этом важно понимать, что выполнение проверок на встроенном языке может оказаться более затратной операцией, нежели использование конструкции Попытка — Исключение.
Кстати, выполнение простого кода в данной конструкциизамедляется всего на ~7% .
Спасибо, за наблюдение — я уже почти уверен, что могу избавиться как минимум от одной конструкции 🙂
Спасибо автору за что он получает + =)
Автору респект, а json много где использовать нынче можно… хотя бы для смс шлюзов, ответы то в json получаешь…
(15) BigB, Доброго вечера. Специально проверил быстродействие (строю обмен с сайтом и для меня это важно). Оценивал кодом:
Показать
В результате вышло что JSON из примера обработки указанной в Вашей ссылке на 1000 итераций:
А автору большое спасибо и +!
Плюсанул. Спасибо. Есть одно пожелание это преобразование кириллицы к виду u0430 и т.д. при записи.
автор молодец, держи плюс )
Александр, спасибо за Ваш труд.
Однозначно +
Парсер и сериализатор в 7.7 будет работать? Спасибо.
(24) theagile, нет, в 7.7 работать не будет. Попробуйте эту реализациюhttp://infostart.ru/public/198619/ .
Обработка зашифрована?
(26) Нет.
Сериализую ТаблицуЗначений, а обратно получается массив соответствий почему-то…
(28) Sirruf, всё верно, JSON оперирует только двумя не примитивными типами: объектом и массивом. Поэтому после сериализации невозможно определить исходный тип многих объектов 1С, без модификаций формата или дополнительных соглашений.
всё заработало на ура 🙂 спасибо
Спасибо автору, как раз то что искал!
Автору ОГРОМНОЕ Спасибо !!! Тут спрашивали зачем JSON нужен в 1С ? Так вот мне было необходимо наладить взаимодействие УПП с неким WEB-сервисом, авторы которого категорически работают только с данным форматом. Изначально делал поhttp://blog.1cbook.ru/index.php/razdely/integratsiya-1s-s-drugimi-sistemami-i-obmen-dannymi/8-rabota-s-formatom-json-a-1s , но, наткнувшись на данный пост, все быстро переделал и прямо доволен вместе с руководством 😉 !!!
По скорости, если кому-то интересно. Сериализация Json работает очень медленно по сравнению с XML-сериализацией.
http://www.oboi.kg
Оптимизация делалась для веб-сайта
На данных из примерно 5 тысяч записей таблицы значений перевод в XML уменьшил время обработки со 120 секунд (2 минуты) до 4 секунд.
(0) портировали проект на 1Scripthttps://github.com/allustin/json-onescript-lib — работает в первом приближении
все «копирайты» постарались максимально сохранить
P.S. Заодно отладили соответствие языка 1С и OneScript 😉
Пытаюсь разобрать 15-тимегабайтный файл JSON. Все 15МБ — одна длинная строка. Парсер работает 4-5 часов.
Запустил замер производительности. более 80% времени выполняется 1(!) строчка кода:
Понятно, что многократно происходит перелив этой огромной строки между ячейками памяти.
Кто подскажет, как можно ускорить работу алгоритма?
(35) gavlexx, попробуйте эту реализациюhttp://infostart.ru/public/61194/ , в вашем случае она скорее всего отработает быстрее, единственно последняя версия которую я пробовал на невалидных данных вела себя непредсказуемо вплоть до зацикливания. Если хочется использовать именно мою реализацию, то самым простым способом будет переписать поиск кавычки (лексемы окончания данных типа Строка) на алгоритм с посимвольным проходом по строке.
Спасибо. Просто супер.
(35) gavlexx,
А с чего вы взяли, что 1С поддерживает JSON? Потому что кто-то из студентов об этом написал (я не про автора)?
Реализована обыкновенная тормозная работа с текстом.
(38) AlexO, Ни с чего не взял. Не жалуюсь, а прошу совета.
Я говорю о конкретном куске кода, где происходит создание новой большой строки путем обрезки нескольких символов из исходной. И спрашиваю — а можно переписать строку кода на другую, которая будет выполняться быстрее?
P.S. Разделил 15МБ файл JSON на 20 кусков поменьше. Стало работать в разы быстрее. 1 кусок обрабатывается 1-3 минуты, всего за 50 минут обработались все файлы.
Автор безусловно молодец! Такой труд проделал. Спасибо тебе!
(41) starik-2005, текст стал читаться быстрее? XML, из которого вырос JSON — значит, тормозной, а JSON — стал быстр? 15 минут 100 метров? Парсинг файла на одном «Пока JS.Прочитать() Цикл»? Ну, пишите еще.
(42) AlexO, а что Вам мешает протестировать и не верить кому-либо на слово. Вот я, допустим, не только прочитать, но и десериализирую. Предположим, что в 1С сидят не совсем идиоты и файл меньшего размера читается быстрее, чем большего. XML содержит описания, в JSON описания заменены на скобочки. Если подойти с точки зрения даже банальной школьной программы, то сравнение одного символа с другим занимает меньше времени, чем сравнение нескольких строк друг с другом, и чем более похожи строки, тем больше операций тратится или на сравнение, а если строится хеш-таблица, то все-равно выбрать для ее построения придется все символы обоих строк. В JSON нет этих дополнительных символов, поэтому код на языке написания платформы (предположим, что-то типа библиотеки stdlib для работы с XML и JSON) будет для JSON работать быстрее только исходя из того, что JSON занимает меньше места.
Добрый день!
Использую ваши труды, т.к. пишу универсальную обработку без заточки под новые платформы (в которых уже реализован JSON-парсер).
Парсером был доволен, но столкнулся с проблемой, что дату мне стали передавать в формате: «2015-01-01 13:50:21» и «2015-01-01»
Можете обновить функцию парсинга даты? Код предоставляю ниже:
Для всех кто столкнулся с такой же проблемой, замените функцию «jsonПрочитатьОпределитьДату» на:
Показать
Подскажите, это обработка подойдет для обмена по rest или что мне еще нужно, если со стороны сайта все готово.
Эта обработка для формирования данных в JSON-формате.
А по REST обмен может работать как в XML-формате, так и в JSON-формате.
На данный момент все стараются использовать JSON.
(46) DrBlack,
А если по xml rest идет обмен, какую обработку лучше использовать?
(47) Saldor, XDTO.