Сжатие текстов исключительно средствами языка 1С


Обработка упаковывает текст и делает его в виде исполняемого SFX.
Область применения: Just for fun
Побаловался на досуге, размял мозг.
Можно применять для упаковки и нечитаемости текстов процедур и функций, или запросов

Цель данной обработки это сжатие текстов.
Поскольку в 1С никогда не требовалось сжимать исходные коды или тексты, то применимость данных методов сомнительна.
Обработка была написана с целью «размять мозг» и для развлечения.
Программа распространяется «Как есть», никаких гарантий и ответственности не подразумевает.
Возможно полезным побочным эффектом работы данного приложения является нечитаемость текстов при сжатии, но в платформе 1С и так предусмотрено сжатие текстов исходных кодов, а так же защита при помощи криптографии, путем установки пароля на тексты модулей
Сжатие (избавление от избыточности) текста при большом количестве итераций происходит довольно медленно и требует много времени, т.к многократно проходит по сжимаемому тексту.
В самом нижнем поле обработка создает текст который можно просто вставить в код своего модуля и данный текст распакуется при исполнении, так называемый «Самораспаковывающийся архив или SFX». Кстати текст который вы сейчас читаете так-же запакован и хранится в коде в запакованном виде, а при запуске обработки выполняется процедура распаковки.
Инструкция.
Для сжатия текста необходимо скопировать или ввести сжимаемый текст в верхнее поле ввода «Исходный», указать максимальное количество итераций для сжатия и нажать на кнопку «Упаковать». Через некоторое время (приблизительно 5 минут) программа заполнит остальные поля формы обработки упакованным текстом и «Разделители».
В окне сообщений будет выведена статистика сжатия: за сколько итераций произошло сжатие.
Строка разделителей по сути является ключом для распаковки сжатого текста, длина этого ключа всегда равна количеству затраченных итераций.

Пример использования:

 

Функция НайтиОптимальноеСловоСжатия(СтруктураПараметров)
Успешно = Ложь;
Текст = СтруктураПараметров.Текст;
СтруктураПараметров.Разделитель = Лев(НайтиНеиспользованныеСимволы(Текст),1);
Если СтруктураПараметров.Разделитель = "" Тогда Возврат Ложь; КонецЕсли;
Т="ЕслиVСжатl94ейaДлdовi8аvКонецo - s + tин0имальнkЦикл_СтрP ПоA;BS
| 5AзицияvWtasOтр9(8)R o_а;DПолi0аd0ыKPокаvL9ВсегоvZ9lогоvXМ0kая9C5 B = 3Разделител4lие6PуктураПараметрi.7Текст8d0а9 Z3сR;5K3Цел(сR / 2);5a3P9(74и)t1;5C3ZO1; 5dя 632A K _5 dяW31A СRs6 _ BL3Сред(8,W, 6)SПiтор3PЧислоВхождений(8,L)SX3Zt6O(6s1) *AвторSV C > X Тогда B C3XS 7ОптkоеСлiо3LS 7636S Успешно3Ист0аSoV; 5DD";
for а=1 to 32 do в=Mid("Vladivost0k_PAS5WORDKLZXCB346789",а,1);б=find(Т,в);Т=StrReplace(Mid(Т,б+1),в,Лев(Т,б-1));enddo;
Выполнить(Т);
Возврат Успешно;
КонецФункции

 

4 Comments

  1. ildarovich

    Какой принцип используется?

    Какой коэффициент достигается?

    Как относительно zip?

    Reply
  2. eugeniezheludkov

    (1) ildarovich,1. Принцип был придуман на ходу, но по прочтению википедии он ближе всего к LZSS:

    ищем самый повторяющийся набор символов и заменяем его на неиспользуемый, в данном тексте (из предопределенного набора), символ, и так на повторе, пока не достигнем увеличения размера после сжатия.

    2. Коэффициент в зависимости от повторяющихся символов, но в среднем для обычных «тел процедур» размер уменьшается на 30%, это с учетом размера распаковщика, который так же присоединяется к упакованному тексту.

    3. Zip сейчас использует множество сжатий RLE + LZW + HAFFMAN поэтому он явно сильней сжимает , и если честно даже не сравнивал

    1С не предназначен для этой задачи 🙂

    мой интерес был написать минимальный по размеру и быстрый распаковщик для текстов процедур и запросов (иногда с паролем) если есть что еще оптимизировать я б выложил на гит, но возможно завтра мне будет уже не интересно 🙁

    ПС извиняюсь за слово «Jast» в статье , фэйл

    Reply
  3. DrAku1a
    ZIP = новый ЗаписьZIP();

    это не средствами 1С разве?

    Reply
  4. eugeniezheludkov

    (3) DrAku1a, в 8.2 нет такого ЗаписьZIP есть лишь ЗаписьZIPФайла, в моем случае предполагается сжимать, к примеру текст запроса, непосредственно в исходном коде конфигурации, а не во внешнем файле и очень быстро распаковав его «на лету», распаковщиком в 4 строки, выполнить. Можно даже защитить паролем который в свою очередь хранить в константе ИБД. пароль в данном случае это строка разделителей, но Да вы совершенно правы, название и текст статьи необходимо сменить но пока в голову ничего не приходит кроме как «развлечения ради», данная обработка неприменима в областях 1С.

    Её применение где-нибудь в javascript. для защиты и сжатия кода веб-страницы, собственно что-то подобное уже нашел http://js1k.com/2012-love/demo/1127

    алгоритм тот же, разве что подход и формат данных другой

    для сравнения с добавил кнопку:

     Упакован = СтрЗаменить(СтрЗаменить(ЗначениеВСтрокувнутр(Новый ХранилищеЗначения(Распакован, Новый СжатиеДанных(9))),Символы.ПС,Символы.ПС+»|»),»»»»,»»»»»»);
    ПересчитатьРазмеры();
    SFX = «Т=ЗначениеИзСтрокиВнутр(«»»+Упакован+»»»).Получить()»;
    

    результат: zip + base64 быстрее (нативный же), но всегда сжимает хуже чем мой способ сжатия, но как я уже писал мой способ действует лишь на текстовую информацию. В случае с zip: base64 все портит . base58 очень спас-бы ситуацию

    Reply

Leave a Comment

Ваш адрес email не будет опубликован. Обязательные поля помечены *