Рассматривается способ, делающий резервирование наименее заметным для пользователей и серверного оборудования.
В статье я расскажу о том, зачем и как мы реализовали архивирование баз данных в dt в режиме онлайн без отключения сеансов пользователей.
Большинству компаний, у которых есть собственный IT отдел, сервера и статичный перечень рабочих баз, вполне может хватать и стандартных средств онлайн архивации средствами выбранного ими SQL сервера. В этом случае возникает только одно неудобство: Чтобы развернуть такую базу хотя бы в копию, нужен работающий SQL сервер, желательно не тот, где развернута рабочая база, также нужны навыки работы с SQL сервером. В общем, этот вариант, замечательный для IT службы, не очень удобен для программистов 1С, которые для разработки очень часто разворачивают файловые варианты баз.
В силу ориентированности нашего датацентра на партнеров (программистов 1С), которые находятся в нашем облаке и особенностей реализации самого облака мы реализовали такую возможность. Итак что для этого понадобилось и как работает архивирование онлайн.
Мы рассматривали несколько вариантов реализации бекапов в онлайн.
Один из рассмотренных вариантов — это воспользоваться средствами самого SQL, pgdump или pg_basebackup. Например:
Создадим дамп базы данных по имени, в файл
pg_dump -U postgres base > pgsql.backup
Создадим новую базу base-backup
createdb -T template0 base-backup
Зальем наш дамп базы из файла в созданную только что базу
psql -U postgres base-backup < pgsql.backup
Но этот вариант и другие, которые требуют копирования большого количества данных, мы сразу забраковали по следующим причинам:
Если база большого размера, то
- Процесс дампа значительно нагружает систему.
- Нужно довольно много дорогостоящего места на дисках, где распологаются SQL сервера.
- В наших кластерах, где сотни информационных баз, использование значительных ресурсов для бекапов очень расточительно.
И мы разработали следующий алгоритм бекапов, который полностью нас устроил:
Особенности реализации:
Postgresql в среде виртуализации.
Среда виртуализауции построена на базе системы linux.
Файловая система среды виртуализации поддерживает снапшоты и работает по COW технологии
1. Сервера PostgreSQL развернуты на файловой системе с поддержкой COW (CopyOnWrite). В вашем случае это может быть вtrfs или zfs. (Зависит от предпочтений linux или freebsd).
В нашем случае откомпилированный под freebsd postgresql на zfs показал лучшую производительность, чем под linux.
Это дает возможность сделать мгновенный снимок блочного устройства практически с нулевыми затратами.
Поэтому на первом шаге мы выполняем SQL команду в нужной нам базе:
CHECKPOINT;
Таким образом сбрасывая на диск все завершенные транзации PostgreSQL
И сразу после этого создаем снапшот системы, например:
btrfs subvolume snapshot /mnt/data/lxc1001 /mnt/data/lxc1001-backup
или
zfs clone rpool/data/jail1001@clone rpool/data/jail1001-backup
У нас процесс автоматизирован, поэтому время между CHECKPOINT и снапшотом составляет доли секунды. Таким образом мы получаем клон файловой системы PostgreSQL на момент времени.
2. На следующем шаге мы должны превратить наш диск в vm qemu, lxc или jail freebsd.
Поскольку диск уже существует, то нам остается только сгенерировать конфигурационный файл для нашей машины, что также делается практически мгновенно, если процесс автоматизирован. Если вы используете KVM виртуализацию, не забудьте поместить новую виртуальную машину или в изолированную виртуальную сеть или vlan, поскольку после старта у нее будет такой же адрес как и у оргинального postgresql.
3. Далее процесс уже вполне понятен. На сервере 1С мы создаем новую базу и указываем новый postgresql сервер. (Программно можно через RAS ). Чтобы снизить нагрузку на оборудование и сделать процесс бекапа наименее заметным для пользователей, лучше всего для целей бекапов держать отдельный сервер 1С на отдельном оборудовании, на котором не работают пользователи.
4. Подключаемся конфигуратором и выгружаем базу в dt.
5. Уничтожаем созданную базу на сервере 1С, виртуальную машину Postgresql и затем созданный клон и снапшот.
Вот, собственно, и всё.
Подытожим преимущества данного способа:
- Минимальное количество дисковых операций и затраты на дисковое пространство
- Минимальное время (если автоматизировано) на подготовку Postgres для выгрузки dt.
- Если сервер 1С для бекапов развернут на отдельном оборудовании, то пользователи даже не заметят процесса выгрузки архивной копии.
для ms sql я делал dt ,не выгоняя пользователей так
1) создал пустую базу в мс скл для выгрузки в дт
2) создал в ней представления (скриптом) на таблицы базы ,из которой нужно сделать дт
3) создал базу в кластере ручками (но сейчас можно скриптом)
4) выгрузил дт ручками (сейчас можно скриптом).
думаю такое можно сделать и в postgresql. ведь чудес не бывает — и за использование COW все равно расплачиваетесь падением производительности.
Читаешь, читаешь… Виртуализация, скрипты, быстрый PG, бэкапы, все автоматизировано… Все как во сне… А потом бац!… выгрузка в ДТ. ((( Рука лицо.
Кому он вдруг понадобился при таком уровне автоматизации администрирования??
(2)
не все разработчики могут (могли) позволить себе для разработки купить 1с серверную.
поэтому им для работы в файловой базе нужна «урезанная» версия рабочей базы.
сейчас можно и не урезать.
(2)
Кому он вдруг понадобился при таком уровне автоматизации администрирования??
Странный вопрос ) Именно программисты и спрашивают. У нас в облаке кроме пользователей крутятся и сторонние программисты. И на удивление, им зачем-то постоянно нужны именно свежие dt для доработок клиента. Часто еще сервер хранилища конфигураций просят настроить. Наверное, все-таки разработка на локальной файловой базе идет быстрее.
(4) Когда база переваливает за десятки гигов, то про какую выгрузку может идти речь? Тот же ms делает уже сжатый бэкап от силы пару минут… (на днях демонстрировал человеку: 17 Гб чистых данных (30Гб база) у меня на ноуте забэкапились за 20-30 сек.), а выгрузка в ДТ — это минут 10-20 может быть. А что делать с базами в 100, 500, 1000 Гб??
Программист должен владеть основными операциями СУБД. MS владеют все. PG отдельные. Если это не так — то это еще не программист. (недавно коллега спросила как установить себе на комп 1с сервер… беда…)
В конце концов администратор БД всегда придет на помощь и покажет как и что делается. Да и гугл кагбэ есть.
Разработка в файловом варианте тестовой базы (только если заказчик не пользует файловый) — нонсенс и дилетантство.
(5)
Никто ведь и не говорит, что бекап средствами sql делается медленно. Наше облако делает 4-х кратное резервирование и файловой системой и резервными хранилищами и бекапами целиком виртуальных машин с sql и средствами sql. Статья называется «Как делать бекапы в dt в онлайн режиме». О том и речь.
У нас в облаке есть и большие базы и по 50Гб и больше. В них, действительно программисты вынуждены вести разработку в режиме клиент-сервер, но большая часть баз — это средние организации с количеством рабочих мест 5-20 с базами по 2-5Гб со своими сторонними программистами, которые подключаются к нам в облако и быстро вносят какие-либо правки «по старинке» в свою файловую базу.
(1)
Интересно, как вы думаете зачем 1С тогда сделала возможность резервирования только в монопольном режиме?
Что будет с содержимым вашего архива, когда бекап делается минут 30, а за эти 30 минут пользователи активно вводят данные?
Идея хороша, и действительно позволяет экономить ресурсы, но место
Вызывает некоторое сомнение. Конечно, уменьшение времени позволяет минимизировать риски, но не устраняет их полностью. А так идея очень хороша.
(3) Не особая проблема, если что-то не специфическое и привередливое. Linux+Postgresql+1C server x32. До 12 подключений лицензию на сервер не надо, пока-что
(6) Таким заголовком статьи Вы укореняете мысль о том, что dt — это бэкап.
В то же время 1С не рекомендует использовать выгрузку в dt для целей резервного копирования.
Прикольно. С интересом почитал про zfs.
Плюс Лустин рассказывал, что использование zfs для 1С на postgres дает хорошие результаты в суровом продакшене…
Надо двигаться в эту сторону 🙂
(10) Плюс еще в зависимости от варианта клиент-сервера можно выловить различные проблемы. dt не всегда можно легко выгрузить в связке PostgreSQL+1C сервер х32
(8) Думаю, риски пренебрежимо малы. Запас времени до очередного чекпоинта существенный, а снапшот сделается фактически мгновенно. Так что идея выглядит вполне себе рабочей.
Пользуясь случаем спрошу. А есть какие-то тонкости в настроках той же zfs? Ну типа «перед началом работы сразу нужно изменить такие-то и такие-то настройки по такому-то принципу»? А то спросил админов, говорят пробовали экспериментировать с zfs и остались вопросы. Типа память любит сильно и заметная деградация производительности наблюдалась…
(6)
Ключевое то что у вас облако и мелкие базы. И вы с программистами по разные стороны барикад. ))) Конечно это метод. Идея известная. За публикацию респект.
Я, например, работаю с клиентами >50Гб. Поэтому и другой взгляд на вещи.
Неверная формулировка. Это не «по старинке» или «вынуждены», нет. Это правильное программирование и тестирование того функционала, который крутится у заказчика.
Думаю, что не нужно объяснять, что при «правильном» программировании конфа должна быть работоспособна и в к-с и в файловом варианте.
Все что слышал это тоже, что память очень любит, особенно для дедупликации. А кроме этого только положительные отзывы. Но сам не пробовал. И в продакшене под того же слона тоже не гонял.
(5) 300+ гиговая база у нас на кластере за 15 минут бэкапится со сжатием до 47 гигов средствами MS SQL.
Если выгружать в DT это будет дольше, да и потом этот DT можно засунуть себе куда подальше, так как из него не развернуть файловую базу…
Тогда зачем нужен этот DT спрашивается)))
Только для маленьких баз приведенный в статье материал.
(6)
Полностью согласен. Кто там и чего рекомендует, это вопрос другой, а данная статья может многим быть полезной. Любой дурак может выгрузить бэкап правильно, только не всем дуракам удобно таким бэкапом пользоваться…
Где готовые скрипты?
Или Вы похвастаться решили, какие Вы молодцы?
Тот случай, когда комментарии интереснее статьи )
пгдамп > 7зип > неткат ….сеть… неткат > 7зип > пгрестор, и всё одним .sh файлом можно сделать с компа разработчика
(0) создать базу для бэкап_дт … сделать скульный бэкап + развернуть в бэкапдт ->сделать выгрузку в дт файл
все можно сделать командной строчкой
Клоны какие-то… Виртуализация… В одном месте на бакапе экономим, в другом 1сные dump заряжаем. Мрак..
Этот dt-шник программерам нужен не часто. Чаще им надо потестироваться на актуальных данных. И они могут делать это прямо на копии по vpn или http. И зачем вгонять СУБД и кластер 1С в виртуальные машины? От этого им сразу нехорошо.
pg_dump из рабочей
pg_restore в копию с —clean
и 1cv8.exe …. /DumpIB и все это ночью или раз в неделю
Сисадмины любят снэпшоты. А здесь мгновенный способ выкинуть насторону dtшник, не теребя дампом сервер платящих клиентов.
Правда сервер будет пережевывать всю эту виртуализацию, имея по тесту гилева 8-11 попугаев, ну а так у большинства т.н. «продакшенов» в рф . Часто ли платят за повышение количества попугаев?
Годный прием сисадминства — «откинь проблемы эффективно». К ней еще прилагается — «работает — не трожь»
(17) Если цифра «300+ гигов» взята из свойства «Размер», то это вообще ни о чем еще не говорит. Подозреваю, что реальных данных, которые и бэкапятся, там гиг на 50. Ну, может, 60. Можете убрать сжатие бэкапов и сравнить. Не так уж сильно оно и жмет.
(24) это именно живые данные на 300 гигов
а как известно там сплошной текст и числа
а все это дело архиваторы любя и жмут довольно таки бодро
ну и не стоит забывать, что в базе есть и двоичные данные выраженные в изображениях
(25) О как. Неслабо. А какой же у вас тогда размер базы (mdf+ldf, именно этот размер management studio показывает в свойствах базы как «размер базы»)?
Зачастую перед выгрузкой в .dt необходимо почистить некоторые таблицы, чтобы они не превышали 4гб, иначе dt-шник не загрузится в файловую базу.
В предисловии темы автором указан аргумент против стандартных бекапов из СУБД:
Прочитав тему я понял, что для описанного автором способа необходимо… нужен работающий SQL сервер, желательно не тот, где развернута рабочая база, также нужны навыки работы с SQL сервером и необходимо знание систем виртуализации, желателен опыт отлова косяков в последних.
зачем мне еще больше переменных при решении подобных задач?
Только линуксоид может сделать задачу за тонну времени и сил, которая настраивается на MS SQL за 5 минут (со всеми проверками)
DT самый ненадежный архив
(19)
Именно )
И у нас не скрипты, а специально разработанная конфигурация для обслуживания Датацентра.
(14)
Для PostgreSQL желательно кластер статического размера.
Мы для датасета назначаем 4k
(29) «Не читал, но осуждаю»?
(26) Нормально SQL жмет. 84 Гб реальных данных сжимает до 13-14 Гб архив. PostgreSQL еще сильнее сжимает, но и восстанавливает дольше.
(32) Читал, Вы можете назвать таких специалистов, которые по данной статье завтра смогут так-же все настроить ? И много таких админов в регионах ? Если тут пишут про то, что 1с-ник не может сделать бэкап и рестор средствами СУБД, я уже молчу тогда про сис. админов.
P.S. Статья узкоспециализированная под конкретную задачу, под конкретную СУБД, написанная скорее всего системным администратором.
(6)
Скажем так, это сильно «по старинке». Если уж «сторонние программисты» не умеют работать с Хранилищем (а вы им, как облачники, часто этого толком не позволяете), не проще ли, с точки зрения бизнеса и удобной опции отдельной строчкой в прайсе сделать «вчерашнюю копия базы» ведь очень редко «сопровождающему лицу» нужен прямо актуальный DT
Я как раз из тех «сопровождающих», у которого свой аккаунт на облаке, а клиентов я туда привожу по партнерке. И в моём случае ТП облака пошли навстречу — одна и та же SQL база видна и у меня,и у сопровождаемых мною клиентов, и есть одна «собственная» SQL база «Текущий клиент» (на сервере с отладкой), куда мне ТП делает копию базы по моему запросу (средствами MS SQL конечно)
А у вас с точки зрения технаря вроде всё нормально сделано — «Задачу поставили — задачу решили», а вот с точки зрения бизнеса и бизнес-заказчиков — костыль, Я уж молчу про безопасность — ведь получается вы физически знаете логин/пароль пользователя ПП, раз сами выгрузку инициируете в dt? — значит возможностей для злоупотребления у сотрудников облака куда как больше
(28)у него задача — выкинуть проблему суппорта актуальными данными внешних программеров вон из рабочего сервера, чтобы дампом в dt не тормозили рабочую среду.
Этот дамп — единственная многонитеваямногопроцессорная функция в платформе.
Поэтому все завиртуалено. Тонна компромиссов. Не нужно все это, когда мало данных.
(29)Теперь нет. dt проверяется в процессе.
1С имеет в виду что dt не заменит бакап SQL сервера. Речь не про надежность, речь про то что sql-ный бакап может быть сделан он-лайн и восстановиться на момент времени.
(34)
А что тут сложного? Если 1Сник это не может, то не знаю для чего он нужен.
У 1сника работа — данные, а не игра в глупенькие разборки «сисадмин против 1сника».
Этот метод вполне рабочий, если перекидывается большими данными в 300, 500 Gb — 1 Tb.
(29)а sqlный бакап может спокойно слить в архив базу, которая убита некорректным динамическим обновлением.
И затереть предыдущий архивчик в том же задании.
Такие дела с надежностью..
(39) если архивы нон-стоп и хранить последние скажем 48, то у вас будут архивы на каждый час, правда у нас период 20 минут.
таким образом, чтобы ни происходило в течение 2-х суток — риски минимизированы. Ну а если вы в течение 2-х суток не заметили проблем с базой, то это уже проблемы квалификации
(34) Если бы читали, то не было бы этого абсолютно неуместного выпада linux vs ms
Банальное бэкапирование (сюрприз!) и на линуксе делается не менее банально, чем на ms
Статья про другое. Как вы правильно заметили — она про решение конкретной узкой задачи. Про очень эффективное решение. Только вы ошиблись — суть предлагаемой технологии не является специфичной для конкретной СУБД, несмотря на то что описывается она в приложении к postgresql.
А если вам не нравится, что она выходит за рамки пресловутой «привычной области знаний рядовых одинэсников», то это каким-то луддизмом попахивает, извините.
(33) Каюсь, был неправ. А постгри, кстати, просто тупо индексы не бэкапирует и при восстановлении их полностью пересоздает. Поэтому и размер меньше / восстановление дольше.
(40)Попробуй хранить 48, если база гигабайт 700. эльфы
(43) С Вами бесмысленно спорить. Кто в теме, тот поймет что это 48 бэкапов журнала транзакций к полной копии.
44)Чета не понял, я начал с кем-то спорить что ли? Храни 48 журналов. Молодец.
Многие сисадмины с которыми имеют дела многие программисты 1с хранят только полные ночные копии. И что?
А задача топика выдать ВСЕ данные на СТОРОНУ. И что?
Очередной не очень понятный велосипед.
Как уже говорили dt файл не самый лучший вариант хранения, я один раз столкнулся что база из dt не грузиться и ни как было не поднять.
Зато видел на ms sql базу битую , она работала, но не тестировалась и не с сохранялась штатными средствами, зато бекапы sql работали на ура.
По поводу нужны разработчикам dt…. Если база более 4 гигов, то быстрее её разворачивать из бекапа sql чем из dt, и если разработчик в теме он знает как поставить себе на рабочем месте сервер 1С для личного использования.
В dt онлайн выгружаем по следующим причинам:
Вебинар: Облако 1С с ориентиром на разработчиков
1. Мы это можем.
2. Это требования облачных договоров. Чтобы клиенты облака могли периодически забирать архивы своих баз. Все-таки в dt они имеют наименьший размер.
Для чего делались этот механизм и другие интересные решения благодаря возможностям платформы виртуализации на нашем вебинаре:
(47) По сути, вы предоставляете выгрузки баз (для чего dt и нужен), а не делаете резервное копирование. Поэтому вы зря подставились, написав в статье про «резервное копирование». С другой стороны, каждый кто будет рад в это ткнуть, будет поднимать тему 🙂
Что-то у меня соменения, что таким образом можно много баз бекапить. Так все сервера лягут, если запустить бекап хотя-бы 5-и баз
(48)
Делаем и резервное копирование причем 2-х кратное, с дублированием на резервное хранилище архивов ). Резервные копии делаются целиком виртуальных машин. И я об этом писал выше. Так, что вы зря думаете, что у нас облако резервируется только выгрузками в dt.
Просто наши резервные копии виртуальных машин исключительно для внутреннего использования у нас и никак не интересны нашим партнерам и фрилансерам, которые располагаются у нас в облаке.
(49)
У нас архивированием занимается управляющая база. В ней сейчас настроено ограничение на 15 параллельных бекапов. Конечно, когда они выполняются параллельно, то бекапы делаются несколько медленнее, но пользователям этого практически не видно. За бекапы отвечает специально предназначенный для этого хост.
(50) Я хвалил вас за использование выгрузки в dt по назначению, а не обвинял в отсутствии бэкапов. Вы же не с целью резервирования данных осуществляете выгрузку в dt. А название статьи вводит в заблуждение.
у меня давно сделано так:
вечером каждый раз снимается автоматом бэкап на MS SQL, далее он разворачивается также автоматом на копии базы, затем автоматом с этой копии выгружается dt — так на всякий случай, но это пока база в 8 гигов.
(53) Это самый надежный вариант.
Потому как если успешно выгружается dt, то это не просто верификация бэкапа, но и весомое подтверждение логической целостности данных в нем.
Но на больших данных такая схема проблематична из-за высокой ресурсоемкости.
ЗЫ. Хотя надежнее, наверное, запускать ТиИ в пакетном режиме. Там можно указать вывод результатов в лог и потом лог анализировать.
Предлагаю изменить заголовок- указать что инструкция для Постгреса
(10) Поддержу — выгрузка дампа базы в dt — это не архивирование, хотя и выглядит, вроде кошерно, выполняется из конфигуратора.
Правильное архивирование файловой базы — это копирование содержимого каталога, когда в базе никого нет, серверной базы — бэкап средствами СУБД
(54)
Подтверждением целостности является успешная загрузка dt, а не выгрузка. Не путайте с pg_dump > /dev/null
Инструкция не для постгреса, а для zfs Если оно есть, то остальное — дело техники.
Которая на уровне гипервизора, правильно я понимаю? То есть если мы развернём виртуалку с MS SQL на борту, то алгоритм тот же самый — чекпоинт, клоним диск с файлами MS SQL, и далее по тексту.
(59)
Не совсем. У нас Postgres физически на zfs. MS SQL на zfs можно поместить только через zvol, поскольку MS может быть только в KVM. А в этом случае нужно еще заботиться о сбросе кешей в VM. В общем с MS такой способ менее надежен.
(63)я просто констатирую факты
(58) Были такие случаи, и достаточно часто
(65) уверен что не сильно чаще случаев когда не загружался бэкап СУБД. Сам кстати строго юзаю архивирование средствами СУБД.
(66) Не поверите, но бэкап СУБД еще не разу не давал сбоев))) А вот dt подводили только так))) Даже разработчики 1С в принципе согласны, что dt это не бэкап, а просто вариант переноса базы.
Если «битый» бэкап:
Средствами СУБД — при неудачном восстановлении база восстанавливается на момент заливки бэкапа.
DT — при неудачном восстановлении гробит базу наглухо, итог: нет базы и нет бэкапа (т.к. он «битый»).
Думаю, плюсы очевидны.
(67) Все очень индивидуально. У меня при простой модели восстановления в MSSQL2012 был случай когда из бэкапа база не развернулась. Пришлось предыдущий бэкап брать и за несколько часов доки восстанавливать.
И еще я вроде как подчеркнул, что не рекомендую делать бэкапы через dt, я лишь настаиваю, что на мой взгляд, делать их для разовых бэкапов имеет смысл.
(63)а Вы считаете разработчиков 1С самыми умными, тогда откуда косяки в разработках и куча обновлений до бесконечности. по моему настоящий …
сегодня только пробовал использовать типовую обработку по переносу БП 3.0 в КА 2.4 и что. в …опе бы им всем…
(67) ОК, dt не бэкап. Но как средство перетаскивания инфобазы с MS SQL на Postgress и обратно его можно рассматривать? Ну не через Универсальный обмен же базу переливать? Или еще есть варианты?
(69) Да, это именно транспортный формат.
Клево! Осталось выложить скрипты автоматизации в опенсорс и написать для чайников статью-инструкцию. А то из статьи-то мы поняли, что вы молодцы, но а дальше-то нам с этого что? :))
(27) Это нужно, только если есть ограничение файловой системы на максимальный размер файла. А ограничение в 4 ГБ свойственно только уродской Fat32 от Microsoft. У этой фирмы вообще везде такие проявления, куда ни глянь: модель бизнеса такая, понимаешь ли ;0
(27) …в той же слизаной NTFS предел размера файла — пара экзобайт.