Неоптимальная работа запроса

Шпаргалка к экзамену «Эксперт по технологическим вопросам».

… Вряд ли сможете думать о чем-то другом.

Шпаргалка для вопроса: Назовите известные Вам типичные ошибки в коде конфигурации и структуре метаданных, которые могут привести к неоптимальной работе запроса. Дайте рекомендации по устранению ошибок.

Признаков неоптимальных запросов насчитывается более двадцати, запомнить такой список непросто. Поэтому я решил их классифицировать и сгруппировать. Итак:

Ошибки в условиях
Ошибки в соединениях
Ошибки сортировки/группировки
Некорректное использование виртуальных таблиц
Прочие ошибки

Теперь подробнее.

Ошибки в формулировке условий: Параметры виртуальных таблиц, Соединения (ПО), ГДЕ

Проверять условия позже, чем надо

Данные передаются в плане запроса от оператора к оператору. Чем раньше удастся отсеять ненужные данные, тем быстрее будет работать запрос. Сначала идет формирование виртуальных таблиц, потом проверяются условия соединения (которые должны быть максимально простыми), позже всего проверяется условие «ГДЕ». Подробнее: //infostart.ru/public/527529/

Отсутствие индекса

Гораздо лучше, если для запроса есть индекс, который содержит все поля данных и условий. (покрывающий индекс для запроса)

Невозможность применен ия индекса (Преобразования)

Использование условия ИЛИ в запросах // Переписать запрос, используя "ОБЪЕДИНИТЬ ВСЕ". Кстати, проверка вхождения в список преобразуется внутри СУБД в условия "ИЛИ". В некоторых случаях оптимизатор может обработать "ИЛИ" правильно, например: "Контрагент.ИНН В &(Список)"
Подзапросы в условиях, в том числе неявные, сложные условия // Упрощайте, используйте временные таблицы, внутренние соединения, избегайте оператор проверки вхождения.
Преобразования, арифметические выражения над индексированным полем

Невозможность применен ия индекса (Принципиально)

Использование ПОДОБНО % // Вызывает сканирование таблицы, если процент помещен в начале шаблона.
Использование условия на «НЕ РАВНО» или «НЕ» // Если проверяем условие не вхождения в список, лучше использовать левое соединение и проверку IS NULL.
Использование поля составного типа примитивных и ссылочных значений // Поля составного типа преобразуются в СУБД в несколько столбцов.
Источники //infostart.ru/public/184361/, http://its.1c.ru/db/metod8dev#content:1828:hdoc

Ошибки в соедин ениях

Соединение с подзапросами (виртуальными таблицами) // В плане запросов преобразуются в малопривлекательный для больших объемов данных Nested loops.
Получение данных через точку от полей составного типа – неявные соединения // Пример полей: Регистратор, Субконто, Последовательность. Происходит левое соединение всех таблиц участвующих типов.
Сложные запросы, использующие большое количество соединений // Оказывается, оптимизатор MS SQL плохо обрабатывает запросы, где 6-8 соединений и больше. Соединение — самый тяжелый оператор.
Сложный, коррелированный запрос
Использование полного соединения для Postgres. Источник http://its.1c.ru/db/metod8dev#content:1556:hdoc

Ошибки сортировки/группировки

Использование ОБЪЕДИНИТЬ вместо ОБЪЕДИНИТЬ ВСЕ – лишняя сортировка
Повторная группировка виртуальных таблиц. Виртуальные таблицы остатков/оборотов сгруппированы по измерениям, участвующим в запросе
Выбрать первые + сортировка. Проблема, если сортировка по неиндексируемому полю, или не первому в индексе
Применять операцию "Различные" к выборке, заведомо не содержащей повторений.

Некорректное использование виртуальных таблиц

Указывать период в виртуальных таблицах вместо использования текущих итогов (Остатки, Срез последних 8.3)
Использование таблицы Обороты для периода, меньшего месяца.
Неполные условия внутри. // Поиск 1С по составным индексам можно сравнить с поиском адреса проживания. Если знаем город, знаем номер дома но не знаем улицу — поиск будет неприятным. Подходящий индекс содержит все поля, перечисленные в условии, поля в индексе идут подряд и между ними нет "зазоров".

Прочие ошибки

Внутри запроса

Запросы виды ВЫБРАТЬ * ИЗ … // Если в объекте есть табличные части — звездочка получает их тоже.
ДЛЯ ИЗМЕНЕНИЯ в автоматическом режиме, не указывать таблицы для блокировки
Конструкции типа Ссылка.Ссылка

Снаружи запроса

Выполнение запросов в цикле.
Выполнение запросов через объектную модель.
Неоптимальное использование RLS платформы // Следует делать запрос из привилегированного модуля, НЕ назначать две роли с RLS
Расчет остатков/оборотов по таблицам документов и таблицам движений регистров

Внутри — первый вариант статьи. Большинство комментариев — по нему.

Ошибки в условиях

Ошибки в соединениях
Ошибки кода

Теперь подробнее.

Ошибки в условиях Параметрах виртуальных таблиц, Соединения (ПО), ГДЕ

Проверять условия позже, чем надо

Данные передаются в плане запроса от оператора к оператору. Чем раньше удастся отсеять ненужные данные, тем быстрее будет работать запрос. Сначала идет формирование виртуальных таблиц, потом проверяются условия соединения (которые должны быть максимально простыми), позже всего проверяется условие «ГДЕ». Подробнее: //infostart.ru/public/527529/

Отсутствие индекса

Гораздо лучше, если для запроса есть индекс, который содержит все поля данных и условий. (покрывающий индекс для запроса)

Невозможность применения индекса (Преобразования)

Использование условия ИЛИ в запросах // Переписать запрос, используя "ОБЪЕДИНИТЬ ВСЕ". Кстати, проверка вхождения в список преобразуется внутри СУБД в условия "ИЛИ". В некоторых случаях оптимизатор может обработать "ИЛИ" правильно, например: "Контрагент.ИНН В &(Список)"
Подзапросы в условиях, в том числе неявные, сложные условия // Упрощайте, используйте временные таблицы, внутренние соединения, избегайте оператор проверки вхождения.
Преобразования, арифметические выражения над индексированным полем

Невозможность применения индекса (Принципиально)

Использование ПОДОБНО % // Вызывает сканирование таблицы, если процент помещен в начале шаблона.
Использование условия на «НЕ РАВНО» или «НЕ» // Если проверяем условие не вхождения в список, лучше использовать левое соединение и проверку IS NULL.
Неполное условие на виртуальные таблицы // Поиск 1С по составным индексам можно сравнить с поиском адреса проживания. Если знаем город, знаем номер дома но не знаем улицу — поиск будет неприятным. Подходящий индекс содержит все поля, перечисленные в условии, поля в индексе идут подряд и между ними нет "зазоров".
Использование поля составного типа примитивных и ссылочных значений // Поля составного типа преобразуются в СУБД в несколько столбцов.
Источники //infostart.ru/public/184361/, http://its.1c.ru/db/metod8dev#content:1828:hdoc

Ошибки в соединениях

Соединение с подзапросами (виртуальными таблицами) // В плане запросов преобразуются в малопривлекательный Nested loops.
Получение данных через точку от полей составного типа – неявные соединения // Пример полей: Регистратор, Субконто, Последовательность. Происходит левое соединение всех таблиц участвующих типов.
Сложные запросы, использующие большое количество соединений // Оказывается, оптимизатор MS SQL плохо обрабатывает запросы, где больше 8 соединений. Соединение — самый тяжелый оператор.

Ошибки кода

Внутри запроса

Запросы виды ВЫБРАТЬ * ИЗ … // Если в объекте есть табличные части — звездочка получает их тоже.
Использование ОБЪЕДИНИТЬ вместо ОБЪЕДИНИТЬ ВСЕ – лишняя сортировка
ДЛЯ ИЗМЕНЕНИЯ в автоматическом режиме, не указывать таблицы для блокировки
Повторная группировка виртуальных таблиц // Виртуальные таблицы уже сгруппированы по измерениям.
Конструкция типа Ссылка.Ссылка

Снаружи запроса

Выполнение запросов в цикле
Выполнение запросов через объектную модель
Неоптимальное использование RLS платформы // Следует делать запрос из привилегированного модуля, НЕ назначать две роли с RLS
Расчет остатков/оборотов по таблицам документов и таблицам движений регистров

Источники

Е. В. Филиппов, "Настольная книга 1С:ЭКСПЕРТА", изд. 2 страницы 215-232

http://learning1c.blogspot.ru/2015/10/1-4.html

https://its.1c.ru/db/metod8dev#content:5842:hdoc

https://ausevich.ru/ekspert/tipichnye-oshibki-privodyashchie-k-neoptimalnoj-rabote-zaprosa/#more-413

Дисклаймер: шпаргалка не заменит полноценной подготовки.

Буду благодарен за положительные отзывы, за конструктивную критику – благодарен вдвойне. Когда писал статью, сомневался: упоминать ли про регламентные операции (пересчет итогов регистров, реиндекс базы, пересчет статистики). С одной стороны они влияют сильно, с другой — это не метаданные и не код, под вопрос не подходят.

P.S. обратите внимание на файл docs
uV8Update.htm в каталоге установки программы. Выполнил отбор информации по теме экзамена. Лично мне интересно: с какого релиза какое новшество началось.

Осторожно, #многобукв

8.3.11 Реализована возможность поглощения управляемых блокировок. Блокировка, в которой указаны значения не всех пространств блокировки, поглотит блокировку, в которой указаны значения для большего количества пространств блокировки, при условии, что совпадают значения по совпадающим пространствам блокировок.

Если при эскалации блокировки возникает конфликт с уже наложенными блокировками, то эскалация не выполняется, а производится попытка установить запрошенную блокировку. В этом случае возможна ситуация, когда в системе будет существовать более 100 000 блокировок на одно пространство.

В случае, если используется транзакция с большим количеством управляемых блокировок, которые отличаются, например, значением одного измерения, рекомендуется вместо большого количества блокировок установить одну управляемую блокировку, для которой не будет установлено значение отличающегося измерения.

Ранее если при эскалации блокировки возникал конфликт с уже наложенными блокировками, то транзакция, которая пыталась эскалировать блокировку, отменялась.

8.3.11 Уточнена документация по особенности использования системы «1С:Предприятие» при работе с СУБД Oracle Database. Поведение платформы не изменилось.

При работе с СУБД Oracle Database отсутствует возможность использования внутри оператора В вложенного запроса с модификатором ПЕРВЫЕ, если внутри вложенного запроса есть обращения к полям внешнего запроса.

Ни разу не использовал такие сложные запросы. ))

8.3.11 В клиент-серверном варианте снижено влияние сервиса нумерации на время начала и завершения транзакций, даже если в транзакции не используется сервис нумерации.

В клиент-серверном варианте оптимизирована работа сервиса нумерации при большом количестве префиксов.

8.3.10 При работе в режиме управляемых блокировок (в клиент-серверном варианте) на СУБД PostgreSQL версии 9.3 и старше, поддерживается установка времени ожидания блокировок. Время ожидания получается из параметров информационной базы, аналогично другим СУБД.

Раньше время ожидания только для автоматического режима.

8.3.9 Для таблицы фактического периода действия регистра расчета индекс дополнен полями дата начала и дата окончания, индекс сделан кластерным.

8.3.9 Изменение времени ожидания блокировки данных в диалоге конфигуратора Параметры информационной базы требует административных прав в неразделенном сеансе и устанавливает мононольный режим доступа к информационной базе. При невозможности установки монопольного доступа выдается сообщение об ошибке со списком «мешающих» сеансов и возможностью повторения.

8.3.9 При откате транзакции из менеджера временных таблиц удаляются все временные таблицы, которые были созданы в рамках транзакции. В файловом варианте исключена возможность после отката транзакции в запросе использовать временные таблицы, которые были созданы этим запросом в рамках транзакции. При работе с другими СУБД использование временных таблиц после отката транзакции было недоступно.

В режиме совместимости с версией 8.3.8 поведение не изменилось.

Ранее использовали Truncate вместо Drop

8.3.8 Оптимизировано получение информации о блокировках СУБД. Время получения этой информации не зависит от количества информационных баз в кластере серверов.

Реализован сервис кластера серверов, выполняющий сбор информации о блокировках СУБД. Сервис называется AuxiliaryService (Сервис вспомогательных функций кластера).

Реализована возможность управлять сбором информации о блокировках СУБД в технологическом журнале (элемент <DBMSLOCKS>). Включение сбора информации о блокировках ведет к повышенной нагрузке на СУБД. Ранее Время получения информации о блокировках СУБД зависело от количества информационных баз в кластере серверов.

8.3.7 Оптимизировано чтение из СУБД объектов типа ДокументОбъект, СправочникОбъект, БизнесПроцессОбъект, ЗадачаОбъект, ПланВидовРасчетаОбъект, ПланВидовХарактеристикОбъект, ПланОбменаОбъект, ПланСчетовОбъект — чтение сопровождается неявным созданием транзакции только при наличии у объекта табличных частей и если СУБД используется «грязное» чтение вне транзакции.

Ранее было для любых СУБД. Теперь только для MS SQL )).

8.3.6 Реализована возможность указать пользователя, от имени которого будет запускаться менеджер кластера (rmngr), и который отличается от пользователя, от имени которого запускается агент кластера (ragent).

Реализована возможность указывать пользователей, от имени которых будут запускаться менеджер кластера (rmngr) и рабочий процесс (rphost) для каждого кластера на данном компьютере.

Реализована возможность указания своего каталога с реестром кластера для каждого менеджера кластера (rmngr) на данном компьютере.

Для файла swpuser.ini реализовано:

параметры rmngr_user и rmngr_pass;

параметр registry;

группа параметров НомерПорта:, которая может включать в себя все параметры файла swpuser.ini.

8.3.6 Поле Период, установленное в отборе набора записей периодического регистра сведений, включается в набор полей, по которым устанавливается управляемая блокировка при чтении или записи набора записей.

В режиме совместимости с версией 8.3.5 поведение не изменилось.

Ранее поле Период не включалось в управляемую блокировку, устанавливаемую при этой операции.

8.3.5 Пессимистическая блокировка данных, описываемых основным реквизитом формы, выполняется в следующих случаях:

При нажатии кнопки открытия выпадающего списка в поле ввода;

При попытке создания нового элемента из выпадающего списка в поле ввода;

При попытке открыть список выбора из поля ввода;

При начале ввода текста в поле ввода.

Если блокировку установить не получилось — действие не выполняется.

8.3.4 Вне зависимости от значения свойства конфигурации Режим автонумерации объектов, реализовано повторное использование автоматически назначенного номера объекта, если произошел откат транзакции, в которой выполнялась запись этого объекта.

Ранее не выполнялось повторное использование номера

8.3.4 В клиент-серверном варианте снижено влияние сервиса нумерации на время начала и завершения транзакций, даже если в транзакции не используется сервис нумерации.

В клиент-серверном варианте оптимизирована работа сервиса нумерации при большом количестве префиксов.

Ранее в клиент-серверном варианте сервис нумерации оказывал негативное влияние на начало и завершение транзакций, даже если в транзакции не использовался этот сервис.

8.3.4 Исключена возможность устанавливать управляемые транзакционные блокировки (свойство ПоляБлокировкиДанных) по реквизитам объектов следующих типов: строка неограниченной длины, хранилище значений, тип значения характеристики, составные типы, включающие в себя какие-либо из вышеперечисленных типов.

При проверке конфигурации выполняется контроль полей, указанных в списке полей блокировки данных и выдается ошибка, если какое-либо из полей не соответствует ограничениям.

8.3.3 Реализован механизм установки монопольного доступа к области данных. Монопольный доступ к области не совместим с любой блокировкой данных в этой области другими сеансами. Монопольный режим области данных должен явно устанавливаться и сниматься с помощью метода встроенного языка УстановитьМонопольныйРежим(). Фоновое задание, запущенное из сеанса, установившего монопольный режим области, до своего завершения получает монопольный доступ родительского сеанса, при этом родительский сеанс «лишается» монопольного доступа.

8.3.3 Количество установленных управляемых блокировок, превышение которого приводит к установке блокировки на все пространство блокировки, равно 100 000.

Ранее порог был 20 000.

8.3.3 Реализована возможность устанавливать управляемые транзакционные блокировки по реквизитам объектов. Для указания реквизитов, по которым возможна блокировка, реализовано свойство ПоляБлокировкиДанных для следующих объектов конфигурации:

Справочник;
Документ;
План видов характеристик;
План видов расчета;
Бизнес-процесс;
Задача;
План счетов;
План обмена.

При записи или удалении объекта выполняется блокировка по всем реквизитам, указанным в свойстве ПоляБлокировкиДанных (по значениям до выполнения операции и из текущего состояния объекта), а также по полю Ссылка.

В режиме совместимости с версией 8.3.2 поведение не изменилось.

8.3.3 Использование объекта БлокировкаДанных, вне транзакции или в автоматическом режиме управления блокировками, приводит к возникновению исключения.

В режиме совместимости с версией 8.3.2 поведение не изменилось.

Ранее ошибки не возникало, но и блокировок не было.

8.3.3 Дискретность вывода времени событий в технологический журнал увеличена до 1 микросекунды. Количество микросекунд времени события технологического журнала выводится в шести позициях.

Реализовано свойство Durationus, которое содержит длительность события, выраженное в микросекундах. Отборы по свойствам Duration поддерживаются для совместимости.

Ранее Дискретность вывода времени событий в технологический журнал равнялась 100 микросекундам.

8.3.1 При работе с Microsoft SQL Server версии 2005 и выше, используется режим управления версиями строк, если конфигурация использует режим управляемых блокировок. Используется уровень изоляции транзакций READ_COMMITED_SNAPSHOT. При чтении данных вне транзакций используется согласованное чтение.

Ранее использовался уровень изоляции транзакций READ_COMMITED. При чтении вне транзакций использовалось «грязное» чтение.

32 Comments

quebracho 27.04.2018 at 06:18

Возможно ошибка в тексте публикации.

Reply ↓
vasilev2015 27.04.2018 at 09:13

(2) Здравствуйте !

Группировка в моем понимании связана с вычислением агрегатных функций.

Объединить (без ВСЕ), применяет различные (DISTINCT) в плане запросов — оператор сортировки.

Reply ↓
vasilev2015 27.04.2018 at 09:16

Коллеги,

я знаю что скоро экзамен, поэтому писал статью второпях.

Буду вносить правки.

Сообщайте о своих сомнениях активнее.

Заранее благодарен.

Reply ↓
melenaspb 27.04.2018 at 10:50

Использование условия на «НЕ РАВНО» или «НЕ» // Если проверяем условие не вхождения в список, лучше использовать внутреннее соединение и проверку IS NOT NULL.

А не ЛЕВОЕ и проверка ЕСТЬ NULL?

Reply ↓
vasilev2015 27.04.2018 at 11:40

(5) Елена, спасибо за внимательность, исправлю.

Reply ↓
headMade 27.04.2018 at 13:03

Для 8.3.12 описание новшеств есть?

Сами сдавали на эксперта или готовитесь?

Reply ↓
vasilev2015 27.04.2018 at 13:13

(7) в статье нет, но можете посмотреть сами в каталоге установки.

нет, не сдавал. Когда сдал — уже шпаргалки писать не нужно.

Reply ↓
headMade 27.04.2018 at 13:17

я бы еще добавил:

— Невыполнение регламентных операций

— Несоответствие индексов и условий (для каждого условия д.б. подходящий ин-декс: содержит все поля, перечисленнные в условии, поля в индексе идут подряд и между ними нет зазоров.).

у вас указано «Неполное условие на виртуальные таблицы» — на не совсем понятно о чем тут

я бы немного перефразировал:

«При этом неоптимально — получение ДАННЫХ через точку от полей составного типа», а не «Обращение через точку к полям составного типа»

Reply ↓
Serg1701 27.04.2018 at 13:49

Полезная статья. Спасибо. Приятно, что не забываете о группе КИНО)))

Reply ↓
vasilev2015 27.04.2018 at 13:59

(10) я боялся, что цитату не заметят. Хотел еще пожирнее сделать.

Reply ↓
vasilev2015 27.04.2018 at 14:03

(9) Спасибо за полезное замечание. Когда писал статью сомневался про Регламентные операции. С одной стороны они влияют сильно, с другой — это не метаданные и не код. С остальным согласен.

Reply ↓
nickpugachev 27.04.2018 at 19:36

В плане запросов преобразуются в малопривлекательный Nested loops

Nested loops самая дешевая операция и в некоторых условиях вполне привлекательная. Это экзаменатор будет уточнять 100% при первой же фразе, что NL плохо

Повторная группировка виртуальных таблиц // Виртуальные таблицы уже сгруппированы по измерениям

Группировка зависит от типа регистра. Срез последних у регистра сведений и обороты регистра накоплений по-разному себя будут вести при выборке не всех измерений в запросе, тоже на доп. вопрос экзаменатора попадете

Reply ↓
vasilev2015 27.04.2018 at 20:35

(13) Да, разумеется, Nested Loops малопривлекателен при большом количестве строк.

Подразумевалась повторная группировка остатков/оборотов.

Спасибо за уточнения.

Reply ↓
vasilev2015 28.04.2018 at 09:12

Отправил немного SM всем, кто помог сделать статью лучше.

:-))

Reply ↓
KVG495 28.04.2018 at 14:43

Еще бы добавил: низкая селективность существующего индекса. Например если индексируемое поле — булево.

И еще два момента:

1. Условие в параметрах виртуальной таблицы должно быть простым. Если там начать строить сложные правила фильтрации. Например по реквизитам измерений, то система сформирует соединение с полным сканированием таблицы движений.

2. Хотел уточнить про соединение с виртуальными таблицами. В общем случае запрос к вирт. таб. лучше выносить в отдельный пакетный запрос иначе будет соединение с подзапросом — это все правильно.

Но! Представим след случай. Соединяемся с периодическим РС. Таблицей среза последних (или первых). Если для регистра установлены галки «Разрешить итоги: срез первых (последних)«, тогда в платформа созтает дополнительные физические таблицы в БД. И если заведомо известно, что запрос получает актуальные итоги, то можно соединяться с виртуальной таблицей напрямую. Без предварительного создания временных таблиц.

Reply ↓
vasilev2015 28.04.2018 at 16:52

(17) Здравствуйте, Андрей !

Низкая селективность использованного индекса влечет сканирование таблицы. Только это не является ошибкой кода конфигурации или метаданных. Про условие я указывал: Ошибки в условиях Параметрах виртуальных таблиц, Соединения (ПО), ГДЕ >> Невозможность применения индекса (Преобразования) >> Подзапросы в условиях. Может, недостаточно выпукло — уточню. Виртуальные таблицы действительно разные по своей полезности. Остатки и срез на пустую дату обращаются к таблицам итогов. Реализация срез на определенную дату сама содержит соединение с подзапросом. Но тему про виртуальные таблицы в рамках этой статьи развивать не буду.

В любом случае — спасибо.

Reply ↓
nickpugachev 28.04.2018 at 17:14

(14) Опять же, последует вопрос что такое «большое количество строк» 🙂 — до 3 строк в ведущей таблице — хорошо, больше — нет

Для оракла при этом есть нюансы, связанные с расположением данных, не помню их

Reply ↓
vasilev2015 28.04.2018 at 18:26

(19) Если есть примерный список вопросов — присылайте ))

Reply ↓
palsergeich 28.04.2018 at 20:33

(17)

Но! Представим след случай. Соединяемся с периодическим РС. Таблицей среза последних (или первых). Если для регистра установлены галки «Разрешить итоги: срез первых (последних)», тогда в платформа созтает дополнительные физические таблицы в БД. И если заведомо известно, что запрос получает актуальные итоги, то можно соединяться с виртуальной таблицей напрямую. Без предварительного создания временных таблиц.

Но запись в таблицу итогов среза последних — это тоже затраты, встречал случаи, когда запись в основную таблицу РС шла минимально фиксируемое время, а запись в таблицу итогов РС до секунды в серверной базе без других пользователей, что в общем то было не здорово. Но это был весьма древний релиз, возможно сейчас это не так.

Иногда лучшее враг хорошего.

А по теме — удачи с экзаменом, мне не хватило прямо совсем чуть чуть, даже экзаменатор сокрушался, как же я так в последнюю секунду срезался… Надеюсь Вам повезет больше.

И да категорически рекомендую подтянуть знания по анализу тех журнала, если есть пробелы, достаточно в рамках этой статьи. Доп вопрос из разряда посчитайте количество дедлоков СУБД в логах в этой папке (коряво формулирую) это более чем реально (подсказка важно не то что вы эталонно решите эту задачу, а то что вы знаете как ее решить, если экзаменатор видит что Вы знаете, но просто впали в ступор — поможет).

События тех журнала — тоже знать желательно все, вплоть до релиза платформы, в котором появилось.

Так же в фаворе postgres — но тут вопросы попроще.

На моей аттестации в группе, с которой я сдавал — вопросов и доп вопросов именно по теме статьи было мало и они были не сложные, а вот вопросов по ТЖ и postgress — много.

Reply ↓
palsergeich 28.04.2018 at 21:01

Сложные запросы, использующие большое количество соединений // Оказывается, оптимизатор MS SQL плохо обрабатывает запросы, где больше 8 соединений. Соединение — самый тяжелый оператор.

Тут есть разночтения в зависимости от источника фигурирует цифра 6-8.

Я на экзамене ответил 6-8 и получил +

Соединение с подзапросами (виртуальными таблицами) // В плане запросов преобразуются в малопривлекательный Nested loops.

это не является ошибкой, на сколько я помню даже в настольной книге эксперта об этом написано, просто данный прием часто ведет к проблемам, но у меня есть примеры — когда именно подазпрос давал самый быстрый результат по времени исполнения.

Расчет остатков/оборотов по таблицам документов и таблицам движений регистров

в части таблицам движений регистров не всегда это так, если период меньше периода итогов (ну например обороты за неделю по высокооборотистому складу), то запрос к реальным таблицам может оказаться существенно быстрее, ибо план запроса, по по запросу написанным программистом, может быть проще плана запроса по автосгенерированному тексту запроса. На обучении приводили пример кстати.

И еще — отсутствие расчитанных итогов — тоже может привести к крайне неоптимальной работе запроса, все о них забывают и на экзамене очень желательно и об этом сказать. Если этого не сказать экзаменатор немножко попытается это вытащить, если не получится то вместо + будет +-

Reply ↓
vasilev2015 28.04.2018 at 21:16

(22) Спасибо, что Вы поделились реальным опытом. Очень важно знать, что идешь в верном направлении.

Reply ↓
palsergeich 28.04.2018 at 21:27

(23) ну и просто категорически рекомендую пройти очное или заочное подготовку к экзамену Эксперт. Все что там рассказывают могут спросить на экзамене + есть спойлеры. И по большому счету — мне лично кое что очень пригодилось в реальной практике. Если быть активным — то это может аукнутся положительным бонусом на эказмене.

Reply ↓
nickpugachev 28.04.2018 at 21:29

(20) Это то что на моей сдаче было. Только заикнешься про что-либо — тут же начинают копать насколько ты это знаешь

На самом деле тест первого дня пройти не сложно.

Дальше нужно активничать, хорошо знать поиск и фильтрацию текстовых файлов (логов) из командной строки (grep и т.д.), достаточно быстро писать тестовые сценарии для центра тестирования. Ну и не бояться и выходить показывать свои решения.

Reply ↓
vasilev2015 28.04.2018 at 22:29

(24) Вы составляли какие-то шпаргалки, пытаясь предугадать вопросы экзамена ?

Reply ↓
palsergeich 28.04.2018 at 23:42

(26) Если честно то я не серьезно отнесся к описанию самого экзамена, думал билет 3 вопроса + допы, прорешал все билеты и пошел)))) не обратил внимания на

Письменная часть состоит из теста.

В итоге эти 3 вопросы — чистая формальность. их по диагонали посмотрели + + +- какие то доп вопросы задали чисто формальные, не помню, уровень новичок, реально, у меня даже как таковых доп вопросов по этой части не было (ибо сами вопросы в текущих реалиях слабо актуальны)

Тестирование — 20 вопросов. Разные.

От. Что значит настройка техжуранла DBMSSQL, до вопросов в 5-6 строк, которые с первой попытки и не прочитаешь. Именно по ним и идут доп вопросы. Именно они то и важны, как оказалось). Вот именно тут и оказалась засада. Пример. Как определить были ли deadlock на уровне СУБД по тех журналу. Ответ: будет событие, дай бог памяти EXCP с текстом «Lock request time out period exceeded». (могу ошибаться, не пинайте), на что экзаменатор вам может дать ноутбук и сказать посчитайте количество этих событий вон в этой папочке. Шпаргалки тут бесполезны

Reply ↓
Andrefan 05.05.2018 at 12:55

Добрый день.

Я бы ещё вынес четвертым разделом «Остальные причины» и добавил бы туда

— Невыполнение регламентных операций. Симптом — количество ожидаемых строк сильно отличается от фактических. (коллега уже писал в комментариях, видел)

— Использование Полного внешнего соединения. В случае с Postgres особо критично.

— Выбрать первые + сортировка. Проблема, если сортировка по неиндексируемому полю, или не первому в индексе.

— Коррелированный запрос

— Фильтр по периоду в параметрах виртуальной таблицы Остатки без необходимости (без фильтра будут использовать только текущие итоги)

Reply ↓
vasilev2015 05.05.2018 at 17:05

(29) есть рациональное зерно.

Reply ↓
Dach 04.06.2018 at 17:59

«Сначала идет формирование виртуальных таблиц, потом проверяются условия соединения (которые должны быть максимально простыми), позже всего проверяется условие «ГДЕ»»

Извините, но это не всегда так. В общем случае да, но в частном нет. Запрос вида

ВЫБРАТЬ

ДоговорыКонтрагентов.Ссылка КАК Ссылка

ИЗ

Справочник.ДоговорыКонтрагентов КАК ДоговорыКонтрагентов

ЛЕВОЕ СОЕДИНЕНИЕ Справочник.Контрагенты КАК Контрагенты

ПО ДоговорыКонтрагентов.Владелец = Контрагенты.Ссылка

ГДЕ

ДоговорыКонтрагентов.Ссылка = &Ссылка

выполнится так:

Сначала выполнится поиск конкретной строки в таблицы договоров, потом к ней будет выполнен джойн таблицы контрагентов. Оптимизатор запросов в общем и целом «не дурак» и он не будет сначала ко всей огромной таблице договоров приклеивать огромную таблицу контрагентов и после выполнять отбор. Говоря языком T-SQL, иными словами, операция INDEX RANGE SEEK более привлекательная и приоритетная, чем INDEX RANGE SCAN и еще более чем FULL SCAN и оптимизатор всегда старается использовать сначала ее. В этом легко убедиться, если посмотреть план запроса. Мало того, если в секции «ГДЕ» заменить отбор на любой неиндексированный реквизит (например «Номер») — все равно сначала выполнится отбор и потом только джойн. То есть оптимизатор каким-то образом прогнозирует затраты на выполнение запроса при компиляции плана. Подозреваю, что не последнюю роль тут играет свежая статистика таблиц.

Даже знаете, вот если логично рассуждать. Вы на форме списка открываете документ с 25 табличными частями. Запрос платформой будет сформирован с условием WHERE. И документ у вас быстро откроется, хотя табличные части — это на минуточку — совершенно другие таблицы БД.

Предлагаю вышеприведенную формулировку дополнить фразой «в общих случаях».

И добавить: «при написании запроса нужно стараться руководствоваться принципом максимальной нормализации и минимизации выборки в ведущей таблице перед выполнением к ней каких-либо соединений»

Reply ↓
vasilev2015 04.06.2018 at 21:06

(31) Да, по поводу порядка выполнения были знатные холивары.

Здесь имел ввиду логический порядок (без учета оптимизатора).

Reply ↓
AlX0id 06.06.2018 at 08:08

(27)

Lock request time out period exceeded

(27)

посчитайте количество этих событий

Это еще из самых простых задач, я бы сказал )) Мне досталась задача — в 27 гигах логов найти таймауты на блокировках и объяснить их причину (!)

Reply ↓
ELInfinito 19.10.2018 at 13:05

Отличная статья.

Заинтересовало следующее :

Некорректное использование виртуальных таблиц:

— Использование таблицы Обороты для периода, меньшего месяца.

Вопрос — в чем некорректность использования ?

На основании какого типа регистра делается вывод — «Обороты» или «Остатки» ?

Reply ↓
vasilev2015 19.10.2018 at 13:53

(35) Здравствуйте !

Речь идет о виртуальных таблицах .Обороты или .ОстаткиИОбороты.

Если смотреть план запроса, то при использовании таких таблиц с периодом меньше месяца как правило можно найти лишние действия: группировку или сортировку. Итоги при этом не используются.

Поэтому обращение к таблице напрямую быстрее.

На мой взгляд, эта неоптимальность не является критической, но знать нужно.

Reply ↓

Неоптимальная работа запроса

Проверять условия позже, чем надо

Отсутствие индекса

Related Posts

32 Comments

Leave a Comment Отменить ответ