Загрузка из EXCEL в 1С. Чтение файла XLSX средствами 1С. ЧтениеXML

ПРАКТИЧЕСКОЕ ПОСОБИЕ РАЗРАБОТЧИКА: Метод "NativeXLSX" (ЧтениеXML).
Обрабатываются данные EXCEL типов: "Строка", "Число", "Дата" ("Время"), "Булево", "Процент".

В данной статье приведен функционал, с помощью которого в обработке
«Импорт из EXCEL и др.источников (xls,xlsx,ods,sxc,dbf,mxl,csv,sql) в 1С«: //infostart.ru/public/120961/
производится считывание данных из файлов табличного типа *.xlsx средствами 1С (метод «NativeXLSX»).

19.09.2014. Уточненная редакция.

Метод позволяет обрабатывать данные EXCEL типов: «Строка», «Число», «Дата» («Время»), «Булево», «Процент».


Методы загрузки из внешнего источника:
— Метод «MS ADO» (Чтение файлов xls, xlsx средствами Microsoft ADO): //infostart.ru/public/163640/
— Метод «MS EXCEL» (Чтение файлов xls, xlsx с картинками средствами Microsoft Office): //infostart.ru/public/163641/
— Метод «LO CALC» (Чтение файлов xls, xlsx, ods, sxc с картинками средствами LibreOffice): //infostart.ru/public/163642/
— Метод «NativeXLSX» (Чтение файлов xlsx с картинками средствами 1С. ПостроительDOM): //infostart.ru/public/300092/
— Метод «NativeXLSX». Предыдущий вариант (Чтение файлов xlsx средствами 1С. ЧтениеXML):
//infostart.ru/public/225624/
— Метод «Excel1C» (Загрузка на платформе 8.3.6 с картинками. Чтение файлов xls, xlsx, ods): //infostart.ru/public/341855/
— Список листов файла: //infostart.ru/public/163724/


Публикаций на тему загрузки из EXCEL — множество, но
«
— Вам билетёр нужен?
— Был нужен, да уже взяли.
— Может и я на что сгожусь?
— Может и сгодишься, если скалиться не будешь …
«
«НЕУЛОВИМЫЕ МСТИТЕЛИ» (1966).


Публикации других авторов:

«XLSX средствами 1С»:
1cmax: Чтение файлов *.xlsx средствами 1С 8.2 (Управляемые формы) в т.ч. Веб-клиент: //infostart.ru/public/142187
Abadonna: Чтение файлов *.xlsx средствами 1С 8.2: //infostart.ru/public/139556
Dzenn: Загрузка файлов Excel XLSX через XML: //infostart.ru/public/205359
webstep: Чтение документа Excel 2007 без офиса, без ВК: //infostart.ru/public/202423
Душелов: Чтение/Запись документа Excel 2007 без офиса, без ВК. (с примером для 7.7, 8.1 и 8.2 на управляемых формах): //infostart.ru/public/19139
«Другое: чтение/редактирование XML»:
anig99: «Однопальцевое» чтение XML для 8.2: //infostart.ru/public/84254
Lokiy: Парсинг, преобразование, редактирование XML: //infostart.ru/public/198131
onec.developer: Редактор XML на управляемых формах 8.2: //infostart.ru/public/201077
Yashazz: Просмотр xml-файлов: //infostart.ru/public/203514
Душелов: Создание документа Word 2007: //infostart.ru/public/16215
«Не 1С, но полезно»:
iddqd: akXmlEdit — v1.5.0.7 редактор XML: //infostart.ru/public/15464


&НаКлиенте
Процедура ПриОткрытии(Отказ)
    ФайлEXCEL= «D:Товар.xlsx»;
    ИмяНомерЛиста = Новый Структура («ИмяЛиста, НомерЛиста»,«Alfa1», 1);
    СтрокаЗаголовка = 1;
    НачСтрока = 0;
    КонСтрока = 0;
    КолвоСтрокExcel = 0;
    ЗагрузитьМетодом_NativeXLSX_НаСервере(ФайлEXCEL, ИмяНомерЛиста, СтрокаЗаголовка, НачСтрока, КонСтрока, КолвоСтрокExcel);
КонецПроцедуры

&НаСервере
Процедура ЗагрузитьМетодом_NativeXLSX_НаСервере(ФайлEXCEL, ИмяНомерЛиста, СтрокаЗаголовка, НачСтрока, КонСтрока, КолвоСтрокExcel)
    ТаблицаРезультат = ЗагрузитьМетодом_NativeXLSX(ФайлEXCEL, ИмяНомерЛиста, СтрокаЗаголовка, НачСтрока, КонСтрока, КолвоСтрокExcel);
КонецПроцедуры

// Метод «NativeXLSX» (ЧтениеXML).
// Преобразует текст формата XML (файл типа XLSX) в таблицу значений,
// при этом колонки таблицы формируются на основе описания в XML.
//
// Параметры:
//      ФайлEXCEL — Полное имя файла (путь к файлу с именем файла и расширением)
//      ИмяНомерЛиста — Структура Имя и Номер выбранного листа файла EXCEL.
//      СтрокаЗаголовка (по умолчанию = 1) — Номер строки EXCEL, в которой расположены заголовки колонок.
//          Не используется.
//      В обработке 1-я строка анализируется для сопоставления колонок EXCEL с реквизитами 1С (справочники, докуметны, регистры).
//      НачСтрока (по-умолчанию = 0) — Номер начальной строки, начиная с которой считываются данные из EXCEL.
//      КонСтрока (по-умолчанию = 0) — Номер конечной строки, которой заканчиваются считываемые данные из EXCEL.
//          Если НачСтрока=0 и КонСтрока=0, то считывается вся таблица, находящаяся на листе EXCEL.
//      КолвоСтрокExcel — Количество строк на листе «ИмяЛиста» EXCEL. Возвращается в вызываемую процедуру.
//
// Возвращаемые значения:
//      ТаблицаРезультат — Результат считывания с листа «ИмяНомерЛиста» EXCEL.
//
&НаСервере
Функция ЗагрузитьМетодом_NativeXLSX(Знач ФайлEXCEL, Знач ИмяНомерЛиста, Знач СтрокаЗаголовка = 1, Знач НачСтрока = 0, Знач КонСтрока = 0, КолвоСтрокExcel = 0)
    Перем ZIPКаталог, ФайлИмяЛиста, ФайлНомерЛиста, КолвоКолонокEXCEL, НомерСтроки, НомерКолонки, ИмяКолонки, ИндексКолонки, ШиринаКолонки, ДлинаСтроки;
    Перем МассивИменКолонокXLSX, МассивSharedStrings, МассивNumFmtId, СоответствиеNumFmtIdFormatCode;
    Перем SheetX,ЗначениеЯчейки, ТипЗначения, ФорматЯчейки, ФорматСтиля;
    Перем ТаблицаРезультат, НоваяСтрока;
   
    ФайлНомерЛиста  = ИмяНомерЛиста.НомерЛиста;
    ФайлНомерЛиста = ?(ФайлНомерЛиста = 0, 1, ФайлНомерЛиста);
   
    ZIPКаталог = КаталогВременныхФайлов() + «XLSX»;
    Если НЕ ПредварительнаяОбработкаФайлаXLSX(ФайлEXCEL, ZIPКаталог) Тогда
        Возврат Новый ТаблицаЗначений;
    КонецЕсли;
   
    СоответствиеNumFmtIdFormatCode = Новый Соответствие;
    МассивNumFmtId = ИзвлечьДанныеИзФайла_StylesXML(ZIPКаталог, СоответствиеNumFmtIdFormatCode);
   
    МассивSharedStrings = ИзвлечьДанныеИзФайла_SharedStringsXML(ZIPКаталог);
   
    SheetX = Новый ЧтениеXML;
    SheetX.ОткрытьФайл(ZIPКаталог + «XLWorkSheetsSheet» + ФайлНомерЛиста + «.xml»);
   
    МассивИменКолонокXLSX = ПолучитьМассивИменКолонокНаЛистеXLSX(SheetX);
    КолвоКолонокEXCEL = МассивИменКолонокXLSX.Количество();
   
    // Создание результирующей таблицы, в которую будут записываться считанные из EXCEL данные.
    ТаблицаРезультат = Новый ТаблицаЗначений;
    // Формирование колонок результирующей таблицы.
    // «НомерСтроки» — для наглядности и удобства.
    // В зависимости от разрабатываемой обработки.
    // «Сопоставлено» — может быть другим.
    // Здесь же могут быть добавлены другие колонки, не формируемые из содержимого файла EXCEL.
    ТаблицаРезультат.Колонки.Добавить(«НомерСтроки», Новый ОписаниеТипов(«Число»), «№», 4);
    ТаблицаРезультат.Колонки.Добавить(«Сопоставлено», Новый ОписаниеТипов(«Булево»), «Сопоставлено», 1)
;
    ТаблицаРезультат.Колонки.Добавить(«УровеньГруппировки«, Новый ОписаниеТипов(
«Число»), «Гр», 2); // Группировка строк в файле EXCEL.
    Для ит = 1 ПО КолвоКолонокExcel Цикл
        ИмяКолонки = «N» + ит;
        Колонка = ТаблицаРезультат.Колонки.Добавить(ИмяКолонки);
    КонецЦикла;
   
    SheetX = Новый ЧтениеXML;
    SheetX.ОткрытьФайл(ZIPКаталог + «XLWorkSheetsSheet» + ФайлНомерЛиста + «.xml»);
   
    ЭтоНачалоДанных = Ложь;
    // Считать очередной узел XML.
    Пока SheetX.Прочитать() Цикл
        Если ВРег(SheetX.Имя) = «SHEETDATA» И SheetX.ТипУзла = ТипУзлаXML.НачалоЭлемента Тогда
            ЭтоНачалоДанных = Истина;
            Прервать;
        КонецЕсли;
    КонецЦикла;
    Если НЕ ЭтоНачалоДанных Тогда
        Возврат Новый ТаблицаЗначений;
    КонецЕсли;
   
    // Считать очередной узел XML.
    НомерСтроки = 0;
    Пока SheetX.Прочитать() Цикл
        Если ВРег(SheetX.Имя) = «SHEETDATA» И SheetX.ТипУзла = ТипУзлаXML.КонецЭлемента Тогда
            Прервать;   // Окончание данных.
        КонецЕсли;
        Если ВРег(SheetX.Имя) = «ROW» И SheetX.ТипУзла = ТипУзлаXML.НачалоЭлемента Тогда
            НомерСтроки = НомерСтроки + 1;
            Если НЕ НачСтрока = 0 И НЕ НомерСтроки = 1 И НомерСтроки < НачСтрока Тогда
                Продолжить;
            КонецЕсли;
            НоваяСтрока = ТаблицаРезультат.Добавить();
            НоваяСтрока.НомерСтроки = НомерСтроки
;
            НоваяСтрока.УровеньГруппировки = SheetX.ЗначениеАтрибута(«outlineLevel»);

            Пока SheetX.Прочитать() Цикл    // Считаем колонки строки EXCEL.
                Если ВРег(SheetX.Имя) = «ROW» Тогда
                    Прервать;
                КонецЕсли;
                Если ВРег(SheetX.Имя) = «SHEETDATA» И SheetX.ТипУзла = ТипУзлаXML.КонецЭлемента Тогда
                    Прервать;   // Окончание данных.
                КонецЕсли;
                Если ВРег(SheetX.Имя) = «C» И SheetX.ТипУзла = ТипУзлаXML.НачалоЭлемента Тогда
                    ТипЗначения = SheetX.ЗначениеАтрибута(«t»);
                    ФорматЯчейки = SheetX.ЗначениеАтрибута(«s»);
                    ИмяКолонки = SheetX.ЗначениеАтрибута(«r»);
                    ИмяКолонкиБезЦифр = ЗаменитьОдниСимволыДругими(«0123456789», ИмяКолонки, «»);
                    ИндексКолонки = МассивИменКолонокXLSX.Найти(ИмяКолонкиБезЦифр)+1;
                    SheetX.Прочитать();
                    Если ВРег(SheetX.Имя) = «V»  ИЛИ ВРег(SheetX.Имя) = «F» Тогда   // «V» — Значение, «F» — Формула.
                        Если ВРег(SheetX.Имя) = «F» Тогда
                            Пока НЕ ВРег(SheetX.Имя) = «V» Цикл
                                SheetX.Прочитать();
                            КонецЦикла;
                        КонецЕсли;
                        SheetX.Прочитать();
                        Если ВРег(SheetX.Имя) = «#TEXT» Тогда
                            ЗначениеЯчейки = SheetX.Значение;
                            ФорматСтиля = «»;
                            Если (НЕ ФорматЯчейки = «» И НЕ ФорматЯчейки = Неопределено) Тогда
                                Попытка
                                    ИндексФормата = Число(ФорматЯчейки);
                                    ФорматСтиля = СоответствиеNumFmtIdFormatCode.Получить(МассивNumFmtId[ИндексФормата]);
                                Исключение
                                    ФорматСтиля = «»;
                                КонецПопытки;
                            КонецЕсли;
                            Если ЗначениеЗаполнено(ЗначениеЯчейки) Тогда
                                Если ТипЗначения = Неопределено ИЛИ ВРег(ТипЗначения) = «N» ИЛИ ВРег(ТипЗначения) = «B» Тогда
                                    Попытка
                                        Значение1 = Число(ЗначениеЯчейки);
                                    Исключение
                                        Значение1 = ЗначениеЯчейки;
                                    КонецПопытки;
                                    ЗначениеЯчейки = Значение1;
                                    Если (ФорматСтиля = «« ИЛИ ФорматСтиля = Неопределено) Тогда
                                        // ФорматСтиля = Неопределено — Атрибут «s» отсутствует.
                                        // MS Office (2010) может не формировать в xml-файле описание стиля форматирования для ячейки.
                                        // LibreOffice (4.1.5) формирует в xml-файле необходимые описания стиля форматирования ячейки.
                                        // Сообщить(«Не определен стиль форматирования для кода » + ФорматЯчейки + » значения » + ЗначениеЯчейки);
                                    КонецЕсли;
                                   
                                    Если ТипЗнч(ЗначениеЯчейки) = Тип(«Строка»)
                                        И (Найти(ЗначениеЯчейки, «E-«) > 0 ИЛИ Найти(ЗначениеЯчейки, «E+») > 0) Тогда
                                        ЗначениеЯчейки = ПолучитьЧислоВСтепениИзСтроковогоЗначения(ЗначениеЯчейки);
                                    КонецЕсли;
                                   
                                    Если ТипЗнч(ЗначениеЯчейки) = Тип(«Число») Тогда
                                        // ПРОЦЕНТ.
                                        Если ЭтоПроцентXLSX(ЗначениеЯчейки, ФорматСтиля) Тогда
                                            ЗначениеЯчейки = Окр(ЗначениеЯчейки * 100, 3);
                                        // БУЛЕВО.
                                        ИначеЕсли ЭтоБулевоXLSX(ЗначениеЯчейки, ФорматСтиля) Тогда
                                            ЗначениеЯчейки = Булево(ЗначениеЯчейки);
                                        // ВРЕМЯ.
                                        ИначеЕсли ЭтоВремяXLSX(ЗначениеЯчейки, ФорматСтиля) Тогда
                                            ЗначениеЯчейки = КонвертироватьЧислоXLSXвДатуВремя(ЗначениеЯчейки);
                                        // ДАТА.
                                        ИначеЕсли ЭтоДатаXLSX(ЗначениеЯчейки, ФорматСтиля) Тогда
                                            ЗначениеЯчейки = КонвертироватьЧислоXLSXвДату(ЗначениеЯчейки);
                                        // ЧИСЛО.
                                        ИначеЕсли ТипЗначения = Неопределено
                                            ИЛИ ( ЭтоЧислоXLSX(ЗначениеЯчейки, ФорматСтиля)
                                            И НЕ ЭтоБулевоXLSX(ЗначениеЯчейки, ФорматСтиля)
                                            И НЕ ЭтоВремяXLSX(ЗначениеЯчейки, ФорматСтиля)
                                            И НЕ ЭтоДатаXLSX(ЗначениеЯчейки, ФорматСтиля) )
                                            Тогда
                                            // Без преобразования.
                                        Иначе
                                            // Прочие форматы.
                                        КонецЕсли;
                                       
                                    Иначе
                                       
                                        Сообщить(«Не удалось преобразовать значение к «»числовому»»(процент, время, дата, число) типу.»);
                                       
                                    КонецЕсли;
                                   
                                ИначеЕсли ВРег(ТипЗначения) = «S» Тогда
                                   
                                    // МассивSharedStrings может быть пустым.
                                    Попытка
                                        ЗначениеЯчейки = СокрЛП(МассивSharedStrings[Число(SheetX.Значение)]);
                                    Исключение
                                        ЗначениеЯчейки = «»;
                                    КонецПопытки;
                                   
                                ИначеЕсли ВРег(ТипЗначения) = «STR» Тогда
                       
                                    Если ТипЗнч(ЗначениеЯчейки) = Тип(«Строка») Тогда
                                        ЗначениеЯчейки = СокрЛП(ЗначениеЯчейки);
                                    КонецЕсли;
                       
                                КонецЕсли;
                            КонецЕсли;
                           
                            ИмяКолонки = «N»+ИндексКолонки;
                            НоваяСтрока[ИмяКолонки] = ЗначениеЯчейки;
                            // Используется при формировании таблицы на форме обработки.
                            ШиринаКолонки = ТаблицаРезультат.Колонки[ИмяКолонки].Ширина;
                            ДлинаСтроки = СтрДлина(СокрЛП(ЗначениеЯчейки));
                            ТаблицаРезультат.Колонки[ИмяКолонки].Ширина = ?(ШиринаКолонки < ДлинаСтроки, ДлинаСтроки, ШиринаКолонки);
                           
                        КонецЕсли;
                    КонецЕсли;
                КонецЕсли;
            КонецЦикла;
            Если ((НЕ КонСтрока = 0 И (НомерСтроки + 1) > КонСтрока)
                ИЛИ (НЕ КолвоСтрокExcel = 0  И (НомерСтроки + 1) > КолвоСтрокExcel)) Тогда
                Прервать;   // Окончание диапазона считываемых данных.
            КонецЕсли;
        КонецЕсли;
    КонецЦикла;
   
    // Завершение работы.
    // Закрытие Объектов.
    SheetX.Закрыть();
   
    УдалитьКолонкиСНулевойШириной(ТаблицаРезультат);
   
    Возврат ТаблицаРезультат;
   
КонецФункции

&НаСервере
Функция ПредварительнаяОбработкаФайлаXLSX(ФайлEXCEL, ZIPКаталог)
    Перем Файл;
   
    Файл = ПолучитьОбъектФайл(ФайлEXCEL);
    Если Файл = Неопределено Тогда
        Сообщить(«Невозможно загрузить данные, т.к. невозможно открыть для чтения файл:
        |» + ФайлEXCEL);
        Возврат Ложь;
    КонецЕсли;
   
    Если НЕ ВРег(Файл.Расширение) = «.XLSX» Тогда
        Сообщить(«Файл с расширением » + Файл.Расширение +» не поддерживается методом NativeXLSX:
        |» + ФайлEXCEL);
        Возврат Ложь;
    КонецЕсли;
   
    Если НЕ РаспаковатьXLSXвКаталогВременныхФайлов(ФайлEXCEL, ZIPКаталог) Тогда
        Сообщить(«Ошибка распаковки файла.
        |Возможно каталог временных файлов занят.
        |» + ФайлEXCEL);
        Возврат Ложь;
    КонецЕсли;
   
    Возврат Истина;
   
КонецФункции

&НаСервере
Функция ПолучитьОбъектФайл(Знач ФайлEXCEL)
    Перем Файл;
   
    Если НЕ ЗначениеЗаполнено(ФайлEXCEL) Тогда
        Возврат Неопределено;
    КонецЕсли;
   
    Файл = Новый Файл(ФайлEXCEL);
    Если НЕ ФайлСуществуетИДоступен(Файл.ПолноеИмя) Тогда
        Сообщить(«Файл не существует/не доступен:
        |» + ФайлEXCEL);
        Возврат Неопределено;
    КонецЕсли;
   
    Возврат Файл;
   
КонецФункции

&НаСервере
Функция ФайлСуществуетИДоступен(ПолноеИмяФайла)
    Перем Файл;
   
    Файл = Новый Файл(ПолноеИмяФайла);
    Если НЕ Файл.Существует() Тогда
        Возврат Ложь;
    КонецЕсли;
   
    // Проверка: Занят ли файл другим процессом?
    Если НЕ ВРег(Файл.Расширение) = «.DBF» Тогда
        Попытка
            ПереместитьФайл(Файл.ПолноеИмя,Файл.ПолноеИмя);
        Исключение
            Сообщить(«Файл не доступен:
            |» + Файл.ПолноеИмя);
            Возврат Ложь;
        КонецПопытки;
    КонецЕсли;
   
    Возврат Истина;
   
КонецФункции

&НаСервере
Функция РаспаковатьXLSXвКаталогВременныхФайлов(ФайлEXCEL, ZIPКаталог)
    Перем ZIPФайл;
   
    Попытка
        УдалитьФайлы(ZIPКаталог);
       
        ZIPФайл = Новый ЧтениеZipФайла;
        ZIPФайл.Открыть(ФайлEXCEL);
        ZIPФайл.ИзвлечьВсе(ZIPКаталог, РежимВосстановленияПутейФайловZIP.Восстанавливать);
        Возврат Истина;
    Исключение
        Возврат Ложь;
    КонецПопытки;
   
    Возврат Истина;
   
КонецФункции

&НаСервере
Функция ИзвлечьДанныеИзФайла_StylesXML(ZIPКаталог, СоответствиеNumFmtIdFormatCode)
    Перем Файл, Styles;
    Перем МассивNumFmtId, ит;
   
    МассивNumFmtId = Новый Массив;
    СоответствиеNumFmtIdFormatCode = Новый Соответствие;
   
    Файл = Новый Файл(ZIPКаталог + «XLStyles.xml»);
    Если НЕ Файл.Существует() Тогда
        Возврат МассивNumFmtId;
    КонецЕсли;
   
    Styles = Новый ЧтениеXML;
    Styles.ОткрытьФайл(Файл.ПолноеИмя);
   
    Пока Styles.Прочитать() Цикл
        Если ВРег(Styles.Имя) = ВРег(«numFmt») И Styles.ТипУзла = ТипУзлаXML.НачалоЭлемента Тогда
            СоответствиеNumFmtIdFormatCode.Вставить(Styles.ЗначениеАтрибута(«numFmtId»), ВРег(Styles.ЗначениеАтрибута(«formatCode»)));
        КонецЕсли;
        Если ВРег(Styles.Имя) = ВРег(«cellXfs») Тогда
            Пока Styles.Прочитать() Цикл
                Если ВРег(Styles.Имя) = ВРег(«xf») И Styles.ТипУзла = ТипУзлаXML.НачалоЭлемента Тогда
                    МассивNumFmtId.Добавить(Styles.ЗначениеАтрибута(«numFmtId»));
                КонецЕсли;
            КонецЦикла;
        КонецЕсли;
    КонецЦикла;
   
    // Завершение работы.
    // Закрытие Объектов.
    Styles.Закрыть();

    // Проверка сопоставления кодов массива и соответствия.
    // MS Office может не формировать в xml-файле описание стиля форматирования для ячейки.
    // LibreOffice формирует в xml-файле необходимые описания стиля форматирования ячейки.
    Для Каждого ит ИЗ МассивNumFmtId Цикл
        Если СоответствиеNumFmtIdFormatCode.Получить(ит) = Неопределено Тогда
            Если ит = «0» Тогда    // Стандарт для числа (Целое число).
                СоответствиеNumFmtIdFormatCode.Вставить(ит, «GENERAL»);
            ИначеЕсли ит = «9» ИЛИ ит = «10» Тогда    // Форматы для % («0%», «0.00%»).
                СоответствиеNumFmtIdFormatCode.Вставить(ит, «0%»);
            ИначеЕсли ит = «14» ИЛИ ит = «16» Тогда    // Форматы для даты.
                СоответствиеNumFmtIdFormatCode.Вставить(ит, «DD.MM.YYYY»);
            ИначеЕсли ит = «45» ИЛИ ит = «46» ИЛИ ит = «47» Тогда    // Форматы для времени.
                СоответствиеNumFmtIdFormatCode.Вставить(ит, «HH:MM:SS»);
            КонецЕсли;
        КонецЕсли;
    КонецЦикла;
   
    Возврат МассивNumFmtId;
   
КонецФункции

&НаСервере
Функция ИзвлечьДанныеИзФайла_SharedStringsXML(ZIPКаталог)
    Перем Файл, SharedStrings;
    Перем МассивSharedStrings;
   
    // Если в файле EXCEL не содержится значений, имеющих тип «СТРОКА», то файл «SharedStrings.xml» не формируется.
   
    МассивSharedStrings = Новый Массив;
   
    Файл = Новый Файл(ZIPКаталог + «XLSharedStrings.xml»);
    Если НЕ Файл.Существует() Тогда
        Возврат МассивSharedStrings;
    КонецЕсли;
   
    SharedStrings = Новый ЧтениеXML;
    SharedStrings.ОткрытьФайл(Файл.ПолноеИмя);
   
    Пока SharedStrings.Прочитать() Цикл
        Если ВРег(SharedStrings.Имя) = «#TEXT» Тогда
            МассивSharedStrings.Добавить(SharedStrings.Значение);
        КонецЕсли;
    КонецЦикла;
   
    // Завершение работы.
    // Закрытие Объектов.
    SharedStrings.Закрыть();
   
    Возврат МассивSharedStrings;
   
КонецФункции

&НаСервере
Функция ПолучитьМассивИменКолонокНаЛистеXLSX(SheetX)
    Перем ДиапазонДанных, ДиапазонКолонок, ПерваяКолонка, ПоследняяКолонка, НомерПервойК, НомерПоследнейК;
    Перем Подсчет, ИмяКолонки;
    Перем МассивИменКолонокXLSX, КолвоКолонокEXCEL;
    
    МассивИменКолонокXLSX = Новый Массив;
    
    Подсчет = Ложь;
    // Считать очередной узел XML.
    Пока SheetX.Прочитать() Цикл
        // DIMENSION.
        Если ВРег(SheetX.Имя) = «DIMENSION» И SheetX.ТипУзла = ТипУзлаXML.НачалоЭлемента Тогда
            ДиапазонДанных     = SheetX.ПолучитьАтрибут(«ref»);
            ДиапазонКолонок = ЗаменитьОдниСимволыДругими(«0123456789», ДиапазонДанных, «»);
            ПерваяКолонка     = Лев(ДиапазонКолонок, Найти(ДиапазонКолонок ,«:») — 1);
            ПоследняяКолонка= Сред(ДиапазонКолонок, Найти(ДиапазонКолонок ,«:») + 1);
            НомерПервойК    = НомерКолонкиДесятичный(ПерваяКолонка);
            НомерПоследнейК    = НомерКолонкиДесятичный(ПоследняяКолонка);
        КонецЕсли;
        // Подсчет по 1-ой строке.
        Если ВРег(SheetX.Имя) = «ROW» Тогда
            Если SheetX.ТипУзла = ТипУзлаXML.НачалоЭлемента Тогда
                // Начало отсчета.
                Подсчет = Истина;
            ИначеЕсли SheetX.ТипУзла = ТипУзлаXML.КонецЭлемента Тогда
                // Окончание отсчета.
                Прервать;
            КонецЕсли;
        КонецЕсли;
        Если Подсчет И ВРег(SheetX.Имя) = «C» И SheetX.ТипУзла = ТипУзлаXML.НачалоЭлемента Тогда
            ИмяКолонки = SheetX.ПолучитьАтрибут(«r»);
            ИмяКолонки = ЗаменитьОдниСимволыДругими(«0123456789», ИмяКолонки, «»);
            МассивИменКолонокXLSX.Добавить(ИмяКолонки);
        КонецЕсли;
    КонецЦикла;
    
    КолвоКолонокEXCEL = МассивИменКолонокXLSX.Количество();
    Если НЕ НомерПоследнейК = Неопределено Тогда
        Если КолвоКолонокEXCEL < НомерПоследнейК Тогда
            Сообщить(«Строка заголовков колонок (1-я строка) заполнена не полностью:
            |К-во колонок строки меньше объявленной: « + КолвоКолонокEXCEL + «<« + НомерПоследнейК);
            ДополнитьМассивИменКолонокXLSX(НомерПоследнейК, МассивИменКолонокXLSX);
        ИначеЕсли КолвоКолонокEXCEL > НомерПоследнейК Тогда
            Сообщить(«Строка заголовков колонок (1-я строка) содержит больше колонок, чем объявлено:
            |К-во колонок строки больше объявленной:» + КолвоКолонокEXCEL + «>» + НомерПоследнейК);
        КонецЕсли;
    КонецЕсли;
        
    Возврат МассивИменКолонокXLSX;
    
КонецФункции

&НаСервере
Функция НомерКолонкиДесятичный(ИмяКолонкиXLSX)
    Перем Латиница, ДлинаНомера, Поз, ит;
    Перем НомерКолонки;
    
    Латиница = «ABCDEFGHIJKLMNOPQRSTUVWXYZ»;    // 26.
    ДлинаНомера = СтрДлина(ИмяКолонкиXLSX);
    НомерКолонки = 0;
    Для ит = 1 ПО ДлинаНомера Цикл
        Поз = Найти(Латиница, Сред(ИмяКолонкиXLSX, (ДлинаНомера + 1 ит), 1));
        НомерКолонки = НомерКолонки + Поз * Pow(26, ит 1);
    КонецЦикла;
    
    Возврат НомерКолонки;
    
КонецФункции

&НаСервере
Процедура ДополнитьМассивИменКолонокXLSX(Знач КолвоКолонокExcel, МассивИменКолонокXLSX, Индекс = — 1)
    Перем Алфавит, ит, Буква;
    
    Алфавит = РазложитьСтрокуВМассивПодстрок(«A,B,C,D,E,F,G,H,I,J,K,L,M,N,O,P,Q,R,S,T,U,V,W,X,Y,Z», «,»);
    
    Если МассивИменКолонокXLSX.Количество() >= КолвоКолонокExcel Тогда
        Возврат;
    КонецЕсли;
    
    Если Индекс > Алфавит.Количество() — 1 Тогда
        Возврат;
    КонецЕсли;
    
    Буква = ?(Индекс = —1, «», Алфавит[Индекс]);
    Для ит = 0 ПО Алфавит.Количество() — 1 Цикл
        Если МассивИменКолонокXLSX.Найти(Буква + Алфавит[ит]) = Неопределено Тогда
            МассивИменКолонокXLSX.Добавить(Буква + Алфавит[ит]);
        КонецЕсли;
        Если МассивИменКолонокXLSX.Количество() >= КолвоКолонокExcel Тогда
            Возврат;
        КонецЕсли;
    КонецЦикла;
    
    Если МассивИменКолонокXLSX.Количество() > КолвоКолонокExcel Тогда
        Возврат;
    Иначе
        Индекс = Индекс + 1;
        ДополнитьМассивИменКолонокXLSX(КолвоКолонокExcel, МассивИменКолонокXLSX, Индекс);
    КонецЕсли;
    
    Возврат;
    
КонецПроцедуры

// Функция «расщепляет» строку на подстроки, используя заданный
//      разделитель. Разделитель может иметь любую длину.
//      Если в качестве разделителя задан пробел, рядом стоящие пробелы
//      считаются одним разделителем, а ведущие и хвостовые пробелы параметра Стр
//      игнорируются.
//      Например,
//      РазложитьСтрокуВМассивПодстрок(«,один,,,два», «,») возвратит массив значений из пяти элементов,
//      три из которых — пустые строки, а
//      РазложитьСтрокуВМассивПодстрок(» один   два», » «) возвратит массив значений из двух элементов
//
//  Параметры:
//      Стр —           строка, которую необходимо разложить на подстроки.
//                      Параметр передается по значению.
//      Разделитель —   строка-разделитель, по умолчанию — запятая.
//
//  Возвращаемое значение:
//      массив значений, элементы которого — подстроки
//
&НаСервере
Функция РазложитьСтрокуВМассивПодстрок(Знач Стр, Разделитель = «,»)
    
    МассивСтрок = Новый Массив();
    Если Разделитель = » « Тогда
        Стр = СокрЛП(Стр);
        Пока 1 = 1 Цикл
            Поз = Найти(Стр, Разделитель);
            Если Поз = 0 Тогда
                МассивСтрок.Добавить(СокрЛП(Стр));
                Возврат МассивСтрок;
            КонецЕсли;
            МассивСтрок.Добавить(СокрЛП(Лев(Стр, Поз 1)));
            Стр = СокрЛ(Сред(Стр, Поз));
        КонецЦикла;
    Иначе
        ДлинаРазделителя = СтрДлина(Разделитель);
        Пока 1 = 1 Цикл
            Поз = Найти(Стр, Разделитель);
            Если Поз = 0 Тогда
                Если (СокрЛП(Стр) <> «») Тогда
                    МассивСтрок.Добавить(СокрЛП(Стр));
                КонецЕсли;
                Возврат МассивСтрок;
            КонецЕсли;
            МассивСтрок.Добавить(СокрЛП(Лев(Стр,Поз 1)));
            Стр = Сред(Стр, Поз + ДлинаРазделителя);
        КонецЦикла;
    КонецЕсли;
   
КонецФункции

&НаСервере
Функция ЭтоЧислоXLSX(Знач ЗначениеЯчейки, Знач ФорматСтиля)
   
    Если ( ВРег(ФорматСтиля) = «GENERAL»
        ИЛИ ВРег(ФорматСтиля) = «STANDARD»
        ИЛИ Найти(ФорматСтиля, «0») > 0 )
        Тогда
        Возврат Истина;
    КонецЕсли;
   
    Возврат Ложь;
   
КонецФункции

&НаСервере
Функция ЭтоПроцентXLSX(Знач ЗначениеЯчейки, Знач ФорматСтиля)
   
    Если ( Найти(ФорматСтиля, «%») > 0 )
        Тогда
        Возврат Истина;
    КонецЕсли;
   
    Возврат Ложь;
   
КонецФункции

&НаСервере
Функция ЭтоБулевоXLSX(ЗначениеЯчейки, ФорматСтиля)
   
    Если (ЗначениеЯчейки = 0 ИЛИ ЗначениеЯчейки = 1)
        И Найти(ВРег(ФорматСтиля), «ИСТИНА») > 0 ИЛИ Найти(ВРег(ФорматСтиля), «ЛОЖЬ») > 0
        ИЛИ Найти(ВРег(ФорматСтиля), «TRUE») > 0 ИЛИ Найти(ВРег(ФорматСтиля), «FALSE») > 0
        Тогда
        Возврат Истина;
    КонецЕсли;
   
    Возврат Ложь;
   
КонецФункции

&НаСервере
Функция ЭтоДатаXLSX(Знач ЗначениеЯчейки, Знач ФорматСтиля)
   
    Если ЗначениеЯчейки = Цел(ЗначениеЯчейки) И
        ( Найти(ФорматСтиля, «DD») > 0
        ИЛИ Найти(ФорматСтиля, «MM») > 0
        ИЛИ Найти(ФорматСтиля, «YY») > 0
        ИЛИ Найти(ФорматСтиля, «QQ») > 0
        ИЛИ Найти(ФорматСтиля, «WW») > 0 )
        Тогда
        Возврат Истина;
    КонецЕсли;
   
    Возврат Ложь;
   
КонецФункции

&НаСервере
Функция ЭтоВремяXLSX(Знач ЗначениеЯчейки, Знач ФорматСтиля)
   
    Если ЗначениеЯчейки < 1 И
        ( Найти(ФорматСтиля, «HH:») > 0
        ИЛИ Найти(ФорматСтиля, «[HH]:») > 0
        ИЛИ Найти(ФорматСтиля, «[H]:») > 0
        ИЛИ Найти(ФорматСтиля, «MM:») > 0
        ИЛИ Найти(ФорматСтиля, «:SS») > 0 )
        Тогда
        Возврат Истина;
    КонецЕсли;
   
    Возврат Ложь;
   
КонецФункции

&НаСервере
Функция КонвертироватьЧислоXLSXвДату(Знач Число)
    Перем Дата1900, Разница, ДатаРезультат;
   
    Дата1900 = Дата(«19000101»);
   
    Разница = Число 2;    // EXCEL ошибочно считает 1900-й год високосным.
    Разница = ?(Разница < 0, 0, Разница);
   
    ДатаРезультат = Дата1900 + Разница * 24 * 60 * 60;
   
    Возврат ДатаРезультат;
   
КонецФункции

&НаСервере
Функция КонвертироватьЧислоXLSXвДатуВремя(Знач Число)
    Перем КВоСекунд;
    Перем ВремяРезультат;
   
    // 0,0000115740740740741 = 1 сек.
    // 1                     = 24 часа 00 мин 00 сек.
   
    Если ТипЗнч(Число) = Тип(«Число») Тогда
        КВоСекунд = Число * 100000 / 1.15740740740741;
        КВоСекунд = Окр(КВоСекунд);
    Иначе
        Сообщить(«Ошибка определения значения типа «»Время»».»);
    КонецЕсли;
   
    ВремяРезультат = Дата(«19000101000000») + КВоСекунд;
   
    Возврат ВремяРезультат;
   
КонецФункции

&НаСервере
Функция ПолучитьЧислоВСтепениИзСтроковогоЗначения(Знач ЗначениеЯчейки)
    Перем Поз1Е, Степень;
    Перем Значение;
   
    Если Найти(ЗначениеЯчейки, «E-«) > 0 Тогда
        Поз1Е = Найти(ЗначениеЯчейки, «E-«);
        Степень = Сред(ЗначениеЯчейки, Поз1Е+2);
        Значение = Лев(ЗначениеЯчейки, Поз1Е1);
        Попытка
            Степень = Число(Степень);
            Значение = Число(Значение) / Pow(10, Степень);
        Исключение
            Значение = ЗначениеЯчейки;
        КонецПопытки;
    ИначеЕсли Найти(ЗначениеЯчейки, «E+») > 0 Тогда
        Поз1Е = Найти(ЗначениеЯчейки, «E+»);
        Степень = Сред(ЗначениеЯчейки, Поз1Е+2);
        Значение = Лев(ЗначениеЯчейки, Поз1Е1);
        Попытка
            Степень = Число(Степень);
            Значение = Число(Значение) * Pow(10, Степень);
        Исключение
            Значение = ЗначениеЯчейки;
        КонецПопытки;
    Иначе
        Значение = ЗначениеЯчейки;
    КонецЕсли;
   
    Возврат Значение;
   
КонецФункции

&НаСервере
Функция ЗаменитьОдниСимволыДругими(ЗаменяемыеСимволы, Строка, СимволыЗамены)
    Результат = Строка;
    Для НомерСимвола = 1 По СтрДлина(ЗаменяемыеСимволы) Цикл
        Результат = СтрЗаменить(Результат, Сред(ЗаменяемыеСимволы, НомерСимвола, 1), Сред(СимволыЗамены, НомерСимвола, 1));
    КонецЦикла;
    Возврат Результат;
КонецФункции

&НаСервере
Процедура УдалитьКолонкиСНулевойШириной(ТаблицаРезультат)
    Перем МассивПустыхКолонок;
    // Найдем пустые колонки.
    МассивПустыхКолонок = Новый Массив;
    Для Каждого Колонка ИЗ ТаблицаРезультат.Колонки Цикл
        Если Колонка.Ширина = 0 Тогда
            МассивПустыхКолонок.Добавить(Колонка.Имя);
        КонецЕсли;
    КонецЦикла;
    // Удалим пустые колонки.
    Для Каждого ПустаяКолонка ИЗ МассивПустыхКолонок Цикл
        ТаблицаРезультат.Колонки.Удалить(ПустаяКолонка);
    КонецЦикла;
КонецПроцедуры

МА! С уважением к сообществу МА!


74 Comments

  1. Evgen.Ponomarenko

    Мега зачетно! В копилку готовых решений на пожизненно! )))

    Reply
  2. peterxx

    Очень неплохо, а то внешние компоненты — кот в мешке, ADO — бывает лень возиться и т.п.

    Reply
  3. TheGrr

    (3) Eugeneer, а вы в каждой публикации, касающейся загрузки из Excel, будете обсирать автора? 🙂 Уже ведь даже не смешно. Я прекрасно понимаю, что это Ваша вотчина. Но я лично за то, чтобы различных решений одной задачи было много и разных, в т.ч. и бесплатных 😉

    Reply
  4. Yashazz

    Ну, пущай будет, как оглавление. А то и правда, неохота иной раз лазить да искать.

    (5) Кое в чём склонен согласиться.

    Reply
  5. Pavl0

    Замечательно! Утащил к себе, проверю на досуге.

    Reply
  6. sergnik

    (5) Eugeneer,

    Позволю себе с вами не согласиться.

    Сама публикация не то чтобы сильно заинтересовала, но была в топе, и я сюда зашел.

    Просмотрел остальные 5 публикаций автора, о которых вы написали

    Каждая публикация описывает совсем разные методы обработки информации,

    поэтому это не выжимание из воздуха.

    Кроме того, весь код выложен прямо в публикации, не нужно качать «кота в мешке» чтобы оценить работу

    кода. Уже за одно это автору — ОГРОМНЕЙШИЙ ПЛЮС

    Быть может, у Вас личная неприязнь к автору? ))

    Reply
  7. CagoBHuK

    Для тех, кто хочет сделать действительно красивое решение: открываете XML XSLX файла и с помощью XSLT преобразуете в сериализованный табличный документ. А дальше — обычная рассериализация с помощью фабрики XDTO. Никакого геморроя и лишнего текста. Все будет работать штатными средствами.

    Reply
  8. Nick_Godspeed

    (5) Eugeneer, не ревнуйте 🙂

    Как верно подметил (8) только за открытый код, да плюс за такую всестороннюю проработку вопроса автор заслужил хоть сто постов по одному вопросу.

    Reply
  9. LexSeIch

    Мир этому дому!

    Мне нравиться, когда код публикуется в статье. Автору плюс.

    Reply
  10. StepByStep

    (7) Pavl0,

    Если не затруднит — отпишитесь, пожалуйста, о результатах.

    Reply
  11. StepByStep

    (9) CagoBHuK,

    ПРЕКРАСНО. Существует еще способ.

    Reply
  12. Abadonna

    (5)

    А тут мы видим банальное выжимание рейтинга. Ведь те кто первую публикацию скачал будут еще ставить рейтинги в других пяти. Это очевидно)))

    Нет, Евген, тут ты как раз не прав! Плюсуют/качают только то, что на виду. Не будут еще ставить рейтинги в других пяти, за редчайшими исключениями. По личному опыту;)..

    P.S. Давным-давно, хохмы ради, я опубликовал свою же обработку под другим ником. Как попёрли плюсы! А самое интересное: продолжали плюсовать даже после того, как я написал, что это шутка и указал первоисточник. Продолжали!

    Reply
  13. Abadonna

    (0) 13.06.2012 Чтение файлов *.xlsx средствами 1С 8.2

    в упор ссылки не вижу.

    Reply
  14. StepByStep

    (15) Abadonna,

    Упоминание об этой работе встречал. Страница была недоступна. Причина — неизвестна.

    А вообще, хорошая мысль, сделать подборку ссылок по вопросу «Загрузки из EXCEL …» от разных авторов в разных «ракурсах».

    Соберу — выложу.

    Reply
  15. StepByStep

    07.11.2013.

    Добавлены ссылки на публикации других авторов.

    Если что-то не увидел, не обессудьте.

    Reply
  16. soap

    Интересно. Оч хор что код прямо в статье.

    Автору плюс

    Reply
  17. Abadonna

    (0) В тексте поправь

    Импирически:

    Эмпирически 😉

    Reply
  18. StepByStep

    (19) Abadonna,

    СПАСИБО. «Велик и Могуч Русский язык».

    Reply
  19. RainyAugust22

    Плюсую. Взял на заметку.

    Reply
  20. zspr

    Автору большое спасибо

    Reply
  21. mvgfirst

    Кто нибудь тестировал это на практических данных?

    Значения ячеек с формулами полностью игнорируются при использовании этого метода.

    Вернее не метода а если скопировать приведенный исходный код.

    Без допиливания руками — никак не обойтись.

    Reply
  22. StepByStep

    (24) mvgfirst,

    СПАСИБО.

    Действительно так. Надо «допилить».

    Reply
  23. StepByStep

    (24) mvgfirst,

    01.02.2014.

    Изменена функция ЗагрузитьМетодом_1CXML().

    Дополнена считыванием значений из ячеек, содержащих формулы.

    Reply
  24. Al-X

    + Актуально-то как !!! Жлобы, не хотят офис покупать !! ))))

    Reply
  25. smilebringer

    Эмпирическая догадка не верна, любое целое, дробное число, процент, время, и другие числовые форматы будут интерпретироваться как дата. Строковые значения будут верно обрабатываться.

    Reply
  26. igyo

    Косяк если в колонке будет пустая ячейка, смещаются колонки тогда… 🙁

    Reply
  27. StepByStep

    (28) smilebringer,

    СПАСИБО.

    Строки, числа, даты читаются.

    Процент, время — посмотрю, подправлю.

    Reply
  28. StepByStep

    (29) igyo,

    Это проверялось.

    В смысле одна или несколько пустых ячеек в колонке или вся колонка пустая?

    Если можно — файл выложите, пожалуйста.

    Reply
  29. StepByStep

    01.03.2014 г. Обновление.

    (28) smilebringer, (29) igyo,

    СПАСИБО за указанные неточности.

    Доработал.

    Если обнаружите неточности — напишите, пожалуйста.

    Reply
  30. spaminfostart

    и тут спрошу про 255 столбцов… таки не обрабатывает такие файлы?

    Reply
  31. smilebringer

    Тебе бы еще такие вещи вынести на git или другую систему контроля версий, тебе тогда и сообщество укажет, где что поправить, может и свой вариант кто-то предложит. А так изменение читать тяжело и поэтому лениво 🙂

    Reply
  32. Glk
    // ЧИСЛО.
    Если Прав(ЗначениеЯчейки, 5) = «E-003» Тогда
    УдалитьПоследнийСимволВСтроке(ЗначениеЯчейки, 5);
    Попытка
    ЗначениеЯчейки = Число(ЗначениеЯчейки);
    Исключение
    КонецПопытки;
    // ЧИСЛО.
    ИначеЕсли Прав(ЗначениеЯчейки, 3) = «E-3» Тогда
    УдалитьПоследнийСимволВСтроке(ЗначениеЯчейки, 3);
    Попытка
    ЗначениеЯчейки = Число(ЗначениеЯчейки);
    Исключение
    КонецПопытки;

    Показать

    Обрезать обрезали, а поделить на 1000 забыли.

    Reply
  33. nSpirit2

    Меня очень нервирует способ объявление переменных взятый явно из Делфи. Ну а так полностью согласен с (9) CagoBHuK все намного проще 🙂

    Reply
  34. StepByStep

    (35) Glk,

    СПАСИБО.

    Reply
  35. Glk

    (36) Кстати, пришлось еще добавить аналогичную конструкцию для

    Прав(ЗначениеЯчейки, 3) = «E-2»

    , регулярно попадалось в присылаемых нам файликах.

    Reply
  36. StepByStep

    (38) Glk,

    Скоро будет новая редакция. В ней будет и Е-…, Е+… и др.

    Reply
  37. StepByStep

    (38) Glk,

    03.09.2014. Новая редакция.

    Reply
  38. Glk
    ИндексКолонки = ?(ИндексКолонки = Неопределено, КоличествоСлужебныхКолонок-1, ИндексКолонки+КоличествоСлужебныхКолонок-1);
    

    Непонятно, зачем тут КоличествоСлужебныхКолонок-1, если имя колонки никак от количества служебных не зависит.

    У меня добавляется еще одна служебная колонка с уровнем группировки для загрузки иерархических справочников номенклатуры от поставщиков, возможно стоит ее добавить и в вашу обработку для универсальности.

    НоваяСтрока.УровеньГруппировки=SheetX.ЗначениеАтрибута(«outlineLevel»);
    
    Reply
  39. StepByStep

    (41) Glk,

    ИндексКолонки = ?(ИндексКолонки = Неопределено, КоличествоСлужебныхКолонок-1, ИндексКолонки+КоличествоСлужебныхКолонок-1);

    СПАСИБО.

    Атрибут «outlineLevel» может отсутствовать, например, если файл создан в MS EXCEL.

    При сохранении в LibreOffice — он есть.

    Reply
  40. Glk

    (42)

    Он отсутствует, если нет собственно группировки в текущей строке, но это не мешает загружать его для остальных. А если определить колонку как

    ТаблицаРезультат.Колонки.Добавить(«УровеньГруппировки», Новый ОписаниеТипов(«Число»), «Гр», 4);

    то даже проверку на Неопределено делать не приходится — само в 0 преобразуется.

    Reply
  41. StepByStep

    (43) Glk,

    Хорошо. Посмотрю.

    Reply
  42. StepByStep

    (43) Glk,

    ОТЛИЧНО. СПАСИБО.

    Reply
  43. 7OH

    Ни на что не претендую.

    Добавил:

    1. чистку временного каталога за собой

    2. выбор листа

    Переделал:

    1. Определение колонок (не по первой строке, а по служебным данным «DIMENSION
    ef» )

    2. Имена колонок — немного подправил аглоритм — вылетало часто.

    3. Сорри — но обычных формах — переделать не сложно.

    Reply
  44. StepByStep

    (46) 7OH,

    Определение колонок (не по первой строке, а по служебным данным «DIMENSION
    ef»

    Сталкнулся с несоответствием служебных данных и реальных колонок — поэтому по 1-ой строке «по факту».

    Имена колонок — немного подправил аглоритм — вылетало часто

    Если не сложно опишите пример.

    СПАСИБО.

    Reply
  45. StepByStep

    (46) 7OH,

    Не заполненная/не полностью заполненная 1-я строка ?

    Reply
  46. 7OH

    (47)

    в первой строке шапка документа в виде

    Склад : техника

    ответственный: Пупкин

    и тут пошла шапка колонок

    итого он определяет всего 2 колонки и при попытке считывания на шапке вываливается с ошибкой

    а так в DIMENSION вроде красиво лежит весь диапазон — спеациально ставил спрва снизу подальше одну букву — подхватывало

    Reply
  47. StepByStep

    (49) 7OH,

    СПАСИБО.

    Reply
  48. Drizer2000

    Эх описал бы кто преимущество, того или иного метода, я не читал все статьи автора, может где и есть. Например, мне нужно загружать в базу из экселя прайсы поставщиков. Прайсы могут содержать до 10 тыс строк, вот и думаю какой бы метод использовать. Сейчас сделано классичеси через ОЛЕ,но относительно медленно идет загрузка.

    Reply
  49. jobkostya1c8

    Ставлю «плюс» за подборку решений. Все равно для разных задач приходится свое писать. В одной из нехороших обработок по загрузке основных средств лучшего решения чем вручную указание пользователем номеров колонок не было.

    Reply
  50. Drizer2000

    А кто знает какой используется метод для обработки указанной вот по этой ссылке:

    http://infostart.ru/public/21810/

    Reply
  51. SinglCOOLer

    все бы вроде не плохо, но часть данных колонок почему то берется с нужно листа, а часть с другого

    Reply
  52. SinglCOOLer

    Если делаешь лист 1 и единственным, то перестает путать и грузит корректно

    Reply
  53. MishaHD

    Update 🙂 Написал хвалебный комментарий, а потом нашел косяк. В представленных выше процедурах когда мы формируем МассивSharedStrings из файла SharedStrings.xml не учитывается то, что может встречаться значение «пустая строка». То есть условие

    Если ВРег(SharedStrings.Имя) = «#TEXT» Тогда

    не будет отрабатывать. Соответственно если в файле SharedStrings.xml встретилась пустая строка, то начинаю «плыть» индексы массива МассивSharedStrings, а за ними «плывет» результирующая таблица.

    Написал следующий костыль, может кому полезно будет:

    Вот это:

    Пока SharedStrings.Прочитать() Цикл
    Если ВРег(SharedStrings.Имя) = «#TEXT» Тогда
    МассивSharedStrings.Добавить(SharedStrings.Значение);
    КонецЕсли;
    КонецЦикла;

    Меняем на это:

    ФлагСтрокаЗаписана = Ложь;
    
    Пока SharedStrings.Прочитать() Цикл
    Если ВРег(SharedStrings.Имя) = «SI» и SharedStrings.ТипУзла = ТипУзлаXML.НачалоЭлемента тогда
    ФлагСтрокаЗаписана = Ложь;
    КонецЕсли;
    
    Если ВРег(SharedStrings.Имя) = «#TEXT» Тогда
    МассивSharedStrings.Добавить(SharedStrings.Значение);
    ФлагСтрокаЗаписана = Истина;
    КонецЕсли;
    
    Если ВРег(SharedStrings.Имя) = «SI» и SharedStrings.ТипУзла = ТипУзлаXML.КонецЭлемента и не ФлагСтрокаЗаписана тогда
    //встретили пустую строку!
    МассивSharedStrings.Добавить(«»);
    КонецЕсли;
    
    КонецЦикла;
    

    Показать

    Спасибо за процедуры, приятно что все нормально отлажено и работает (как выяснилось кроме некоторых косяков))). Небольшое пожелание, бы бы удобно если бы колонки именовались из заголовочных данных (например если указываем что заголовок — это строка №1).

    Reply
  54. StepByStep

    (54), (55) SinglCOOLer,

    В ранних версиях обработки «Импорт (загрузка) из внешнего источника (Excel,LibreOffice,SQL,DBF,MXL) в 1С 8.2/8.3: Розница,УТ,БП,КА. /РОССИЯ,УКРАИНА,БЕЛАРУСЬ/» http://infostart.ru/public/120961/ описанный метод использовался и корректно брал данные с необходимого листа.

    Reply
  55. StepByStep

    (56) MishaHD,

    Рекомендую обратить внимание на «Загрузка из EXCEL в 1С. Чтение файла XLSX средствами 1С. ПостроительDOM» http://infostart.ru/public/300092/

    Reply
  56. MishaHD

    (58) спасибо за совет. В принципе допилил то, что в этом посте выложено под свои нужды, все работает без косяков

    Reply
  57. jobkostya1c8

    Вопрос граждане по отказоустойчивости при чтении из Excel. Тут есть сервер 1С (вроде 64 битный без установленного на нем офисного пакета. Соответственно на нем нет зарегистрированного объекта COMОбъект «Excel.Application». Как раз смотрели недавнюю статью Настройка DCOM компоненты «Excel.Application» на 64-битном сервере приложений 1С

    Суть вопроса в чем. Мне прислали такое техническое мнение корпорации Майкрософт:

    Корпорация Microsoft на сегодняшний день не рекомендует производить и не поддерживает автоматизацию программ из пакета Microsoft Office с помощью автоматических, неинтерактивных клиентских приложений или компонентов (включая ASP, DCOM и службы NT), поскольку при запуске в этом окружении программы пакета Office могут работать нестабильно или зависать.

    Насчет при запуске в этом окружении программы пакета Office могут работать нестабильно или зависать частично согласен. Методы закрытия работают плохо и висят на сервере о чем писали.

    Что народ скажед по поводу данного мнения? Не хотелось бы вступать в админские споры. Если загрузка хотя бы периодическая под контролем оператора? Насколько это критично. В чем получается преимущество ADO? В том что не надо пакет офисный ставить (я про уклон в лицензионную политику)? Или еще есть преимущества (про скорость и прочие радости излишне).

    Reply
  58. jobkostya1c8

    Насчет «универсального ADO» как-то начал обработку чтения xls в тонком клиенте для БП 3.0 с анализом ошибок. Предполагалось сделать универсальной с ведением протокола ошибок на сервере с передачей на клиент.

    Сразу предупреждаю, данную обработку запускать осторожно чтоб не повредить данные. Тут выкладываю только с целью сравнения и отладки технологии по чтению из екселя с помощью ADO.

    По крайней мере лист начинает читать без всяких настроек ADO и локального Екслея (на компе только Libre office).

    Код чтения (главное, метод ADODBConnection.Open(); срабатывает:

    // Инициализация основного объекта ADODB.Connection. Открытие соединения.
    ADODBConnection = Новый COMОбъект(«ADODB.Connection»);
    ADODBConnection.ConnectionString =  СonnectionString;
    
    ADODBConnection.Provider = «Microsoft.Jet.OLEDB.4.0»; //????? ставился САМ MSSQL —
    ADODBConnection.Open();
    // Импирически определенный параметр для правильного определения количества строк листа.
    ADODBConnection.CursorLocation = 3;    // По-умолчанию 2.
    
    ТекстЗапроса = «SELECT * FROM [» + ИмяЛиста + «$]»;
    
    // Создание Recordset. Дочерний объект ADODBConnection. Набор записей по запросу.
    
    ADODBRecordset = Новый COMОбъект(«ADODB.Recordset»);
    ADODBRecordset.Open(ТекстЗапроса, ADODBConnection);
    
    // Проверка заполненности листа.
    Если (ADODBRecordset.EOF ИЛИ ADODBRecordset.BOF) Тогда
    КолвоСтрокExcel = 0;
    ДобавитьВЛогНаСервере(«Лист екселя » + ИмяЛиста + «: не содержит данных (вообще)!»);
    
    // Завершение работы.
    // Закрытие Объектов.
    ADODBRecordset.Close();
    ADODBConnection.Close();
    ADODBRecordset   = Неопределено;
    ADODBConnection = Неопределено;
    
    Возврат;
    КонецЕсли;
    
    // Импирически определенные параметры для правильного определения количества строк листа.
    ADODBRecordset.AbsolutePage     = 1;
    ADODBRecordset.AbsolutePosition = 1;
    
    // Параметр, возвращаемый в вызывающую процедуру.
    КолвоСтрокExcel = ADODBRecordset.RecordCount + 1;    // (+1) — учет Строки-Заголовока, которая «съедается».
    КолвоКолонокExcel = ADODBRecordset.Fields.Count;
    
    // Проверка заполненности листа.
    Если КолвоСтрокExcel <= 2 Тогда
    КолвоСтрокExcel = 0;
    ДобавитьВЛогНаСервере(«Лист екселя » + ИмяЛиста + «: не содержит данных (строк)!»);
    
    // Завершение работы.
    // Закрытие Объектов.
    ADODBRecordset.Close();
    ADODBConnection.Close();
    ADODBRecordset   = Неопределено;
    ADODBConnection = Неопределено;
    
    Возврат;
    КонецЕсли;
    

    Показать

    обработка прилагается

    Reply
  59. Petrony

    Также не распознаются ячейки с Дата+Время.

    Поскольку Дата+Время — это не целое число, которое больше 1, то оно не распознается ни процедурой ЭтоДатаXLSX() ни процедурой ЭтоВремяXLSX

    В принципе, можно из функции ЭтоДатаXLSX(Знач ЗначениеЯчейки, Знач ФорматСтиля) убрать проверку на то, что значение ячейки — целое число. Или отдельно создать функцию.

    Reply
  60. XelOla

    (46) 7OH, будет ли это работать в обычном приложении?

    Что еще можно использовать для работы с Эксель без установленного Офиса?

    Reply
  61. StepByStep

    (60) kostyaomsk, (61) kostyaomsk,

    См. Загрузка из EXCEL в 1С. MS ADODB.Connection : http://infostart.ru/public/163640/

    Reply
  62. StepByStep

    (62) Petrony,

    СПАСИБО.

    Reply
  63. StepByStep

    (63) XelOla,

    будет ли это работать в обычном приложении?

    Что еще можно использовать для работы с Эксель без установленного Офиса?

    Да, будет.

    См. также

    Методы загрузки из внешнего источника:

    — Метод «MS ADO» (Чтение файлов xls, xlsx средствами Microsoft ADO): http://infostart.ru/public/163640/

    — Метод «NativeXLSX» (Чтение файлов xlsx с картинками средствами 1С. ПостроительDOM): http://infostart.ru/public/300092/

    — Метод «Excel1C» (Загрузка на платформе 8.3.6 с картинками. Чтение файлов xls, xlsx, ods): http://infostart.ru/public/341855/

    При установленном бесплатном LibreOffice:

    — Метод «LO CALC» (Чтение файлов xls, xlsx, ods, sxc с картинками средствами LibreOffice): http://infostart.ru/public/163642/

    Reply
  64. [4EPHbIYY_KOT]

    (56) MishaHD, ещё бы автор это подправил — вообще был бы зачёт. А то без разбора кода пооткрывали файлики, плывёт всё жестко. Даже с соседних листов данные берёт 🙂

    Reply
  65. InShallaH

    (56)

    Ты просто сделал мой день 🙂

    Reply
  66. vladismi

    Плюсую. Полезно.

    Reply
  67. It-developer

    (56)Спасибо!

    Reply
  68. It-developer

    Все хорошо, но у меня был косяк, когда ничего не было в заголовке — происходило смещение колонок. Помогло исправить изменение функции ПолучитьМассивИменКолонокНаЛистеXLSX_Новый. Не все в ней нужно, но суть, думаю, понятна

    Функция ПолучитьМассивИменКолонокНаЛистеXLSX_Новый(SheetX)
    Перем ДиапазонДанных, ДиапазонКолонок, ПерваяКолонка, ПоследняяКолонка, НомерПервойК, НомерПоследнейК;
    Перем Подсчет, ИмяКолонки;
    Перем МассивИменКолонокXLSX, КолвоКолонокEXCEL;
    
    МассивИменКолонокXLSX = Новый Массив;
    
    Подсчет = Ложь;
    // Считать очередной узел XML.
    Пока SheetX.Прочитать() Цикл
    // DIMENSION.
    Если ВРег(SheetX.Имя) = «DIMENSION» И SheetX.ТипУзла = ТипУзлаXML.НачалоЭлемента Тогда
    ДиапазонДанных     = SheetX.ПолучитьАтрибут(«ref»);
    ДиапазонКолонок = ЗаменитьОдниСимволыДругими(«0123456789», ДиапазонДанных, «»);
    ПерваяКолонка     = Лев(ДиапазонКолонок, Найти(ДиапазонКолонок ,»:») — 1);
    ПоследняяКолонка= Сред(ДиапазонКолонок, Найти(ДиапазонКолонок ,»:») + 1);
    НомерПервойК    = НомерКолонкиДесятичный(ПерваяКолонка);
    НомерПоследнейК    = НомерКолонкиДесятичный(ПоследняяКолонка);
    КонецЕсли;
    КонецЦикла;
    
    к = НомерПервойК;
    Пока к <= НомерПоследнейК Цикл
    МассивИменКолонокXLSX.Добавить(ИмяКолонкиПоНомеру(к));
    к = к + 1;
    КонецЦикла;
    
    КолвоКолонокEXCEL = МассивИменКолонокXLSX.Количество();
    Если НЕ НомерПоследнейК = Неопределено Тогда
    Если КолвоКолонокEXCEL < НомерПоследнейК Тогда
    Сообщить(«Строка заголовков колонок (1-я строка) заполнена не полностью:
    |К-во колонок строки меньше объявленной: » + КолвоКолонокEXCEL + «<» + НомерПоследнейК);
    ДополнитьМассивИменКолонокXLSX(НомерПоследнейК, МассивИменКолонокXLSX);
    ИначеЕсли КолвоКолонокEXCEL > НомерПоследнейК Тогда
    Сообщить(«Строка заголовков колонок (1-я строка) содержит больше колонок, чем объявлено:
    |К-во колонок строки больше объявленной:» + КолвоКолонокEXCEL + «>» + НомерПоследнейК);
    КонецЕсли;
    КонецЕсли;
    
    Возврат МассивИменКолонокXLSX;
    
    КонецФункции
    
    Функция ИмяКолонкиПоНомеру(НомерКолонки)
    
    Латиница = «ABCDEFGHIJKLMNOPQRSTUVWXYZ»;    // 26.
    
    Если НомерКолонки <= 26 Тогда
    Возврат Сред(Латиница, НомерКолонки, 1)
    Иначе
    Возврат Сред(Латиница, Цел((НомерКолонки-1)/26), 1) + Сред(Латиница, НомерКолонки — 26*Цел((НомерКолонки-1)/26), 1)
    КонецЕсли;
    
    КонецФункции

    Показать

    Reply
  69. AlexeyPapanov

    Коллеги, я одного не догоню.

    Колонки смешиваются по непонятному принципу. Т.е. они не идут в ТЗ в таком порядке как они были в эксель-файле.

    Я хочу дать юзеру возможность видеть на форме всю ТЗ результата.

    Мне надо взять нужные колонки из ТЗ результата загрузки.

    А как я ее выведу, если колонки в неведомом мне порядке идут.

    Reply
  70. fanlexa

    Всем доброго дня. С выше указанными доработками, все отлично работает, за что всем огромное спасибо! Но у меня вот какая проблема, при выгрузке из клиент банка(сбербанк) в формате excel, файлы выгруженные на разных компах имеют почему-то разную структуру xml файлов, т.е. на одних компах файлы выгружается с «правильной » структурой и в заголовке файла sheet1.xml: «<?xml version=»1.0″ encoding=»UTF-8″ standalone=»true»?>

    -<worksheet xmlns:x14ac=»http://schemas.microsoft.com/office/spreadsheetml/2009/9/ac» mc:Ignorable=»x14ac» xmlns:mc=»http://schemas.openxmlformats.org/markup-compatibility/2006″ xmlns:r=»http://schemas.openxmlformats.org/officeDocument/2006/relationships» xmlns=»http://schemas.openxmlformats.org/spreadsheetml/2006/main»>»,

    а в НЕ правильных файлах: «<?xml version=»1.0″ encoding=»UTF-8»?>

    -<worksheet xmlns:r=»http://schemas.openxmlformats.org/officeDocument/2006/relationships» xmlns=»http://schemas.openxmlformats.org/spreadsheetml/2006/main»>», кроме того у них разная структура папок внутри. Но если «не правильный файл» открыть в excel, и просто нажать сохранить, то его структура становится правильной и читается нормально… не понимаю как победить пока, может кто уже сталкивался?

    Reply
  71. fanlexa
    Reply
  72. user1114234

    Почему может писать, чтo:

    Файл не существует/не доступен:

    D:Товар.xlsx

    Хотя файл там. Пробовал разные директории, даже файл пустым делал. Всё равно не хочет видеть

    Reply
  73. Petrony

    (75) Если у вас клиент-сервер, то возможно, загрузка у вас происходит на сервере и тогда файл должен быть там, а не на локальном компьютере. И наоборот. Если нужно выбрать файл на локальном компьютере, а прочитать на сервере, помещайте во временное хранилище.

    Reply
  74. yurant

    (75) починил у себя подобное, выправив руками все слэши в путях, и переведя все наименования в путях в нижний регистр

    и помимо этого допилил случайный каталог для временных файлов (пользователей много, всё выполняется на серваке… начинает стучаться у всех в одну папку)

    ВременноеИмяФайла = ПолучитьИмяВременногоФайла();
    ВыбФайл = Новый Файл(ВременноеИмяФайла);
    ВременноеИмяКаталога = СтрЗаменить(ВыбФайл.Имя, «.tmp», «»);
    ZIPКаталог = КаталогВременныхФайлов() + ВременноеИмяКаталога +  «/xlsx/»;

    а по итогам возврата таблицы

    УдалитьФайлы(СтрЗаменить(ZIPКаталог, «/xlsx/», «»));

    дабы удалить временный каталог.

    ps для серверов на линуксе во избежание проблем с правами (и чтоб не давать рутовые права службе 1с, либо чтоб не давать владельца на всю папку темпов) — можно в темпе создать отдельную папку дать ей права владельца и модифицировать

    ZIPКаталог = КаталогВременныхФайлов() +»папка_с_вашим_названием» + ВременноеИмяКаталога + «/xlsx/»;

    тогда «папка_с_вашим_названием» будет жить а содержимое дропаться сразу после возврата итоговой таблицы

    Reply

Leave a Comment

Ваш адрес email не будет опубликован. Обязательные поля помечены *