Загрузка файлов csv и xlsx


Функция загрузки файлов позволяет импортировать в таблицу хранилища данных информацию, подготовленную вручную в Excel или сохранённую в текстовых файлах формата CSV. Для успешной загрузки файлы должны соответствовать следующим требованиям:

  • Заголовки столбцов не должны содержать управляющие символы, такие как «;», «&» или переход на новую строку.
  • Данные в таблицах должны быть однородными и отформатированными в соответствии с их типом: текст, число или дата.
  • В наборах данных недопустимы пустые строки и столбцы.

Мастер загрузки

Откройте сервис в разделе меню «Главное/ Сервис/ Загрузка файла в БД (мастер настройки)»:

Порядок работы:

  • Для настройки загрузки файлов следуйте шагам мастера.
  • Переход к следующему шагу возможен только после выполнения всех условий текущего.
  • При необходимости можно вернуться к предыдущим шагам, изменить введённые настройки и продолжить работу.
  • Настройку можно прервать в любой момент, но в этом случае изменения не сохранятся.
  • После завершения настройки можно сохранить параметры и применять их для загрузки файлов с аналогичной структурой.

Шаг 1 «Выберите исходный файл и место назначения данных»

  1. Укажите, требуется ли выгружать данные.
  2. Выберите базу данных-приемник. Загружать файлы в Базу Данных Clickhouse сейчас нет возможности.
  3. Выберите в новую или существующую таблицу должны загрузиться данные.
  4. Если был выбран вариант загрузки в существующую таблицу, укажите таблицу выгрузки (вручную или выбрав из списка).
  5. Выберите тип файла: «XLSX», «XLS», «CSV».
  6. Выберите файл для загрузки.
  7. Когда выбран файл и приемник, становится доступна кнопка «Далее», которая переводит процесс на следующий шаг.

Шаг 2 «Выберите лист»

  1. По умолчанию для загрузки предлагается первый лист в файле, вы можете выбрать другой лист.
  2. После выбора листа возможно просмотреть данные, которые на нем находятся и убедиться, что лист выбран правильно.
  3. Если все верно, переходите на следующий шаг — нажмите на кнопку «Далее».

Шаг 3 «Настройте диапазон загрузки»

  1. Укажите строку заголовка на выбранном листе.
  2. Укажите начало диапазона загрузки.
  3. Укажите окончание диапазона загрузки.
  4. Количество строк предпросмотра на экране ограничено значением 50, так как чем больше строк нужно отобразить, тем дольше будет работать мастер. При необходимости возможно увеличить количество строк предпросмотра вручную.
  5. Галочка «Распространить значение в объединенных ячейках» означает, что при наличии в выбранном диапазоне объединенных ячеек, мастер разделит их и все заполнит текущим значением.
  6. Здесь отображаются строки предпросмотра.
  7. Если все настроено верно, переходите на следующий шаг, нажав на кнопку «Далее».

Шаг 4 «Соответствие исходных данных и таблицы-приемника»

  1. Выберите в области предпросмотра нужный столбец, нажав на его заголовок.
  2. Проверьте правильность предложенного системой названия поля, при необходимости измените его.
  3. Проверьте правильность предложенного системой типа данных, при необходимости измените его.
  4. Если столбец загружать не нужно, то установите переключатель «Импортировать поле» в положение «Нет».
  5. После настройки названий поля и типа данных столбцов, переходите на следующий шаг, нажав на кнопку «Далее».

Шаг 5 «Проверьте структуру новой таблицы»

  1. Проверьте получившуюся структуру перед загрузкой данных, при необходимости возможно поменять названия поля и типа данных.
  2. Если структура данных настроена верно, переходите на следующий шаг, нажав кнопку «Далее».

Шаг 6 «Введите название таблицы и запустите процесс»

  1. Введите название таблицы-приемника.
  2. Галочка «Сохранить ошибки при загрузке строк из файла» включает запись ошибок.
  3. Если все настроено верно, запустите процесс загрузки, нажав на кнопку «Далее».

Настройка загрузки вручную

Перейдите в сервис ручной загрузки через начальную страницу или через меню «Главное/ Сервис/ Загрузка файла в SQL»:

Порядок работы:

  1. На закладке «Основная» выберите файл для загрузки.
  2. Нажмите на кнопку «1. Проанализировать файл». При этом автоматически заполнится табличная часть со списком полей таблицы.
  3. В табличной части при необходимости возможно отредактировать «Наименование», «Тип» и «Длину поля в создаваемой SQL-таблице».
  4. На вкладке «Пред. просмотр» возможно посмотреть, как будет выглядеть таблица.
  5. Заполните параметры на закладке «Все настройки».
    • «База данных», «Имя таблицы», «Режим записи в SQL» (см. рисунок выше, 1);
    • параметры файла, в зависимости от типа (см. рисунок выше, 2, 4);
    • прочие настройки (см. рисунок выше, 3).
  6. Вернитесь на закладку «Основная», нажав на кнопку «Создать таблицу SQL». Если все верно, выведется сообщение о создании таблицы, иначе — описание ошибки.
  7. Нажмите на кнопку «Загрузить данные в SQL» на вкладке «Основная». Данные из файла запишутся в SQL-таблицу.

Особенности использования «ADO-ODBC»

В ETL есть возможность использования «ADO-ODBC» для загрузки данных файлов.

Примечание — для использования «ADO-ODBC» необходимы соответствующие драйвера.

Для источников со способом подключения «ADODB», в правилах выгрузки используется вид правила «Запрос» и формируется обычный SQL-запрос. Из особенностей можно выделить только описание секции FROM в запросе:

  • для файлов «XLSX» и «XLS» в секции FROM указывается имя листа, из которого получаются данные в формате ИмяЛиста$. Например, для листа «Лист1» секция FROM будет выглядеть как FROM [Лист1$];
  • для файлов «CSV» в секции FROM указывается имя файла. Например, SELECT * FROM datafile.csv.

При получении данных через «ADO-ODBC», есть возможность использовать Агента ETL:

  • для Windows — опционально.
  • для Unix-подобных систем — обязательно.

Для использования Агента ETL выберите его в составе выгрузки на вкладке «Дополнительно»: