Перейти к содержанию

Databricks

Чтобы добавить подключение к базе данных, нажмите значок gear в правом верхнем углу и перейдите в Admin settings > Databases > Add a database. Затем выберите Databricks.

Эти параметры можно изменить в любое время. Не забудьте сохранить изменения.

Изменение параметров подключения

Строка подключения

Вставьте строку подключения, чтобы автоматически заполнить поля ниже.

Отображаемое название

Отображаемое название базы данных в интерфейсе Glarus BI.

Хост

IP‑адрес базы данных или доменное имя (например, xxxxxxxxxx.cloud.databricks.com или adb-xxxxx.azuredatabricks.net). Это значение Server Hostname вычислительного ресурса Databricks.

См. Compute settings for the Databricks JDBC Driver.

HTTP path (путь HTTP)

Значение HTTP Path вычислительного ресурса Databricks. Часто это endpoint SQL warehouse в формате /sql/1.0/endpoints/abcdef1234567890. См. Connect to a SQL warehouse.

Также см. Compute settings for the Databricks JDBC Driver.

Аутентификация

Есть два способа аутентификации в Databricks: персональный токен доступа (PAT) или service principal через OAuth (OAuth M2M).

Драйвер Databricks поддерживает оба варианта. Используйте переключатель, чтобы выбрать нужный способ.

Аутентификация через personal access token

См. Personal Access Token (PAT).

Аутентификация через service principal по OAuth (OAuth M2M)

См. Authenticate access with a service principal using OAuth.

Включить несколько каталогов

Включите, чтобы синхронизировать несколько каталогов. Если вы включите эту опцию, вы сможете указать, какие каталоги синхронизировать.

Каталог по умолчанию

Обязательно. Нужно указать каталог по умолчанию (чтобы в прямых запросах не приходилось указывать каталог явно).

При этом нельзя синхронизировать legacy‑каталоги Databricks, включая samples или hive_metastore.

Каталоги и схемы

Вы можете указать, какие каталоги и схемы нужно синхронизировать и сканировать. Варианты:

  • All (все)
  • Only these... («только эти…»)
  • All except... («все кроме…»)

Для вариантов Only these... («только эти…») и All except... («все кроме…») можно указать список значений через запятую, чтобы подсказать Glarus BI, какие каталоги и схемы включать (или исключать). Например:

foo,bar,baz

Можно использовать wildcard *, чтобы сопоставлять несколько схем.

Допустим, у вас есть три схемы: foo, bar и baz.

  • Если выбрано Only these... («только эти…») и вы ввели b*, синхронизируются bar и baz.
  • Если выбрано All except... («все кроме…») и вы ввели b*, синхронизируется только foo.

Поддерживается только wildcard *; другие спецсимволы и regex не поддерживаются.

Дополнительные параметры строки подключения JDBC

Можно добавить параметры к строке подключения, которую Glarus BI использует для подключения к базе данных. Например, IgnoreTransactions=0.

См. Compute settings for the Databricks JDBC Driver.

Перезапускать запросы при простых изменениях

Выключите эту опцию (OFF), если пользователи хотят нажимать Run (кнопку воспроизведения) перед применением любой суммаризации или фильтров в конструкторе запросов.

По умолчанию Glarus BI выполнит запрос, как только вы выберете вариант группировки из меню Summarize или условие фильтра из drill-through меню. Если база данных работает медленно, возможно, стоит отключить автоматический перезапуск, чтобы не загружать данные при каждом клике.

Выберите, когда запускать синхронизацию и сканирование

См. "Синхронизация и сканирование базы данных"

Периодически снимать слепки таблиц

Периодическое снятие слепков таблиц увеличит нагрузку на вашу базу данных.

Включите (ON), чтобы сканировать выборку значений каждый раз, когда Glarus BI запускает синхронизацию.

Запрос fingerprinting анализирует первые 10 000 строк каждого столбца и оценивает, сколько уникальных значений у столбца, какие минимальные и максимальные значения у числовых столбцов и столбцов временных меток и т. д. Если оставить опцию OFF, Glarus BI выполнит fingerprinting столбцов только один раз во время настройки.

Возможности моделей

Для Databricks пока нет возможностей моделей.

Опасная зона (Danger zone)

См. опасную зону.

Дополнительная информация