Databricks¶
Чтобы добавить подключение к базе данных, нажмите на значок шестерёнки в правом верхнем углу и перейдите в Управление > Базы данных > Добавить базу данных. Затем выберите Databricks.
Вы можете редактировать эти настройки в любое время. Просто не забудьте сохранить изменения.
Название¶
Название базы данных в интерфейсе Glarus BI.
Хост¶
IP-адрес вашей базы данных или её доменное имя (например, xxxxxxxxxx.cloud.databricks.com
или adb-xxxxx.azuredatabricks.net
). Это значение параметра Server Hostname вычислительного ресурса Databrick.
См. Настройки вычислений для драйвера Databricks JDBC (англ.).
Путь HTTP¶
Это значение HTTP Path вычислительного ресурса Databrick. Это значение часто является методом хранилища SQL в формате /sql/1.0/endpoints/abcdef1234567890
. См. Подключение к хранилищу SQL (англ.).
Кроме того, см. Настройки вычислений для драйвера Databricks JDBC (англ.).
Аутентификация¶
Существует два способа аутентификации в Databricks. Вы можете использовать токен персонального доступа (PAT) или сервисный принципал с использованием OAuth (OAuth M2M).
Драйвер Databricks поддерживает оба варианта. Используйте переключатель для выбора метода аутентификации, который вы хотите использовать.
Аутентификация с токеном персонального доступа¶
См. Токен персонального доступа (PAT, англ.).
Аутентификация доступа с помощью сервисного принципала с использованием OAuth (OAuth M2M)¶
См. Аутентификация доступа с помощью сервисного принципала с использованием OAuth (англ.).
Каталог¶
В настоящее время вы можете выбрать только один каталог. Glarus BI не поддерживает подключения к нескольким каталогам. Если вы хотите использовать более одного каталога в Glarus BI, вы можете настроить несколько подключений, каждое из которых выбирает другой каталог.
Вы не можете синхронизировать устаревшие каталоги Databricks, включая каталоги samples
или hive_metastore
.
Схемы¶
Вы можете указать, какие схемы вы хотите синхронизировать и сканировать. Варианты:
- Все
- Только эти...
- Все, кроме...
Для опций Только эти и Все, кроме вы можете ввести список значений, разделенных запятыми, чтобы указать Glarus BI, какие схемы вы хотите включить (или исключить). Например:
Вы можете использовать подстановочный знак *
для соответствия нескольким схемам.
Допустим, у вас есть три схемы: foo, bar и baz.
- Если у вас установлено Только эти..., и вы введёте строку
b*
— вы будете синхронизироваться с bar и baz. - Если у вас установлено Все кроме..., и вы введёте строку
b*
— вы будете синхронизироваться только с foo.
Обратите внимание, что поддерживается только подстановочный знак *
; вы не можете использовать другие специальные символы или регулярные выражения.
Дополнительные параметры JDBC-подключения¶
Вы можете указать дополнительные параметры через строку, например, IgnoreTransactions=0
.
Дополнительную информацию можно получить в документации к Databricks (англ.).
Перезапустить запрос для простых исследований¶
Выключите эту опцию (ВЫКЛ), если пользователи хотят нажимать Запустить (кнопку воспроизведения) перед применением любых изменений в Суммировать или условиях фильтрации.
По умолчанию Glarus BI выполнит запрос, как только вы выберете вариант группировки из меню Суммировать или условие фильтра из контекстного меню (документация Metabase, англ.). Если ваша база данных работает медленно, вы можете отключить автоматический перезапуск, чтобы избежать загрузки данных при каждом клике.
Выберите, когда будет выполняться синхронизация и сканирование¶
Включите эту опцию (ВКЛ), чтобы управлять запросами, которые Glarus BI использует для поддержания актуальной информации о вашей базе данных. Для получения дополнительной информации см. Синхронизация и сканирование баз данных.
Синхронизация базы данных¶
Если вы выбрали Выберите, когда будет выполняться синхронизация и сканирование > ВКЛ, то сможете настроить:
- Частоту синхронизации: каждый день или каждый час.
- Время запуска синхронизации в часовом поясе сервера, на котором работает ваше приложение Glarus BI.
Сканирование значений фильтров¶
Glarus BI может сканировать значения, присутствующие в каждом поле этой базы данных, чтобы включить флажки фильтров на дашбордах и в запросах. Это может быть довольно ресурсоёмким процессом, особенно если у вас очень большая база данных.
Если вы переключили Выберите, когда будет выполняться синхронизация и сканирование > ВКЛ, то увидите следующие параметры в разделе Сканирование значений фильтров:
- Регулярно, по расписанию позволяет запускать запросы сканирования с частотой, соответствующей скорости изменения вашей базы данных. Время устанавливается в часовом поясе сервера, на котором работает ваше приложение Glarus BI. Это лучший вариант для небольшой базы данных или таблиц с уникальными значениями, которые часто обновляются.
- Только при добавлении виджета фильтра — отличный вариант, если вы хотите запускать запросы сканирования по запросу. Включение этой опции (ВКЛ) означает, что Glarus BI будет сканировать и кэшировать значения поля (полей), которые используются только при добавлении нового фильтра на дашборд или в SQL-запрос.
- Никогда, я сделаю это вручную, если потребуется — это опция для баз данных, которые либо слишком велики, либо в которые никогда не добавляются новые значения. Используйте кнопку Пересканировать значения полей, чтобы запустить сканирование вручную и обновить значения фильтров.
Периодический слепок таблиц¶
Предупреждение
Периодическое повторное снятие слепков таблиц увеличит нагрузку на вашу базу данных.
Включите эту опцию (ВКЛ), чтобы сканировать образец значений при каждом запуске синхронизации в Glarus BI.
Запрос на создание слепков исследует первые 10 000 строк из каждого столбца и использует эти данные для примерной оценки количества уникальных значений в каждом столбце, минимальных и максимальных значений для числовых столбцов и столбцов временных меток и т. д. Если вы оставите этот параметр ВЫКЛ, Glarus BI будет делать слепки столбцов только один раз во время настройки.