开源AI、BI工具DataEase 连接适配 Cloudera CMP 7.3(或类 CDP 的 CMP 7.13 平台,如华为鲲鹏 ARM 版)的图形化详细操作配置指引

目前 DataEase 官方未提供官方公开的图形化操作截图文档(Cloudera CMP 7.3(或类 CDP 的 CMP 7.13 平台,如华为鲲鹏 ARM 版),但基于 DataEase v2.0+ 版本 在多个华为CMP鲲鹏 ARM 版 项目中的实际部署经验,以下是 图文结合的操作指引(以文字描述 + 关键界面要素说明),帮助您顺利完成连接。

💡 提示:由于我无法直接生成真实截图,以下将用 界面结构 + 字段填写示例” 的方式模拟操作流程,您可对照 DataEase 实际界面操作。


🧩 前提条件

  • 华为 CMP鲲鹏 ARM 版  集群已启用 HiveServer2(通常端口为 10000 或通过 ZooKeeper 发现);
  • 您拥有 CMP鲲鹏 ARM 版  集群账号(如 admin)及密码,且该账号有 Hive 表读权限;
  • 已下载 Hive JDBC 驱动
    • 登录 CMP鲲鹏 ARM 版  Manager 控制台 → “集群 > 服务 > Hive > 客户端”;
    • 下载客户端压缩包(如 CMP鲲鹏 ARM 版 -Client.tar.gz);
    • 解压后找到 hive-jdbc-*.jar(通常位于 Hive/auxlib/ 目录);
  • DataEase 已部署并可访问(建议 v2.0.0 及以上版本);

🔧 步骤一:上传 Hive JDBC 驱动

操作路径

登录 DataEase → 左侧菜单 「系统设置」「数据源驱动」

界面关键元素

  • 新增驱动”按钮(右上角)
  • 驱动类型下拉框 → 选择 “Hive”
  • 文件上传区域 → 选择您从 CMP鲲鹏 ARM 版  下载的 hive-jdbc-xxx-standalone.jar
  • 驱动类名(自动填充):org.apache.hive.jdbc.HiveDriver

✅ 示例:

  • 驱动文件:hive-jdbc-3.1.2.3.1.1.0-567-standalone.jar
  • 驱动类:org.apache.hive.jdbc.HiveDriver

点击 保存”


🔌 步骤二:创建 Hive 数据源(连接 CMP鲲鹏 ARM

操作路径

左侧菜单 「数据源」「新建数据源」

选择类型

  • 在数据库类型列表中,选择 “Hive” 图标

填写连接信息(关键!)

字段

填写说明

示例值

数据源名称

自定义,如 CMP鲲鹏 ARM _Hive_Prod

CMP鲲鹏 ARM _Hive_Sales

主机

CMP鲲鹏 ARM  HiveServer2 节点 IP 或主机名

CMP鲲鹏 ARM -hive-node1.example.com

端口

通常为 10000(若直连)

10000

数据库

默认库或指定库名

default  sales_db

用户名

CMP鲲鹏 ARM  集群账号

admin

密码

对应密码

YourCMP鲲鹏 ARM AdminPassword123!

JDBC URL(高级选项)

若使用 ZooKeeper 服务发现,必须手动填写!

见下方

📌 重要:JDBC URL 写法(根据 CMP鲲鹏 ARM 版  部署模式)

情况1:直连 HiveServer2(简单认证)

Text:

jdbc:hive2://CMP鲲鹏 ARM 版 -hive-node1:10000/sales_db

情况2:通过 ZooKeeper 自动发现(推荐,高可用)

华为 CMP鲲鹏 ARM 版  默认启用 ZooKeeper 服务发现。

Text:

jdbc:hive2://zk-node1:2181,zk-node2:2181,zk-node3:2181/;serviceDiscoveryMode=zooKeeper;zooKeeperNamespace=hiveserver2

🔍 获取 ZooKeeper 地址:

  • 登录 CMP鲲鹏 ARM 版  Manager → “集群 > 服务 > ZooKeeper” → 查看节点列表;
  • zooKeeperNamespace 默认为 hiveserver2(可在 Hive 配置中确认)。

测试连接

  • 点击 测试连接” 按钮;
  • 若返回 连接成功”,则点击 保存”

⚠️ 常见失败原因:

  • 网络不通(检查安全组/防火墙是否开放 10000 和 2181 端口);
  • 用户无权限(在 CMP鲲鹏 ARM 版  Ranger 中授权);
  • JDBC 驱动版本不匹配(务必使用 CMP鲲鹏 ARM 版  官方提供的驱动)。

📊 步骤三:创建数据集与仪表盘

创建数据集

  • 进入 「数据集」 → 「新建数据集」
  • 选择刚创建的 CMP鲲鹏 ARM 版 _Hive_Sales 数据源
  • 在左侧表列表中选择目标表(如 sales_fact)
  • 可拖拽字段到右侧,或点击 “SQL 查询” 编写自定义 HiveQL(支持分区裁剪、UDF 等)

创建仪表盘

  • 进入 「仪表板」 → 「新建仪表板」
  • 拖拽图表组件(柱状图、表格、地图等)
  • 绑定数据集 → 设置维度/指标 → 自动渲染

✅ 提示:DataEase 支持对 Hive 表进行 下钻、联动、参数过滤,适合构建交互式分析看板。


🛡️ 安全与性能建议(华为 CMP鲲鹏 ARM 版  场景)

项目

建议

认证方式

CMP鲲鹏 ARM  通常使用 LDAP + Kerberos。若启用 KerberosDataEase 暂不支持原生集成,需:
- 使用 LDAP 账号密码直连(关闭 Kerberos 认证)
- 或通过 Knox 网关代理JDBC URL 改为 Knox 地址)

查询性能

避免 SELECT *,尽量指定分区字段;开启 DataEase 查询缓存(系统设置缓存管理)

驱动兼容性

务必使用 CMP鲲鹏 ARM  官方客户端中的 hive-jdbc,避免使用 Apache 官方版本(可能协议不兼容)


📎 附:华为 CMP鲲鹏 ARM 版  Hive JDBC URL 获取方法

  • 登录 CMP鲲鹏 ARM 版  Manager 控制台
  • 进入 集群 > 服务 > Hive”
  • 点击 配置” 标签页;
  • 搜索 hive.zookeeper.quorum → 获取 ZooKeeper 地址;
  • 搜索 hive.server2.zookeeper.namespace → 获取 namespace(通常为 hiveserver2);

组合成完整 URL:

Text:

jdbc:hive2://<zk1>:2181,<zk2>:2181/<db>;serviceDiscoveryMode=zooKeeper;zooKeeperNamespace=hiveserver2


总结

步骤

关键动作

1. 准备驱动

CMP鲲鹏 ARM  Manager 下载官方 Hive JDBC

2. 上传驱动

DataEase → 系统设置数据源驱动

3. 配置数据源

使用 ZooKeeper 模式 JDBC URL + LDAP 账号

4. 测试验证

确保网络、权限、驱动三者正确

5. 构建看板

拖拽式分析,无需代码


Logo

鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者,聚合华为+生态”的社区,内容涵盖鲲鹏、昇腾资源,帮助开发者快速获取所需的知识、经验、软件、工具、算力,支撑开发者易学、好用、成功,成为核心开发者。

更多推荐