开源AI、BI工具DataEase 连接适配 Cloudera CMP 7.3(或类 CDP 的 CMP 7.13 平台,如华为鲲鹏 ARM 版)的图形化详细操作配置指引
本文提供了DataEase连接华为CMP鲲鹏ARM版(类CDP平台)的详细配置指南。首先需从CMP Manager下载Hive JDBC驱动并上传至DataEase系统设置。创建数据源时,重点配置JDBC URL:直连模式使用HiveServer2地址,或通过ZooKeeper服务发现模式(推荐)。需注意获取正确的ZooKeeper地址和namespace,并测试连接确保网络、权限正常。文章还包含
开源AI、BI工具DataEase 连接适配 Cloudera CMP 7.3(或类 CDP 的 CMP 7.13 平台,如华为鲲鹏 ARM 版)的图形化详细操作配置指引
目前 DataEase 官方未提供官方公开的图形化操作截图文档(Cloudera CMP 7.3(或类 CDP 的 CMP 7.13 平台,如华为鲲鹏 ARM 版),但基于 DataEase v2.0+ 版本 在多个华为CMP鲲鹏 ARM 版 项目中的实际部署经验,以下是 图文结合的操作指引(以文字描述 + 关键界面要素说明),帮助您顺利完成连接。
💡 提示:由于我无法直接生成真实截图,以下将用 “界面结构 + 字段填写示例” 的方式模拟操作流程,您可对照 DataEase 实际界面操作。
🧩 前提条件
- 华为 CMP鲲鹏 ARM 版 集群已启用 HiveServer2(通常端口为 10000 或通过 ZooKeeper 发现);
- 您拥有 CMP鲲鹏 ARM 版 集群账号(如 admin)及密码,且该账号有 Hive 表读权限;
- 已下载 Hive JDBC 驱动:
- 登录 CMP鲲鹏 ARM 版 Manager 控制台 → “集群 > 服务 > Hive > 客户端”;
- 下载客户端压缩包(如 CMP鲲鹏 ARM 版 -Client.tar.gz);
- 解压后找到 hive-jdbc-*.jar(通常位于 Hive/auxlib/ 目录);
- DataEase 已部署并可访问(建议 v2.0.0 及以上版本);
🔧 步骤一:上传 Hive JDBC 驱动
▶ 操作路径
登录 DataEase → 左侧菜单 「系统设置」 → 「数据源驱动」
▶ 界面关键元素
- “新增驱动”按钮(右上角)
- 驱动类型下拉框 → 选择 “Hive”
- 文件上传区域 → 选择您从 CMP鲲鹏 ARM 版 下载的 hive-jdbc-xxx-standalone.jar
- 驱动类名(自动填充):org.apache.hive.jdbc.HiveDriver
✅ 示例:
- 驱动文件:hive-jdbc-3.1.2.3.1.1.0-567-standalone.jar
- 驱动类:org.apache.hive.jdbc.HiveDriver
点击 “保存”。
🔌 步骤二:创建 Hive 数据源(连接 CMP鲲鹏 ARM 版 )
▶ 操作路径
左侧菜单 「数据源」 → 「新建数据源」
▶ 选择类型
- 在数据库类型列表中,选择 “Hive” 图标
▶ 填写连接信息(关键!)
|
字段 |
填写说明 |
示例值 |
|
数据源名称 |
自定义,如 CMP鲲鹏 ARM 版 _Hive_Prod |
CMP鲲鹏 ARM 版 _Hive_Sales |
|
主机 |
CMP鲲鹏 ARM 版 HiveServer2 节点 IP 或主机名 |
CMP鲲鹏 ARM 版 -hive-node1.example.com |
|
端口 |
通常为 10000(若直连) |
10000 |
|
数据库 |
默认库或指定库名 |
default 或 sales_db |
|
用户名 |
CMP鲲鹏 ARM 版 集群账号 |
admin |
|
密码 |
对应密码 |
YourCMP鲲鹏 ARM 版 AdminPassword123! |
|
JDBC URL(高级选项) |
若使用 ZooKeeper 服务发现,必须手动填写! |
见下方 |
📌 重要:JDBC URL 写法(根据 CMP鲲鹏 ARM 版 部署模式)
情况1:直连 HiveServer2(简单认证)
Text:
jdbc:hive2://CMP鲲鹏 ARM 版 -hive-node1:10000/sales_db
情况2:通过 ZooKeeper 自动发现(推荐,高可用)
华为 CMP鲲鹏 ARM 版 默认启用 ZooKeeper 服务发现。
Text:
jdbc:hive2://zk-node1:2181,zk-node2:2181,zk-node3:2181/;serviceDiscoveryMode=zooKeeper;zooKeeperNamespace=hiveserver2
🔍 获取 ZooKeeper 地址:
- 登录 CMP鲲鹏 ARM 版 Manager → “集群 > 服务 > ZooKeeper” → 查看节点列表;
- zooKeeperNamespace 默认为 hiveserver2(可在 Hive 配置中确认)。
▶ 测试连接
- 点击 “测试连接” 按钮;
- 若返回 “连接成功”,则点击 “保存”。
⚠️ 常见失败原因:
- 网络不通(检查安全组/防火墙是否开放 10000 和 2181 端口);
- 用户无权限(在 CMP鲲鹏 ARM 版 Ranger 中授权);
- JDBC 驱动版本不匹配(务必使用 CMP鲲鹏 ARM 版 官方提供的驱动)。
📊 步骤三:创建数据集与仪表盘
▶ 创建数据集
- 进入 「数据集」 → 「新建数据集」
- 选择刚创建的 CMP鲲鹏 ARM 版 _Hive_Sales 数据源
- 在左侧表列表中选择目标表(如 sales_fact)
- 可拖拽字段到右侧,或点击 “SQL 查询” 编写自定义 HiveQL(支持分区裁剪、UDF 等)
▶ 创建仪表盘
- 进入 「仪表板」 → 「新建仪表板」
- 拖拽图表组件(柱状图、表格、地图等)
- 绑定数据集 → 设置维度/指标 → 自动渲染
✅ 提示:DataEase 支持对 Hive 表进行 下钻、联动、参数过滤,适合构建交互式分析看板。
🛡️ 安全与性能建议(华为 CMP鲲鹏 ARM 版 场景)
|
项目 |
建议 |
|
认证方式 |
CMP鲲鹏 ARM 版 通常使用 LDAP + Kerberos。若启用 Kerberos,DataEase 暂不支持原生集成,需: |
|
查询性能 |
避免 SELECT *,尽量指定分区字段;开启 DataEase 查询缓存(系统设置 → 缓存管理) |
|
驱动兼容性 |
务必使用 CMP鲲鹏 ARM 版 官方客户端中的 hive-jdbc,避免使用 Apache 官方版本(可能协议不兼容) |
📎 附:华为 CMP鲲鹏 ARM 版 Hive JDBC URL 获取方法
- 登录 CMP鲲鹏 ARM 版 Manager 控制台;
- 进入 “集群 > 服务 > Hive”;
- 点击 “配置” 标签页;
- 搜索 hive.zookeeper.quorum → 获取 ZooKeeper 地址;
- 搜索 hive.server2.zookeeper.namespace → 获取 namespace(通常为 hiveserver2);
组合成完整 URL:
Text:
jdbc:hive2://<zk1>:2181,<zk2>:2181/<db>;serviceDiscoveryMode=zooKeeper;zooKeeperNamespace=hiveserver2
✅ 总结
|
步骤 |
关键动作 |
|
1. 准备驱动 |
从 CMP鲲鹏 ARM 版 Manager 下载官方 Hive JDBC |
|
2. 上传驱动 |
DataEase → 系统设置 → 数据源驱动 |
|
3. 配置数据源 |
使用 ZooKeeper 模式 JDBC URL + LDAP 账号 |
|
4. 测试验证 |
确保网络、权限、驱动三者正确 |
|
5. 构建看板 |
拖拽式分析,无需代码 |
鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者,聚合华为+生态”的社区,内容涵盖鲲鹏、昇腾资源,帮助开发者快速获取所需的知识、经验、软件、工具、算力,支撑开发者易学、好用、成功,成为核心开发者。
更多推荐



所有评论(0)