Skip to content

欢迎使用衡石智能分析平台 HENGSHI SENSE

HENGSHI SENSE 是 AI 时代的新一代智能型 BI 分析平台!

为了应对当前的数据挑战,我们为数据驱动型组织量身打造了这个标准化的企业级工具。在敏捷 BI 基础上加入 ChatBI、指标管理、数据集成、复杂报表、多租户协同发布等先进特性,帮助业务人员灵活探索,让数据成果在组织内一键可达。

  • 适配多种主流 LLM,提供智能问数的 ChatBI 能力,可通过集成嵌入在各种业务应用中被唤醒
  • 提供指标中心化管理能力,沉淀指标体系,提供指标定义的标准语言HQL — Hengshi Query Language
  • 适配各种主流数据平台,包括数据库,数据仓库,湖仓一体平台,大数据平台,NoSQL 数据库,Excel 文件,自定义 API 等
  • 内置高性能数仓引擎的设计,可以适配搭载 Greenplum,Apache Doris 等 MPP 架构的平台,提供数据集成能力
  • 基于 H5 的数据可视化引擎,支持多屏适配,支持可视化图表的自定义扩展和js扩展
  • 完备的企业级平台权限控制和发布分享机制,支持主流 SSO 协议
  • Headless 架构设计,支持 Restful API,支持 OEM

产品核心概念

由于构建企业级 BI 要求的技能跨度极广:涉及到偏向底层架构的数据存储、数据同步、计算性能优化机制;偏向展示层的可视化图表渲染、仪表盘布局和响应;偏向IT管控的权限体系和集成能力;偏向业务实现的数据建模原理;以及偏向用户体验的交互设计,因此 BI 产品的研发通常是一项成本巨大的工作。

与此形成对比的是,BI 产品核心概念却寥寥无几,产品的复杂度构建于这些核心概念的组合之上。以下阐述了产品基本概念,这些概念设计贯穿我们的整个产品,并最终体现为产品的功能形态。我们希望衡石智能分析平台可以成为各个领域的行业人员进行业务分析的称手兵器,简单稳定,容易上手。

一切的开始 — 数据连接|Data Connection

数据连接面向物理数据源,是 BI 工作和数仓工作之间的桥梁。建立数据连接后才能够创建数据集。

在可分析数据的范围已经扩大化的今天,各种专业的数据引擎、数据仓库技术更加百花齐放。大多数情况下,BI 的工作要后置于数仓的搭建筹备工作。数仓加上 BI 获取数据的 insight 依然是被实践证明最合理的路径,AI 大模型技术的兴起目前还没有撼动这个现状。

分析的单位 — 数据集|DataSet

数据集是虚拟的二维表格,是数据库中表和视图的抽象,是分析工作的起点。

这个定义是对所有结构化数据在二维表格形态下的抽象表达,定义的目的是为了不用关心物理上来自哪个具体数据源。后面的统计分析和处理都专注集中于数据行列的操作上,对数据的聚合计算集中在行上的遍历,而所有的过滤则主要是列为锚点进行。

可视化的语言 — 数据图表|Chart

图表是数据可视化的最小单位。在 HENGSHI SENSE 中,一个数据的论点以一个图表来呈现。 一图胜千言的底层原理在于人类大脑对于图形信息的处理速度是文字信息的数百倍。BI 的其中一项主要工作就是对于管理的数据集创建最合适的可视化图表。数据可视化的宗旨不在于炫酷而在于高效的传达。最经典的图表通常最有用,比如折线图、柱状图和饼图就能解决很多问题,热力图、气泡图也非常有用。

KPI 也是一种高频使用形式,可以突出某个关键指标的准确数值,通常和折线图等可视化图形在一个仪表盘中组合使用。

触手可及 — 仪表盘|Dashboard

仪表盘是图表、过滤器和文本的组合排版,配合展示一个具体的主题,用于讲述一个用户故事。

仪表盘是 BI 工程的主要产物之一,也是连接不同角色的中枢。一个 BI 的项目落地首先要明确两个角色,谁负责从数据建模到仪表盘的制作,谁会消费查看仪表盘。

在衡石产品中还有一个相关概念是数据应用 Application,我们希望可以封装一组仪表盘,形成一个更完整的分析解决方案,并给予更多的使用场景,如数据门户。

数据大屏是仪表盘的一种特殊展现形式,主要用于汇报和展览等集中在视觉效果的场景。

BI 真正的核心工作 — 数据模型|Model

数据模型定义在逻辑上数据集之间的关联关系, Union 和 Join 是两种最基础的关系。

定义数据模型的目的归根结底是灵活性,这也是 BI 平台最重要的能力之一。业务对于明细数据在多维度上的统计和不同聚合层次上的计算需要满足在响应速度和灵活性两个方面的最佳平衡,数据模型的支持能最大程度降低在实际数据查询发生前做计算的范围,减少在物理层面的数据复制和搬运。随着数据引擎的性能一路提升,模型的重要性也变得更加重要,没有强大的建模能力相当于浪费了大数据技术发展以来各数据引擎平台的创新成果。当前 BI 的主流趋势很明确,就是拥抱当前更强的实时数据处理能力,在整体架构上的 trade-off 上更倾向于灵活性!

业务友好的语言 — 指标|Measures & Metrics

指标能力本质上是数据建模的延伸,是对数据集的增强扩展,是 BI 产品建模上的核心门槛。

指标是 HENGSHI SENSE 里最重要的概念,分为数据建模层面和业务层面两类,在产品里用原子指标和业务指标进行区分,更底层的能力在于原子指标。原子指标是定义一个数据集在某个统计度量上的表达式,比如一个设定条件下灵活定义的同比增长率,或者一个基于字段值和函数组合成的动态表达式。原子指标很大程度上扩充了做 BI 分析动作时面对数据集的可操作空间,这个能力依赖比较丰富的函数库,衡石提供了上百种高级函数对其进行支撑。

业务指标面向业务运营专家,是确定了维度和计算表达之后具体的一个业务口径的计算结果。基于业务指标的管理、分析和查看,以及指标体系的管理能力,是 BI 工具从 IT 技术部门进一步走进业务用户的新型功能板块。

动态的体现 1 — 过滤器|Filter

过滤器为静态仪表盘赋予动态能力,通过变换切面来锁定洞见。

一个静态的页面承载的信息量终究有限,仪表盘中的过滤器能起到动态切换观察范围的效果。由于数据的查阅动作是面向查看人员的,因此过滤器需要具备丰富的类型和呈现方式,按照过滤内容有文本、时间、数值等;按照呈现有输入控件、选择控件、平铺控件、滑块控件、树形控件、日历控件等;按照作用范围则有局部过滤器,全局应用过滤器,数据集过滤器。过滤器需要有大量的交互能力,让仪表盘起到类似千人千面的个性化效果,这个功能体现出了数据类工具产品较高的功能复杂度。

动态的体现 2 — 参数|Parameters

参数本质也是一种底层数据的动态切换,并将切换能力显式地装载到仪表盘的交互操作中。

参数可以以控件形态大量使用于仪表盘中,增加图表的可交互性,分为局部参数控件和全局应用参数控件。同时作为施展灵活性的重要手段,也会频繁的用于指标的计算表达式、权限控制、数据集创建等场景。

参数和过滤器一样,都体现了数据分析工作的动态性和复杂性。同时作为一项基础能力,和指标表达式的语义组合,能够得到强大的业务逻辑表达能力。

分析的性能 — 引擎|Engine

数据结论得由数据运算得出,数据运算需要物理层面有地方对数据高效的查询和聚合计算,这个地方叫引擎。

默认的引擎是外部的高性能数据仓库,但是由于对响应性的更高追求,现代 BI 工具都会尝试内存计算引擎这样的方式,去获得更好的响应体验。当前飞速发展的数据仓库平台,让内存计算不再是必须的选择,这是一个时代的判断,也是架构上的极大简化。

在分析的 pipeline 中,引擎是必须有的角色。而不同的企业对于数据平台的建设和规划有很大的差异,所以在衡石产品的架构中也提供了开箱即用的引擎以满足一般的计算需求,我们叫内置引擎。实际落地是衡石内置引擎还是客户自建,两者皆可。

业务的封装 — 应用|App

从 2.0 版本开始,我们将仪表盘 | Dashboard 和数据集 | Dataset 都封装进了应用 | App 里,让用户在探索的过程中可以更专注于当前的业务场景,充分利用数据集和仪表盘提供的功能。

即时呈现,即时同步 - 发布|Publish

我们把发布的功能作为一种基础能力放到了应用|App 上,用户可以使用发布功能将数据分析的作品发布出去,由于衡石分析平台基于 H5 页面特性构建,这让分享出去的成果保持了可交互的优点,也可以适配信息抵达的不同设备。同时我们提供了精细化的权限控制体系,适应在大型组织内部的管理要求。

发布是为了组织内部的协同,这非常重要。我们需要让组织内部洞察业务现状的成本降到最低,让数据成果的消费方能够即刻得到反馈,让数据可视化结果在组织内部一键可达。在这些高频操作上的效率优化,将显著提升一个组织内部的信息流转效率,用户围绕这个平台协作得越久,这个组织的数据效能就会越高,达到一个良性的循环,最终催生形成一个数据驱动型的团队。

衡石分析平台使用手册