「智能问数」是 Sugar BI 基于文心大语言模型推出的对话式数据问答产品,让用户能够通过自然语言的方式进行对答形式的数据查询,系统自动使用可视化图表的方式呈现数据结果,并支持对数据做summary总结。
智能问数功能邀测中,欢迎CSDN的用户前来报名:点击这里进行报名
下面我将为大家展示如何使用智能问数功能,来辅助我们进行数据分析:
恰当的提问描述可以帮助您更高效地获得想要的图表和结论,目前智能问数支持多种类型的提问,如简单指标类、时间筛选类、地域类和其他复杂类问题。
下面举例说明了部分典型的提问类型,您可参照和使用类似的问题描述进行提问。
提问类型举例
1、简单指标类
若您需要获得某个具体的数据指标,如销量、成本等,您可直接对数据模型中的维度或度量进行限定性地提问,如:
- 2023 年 5 月及之后的全国销售额?
- 2023 年河北省的销售额情况?
2、时间筛选类
您可基于时间维度对度量进行提问分析,如针对具体的日期范围,日/周/月/季度/年等。
为了准确识别相应字段,若您的日期类字段本身以字符串形式存储,则需要您在数据类型页面将其转成日期类型,详见前期数据准备。
部分提问举例:
- 2023 年华北地区各省份销售额趋势?
- 2023 年 12 月每天的成本变化趋势?
3、地域类问题
您可基于地域维度对度量进行提问分析,如针对具体的省份、城市等。
为了准确匹配地图类图表进行分析展示,您需要在数据模型中将包含地理信息的字段「标记为地理信息」,详见前期数据准备。
部分提问举例:
- 统计一下 2023 年第 1 季度,各省份的销量
- 2023 年各个城市的成本情况
4、记录数类
记录数类提问指的是根据特定条件过滤数据,并要求提供符合条件的记录总数。
部分提问举例:
- 每个产品在华北销售了多少次?
- 有多少类别为服装的产品?
- 每个产品名称的记录数
- 城市为北京的数据有多少行?
5、其他复杂问题
除上述问题之外,您可能还会遇到需要根据多种维度或多种度量数据分析呈现的复杂问题,如排序/排名类、模糊匹配类、日期时间类型聚合类问题。
A. 排序/排名类
在筛选日期时间和地域的同时,您可以针对具体的维度和度量进行排名或排序类提问,请表达清楚您希望选取的前几名。
部分提问举例:
- 2023 年东北地区销售额排名前十的城市
- 2023 年价格排名前三的产品名称
B. 模糊匹配类
您可以根据特定条件模糊搜索数据,系统将返回与条件相匹配的数据分析。这种提问方式适用于那些您可能无法提供完整的条目名称,或者需要更大细粒度的数据统计。
例如,当前数据表内不同产品名称众多,且没有分类,那么可以选取产品名称中的部分词汇进行针对性提问,如复印纸:
- 产品名称包含复印纸的销售额是多少?
- 支行名称包含北京的记录数
C. 日期时间类型聚合
您可以通过按照不同的时间单位(如年、季度、月、周、日、小时等)对日期时间数据进行分类和聚合,更好地了解数据在不同时间维度上的表现。
部分提问举例:
- 安庆市 2023 年各个月的销售额有多少?
- 华南地区 2023 年第 4 季度的产品类别有哪些?
注意事项
- 您提出的问题字数限制为 300 字(空格也算做有效字符)。
- 当生成的图表不符合预期时,可以点击「重新生成」,同一提问最多可重新生成三次图表。
- 欢迎通过图表或者结论右下角的赞和踩进行真实情况的反馈。
- 如果在大屏/报表编辑页面中关闭智能问数页面,Sugar BI 将会清空之前会话的全部内容。
- 若需要在提问中对已有维度和度量之外的字段进行提问,则需要在数据模型中根据新字段的计算逻辑添加相应的计算字段,否则可能会导致智能问数因无法直接识别和分析未知的维度或度量,而返回不够准确的结果。 如下图中示例,表中已存在度量字段“成本”和“销售额”,若我们想针对表中未明确定义的“利润”进行提问和分析,则需在数据模型中点击「新增度量字段」,进一步对新增字段的「表达式」或「表计算」进行定义,更多关于计算字段的内容可参考该章节:https://cloud.baidu.com/doc/SUGAR/s/vltijo6zp
利润”的计算字段添加完成后,即可在智能问数页面对“利润”相关的数据信息进行直接提问:
- 2023 年利润排名前十的省份
智能问数功能邀测中,欢迎CSDN的用户前来报名:点击这里进行报名