对接 对接DataV
发布时间:2020-06-09 12:15:53 来源:网络 关键词:对接
对接
本文档为您介绍如何通过日志服务对接DataV进行大屏数据展示。
背景信息
实时大屏广泛应用于大型在线促销活动。实时大屏基于流式计算架构,该架构包含以下模块:- 数据采集:将来自各源头数据实时采集。
- 中间存储:利用类Kafka Queue进行生产系统和消费系统解耦。
- 实时计算:环节中最重要环节,订阅实时数据,通过计算规则对窗口中数据进行运算。
- 结果存储:计算结果数据存入SQL和NoSQL。
- 可视化:通过API调用结果数据进行展示。


日志服务支持使用查询+SQL92语法对日志进行实时分析。在结果分析可视化上,除了使用自带Dashboard外,还支持Grafana、Tableau(JDBC)等对接方式。
功能特点
计算一般根据数据量、实时性和业务需求会分为以下两种方式。- 实时计算(流计算):固定的计算 + 变化的数据
- 离线计算(数据仓库+离线计算):变化的计算+固定的数据
- 快速:API传入Query立马拿到结果,无需等待和预计算结果。
- 实时:99.9%情况下可做到日志产生1秒内反馈到大屏。
- 动态:无论修改统计方法还是补数据,支持实时刷新显示结果,无需等待重新计算。
- 数据量:单次计算数据量限制为百亿行,一旦超过,需要限定时间段。
- 计算灵活度:目前计算限于SQL92语法,不支持自定义UDF。

配置流程
日志服务数据对接DataV大屏展示,其操作主要分为以下3个流程。- 数据采集。请参考文档配置,将数据源接入日志服务。
- 索引设置。请参考简介,或最佳实践中网站日志分析案例。
- 对接DataV插件,将实时查询SQL转化为视图。
完成1、2步骤后,在查询页面可以看到原始日志,本文档主要介绍步骤3。
配置步骤
实际案例:不断调整统计口径下实时大屏
例如,云栖大会期间有个临时需求,统计线上(网站)的全国各地访问量。此前已配置采集全量日志数据、并且在日志服务中打开了查询分析,所以只要输入查询分析Query即可。- 在云栖大会的第一天,您需要统计UV,对所有访问日志中nginx下forward字段获取10月11日到目前唯一计数。可以使用如下语句。
* | select approx_distinct(forward) as uv
- 云栖大会的第二天,需求变更了。您只需要统计yunqi这个域名下的数据。则可以增加一个过滤条件host进行实时查询。 语句如下。
host:yunqi.aliyun.com | select approx_distinct(forward) as uv
- 统计过程中发现Nginx访问日志中有多个IP情况,默认情况下您只要第一个IP即可。则语句如下。
host:yunqi.aliyun.com | select approx_distinct(split_part(forward,',',1)) as uv
- 云栖大会的第三天您接到新需求,需要把uc访问中的广告访问去掉。此时可以加上一个过滤条件not。则语句如下。
host:yunqi.aliyun.com not url:uc-iflow | select approx_distinct(split_part(forward,',',1)) as uv
图 10. 示例 图 11. 大屏效果
ddos怎么防
海外CDN