加入收藏 | 设为首页 | 会员中心 | 我要投稿 晋中站长网 (https://www.0354zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 运营中心 > 网站设计 > 教程 > 正文

Apache Flink 漫谈系列 - SQL概览

发布时间:2018-11-15 10:22:07 所属栏目:教程 来源:孙金城
导读:一、SQL简述 SQL是Structured Query Language的缩写,最初是由美国计算机科学家Donald D. Chamberlin和Raymond F. Boyce在20世纪70年代早期从 Early History of SQL 中了解关系模型后在IBM开发的。该版本最初称为[SEQUEL: A Structured English Query Lang

Tumble 滚动窗口有固定size,窗口数据不重叠,具体语义如下:

Apache Flink 漫谈系列 - SQL概览

b. 语法

Tumble 滚动窗口对应的语法如下:

  1. SELECT 
  2. [gk], 
  3. [TUMBLE_START(timeCol, size)], 
  4. [TUMBLE_END(timeCol, size)], 
  5. agg1(col1), 
  6. ... 
  7. aggn(colN) 
  8. FROM Tab1 
  9. GROUP BY [gk], TUMBLE(timeCol, size) 
  • [gk] - 决定了流是Keyed还是/Non-Keyed;
  • TUMBLE_START - 窗口开始时间;
  • TUMBLE_END - 窗口结束时间;
  • timeCol - 是流表中表示时间字段;
  • size - 表示窗口的大小,如 秒,分钟,小时,天。

c. SQL 示例

利用pageAccess_tab测试数据,我们需要按不同地域统计每2分钟的淘宝首页的访问量(PV)。

  1. SELECT 
  2. region, 
  3. TUMBLE_START(rowtime, INTERVAL '2' MINUTE) AS winStart, 
  4. TUMBLE_END(rowtime, INTERVAL '2' MINUTE) AS winEnd, 
  5. COUNT(region) AS pv 
  6. FROM pageAccess_tab 
  7. GROUP BY region, TUMBLE(rowtime, INTERVAL '2' MINUTE) 

d. Result

Apache Flink 漫谈系列 - SQL概览

(2) Hop

Hop 滑动窗口和滚动窗口类似,窗口有固定的size,与滚动窗口不同的是滑动窗口可以通过slide参数控制滑动窗口的新建频率。因此当slide值小于窗口size的值的时候多个滑动窗口会重叠。

a. 语义

Hop 滑动窗口语义如下所示:

Apache Flink 漫谈系列 - SQL概览

b. 语法

Hop 滑动窗口对应语法如下:

  1. SELECT 
  2. [gk], 
  3. [HOP_START(timeCol, slide, size)] , 
  4. [HOP_END(timeCol, slide, size)], 
  5. agg1(col1), 
  6. ... 
  7. aggN(colN) 
  8. FROM Tab1 
  9. GROUP BY [gk], HOP(timeCol, slide, size) 
  • [gk] 决定了流是Keyed还是/Non-Keyed;
  • HOP_START - 窗口开始时间;
  • HOP_END - 窗口结束时间;
  • timeCol - 是流表中表示时间字段;
  • slide - 是滑动步伐的大小;
  • size - 是窗口的大小,如 秒,分钟,小时,天;

c. SQL 示例

利用pageAccessCount_tab测试数据,我们需要每5分钟统计近10分钟的页面访问量(PV).

  1. SELECT 
  2. HOP_START(rowtime, INTERVAL '5' MINUTE, INTERVAL '10' MINUTE) AS winStart, 
  3. HOP_END(rowtime, INTERVAL '5' MINUTE, INTERVAL '10' MINUTE) AS winEnd, 
  4. SUM(accessCount) AS accessCount 
  5. FROM pageAccessCount_tab 
  6. GROUP BY HOP(rowtime, INTERVAL '5' MINUTE, INTERVAL '10' MINUTE) 

(编辑:晋中站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读