Flink在袋鼠云一站式大数...

Flink在袋鼠云一站式大数据平台中的使用

Flink China Meetup 上海 - 2018年11月4日

杨思枢 · 袋鼠云 / 技术专家

CONTENT

为什么要扩展Flink SQL

目录 >>如何实现流与维表的JOIN

https://github.com/DTStack/flinkStreamSQL开源地址：

后续的开发计划

01为什么要扩展FlinkSQL

实时计算完全SQL化

在实时计算的世界里不只是流与流的JOIN，还需要流与维表的JOIN

Kafka Kafka

KafkaMysql,Hbase

维表流流流

FLinkSQL不支持流与维表JOIN这么办?

修改Flink源码扩展FlinkSQL？

1. 对Flink的源码改动的地方比较多，无法保证对其他的功能带来影响，要做额外的测试工作

2. 除非合并到社区版本，不然后续合并社区代码是比较大的工作量

修改Flink源码带来的问题

02如何实现流与维表的JOIN

DEMO SQLinsert into

MyResultselect

d.channel, d.info

from ( select a.*,b.infofrom

MyTable a join sideTable b

on a.channel=b.namewhere a.channel = 'xc2’

and a.pv=10 ) as d

Calcite解析Insert into语句，拆分出子语句

1. select a.*,b.info from MyTable a join sideTable b on a.channel=b.namewhere a.channel = 'xc2' and a.pv=10

2. select d.channel, d.info from d

3. insert into MyResult

Calcite继续解析select语句old: select a.*,b.info from MyTable a join sideTable b on a.channel=b.namewhere a.channel = 'xc2' and a.pv=10

判断right table 是否是维表（维表只能是右表）

如果是拆分出left table(select * from MyTable )生成 A

把维表转换成AsyncFunction或者RichFlatMapFunction生成 B

CREATE TABLE sideTable( cf:name varchar as name, cf:info varchar as info, PRIMARY KEY(name), PERIOD FOR SYSTEM_TIME )WITH(type ='hbase’, zookeeperQuorum ='rdos1:2181',

zookeeperParent ='/hbase', tableName ='workerinfo’, cache ='LRU’,

cacheSize ='10000’,cacheTTLMs ='60000’,parallelism ='1' );

AsyncDataStream.orderedWait(A, B, Timeout, TimeUnit)或A.flatMap(B)生成C

生成新的SQL(Select name,channel,pv,xctime,info from C where channel = ‘xc2’ and pv=10)

LRU维表的实现

RichAsyncFunction

open(Configuration)

asyncInvoke(Row, ResultFuture<Row> )

close()

LRU维表

继承

Async I/O简介

Async I/O 是由阿里巴巴贡献给社区的，于1.2版本引入，主要目的是为了解决与外部系统交互时网络延迟成为了系统瓶颈的问题。

ALL维表实现

RichFlatMapFunctionvoid flatMap(IN value, Collector<OUT> out)

ALL维表

继承

03后续的开发计划

后续的开发计划

1.中间临时表(视图)功能

2.性能指标采集到Prometheus

3.维表快照功能

4.redis维表,结果表功能

5.mongodb维表，结果表功能

6.用SQL实现CEP

公司简介

关注袋鼠云技术团队

回复“10”获取PPT资料

Flink在袋鼠云一站式大数...

Documents

NWP Flink Reklam Företagspresentation

Apache Flink Overview (Flink.tw Meetup 2015/01/31)

常用实验动物的生物学特性及其应用 - gxmu.edu.cn...小鼠生物学特性属于动物界、脊索动物门、哺乳纲、啮齿目、鼠科、小鼠属。来源于野

Chimera 配種說明會 NRPGM 基因轉殖鼠核心設施. 小鼠配種方式簡介基因剔除鼠配種說明基因剔除鼠命名小鼠編號方式 Chimera 配種說明會

Wells Fargo Activity book El- Toro · 2019-09-18 · 回到他的馬廄，托洛終於可以放下辛苦的工作好好休息了。馬廄裡的老鼠把鼻子冒出來跟他問好。這隻老鼠的名字是大象。托洛看著

Migratie @ DrupalJam 2013 by Chris Flink

表达HBx的肝前体细胞肝内移植小鼠模型的构建aammt.tmmu.edu.cn/Upload/Script/17109201407025-171… · Web view表达HBx的肝前体细胞经肝内移植小鼠模型的构建

PSYKT FLINK - Røde Kors

Big Data: retos y oportunidades para la investigación ...socialbigdata.transyt-projects.com › wp-content › uploads › 2017 › 07 … · Apache Flink Apache Flink Paraleliza

嘽嘽看，，這是什麼樣的故事，這是什麼樣的故事®¶族相簿繪本.pdf · 小妮絲說「「媽媽媽媽，，不好了不好了，，我的米老鼠掉在上面我的米老鼠掉在上面

스사모 테크톡 - Apache Flink 둘러보기

第 10 章章打地鼠打地鼠遊戲 - ezonesoft.com.twezonesoft.com.tw/S1/PDF/C10.pdf · 要讓M1 之外的其他地鼠的Click 事件共用程式M1_Click ，必須用程式碼交

Python y Flink

Apache flink - prise en main rapide

叙利亚仓鼠、花枝鼠、仓鼠、豚鼠、小白鼠庄里动物园：五鼠闹春 …yzdsb.hebnews.cn/pc/paper/att/202001/17/28dfe404-fd17-40d7-925… · 精粹，吉祥三宝”专项社教活动，

20 - xinmin.cnxmwb.xinmin.cn/resfile/2017-07-30/A20/A20.pdf · 的小袋鼠，它好奇地打量着我，我赶紧披衣走了出去，于是便有人与动物的对话。袋鼠岛上有大袋鼠&

Nwp flink reklam kundunik webbshop 2014v1

Kobia Akademin - Smakrika portionsbröd med Fabian Flink

【鼠年話鼠】道教的神仙鼠 · 2020. 1. 20. · 族十二生肖的故事。相傳姜子牙想要排列十二種動物的先後順序，因此讓牠們一較高下，便想出了游泳比賽，十二種動物在起點上摩拳擦

防鼠ケーブル難燃防鼠ケーブル - SWCCM-VV／M-CVV ビニル防鼠ビニル M-CV／M-CCV 架橋ポリエチレン難燃防鼠ケーブル FPM-VV／FPM-CVV ビニル難燃防鼠ビニル