如何分析Flink中的KeyBy,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。

十年的隆回网站建设经验,针对设计、前端、开发、售后、文案、推广等六对一服务,响应快,48小时及时工作处理。营销型网站的优势是能够根据用户设备显示端的尺寸不同,自动调整隆回建站的显示方式,使网站能够适用不同显示终端,在浏览器中调整网站的宽度,无论在任何一种浏览器上浏览网站,都能展现优雅布局与设计,从而大程度地提升浏览体验。创新互联从事“隆回网站设计”,“隆回网站推广”以来,每个客户项目都认真落实执行。
KeyBy算子:将数据流按照指定key进行分区(分组)
示例环境
java.version: 1.8.x flink.version: 1.11.1
示例数据源 (项目码云下载)
Flink 系例 之 搭建开发环境与数据
KeyBy.java
package com.flink.examples.functions;
import com.flink.examples.DataSource;
import org.apache.flink.api.java.functions.KeySelector;
import org.apache.flink.api.java.tuple.Tuple3;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.datastream.KeyedStream;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import java.util.List;
/**
* @Description KeyBy算子:将数据流按照指定key进行分区
*/
public class KeyBy {
/**
* 遍历集合,将用户按性别分成两类
* @param args
* @throws Exception
*/
public static void main(String[] args) throws Exception {
final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
//如果有多个分区,则设置并行度需大于1,或者在算子上设置setParallelism(2)前行度,否则算子只有一个并行度,则计算结果始终只有一个分区
// env.setParallelism(4);
List> tuple3List = DataSource.getTuple3ToList();
DataStream> dataStream = env.fromCollection(tuple3List);
//注意:使用Integer进行分区时,会导致分区结果不对,转换成String类型输出key即可正确输出
KeyedStream, String> keyedStream = dataStream.keyBy(new KeySelector, String>() {
@Override
public String getKey(Tuple3 tuple3) throws Exception {
//f1为性别字段,以相同f1值(性别)进行分区
return String.valueOf(tuple3.f1);
}
});
//lambda
// KeyedStream, String> keyedStream = dataStream.keyBy((KeySelector, String>) t3 -> t3.f1);
//指定第几个字段做为key进行计算
// KeyedStream, Tuple> keyedStream = dataStream.keyBy(1);
keyedStream.print().setParallelism(4);
env.execute("flink keyBy job");
}
} 打印结果
2> (张三,man,20) 4> (李四,girl,24) 2> (王五,man,29) 4> (刘六,girl,32) 2> (吴八,man,30) 4> (伍七,girl,18)
关于如何分析Flink中的KeyBy问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注创新互联行业资讯频道了解更多相关知识。