这份数据去重，用Flink怎么来实现？#大数据 #大数据开发 #Flink开发 #数据去重

Flink删除设置

66

2

23

1

举报

发布时间：2025-11-13 09:30

安瑞哥是码农

粉丝4654获赞2.2万

相关视频

02:16
Flink读文件，选择流还是批？
#大数据 #大数据开发 #flink读文件 #flink开发
45安瑞哥是码农
02:22
Flink cdc 3.5.0测评表现如何？
#大数据 #大数据开发 #flink cdc #flink开发
23安瑞哥是码农
02:14
为什么要学好Flink?
#大数据 #大数据开发 #flink开发 #flink学习
78安瑞哥是码农
02:15
Flink cdc 3.4.0，表现拉胯。
#大数据 #大数据开发 #flink开发 #flink cdc测评
25安瑞哥是码农
03:06
Flink被压了，咋整？ #大数据 #大数据开发 #flink开发 #Flink被压 #flink优化
60安瑞哥是码农
01:52
Flink运行任务Checkpoints保存失败问题解决 #小工蚁 #flink
查看AI文稿
AI文稿
我们在跑一个就是 flink 的任务的时候，我们会发现什么呢？就是说他的那个 checkpoints 啊，一直是失败的，一直是是一直是失败的，就是所以你你呃 flink 他不断在检查你的那个保存你的状态，然后在这个过程当中他一直是失败的，所以的话呢，就没有办法把这个弗林克的这个 job 能够执行完啊，所以他是有这样的一个问问这样的一个问题，那么这个问题是什么原因造成的呢？但是那么我我们今天也去看了一下，最主要的核心的问题的话呢，主要是问题的话呢，主要就是说我们跑的这个任务呢，他比较大啊，然后他那个 the checkpoint 它会保持一个这个整个一个任务的一个状态，然后呢它默认的形式呢是放在那个 host table 里面，是放在内存里面的，但是呢由于你可以看到它它这个 host table 的那个内存里面，他最大只能保保持五十几兆，但是他需要的空间可能要三百多兆，所以这个导致他就始终无法把这个状态保持在这个保存下来，他等于是这样，所以的话呢他就反复反复就是那个 checkpoint，这样就失败，失败的话呢，他就会不会让他就不断的去重启这个任务，让你这个呃 flink 这个人无无法往下跑，它等于是这样，所以的话呢就是呃，我们就呃就发现有这样的一个问题，所以的话呢，我们就要换一种呃，就是保存 checkpoint 的它的那个 storage，它等于是这样，所以我们要换一个就是文件系统的 checkpoint 的四 storage 就行了，而不需要把那个 checkpoint， checkpoint 里面的这些状态保持在内存当中，他直接保存在，呃，文件资盘当中，这样的话呢，他就可以能够正常地让 flink 去跑车这样的一些任务。好吧？呃，现在的话我们也看了一下，现在这个任务就很正常了，因为经过这样跑了一下之后的话呢，他现在这个 checkpoint 他就很顺畅了，他等于是这样，嗯。
29小工蚁
02:06
Flink的域名黑名单碰撞，怎么整？
#大数据 #大数据开发 #flink开发 #域名黑名单
30安瑞哥是码农
02:30
一个Flink内存调优的案例。
#大数据 #大数据开发 #实时开发 #Flink开发 #Flink内存调优
21安瑞哥是码农
02:21
Flink很flink cdc到底有什么不一样？
#大数据 #大数据开发 #flink开发 #flink cdc开发
58安瑞哥是码农
02:38
Flink高并发点查clickhouse,咋优化？
#大数据 #大数据开发 #Flink开发 #Flink优化 #flink点查clickhouse
57安瑞哥是码农
02:27
Flink的watermark有哪些坑？
#大数据 #大数据开发 #流式计算 #Flink开发 #Flink使用watermark
40安瑞哥是码农
02:16
Flink cdc的-u跟-d数据，怎么入库？
#大数据 #大数据开发 #Flink开发 #Flink cdc开发
51安瑞哥是码农
02:09
Flink的广播变量，玩呢？
#大数据 #大数据开发 #flink开发 #广播变量
37安瑞哥是码农
08:06
8分钟带你攻克Flink SQL Join所有核心考点观众老爷们记得一键收藏，点赞＋关注~
需要交流大数据学习可以私信或者 + dsflink
#flink #sql #join #数据开发 #实时开发
27涤生大数据
02:15
Doris整库同步，上游删除数据导致报错，咋整？
#大数据 #大数据开发 #Doris整库同步 #Flink cdc
44安瑞哥是码农
01:02
卸载已经删除的应用程序提示找不到文件…….exe#windows
1.9万echo
01:56
Flink 的mongodb cdc，耍起来怎么样？
#大数据 #大数据开发 #实时开发 #flinkcdc #mongodb cdc
46安瑞哥是码农
00:27
顽固流氓软件如何才能彻底清除？一招教会你！ #ROG显示器 #超杀27pro二代 #OLED
80ROG玩家国度汕头万象城店
02:19
flink跟spark任务，是可以本地运行的哦。
#大数据 #大数据开发 #flink开发 #spark开发 #任务运行方式
44安瑞哥是码农

热门推荐

热门分类