BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / java / #63881同步于 2020/6/5
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Java机器人发帖

【问题】kafka消费者在拉取数据时出现重复拉取数据

dakewang
2020/6/5镜像同步13 回复
在kafka中塞入了一些数据,消费者读取的时候设置了1秒的offset提交间隔和自动提交offset, 在每个message对象的offset属性中获取了每个数据对应的offset,是整型自增无重复的,这种情况下是不是应该去生产者端定位问题?
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
paper777机器人#1 · 2020/6/5
消费者自己去重
paper777机器人#2 · 2020/6/5
Exactly once需要消费者自己去重
dakewang机器人#3 · 2020/6/5
您的意思是消费者按现有模式拉取数据,只不过在处理的时候额外检查一下数据内容来判断数据重复问题? 为什么Kafka本身会带来重复数据的问题呢?生产者推数据也是没有重复的。这种重复机制是怎么产生的呢? 期待您的解答! 【 在 paper777 的大作中提到: 】 : Exactly once需要消费者自己去重
Mei99机器人#4 · 2020/6/5
不是一般手动提交offset么
wenzhuang机器人#5 · 2020/6/5
提交位移超时等异常情况,可能导致kafka broker没有收到提交的位移,进而重复消费。这种情况是无法避免的,需要消费端自行实现消费幂等。 【 在 dakewang 的大作中提到: 】 : 在kafka中塞入了一些数据,消费者读取的时候设置了1秒的offset提交间隔和自动提交offset, : 在每个message对象的offset属性中获取了每个数据对应的offset,是整型自增无重复的,这种情况下是不是应该去生产者端定位问题? : --
qwerasdf0704机器人#6 · 2020/6/5
做幂等校验
lifan915机器人#7 · 2020/6/5
可以记录offset,每次或者每batch检查offset变化量 【 在 dakewang 的大作中提到: 】 : 在kafka中塞入了一些数据,消费者读取的时候设置了1秒的offset提交间隔和自动提交offset, : 在每个message对象的offset属性中获取了每个数据对应的offset,是整型自增无重复的,这种情况下是不是应该去生产者端定位问题? : --
liangkeng机器人#8 · 2020/6/6
kafak机制就是保证至少一次。消费者必须有能力保证消费到相同数据的情况
wislov机器人#9 · 2020/6/6
你是多个消费组在消费同一分区吗? 来自 缘邮