V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
lllnever
V2EX  ›  程序员

通过消费 kafka 中的 mysql binlog 同步数据,有没有好的办法可以进行 join? join 的两个表的变更不一定在一个时间窗口内

  •  
  •   lllnever · 2021-12-08 14:09:59 +08:00 · 1068 次点击
    这是一个创建于 863 天前的主题,其中的信息可能已经有所发展或是发生改变。
    4 条回复    2021-12-08 15:49:36 +08:00
    lllnever
        1
    lllnever  
    OP
       2021-12-08 14:12:06 +08:00
    初步的想法是在 sink 数据库建立单表,再查询单表进行聚合,但是会建立非常多的单表,而且逻辑也比较复杂
    SbloodyS
        2
    SbloodyS  
       2021-12-08 15:07:29 +08:00
    flink 双流 join
    lllnever
        3
    lllnever  
    OP
       2021-12-08 15:46:57 +08:00
    @SbloodyS 之前也大概看过 flink 的 join ,因为时间窗口不能满足需求,常规 join 的话资源消耗可能太大了
    https://nightlies.apache.org/flink/flink-docs-release-1.12/zh/dev/table/streaming/joins.html#%E5%B8%B8%E8%A7%84-join
    SbloodyS
        4
    SbloodyS  
       2021-12-08 15:49:36 +08:00
    这种需求本身就是成本和性能不可兼顾的,要不堆机器,要不就慢
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   889 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 21:23 · PVG 05:23 · LAX 14:23 · JFK 17:23
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.