V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
GTim
V2EX  ›  职场话题

最近 24 小时热门数据 TopN 算法有啥好的方案吗?

  •  
  •   GTim · 2021-02-24 20:59:57 +08:00 · 2306 次点击
    这是一个创建于 1147 天前的主题,其中的信息可能已经有所发展或是发生改变。
    今天去面试,面到了 TopN 问题,小弟我回答的挺溜的,但是面试官突然说 24 小时内 TopN 问题,我就迷茫了,无从下手。误差可以在 5 分钟内。

    想知道大家是怎么解决的。
    10 条回复    2021-02-26 07:49:02 +08:00
    mxT52CRuqR6o5
        1
    mxT52CRuqR6o5  
       2021-02-24 21:15:10 +08:00
    好像只能硬算吧,所以没法做到实时
    sizhitu
        2
    sizhitu  
       2021-02-24 21:22:52 +08:00 via iPhone   ❤️ 1
    5 分钟一个桶么
    GGGG430
        3
    GGGG430  
       2021-02-24 21:39:08 +08:00 via iPhone
    redis 的 sorted set 行不
    zjbztianya
        4
    zjbztianya  
       2021-02-24 22:06:35 +08:00
    slide window?
    GTim
        5
    GTim  
    OP
       2021-02-24 22:19:04 +08:00
    @zjbztianya 对,就是他的变形
    xupefei
        6
    xupefei  
       2021-02-24 22:33:52 +08:00 via iPhone
    二楼说的对,桶排序之后全局提取 top N 。
    suiterchik
        7
    suiterchik  
       2021-02-24 22:39:03 +08:00
    也有实时的方案,Misra-Gries 算法,这个是流式的算法
    缺点是数据不够大 or 长尾不够显著的时候会有误差,但你都需要用这个算法了,数据量显然足够
    ahill
        8
    ahill  
       2021-02-25 14:19:29 +08:00
    ahill
        9
    ahill  
       2021-02-25 15:24:21 +08:00
    oldmanong
        10
    oldmanong  
       2021-02-26 07:49:02 +08:00 via iPhone
    Flink 滑动窗口
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   997 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 20:17 · PVG 04:17 · LAX 13:17 · JFK 16:17
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.