pppwww 最近的时间轴更新
pppwww

pppwww

V2EX 第 357317 号会员,加入于 2018-10-20 09:38:48 +08:00
pppwww 最近回复了
@Jim2Chen 有空了写个文章分享下,目前整理的方案和公司的数据结合的比较多,不方便直接发,主要步骤就是:
1 、如何识别会话
通过窗口函数,计算相邻两次行为的时间间隔,按照规定的 sessionPeriod 切割会话
2 、识别会话后,如何实现路径的裁剪
通过窗口函数,找到路径的起始或者结束节点,然后进行一次裁剪
再次通过窗口函数,对每个会话的行为节点编号,进行一次深度上的裁剪
3 、最终返回给展示层的数据格式
这里有两种返回形式,一种是直接返回路径,然后业务层做计算,另一种是返回节点对之间的统计信息。可以根据业务需求自由选择
@Jim2Chen 用 4 层窗口函数实现了一个版本,但是查询性能感觉不是很好.. 4 个行为,13E 数据要 30s
手抖点错了,删掉删掉
123 天前
回复了 pppwww 创建的主题 职场话题 工作的难点是什么
@leimu012 什么公司,让兄弟们避避坑
123 天前
回复了 pppwww 创建的主题 职场话题 工作的难点是什么
@Duanpei 这个确实,领导还会觉得你很重要...
2023-11-13 10:37:33 +08:00
回复了 pppwww 创建的主题 Redis 想问下大佬 40M 的字符串适合放到 redis 缓存吗?
@night98 确实,现在就是考虑使用这种方案,用楼下大佬说的版本号来实现下
2023-11-13 10:35:47 +08:00
回复了 pppwww 创建的主题 Redis 想问下大佬 40M 的字符串适合放到 redis 缓存吗?
@Chad0000 嗯,目前看起来这种方法要更优一些,还是需要尽量减少访问 redis 的次数
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5662 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 21ms · UTC 06:04 · PVG 14:04 · LAX 22:04 · JFK 01:04
Developed with CodeLauncher
♥ Do have faith in what you're doing.