rt,小弟目前要做一个基于 starRocks 的路径分析功能,参考火山引擎/神策数据,但是这两个平台没有展示 sql ,小弟感觉有点难以下手。
目前的思路是: 1 、首先要做到会话识别,通过窗口函数等操作将数据划分为一个个的会话 2 、从这个会话上识别出路径,然后 group by 统计信息等
上面的思路目前还是很模糊,有木有搞过的大佬分享下经验,万分感谢
1
pppwww OP 手抖点错了,删掉删掉
|
![]() |
2
Jim2Chen 41 天前
有思路了没?学习一下
|
5
pppwww OP @Jim2Chen 有空了写个文章分享下,目前整理的方案和公司的数据结合的比较多,不方便直接发,主要步骤就是:
1 、如何识别会话 通过窗口函数,计算相邻两次行为的时间间隔,按照规定的 sessionPeriod 切割会话 2 、识别会话后,如何实现路径的裁剪 通过窗口函数,找到路径的起始或者结束节点,然后进行一次裁剪 再次通过窗口函数,对每个会话的行为节点编号,进行一次深度上的裁剪 3 、最终返回给展示层的数据格式 这里有两种返回形式,一种是直接返回路径,然后业务层做计算,另一种是返回节点对之间的统计信息。可以根据业务需求自由选择 |
6
superliy 22 天前
StarRocks 好用吗
|