比如有一些数据,我想拟合一个分布出来,得到分布的参数。
数据同时会因为用户数量的增长或者现有数据的变化而改变,但不需要每次都重新计算。我想设定一个阈值,当 x%的数据发生了改变就触发重新拟合计算,这个阈值的设定有什么理论可依吗?想到可以尝试不同取值看结果,或者统计每天改变的数据量取均值,有其他更好的方案吗?
数据同时会因为用户数量的增长或者现有数据的变化而改变,但不需要每次都重新计算。我想设定一个阈值,当 x%的数据发生了改变就触发重新拟合计算,这个阈值的设定有什么理论可依吗?想到可以尝试不同取值看结果,或者统计每天改变的数据量取均值,有其他更好的方案吗?