团队日志要存几年，怎么找一个便宜又能查的地方？

日志存储

SQL查询

成本控制

97 条回复 • 2025-08-24 14:28:34 +08:00

1

FlashEcho

59 天前

3

grafana 可视化+promtail 收集+loki 日志聚合+任意对象存储，k8s helm chart 一个 loki-stack 全搞定了，只要调调 yaml 配置，相当不折腾

2

c00WKmdje2wZLrSI

59 天前

阿里云或者腾讯云的日志服务?

3

phrack

59 天前

@chesha1 你这相当复杂了

4

Nitroethane

59 天前 via iPhone

试试阿里云 maxcompute ？内部叫 odps ，挺好用

5

nm1st

59 天前

2

duckdb+s3

6

Smileh

59 天前

买个 10T 硬盘

7

linhrdom

OP

59 天前

@c00WKmdje2wZLrSI 有点贵，1TB 一年 2700 左右。有点恐怖了

8

COW

59 天前 via Android

presto 非常吃内存的，而且也不太推荐用于块存储查询，要不看看 ck ？

9

linhrdom

OP

59 天前

@COW 感谢建议，避坑了

10

Maboroshii

59 天前

2

没有银弹... 最简单就是存文件，grep 查

11

bruce0

59 天前

我前几天刚搭了一套 ELK, filebeat 收集,logstash 分析处理,ES 存, kibana 展示. 除了 filebeat 都是 docker(podman) 跑的, 现在只收集程序运行 log.每天 2G 左右,保存 14 天,原始 log 永久保存(gov 规定的)

前几天想把玩家行为 log 也写入 ES,每天可能在 10G 左右,打算保存 1 年+, 算了一下,硬盘需求太大,还是用原来的吧(原来有一套程序+脚本能通过原始 log 文件查找分析玩家行为) 就没必要把行为 log 再写入 ES 了

12

vincentWdp

59 天前

aws Athena? 虽然成本也不低

13

Dragonish3600

59 天前 via iPhone

aws s3

14

pingdog

59 天前 via Android

买冷存储块，3 天后就放入冷库，要查在捞出来

15

DefoliationM

59 天前 via Android

quickwit+s3 ，完美符合你的要求，支持全文搜索。

16

ETiV

59 天前 via iPhone

https://github.com/openobserve/openobserve

🚀 10x easier, 🚀 140x lower storage cost, 🚀 high performance, 🚀 petabyte scale - Elasticsearch/Splunk/Datadog alternative for 🚀 (logs, metrics, traces).

OpenObserve (O2 for short) is a cloud-native observability platform built specifically for logs, metrics, traces, analytics, RUM (Real User Monitoring - Performance, Errors, Session Replay) designed to work at petabyte scale.

17

perfectlife

59 天前 via Android

云上直接用云平台的日志服务，想降低成本就设置把历史日志扔到归档存储里

18

BlueSpace4512

59 天前

4

我有一技：
你去 steam 上买个 wallpaper engine
然后使用 SteamCMD 命令行向 wallpaper engine 创意工坊上传作品，在这个作品里把你的日志文件加密丢进去，然后随便整个图片包装下上传，描述或者标题就写你的日志备份日期
一次传十几个 G 的文件没太大问题，还能免费用到 steam 的 CDN 下载服务
而且完全可以自动化进行，因为 steam 有 SteamCMD 功能可以命令行运行，可以部署在 linux 或者 docker 上

19

w568w

59 天前

看看 InfluxDB ？ https://www.influxdata.com/influxdb-pricing/

20

ETiV

59 天前 via iPhone

1

我也给我们项目写过

- 日志每天 gzip 上传到阿里云 oss 、AWS S3 这种地方，存储路径、文件名都有规律的
- 配置好归档冷存储策略
- 等需要搜索的时候，大批量开按量计费的虚拟机，然后用分布式、多进程、管道化的方式来 gunzip | grep 想要搜索的内容
* 机器都开在了同 region ，访问走内网域名，不会收取 egress 流量费
- 上面的工作是一个异步的任务，开跑了就可以挂着了
- 跑完会给企业微信群里发条消息，说最终 grep 匹配出来的结果放在了什么路径下。然后把跑任务的机器自动关机。

21

lscho

59 天前

4

便宜
不折腾
能直接用（ SQL 能直接捞出来）

以上不可能三角

22

JungleZZ

59 天前

@sjbsjb233 笋都让你夺完了...hhh

23

wupher

59 天前

- 常用查询放 ELK ，一般双周或一月，视各项目重要情况。

- 归档日志存放于 Hadoop ，通过 API 进行检索。

24

defunct9

59 天前

1

@ETiV 你这一股子的咖喱味，能行吗

25

ITisCool

59 天前

@sjbsjb233 #18 你说得这么详细，想必是正在这么干

26

zed1018

59 天前

@phrack 实际上一点也不，除了 s3 配置一下，剩下就是 replica 的设置搞一搞绝大部分用 helm values 的默认值就完事了

27

slowman

59 天前

1

每天上传几十 GB 日志,会不会被认定跑 PCDN 被限速?

28

512357301

59 天前 via Android

用 duckdb 转成 parquet ，然后随便放哪里(本地或者 s3 ，甚至 http 文件服务器也行)，用 duckdb 读取，速度也很快。

29

512357301

59 天前 via Android

每天啊，那这量不算小，一般建议数仓了，可以先用 duckdb 试试，不行就上 ck 数仓

30

dji38838c

59 天前

2

如果一年几万块，不值得出
那么大概率这数据也不值得放

31

marquina

59 天前 via iPhone

@dji38838c #30 +1 ，用价格竞争最充分的对象存储来算，每月几十 g 的数据一年下来也得 5 位数了。如果这钱都不想出那说明这数据没那么值钱。

32

billccn

59 天前

以前 AWS S3 还支持直接运行 SQL-like 查询呢： https://docs.aws.amazon.com/AmazonS3/latest/userguide/selecting-content-from-objects.html

当然这种好事已经结束了

33

guo4224

59 天前 via iPhone

找个大善人给你出钱出精力维护

34

xuanbg

59 天前

日志留够 1 年是你想多了，除非用于数据恢复。查问题的话，7 天足够了。一般也就 24 小时内的问题要查。

35

bk201

59 天前

自己买 nas 存储设备存储最便宜。

36

ExplodingDragon

59 天前

一楼的方案算是比较好的了，prometheus 也可以顺便用 grafana ，只不过每天落几十 GB 日志有点难崩，假如 30G/d, 一年就是 10T + 了

37

jnliyan1

59 天前

啥问题需要一年后查..

38

kzfile

59 天前

既要低成本又要方便查询，我感觉需要建多层缓存

39

opengps

59 天前

其实一块大容量的移动硬盘已经足够靠谱了

40

spritecn

59 天前

年? 没审计需求的话,到月就可以了吧,我只存 10 天,方案是 OpenObserve 走 s3

41

spritecn

59 天前

OpenObserve 存储也是 parquet

42

yudoo

58 天前

ilogtail+clickhouse 最简单的单节点就行压缩比 es 高 7 倍，硬盘 1T 差不多了

43

guanyujia5444

58 天前

对象存储+分层存储，要不就降低保留时间，再便宜的方案可能可用性就受影响了

44

i8086

58 天前

频繁查询都是 15 天内的，我这里 3 个月前的日志很少要查，平均下来 1 年查不到 2 次，那时候把日志导出为文本，直接用 winrar + 大字典压缩归档了，超级省空间，10G 日志压缩完不到 1G 。

完善后续恢复导入流程就可以了。

45

i8086

58 天前

按月归档。

46

TaiShang

58 天前

victorialog

47

tomatocici2333

58 天前

百度云自动备份就行了就一个会员钱

48

Goooooos

58 天前

日志我们最多只存 30 天

49

RedisMasterNode

58 天前

一年 2700 的成本都不愿意..吗这不对吧

50

dode

58 天前

试试 clickhouse ，带压缩功能

51

evan1

PRO

58 天前

@RedisMasterNode #49 这是 1t 的价格。op 一天就产生几十 g 的日志。一年下来也要几万块钱了。

52

RedisMasterNode

58 天前

@evan1 按 30G 一年只有 10T 左右，现在日志存储压缩率极高，轻松可以有 10x 以上的压缩率把存储开销保持在 2T 内。

See: https://victoriametrics.com/products/victorialogs/

53

joyoyao

58 天前

clickhouse 上手简单。支持到期日志自动删除，压缩算法也给力。也支持 sql 。搞个大一点的机械硬盘就行了。

54

guxingke

58 天前

doris ，MySQL 协议兼容，支持分层存储(冷数据丢到 OSS)

55

duanxianze

58 天前

买两块硬盘不就好了，互为备份就行了，五年内还是稳的

56

fengfisher3

58 天前

日志最好能留够 1 年。
偶尔要查问题，用 SQL 能直接捞出来就行。
不想自己搭 ES/数仓，成本太高、维护也麻烦
-------------------------------------------------------
大量长时间存储，还要方便能直接使用，又不想麻烦的，真的如 @lscho 所说，不可能三角。
每天几十 GB 日志，这个量，光存储的钱都不少，还不想麻烦，真的不可能，换方案吧。

57

luzihang

58 天前

年初遇到个需求，金融机构上面来检查，按照订单号，要查 5 年内的日志：请求和响应 2 条。后面写个脚本，读按照日期归类的日志压缩文件。

58

salmon5

58 天前

@duanxianze #53 的方案可以了，买 2 块大硬盘足够了

59

laminux29

58 天前

你既要方便地能直接 SQL 查询，又懒得搭建和维护。

这边建议您花钱找人帮您搭建。

60

spritecn

58 天前

1

@w568w influxDB 新版本也是走 parquet 存储的,但现在开源版本还没有 s3 可以用

61

la2la

58 天前

假设 1 天 100 GB 数据，1 年大概 36.6 TB 左右的数据
这点数据可以考虑一下云厂商的 OSS 服务，在加上冷热模式，用不了几个钱。
不过你要支持可查，那么用数据湖格式，存储落到 OSS 上，使用 Doris 或者 Spark 挂个外表就能查了。

62

spritecn

58 天前

@joyoyao #53 clickhouse 需要机器好,机器不好可能会一条 sql 拉挂掉,太吃 cpu 了

63

JoeDH

58 天前

一年有没有必要？如果接受不了云服务的价钱，那还是自己买存储搭一套吧

64

Moatkon

58 天前

找一个压缩算法，规划好分片维度。后面业务如果需要找到指定分片解压

65

zhangxiangperson

58 天前

1

如果不想自己拼组件，可以考虑全托管的湖仓，（对象存储 + 表格式 + SQL 引擎一体化）。例如把日志直接落到云器 Lakehouse ，一年存储免费的 “资源包”，1TB 存储免费，存储+SQL 即席查询的诉求能一次到位：
https://www.yunqi.tech/product/one-year-package

66

linhrdom

OP

58 天前

@vincentWdp AWS Athena 我简单算了一下，可能要 4000 多美金，更恐怖了。

67

linhrdom

OP

58 天前

@DefoliationM 可以，但不是 SQL

68

linhrdom