我写了个站, 去天涯抓数据, 昨天 100多万的数据, 系统响应不错, 今天数据量 到达了 200多W, 系统反应极其慢....
我查了一下, 主要是这种sql非常慢 (posts 表 数据量 2468234 )
SELECT `posts`.* FROM `posts` WHERE (`posts`.topic_id = 11036) ORDER BY id ASC LIMIT 20 OFFSET 1082340;
20 rows in set (34.13 sec)
`posts`.topic_id 上有索引,
更要命的是, 要是想抓的话, 每天我都能加 100w 的数据, 这样的话 即使 把现在的innodb 换成 myisam引擎估计也没啥效果, 同时又不想分表(用的是rails, 就是图个省事儿),
求一解决方案, 或者其他办法
我想先换成 mongodb ? 不知可行否 ?(没玩过大数据量数据库, 还请同学们帮忙 :) )
对了 机器是在linode 上的vps , 1G 内存....
我查了一下, 主要是这种sql非常慢 (posts 表 数据量 2468234 )
SELECT `posts`.* FROM `posts` WHERE (`posts`.topic_id = 11036) ORDER BY id ASC LIMIT 20 OFFSET 1082340;
20 rows in set (34.13 sec)
`posts`.topic_id 上有索引,
更要命的是, 要是想抓的话, 每天我都能加 100w 的数据, 这样的话 即使 把现在的innodb 换成 myisam引擎估计也没啥效果, 同时又不想分表(用的是rails, 就是图个省事儿),
求一解决方案, 或者其他办法
我想先换成 mongodb ? 不知可行否 ?(没玩过大数据量数据库, 还请同学们帮忙 :) )
对了 机器是在linode 上的vps , 1G 内存....