V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
wwolf
V2EX  ›  程序员

做一个小说网站, 预计后期日活( UV) 30W, V 友来讨论下如何架构比较好?

  •  
  •   wwolf · 2016-11-10 12:51:24 +08:00 · 12192 次点击
    这是一个创建于 2938 天前的主题,其中的信息可能已经有所发展或是发生改变。

    R.T.

    第 1 条附言  ·  2016-11-10 20:48:37 +08:00
    看了大家的意见,大部分都是全站静态化。
    有的一台服务器搞定的,你来给我搞吧

    -------------------------------------------------------------------------------------------------------------------------------

    日活 30W, 按照小说站来说, pv 至少上 300W 以上了。小说站一般都有自己的用户体系,支付体系再加评论回复,点赞等等一般的 web 网站所具备的功能都有,这不都是常识吗?竟然还有人跟我说直接放阿里 oss 的?你说实话阿里 si 不 si 你家开的?

    现在已经确定, 30W uv 是最少的了,按 2W 本书算,我们在论论架构的事呗
    73 条回复    2016-11-11 17:08:23 +08:00
    wwolf
        1
    wwolf  
    OP
       2016-11-10 13:09:54 +08:00
    20 分钟之前发布的,怎么列表页显示 4 小时 20 分钟前了。。
    qcloud
        2
    qcloud  
       2016-11-10 13:20:49 +08:00   ❤️ 1
    等到了日活( UV ) 30W 再说吧 - -
    yilin101
        3
    yilin101  
       2016-11-10 13:23:49 +08:00
    直接 lnmp 吧
    yilin101
        4
    yilin101  
       2016-11-10 13:24:43 +08:00
    不过 uv 30w 这么好做?
    akaayy
        5
    akaayy  
       2016-11-10 13:25:57 +08:00 via Android   ❤️ 2
    我预测 v 友的焦点会集中在 日活 30w ,而不是架构上
    wwolf
        6
    wwolf  
    OP
       2016-11-10 13:25:59 +08:00
    @qcloud 初期用户量不比这个少多少, 30W 是至少
    caomu
        7
    caomu  
       2016-11-10 13:27:28 +08:00 via Android
    小说?
    日活 30w ?
    做盗版还是正版?
    堆广告?
    waruqi
        8
    waruqi  
       2016-11-10 13:27:51 +08:00
    版权问题怎么解决?
    wwolf
        9
    wwolf  
    OP
       2016-11-10 13:29:57 +08:00
    有钱,版权问题不要担心,讨论主题重点。。。

    @waruqi
    @caomu
    idblife
        10
    idblife  
       2016-11-10 13:32:00 +08:00
    生成静态 html 文件,往 redis 里一放,全端加个 cdn , 30w uv 算个毛
    nine
        11
    nine  
       2016-11-10 13:32:08 +08:00
    代码写好,查询优化好,做好缓存就行了。 4 核 8G 轻松飞起。不放心再加个 CDN 。
    fuxkcsdn
        12
    fuxkcsdn  
       2016-11-10 13:35:14 +08:00 via iPhone
    你倒是先说你打算咋架构啊
    想起今天同事说的,他朋友公司的 nginx 配置了强制不缓存,然后问他为嘛服务器负载那么高,咋都不走 cdn 呢…😂
    humiaozuzu
        13
    humiaozuzu  
       2016-11-10 13:41:49 +08:00
    有钱就找 SA 啊
    suliuyes
        14
    suliuyes  
       2016-11-10 13:44:36 +08:00
    插句话,快 2017 年了做小说站都还能有这么大的量?厉害啊
    ipconfiger
        15
    ipconfiger  
       2016-11-10 13:52:56 +08:00
    这点日活还没有到需要研究架构的地步
    nicoljiang
        16
    nicoljiang  
       2016-11-10 14:04:58 +08:00
    千万级左右的 PV 还不至于要特别设计架构,普通的 lnmp 就可以了。何况你这还是浏览型网站,功能简单。
    另外既然内容版权不差钱,那服务器数量、 CDN 什么的应该也不是问题。
    再加上现在云服务这么多,分这么细~更没问题
    建议你多把精力放在业务逻辑的实现和交互、视觉的设计上。
    chuhemiao
        17
    chuhemiao  
       2016-11-10 14:17:11 +08:00
    都是文字,消耗很大? redis 加 cdn 还不能解决?
    falcon05
        18
    falcon05  
       2016-11-10 14:22:47 +08:00 via iPhone
    过早优化并不值得提倡
    janeyuan
        19
    janeyuan  
       2016-11-10 14:35:18 +08:00
    真心建议先把网站跑起来再说 。
    ihuotui
        20
    ihuotui  
       2016-11-10 14:44:17 +08:00
    都没有业务的网站,都是浏览,怕啥
    incesa
        21
    incesa  
       2016-11-10 14:47:13 +08:00
    突然发现 linux+nginx+mysql+python 也是 lnmp
    ZavierXu
        22
    ZavierXu  
       2016-11-10 14:53:45 +08:00
    @incesa 印象中这个 P 本来就能指代 PHP 、 Python 和 Perl
    lujiajing1126
        23
    lujiajing1126  
       2016-11-10 14:54:23 +08:00
    纯静态页。。。 30w 算什么。。。。
    onlyhot
        24
    onlyhot  
       2016-11-10 14:58:57 +08:00 via iPhone
    30 万随便弄弄就行了
    ohhe
        25
    ohhe  
       2016-11-10 15:02:59 +08:00
    30w 单机就行了。
    zhuoziyu
        26
    zhuoziyu  
       2016-11-10 15:03:16 +08:00
    想做一个追书 APP ,类似追书神器那样的
    目前完成了服务端,正在做测试。放在了腾讯云上, 1 核 1G 。
    数据演示: https://zhuishu.me
    前端渣,后台和用户等功能界面沿用了 http://golanghome.com 的开源版本
    本职 N 线小城镇从事其它行业,收入微薄
    所以服务端做成了一个完善的追书系统,希望能有些额外的收入
    当然,这里非站长聚集地,就不吹嘘功能了

    正在考虑要不要先做个微信小程序版本
    有同好的欢迎交流,微信: donkey
    lan894734188
        27
    lan894734188  
       2016-11-10 15:22:15 +08:00 via Android
    lnmpa+redis CDN 轻松上 100w uv
    xtorrent9527
        28
    xtorrent9527  
       2016-11-10 15:31:21 +08:00
    @zhuoziyu 自己做的吗?什么语言写的
    zhuoziyu
        29
    zhuoziyu  
       2016-11-10 15:36:08 +08:00
    @xtorrent9527 是的, golang
    9hills
        30
    9hills  
       2016-11-10 15:36:18 +08:00   ❤️ 1
    全站静态化,加 CDN
    其他动态内容(点击数、收藏、关注、书架 etc ),全部用 JS+API ,后端 Redis+MySQL 即可
    levon
        31
    levon  
       2016-11-10 15:44:20 +08:00
    楼主对流量这么有信心。不如跟俺合作, 30w unique view ,我保证每天给你 10000RMB
    我需要流量,转化率刚刚的。 http://www.pianyiniao.com
    cncqw
        32
    cncqw  
       2016-11-10 16:07:41 +08:00
    @levon 目测是赚佣金的 每天 30w uv 至少你能赚 30w 吧 你才给楼主 1w ?
    levon
        33
    levon  
       2016-11-10 16:10:05 +08:00
    @cncqw 你想多了
    KenGe
        34
    KenGe  
       2016-11-10 16:34:26 +08:00
    我是来搭车卖云 国内国外都有 欢迎咨询 QQ :( MjY3OTA1MTU=)
    w4462358
        35
    w4462358  
       2016-11-10 16:39:15 +08:00
    你这个问题提上来能指望有什么回复? 我觉得你应该自己先弄一套初稿出来,然后大家一起讨论慢慢改进,上来就让别人给你一个架构,你工资分我多少?
    zxy
        36
    zxy  
       2016-11-10 16:40:06 +08:00
    上这个配置可以扛住压力
    haopic
        37
    haopic  
       2016-11-10 16:40:53 +08:00
    30w 很大吗?
    tracymcladdy
        38
    tracymcladdy  
       2016-11-10 16:50:03 +08:00
    用户没有大量写操作,乞丐版 vps 都能玩转。。
    goodluck
        39
    goodluck  
       2016-11-10 16:54:54 +08:00
    打听一下,30W UV,CDN  每个月大概费用多少钱?预算一下。
    ykrl089
        40
    ykrl089  
       2016-11-10 16:58:15 +08:00
    用 golang 写,不用静态,并发都能做到快 1000 , 30w 真的是太简单了。
    billytom
        41
    billytom  
       2016-11-10 17:26:11 +08:00
    单机 lnmp + cdn 。搞定
    xshwy
        42
    xshwy  
       2016-11-10 17:27:55 +08:00 via iPhone   ❤️ 1
    都跑题了,练习楼主重新发个帖子「网站目前日活 30 万,访问太卡,体验不好,请问应该怎么架构一下?可以推翻重来。」
    kslr
        43
    kslr  
       2016-11-10 17:34:29 +08:00
    小说站都是静态的,跑个普通服务器+CDN 就够了,后期扩展也非常的简单简单,所以这个问题你不用考虑的太多。
    a3mao
        44
    a3mao  
       2016-11-10 17:36:50 +08:00
    根本无需架构,小说网站都是静态页面,随便搞个 CDN 足以
    firefox12
        45
    firefox12  
       2016-11-10 17:50:12 +08:00
    30w uv 每天赚 1 万?

    我能想到的就是做草榴 2 了。
    tumbzzc
        46
    tumbzzc  
       2016-11-10 17:55:52 +08:00
    不妨放出网址,让大家看看
    RangerWolf
        47
    RangerWolf  
       2016-11-10 18:00:31 +08:00
    @zhuoziyu 好像有 bug 。比如打开 https://zhuishu.me/read/g761bQO/YBz5 里面什么内容都没有~ 难道要先注册?
    NERvGear
        48
    NERvGear  
       2016-11-10 18:40:44 +08:00
    @RangerWolf 换源就好了。
    Joway
        49
    Joway  
       2016-11-10 18:45:14 +08:00
    是我直接丢静态 CDN 了 , 配置个缓存规则就行了
    Troevil
        50
    Troevil  
       2016-11-10 18:46:03 +08:00
    静态化,别无他法
    zhuoziyu
        51
    zhuoziyu  
       2016-11-10 18:47:31 +08:00
    @RangerWolf 应该是正文提取算法的问题,其它源可以,晚上我看下是算法问题还是被屏蔽了
    LancerEvo
        52
    LancerEvo  
       2016-11-10 18:50:52 +08:00
    倒不是鄙视日活 30w 太少 因为我的博客日活只有个位数 但是一秒钟十个请求的量级讨论什么架构。。。
    It's like trying to find the greatest ever solution to a problem that doesn't exist.
    sobigfish
        53
    sobigfish  
       2016-11-10 19:26:37 +08:00
    @RangerWolf 估计是没采集到 或者采集任务还没完成
    Dashit
        54
    Dashit  
       2016-11-10 19:38:53 +08:00
    @zhuoziyu 追书神器新版本屏蔽了盗版源 好不容易退回老版本😂 体验下你的这个.
    daiv
        55
    daiv  
       2016-11-10 19:40:47 +08:00
    @zhuoziyu https://zhuishu.me 设计不错呀,是 bootstrap 吧
    doublleft
        56
    doublleft  
       2016-11-10 19:50:56 +08:00
    纯静态 30w 甚至都不用服务器 直接存阿里云 oss 上
    ViYun
        57
    ViYun  
       2016-11-10 20:01:23 +08:00
    @caomu
    @firefox12
    @tumbzzc
    现在厉害的小说网站 UV 都能达到 50 来万
    譬如:
    笔趣阁 http://www.viyun.com/www.23wx.com
    23wx http://www.viyun.com/biquge.la
    每天广告费都好几千
    zhuoziyu
        58
    zhuoziyu  
       2016-11-10 20:15:21 +08:00
    @Dashit 我这只是演示一下数据,不一定长久哈。正准备做 APP
    zhuoziyu
        59
    zhuoziyu  
       2016-11-10 20:17:05 +08:00
    @daiv 是 bootstrap ,美工渣,哪来的设计啊,准备做的追书 APP ,也在为设计头疼
    qianlicao353
        60
    qianlicao353  
       2016-11-10 20:19:38 +08:00 via Android
    爬虫网站吧,哪来的原创和版权
    ericls
        61
    ericls  
       2016-11-10 20:22:02 +08:00 via iPhone
    我觉得系统的瓶颈在于搜索引 和 更新浏览量

    如果你需要统计最近 24 小时浏览量什么的 可以用 influxdb

    考虑横向扩展可以采用 jwt 的授权方式

    其他的还真想不到什么瓶颈
    wolfan
        62
    wolfan  
       2016-11-10 20:37:39 +08:00
    突然发现在大种花家同样是敲键盘的,码字的和码字母的人收入差距真的是很大吖。
    果然还是学好 English 搞海外媒社才是码字反超码字母的正确方式吖。
    fhefh
        63
    fhefh  
       2016-11-10 21:22:33 +08:00
    先 mark~~~
    boter
        64
    boter  
       2016-11-10 21:26:35 +08:00
    建议做好跑路准备 :)
    版权越来越严格
    搞电影的进去了好多人吧
    做小说的也快了
    realpg
        65
    realpg  
       2016-11-10 22:00:52 +08:00   ❤️ 1
    充分结合 CDN ,静态 /半静态,一组服务器可以搞定。
    而且我用的 LNMP+memcached ……那时候 redis 还没现在这么热
    wwolf
        66
    wwolf  
    OP
       2016-11-10 22:03:40 +08:00
    @realpg 目前我们想法一致
    realpg
        67
    realpg  
       2016-11-10 22:22:12 +08:00   ❤️ 3
    @wwolf
    我当年那个项目比你预期的日活和 PV 都要高
    当时架构可以给你参考一下 当时是放在自己机房

    LNMP 中 受限于 TCP 连接数、 TCP 连接开销,前面是四台 AMD 入门 PC 跑 nginx 反代后面的真实 webserver ,实际上直接用 webserver 顶在前面是没问题的,主要是总遇到采集器啥的,产生大量 time_wait 等 tcp 状态堵塞,所以前面我直接二手东组装了 4 台最便宜的 AMD CPU 的机器用来跑 nginx

    真实 webserver 两台双路 X5650 ,并不是单机不够跑,本质是想要一主一备防止服务器故障,既然开着同时有程序部署,就变成两个都在用了
    数据库服务器 32G 内存的 X5650 一台,分配 2GB RAM 给 memcached ,剩余充分优化的跑 MYSQL 。另有大量单位淘汰的七八年+机龄的破 PC 包含赛扬 1.7G 啥的统统丢到一个池子里跑全文搜索集群

    全站没生成静态(个人习惯特别不喜欢手动处理 html 文件),前面顶了带缓存的全站 cdn ,书内容页和目录页采用一个 url 只用一次不可编辑的模式,一旦出现编辑就作废原页面,这样全站内容类的压力都打在 CDN 上。我玩这个的时候, CDN 还比较落后,还没有现在满地跑的阿里云啥的,那些传统 CDN 服务商都不给太大缓存空间,隔三差五是要回源的,一个采集器扫过来瞬间爆豆的回源连接,这也是为啥前面顶着 CDN 我还用四个入口机分流的原因

    全站平时跑起来一天近千万 PV (包含被采集)都没啥压力,最大的压力还是在用户系统评论系统上,这些高实时的东西我都是不经过 CDN 直接去刷服务器的

    其实最大的好处,还是当时并没有泛滥的 DDOS 攻击,自己好好的维护站,只要能匹配设计容量就足够了
    zachlhb
        68
    zachlhb  
       2016-11-11 08:09:10 +08:00 via Android
    楼主哪来的自信?
    youxiachai
        69
    youxiachai  
       2016-11-11 09:09:33 +08:00
    厉害.....国内的正版网文..应该被起点和纵横垄断了吧...还能有新人进场?

    佩服
    chocotan
        70
    chocotan  
       2016-11-11 12:13:27 +08:00
    > 小说站一般都有自己的用户体系,支付体系再加评论回复,点赞

    很多小说站都没有你说的这些
    frittle
        71
    frittle  
       2016-11-11 12:14:49 +08:00
    @youxiachai 「现在已经确定, 30W uv 是最少的了,按 2W 本书算」一开始就预计 2W 本,你觉得能是原创么?不是盗版就是授权,真的有原创网站愿意授权转载吗?
    jiar
        72
    jiar  
       2016-11-11 12:54:40 +08:00
    一看这界面风格就知道是 bootstrap 。。。检查一看果然如此。个人感觉这个界面比较适合后台管理。
    firefox12
        73
    firefox12  
       2016-11-11 17:08:23 +08:00
    做这样的网站 是不是就是用爬虫 把别人的书 爬过来,整理好 放上去? 这个不怕别人一把爬掉吗? 这样的网站看的人多吗? 30w uv ? 那至少几万 ip 访问了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3880 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 34ms · UTC 00:14 · PVG 08:14 · LAX 16:14 · JFK 19:14
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.