V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
jianxun
V2EX  ›  互联网

快速崛起的直播平台背后,大数据做得怎么样?

  •  
  •   jianxun · 2016-08-22 11:15:13 +08:00 · 4624 次点击
    这是一个创建于 3021 天前的主题,其中的信息可能已经有所发展或是发生改变。

    上周一,来自武汉的直播平台斗鱼 TV 融钱了:腾讯和凤凰资本领投的 15 亿人民币,距其上次得到腾讯领投的 1 亿美元不到半年。如果考虑到起 2015 年下半年的资本寒冬还远未结束,斗鱼的姿态实在有种烈马嘶吼,逆势而动的态势。

    但与直播现在还处于灰色地带的姿态,更感兴趣的是他们的大数据。毕竟,撇除数据造假的成分,这依然是一个流量快速爆发的行业。如同投资人愿意对优步和滴滴烧钱,想要的绝不止是出行市场。对直播其实也一样,烧钱烧得又快又多,资本想要的其实是大数据流量带来的娱乐商业版图。

    吴瑞诚曾在今年 3 月简寻主办的武汉开发者峰会上有过演讲,主题是他从十万用户量级开始,搭建斗鱼的大数据平台的经验和一些坑,纯技术干货,有兴趣的同学可以点链接查看收藏,吴瑞诚:斗鱼实时计算平台的演进)。

    一个典型的斗鱼直播间

    一:高峰时接近淘宝 80% 的用户量

    最开始对斗鱼的数据团队感兴趣,是因为吴瑞诚在今年 3 月参加简寻主办的武汉首届开发者峰会时,透露过一组数据:

    这些数字是什么概念?就是高峰时段,其访问人数已经接淘宝网站高峰时段的 80%。(据说,如今已经又上涨了超过 10%)

    而这些数据全都是从 2014 年至今,短短两年的时间里快速增长积累起来的。心里疑问是,斗鱼背后有一个怎样的数据团队,海量的数据如何处理,这些数据会指引斗鱼走向何方?

    事实是, 2014 年 8 月入职的吴瑞诚是斗鱼数据平台部的第一个人,整个团队的情况是:

    • 整体近 30 人
    • 年龄区间在 21 到 30 岁
    • 其中三成来自北上广等一线城市的回流

    吴瑞诚自己加入斗鱼前,曾在杭州阿里巴巴做大数据开发,具体负责的部分是淘宝历史订单和旺旺聊天记录,每天产生的数据量同样以 PB 级别论。

    但作为阿里巴巴大数据几千人团队中的一员,吴瑞诚的工作内容限于底层,负责存储和提供接口,流程非常单一。他能想起来的跟自己的工作直接相关的最典型场景就是「和各个业务团队对接口」,比如出现业务纠纷时提供阿里旺旺聊天记录。

    吴瑞诚谈到刚入职斗鱼时,「老板当时就对大数据有很大想法」。当时的大数据还没炽手可热到现在这样,连路边卖煎饼的都能跟你大扯一通大数据,在直播行业的应用也几乎还是一片空白。吴瑞诚是因为自己在淘宝,见识了其十多年的大数据商业化经验,因此看好大数据和直播的结合。

    二:个性推荐的开端

    经过从 0 开始搭建,斗鱼现在已经有比较清晰的大数据架构了,主要有数据汇集、处理、展现、挖掘等方面。这些积累的数据显然对斗鱼的未来有重要的战略意义。

    除了以数据统计的方式为公司整体发展提供参考以外,个性推荐会是斗鱼积累的大数据在未来的最大用武之地。

    2014 年上线以来,斗鱼搅动行业春水,令同行和用户侧目的,一直是新锐凶悍的运营手法,包括重金邀请英雄联盟高水平玩家更名为“斗鱼 tv+某某”,使得英雄联盟的排行榜前列便铺满了斗鱼二字,迅速将平台在线人数从十万级别拉升到百万级别。

    但也许直播深度用户都很少注意的是,从 2014 年,斗鱼就开始尝试做精细化运营,到现在,开始通过各种应用服务于用户。

    通常来说,在直播领域,一个基本判断是, 10% 的头部主播会吸纳平台 90% 的用户流量,这是各直播平台对挖主播大战的根源,也被认为在未来很长时间都不会发生变化。

    但正如斗鱼的竞争对手,熊猫 TV 的投资人王思聪判断的,「钱能解决的问题就不是问题」

    那对直播来说,什么问题是真问题?内容,当然也包括主播,是当前最重要的问题,但某种程度上,内容和主播其实也是钱能解决的问题。

    因此,我的一个判断是,在未来,高度个性化精准贴合用户的娱乐场景,将会成为钱也不能解决的真问题和真壁垒,因为这需要的是足够大量且清晰的数据积累,优秀的算法架构,进而长期形成高度智能化的推荐机制。

    三:直播行业的大数据想象空间

    这一判断来自整个直播行业的泛娱乐演进趋势。而泛娱乐也是斗鱼早就希望从细分领域和灰色地带走出来占领的更广阔地盘。新一轮融资后,扩宽泛娱乐的边界正在成为斗鱼在未来的重要战略方向和希望树立的壁垒。

    根据吴瑞诚提供的数据,在斗鱼目前的千万级别的用户中,有很大比例用户每天在斗鱼的观看时长会超过 2 个小时以上。

    可以佐证这一说法的是,简寻的运营同学曾小样本调查过一些直播用户,对这些这些年龄集中在 20 到 30 岁的男性大学生或白领来说,直播正在成为电视机一样的存在,无聊时就开着,没有明确的娱乐目的,而是作为背景音和宅居暖场器。

    这可能超出了大多数非深度用户对直播的印象,因为大多数人对直播的印象要么是游戏和色情,要么是「不知道为什么会有人看直播,跟风吧?」

    斗鱼的主播在直播乞讨

    但事实可能是,对一些真实用户来说,直播的使用场景已经深度融入各种生活场景,这也显示了这个群体对视频的需求不再仅仅是娱乐和观看,而是陪伴和社交——人们在宅居的空荡荡的房子里,参与主播制造的事件,和其它观众交流。

    这和各平台邀请明星大腕带来上千万的现象级流量截然不同,明星本身不可能长期关联在直播平台上,其带来的流量更偏向热点效应。而真正沉淀下来的,将会是上述对直播产生陪伴和社交需求的深度用户,并通过陪伴和社交进而满足这些人的其它娱乐需求。

    与此同时,老一代人因为娱乐匮乏,即使娱乐节目千人一面,依然趋之若鹜,但对成长在互联网和娱乐信息过剩的年轻一代来说,尤其是对斗鱼借风势收割起来的移动用户来说,需要的是更个性化更丰富更细分的内容满足。

    斗鱼埋头试和做的基础是什么?隐藏在数据中的魔鬼可能比个人判断远更丰富直接。一个被经典引用的案例是,「喜鹊搭窝」这类深度无聊事件会受到意外追捧,引入大量流量。

    喜鹊搭窝的场景和弹幕

    目前,只要在斗鱼网站和移动端 APP 上观看直播,斗鱼会根据用户偏好推荐相应的主播。而未来,吴瑞诚说,斗鱼的目标是在个性推荐上不断积累和优化,做到属于每个用户自己的斗鱼直播,以大数据的形式驱动和支撑起斗鱼的泛娱乐未来。

    虽然到目前为止,还鲜有人关注大数据对直播行业的大盘影响,但那只是行业发展阶段、数据和技术的积累都还处于早期混战的原因。就像今日头条出现之前,少有人预见到数据对新闻行业的搅动。大数据对直播行业的格局影响也会慢慢开始的。

    ——————————————————————————————————————————————————————

    ps :斗鱼也是简寻服务的优( tu )秀( hao )的公司,各个技术岗位都很缺人,感兴趣的同学可以点(简寻官网链接)关注 or 通过微信公众号联系简寻的业务同学(公号 id : jianxun-fuwu )

    pps :在起于 2015 年下半年,延续得格外漫长的资本寒冬里,裁员正在成为互联网创业领域最沉重的头部主题,科技媒体 36 氪在一篇裁员主题的文章中统计,百度搜索裁员的新闻条目, 38 页新闻里,其中 30 页发生在 2016 年。毫无疑问,互联网创业公司为这 30 页贡献了很大比重。

    据(常常不靠谱的) 媒体预测,这一轮资本寒冬也许要延续到 2017 年,甚至 2018 年。所以,资本寒冬看起来毫无短期内结束的迹象,但优秀的公司永远缺人,充满想象的前沿领域对愿意挑战的高端人才需求也永远处于饥渴状态。

    在约斗鱼数据平台部负责人吴瑞诚聊一聊的时候,他的第一需求是「能帮我们招到人吗?」感想就是,为了招人,套路也是深 TAT

    Magic347
        1
    Magic347  
       2016-08-22 11:24:06 +08:00
    体量确实看起来是够了(如果文中提供的数字属实),看起来是时候扩展大数据团队了。
    jianxun
        2
    jianxun  
    OP
       2016-08-22 14:30:50 +08:00
    @Magic347 水分这个不太好估计,但流量在爆发增长是肯定的
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2777 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 02:14 · PVG 10:14 · LAX 18:14 · JFK 21:14
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.