V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
bigtang
V2EX  ›  分享创造

大数据起名字: 1300 万人名数据库, 2600 万公司品牌名数据库帮你取名字,可大致预估全国同名人数

  •  
  •   bigtang · 278 天前 · 1900 次点击
    这是一个创建于 278 天前的主题,其中的信息可能已经有所发展或是发生改变。
    想做一个不被 chatgpt 替代的服务很难了。

    拿到一份数据,去掉手机,邮箱等敏感信息,把人名部分拿出来做起名服务。

    预估全国同名人数肯定不如国家的准确,很基本概率还是能反映的。

    网站: www.tanglib.com
    第 1 条附言  ·  261 天前
    人名库增加 2400 万人名,新增所有上市公司 2007-2022 年报文本,MDA 管理层讨论与分析,CSR 社会责任报告。
    12 条回复    2023-08-18 20:24:08 +08:00
    just4id
        1
    just4id  
       278 天前 via iPhone   ❤️ 1
    犬数据(比“大”数据多一点的意思)
    linksNoFound
        2
    linksNoFound  
       278 天前
    比较好奇这点,大约 1300G 的内容,ES 吃多少内存?
    yafoo
        3
    yafoo  
       277 天前 via Android
    收藏了
    zoharSoul
        4
    zoharSoul  
       277 天前
    哪来的数据?
    947
        5
    947  
       277 天前
    很棒,收藏了
    bigtang
        6
    bigtang  
    OP
       277 天前
    #2 @linksNoFound 自研的搜索引擎,ES 做不到的
    piaochen0
        7
    piaochen0  
       276 天前
    这个网站的 logo...换个吧...
    simo
        8
    simo  
       276 天前
    检索速度很快啊
    tyzandhr
        9
    tyzandhr  
       276 天前 via Android
    @just4id 太数据……
    someonedeng
        10
    someonedeng  
       275 天前
    速度不错
    bigtang
        11
    bigtang  
    OP
       275 天前
    @tyzandhr
    @just4id 多大才算大数据?
    FcukYouTony
        12
    FcukYouTony  
       253 天前
    支持, 起名就靠你了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2967 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 12:56 · PVG 20:56 · LAX 05:56 · JFK 08:56
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.