V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
shuyun008
V2EX  ›  2018

GitHub 十周岁 HanLP 自然语言处理包用户量超越 CoreNLP

  •  
  •   shuyun008 · 2018-10-10 17:27:11 +08:00 · 1036 次点击
    这是一个创建于 2264 天前的主题,其中的信息可能已经有所发展或是发生改变。

    GitHub 十周岁 HanLP 自然语言处理包用户量超越 CoreNLP

    在本周,GitHub 终于度过了属于它自己的十周岁生日。这个在 2008 年由 3 个来自旧金山的年轻人创建的基于 Git 的代码托管网站,先后超越了元老级的 SourceForge 和背景强大的 Google Code,成为了全世界范围内最受欢迎的代码托管网站。

    “十年前的今天,GitHub 正式上线。最一开始,我们只有一个特别简单的目标:链接所有的开发者,让他们用 Git 更轻松地进行项目协作。”联合创始人 Chris Wanstrath 在博客里写道,“十年过去了,我们作为公司,作为平台都有了很大的变化,但 GitHub 存在的意义从未改变。” 截至到去年 5 月底,GitHub 完成了第 1 亿个 PR 合并请求命令。截至今天,GitHub 上已经能够拥有超过 8000 万个 repo,活跃用户达到 2700 万人,超过 150 万家公司和机构进驻。大快搜索的 HanLp 自然语言处理开源项目同样进驻了 GitHub。 GitHub 团队作为对十周年的纪念和庆祝,并没有像大多数公司一样选择回顾公司的发展历史,而是整理了一份过去十年的几大里程碑事件。这份光荣,不止属于平台自己,更是属于那些为了让这个世界变得更好,通过 Git、GitHub、用 JS、Python 和各种语言共享代码的人们。 在 GitHub 十周年之际,大快搜索 AI 研究小组的,自然语言处理专家 Hancks 所主持的 HanLP 开源项目,全球用户量首次超过了斯坦福大学的 CoreNLP,以及老牌的自然语言处理开包 Ansj,成为全球范围内最受开发人员喜爱的自然语言处理技术。

    自 2014 年首次发布,通过 3 年的不断迭代,HanLP 的分词准确性和分词速率得到了极大的提升。据阿里杨尚川的一份测评报告显示,HanLP 的分次准确率在全球排名第三,分词速度在全球排名第一。卓越的性能自然带来了大量的使用者。终于,在太平洋时间 10 月 25 日,GitHub 上 HanLP 的用户量超过 Stanford-CoreNLP。

    自然语言处理是人工智能的一个重要分支,HanLP 的用户量证明了国产技术的高性能与可靠性,也再一次证明了大快搜索用心做技术、专注于大数据与人工智能基础软件的决心。大快今后也将开发出更多组件用于建设大数据与人工智能生态,绘出人工智能与大数据的中国智慧。

    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2488 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 02:46 · PVG 10:46 · LAX 18:46 · JFK 21:46
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.