V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
moshoujingli
V2EX  ›  程序员

有从短文本中提取时间信息相关的技术么

  •  
  •   moshoujingli · 2015-02-21 15:30:09 +08:00 · 3882 次点击
    这是一个创建于 3357 天前的主题,其中的信息可能已经有所发展或是发生改变。

    请问从短文本(50字以内)提取时间信息这种需求
    有现成的解决方案吗?有可以参考的论文吗?这算不算是某种从A提取B的特殊情况,已经有了通用性的算法了呢?应该怎么下手搜集资料呢,,,除了硬匹配关键词,完全没有头绪。

    12 条回复    2016-11-21 11:49:34 +08:00
    Wyatts
        1
    Wyatts  
       2015-02-21 16:55:02 +08:00
    有一个叫做正则表达式的神奇的东西
    日期(年-月-日) (\d{4}|\d{2})-((1[0-2])|(0?[1-9]))-(([12][0-9])|(3[01])|(0?[1-9]))
    日期(月/日/年) ((1[0-2])|(0?[1-9]))/(([12][0-9])|(3[01])|(0?[1-9]))/(\d{4}|\d{2})
    时间(小时:分钟, 24小时制) ((1|0?)[0-9]|2[0-3]):([0-5][0-9])
    xenme
        2
    xenme  
       2015-02-21 17:22:48 +08:00 via iPhone
    @Wyatts 估计问的不是这种简单的。
    1. 上周五怎么怎么怎么了
    2. 入冬第一天
    3. 上届冬奥会的时候
    太多了
    fatea
        3
    fatea  
       2015-02-21 17:25:49 +08:00
    @xenme 是想要自然语言处理吧?
    shoumu
        5
    shoumu  
       2015-02-21 18:17:59 +08:00
    主要是基于规则的
    temporal expression
    moshoujingli
        6
    moshoujingli  
    OP
       2015-02-21 19:19:23 +08:00 via iPhone
    @xenme 嗯,就是这个意思,提取明显指代了时间的短语…
    kofj
        7
    kofj  
       2015-02-21 19:35:45 +08:00 via iPhone
    NLG
    kofj
        8
    kofj  
       2015-02-21 19:36:58 +08:00 via iPhone
    @kofj 手滑了,NLP
    arachide
        9
    arachide  
       2015-02-21 20:44:06 +08:00
    提取时间的不知道
    提取摘要的一个小孩做的summply
    雅虎几千万收购了
    moshoujingli
        10
    moshoujingli  
    OP
       2015-02-21 20:52:06 +08:00 via iPhone
    @akfish 感觉上就是这个!谢谢!
    moshoujingli
        11
    moshoujingli  
    OP
       2015-02-21 20:53:40 +08:00 via iPhone
    @arachide 小孩…
    ljdawn
        12
    ljdawn  
       2016-11-21 11:49:34 +08:00
    @arachide 摘要很来就很难做呀。。。 几千万很正常。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   801 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 22:01 · PVG 06:01 · LAX 15:01 · JFK 18:01
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.