V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
n3r0
V2EX  ›  分享创造

[小论文神器] 基于 30w 文献数据的论文自动生成工具,设置主题、文风与字数即可,段落可无限更新

  •  1
     
  •   n3r0 · 2020-02-06 21:34:20 +08:00 · 8671 次点击
    这是一个创建于 1755 天前的主题,其中的信息可能已经有所发展或是发生改变。

    迭代了一个多月,目前对常见类目的文章生成效果较好。对大量数据进行了一些简单的机器学习和过滤,主要是通过题目和关键词来匹配段落。

    使用非常简单,设定参数三步生成,然后针对段落进行调整到满意为止。

    设定参数 图 1:设定参数

    调整段落 图 2:调整段落(底下一排圆形按钮为 切换,更新,增减当前段落)

    一些特性:

    • 自适应移动&桌面端
    • 夜间模式切换
    • 生成文章几乎无重复
    • 高级版无限精确关键词
    • 标准格式 doc 文档下载

    欢迎使用!

    连接:小论文神器

    推荐给各位的同时,也想探讨一个问题:论文的自动生成可以走什么样的思路?是否可以把文章结构抽出来,只要给予核心的思想,就能生成格式和内容上都可行的文章。有些人或许有想法,但不擅于写文章。后面我想逐渐向这方面靠拢,毕竟以目前的方法,优化再好也只能是个参考。

    Thx

    26 条回复    2020-02-12 02:13:54 +08:00
    easylee
        1
    easylee  
       2020-02-06 21:57:21 +08:00
    n3r0
        2
    n3r0  
    OP
       2020-02-06 22:04:06 +08:00   ❤️ 1
    @easylee 这种情况,一般是某些关键词匹配到的数据没有优化好🤦‍♂️可以重新生成试试,或者替换相关段落。

    数据量太大,过滤了好多遍还是有漏网之鱼,头痛啊。
    sevenQu
        3
    sevenQu  
       2020-02-07 11:47:07 +08:00   ❤️ 1
    太狠了,我收藏了,其实我觉得可以换一个思路,不一定要直接生成全文。按更细的粒度需求生成文章的某个段落,我觉得就挺好,省的自己去想这段套话怎么写,哈哈
    cxsz
        4
    cxsz  
       2020-02-07 11:52:11 +08:00   ❤️ 1
    挺好玩的,支持一下
    n3r0
        5
    n3r0  
    OP
       2020-02-07 13:21:10 +08:00
    @sevenQu 有道理,目前整篇文章就是按段落为单位生成的,只是还没有具体做一些区分,后面应该可以把正文再分成几个部分,然后按套路生成😁
    mosbic
        6
    mosbic  
       2020-02-08 16:59:36 +08:00
    可以开始编了(^-^)V
    hhxiaolei
        7
    hhxiaolei  
       2020-02-08 18:39:22 +08:00
    能否开放 api?
    n3r0
        8
    n3r0  
    OP
       2020-02-08 20:20:11 +08:00
    @hhxiaolei 目前还不行,一是考虑到自己服务器可能支撑不了,二是目前的数据整理的太乱🤣放出去有点丢人,还在进一步的优化当中。日后如果效果比较稳定了,可以开放一些高级接口,直接获取相关的段落。
    n3r0
        9
    n3r0  
    OP
       2020-02-08 20:21:21 +08:00
    @mosbic 会努力让它编的越来越好😝
    hhxiaolei
        10
    hhxiaolei  
       2020-02-08 20:55:39 +08:00
    @n3r0 怎么联系您
    n3r0
        11
    n3r0  
    OP
       2020-02-08 21:57:44 +08:00
    @hhxiaolei 网站的菜单,关于作者,里面有工作邮箱。抱歉不想留在公共场合,容易被爬虫广告邮件骚扰🤣
    luo7
        12
    luo7  
       2020-02-09 02:37:06 +08:00   ❤️ 1
    我的天啊这真的是神器
    Dreax
        13
    Dreax  
       2020-02-09 04:51:08 +08:00
    tql
    dick20cm
        14
    dick20cm  
       2020-02-09 22:04:03 +08:00   ❤️ 1
    楼主挺厉害的,我记得几年前听说亚研院有做过类似工作,但可能因为各种原因并没有变成真正的产品
    n3r0
        15
    n3r0  
    OP
       2020-02-10 09:29:10 +08:00
    @dick20cm 之前我只查到过 MIT 有做过英文假论文的生成,这个倒是不清楚,回去了解一下,感谢😁
    我觉得对真正的产品考验最大的,应该还是通用性,单一类目的生成还是比较容易的。
    tfdetang
        16
    tfdetang  
       2020-02-10 10:41:53 +08:00
    楼主可以说下思路吗? 是基于 gpt-2 训练的吗?
    n3r0
        17
    n3r0  
    OP
       2020-02-10 13:09:20 +08:00
    @tfdetang 不是。目前的效果还不够理想,等优化的差不多了可以放出来交流一下🤦‍♀️
    现在只能说是,“人工”的部分还大于“智能”🤣
    tfdetang
        18
    tfdetang  
       2020-02-10 16:09:14 +08:00   ❤️ 1
    @n3r0 好的啊,到时可以交流下。 其实 NLP 的东西,都是先人工再智能的。 一上来就智能的除非 PPT
    cainiuwow
        19
    cainiuwow  
       2020-02-10 22:14:13 +08:00 via Android   ❤️ 1
    哈哈,挺有意思的,刚试了一下,根据手里的诉讼案件,整理了几个关键词,然后生成论文,节省了一部分找资料的时间。
    粗略看了一下,有些内容还是可以直接作为论述观点的。nice~
    n3r0
        20
    n3r0  
    OP
       2020-02-11 09:40:36 +08:00
    @cainiuwow 能帮上忙就太好了😁一度因为它直接生成的效果不稳定打算放弃,后面还是加了个段落替换功能,感觉做个参考还可以。现在每天小几百人访问,也挺有成就感的,哈哈。
    337136897
        21
    337136897  
       2020-02-11 10:11:57 +08:00   ❤️ 1
    楼主你为什么不早个好几年开发出这玩意
    cainiuwow
        22
    cainiuwow  
       2020-02-11 14:57:06 +08:00 via Android   ❤️ 1
    @n3r0 哈哈,楼主要加油啊,如果建立群的话记叫我。这个虽然暂时不能直接作为论文使用,但是参考意义是很大的,能给很多的思路和想法。还有 3000 字有点少,如果能多一点就好了。
    n3r0
        23
    n3r0  
    OP
       2020-02-11 20:29:17 +08:00
    @cainiuwow 哈哈哈谢谢,字数限制主要是为了用户体验,理论上几万字都没问题,但是目前的生成速度太慢了。
    等后期再优化的好一点,会考虑哒😁
    clemente0620
        24
    clemente0620  
       2020-02-11 21:07:53 +08:00
    挺好玩的 但是有些生成的论文会牛嘴不对马尾? 想知道是用的 AI 神经网络做的算法吗?还是单纯的标题+关键词关联
    n3r0
        25
    n3r0  
    OP
       2020-02-11 22:33:49 +08:00
    @clemente0620 数据的前期处理用了机器学习,文章生成是直接按照类目+关联度的算法从数据库取的内容,没有 AI,不然计算量太大了承受不起。
    Telegram
        26
    Telegram  
       2020-02-12 02:13:54 +08:00 via iPhone
    一查重,死翘翘,重复率可能 80%以上
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3509 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 11:00 · PVG 19:00 · LAX 03:00 · JFK 06:00
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.