hansjimo 最近的时间轴更新
hansjimo

hansjimo

V2EX 第 418184 号会员,加入于 2019-06-03 12:55:26 +08:00
hansjimo 最近回复了
2023-06-08 15:08:18 +08:00
回复了 hanh1985 创建的主题 自然语言处理 GPT 用于知识图谱构建的 NER 和 RE
是的,知识图谱肯定在具体的工程应用中暂时还是无法替代的。
用的是 gpt-4 、Claude ,没用 api ,我是试着直接让 gpt-4 输出知识图谱的。先问应该定义哪些实体和关系类别,然后分级输出各层级概念,再给他规定要输出的实体属性格式后,给他概念让他自动把所有属性和关系补全并按格式输出。
不过确实如果是大模型训练语料中已经有的通用知识,输出效果还是不错的,不过比如一些国内特有的或者实例词级别的输出结果就不准确了,开始胡编乱造了。
后来还找到了国外比较专业的领域网站,网站的内容基本已经按照知识体系组织的很完整了,又从上面采集了很多信息吗,再扔给 gpt 帮着补全些关系。
我是有点觉得用大模型做实体识别和关系提取有点大材小用的感觉,目前的能力应该能直接输出很多实体和关系了,不过可能针对像国内医疗领域,又有很多新概念的情况下,还是需要用语料训练下的。
2023-06-07 15:58:54 +08:00
回复了 hanh1985 创建的主题 自然语言处理 GPT 用于知识图谱构建的 NER 和 RE
前一阵试着用大模型构建了一个简单的领域知识图谱,gpt 是可以直接输出实体、关系和属性的,大部分基础知识输出质量还不错,从一些文本中提取实体和关系并进行格式化信息也没什么问题。过程中一度产生有了大模型还要知识图谱干嘛的困惑。不过现阶段大模型确实还存在一些问题,也需要很多手工修正工作,还需要结合爬虫等其它工具进行一些后续工作。
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4320 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 13ms · UTC 01:01 · PVG 09:01 · LAX 17:01 · JFK 20:01
Developed with CodeLauncher
♥ Do have faith in what you're doing.