首页
注册
登录
hansjimo 最近的时间轴更新
hansjimo
V2EX 第 418184 号会员,加入于 2019-06-03 12:55:26 +08:00
hansjimo
提问
技术话题
好玩
工作信息
交易信息
城市相关
hansjimo 最近回复了
2023-06-08 15:08:18 +08:00
回复了
hanh1985
创建的主题
›
自然语言处理
›
GPT 用于知识图谱构建的 NER 和 RE
是的,知识图谱肯定在具体的工程应用中暂时还是无法替代的。
用的是 gpt-4 、Claude ,没用 api ,我是试着直接让 gpt-4 输出知识图谱的。先问应该定义哪些实体和关系类别,然后分级输出各层级概念,再给他规定要输出的实体属性格式后,给他概念让他自动把所有属性和关系补全并按格式输出。
不过确实如果是大模型训练语料中已经有的通用知识,输出效果还是不错的,不过比如一些国内特有的或者实例词级别的输出结果就不准确了,开始胡编乱造了。
后来还找到了国外比较专业的领域网站,网站的内容基本已经按照知识体系组织的很完整了,又从上面采集了很多信息吗,再扔给 gpt 帮着补全些关系。
我是有点觉得用大模型做实体识别和关系提取有点大材小用的感觉,目前的能力应该能直接输出很多实体和关系了,不过可能针对像国内医疗领域,又有很多新概念的情况下,还是需要用语料训练下的。
2023-06-07 15:58:54 +08:00
回复了
hanh1985
创建的主题
›
自然语言处理
›
GPT 用于知识图谱构建的 NER 和 RE
前一阵试着用大模型构建了一个简单的领域知识图谱,gpt 是可以直接输出实体、关系和属性的,大部分基础知识输出质量还不错,从一些文本中提取实体和关系并进行格式化信息也没什么问题。过程中一度产生有了大模型还要知识图谱干嘛的困惑。不过现阶段大模型确实还存在一些问题,也需要很多手工修正工作,还需要结合爬虫等其它工具进行一些后续工作。
»
hansjimo 创建的更多回复
关于
·
帮助文档
·
博客
·
API
·
FAQ
·
实用小工具
·
4320 人在线
最高记录 6679
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 13ms ·
UTC 01:01
·
PVG 09:01
·
LAX 17:01
·
JFK 20:01
Developed with
CodeLauncher
♥ Do have faith in what you're doing.