V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  tommyZZM  ›  全部回复第 1 页 / 共 9 页
回复总数  163
1  2  3  4  5  6  7  8  9  
23 天前
回复了 puputeju 创建的主题 OpenAI Claude3 深夜发布,号称超越 GPT4.0!
说的对,之前刚刚注册一个号,秒封了,我甚至还没发一句话
洗鼻挺好的,大部分人应该不需要做手术
收回我上面说过的话。之前的回复是 2020 年的。实际上已经是黎明的前夜了。

为什么很长一段时间搜索数据或者答案难?

对于这个问题,我现在确实更倾向于以往的搜索引擎技术是由于像谷歌这样的大公司基于英语的文化环境和技术发展的优势造成的。这并不是某个语言的属性导致的。

这里是 2023 年,随着像多模态大模型这样的技术发展,会极大地缓解甚至最终在大部分文化语言环境下解决这个问题。
2020-11-20 17:28:30 +08:00
回复了 zh584728 创建的主题 程序员 吐槽贴:现在用中文搜索出正确的答案太难了
@gyh 个人认为,中文比英文在处理同义 /歧义时成本高很多,往往对于同样场景,同义表述的情况中文会“丰富”很多。“博大精深”
2020-11-20 16:16:51 +08:00
回复了 zh584728 创建的主题 程序员 吐槽贴:现在用中文搜索出正确的答案太难了
@zh584728 哈哈哈,甚至就连这个问题本身,都变成了这种同表歧义 /多表同义现象一部分呢~
2020-11-20 15:50:55 +08:00
回复了 zh584728 创建的主题 程序员 吐槽贴:现在用中文搜索出正确的答案太难了
@CismonX

确实查询问题,只需要动词名词就行了,用来连接句子的介词等没有实际含义的单次都不应该包括
2020-11-20 15:47:17 +08:00
回复了 zh584728 创建的主题 程序员 吐槽贴:现在用中文搜索出正确的答案太难了
很多人不明白这个表述差异是什么情况,举一个简单例子吧

例如一个查问题的人不知道“linux 创建用户的命令行”是什么(这只是我的表述)

他可能会去查询以下其中一个或者是一部分关键词

- linux 新建账号
- linux 创建账号
- linux 新建用户
- linux 创建用户
- linux 新增用户
- linux 新增账号
...

注意上述表述,只是这个问题可能表述的一部分,列举这几个相似程度已经非常接近,在这个问题中实际上是等价的,具体选取的表述则因人而异。

实际上如果你用百度去逐个差上述关键词,会发现他们都被归纳成了同一个关键词 [Linux 创建 /新建 用户]

但是这些组合查出来的结果竟然都是不一样的
2020-11-20 15:32:48 +08:00
回复了 zh584728 创建的主题 程序员 吐槽贴:现在用中文搜索出正确的答案太难了
@tommyZZM FIX:不对 80 年代我还没出生呢
2020-11-20 15:30:55 +08:00
回复了 zh584728 创建的主题 程序员 吐槽贴:现在用中文搜索出正确的答案太难了
@nevermlnd 我的网龄长不长不知道,但我确实不是中国第一批用互联网的人,80 年代那时候我还很小,我是 90 年代才接触互联网的。

事实上商业化这个因素,在全球范围内都是一样的,其他语言环境也有同样的现象。

我的实际体验所描述的情况,仅仅局限于一般查询问题,例如技术问题、一般自然科学类的问题。
2020-11-20 15:28:01 +08:00
回复了 zh584728 创建的主题 程序员 吐槽贴:现在用中文搜索出正确的答案太难了
有一种潜在的可能是,即使将这个问题换成其他非英文语言得出的结论可能是一样的。

例如:
现在用俄文搜索出正确的答案太难了,
现在用土耳其语搜索出正确的答案太难了,
现在用法文搜索出正确的答案太难了
...

但这并不一定说是英语本身具有某种语言优势,可能只是其先发地位,例如信息技术最早发达起来的国家主体语言是英语,造成了网络上英语的内容比较多,反过来又造成了查问题的时候用英语查询得出的结果更准确。
2020-11-20 15:12:37 +08:00
回复了 zh584728 创建的主题 程序员 吐槽贴:现在用中文搜索出正确的答案太难了
根据我的实际体验

英文能很轻易通过几个近义词配合简单的动宾关键词,找到很多相关的问题解决方法

但中文做不到,往往查到的资料少很多,

个人感觉就是中文对事物表述特别丰富,经常会发现并不是内容不存在,而是关键词很不准确。例如问问题的时候问问题的人对同一个现象有很多种不同的表述。句子构词差异很大。

这可能跟目前的搜索引擎技术有关,还可能跟资料的丰富程度有关。

至少目前,在同等场景下,使用中文和英文进行检索得到期望结果比起来差距还比较大。
2020-11-20 15:04:55 +08:00
回复了 zh584728 创建的主题 程序员 吐槽贴:现在用中文搜索出正确的答案太难了
我认为这个是中文,语言文字本身的缺陷

陈述形态组合太多,一意多表,一义多词
2020-09-03 09:47:13 +08:00
回复了 leaveeel 创建的主题 问与答 30 系显卡支持 PCIe 4.0,要换 AMD 平台吗
闪退应该是软件的锅
2020-09-03 09:46:20 +08:00
回复了 liyanan 创建的主题 问与答 鼻炎
洗鼻器+洗鼻盐
2020-08-12 08:59:16 +08:00
回复了 gramyang 创建的主题 Rust 求一个简单点的 rust 写的 js 引擎学习一下
deno 不是 js 引擎
2020-08-07 23:11:27 +08:00
回复了 jaleo 创建的主题 科技 规避制裁 全球最大开源代码平台 GitHub 要来中国
很赞成
2020-07-29 11:41:53 +08:00
回复了 plusDiscuss 创建的主题 奇思妙想 独立开发者交流群(扶持互助,吹水勿入)
过期了
2020-07-29 11:40:49 +08:00
回复了 shumeigang 创建的主题 奇思妙想 怎么才能知道自己在网络世界的安全性?
我查过社工库,自己常用的账号密码是已经被暴露的
1  2  3  4  5  6  7  8  9  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1020 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 40ms · UTC 19:44 · PVG 03:44 · LAX 12:44 · JFK 15:44
Developed with CodeLauncher
♥ Do have faith in what you're doing.