为什么 NLP 发展这么多年了机器翻译还是经常翻译出狗屁不通的内容？难点在哪里？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

这是一个创建于 971 天前的主题，其中的信息可能已经有所发展或是发生改变。

翻译

NLP

狗屁

不通

25 条回复 • 2023-03-01 09:09:32 +08:00

maemual

2023-02-27 20:25:25 +08:00

人工翻译都会出现一堆狗屁不通的内容。。。

cmdOptionKana

2023-02-27 20:37:35 +08:00

难在没有标准，无法评分。

比如 AlphaGo 围棋，每下一个子，好歹能看实地有没有变多、外势有没有变强、大龙有没有危险，下完也能清晰判断输赢。这样知道好不好，才能改进。

但翻译，很难评分啊（说的是机器自己给自己打分），翻译完了，好不好、对不对，这个都极难判断，而无法判断这个，就无法改进了。

TimePPT

PRO

2023-02-27 20:45:27 +08:00

日常翻译还好吧，专业领域翻译不太理想。主要的问题还是在对常识 /知识的处理，以及上下文的理解。

hhjswf

2023-02-27 20:57:05 +08:00 via Android

难点在于人类太难懂了。

laqow

2023-02-27 21:08:33 +08:00

机器学习得到的总是某种层面下的最优，人类只会没有最优制造最优

2xvaHoK2LGxQ29R5

2023-02-27 21:11:34 +08:00 via Android

难点在于机器学习的 golden=>人工翻译还会翻译出一堆狗屁不通的东西

cocomiko

2023-02-27 21:41:23 +08:00

语言是文化一部分，不同文化之间本来就很难理解，思维方式方式也不一样，所以实质还是文化不相通，互相理解可太难了

mercury233

2023-02-27 23:05:25 +08:00

其实 openai 的翻译已经很强了，包括 chatgpt 和 whisper 内置的翻译，期待成品化的一天

lrigi

2023-02-28 00:22:19 +08:00 via iPhone

我天天用谷歌翻译，感觉还是挺满意的啊
现在的谷歌翻译还不够强吗
有点好奇楼主翻译的什么内容，给个例句么看看

lslqtz

2023-02-28 00:38:39 +08:00

即使进行大量数据标注, 翻译这个东西也很看场景. 还是语法的问题.

em70

2023-02-28 00:42:54 +08:00

因为缺少语言中间态,字面意思的转换会丢失大量的信息,chatgpt 是目前已知唯一可能得语言中间态

xxzlll

2023-02-28 00:44:00 +08:00 via Android

既想要信雅达的翻译效果，有不愿意支付高额的使用费用来支撑翻译软件公司去做数据标注和审核的工作，这世上哪有这么美的事？

F281M6Dh8DXpD1g2

2023-02-28 00:46:36 +08:00

deepl 已经不错了
你想要达到专业翻译的水平还不如自己学

edis0n0

2023-02-28 00:54:49 +08:00

@liprais #13 DeepL 经常改变原文意思 /t/890408
@lrigi #9 Google 英文还好，翻译日文经常一句剩半句，另外半句直接没了

HankLu

2023-02-28 01:00:03 +08:00

翻译，太难了，用现在的机器水平来要求翻译，太难为机器了

chern9511

2023-02-28 02:12:18 +08:00 via Android

语料，模型，还要挑专业场景，其实就是挺难的吧

Ocean810975

2023-02-28 09:47:59 +08:00 via Android

@edis0n0 deepl 德译英还行，差不多趋于完美了。德译中还是差点，

opentrade

2023-02-28 10:50:59 +08:00

难点在于你都意识不到它很难

macscsbf

2023-02-28 14:25:07 +08:00

我感觉 hybrid 挺不错的

aloop

2023-02-28 14:28:38 +08:00 via Android

@mercury233 whisper 是什么

mercury233

2023-02-28 15:40:54 +08:00

@aloop https://github.com/openai/whisper
语音转文本的 AI ，自带任何语言翻译成英文功能

edis0n0

2023-02-28 15:53:11 +08:00

@mercury233 #21 这东西日文识别率稳定 0%，全是乱七八糟的日文出来，其它语言没试

xiaochen3

2023-02-28 16:11:07 +08:00

@edis0n0 不会吧，之前还看到有人用这来识别日综。不过我也只是识别过英文。

mercury233

2023-02-28 17:19:07 +08:00

@edis0n0 我测试日文还好，但多音字和幻听的问题确实很严重

9527kf

2023-03-01 09:09:32 +08:00

我也一直有这个一问，chatgpt 的对话，看着很流畅，为啥直接翻译却不流畅呢