gemini3 真有那么神吗

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

› Google Play

› Google Fi

› Google Developers Channel

› Google 全球透明度报告

› 9to5Google

最近这段时间在折腾 Gemini 3 （ Ultra / Flash 都试过），本来没想写帖子，但身边有好几个朋友问我“到底感觉怎样”，索性在 V2EX 上随便记录一下，纯个人视角，不代表任何结论，也没有立场。

一、先说直观感受：速度比我预期快很多我原来以为 Gemini 3 这样的大模型肯定会有点“重”，但实际用下来，响应速度比我想象得快得多。尤其是 Flash 版本，看起来就是为了“能跑就跑”的需求设计的：

反应快
有时候比 4o mini 还灵敏
简单任务（总结、改写、问答）非常顺滑 Ultra 3 则更像是用来“干活”的，复杂问题、推理类、代码类都比前代稳不少。

二、代码能力我觉得是这代最大的进步随便测试了几个我常用的场景：

写小脚本（抓 API ，处理数据）：可用
JS / TS / Node 抽象能力：明显增强
让它改别人写得乱七八糟的代码：整理能力不错
多文件结构的理解：比上代强
看日志、分析报错信息：比较聪明，不会乱猜以前 Gemini 代码的“幻觉”主要体现在喜欢搞一些不存在的函数，现在 3 代里这种情况少了不少。（但依然不能完全信任它——毕竟没有一个模型可以。）

三、语言风格变得更“自然”了这个我还挺意外的。 Gemini 2 的时候，我总能感觉到它写出来的东西带一点“模板味”。 Gemini 3 在不少场景下的风格更像“真人写的”，尤其是：

叙述类
观点表达类
讨论意见类不会过度堆知识，也不会元认知式地解释“我作为一个 AI 模型……”。这点对我这种用它写文案、写电商脚本的场景挺有帮助。

四、图像理解能力也提升了，但仍不完美对照片、UI 截图、文档图、手写稿的识别都比以前强。 尤其是：

小字体
拍歪了的纸张
模糊一点的场景都能“读懂”。不过依然有三类容易翻车：

数字（比如金额、日期） — 偶尔会看错
图表 — 简单折线图可以，多层嵌套的会混乱
情绪类理解 — 它会猜，但不一定准总体，我觉得是“能干活，但不能盲信”。

五、最让我意外的一点：写视频脚本很强我最近在折腾一些 AI 视频相关的东西（主要是广告脚本、短片脚本），Gemini 3 的分镜、节奏、台词安排比上代强太多。如果你是：

做短视频
做广告脚本
做产品展示 Gemini 3 给的结构通常比 GPT 那种“文学写法”更实用一点。

六、一些我觉得还不够好的地方

有时候会“过度自信”
逻辑链条太长的时候会跳步骤
代码解释里偶尔会重复内容
看英文长文档依然比不上 Claude
作为 API 调用还不够便宜（这是巨头通病）
有些回答明明知道答案，却因为对齐策略“不肯说死”（这个我个人不是很喜欢）但整体来说，属于可以真用的程度了。

七、总结一句话：不是“颠覆”，但确实在往正确方向走如果你问我： Gemini 3 值不值得用？我的回答是： 如果你是做内容、做脚本、做代码、做分析——值得一试。 如果你只做基础问答、总结、翻译——区别没那么大。它不是那种“惊天动地”的升级，但确实把几个最重要的基础能力都补齐了。我感觉我们现在进入一个阶段： 大模型不是比谁聪明，而是比谁更稳定、更能干活、更好融入真实场景。 Gemini 3 很明显就是往这个方向走的。

如果有人也在用，可以在下面说你们遇到的坑 or 好用的地方，大家一起交流一下。

Gemini3

速度

代码能力

22 条回复 • 2025-12-10 09:56:39 +08:00

tool2dx

31 天前 via Android

修传统代码 bug （非前端），side by side 对比，3.0pro 不如 2.5pro 。
语言是 hp basic ，可能是训练集的关系，没覆盖到，但我还是觉得 2.5 pro 泛化能力更强。

Feeli

31 天前

感觉对这些 AI 有点怯魅了

事前各种炒作，等上手了也就那么回事

也就应用端有点意思

Kelly00

31 天前

@Feeli ai coding 还是很惊艳我的😂，非程序员敲出月入万刀产品的比比皆是

Feeli

31 天前

@Kelly00 我的意思是没有当初那种惊艳的感觉了，感觉有点到顶了，现在基本都是在应用端布局了

shoushen

31 天前

@Kelly00 “非程序员敲出月入万刀产品的比比皆是”
怎么可能，你以为全球这么多程序员都是 sb 吗？什么不懂的人，用 ai 随便搞搞能个产品，还能赚钱？怎么可能啊。

bbbblue

31 天前

@shoushen 幸存者偏差+还有些是融资的诱饵弹😂

maolon

31 天前

3.0 preview 现在模型本身肯定有点问题，指令遵循在 9w tokens 之后就开始失效了，他会开始自由发挥，
大多数的评测和自己的测试都是短 context 测试，一个 case 一个 context 所以这种效应不明显，一旦进入大代码库的实际场景这种问题就会开始凸显，
这也可以解释为什么现在各种评测显示 gemini3 最好的就是前端场景，因为就算他自由发挥了你也看不出大的问题（而且大部分这种测试都是从头构建的前端）

const

31 天前

我对比了同样的数据分析/技术等问题，gemini 确实比 GPT 回答好很多，不管是准确性还是文本风格上。
deep research 倒是 GPT 一直没输过

Biem

31 天前

为什么我感觉这个帖子有点 GPT5.1 的味道

usn

PRO

31 天前 via iPhone

你知道发布 ai 内容再有人艾特 Livid ，之后你的号会被封禁吗

usn

PRO

31 天前 via iPhone

起码得标注下经过 ai 润色吧

accelerator1

31 天前

@Kelly00 #3 月入百万的从来不是代码，而是产品，所以就算没有 AI ，这些人一样会搞出月入百万的产品，程序员 ≠ 产品。

qieqie

31 天前

现在 gemini3 哪来的 ultra/flash?

muzei233

31 天前

总结是 AI 写的吗，味道太重了

HetFrame

31 天前

@Kelly00 #3 代码只是工具，能卖出钱才是能力

PiktCai

30 天前

煞有介事地在讲什么 flash/ultra ，明明现在只有 pro 啊😅

Kelly00

27 天前

@shoushen 可能是跟环境有关吧。。。我身边挺多的。。。

Kelly00

27 天前

@Feeli 确实，不过 gemini 3 image pro 真的是惊艳到我了

Kelly00

27 天前

@PiktCai 你没用过 ultra 。不代表没有。。。

Kelly00

27 天前

@maolon 赞同，我用他搭建复杂一点的项目就不行，对比 lovable 这种，感觉只是没有了 ai 紫并且前端效果更炫酷

Kelly00

27 天前

@accelerator1 我觉得你说的很有道理，但是之前一个团队能搞出来的，现在一个人就能搞出来，这个是事实

PiktCai

12 天前

@Kelly00 #19 不是……现在到底哪里有？