V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Kelly00
V2EX  ›  Google

gemini3 真有那么神吗

  •  
  •   Kelly00 · 23 小时 40 分钟前 · 2539 次点击

    最近这段时间在折腾 Gemini 3 ( Ultra / Flash 都试过),本来没想写帖子,但身边有好几个朋友问我“到底感觉怎样”,索性在 V2EX 上随便记录一下,纯个人视角,不代表任何结论,也没有立场。

    一、先说直观感受:速度比我预期快很多 我原来以为 Gemini 3 这样的大模型肯定会有点“重”,但实际用下来,响应速度比我想象得快得多。 尤其是 Flash 版本,看起来就是为了“能跑就跑”的需求设计的:

    • 反应快
    • 有时候比 4o mini 还灵敏
    • 简单任务(总结、改写、问答)非常顺滑 Ultra 3 则更像是用来“干活”的,复杂问题、推理类、代码类都比前代稳不少。

    二、代码能力我觉得是这代最大的进步 随便测试了几个我常用的场景:

    • 写小脚本(抓 API ,处理数据):可用
    • JS / TS / Node 抽象能力:明显增强
    • 让它改别人写得乱七八糟的代码:整理能力不错
    • 多文件结构的理解:比上代强
    • 看日志、分析报错信息:比较聪明,不会乱猜 以前 Gemini 代码的“幻觉”主要体现在喜欢搞一些不存在的函数,现在 3 代里这种情况少了不少。 (但依然不能完全信任它——毕竟没有一个模型可以。)

    三、语言风格变得更“自然”了 这个我还挺意外的。
Gemini 2 的时候,我总能感觉到它写出来的东西带一点“模板味”。
Gemini 3 在不少场景下的风格更像“真人写的”,尤其是:

    • 叙述类
    • 观点表达类
    • 讨论意见类 不会过度堆知识,也不会元认知式地解释“我作为一个 AI 模型……”。 这点对我这种用它写文案、写电商脚本的场景挺有帮助。

    四、图像理解能力也提升了,但仍不完美 对照片、UI 截图、文档图、手写稿的识别都比以前强。
尤其是:

    • 小字体
    • 拍歪了的纸张
    • 模糊一点的场景 都能“读懂”。 不过依然有三类容易翻车:
    1. 数字(比如金额、日期) — 偶尔会看错
    2. 图表 — 简单折线图可以,多层嵌套的会混乱
    3. 情绪类理解 — 它会猜,但不一定准 总体,我觉得是“能干活,但不能盲信”。

    五、最让我意外的一点:写视频脚本很强 我最近在折腾一些 AI 视频相关的东西(主要是广告脚本、短片脚本),Gemini 3 的 分镜、节奏、台词安排 比上代强太多。 如果你是:

    • 做短视频
    • 做广告脚本
    • 做产品展示 Gemini 3 给的结构通常比 GPT 那种“文学写法”更实用一点。

    六、一些我觉得还不够好的地方

    • 有时候会“过度自信”
    • 逻辑链条太长的时候会跳步骤
    • 代码解释里偶尔会重复内容
    • 看英文长文档依然比不上 Claude
    • 作为 API 调用还不够便宜(这是巨头通病)
    • 有些回答明明知道答案,却因为对齐策略“不肯说死”(这个我个人不是很喜欢) 但整体来说,属于可以真用的程度了。

    七、总结一句话:不是“颠覆”,但确实在往正确方向走 如果你问我: Gemini 3 值不值得用? 我的回答是:
如果你是做内容、做脚本、做代码、做分析——值得一试。
如果你只做基础问答、总结、翻译——区别没那么大。 它不是那种“惊天动地”的升级,但确实把几个最重要的基础能力都补齐了。 我感觉我们现在进入一个阶段:
大模型不是比谁聪明,而是比谁更稳定、更能干活、更好融入真实场景。 Gemini 3 很明显就是往这个方向走的。

    如果有人也在用,可以在下面说你们遇到的坑 or 好用的地方,大家一起交流一下。

    15 条回复    2025-11-21 10:42:58 +08:00
    tool2dx
        1
    tool2dx  
       23 小时 15 分钟前 via Android
    修传统代码 bug (非前端) ,side by side 对比,3.0pro 不如 2.5pro 。
    语言是 hp basic ,可能是训练集的关系,没覆盖到,但我还是觉得 2.5 pro 泛化能力更强。
    Feeli
        2
    Feeli  
       20 小时 52 分钟前
    感觉对这些 AI 有点怯魅了

    事前各种炒作,等上手了也就那么回事

    也就应用端有点意思
    Kelly00
        3
    Kelly00  
    OP
       20 小时 51 分钟前
    @Feeli ai coding 还是很惊艳我的😂,非程序员敲出月入万刀产品的比比皆是
    Feeli
        4
    Feeli  
       20 小时 44 分钟前
    @Kelly00 我的意思是没有当初那种惊艳的感觉了,感觉有点到顶了,现在基本都是在应用端布局了
    shoushen
        5
    shoushen  
       17 小时 44 分钟前   ❤️ 2
    @Kelly00 “非程序员敲出月入万刀产品的比比皆是”
    怎么可能,你以为全球这么多程序员都是 sb 吗?什么不懂的人,用 ai 随便搞搞能个产品,还能赚钱?怎么可能啊。
    bbbblue
        6
    bbbblue  
       17 小时 36 分钟前
    @shoushen 幸存者偏差+还有些是融资的诱饵弹😂
    maolon
        7
    maolon  
       17 小时 18 分钟前
    3.0 preview 现在模型本身肯定有点问题,指令遵循在 9w tokens 之后就开始失效了,他会开始自由发挥,
    大多数的评测和自己的测试都是短 context 测试,一个 case 一个 context 所以这种效应不明显,一旦进入大代码库的实际场景这种问题就会开始凸显,
    这也可以解释为什么现在各种评测显示 gemini3 最好的就是前端场景,因为就算他自由发挥了你也看不出大的问题(而且大部分这种测试都是从头构建的前端)
    const
        8
    const  
       16 小时 52 分钟前
    我对比了同样的数据分析/技术等问题,gemini 确实比 GPT 回答好很多,不管是准确性还是文本风格上。
    deep research 倒是 GPT 一直没输过
    Biem
        9
    Biem  
       15 小时 13 分钟前
    为什么我感觉这个帖子有点 GPT5.1 的味道
    usn
        10
    usn  
    PRO
       14 小时 52 分钟前 via iPhone
    你知道发布 ai 内容再有人艾特 Livid ,之后你的号会被封禁吗
    usn
        11
    usn  
    PRO
       14 小时 51 分钟前 via iPhone
    起码得标注下经过 ai 润色吧
    accelerator1
        12
    accelerator1  
       6 小时 6 分钟前
    @Kelly00 #3 月入百万的从来不是代码,而是产品,所以就算没有 AI ,这些人一样会搞出月入百万的产品,程序员 ≠ 产品。
    qieqie
        13
    qieqie  
       5 小时 51 分钟前
    现在 gemini3 哪来的 ultra/flash?
    muzei233
        14
    muzei233  
       5 小时 19 分钟前
    总结是 AI 写的吗,味道太重了
    HetFrame
        15
    HetFrame  
       4 小时 46 分钟前
    @Kelly00 #3 代码只是工具,能卖出钱才是能力
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5139 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 41ms · UTC 07:29 · PVG 15:29 · LAX 23:29 · JFK 02:29
    ♥ Do have faith in what you're doing.