V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
zhmouV2
V2EX  ›  分享发现

DeepSeek 发布了推理模型 R1-Lite-Preview

  •  1
     
  •   zhmouV2 · 3 天前 · 659 次点击

    看 V2 好像没人提 发一下这个新闻 https://api-docs.deepseek.com/zh-cn/news/news1120

    使用: https://chat.deepseek.com/

    省流:

    • 类似 o1-mini 的模型,能输出思考过程并反复推理,官方给出的 benchmark 在部分领域打败了 o1-preview
    • 目前每天可用 50 次 据称未来会完整开源基座模型 R1
    • 实际体验目前不支持上传文件解析,感觉下来确实是聪明了一些 不过 token 消耗也很恐怖:比较一下 1.11 和 1.8 数字大小那个思维过程就要写篇小作文。个人认为完整模型如果开源的话,确实会成为 LLM 的搅局者,想起来上半年李彦宏说开源模型会越来越落后有点贻笑大方了。
    6 条回复    2024-11-22 12:39:02 +08:00
    cat9life
        1
    cat9life  
       3 天前
    看起来很有意思,支持 api 了吗
    zhmouV2
        2
    zhmouV2  
    OP
       3 天前
    @cat9life #1 目前还不支持
    cookii
        3
    cookii  
       3 天前 via Android
    支持 deepseek ,国产里面算好用的
    PositionZero
        4
    PositionZero  
       3 天前
    过度思考太严重了,问了一道数学题思考五分钟,花了 15000 tokens ,同样问题 gpt-4o 不思考也能做对。不过确实很厉害,不知道 kimi 的 k0-math 什么水平
    A1st0n
        5
    A1st0n  
       2 天前
    感觉 deepseek 在代码问答还不是如 ChatGPT 免费版
    linglingfa
        6
    linglingfa  
       2 天前
    国内的诸多模型我也都一直在尝试和测试。

    应该来说,Deepseek 算是代码能力相对比较优秀的一款国产 大模型。

    不方便注册 openai 或者 claude 的朋友,也可以考虑让 deepseek 来帮你。

    当然,缺点也有,就是 deepseek 出代码的速度相对较慢。

    有时候写的代码行数(字数) 一多的话,就看着 deepseek 一个字母一个字母的给你输出,那种感觉真酸爽。特别是当你习惯了 ChatGPT 和 claude 的代码输出之后。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1152 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 19ms · UTC 18:11 · PVG 02:11 · LAX 10:11 · JFK 13:11
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.