V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
zzboat0422
V2EX  ›  OpenAI

实测 DeepSeek 代码能力果然强,文心一言是真不行

  •  
  •   zzboat0422 · 3 天前 · 276 次点击

    使用以下代码测试

    A = "aaa"
    b = 1
    
    def main():
        print(A)
        for i in range(10):
            B = A + "-" + str(b)
            print(B)
            if b < i:
                b += 1
    
    
    if __name__ == '__main__':
        main()
    

    让各个 AI 指出代码中的错误,输出正确的代码,并显示正确代码的运行结果。

    结果如下:

    AI 是否指出错误 是否给出正确的运行结果
    GPT-4o
    文心一言
    Grok3
    腾讯 hunyuan
    DeepSeek(腾讯元宝版,不开深度思考和联网搜索)
    豆包
    通义千问
    讯飞星火

    结论:DeepSeek 还是强,Grok3 代码能力也不是全面胜出。

    题外话:GPT-4o 是唯一一个连代码逻辑都给改了的 AI ,还要加限定词不要改代码逻辑。

    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3967 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 05:21 · PVG 13:21 · LAX 22:21 · JFK 01:21
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.