TangMonkDance

关于转 AI 大模型的一些疑问

  •  
  •   TangMonkDance · Nov 13, 2023 · 2999 views
    This topic created in 935 days ago, the information mentioned may be changed or developed.

    我有近 6 年的 Java 开发经验,专业是计算机科学与技术,今年 33 岁。

    我考虑转向 AI 大模型领域,想请教一下应该学习哪些知识。我了解到一些课程好像更适合算法工程师,但我之前在学校主要学习了一些专业课,算法可能也有的,感觉目前 Java 太卷了。

    我观察到目前发展较好的领域主要有 Web3 和 AI 大模型。作为一名 Java 开发者,我想请教一下,转向这两个方向中的哪一个更适合,并且更有发展潜力。

    希望有经验的 v 友们能提供一些建议,最好能具体到书籍或课程的推荐。非常感谢!

    18 replies    2024-01-12 17:38:37 +08:00
    murmur
        1
    murmur  
       Nov 13, 2023
    web3 国外还行,web3 在国内等同于诈骗,国外一大半等同于诈骗,剩下的在炒币
    tool2d
        2
    tool2d  
       Nov 13, 2023
    所谓 AI 大模型,感觉大家都是调用开源库,或者是微调一下模型参数,技术含量高的都是发论文的作者。

    AI 就是一阵风,要想稳定长久也不容易。还不一定有 JAVA 后端稳定。

    至于 web3 ,只有技术大牛能在行业立足,小兵接触的都是灰产。
    helone
        3
    helone  
       Nov 13, 2023
    这俩行业虽然不卷,但其实都不适合,web3 跟楼上说的情况差不多,也就几个大的交易所工作靠谱点,但是人在国内的基本也是分散式办公,工资直接发币的,大模型对学历、算法、数学要求都比较高,我感觉三十多已经是卷不了这个行业了。。。
    565656
        4
    565656  
       Nov 13, 2023
    别转 一些公司学校连跑 inference 资源都没
    vicalloy
        5
    vicalloy  
       Nov 13, 2023   ❤️ 1
    大模型卷的是算力,换句话是卷的是“钱”。
    世界范围内有能力做大模型的总共也没几个公司。
    一个大模型,核心工程师总共也要不了几个人。

    别以为大模型才刚开始,其实能入场的都入的差不多了,剩下的只是看谁能活到最后。
    vicalloy
        6
    vicalloy  
       Nov 13, 2023
    另外,现在大模型走的路和之前所谓的算法完全是两条不同的路。
    ChatGPT 出来后,传统的 NLP 基本上都可以消失了。
    zhangyichent
        7
    zhangyichent  
       Nov 13, 2023
    纯算法就算了吧,个人感觉已经过了没基础的人入行的时期了,毕竟现在科班出身的很多了,可以看看一些大模型框架,像 langchain 的那一套。
    herozzm
        8
    herozzm  
       Nov 13, 2023
    @vicalloy 但是 chatgpt 没有可以替代传统 NLP 的离线模型,调用 api 实在太贵
    bbao
        9
    bbao  
       Nov 13, 2023
    始终认为,无论任何事情如果要转一个方向,自己都没有想清楚以及了解明白,哪怕是做了,也是炮灰,无论是投资还是创业亦或是转行或者技术转型,没有内驱来解决困惑和疑问,靠外部输入的信息,就说明不合适
    hao7Chen
        10
    hao7Chen  
       Nov 13, 2023
    @zhangyichent 赞同,基于模型框架来为客户搭建定制化、私有化的大模型应用,所以用 Java 和用 Python 都差不多,而且也不必特别掌握模型算法。
    wateryessence
        11
    wateryessence  
       Nov 13, 2023 via iPhone
    cs224n ,请
    cbythe434
        12
    cbythe434  
       Nov 13, 2023
    转前端或者应用,执行最快
    算法不现实,学历背景都刷掉一大波对口专业水硕,磕磕绊绊进组都不一定能分配到卡
    Morriaty
        13
    Morriaty  
       Nov 13, 2023
    都在劝退🤣我稍微正经点吧,可以参考这个 https://gugehome.com/am.php?t=a8pslXGjYFhJ 开始入门学习。

    对于 train 和 fine tune 这条路而言,楼主想转难度挺大,需要极好的学术背景+大公司资源

    但对于 Prompt tune 这条路而言,我觉得当前还是可以尝试一下的
    love060701
        14
    love060701  
       Nov 13, 2023
    AI 大模型应用方向,JAVA 后端有发挥的场景。目前最合适的工作场景:
    love060701
        15
    love060701  
       Nov 13, 2023
    AI 大模型应用方向,JAVA 后端有发挥的场景。目前最合适的工作场景:

    调用 OpenAI API + Assistant API + Function Call + 自研服务端功能和数据维护,实现数据私有、减少幻觉、安全有效的 LLM 应用。
    TangMonkDance
        16
    TangMonkDance  
    OP
       Nov 14, 2023
    @love060701 #15 这感觉就是一般的调用三方接口呀,然后数据集中一下
    love060701
        17
    love060701  
       Nov 14, 2023 via iPhone
    @TangMonkDance 是,但是有了大模型的能力。大模型来解读用户的需求,来判断什么时候调用私有功能
    testliyu
        18
    testliyu  
       Jan 12, 2024
    @Morriaty 文章是好文啊,但是这个 gugehome.com 是正经谷歌么
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2498 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 56ms · UTC 15:54 · PVG 23:54 · LAX 08:54 · JFK 11:54
    ♥ Do have faith in what you're doing.