@
LeeReamond #10
当然有预测未来预测得很准的,但这意义不大。学过信息论就知道,这样的讨论就等于没有信息量。
比如你预测,明天可能下雨,但也可能不下。晚上可能吃面,也可能不吃面。
你说未来 50 年内核聚变可能可以投产使用,但也可能无法投产使用。这是不是预测了个寂寞。
咱不说那么复杂的东西,就像你说的 GPT3.5 出来的时候谁会想到现在大模型+Agent 可以直接上手半自动化开发复杂的软件。当时的你可能连 Agent 这样一个东西将会被发明出来都不知道。没有多少人类可以凭空想象出还不存在的东西,如果你可以,那你应该开始创业。
很久以前在油管上看过一个视频,里面就提到了未来人类会遇到的情况。你进入大学学习,然后大一大二学到的前沿知识,到了大学毕业的时候就已经过时了。你高中时候对未来做了职业规划,想着将来我要在某某行业做某种工作,结果到了找工作的时候发现,这个工种已经消失了。而取而代之的工作岗位,可能是三五年前根本还不存在的工作,工作内容要处理的,甚至是人们可能从来没想过的问题。整个世界都在以指数级的速度发展,过去 5 年内创作出的新知识可能比过去 5000 年的还要多。
当然我不是说不能去预测未来,只是未来的变化实在太快了,在新的变化出来之前你可能根本就没想到这会是个变化,历史的滚滚洪流就把你当减速带碾过去了。
顺便一提,就算能去掉 CUDA 护城河,你用 AMD 的显卡也不会便宜。如果 N 卡和 A 卡都降价了,Cerebras 也不会便宜。Cerebras 如果便宜了,那人类就可以迈出一大步了。
现在大模型的弱点,除了上面说的注意力和智力,还有速度。现在普通人用的 AI 无非也就是几十 tps ,你要用美国豆包 3.5 Flash ,那说不定能跑个小几百 tps ,要实时响应还是太慢了。如果能保持现在 5.5 xHigh 的智力水平然后再把速度提升 20 倍,那开发的体验会好很多。当然价格如果能打下来那就更好了。现在写个大项目一个月得花好几千,要不是公司买单,我自己掏钱做开源软件那是真用不起。