• 请不要在回答技术问题时复制粘贴 AI 生成的内容
fennu2333
V2EX  ›  程序员

大家心里最理想的和 Agent 交互的方式是啥样的?

  •  1
     
  •   fennu2333 · 2 days ago · 3997 views

    我本职工作偏向 Agent 开发,去年为止我们的产品千篇一律全是 Chat UI ,和一些朋友聊下来现在看到产品上来就是一个 Chat 界面就非常反感

    我自己还在维护一个 Harness 项目 Chorus, 本意是让用户可以在 Claude Code 这样的 Cli 界面里开发,不侵入工作习惯的前提下注入想法细化,自动计划 Review 等这种 SDLC 的流程,另外搭配一套界面做人类友好的 Agent 任务追踪,但有些用户觉得很割裂,Cli 和 UI 两头都有交互。另外有一个类似但出名得多的项目 Multica 就比较激进,完全在 UI 上分发任务给 Claude Code ,几乎不让你去 Cli 上交互,但我个人不太喜欢这种方式

    作为程序员大家心中能让自己用的下去的理想 Agent 交互式啥样的呢,UI 分配任务? Slack 这样的 IM 工具?纯 CLI/Tmux ?解放双手纯语音交互?

    49 replies    2026-05-28 16:29:46 +08:00
    dabaibai
        1
    dabaibai  
       2 days ago   ❤️ 1
    你去开发一个王者荣耀 上线赚钱后告诉我。
    askfilm
        2
    askfilm  
       2 days ago
    刚有想法,它活就干好了。
    hidemyself
        3
    hidemyself  
       2 days ago
    能够读取我的想法,不需要我打字就能完成我的需求
    YanSeven
        4
    YanSeven  
       2 days ago   ❤️ 2
    终极形态就是语音交互啊,智能眼镜,语音下达指令,视觉反馈和 review ,再终极就是跟电影里面一样能有任何时间任何地点的全息投影来展示视觉信息。
    Nasdaq
        5
    Nasdaq  
    PRO
       2 days ago
    非侵入式脑机接口
    sn0wdr1am
        6
    sn0wdr1am  
       2 days ago
    阿拉丁神灯?
    Lucups
        7
    Lucups  
       2 days ago
    @YanSeven 老罗的 TNT 哈哈哈
    fennu2333
        8
    fennu2333  
    OP
       2 days ago
    @dabaibai
    @askfilm
    @hidemyself
    这种交互的前提是 Agent 已经聪明到完全不会跑偏了哈哈
    greatim
        9
    greatim  
       2 days ago
    贾维斯?
    lekai63
        10
    lekai63  
       2 days ago
    想象一下:你跟人类 是怎么交互的。

    所以排序如下:
    1 跟机器人当面交互
    2 语音(类似跟人打电话)
    3 文字(类似发短信/微信?)

    ---
    关于交互形态,我觉得看豆包就行。 模型渣渣、交互呱呱
    fennu2333
        11
    fennu2333  
    OP
       2 days ago
    @lekai63 有没有可能 Agent 可以超越和人类的交互呢?人类受限于感官和物理实体,但是 Agent 没有这一层限制
    Meursau1T
        12
    Meursau1T  
       2 days ago
    IM 工具吧,和多个 AI 聊天,各自像 CLI 一样实时同步当前在干嘛,别像那个龙虾一样把事情办砸了再来给条消息。
    limon
        13
    limon  
       2 days ago via Android
    脑机接口呗
    visper
        14
    visper  
       2 days ago
    网游模式,自己控制的一玩家,其他的是 agent 是 npc, 跑去告诉他任务,然后他们自己跑来跑去互动,然后跑到不同的地方用不同的工具去忙碌。完成了再跑回来汇报。
    lekai63
        15
    lekai63  
       2 days ago
    @fennu2333 那人类自己就跟不上。。

    比如:让一个普通人跟爱因斯坦聊天,大概是跟不上他的话题、思路的,也聊不动。让这个人付 1000 块钱/小时给爱因斯坦,大概率是不愿意付的。。
    someonelikeyouah
        16
    someonelikeyouah  
       2 days ago
    我感觉没人知道,人们反对 Chat UI 是因为 大部分做出来的都很臭 ,又拉又臭,人们的参考系是 2 大独角兽,还有现在做出来的都是偏 demo 的产品 质量都不好,至少我们公司是这样,所以不是讨厌 Chat UI 还有一种说不出来的刻板印象,而且这个东西很难量化自己需要什么,都是人们在用 codex 和 claude code 时候发现了一部分局限 才会想要有新的需求,是不是可以看看什么 codex 的 issue 可以激发灵感😂 没玩过 github 不太清楚
    Cloudust
        17
    Cloudust  
       2 days ago
    老罗还是太超前了
    tiezlk443
        18
    tiezlk443  
       2 days ago
    实时读取我的工作消息自动帮我做一些事情
    dimlau
        19
    dimlau  
       2 days ago
    斯派克·琼斯( Spike Jonze )执导的电影《 Her 》
    unco020511
        20
    unco020511  
       2 days ago
    至少应该比一个员工更好用
    Charon2050
        21
    Charon2050  
       2 days ago
    我理想中的 Agent 应该是主动发现需求的。常驻后台读屏,发现需求后就弹出通知「要我帮你实现这个吗?」之类的。理想状态下不需要说话/打字,只要用鼠标点是/否就可以
    zerovoid
        22
    zerovoid  
       2 days ago
    肯定要能预判啊,

    就跟各种短视频的推荐算法一样,
    比我还懂我自己想要什么,

    一个接管了我所有信息的智能体,
    肯定要能预判我想做什么,
    然后我只要点一下要不要启动就行。
    NakanoAzure
        23
    NakanoAzure  
       2 days ago
    我们组现在做的项目就是参照 multica 抄然后搞了个类似的,一开始搞的巨复杂,后面迭代了一个月决定把其他不必要的都砍掉只保留 Chat 和 Task ,反正感觉现在这些东西吧,如果未来模型都越来越厉害感觉都不用做了,现在完全是因为 Claude Managed Agents 因为数据安全不能用,所以每个公司都要自己内部搞一套这种东西
    HTravel
        24
    HTravel  
       2 days ago
    看你的想法,你应该去卷 toC 这种对智力要求不高的用户的赛道,类似抖音短视频这样,通过满足用户情绪价值赚钱。

    如果是专业程序员的话,显然 AI 普及后,产出代码速度太快了,人工 Review 完全跟不上。即使 AI review AI ,也必须引入复杂专业的管理流程,引入各种界面来让人工确认各种流程中的各个环节目标是否达成了。这就要求无论大小公司,只要想活下去,必须走规范的大型软件开发管理流程,现有的大型软件复杂开发管理流程也要重新进化。因为程序员其实变成了产品经理+软件开发架构师+测试架构师角色,这就需要一套成熟的工具把一大堆 AI 员工管起来。个人开发者想开发这类工具去卷,压根不可能。

    另外,CLI 方向本就错着,这本来是外行才会一惊一乍犯的错,作为行业内人士你应该压根对它不屑一顾才是。CLI 本质就是 m x n 的字符数组,当把字符进一步缩小成到像素级别,不就变成 GUI 了嘛,所以 CLI 怎么可能成功。GUI 时代,哪个复杂的专业软件能通过字符界面操作完整的功能?这个问题初级到压根不应该提出来。(当然 CLI 一般指命令行接口,但看你上下文,应该是指 TUI)。

    即使现阶段,我肯定也是只用 AI 大厂的 UI 和交互方案,他们经过了顶级智力人士的最专业思考,他们在做最顶级的 AI ,他们每天在思考最顶级的 AI 应该怎么解决问题。所以对于其他人玩的各种提示词优化、开发流程优化什么的我只浅浅了解下,因为我明白 AI 产品要真正成功,这些顶尖智力人士必须给出可行答案,而不是让我们做各种低效且必然最终无效的探索。他们代表着 agent 交互演进方向和进度,我不认为其他人能在思考和产品开发进度上明显超越他们。
    ericshen
        25
    ericshen  
       2 days ago
    @Lucups #7 <别说话, 你吵到我用 TNT 了.jpg>
    plane
        26
    plane  
       2 days ago
    看了眼大家都很喜欢 proactive agent 呀,我做了个主动型 agent 项目本来觉得不是很舒服,这样看来有搞头。现在全世界都在搞这个了。
    a0210077
        27
    a0210077  
       2 days ago
    瞪它一眼就开始帮我干活赚钱
    chairuosen
        28
    chairuosen  
       2 days ago
    脑机接口
    auroraccc
        29
    auroraccc  
       2 days ago
    脑机接口,以及加快生成速度
    teaguexiao
        30
    teaguexiao  
       2 days ago
    语音输入配 Claude Code 已经相当接近了,直接说需求转成 prompt 扔进去,打字摩擦少了很多。真正的痛点是 agent 跑偏时的干预成本——理想交互应该是能随时喜唆、随时插嘴,而不是等它跑完一大坎再改。
    DeWjjj
        31
    DeWjjj  
    PRO
       2 days ago
    我什么都不用说,当我开组会的时候他就已经开始敲代码了。
    然后,我就可以不上班就能赚工资,等优化了。
    majianglin
        32
    majianglin  
       2 days ago
    现在最大的问题是写代码的时候,AI 不会提问,缺东西或者有选择的时候不提问题给用户,缺少了这个交互
    momocraft
        33
    momocraft  
       2 days ago
    不交互 每月打钱给我
    skills
        34
    skills  
       2 days ago
    听说过脑机接口吧,如果马斯克的脑机接口最终成熟了,结合 AI ,你觉得有戏没?
    moguiyu
        35
    moguiyu  
       2 days ago
    理想的交互方式,就是像电影《 Her 》里面初始化那一段的设计。
    bwnjnOEI
        36
    bwnjnOEI  
       2 days ago
    理想交互就是不交互
    FrankAdler
        37
    FrankAdler  
       2 days ago via Android
    我最理想的交互是当成一个真人一样,不区分项目,不区分 session ,不区分 skill 还有插件等,我希望可以直接跟他对话交代事情就好了,他需要知道的我都可以说,但是不希望反复说,我希望他可以越来越懂我,知道我参与的所有项目,部署过的所有服务,我要做微调小改动只用说就好了,比如我说把 xx 域名加进代理列表和去 pt 搜索 xx 电影下载两件完全不相干的事情也不用考虑,什么会话太长上下文压缩了,什么不相干导致缓存不命中了,什么 skill 太多起手 token 消耗太多了,真的不想操心
    LuliYanng
        38
    LuliYanng  
       2 days ago
    我在构思一个 voice agent 的交互 就像楼上说的 her 里面的 samantha 一样 不过感觉 emmm 。。语音这种低信息密度,而且模糊的交互方式 真的能做到像电影里 jarvis samantha 那样吗?大家会期待这样的一种交互吗
    rapiz
        39
    rapiz  
       2 days ago   ❤️ 1
    感觉你写得挺好的
    awanabe
        40
    awanabe  
       2 days ago
    脑电波
    deepbytes
        41
    deepbytes  
       1 day ago via iPhone
    星际穿越里面的机器人 TARS ,cli 界面的屏幕交互,可以执行物理世界的任务,可以跟人说话,可以调节幽默程度 balaba 。电影就是预言未来
    saltbo
        42
    saltbo  
       1 day ago
    自荐我的 AK 。https://github.com/saltbo/agent-kanban

    我已经用它重写了我几年前开源的 zpan ,除此之外已经做了好几个项目了,用了 ak 之后开发者只需要设计好反馈回路,然后就只需要专注于产品功能设计就行了,全部可以委托给 agent 去实现。当然前提是用最顶级的模型。
    deepbytes
        43
    deepbytes  
       1 day ago via iPhone
    @Charon2050 360 防病毒加入 ai 后就是你说的形态了
    wumoumou
        44
    wumoumou  
       1 day ago
    用意念交流
    fennu2333
        45
    fennu2333  
    OP
       1 day ago
    大家有看过 https://github.com/farzaa/clicky 这个项目不,当时看了感觉这个交互挺惊艳的,ai 在你的屏幕上有一个伴随鼠标,可惜最近好像不怎么更新了
    Haku
        46
    Haku  
       1 day ago
    @NakanoAzure multica 好啊,就喜欢这种不干扰我的队友/下属的形式
    jackOff
        47
    jackOff  
       1 day ago
    "贾维斯你懂我在想什么吗?","是的老大,我接收到您的脑电波指令了,您的想法很有趣,我已经实现了几个方案,要给您演示一下吗?"
    Zy143L
        48
    Zy143L  
       1 day ago
    随时语音+脑机接口 让我可以直接臆想编程
    xujiabin
        49
    xujiabin  
       1 day ago
    试用了一下,有点意思的
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   912 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 114ms · UTC 19:48 · PVG 03:48 · LAX 12:48 · JFK 15:48
    ♥ Do have faith in what you're doing.