AI 工作流,选图形界面,还是命令行?

这种组合,才是真正的灵活。你想到一个词儿了对吧?

Shuyi Wang
7 min readJul 9, 2024

在知识星球上,星友「土豆君」提问:

非常感谢王老师今天的思路分享,我是一名独立开发者,本来我都觉得沉浸式翻译已经做的非常好了,没有什么机会,但看到王老师分享的三步翻译法让我觉得翻译其实还是可以优化,自己可以去尝试构建翻译产品。

另外借此感谢下王老师一直以来的分享,从学术的视角科普 AI 的最新进展,推荐的很多开源项目或应用自己是不太可能关注到的,因为自己关注的焦点都在应用端。

而通过王老师让我了解到一些东西,比如 fabric。 我是最近通过 coze 才关注到 AI 工作流的,对这个非常感兴趣想尝试动手做一些有意思的小产品,主要也是看到 coze 构建的生态很强大,不仅能轻松构建工作流 (支持脚本 / 图片流 / 大模型 / 各种插件 / Agent 等),而且有很多用户自发开发的 Agent、插件、工作流,使得普通用户可以直接用构建好的 Agent,非常方便。

前几天直播我也看了,看了两遍才明白提到的一些 AI 工作流产品,crewai、autogen、human-in-the-loop。 我也从 fabric 看到一个多模态 Agent:PraisonAI。

但我只在最近用过 coze, 上面那些产品不太了解,请问下王老师你能再写篇文章详细讲下工作流吗?目前的 coze 形态跟你提到的那些工作流产品有些什么不一样呢?

还有我个人想请教一个问题,作为个人开发者,只有时间没有什么其他资源,想要应用工作流去快速构建 AI 相关的产品,技术上应该采取什么样的工作流方式?

比如,通过脚本 + GPT API 就可以实现 AI 工作流的一些操作,只是脚本构建起来会稍微困难一点。

那如果引入 fabric,脚本 + fabric,好像文字处理确实会简单很多,但如果遇到图片处理、搜索处理,还是需要自己去解决这些图片 / 搜索脚本的问题,这里可能会复杂一些。

那如果我使用 coze api, 通过 coze 工作流去构建我的 Agent,如果 coze 平台有图片处理、搜索处理相关的插件,那么构建就方便些,没有的情况就比较麻烦,而且依赖平台用户的插件,有不确定性。

那王老师直播提到的目前最新的几个工作流工具能轻松的解决我遇到的这个多模态分步骤处理的问题吗?以及最新的几个工作流工具有些什么用途?

或者说针对我想借助 AI 工作流构建新的小产品王老师有什么建议?

最后再感谢下王老师,关注公众号好久了,现在才加入进来😹。

--

--

Shuyi Wang

PhD in Information Science. Associate Professor at Tianjin Normal University. Former Adjunct Faculty at UNT. First Prize Winner of HackNTX 2018.