最近,AI Agent成为一个非常热门的话题。作为一个长期跟踪AI发展但已忘记如何编程的人,我一直在追逐前沿动态,试图更加高效地学习使用AI Agent,拓展自己的能力边界。

继5月份和AI一起从零开始制作一个功能不全的简易版Agent后,我将目光转向了已经颇具规模的成熟Agent,并选择了朋友推荐的新兴开源Agent——Hermes,然后将API选定为我的老朋友DeepSeek。开了高权限的Agent能做的事情非常多,不仅能和你搞出聊天bot、相对高效率地编程、对很多参数配置进行一句话修改,还能模拟键鼠绕过传统的反爬虫程序,读取不少东西。不过这个过程也并非一帆风顺,也会出现改错东西导致软件崩溃的情况,例如我在修改bot参数的时候,Agent会意外篡改原来的API信息,还会频繁切换输入法繁简体。

最让我意外的是DeepSeek。由于我对编程已经忘得差不多了,本地也没有很多编程工具和软件包,每次在调试程序时,我给出的提示词都比较模糊,导致精细调整时浪费了很多词元。在一次次不断地为本地Agent界面功能升级、自动输出skill以及编程的过程中,我的词元消耗量在短时间内达到了4.5亿。我不太清楚这个数字意味着什么,尤其是我的第一选择一直是DeepSeek,没有使用过其他公司的官网API。于是我向ChatGPT提出了这个问题:4.5亿词元是不是很多?它给出了回答:4.5亿词元非常多,相当于约3亿多个英文单词或3亿到4.5亿个汉字/字符级内容。如果一篇长稿按1万词元算,大概是4.5万篇长稿;如果一本书按10万到20万词元算,大概是2250到4500本书。按OpenAI当前官方价格,处理4.5亿词元的成本非常高昂,而我只需为此付出35块钱。

由于ChatGPT的回答超出了我的预期,我又问了一下,4亿词元用美国的API要多少钱?答案再次让我惊讶。根据ChatGPT、Gemini和Claude的说法,即便在最便宜的情况下,用GPT-5.4nano全输入4亿词元也要80美元。而如果是全输出,最贵的GPT-5.5会收费1.2万美元。也就是说,即便按美国主流模型中最便宜的报价计算,处理4.5亿词元的成本理论上也会是我这次DeepSeek所花成本的约17.5倍。