概念
FunctionCall / ToolCall / MCP / Skills
function call和tool call其实非常简单,最早是OpenAI提出的,简单来说就是发送json scheme给大模型(不是在Chat中),大模型就知道你有这个函数了,他会根据你的提示词决定是否要调用你传入的function。因为调用function使用的是结构化数据,因此就可以通过截获来让大模型返回结果化数据(比如python的Instruct库)
mcp最早是claude code中携带的功能,他的作用是将本地函数编程云函数,可以介入外部的mcp(比如阿里modelscope)
skills还没有使用过,但是应该是通过提示词注入的方式来给大模型添加限制
流式抗截断/假流式
流式抗截断主要是用于解决gemini免费模型(上半年免费提供gemini 2.5 pro)在返回时经常性截断,而大模型在流式返回时的协议规定,最后一个返回的片段为[done],当没有正常返回[done]的时候说明模型被截断了,因此中转服务会重新发给大模型供应商从截断的地方再次返回。
假流式就是先让中转站把大模型供应商的数据都获取完后,再流式返回给前端。
缓存
相比大模型刚出来的时候,我们可以明显发现价格是下降了的,因为有了缓存机制。比如Codex在缓存方面做的很好,因此每次请求仅消耗非常少的token数量。
前端/中转服务
我们知道各个大模型实际上提供了API接口,目前流行的主要有三种:
OpenAI Compatible / OpenAI Response
Anthropic
Gemini
一般来说各种提供大模型接口的软件都支持OpenAI Compatible接口。
但是很多地方还是没有兼容,因此就出现了:大模型前端,用于直接提供可视化接口;中转服务,用于转换接口
1. 前端
下面是一些前端
1.1 Cherry Studio
最热门的前端,最近被吐槽说臃肿

1.2 OpenWebUI
使用python/docker部署
1.3 LobeChat
提供桌面端、docker web部署,也比较臃肿(巨大)
2. 中转服务
2.1 NewAPi
oneapi的二开项目,主要特点是全
...(其实还有很多,但是估计也用不到( )
Vibe Coding
Vibe Coding 中译 氛围编程。简单来说就是让AI指哪打哪,你只要做最后的审查工作就可以了
1. 如何实现Vibe Coding
1.1 模型选择
目前的模型选择比较多了
国内:deepseek v3.2、GLM 4.7、Minimax 2.1、kimi k2(好像掉队了)
国外:Claude sonnet 4.5、Claude opus 4.5、GPT-5.2-codex、Gemini-3.0-pro-preview(后面有我白嫖的方式/教程)
国内的模型价格便宜,deepseek适合数学推理,后面两个对coding进行了优化(GLM拼车更便宜),国外的模型也有各种白嫖的方法,各个模型都有各自的优势。
Claude sonnet 4.5: 实测代码能力第二,相比opus价格稍微便宜一点
Claude opus 4.5: 代码能力第一,价格贵
GPT: 快
Gemini-3.0-pro-preview: 多模态上最强,识图、仿照构建网站能力最强
1.2 工具选择
(1) Cline / Roo Code / Kilo Code (开源)
这三个是一脉相承的,提供可视化界面、回滚机制、多接口适配(我个人推荐Kilo Code,jetbrains[pycharm、idea]、vscode都有插件提供)
配置:

往下翻,要根据大模型的上下文来设定,一般来说100k-200k就可以了,太长实际上效果就大大下降了。
然后使用Code模式就可以指挥大模型让AI开发了。
(2) Claude Code / Codex / Gemini cli (开源)
这些都是命令行的vibe coding工具,支持最好的肯定是官方提供的工具,特别是Codex,Codex套餐几乎只能在Codex Cli中使用
如果要使用cli开发的话,最推荐的还是Claude Code,出来最早,生态最成熟(skills),很多模型供应商都支持(比如GLM、DS)
如果决定这些官方Cli工具不太行,可以使用其他的开源Cli工具进行替代,例如:OpenCli
(3) Cursor / kiro / Trae / Warp / Argument / Antigravity
这里我只使用过Cursor。Cursor基于vscode开发,兼容性自然不必说,而且是这些工具最早出来的,Auto模式下也有非常不错的体验。缺点是贵(20$,每个月500$的用量)。但是也有解决方法,cursor普通账户有一定余额的试用(仅能用Auto模式),不要想着自己重新注册,官网有各种方式检测你的设备信息(当然用开源工具注册除外),咸鱼50块就能买到无限续杯(一键换号)
2. 如何愉快的进行Vibe Coding
2.1 前端开发
前端开发对于大模型来说已经非常简单了,只需要一张截图/一次对话就能生成比较好的结果了。早在claude sonnet 4.5时,就能通过一张截图复刻一个网站了。
2.2 后端开发
如果要想要一次性生成一个项目,需要你详细的提示词(生成小项目),否则他只能生成简单的增删改查。
以课设医疗系统举例:
开发环境:Claude Code 项目规划 + Gemini 2.5 pro编写代码 + Kilo Code
开发要求:FastApi + Peewee(ORM)
最终效果:增删改查 + 登录功能
开发效果完全不达标,因此,开发步骤应该是:
帮我搭建FastApi的基本框架,配置使用 env + config.toml 使用 pydantic验证
帮我添加登录功能,使用jwt
帮我....(然后休息一下喝茶去吧)
白嫖模型
其实有很多公益站,比如下面是我的
拥有各种模型,包括claude、gemini、gpt
支持kilo、cherry studio,随便用
如何低价/免费使用大模型
1. 拼好模(低价)
GLM、MiniMax、Codex都有拼车渠道,可以去咸鱼拼车,或者拼车网站(下面都是codex):
2. Google One 学生优惠(自行注册很难成功)(低价)
学生优惠1年时间,可以选择咸鱼购买(我亲眼看见从20块涨到80块,马上要没有了)或者自己注册
自己注册需要有以下条件
干净IP注册的谷歌账号(美区)
干净的美区节点
指纹浏览器
纸飞机账号
访问https://goo.gle/freepro,如果显示可以订阅的话,根据项目:https://github.com/ThanhNguyxn/SheerID-Verification-Tool的教程完成就可以了,然后在咸鱼上5块买个临时信用卡绑定上去,就能开启学生优惠。此外,一个pro账户下面可以开启家庭组,最多邀请5人,每个人接受邀请后都是one pro会员。目前one pro会员可以几乎无限次数使用包含gemini cli中的gemini-3.0-pro,以及antigravity中的claude opus 4.5 + gemini-3.0-pro-preview + nanobanana pro + web端gemini pro。如果想要在Kilo上使用的话,可以使用https://github.com/su-kaka/gcli2api
3. iflow (免费,国内模型)
直接注册获取api调用,或者用他们推出的ifow cli