200字
大模型入门指南
2025-12-24
2025-12-24

概念

FunctionCall / ToolCall / MCP / Skills

function call和tool call其实非常简单,最早是OpenAI提出的,简单来说就是发送json scheme给大模型(不是在Chat中),大模型就知道你有这个函数了,他会根据你的提示词决定是否要调用你传入的function。因为调用function使用的是结构化数据,因此就可以通过截获来让大模型返回结果化数据(比如python的Instruct库)

mcp最早是claude code中携带的功能,他的作用是将本地函数编程云函数,可以介入外部的mcp(比如阿里modelscope)

skills还没有使用过,但是应该是通过提示词注入的方式来给大模型添加限制

流式抗截断/假流式

流式抗截断主要是用于解决gemini免费模型(上半年免费提供gemini 2.5 pro)在返回时经常性截断,而大模型在流式返回时的协议规定,最后一个返回的片段为[done],当没有正常返回[done]的时候说明模型被截断了,因此中转服务会重新发给大模型供应商从截断的地方再次返回。

假流式就是先让中转站把大模型供应商的数据都获取完后,再流式返回给前端。

缓存

相比大模型刚出来的时候,我们可以明显发现价格是下降了的,因为有了缓存机制。比如Codex在缓存方面做的很好,因此每次请求仅消耗非常少的token数量。

前端/中转服务

我们知道各个大模型实际上提供了API接口,目前流行的主要有三种:

  1. OpenAI Compatible / OpenAI Response

  2. Anthropic

  3. Gemini

一般来说各种提供大模型接口的软件都支持OpenAI Compatible接口。

但是很多地方还是没有兼容,因此就出现了:大模型前端,用于直接提供可视化接口;中转服务,用于转换接口

1. 前端

下面是一些前端

1.1 Cherry Studio

最热门的前端,最近被吐槽说臃肿

1.2 OpenWebUI

使用python/docker部署

1.3 LobeChat

提供桌面端、docker web部署,也比较臃肿(巨大)

2. 中转服务

2.1 NewAPi

oneapi的二开项目,主要特点是全

...(其实还有很多,但是估计也用不到( )

Vibe Coding

Vibe Coding 中译 氛围编程。简单来说就是让AI指哪打哪,你只要做最后的审查工作就可以了

1. 如何实现Vibe Coding

1.1 模型选择

目前的模型选择比较多了

国内:deepseek v3.2、GLM 4.7、Minimax 2.1、kimi k2(好像掉队了)

国外:Claude sonnet 4.5、Claude opus 4.5、GPT-5.2-codex、Gemini-3.0-pro-preview(后面有我白嫖的方式/教程)

国内的模型价格便宜,deepseek适合数学推理,后面两个对coding进行了优化(GLM拼车更便宜),国外的模型也有各种白嫖的方法,各个模型都有各自的优势。

  • Claude sonnet 4.5: 实测代码能力第二,相比opus价格稍微便宜一点

  • Claude opus 4.5: 代码能力第一,价格贵

  • GPT: 快

  • Gemini-3.0-pro-preview: 多模态上最强,识图、仿照构建网站能力最强

1.2 工具选择

(1) Cline / Roo Code / Kilo Code (开源)

这三个是一脉相承的,提供可视化界面、回滚机制、多接口适配(我个人推荐Kilo Code,jetbrains[pycharm、idea]、vscode都有插件提供)

配置:

往下翻,要根据大模型的上下文来设定,一般来说100k-200k就可以了,太长实际上效果就大大下降了。

然后使用Code模式就可以指挥大模型让AI开发了。

(2) Claude Code / Codex / Gemini cli (开源)

这些都是命令行的vibe coding工具,支持最好的肯定是官方提供的工具,特别是Codex,Codex套餐几乎只能在Codex Cli中使用

如果要使用cli开发的话,最推荐的还是Claude Code,出来最早,生态最成熟(skills),很多模型供应商都支持(比如GLM、DS)

如果决定这些官方Cli工具不太行,可以使用其他的开源Cli工具进行替代,例如:OpenCli

(3) Cursor / kiro / Trae / Warp / Argument / Antigravity

这里我只使用过Cursor。Cursor基于vscode开发,兼容性自然不必说,而且是这些工具最早出来的,Auto模式下也有非常不错的体验。缺点是贵(20$,每个月500$的用量)。但是也有解决方法,cursor普通账户有一定余额的试用(仅能用Auto模式),不要想着自己重新注册,官网有各种方式检测你的设备信息(当然用开源工具注册除外),咸鱼50块就能买到无限续杯(一键换号)

2. 如何愉快的进行Vibe Coding

2.1 前端开发

前端开发对于大模型来说已经非常简单了,只需要一张截图/一次对话就能生成比较好的结果了。早在claude sonnet 4.5时,就能通过一张截图复刻一个网站了。

2.2 后端开发

如果要想要一次性生成一个项目,需要你详细的提示词(生成小项目),否则他只能生成简单的增删改查。

以课设医疗系统举例:

开发环境:Claude Code 项目规划 + Gemini 2.5 pro编写代码 + Kilo Code

开发要求:FastApi + Peewee(ORM)

最终效果:增删改查 + 登录功能

开发效果完全不达标,因此,开发步骤应该是:

  1. 帮我搭建FastApi的基本框架,配置使用 env + config.toml 使用 pydantic验证

  2. 帮我添加登录功能,使用jwt

  3. 帮我....(然后休息一下喝茶去吧)

白嫖模型

其实有很多公益站,比如下面是我的

newapi

拥有各种模型,包括claude、gemini、gpt

支持kilo、cherry studio,随便用

如何低价/免费使用大模型

1. 拼好模(低价)

GLM、MiniMax、Codex都有拼车渠道,可以去咸鱼拼车,或者拼车网站(下面都是codex):

codexzhright

2. Google One 学生优惠(自行注册很难成功)(低价)

学生优惠1年时间,可以选择咸鱼购买(我亲眼看见从20块涨到80块,马上要没有了)或者自己注册

自己注册需要有以下条件

  1. 干净IP注册的谷歌账号(美区)

  2. 干净的美区节点

  3. 指纹浏览器

  4. 纸飞机账号

访问https://goo.gle/freepro,如果显示可以订阅的话,根据项目:https://github.com/ThanhNguyxn/SheerID-Verification-Tool的教程完成就可以了,然后在咸鱼上5块买个临时信用卡绑定上去,就能开启学生优惠。此外,一个pro账户下面可以开启家庭组,最多邀请5人,每个人接受邀请后都是one pro会员。目前one pro会员可以几乎无限次数使用包含gemini cli中的gemini-3.0-pro,以及antigravity中的claude opus 4.5 + gemini-3.0-pro-preview + nanobanana pro + web端gemini pro。如果想要在Kilo上使用的话,可以使用https://github.com/su-kaka/gcli2api

3. iflow (免费,国内模型)

网站:https://platform.iflow.cn

直接注册获取api调用,或者用他们推出的ifow cli

评论