LRC歌词
[ti:]
[ar:]
[al:]
[by:AI智能字幕]
[offset:0]
[00:00.00]本字幕由TME AI技术生成
[00:00.15]圈子里每天都有人在抱怨
[00:02.53]说自己装了最高级的系统
[00:04.95]跑了不到半个月
[00:06.45]收到账单直接傻眼
[00:08.53]一个月跑掉几千块钱的接口费
[00:11.37]这帮人觉得自己被大模型公司割了韭菜
[00:14.65]但真相是他们连底层怎么算钱的逻辑都没搞懂
[00:18.41]很多人对里面的名词完全不清楚
[00:20.93]有时候连钱花到哪儿都不知道
[00:23.01]官方的文档全是技术语言
[00:25.07]普通人看一眼就头晕
[00:27.05]今天这期节目
[00:28.39]我用最接地气的大白话把那些晦涩的技术名词全给你扒开
[00:34.58]看看你的钱到底流进了谁的口袋
[00:38.10]很多人第一次听到open clad
[00:40.54]以为是一个新的聊天对话框
[00:42.96]像你平时用的chat
[00:44.28]Gpt 或者豆包那种打开就能聊
[00:47.54]其实根本不是
[00:48.98]它本身不会说话
[00:50.74]也不会思考
[00:52.14]说白了
[00:52.96]它是一个让机器真正能干活的框架
[00:56.10]它是身体
[00:57.12]不是大脑
[00:58.36]这里说的大脑就是是模型
[01:01.15]模型是真正负责理解你说的话
[01:04.17]并且给你回答的那个东西
[01:06.41]Cloud gpt 四
[01:08.43]Deep sick
[01:09.47]豆包 Kimi
[01:10.83]这些全都是模型
[01:12.97]你花钱买api
[01:14.29]本质上就是在买大脑的思考时间
[01:17.25]而open cloud 这个框架不跟任何一个模型绑死
[01:21.75]你可以今天用国外的模型
[01:23.93]明天换国内的模型
[01:25.85]框架照样跑
[01:27.53]打个比方
[01:28.57]模型是发动机
[01:30.18]框架是整辆车
[01:31.76]发动机可以换
[01:33.08]车的结构不变
[01:34.40]你每次开车都要烧油
[01:36.20]但烧哪家的油是你自己定的
[01:38.58]这就带来了一个巨大的商业套利空间
[01:41.74]哪家最近出了更便宜的版本
[01:44.08]切过去就行
[01:45.22]根本不用换工具
[01:46.70]比如你做下沉市场的图文带货
[01:49.34]核心诉求是量大
[01:51.26]这时候你如果用最顶级的国外模型去批量生成文案
[01:55.62]你连电费都赚不回来
[01:57.42]但如果你切到国内极低费率的模型行
[02:00.53]生成的每一篇文案成本可能只有几厘钱
[02:03.75]大部分日常任务用便宜的小脑
[02:06.57]只有真正复杂的事情才挑贵的大脑
[02:09.59]这一条操作通常能省掉六七成以上的费用
[02:13.65]那具体的油钱到底怎么算
[02:15.79]这就必须搞懂token 这个词
[02:18.21]它是模型读懂你说的话的最小计费单位
[02:21.75]可以把它理解成一个字或半个单词
[02:24.67]大概来说
[02:25.67]一个单位差不多等于一个中文汉字
[02:28.53]你发的每一条消息
[02:30.28]他回的每一个字都会被换算成计费单位来收钱
[02:34.62]这里藏着一个绝大多数人没注意到的吸血陷阱
[02:38.44]你发过去的字和他回给你的字是分开算钱的
[02:42.66]而且他回你的部分通常比你问他的部分贵两到五倍
[02:47.98]也就是说
[02:49.22]他说的越多
[02:50.70]你花钱越多
[02:52.06]你让他多解释一点
[02:53.62]他就多收一点的钱
[02:55.46]不仅如此
[02:56.48]为了维持上下文记忆
[02:58.08]他每次回答你的时候
[02:59.68]都要把你们之前聊过的所有废话重新在后台跑一遍
[03:03.93]用高端接口的时候差距更夸张
[03:07.07]高级版本大概是基础版的十五倍价格
[03:10.39]但两个回答的都是差不多的问题
[03:13.31]你感觉就聊了几句
[03:14.87]一个月下来账单一看会吓一跳
[03:17.51]原因就在这里
[03:19.01]每一句话都在滚雪球
[03:21.09]一天聊几十条
[03:22.63]一个月就积成了天价
[03:24.53]所以你问钱花哪儿了
[03:26.11]很大一部分就是这个油钱消耗
[03:28.93]这个钱是你用的那个大模型公司按用量收的
[03:33.50]不是框架收的
[03:35.02]真正花钱的地方就两块
[03:36.96]一是让他跑起来的服务器租金
[03:39.26]二是每次对话消耗的这个油钱
[03:42.06]聊完算钱
[03:43.28]我们说回工具本身
[03:45.06]为什么它叫agent 智能体
[03:47.40]而不叫聊天机器人
[03:49.30]普通机器人是你问一句他答一句
[03:52.94]你不问
[03:53.72]他什么都不做
[03:55.04]而且每次新对话他都不知道你上次聊过什么
[03:59.28]完全从头开始
[04:01.15]智能体不一样
[04:02.75]你告诉他一个目标
[04:04.43]他自己想步骤自己去做
[04:06.95]做完了告诉你结果
[04:08.67]中间出错了他会自己调整再试
[04:11.61]根本不需要你盯着他
[04:13.63]比如你让他把客户邮件整理好家进日历
[04:17.13]你去睡觉
[04:18.43]醒来他已经干完了
[04:20.17]这事普通的聊天框绝对做不到
[04:22.71]但光会思考会规划还不够
[04:25.53]你让他发邮件
[04:26.65]他得先长出手脚会发邮件才行
[04:29.51]这就引出了下一个核心名词skill
[04:33.08]它就是装在框架里的技能插件
[04:36.52]每个插件对应一件具体的事情
[04:39.06]比如管日历
[04:40.60]读邮件
[04:41.50]写代码
[04:42.62]没有装某个插件
[04:44.30]他就不会做那件事
[04:46.42]你让他帮忙
[04:47.64]他只能告诉你他没这个能力
[04:49.90]打个比方
[04:50.94]你雇了一个很聪明的人
[04:52.80]但他没有公司大门的门禁卡
[04:55.02]就算再能干也进不了门
[04:57.30]装插件就是给他配各种门禁卡
[05:00.33]配了哪张卡
[05:01.67]他就能进那扇门干那件事
[05:04.11]这就是为什么两个人用一样的模型
[05:06.81]一个能帮你干一堆事
[05:08.51]另一个只会聊聊天
[05:10.15]差的就是装了多少插件
[05:12.27]社区里有人做好的现成包
[05:14.23]可以直接用
[05:15.33]自己有特殊需要也可以自己写一个
[05:18.35]说到接工具
[05:19.73]绕不开mcp 这个词
[05:21.87]这是一套规范协议
[05:23.55]听起来很绕
[05:24.65]但说的其实是一件极其现实的商业基建
[05:27.99]在他出来之前
[05:29.29]每个产品要接入外部工具
[05:31.40]都要专门写一套对接代码
[05:33.80]工具换了要重写
[05:35.56]大脑换了也要重写
[05:37.46]极其麻烦
[05:38.48]而且互不兼容
[05:40.26]这套规范的做法是大家都按同一套格式来
[05:44.78]工具按这个格式做好
[05:46.96]大脑也按这个格式去用
[05:49.64]类比就是电脑的usb 接口
[05:52.72]以前鼠标键盘各用各的接口
[05:55.66]买新设备还得配专用线
[05:58.24]现在统一之后
[05:59.32]任何和设备插进去就能用
[06:02.19]Mcp 想做的就是这个领域的usb
[06:05.71]这意味着别人做好的现成工具你可以直接拿来用
[06:10.15]不用自己一个个去配
[06:12.13]大脑有了
[06:13.31]技能装好了
[06:14.59]工具也接上了
[06:16.11]那你发的消息是怎么到他那里的
[06:18.83]这里要说最后三个词
[06:20.91]Channel
[06:21.63]Gateway
[06:22.43]Session
[06:23.27]Channel 就是接收端
[06:24.93]你发消息用的那个软件
[06:26.85]钉钉 飞书 微信
[06:28.91]每一个软件就是一个接收端
[06:31.16]你在哪个软件发
[06:32.54]他就在哪里回你
[06:33.92]Gateway 是中间站
[06:35.56]是收消息的枢纽
[06:37.14]所有前端发进来的消息都先汇到中间站这里
[06:41.18]他的工作就是判断这条消息是谁发的
[06:44.26]该转给哪个对话去处理
[06:46.52]他不做任何思考
[06:47.98]就是负责转发
[06:49.56]Session 是记忆库
[06:51.26]是记住你们聊天内容的单位
[06:53.70]每个档案保存了你们说过的所有话
[06:57.04]好处是你早上在钉钉问了一件事
[07:00.33]晚上打开飞书想继续聊
[07:02.49]只要还是同一个档案
[07:04.33]他记得之前说的所有细节
[07:07.01]而且这个档案是保存在本地文件里的
[07:09.93]重启也不会消失
[07:11.73]整个流程串起来就是你在某个软件发消息
[07:15.67]中间站把消息转给你的对话档案
[07:18.63]档案带着历史记录交给后方处理
[07:21.51]想好了用工具干完活
[07:23.41]再把结果发回给你的软件
[07:25.63]这套设计的好处是换个软件聊天对话不断换个模型
[07:31.34]既能照用
[07:32.40]每个部分出问题绝对不会牵连其他部分
[07:36.08]把这些词放在一起
[07:37.88]其实说的就是一件事
[07:39.72]一个可以二十四小时帮你干活
[07:42.58]记住你说过什么用你选的模型连接你常用软件的私人助手
[07:48.26]商业的底层永远是成本和算
[07:51.30]你现在去把每天让员工做的机械动作拆解一下
[07:55.42]算算需要耗费多少油钱
[07:57.92]现在拿出纸笔写上以下你目前业务流程里最不赚钱的三个环节
[08:03.71]去查一下如果把这三个环节交给便宜的大脑去跑
[08:08.11]每天的成本是多少
[08:09.95]再去对比一下你雇佣一个真人每个月要付出的底薪
[08:15.41]算不清楚这个数字
[08:17.03]就永远别提商业落地
[08:19.47]下一期我们讲讲怎么让这个算好账的系统接管你所有的聊天软件
[08:26.09]实现真正的流量节流
[ar:]
[al:]
[by:AI智能字幕]
[offset:0]
[00:00.00]本字幕由TME AI技术生成
[00:00.15]圈子里每天都有人在抱怨
[00:02.53]说自己装了最高级的系统
[00:04.95]跑了不到半个月
[00:06.45]收到账单直接傻眼
[00:08.53]一个月跑掉几千块钱的接口费
[00:11.37]这帮人觉得自己被大模型公司割了韭菜
[00:14.65]但真相是他们连底层怎么算钱的逻辑都没搞懂
[00:18.41]很多人对里面的名词完全不清楚
[00:20.93]有时候连钱花到哪儿都不知道
[00:23.01]官方的文档全是技术语言
[00:25.07]普通人看一眼就头晕
[00:27.05]今天这期节目
[00:28.39]我用最接地气的大白话把那些晦涩的技术名词全给你扒开
[00:34.58]看看你的钱到底流进了谁的口袋
[00:38.10]很多人第一次听到open clad
[00:40.54]以为是一个新的聊天对话框
[00:42.96]像你平时用的chat
[00:44.28]Gpt 或者豆包那种打开就能聊
[00:47.54]其实根本不是
[00:48.98]它本身不会说话
[00:50.74]也不会思考
[00:52.14]说白了
[00:52.96]它是一个让机器真正能干活的框架
[00:56.10]它是身体
[00:57.12]不是大脑
[00:58.36]这里说的大脑就是是模型
[01:01.15]模型是真正负责理解你说的话
[01:04.17]并且给你回答的那个东西
[01:06.41]Cloud gpt 四
[01:08.43]Deep sick
[01:09.47]豆包 Kimi
[01:10.83]这些全都是模型
[01:12.97]你花钱买api
[01:14.29]本质上就是在买大脑的思考时间
[01:17.25]而open cloud 这个框架不跟任何一个模型绑死
[01:21.75]你可以今天用国外的模型
[01:23.93]明天换国内的模型
[01:25.85]框架照样跑
[01:27.53]打个比方
[01:28.57]模型是发动机
[01:30.18]框架是整辆车
[01:31.76]发动机可以换
[01:33.08]车的结构不变
[01:34.40]你每次开车都要烧油
[01:36.20]但烧哪家的油是你自己定的
[01:38.58]这就带来了一个巨大的商业套利空间
[01:41.74]哪家最近出了更便宜的版本
[01:44.08]切过去就行
[01:45.22]根本不用换工具
[01:46.70]比如你做下沉市场的图文带货
[01:49.34]核心诉求是量大
[01:51.26]这时候你如果用最顶级的国外模型去批量生成文案
[01:55.62]你连电费都赚不回来
[01:57.42]但如果你切到国内极低费率的模型行
[02:00.53]生成的每一篇文案成本可能只有几厘钱
[02:03.75]大部分日常任务用便宜的小脑
[02:06.57]只有真正复杂的事情才挑贵的大脑
[02:09.59]这一条操作通常能省掉六七成以上的费用
[02:13.65]那具体的油钱到底怎么算
[02:15.79]这就必须搞懂token 这个词
[02:18.21]它是模型读懂你说的话的最小计费单位
[02:21.75]可以把它理解成一个字或半个单词
[02:24.67]大概来说
[02:25.67]一个单位差不多等于一个中文汉字
[02:28.53]你发的每一条消息
[02:30.28]他回的每一个字都会被换算成计费单位来收钱
[02:34.62]这里藏着一个绝大多数人没注意到的吸血陷阱
[02:38.44]你发过去的字和他回给你的字是分开算钱的
[02:42.66]而且他回你的部分通常比你问他的部分贵两到五倍
[02:47.98]也就是说
[02:49.22]他说的越多
[02:50.70]你花钱越多
[02:52.06]你让他多解释一点
[02:53.62]他就多收一点的钱
[02:55.46]不仅如此
[02:56.48]为了维持上下文记忆
[02:58.08]他每次回答你的时候
[02:59.68]都要把你们之前聊过的所有废话重新在后台跑一遍
[03:03.93]用高端接口的时候差距更夸张
[03:07.07]高级版本大概是基础版的十五倍价格
[03:10.39]但两个回答的都是差不多的问题
[03:13.31]你感觉就聊了几句
[03:14.87]一个月下来账单一看会吓一跳
[03:17.51]原因就在这里
[03:19.01]每一句话都在滚雪球
[03:21.09]一天聊几十条
[03:22.63]一个月就积成了天价
[03:24.53]所以你问钱花哪儿了
[03:26.11]很大一部分就是这个油钱消耗
[03:28.93]这个钱是你用的那个大模型公司按用量收的
[03:33.50]不是框架收的
[03:35.02]真正花钱的地方就两块
[03:36.96]一是让他跑起来的服务器租金
[03:39.26]二是每次对话消耗的这个油钱
[03:42.06]聊完算钱
[03:43.28]我们说回工具本身
[03:45.06]为什么它叫agent 智能体
[03:47.40]而不叫聊天机器人
[03:49.30]普通机器人是你问一句他答一句
[03:52.94]你不问
[03:53.72]他什么都不做
[03:55.04]而且每次新对话他都不知道你上次聊过什么
[03:59.28]完全从头开始
[04:01.15]智能体不一样
[04:02.75]你告诉他一个目标
[04:04.43]他自己想步骤自己去做
[04:06.95]做完了告诉你结果
[04:08.67]中间出错了他会自己调整再试
[04:11.61]根本不需要你盯着他
[04:13.63]比如你让他把客户邮件整理好家进日历
[04:17.13]你去睡觉
[04:18.43]醒来他已经干完了
[04:20.17]这事普通的聊天框绝对做不到
[04:22.71]但光会思考会规划还不够
[04:25.53]你让他发邮件
[04:26.65]他得先长出手脚会发邮件才行
[04:29.51]这就引出了下一个核心名词skill
[04:33.08]它就是装在框架里的技能插件
[04:36.52]每个插件对应一件具体的事情
[04:39.06]比如管日历
[04:40.60]读邮件
[04:41.50]写代码
[04:42.62]没有装某个插件
[04:44.30]他就不会做那件事
[04:46.42]你让他帮忙
[04:47.64]他只能告诉你他没这个能力
[04:49.90]打个比方
[04:50.94]你雇了一个很聪明的人
[04:52.80]但他没有公司大门的门禁卡
[04:55.02]就算再能干也进不了门
[04:57.30]装插件就是给他配各种门禁卡
[05:00.33]配了哪张卡
[05:01.67]他就能进那扇门干那件事
[05:04.11]这就是为什么两个人用一样的模型
[05:06.81]一个能帮你干一堆事
[05:08.51]另一个只会聊聊天
[05:10.15]差的就是装了多少插件
[05:12.27]社区里有人做好的现成包
[05:14.23]可以直接用
[05:15.33]自己有特殊需要也可以自己写一个
[05:18.35]说到接工具
[05:19.73]绕不开mcp 这个词
[05:21.87]这是一套规范协议
[05:23.55]听起来很绕
[05:24.65]但说的其实是一件极其现实的商业基建
[05:27.99]在他出来之前
[05:29.29]每个产品要接入外部工具
[05:31.40]都要专门写一套对接代码
[05:33.80]工具换了要重写
[05:35.56]大脑换了也要重写
[05:37.46]极其麻烦
[05:38.48]而且互不兼容
[05:40.26]这套规范的做法是大家都按同一套格式来
[05:44.78]工具按这个格式做好
[05:46.96]大脑也按这个格式去用
[05:49.64]类比就是电脑的usb 接口
[05:52.72]以前鼠标键盘各用各的接口
[05:55.66]买新设备还得配专用线
[05:58.24]现在统一之后
[05:59.32]任何和设备插进去就能用
[06:02.19]Mcp 想做的就是这个领域的usb
[06:05.71]这意味着别人做好的现成工具你可以直接拿来用
[06:10.15]不用自己一个个去配
[06:12.13]大脑有了
[06:13.31]技能装好了
[06:14.59]工具也接上了
[06:16.11]那你发的消息是怎么到他那里的
[06:18.83]这里要说最后三个词
[06:20.91]Channel
[06:21.63]Gateway
[06:22.43]Session
[06:23.27]Channel 就是接收端
[06:24.93]你发消息用的那个软件
[06:26.85]钉钉 飞书 微信
[06:28.91]每一个软件就是一个接收端
[06:31.16]你在哪个软件发
[06:32.54]他就在哪里回你
[06:33.92]Gateway 是中间站
[06:35.56]是收消息的枢纽
[06:37.14]所有前端发进来的消息都先汇到中间站这里
[06:41.18]他的工作就是判断这条消息是谁发的
[06:44.26]该转给哪个对话去处理
[06:46.52]他不做任何思考
[06:47.98]就是负责转发
[06:49.56]Session 是记忆库
[06:51.26]是记住你们聊天内容的单位
[06:53.70]每个档案保存了你们说过的所有话
[06:57.04]好处是你早上在钉钉问了一件事
[07:00.33]晚上打开飞书想继续聊
[07:02.49]只要还是同一个档案
[07:04.33]他记得之前说的所有细节
[07:07.01]而且这个档案是保存在本地文件里的
[07:09.93]重启也不会消失
[07:11.73]整个流程串起来就是你在某个软件发消息
[07:15.67]中间站把消息转给你的对话档案
[07:18.63]档案带着历史记录交给后方处理
[07:21.51]想好了用工具干完活
[07:23.41]再把结果发回给你的软件
[07:25.63]这套设计的好处是换个软件聊天对话不断换个模型
[07:31.34]既能照用
[07:32.40]每个部分出问题绝对不会牵连其他部分
[07:36.08]把这些词放在一起
[07:37.88]其实说的就是一件事
[07:39.72]一个可以二十四小时帮你干活
[07:42.58]记住你说过什么用你选的模型连接你常用软件的私人助手
[07:48.26]商业的底层永远是成本和算
[07:51.30]你现在去把每天让员工做的机械动作拆解一下
[07:55.42]算算需要耗费多少油钱
[07:57.92]现在拿出纸笔写上以下你目前业务流程里最不赚钱的三个环节
[08:03.71]去查一下如果把这三个环节交给便宜的大脑去跑
[08:08.11]每天的成本是多少
[08:09.95]再去对比一下你雇佣一个真人每个月要付出的底薪
[08:15.41]算不清楚这个数字
[08:17.03]就永远别提商业落地
[08:19.47]下一期我们讲讲怎么让这个算好账的系统接管你所有的聊天软件
[08:26.09]实现真正的流量节流
文本歌词
本字幕由TME AI技术生成
圈子里每天都有人在抱怨
说自己装了最高级的系统
跑了不到半个月
收到账单直接傻眼
一个月跑掉几千块钱的接口费
这帮人觉得自己被大模型公司割了韭菜
但真相是他们连底层怎么算钱的逻辑都没搞懂
很多人对里面的名词完全不清楚
有时候连钱花到哪儿都不知道
官方的文档全是技术语言
普通人看一眼就头晕
今天这期节目
我用最接地气的大白话把那些晦涩的技术名词全给你扒开
看看你的钱到底流进了谁的口袋
很多人第一次听到open clad
以为是一个新的聊天对话框
像你平时用的chat
Gpt 或者豆包那种打开就能聊
其实根本不是
它本身不会说话
也不会思考
说白了
它是一个让机器真正能干活的框架
它是身体
不是大脑
这里说的大脑就是是模型
模型是真正负责理解你说的话
并且给你回答的那个东西
Cloud gpt 四
Deep sick
豆包 Kimi
这些全都是模型
你花钱买api
本质上就是在买大脑的思考时间
而open cloud 这个框架不跟任何一个模型绑死
你可以今天用国外的模型
明天换国内的模型
框架照样跑
打个比方
模型是发动机
框架是整辆车
发动机可以换
车的结构不变
你每次开车都要烧油
但烧哪家的油是你自己定的
这就带来了一个巨大的商业套利空间
哪家最近出了更便宜的版本
切过去就行
根本不用换工具
比如你做下沉市场的图文带货
核心诉求是量大
这时候你如果用最顶级的国外模型去批量生成文案
你连电费都赚不回来
但如果你切到国内极低费率的模型行
生成的每一篇文案成本可能只有几厘钱
大部分日常任务用便宜的小脑
只有真正复杂的事情才挑贵的大脑
这一条操作通常能省掉六七成以上的费用
那具体的油钱到底怎么算
这就必须搞懂token 这个词
它是模型读懂你说的话的最小计费单位
可以把它理解成一个字或半个单词
大概来说
一个单位差不多等于一个中文汉字
你发的每一条消息
他回的每一个字都会被换算成计费单位来收钱
这里藏着一个绝大多数人没注意到的吸血陷阱
你发过去的字和他回给你的字是分开算钱的
而且他回你的部分通常比你问他的部分贵两到五倍
也就是说
他说的越多
你花钱越多
你让他多解释一点
他就多收一点的钱
不仅如此
为了维持上下文记忆
他每次回答你的时候
都要把你们之前聊过的所有废话重新在后台跑一遍
用高端接口的时候差距更夸张
高级版本大概是基础版的十五倍价格
但两个回答的都是差不多的问题
你感觉就聊了几句
一个月下来账单一看会吓一跳
原因就在这里
每一句话都在滚雪球
一天聊几十条
一个月就积成了天价
所以你问钱花哪儿了
很大一部分就是这个油钱消耗
这个钱是你用的那个大模型公司按用量收的
不是框架收的
真正花钱的地方就两块
一是让他跑起来的服务器租金
二是每次对话消耗的这个油钱
聊完算钱
我们说回工具本身
为什么它叫agent 智能体
而不叫聊天机器人
普通机器人是你问一句他答一句
你不问
他什么都不做
而且每次新对话他都不知道你上次聊过什么
完全从头开始
智能体不一样
你告诉他一个目标
他自己想步骤自己去做
做完了告诉你结果
中间出错了他会自己调整再试
根本不需要你盯着他
比如你让他把客户邮件整理好家进日历
你去睡觉
醒来他已经干完了
这事普通的聊天框绝对做不到
但光会思考会规划还不够
你让他发邮件
他得先长出手脚会发邮件才行
这就引出了下一个核心名词skill
它就是装在框架里的技能插件
每个插件对应一件具体的事情
比如管日历
读邮件
写代码
没有装某个插件
他就不会做那件事
你让他帮忙
他只能告诉你他没这个能力
打个比方
你雇了一个很聪明的人
但他没有公司大门的门禁卡
就算再能干也进不了门
装插件就是给他配各种门禁卡
配了哪张卡
他就能进那扇门干那件事
这就是为什么两个人用一样的模型
一个能帮你干一堆事
另一个只会聊聊天
差的就是装了多少插件
社区里有人做好的现成包
可以直接用
自己有特殊需要也可以自己写一个
说到接工具
绕不开mcp 这个词
这是一套规范协议
听起来很绕
但说的其实是一件极其现实的商业基建
在他出来之前
每个产品要接入外部工具
都要专门写一套对接代码
工具换了要重写
大脑换了也要重写
极其麻烦
而且互不兼容
这套规范的做法是大家都按同一套格式来
工具按这个格式做好
大脑也按这个格式去用
类比就是电脑的usb 接口
以前鼠标键盘各用各的接口
买新设备还得配专用线
现在统一之后
任何和设备插进去就能用
Mcp 想做的就是这个领域的usb
这意味着别人做好的现成工具你可以直接拿来用
不用自己一个个去配
大脑有了
技能装好了
工具也接上了
那你发的消息是怎么到他那里的
这里要说最后三个词
Channel
Gateway
Session
Channel 就是接收端
你发消息用的那个软件
钉钉 飞书 微信
每一个软件就是一个接收端
你在哪个软件发
他就在哪里回你
Gateway 是中间站
是收消息的枢纽
所有前端发进来的消息都先汇到中间站这里
他的工作就是判断这条消息是谁发的
该转给哪个对话去处理
他不做任何思考
就是负责转发
Session 是记忆库
是记住你们聊天内容的单位
每个档案保存了你们说过的所有话
好处是你早上在钉钉问了一件事
晚上打开飞书想继续聊
只要还是同一个档案
他记得之前说的所有细节
而且这个档案是保存在本地文件里的
重启也不会消失
整个流程串起来就是你在某个软件发消息
中间站把消息转给你的对话档案
档案带着历史记录交给后方处理
想好了用工具干完活
再把结果发回给你的软件
这套设计的好处是换个软件聊天对话不断换个模型
既能照用
每个部分出问题绝对不会牵连其他部分
把这些词放在一起
其实说的就是一件事
一个可以二十四小时帮你干活
记住你说过什么用你选的模型连接你常用软件的私人助手
商业的底层永远是成本和算
你现在去把每天让员工做的机械动作拆解一下
算算需要耗费多少油钱
现在拿出纸笔写上以下你目前业务流程里最不赚钱的三个环节
去查一下如果把这三个环节交给便宜的大脑去跑
每天的成本是多少
再去对比一下你雇佣一个真人每个月要付出的底薪
算不清楚这个数字
就永远别提商业落地
下一期我们讲讲怎么让这个算好账的系统接管你所有的聊天软件
实现真正的流量节流































