换 MiniMax-M3 之后,微信被 Hermes 刷爆了

2026年6月7日 6点热度 0人点赞 0条评论

模型从 M2.7 换到 M3。M3 没毛病——推理稳、JSON 干净、长任务不掉链子。但微信对话开始频繁触发消息限流。

根因

M2.7 偏"闷头做完"型,长任务里几乎不主动汇报。M3 严谨多了,会显式把计划、进度、子步骤说出来。

这本身是优点。但配上一个开关 display.interim_assistant_messages,每句"我先搜一下资料""读完了,再查另一个"都变成一条独立消息。任务中间汇报十几次,微信就被刷成消息瀑布。实测通过微信发送消息,Hermes 回复超过 10 条就触发限流。

这个开关只对 gateway 生效,控制模型中途的"自言自语"要不要单独发一条消息。微信消息永久、无法编辑,默认是开的——全局配了 interim_assistant_messages: true 就会被覆盖应用到微信。这就是踩的坑。

同样一句"帮我分析一下销售数据",M2.7 全程 1 句总结 + 1 个附件;M3 因为显式汇报计划 + 工具进度,把对话框刷成了消息瀑布。

M2.7 vs M3 微信消息量对比

修法

Hermes 配置按 profile 分文件。我的微信跑在 writer profile 下(~/.hermes/profiles/writer/config.yaml),要改这个文件。如果默认 profile(~/.hermes/config.yaml)也接了微信,同样要改一份。

显式把微信关掉:

display:
  interim_assistant_messages: false

配套压一压:

  • tool_progress: "off"——不要每个工具调用都打日志气泡
  • long_running_notifications: false——长任务的"⏳ Working — N min"心跳也关
  • busy_ack_detail: false——忙状态不要显示"iteration 21/60"这种调试细节

改完单次任务从 20+ 条压到 3-5 条。微信只剩必要节点 + 最终结果。

提醒

改了要 hermes gateway restart 才生效。

kenny

曾经是一位IT相关行业工作者...

文章评论