Gemma 4 12B和Qwen 3.6 评测
先说说我的配置: Mac mini M4 Pro,64G内存,1T SSD,Sequoia 15.7.7 LM Studio 0.4.16 模型:gemma-4-12B、gemma-4-12B-it-q8、qwen3.6-27b-q8 昨天 Gemma 4 12B 原生多模态发布,我在 LM Studio 上试了下,体验很一般,原生和量化的模型速度都很慢,最快只有 20 token/s...
先说说我的配置: Mac mini M4 Pro,64G内存,1T SSD,Sequoia 15.7.7 LM Studio 0.4.16 模型:gemma-4-12B、gemma-4-12B-it-q8、qwen3.6-27b-q8 昨天 Gemma 4 12B 原生多模态发布,我在 LM Studio 上试了下,体验很一般,原生和量化的模型速度都很慢,最快只有 20 token/s...
我做为一个程序员,从最开始的小龙虾,一直折腾到 Hermes 河马,中间见过太多小白踩坑, 特别是小龙虾,从入门到放弃😆,每天都在修它,而不是再用它 以及 Hermes,虽然相比小龙虾稳定多了,但对非技术的人来说,从零搭一套能稳定跑的 AI 助理,还是挺难的。 所以我把自己踩过的坑、群友问过最多的问题,整理了一份教程 希望能帮到想入门 Hermes 和 AI 助理,但不知道从哪下手的你...
多 Agent 协作,是当下最热门的表演项目。 一张架构图里塞十几个 Agent:研究、写作、代码、审查、规划、执行……看起来很热闹,很“先进”。 但我越来越觉得,这个方向容易走偏。 一个人不该直接管一堆 Agent。精力有限,不可能每种任务都手动挑一个专门的 Agent,再去判断谁先做、谁后做、谁来检查谁。 老板也不会直接管所有员工,可行的组织方式,一定是分层的。...
这两天给 ShareThis.Chat 加了图片、音频上传、长文分页功能
现在你分享的内容不再只有文字,也可以直接包含图片和音频
另外也处理了一个用户反馈:不同模型在执行 Skill 时,有时会走出完全不同的方法和步骤,结果很不稳定。
所以这次我把 Skill 文档也重新整理了一遍,少写描述,多写具体步骤,用更明确的执行路径约束 Agent 行为。
同时还添加了长内容和压缩上下文的处理方式,不会再出现压缩摘要和真实聊天内容重复的问题
整个 SKill 文档从原来的近 3000 字,减少到了 1300 字左右
有娃: 早上5点被小儿子闹醒,喝奶洗漱,在床上陪玩(我再眯一会,顺便被他玩) 6点40起床,给女儿和老婆准备早餐,洗奶瓶洗奶嘴收拾被褥,打开洗衣机,继续陪玩,期间打开电脑,准备上班内容,看看有什么单子要做 7点,叫女儿起床,开始吃饭,防止小儿子闹事 8点,送女儿上学回来,晾衣服,收拾碗筷,把小儿子交给老婆,回到电脑前发会呆准备上班 -------- 没娃: 醒了,缠绵会,起床,跑步,吃饭,上班
听说 Hermes 最近迭代了很多,稳定了很多,下午我让openclaw 去安装 hermes,还挺顺利,有惊无险,先用几天看看分享下整个对话过程https://t.co/bxCvMGBGJ2
再次卸载了 Hermes Agent,太傻了,和 OpenClaw 比差的不是一点两点,严重怀疑那些吹它聪明的人,有没有深入用过?我的版本号:V0.11.0
列举下我遇到的主要问题:
这几天的使用感受甚至还不如我几个月前用 Pi-Agent 的体验好
除了升级丝滑、响应快以外,没有任何优点。
完。
今天下午微信群里在聊 Hermes 和 OpenClaw。 有个群友说了一句挺有代表性的话:这些工具本质上都是过渡性的炮灰产品。大模型迟早会把这些能力自己集成掉,应用层工具不会有什么位置。 我觉得他说得没错。 但也只对了一半。 这些工具当然是实验性的,甚至很多现在看起来很热闹的东西,过半年可能就没人用了。AI 时代的工具淘汰速度太快了,今天刚搭好的工作流,明天模型一更新,可能就直接原地报废。...