
“素人模型”冲上抱抱脸热榜
一位个人开发者竟在大厂林立中,杀进抱抱脸 Models Trending 榜前排。这一天,刷着抱抱脸的 Trending 榜,第一是智谱最新开源模型 GLM - 5.2,下载量 6 万多;第二是百度无限 OCR,能解析 40 多页文档,下载量 7 万。再往下,个人账号“yuxinlu1”占两个位置,下载量分别达 20.7 万和 53.6 万。此前一周,其模型霸榜,力压 GLM - 5.2,智谱负责人在 X 上公开推荐。
这波 Hugging Face 热榜,前排被大厂等占据,如智谱 GLM - 5.2、百度 Unlimited - OCR 等,还有国产开源大模型和图像生成方向的 Krea 等。其中夹着两个 luyuxin 的 12B GGUF 模型。
这两个新模型将 Fable 5 编程推理能力融入 Gemma4 - 12B 小模型,4.5GB 显存可本地、离线运行,零 API 成本。V1 是 Coder 版,训练数据“可验证”,教师数据来自 Cursor 的 Composer 2.5 和 Fable 5,发布后曾霸榜榜首。V2 是 agentic 版,增加多步工具调用能力,benchmark 测试得分约为基础性能 3.5 倍,但与 frontier 大模型有差距。作者提到 Fable 5 下线,用 Claude Opus 4.8(xhigh)补齐数据,微调数据约 1 万条,强调数据质量重要。
模型因可本地运行受关注,是 GGUF 量化版,用户可用多种工具加载。V1 最小 Q2_K 版本约 4.5GB,推荐 Q4_K_M 约 6.87GB,Q8_0 约 11.8GB;V2 最小可靠版本 Q3_K_M 约 5.7GB,推荐 Q4_K_M 约 6.87GB。作者剧透 V3 沿 12B 做 coding + agentic 方向,还在开发 Qwen3.6 - 27B 版本。
一个人,40 小时,杀进大厂中间
这位作者叫逯雨鑫,是美国高校 AI 方向在读研究生,本科学数据与商业分析,学过全栈开发。爆火模型是自费项目,做 V1 为自我提升,因学校知识更新慢。
为做模型,他用掉一个 Claude Max 20×套餐,V2 花 40 多小时,工作基本一人完成。硬件用 RTX 5090,显存 32GB VRAM,有 96GB 本地 SSD 资源,可调动约 128GB。数据处理最耗时,采用“滑动窗口”处理方式。
V1 和 V2 以 Gemma 4 - 12B 为底座,选择它是为挑战自己和 12B 尺寸有吸引力。逯雨鑫认为本地模型价值是“隐私”和“免费”。V1 发布后,起初没关注榜单,后排名飙升,他认真回复评论和 issue。
原来还是个爱看网文的…
在 HF 上,逯雨鑫发布 9 个公开模型。除爆火模型,还有“直接蒸 Claude”的模型和网文微调模型。网文微调模型分四个题材,基于 Qwen3.6,是他做模型的起点,因喜欢看小说,后因用户需求转向 coding 和 agentic 方向。
个人开发者的机会
逯雨鑫建议其他个人开发者“真诚和坚持”。真诚是如实说明模型强弱,坚持是接受负面声音。他认为开源艰难,即便登顶热榜也无直接收入。
他患有 ADHD,在 AI 领域成优势,认为“AI 时代是 ADHD 的天下”。他认为大厂有优势,但个人开发者无包袱,可专注解决具体痛点,这是个人开源作者的机会。
如果你想体验这款本地模型,链接如下:HF 地址:https://huggingface.co/yuxinlu1 。目前最适配的平台是 llama.cpp,优先推荐使用。

被折叠的 条评论
为什么被折叠?



