博客

关于AI、软件、生活等的思考。短篇笔记和长篇写作。

🚀 主页升级｜Next.js 模板 + Vercel 一键部署

从 Hugo + GitHub Pages 全面迁移到 Next.js + Vercel，不只是性能升级，更是架构自由的开始。这篇文章记录了我为个人主页做的一次‘大手术’，并正式开源了这套为研究者与开发者量身打造的模板。

当地球的最后一夜降临，三个逃亡者从废墟中带走了人类的火种。他们以为在越狱，却不知正越过命运的边界。

在AI飞速发展的时代，评价能力、判断力、审美能力正在成为新的生产力。人类对'好'与'美'的定义和判断，将重塑创造的本质与价值。从手工时代的完整闭环到AI时代的评价驱动，我们正在见证一场生产范式的根本性革命。

多轮训练在简单、已学好的样本上浪费时间。InfoBatch 动态剪枝数据并重新缩放损失，以保持准确性，同时在视觉和语言任务上将训练速度提高 20-40%。

视觉-语言模型的持续微调可能会损害零样本迁移。ZSCL 在特征空间和参数空间中添加简单约束，以保持零样本能力，同时提高下游性能。

训练大语言模型需要大量内存。CAME 将内存使用降低到 Adafactor 水平，同时保持类似 Adam 的性能。