跳转到主要内容

博客

关于AI、软件、生活等的思考。短篇笔记和长篇写作。

🚀 主页升级|Next.js 模板 + Vercel 一键部署

2025年10月25日

从 Hugo + GitHub Pages 全面迁移到 Next.js + Vercel,不只是性能升级,更是架构自由的开始。这篇文章记录了我为个人主页做的一次‘大手术’,并正式开源了这套为研究者与开发者量身打造的模板。

阅读更多

《地球终夜》

2025年10月24日

当地球的最后一夜降临,三个逃亡者从废墟中带走了人类的火种。他们以为在越狱,却不知正越过命运的边界。

阅读更多

评价即创造:AI时代将重新定义人类的生产力

2025年10月15日

在AI飞速发展的时代,评价能力、判断力、审美能力正在成为新的生产力。人类对'好'与'美'的定义和判断,将重塑创造的本质与价值。从手工时代的完整闭环到AI时代的评价驱动,我们正在见证一场生产范式的根本性革命。

阅读更多

InfoBatch:动态数据集剪枝

2024年1月17日

多轮训练在简单、已学好的样本上浪费时间。InfoBatch 动态剪枝数据并重新缩放损失,以保持准确性,同时在视觉和语言任务上将训练速度提高 20-40%。

阅读更多

ZSCL:在不降低零样本迁移能力的情况下微调视觉-语言模型

2023年7月15日

视觉-语言模型的持续微调可能会损害零样本迁移。ZSCL 在特征空间和参数空间中添加简单约束,以保持零样本能力,同时提高下游性能。

阅读更多

CAME 优化器:Adam 性能与 Adafactor 内存需求

2023年7月14日

训练大语言模型需要大量内存。CAME 将内存使用降低到 Adafactor 水平,同时保持类似 Adam 的性能。

阅读更多