V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
huangyezhufeng
V2EX  ›  机器学习

BERT 论文复现: 经验 & 教训

  •  
  •   huangyezhufeng · 11 天前 · 374 次点击

    https://datahonor.com/blog/2025/11/02/bert/

    目录:

    关于我们做到了哪一步
    BERT 简介
    有趣的观察
        预训练过程的有趣现象
        数据非常非常重要
        从 Finetune 管窥预训练的威力
    错误与教训
        即使在极小数据集上也无法过拟合
        一次性预处理全量数据,CPU 加班,GPU 休假
        试图用临时手搓的玩意儿达到很好的性能
        workers 和 prefetch 因子设得过大导致 OOM
        没有优雅处理 DataLoader worker 的异常
        评估时使用了错误的 tokenizer
    最后
    
    2 条回复    2025-11-03 11:39:15 +08:00
    dryadent
        1
    dryadent  
       11 天前   ❤️ 1
    看错误和教训就知道是真正训练了的, [ workers 和 prefetch 因子设得过大导致 OOM] 这个是刚做的人经常会遇到的问题~
    huangyezhufeng
        2
    huangyezhufeng  
    OP
       11 天前
    @dryadent 👍,确实是踩过坑才知道:D
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   881 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 20:48 · PVG 04:48 · LAX 12:48 · JFK 15:48
    ♥ Do have faith in what you're doing.