config.json 预训练模型调参

时间:2020-10-26 11:39:20   收藏:0   阅读:44

(来自BERT论文)

config文件定义了模型的超参数。

但是,由于此模型在64GB内存上训练,所以如果个人使用的话,需要调整超参数。

内存大小影响因子包括:

用默认训练脚本 (run_classifier.py 和 run_squad.py), 获得基准后的maximum batch size 在一个单独的 Titan X GPU (12GB RAM) 和 TensorFlow 1.11.0:

技术图片

BERT-large 的 max batch size相当小,以至于确实损害模型精度。我们正在努力增大batch size值。我们通过以下方法增加batch size值。

(后面与普通人无关)

评论(0
© 2014 mamicode.com 版权所有 京ICP备13008772号-2  联系我们:gaon5@hotmail.com
迷上了代码!