推荐数据缩至1/5000,模型准确率却翻倍,谷歌新“蒸馏法”火了

博雯发自凹非寺量子位报道|公众号QbitAI在炼丹过程中,为了减少训练所需资源,MLer有时会将大型复杂的大模型“蒸馏”为较小的模型,同时还要保证与压缩前相当的结果。这就是知识蒸馏 [更多]
新闻
量子位
0 跟贴 0

用微信扫码二维码

分享至好友和朋友圈

热点新闻
进入关怀模式