本文共 132 字,大约阅读时间需要 1 分钟。
最初出自于《deep learning》,在MT && Abstractive Summarization的encoder训练中比较常用,先mark,有空来写。
转载于:https://www.cnblogs.com/wai7niu8/p/5688147.html