1. Transformer是什么
Transformer
是一个利用注意力机制来提高模型训练速度的模型。关于注意力机制可以参看这篇文章,trasnformer可以说是完全基于自注意力机制的一个深度学习模型,因为它适用于并行化计算,和它本身模型的复杂程度导致它在精度和性能上都要高于之前流行的RNN循环神经网络。
对于RNN来说它一般只关注附近的关系关联,而没有从全局寻找关系紧密的相关特征。因此对于一些特定的场景,不能够很好的处理。而Transforme放眼全局,通过计算权重得到相应的向量,得到更为全面的特征