DeepMind指出「Transformer无法超出预训练数据实现泛化」,但有人投来质疑
栏目索引
相关内容