2.2.9 基于Transformer的大模型架构选择