这些工作为后续模块(如自注意力机制和前馈网络)的处理和任务执行奠定了基础。