statustypedateslugsummarytagscategoryiconpassword Image encoder 这里先看 rel_pos rel_pos可以学习 在h w两维各自长度为 2l -1 反应向上向下一共多少种可能性 每种可能性对应head_dim的emb info 这里的两方向 rel_pos + attn + q → 真正attn Author:ran2323URL:https://www.blueif.me//article/18071a79-6e22-8064-af69-f313b9cf6ca6Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!致2025的你SFT Trainer