status
type
date
slug
summary
tags
category
icon
password
 

Image encoder

 
 
 
这里先看 rel_pos
 
rel_pos可以学习 在h w两维各自长度为 2l -1 反应向上向下一共多少种可能性 每种可能性对应head_dim的emb info
 
这里的两方向 rel_pos + attn + q → 真正attn
 
 
 
致2025的你SFT Trainer
Loading...
ran2323
ran2323
忘掉名字吧
Latest posts
SFT + DPO 塔罗解读
2025-4-14
Backtracking
2025-4-14
Leetcode 0001-1000 分组
2025-4-14
mcp 记录(1)
2025-4-14
DPO 相关
2025-3-29
今日paper(3/25) - MAGPIE
2025-3-27
Announcement
 
 
 
 
暂时没有新的内容
 
Catalog
0%