相对位置编码的详细阐述(绝对位置与相对位置编码)

宝塔服务器面板，一键全能部署及管理，送你10850元礼包，点我领取

一、基本概念

相对位置编码是一种用于序列标注的编码方法，可以通过将每个位置与每个不同位置之间的相对距离编码成向量，从而更好地表达位置之间的关系。在自然语言处理中，相对位置编码通常用于语言模型和序列标注任务。

相对位置编码不同于绝对位置编码，后者只关注每个位置在整个序列中的绝对位置，而相对位置编码则更加强调位置之间的相对关系。

二、相对位置编码的优势

1. 更好地捕捉语序关系

相对位置编码可以更好地捕捉语序关系，例如在语言模型中，相对位置编码可以表达相邻单词之间的先后顺序关系，从而更准确地预测下一个单词的概率。

2. 减少计算量

相对位置编码可以减少计算量，因为每个位置只需要编码与其他位置的相对距离，而不需要计算整个序列中每个位置的绝对位置。这样可以减少计算时间和空间复杂度。

3. 更好地应对长序列

相对位置编码可以更好地应对长序列，因为长序列中每个位置与其他位置之间的距离更大，相对位置编码可以更好地反映这种距离关系，从而更好地表达长序列中的语序关系。

三、相对位置编码的实现方式

1. Sinusoidal Positional Encoding

def sinusoidal_position_encoding(position, d_model):
    """
    生成给定位置的Sinusoidal位置编码向量。
    Args:
        position: 位置 (int)
        d_model: 向量维度 (int)
    Returns:
        该位置的Sinusoidal位置编码（向量）
    """
    exponent = 2 * np.arange(d_model // 2) / d_model
    # 将指数项作为角度计算正弦和余弦
    sinusoidal = np.zeros((position.shape[0], d_model))
    sinusoidal[:,::2] = np.sin(position[:,np.newaxis] * np.power(10000, exponent))
    sinusoidal[:,1::2] = np.cos(position[:,np.newaxis] * np.power(10000, exponent))
    return sinusoidal

Sinusoidal Positional Encoding 通过将每个位置的位置向量表示为正弦和余弦函数的组合来实现相对位置编码，以此减少计算复杂度。

2. Relative Positional Encoding

class RelativePositionalEncoding(nn.Module):
    def __init__(self, d_model, max_position, dropout=0.1):
        super(RelativePositionalEncoding, self).__init__()
        self.d_model = d_model
        self.max_position = max_position
        self.dropout = nn.Dropout(dropout)
 
        # 可学习的相对位置编码参数
        self.relative_embeddings = nn.Parameter(torch.randn(2 * max_position - 1, d_model // 2))
  
    def forward(self, query):
        batch_size, seq_len, d_model = query.size()
        # 生成包含0~(2*seq_len-2)的序列并将序列起始点调整到seq_len-1
        # 根据序列相对位置计算相对位置编码
        positions = torch.arange(0, 2 * seq_len - 1).to(query.device)
        positions[seq_len:] = positions[seq_len:] - (2 * seq_len - 1)
        distances = positions.unsqueeze(-1) - positions.unsqueeze(-2) + self.max_position - 1
        # 对distances进行clamp操作，因为范围不能超过[0, max_position*2-2]
        distances.clamp_(0, 2 * self.max_position - 2)
        # 根据distances在relative_embeddings上取数从而得到相对位置编码
        relative_embeddings = self.relative_embeddings[distances]
        # 在第二维上进行拼接
        relative_embeddings = relative_embeddings.view(-1, seq_len, seq_len, self.d_model//2).permute(0, 3, 1, 2)
        # 使用dropout防止过拟合
        relative_embeddings = self.dropout(relative_embeddings)
        return relative_embeddings

Relative Positional Encoding 将每个位置间的相对距离编码成一个可学习的参数，使用该参数作为相对位置编码的向量表示，以此表达位置之间的相对关系。

四、总结

相对位置编码是一种用于序列标注的编码方法，可以更好地表达序列中位置之间的相对关系。相对位置编码可以通过Sinusoidal Positional Encoding 或者 Relative Positional Encoding 实现。相对位置编码可以更好地捕捉语序关系，减少计算量，更好地应对长序列。

相对位置编码的详细阐述(绝对位置与相对位置编码)

一、基本概念

二、相对位置编码的优势

1. 更好地捕捉语序关系

2. 减少计算量

3. 更好地应对长序列

三、相对位置编码的实现方式

1. Sinusoidal Positional Encoding

2. Relative Positional Encoding

四、总结

Rar安装的详细教程(WinRAR安装教程)

电脑的风扇如何上油滚珠风扇如何上油

最新文章

足球经理2022助教怎么训练训练技巧分享

足球经理2022决断有什么用决断属性作用详细介绍

最终幻想7重制版螺旋飞行重炮怎么打打法技巧分享

特斯拉花 1500 万，「救急」了一家激光雷达公司

长安汽车全新 CS75 PLUS 完成工信部申报：轴距 2.8 米，搭载 1.5T 发动机

微软因 Cortana 专利侵权被判赔偿 2.42 亿美元

马斯克与曾毓群会“憋”出大招吗？

为巴黎奥运安保“铺路”，戛纳电影节将部署可识别可疑行为的 AI 摄像头

办什么卡无线流量划算-哪种卡无限流量

办个流量卡哪家划算些-办流量卡哪种好

最新评论

标签

关注我们么么哒！

相对位置编码的详细阐述(绝对位置与相对位置编码)

一、基本概念

二、相对位置编码的优势

1. 更好地捕捉语序关系

2. 减少计算量

3. 更好地应对长序列

三、相对位置编码的实现方式

1. Sinusoidal Positional Encoding

2. Relative Positional Encoding

四、总结

Rar安装的详细教程(WinRAR安装教程)

电脑的风扇如何上油滚珠风扇如何上油

最新文章

足球经理2022助教怎么训练 训练技巧分享

最新评论

标签

关注我们 么么哒！

关注我们的公众号

足球经理2022助教怎么训练训练技巧分享

关注我们么么哒！