BERT的代码实现

原创

已于 2024-09-22 22:26:30 修改 · 1.5k 阅读

标签

#bert #人工智能 #python #自然语言处理 #pytorch

收录于

于 2024-09-22 22:26:03 首次发布

2.3.1任务一：Masked Language Modeling MLM掩蔽语言模型任务

2.3.2 任务二：next sentence prediction

3.整合代码

4.知识点个人理解

1.BERT的理论

BERT全称叫做Bidirectional Encoder Representations from Transformers, 论文地址: [1810.04805] BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding (arxiv.org)

BERT是谷歌AI研究院在2018年10月提出的一种预训练模型. BERT本质上就是Transformer模型的encoder部分, 并且对encoder做了一些改进.

官方代码和预训练模型 Github: https://github.com/google-research/bert

下图中编码器部分即BERT的基本结构.

2.代码实现

import torch
from torch import nn
import dltools

2.1构建输入数据格式

def get_tokens_and_segments(tokens_a, tokens_b=None):
    #classification 分类
    #BERT是两句话作为一对句子一同传入的，也可以单独传一句话，若序列长度长，可以补padding
    #假设先传一句话tokens_a
    tokens = ['<cls>'] + tokens_a + ['<sep>']  #tokens_embedding层的处理
    segments = [0] * (len(tokens_a) + 2)  #判断词元属于哪一句话，加标记，0属于第一句话
    if tokens_b is not None:
        tokens += tokens_b + ['sep']
        segments += [1] * (len(tokens_b) + 1)
    return tokens, segments


#测试上面的函数
get_tokens_and_segments([1, 2, 3], [4, 5, 6])

(['<cls>', 1, 2, 3, '<sep>', 4, 5, 6, 'sep'], [0, 0, 0, 0, 0, 1, 1, 1, 1])

2.2定义BERT编码器的类

class BERTEncoder(nn.Module):
    #由

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Hiweir ·

关注关注

15
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

BERT代码解析

qq_41898761的博客

05-19

3625

一、bert的原理 1、最核心的一点是：MLM损失函数的计算什么是MLM损失函数？损失函数就是用来表现预测与实际数据的差距程度-----我根据数据预测出一个函数来预测我之后的变化，而损失函数就是L=(Y-f（x）)2，最后计算一个平均损失函数求和的值来表示差距。 MLM损失函数：这个任务就是将sentence中一些token进行掩盖，模型会输出这些掩盖的token的隐藏状态，将这些隐藏状态输入softmax可以得到候选单词的概率分布，这样根据ground truth就可以计算cross entropy

参与评论您还未登录，请先登录后发表或查看评论

Bert代码详解（一）

cpluss的博客

03-12

3万+

这是bert的pytorch版本（与tensorflow一样的，这个更简单些，这个看懂了，tf也能看懂），地址：https://github.com/huggingface/pytorch-pretrained-BERT 主要内容在pytorch_pretrained_bert/modeling文件中。由于这几天要参见计算所复试，超级紧张，所以先把草稿贴在这里，复试过了再加以完善！！！嘤嘤...

Bert模型

最新发布

ctlover的博客

04-03

210

堆叠多层，训练出一个懂语言的通用大脑。

BERT模型具体代码实现

my的博客

12-05

1913

这篇文章简要实现了一个BERT模型

Bert模型介绍及代码解析（pytorch）

gary101818的博客

04-12

1万+

21.Bert（预训练模型）动机基于微调的NLP模型预训练的模型抽取了足够多的信息新的任务只需要增加一个简单的输出层注：bert相当于只有编码器的transformer 基于transformer的改进每个样本是一个句子对加入额外的片段嵌入位置编码可学习 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-DwkojOLg-1649776319364)(C:\Users\pc\AppData\Roaming\Typora\typora-user-images

BERT代码解读

wangpan007的博客

08-01

6083

文章目录本文框架1. BERT定义2. BERT实现2.1 BERT输入2.1.1 Token Embeddings（input_ids）2.1.2. Segment Embeddings（token_type_ids）2.1.3 Position Embeddings（attention_mask）2.2 预训练2.2.1 获取序列的embeddings2.2.2 利用Transformer对序列进行编码3.我的做法4. 结果5. 下一步打算本文框架 1. BERT定义 BERT全称Bidirecti

BERT训练环节（代码实现）

Hiweir的博客

09-24

1837

【代码】BERT训练环节（代码实现）

94. BERT以及BERT代码实现

weixin_47505105的博客

01-30

1674

笔记

Bert模型特征提取代码实现

qq_51925699的博客

10-02

2083

为了适应模型处理的需要，input_ids的长度被规范化为一个固定的值。在这个规范化过程中，长度超出预定值的输入会被截断，而短于此长度的输入则通过添加特定的填充标记（[PAD]，通常对应的整数标识符为0）来补齐。及其衍生体中，输入文本首先经过一个分词处理流程，其中文本被细分为单词或子单词（subwords），每个分词随后映射到一个唯一的整数标识符。Bert官网已经有训练好的Bert模型，即下载可以使用，在训练模型时，需要保证不对Bert模型参数进行修改。vocat.txt存储的语料库。

Bert详细学习及代码实现详解

银晗的学习博客

08-07

3376

BERT的全称是Bidirectional Encoder Representation from Transformers，即双向Transformer的Encoder，因为decoder是不能获要预测的信息的。模型的主要创新点都在方法上，即用了Masked LM和两种方法分别捕捉词语和句子级别的representation。

一文彻底搞懂Bert（代码+手撕）

Z4400840的博客

08-16

7511

在不断发展的自然语言处理（NLP）领域中，一项被称为 BERT 的突破性创新已经崭露头角，成为一场变革的推手。BERT代表双向编码器来自 Transformer 的表示，它不仅仅是机器学习术语浩瀚海洋中的又一个缩写。它代表了机器理解语言方式的转变，使它们能够理解使人类沟通丰富而有意义的复杂细微差异和上下文依赖关系。

深度学习（九）：bert之代码实现

m0_68926749的博客

12-26

2212

处理的过程包括：将标签移动到指定的设备，将数据传递给模型得到预测结果，将预测结果的最大值的索引作为预测的类别，然后将预测结果和标签转换为列表，最后添加到总的预测结果和真实标签中。这些参数包括训练、验证和测试数据的文件路径，BERT预训练模型的路径，分类的数量，最大文本长度，批次大小，训练周期数，学习率，BERT模型的过滤器数量，以及最佳模型和最后模型的保存路径。处理的过程包括：将标签移动到指定的设备，将数据传递给模型得到预测结果，计算损失，清空优化器的梯度，反向传播，更新参数，累加损失。

bert模型代码介绍

热门推荐

yiyele的博客

05-06

3万+

关于bert模型的细节记录 1. Input 1.1. pretrain 输入包含七个部分,分别为 input_ids,input_mask,segment_ids,masked_lm_positions,mask_lm_ids,masked_lm_weights,next_sentence_labels. input_ids:表示tokens的ids input_mask:表示哪些是inpu...

BERT代码逐行逐句详解版（pytorch版本）

zjs975584714的博客

10-08

6616

最近入门BERT，在网上观看了一些网课视频理解了原理，并且找到了pytorch版本的源码，经过一遍阅读有了初步的认知，所以在此记录，温故而知新。本文所解读的源码链接为：https://github.com/daiwk/BERT-pytorch/tree/master/bert_pytorch 其整体代码框架如下（有些部分我也略有改动，但整体不影响）：解读一个项目的代码，自然要从main开始，所以我们打开main.py（项目中是__main__.py）后看到首先是对一些路径参数的填写： .

Python自然语言处理-BERT模型实战

10-21

购买课程后，添加小助手微信（微信号：itxy41）回复【唐宇迪】进入学习群，获取唐宇迪老师答疑Python自然语言处理-BERT模型实战课程旨在帮助同学们快速掌握当下NLP领域最核心的算法模型BERT的原理构造与应用实例。通俗讲解BERT模型中所涉及的核心知识点（Transformer,self-attention等），基于google开源BERT项目从零开始讲解如何搭建自然语言处理通用框架，通过debug源码详细解读其中每一核心代码模块的功能与作用。最后基于BERT框架进行中文情感分析与命名实体识别等主流项目实战，提供全部课程资料，包括PPT,数据,代码。

BERT（Transformer Encoder）详解和TensorFlow实现（附源码）

专注AI领域

06-07

4599

单向语言模型会限制模型的表征能力，使其只能获取单方向的上下文信息，而BERT利用双向注意力来构建整个神经网络，因此最终生成能融合左右上下文信息的深层双向语言表征，即真正意义上的Bi-Directional Context信息。在实际的训练中，通常另训练集中的50%符合IsNext关系，另外50%的第二句话随机从语料中提取，它们的关系是NotNext，并将这个关系保存在[CLS]中。下图展示了BERT在11种各不同任务中的模型，它们只需要在BERT的基础上再添加一个输出层便可以完成对特定任务的微调。

简洁高效的 NLP 入门指南: 200 行实现 Bert 文本分类 (Pytorch 版)

我是小白呀的博客

12-15

1528

探索NLP的世界：这篇入门指南详细介绍了如何在仅200行代码内使用Pytorch实现Bert文本分类。适合初学者和中级开发者，本指南深入浅出地讲解了Bert模型的基础知识、环境搭建、数据处理及模型训练，是理解和应用NLP的理想起点。

【深度学习】基于BERT模型的情感分析（附实战完整代码+数据集）

aaaa_hsjsueu的博客

02-15

2万+

情感分类是一个快速发展的研究领域，尽管众多模型和数据集在二分类任务中显示出很高的准确性，但细粒度的情感分类任务仍然是一个很大改进空间的领域。分析SST-5数据集，Munikar等人的先前工作表明，嵌入工具BERT允许使用简单的模型来实现最新的准确性。

【自注意力机制必学】BERT类预训练语言模型（含Python实例）

Moresweet 猫甜

06-22

1万+

BERT（Bidirectional Encoder Representations from Transformers）是一种预训练模型，它是自然语言处理（NLP）领域的重大里程碑，被认为是当前的State-of-the-Art模型之一。BERT的设计理念和结构基于Transformer模型，通过无监督学习方式进行训练，并且能够适配各种NLP任务。预训练模型是指在大规模文本数据上进行大量无监督训练，学习得到丰富的语言表示。