ps22(PS2251 U盘拆解)

?餐馆食物不错,但是环境不太容易让人放松惬意。

{属性:食物 ;?观点:不错 ;?情感:正}

{属性:环境?;?观点:不容易让人放松?;?情感:负}

从一个评论句子中找出,用户评论了哪些方向、观点是什么、情感急性是什么。看起来是一个观点抽取+多分类的问题。

解决这个问题主要有两大思路:1.联合模型一步解决 ?2.任务分成两步做

联合模型解决

好处:

1.把问题当成一个整体,问题之间关联关系可以作为默认约束

2.单一模型解决简单方便,使用者输出结果简单

问题:

1.需要更强大表现力的模型,也就也为需要更多的标注数据

2.数据的标注需要更多的技ps22巧,一种标记符号区别3个任务,符号信息熵一定是比较大的

两段法

好处:

1.可以拆分成现有的NLP问题来解,泛化的标注数据集更多,可以用的预训练模型也更多

2.分两阶段,模型参数可共享,需要标注的数据量也可以更少

问题:

1.分两段来做,需要考虑人为的思考两阶段之间的关系,训练时候需要人工调整数据分布

2.两段之间相互约束关系没有一个网络学习到

两阶段法也有好多实现思路,比如:把属性、观点用实体抽取法抽取了,在对实体对做分类判断属于哪类属性、观点是什么;属性做实体抽取,抽取的属性和评论一起输出模型做观点抽取和情感判断。我们这次介绍的思路是两段法属性做实体抽取,抽取的属性和评论一起输出模型做观点抽取和情感判断。

实现思路:

1.bert+crf做属性抽取

2.bert+span+softmax做观点抽取和情感分类

属性抽取训练样本构造如下:

四 O
驱 O
价 B-ORG
格 I-ORG
貌 O
似 O
挺 O
高 O
的 O
, O
高 O
的 O
可 O
以 O
看 O
齐 O
X O
C O
6 O
0 O
了 O
, O
看 O
实 O
车 ?B-ORG
前 ?I-ORG
脸 ?I-ORG
有 O
点 O
违 O
和 O
感 O
。 O
不 O
过 O
大 ?B-ORG
众? B-ORG
的 ?I-ORG
车 ?I-ORG
应 O
该 O
不 O
会 O
差 O
。 O
。 O

观点抽取和情感分类训练数据构造:

价格,四驱价格貌似挺高的,高的可以看齐XC60了,看实车前脸有点违和感。不过大众的车应该不会差。 ?挺高(8,9) 0

车前脸,四驱价格貌似挺高的,高的可以看齐XC60了,看实车前脸有点违和感。不过大众的车应该不会差。 ?有点违和感(28,32) -1

大众的车,四驱价格貌似挺高的,高的可以看齐XC60了,看实车前脸有点违和感。不过大众的车应该不会差。 ?不会差(42,44) 1

观点抽取(用的命名实体识别代ps22码实现)

初始化环境+训练数据集+bert模型参数准备

 

构造模型

 

训练模型

 

验证+模型加载

 

观点抽取+情感分类

初始化环境+模型参数准备

 

数据集构造

 

模型构造

 

训练模型

 

测试

 

以上就是实现的思路了,数据集需要自己做标注,情感分类需要自己加一个3分类的softmax头,代码中标注地方加就好。

参考代码:https://github.com/wilsonlsm006/bert_ner.git

转载请说明出处 内容投诉内容投诉
九幽软件 » ps22(PS2251 U盘拆解)