5 BERT预训练模型
最近科大讯飞比赛又开始了。目前我参加了基于文本的违禁词分类挑战赛,这是一个文本分类比赛2025 iFLYTEK AI开发者大赛。
目前的分数在0.67左右,但是后续使用好几个策略都没提高分数!
- 数据处理,文本按照128长度进行切分+然后使用BERT+全连接进行预测!
- 数据处理,文本按照128长度进行切分+然后使用roBERT+全连接进行预测!
- 数据处理,剔除停用词,然后128长度进行切分+然后使用roBERT+全连接进行预测!
- 数据处理,文本按照128长度进行切分+然后使用roBERT+LSTM+全连接进行预测!
- 数据处理,文本按照128长度进行切分+然后使用Erain+全连接进行预测!
但是分数都没上去!所以我又想着对Robert使用训练集进行预训练,然后再尝试进行预测吧!