基于深度学习的政府文件标签化技术文献综述

 2023-05-22 10:05

文献综述

一﹑系统开发的背景及意义标签技术发展迅速,电商网站、社交软件都通过给人或者物打标签的方式,来精确营销,提高运营效率。

同样,在政府领域,政府各种文件、政策日益增多,对政策文件进行标签化处理,对于提高文件的使用便利,提高政府的职能效率日益重要。

在实际业务中,利用标签提取技术一方面能提高政策文件的使用效率,有利于政府部门减少人工量,快速的分类整理,提高分类使用的准确率,同时也有利于公众对于公开的政策文件的检索利用。

另一方面结合用户信息为公众提供政策推荐,使公众能够及时了解到自己感兴趣的最新政策。

本次毕业设计旨在将以深度学习[1]为主的自然语言处理技术应用到政府文件分类领域中,以提高模型准确率为目标,实现实际政府文件智能处理应用系统,给定的训练数据是通过采集政府网站的政府文件,包括分类标签、政策标题和政策正文三个字段。

通过设计的相应标签算法,接受输入参数,返回输出结果。

接受输入的参数有两个,分别是政策标题和政策正文。

输出的结果为政策的分类标签,包括一级分类标签和二级分类标签,格式如下财政、金融、审计税务。

本文从词向量表示和文本特征提取以及挖掘公文标签之间的相关性三个方向入手,综合应用对标签相关性进行高阶建模的多标签预测模型作为最终的公文多标签分类算法[2]-[3]方案,实现精确的政府文件分类管理。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版