腾讯科技申请文本分类专利,提高文本分类的效率
金融界2025年4月19日消息,国家知识产权局信息显示,腾讯科技(深圳)有限公司申请一项名为“文本分类、聚类和检索方法、装置和计算机设备”的专利,公开号CN119848250A,申请日期为2023年10月。
专利摘要显示,本申请涉及一种文本方法、分类、聚类和检索方法、装置和计算机设备。所述方法包括:获取待分类文本,确定所述待分类文本的可变长编码的第一编码长度;从参考文本集合中分别获取参考文本,分别将参考文本与所述待分类文本进行拼接,得到第一拼接文本;获取参考文本的可变长编码的第二编码长度以及所述第一拼接文本的可变长编码的第三编码长度;基于所述第一编码长度、所述第二编码长度和所述第三编码长度,得到待分类文本与参考文本之间的目标压缩距离。基于目标压缩距离从所述参考文本集合中确定与待分类文本相似的目标数量的参考文本,基于所述目标数量的参考文本的类别,确定所述待分类文本的类别。本申请了文本分类的效率。
天眼查资料显示,腾讯科技(深圳)有限公司,成立于2000年,位于深圳市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本200万美元。通过天眼查大数据分析,腾讯科技(深圳)有限公司共对外投资了16家企业,参与招投标项目250次,财产线索方面有商标信息5000条,专利信息5000条,此外企业还拥有行政许可439个。
来源:金融界
版权声明:如无特殊标注,文章均为本站原创,转载时请以链接形式注明文章出处。
评论