本文源自:市场资讯
国家知识产权局信息显示,北京积步千里科技有限公司申请一项名为“基于长文本的语言模型训练方法、设备、介质及产品”的专利,公开号CN121030337A,申请日期为2025年8月。专利摘要显示,本申请公开了基于长文本的语言模型训练方法、设备、介质及产品,属于数据处理领域。本申请能够对获取的原始训练样本进行分类处理得到第一训练样本,可以有效筛选出具有高质量长文依赖性的训练数据,提高模型对长文本中依赖关系的学习效率;基于预设策略将第一训练样本与多分布语料库中的数据进行混合,得到第二训练样本,在该过程中将不同长度的长文数据与短文数据按特定比例混合,构建多级长度的训练数据集,可以在保持短文本处理能力的同时提升长文本理解能力;将第二训练样本输入待训练语言模型进行多级训练,逐步提高模型处理长文本的能力,同时减少对大量训练数据和高性能GPU资源的依赖,目标语言模型具备支持长度文本理解的能力。
天眼查资料显示,北京积步千里科技有限公司,成立于2023年,位于北京市,是一家以从事科技推广和应用服务业为主的企业。企业注册资本30000万美元。通过天眼查大数据分析,北京积步千里科技有限公司拥有行政许可2个。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
>>>查看更多:股市要闻