邦度学问产权局新闻显示,思乾(南京)科技有限公司申请一项名为“一种基于深化练习的大叙话模子反抗性微调巩固编制”的专利,公然号CN121457631A,申请日期为2025年11月。
专利摘要显示,本出现涉及深化练习范围,完全为一种基于深化练习的大叙话模子反抗性微调巩固编制。蕴涵形态预测模块:获取编制形态数据和机械人手脚数据;基于机械人手脚数据,通过神经汇集预测模子天生预测形态向量,与编制形态数据举行比对,获得残差向量;手脚解码模块:将残差向量输入前馈神经汇集,举行编码天生自然叙话形态叙述,并通过大叙话模子举行自回归解码,获得失掉值;战术优化模块:通过非线性函数将处治函数值转化为深化练习赏赐信号,PPO算法遵照深化练习赏赐信号计划出总失掉;基于总失掉,计划并优化更新大叙话模子中低秩自合适参数的梯度。本出现通过前馈神经汇集和PPO算法,缉捕轻微动态误差,提拔了编制的意思性和安适性。
天眼查原料显示,思乾(南京)科技有限公司,设立于2020年,位于南京市,是一家以从事科技扩展和行使任事业为主的企业。企业注册资金1000万邦民币。通过天眼查大数据领悟,思乾(南京)科技有限公司家当线条,别的企业还具有行政许可8个。