基于大语言模型的强化学习自动构建提示词方法及装置

被引:0
专利类型
发明
申请号
CN202410335971.5
申请日
2024-03-22
公开(公告)号
CN118210896A
公开(公告)日
2024-06-18
发明(设计)人
杨乾成 罗勇 杜博
申请人
武汉大学
申请人地址
430072 湖北省武汉市武昌区八一路299号
IPC主分类号
G06F16/332
IPC分类号
G06N3/045 G06N20/00 G06F40/205
代理机构
武汉智权专利代理事务所(特殊普通合伙) 42225
代理人
陈桂扬
法律状态
公开
国省代码
湖北省 武汉市
引用
下载
收藏
共 50 条
[1]
基于大语言模型的多智能体强化学习环境自动构建方法及系统 [P]. 
朱鑫国 ;
陈睿智 ;
张续志 ;
李玲 .
中国专利 :CN120542595A ,2025-08-26
[2]
基于大语言模型和强化学习的决策方法、装置及设备 [P]. 
徐泽来 ;
于超 ;
汪玉 ;
吴翼 .
中国专利 :CN118260681A ,2024-06-28
[3]
基于大语言模型的自我反思式提示词优化方法及系统 [P]. 
刘鹏 ;
张真 ;
王美民 ;
于可汗 ;
徐贺龙 ;
秦恩泉 .
中国专利 :CN118966208A ,2024-11-15
[4]
基于大语言模型的自我反思式提示词优化方法及系统 [P]. 
刘鹏 ;
张真 ;
王美民 ;
于可汗 ;
徐贺龙 ;
秦恩泉 .
中国专利 :CN118966208B ,2025-01-03
[5]
大语言模型的提示词优化方法及装置 [P]. 
田琛 ;
袁琦 ;
闫颖 ;
张宏星 ;
王昱龙 .
中国专利 :CN120256557A ,2025-07-04
[6]
基于反向提示词的大语言模型推理方法及装置 [P]. 
刘菊华 ;
杜博 ;
钟起煌 ;
陆卓然 .
中国专利 :CN119358668A ,2025-01-24
[7]
一种大语言模型提示词构建方法 [P]. 
刘文 ;
刘祥根 ;
邓洪波 ;
吕建成 ;
孙晨伟 ;
江兰兰 ;
唐飞熊 ;
史建成 .
中国专利 :CN120181199A ,2025-06-20
[8]
基于大语言模型的提示词优化方法及系统 [P]. 
吴松原 ;
卢超 .
中国专利 :CN119047482A ,2024-11-29
[9]
基于强化学习的大语言模型安全保护防御方法和装置 [P]. 
何柯阳 ;
韩蒙 ;
孔德章 ;
林昶廷 ;
邢文鹏 ;
许海涛 ;
谢珍真 ;
马治国 .
中国专利 :CN120974512A ,2025-11-18
[10]
结合大语言模型与强化学习的RPA流程自动构建方法及系统 [P]. 
汪东瑶 ;
倪进鑫 ;
孙林君 ;
高扬 .
中国专利 :CN117634867B ,2024-05-24