c#发展

注册

 

发新话题 回复该主题

港中文清华等七所顶尖高校提出全新CSV [复制链接]

1#

编辑:LRS

让模型用代码自我验证解决方案,结合多数投票集成机制,推理准确率可以提升近30%!

虽然大型语言模型(LLMs)在常识理解、代码生成等任务中都取得了非常大的进展,不过在数学推理任务上仍然存在很大改进空间,经常会生成无意义、不准确的内容,或是无法处理过于复杂的计算。

最近推出的一些语言模型,如GPT-4,PaLM-2都在数学推理上取得了重大进步,特别是OpenAI的最新版模型GPT-4CodeInterpreter,在较困难的数学推理数据集上也展现出了很高的性能。

为了探索「代码生成任务」对「语言模型推理能力」的影响,来自香港中文大学、南京大学、中国科学技术大学、清华大学、香港城市大学、长沙理工大学和塔夫茨大学的研究人员联合发布了一篇论文,通过在代码使用频率(CodeUsageFrequency)上引入不同的约束限制进行实验验证。

论文链接:

分享 转发
TOP
发新话题 回复该主题