
文章核心总结与翻译一、主要内容本文将大型语言模型(LLMs)作为人类联想学习的计算模型,通过适配认知神经科学的联想学习范式,探究6个开源LLM在上下文学习(ICL)中的表征动态变化。核心发现包括:LLM的表征变化符合非单调可塑性假说(NMPH),仅在学习巩固阶段呈现U型曲线(中等相似的token对会分化);提出“词汇干扰”概念,即新联想与模型先验知识的竞争会调节表征变化,干扰越强分化越明显;LLM的学习过程分为编码、巩固、遗忘三阶段,且不同模型的遗忘机制存在差异。二、创新点首次将LLM作为“模型有机体”用于人类联想学习研究,解决了生物系统中难以控制变量、采样密集度不足的实验难题。验证了NMPH在LLM中的适用性,发现该非单调模式仅存在于巩固阶段,揭示了学习阶段与表征变化的关联。提出“词汇干扰”这一可量化的新因素,阐明局部token相似性与全局词汇竞争对表征变化的联合影响。系统划分LLM联想学习的三阶段动态,为理解模型记忆重组机制提供了新框架。三、关键部分翻译(Markdown格式)Abstract(摘要)联想学习——即在共现项目间建立关联——是人类认知的基础,会以复杂方式重塑内部表征。在生物系统中测试表征变化如何发生的假说具有挑战性,但大型语言模型(LLMs)提供了一种可扩展的替代方案。基于LLMs的上下文学习能力,我们适配了一种认知神经