机械之心编译
编纂 :Panda
语言模子:过长我不看 。语言远偷
大型语言模子大实用途 ,模偏模在妄想 prompt 方面,懒新略过人们个别建议为语言模子提供详尽的钻研中间使命形貌以及布景信息。
近期的高过长一些语言模子有能耐输入较长的高下文 ,但它事实能多好地运用更长的下文高下文 ?这一点却相对于少有人知。
克日,语言远偷斯坦福大学 、模偏模加州大学伯克利分校以及 Samaya AI 的懒新略过钻研者宣告了一篇实证研品评辩说文,探究了这个下场。钻研中间
论断使人意外:假如高下文过长,高过长语言模子会更关注其中的下文先后部份,中间部份却简直被略过不看