論文,特定推理飆升52%" alt="別捲上下文了?CMU新論文:讓AI睡一覺,特定推理飆升52%"> 新智元報道 【新智元導讀】都在捲上下文視窗,以為越大越強論文。CMU新論文發現:大模型缺的不是長上下文,是「睡一覺」。 這兩天,一篇arXiv上的論文在Hacker News上引發熱議論文。 論文
論文?CMU新論文讓LLM在夢中「鞏固記憶」" alt="模型也需要「睡覺」?CMU新論文讓LLM在夢中「鞏固記憶」"> 機器之心編輯部 很長一段時間,「長上下文」一直是各大模型廠商軍備競賽的焦點,從 128K 到 1M,再到更長的上下文視窗,業界已然形成一個固有認知,只要視窗足夠大,模型就能記住更