SAMBA(简单混合状态空间模型用于高效的无限上下文语言建模)及其对长文本模型的改进
论文地址: https://arxiv.org/pdf/2406.07522 SAMBA(Simple Hybrid State Space Models for Efficient Unlimited Context Language Modeling)是一种新型的基于Transformer的语言模型,旨在解决传统大语言模型在处理长文本时遇到的…
2025-08-20