人工智能开发商Mistral开源编程模型Codestral Mamba 支持无限长度的输入
2024-7-17 09:25:42 Author: www.landiannews.com(查看原文) 阅读量:13 收藏

#人工智能 人工智能开发商 Mistral 开源编程模型 Codestral Mamba,支持无限长度的输入、支持最高 256K 上下文检索。该模型基于 Mamba 而非 Transformer,能够快速响应和不受输入长度限制,更适合在编程开发领域使用。查看全文:https://ourl.co/104987

人工智能开发商 Mistral 今天发布了专门用于编程开发的大型语言模型 Codestral Mamba,这是一种 Mamba2 语言模型,基于 Apache 2.0 许可证发布,所有人都可以免费下载和使用。

Mistral 表示,即 Mixtral 系列模型发布后,Codestral Mamba 模型是研究和提供新架构的新步伐,该公司希望这个新模型能够为架构研究开辟新的视角。

人工智能开发商Mistral开源编程模型Codestral Mamba 支持无限长度的输入

与 Transformer 模型不同,Mamba 模型具有线性时间推理的优势,并且理论上能够对无限长度的序列进行建模,这种优势可以让用户广泛地与模型进行互动、提供快速响应、不受输入长度的限制。

这种高效的模型对编程开发尤其重要,不受输入长度的限制意味着模型可以读取更多代码内容并根据上下文编写更适合的代码、帮助开发者构建更完整的项目。

人工智能开发商Mistral开源编程模型Codestral Mamba 支持无限长度的输入

Mistral 已经对 Codestral Mamba 上下文检索功能进行了测试,最高可以支持 256K,Mistral 希望该模型能够成为一款出色的本地代码助手。

Codestral Mamba 同样是一个指导模型,开发者可以根据自己的需要使用 mistral-inference 进行微调训练,打造适合自己或特定领域的版本。

需要提醒的是 Mistral 同时提供了 codestral-mamba-2407 版和 Codestral-22B 版,其中前者基于 Apache 2.0 许可证发布,具有 72B 参数;后者并非开源,商业性使用必须购买商业许可,免费的社区许可只能用于测试目的。


文章来源: https://www.landiannews.com/archives/104987.html
如有侵权请联系:admin#unsafe.sh