首页 >> 科技 >

Sakana AI推出Transformer²模型,突破LLM限制,引领动态推理新时代

2025-01-24 11:35:31 来源:网易 用户:长孙勇灵 

Sakana AI近日发布了名为Transformer²的创新自适应语言模型。该模型无需微调,通过两步动态权重调整机制,在推理过程中动态学习并适应新任务,这标志着LLM技术的重要进展。Transformer²的核心在于其独特的动态权重调整,通过奇异值分解(SVD)与数学技巧,实时优化性能。

测试显示,Transformer²在数学、编码、推理和视觉问答等任务中表现优于LoRA模型,且参数更少。该模型还具有知识迁移能力,应用潜力广泛。Sakana AI公开了Transformer²组件的训练代码,推动了LLM推理时定制技术的发展。Transformer²与Google Titans等技术共同改变了LLM的应用方式,为更广泛领域的高效、个性化AI工具奠定了基础。

  免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!

 
分享:
最新文章
版权与免责声明:
①凡本网注明"来源:驾联网"的所有作品,均由本网编辑搜集整理,并加入大量个人点评、观点、配图等内容,版权均属于驾联网,未经本网许可,禁止转载,违反者本网将追究相关法律责任。
②本网转载并注明自其它来源的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品来源,并自负版权等法律责任。
③如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,我们将在您联系我们之后24小时内予以删除,否则视为放弃相关权利。
滚动资讯