维也纳大学有计算机系

西风 发自 凹非寺

量子位 | 公众号 QbitAI

挑战Transformer,MIT初创团队推出LFM(Liquid Foundation Model)新架构模型爆火。

LFM 1.3B、LFM 3B两个不同大小的模型,性能超越同等规模Llama3.2等Transformer模型。

LFM架构还有很好的可扩展性,团队还推出了基于MoE的LFM 40B(激活12B参数),能与更大规模的密集模型或MoE模型相媲美。

LFM用的是一种液态神经网络(LNN),从第一性原理出发而构建,其计算单元植根于动态系统理论、信号处理和数值线性代数。

这种架构还有一个特点:在内存效率方面特别强。

基于Transformer的LLM中的KV缓存在长上下文中会急剧增长,而LFM即使在处理100万个token时也能保持内存最小。

小巧便携,使得它能够直接部署在手机上进行文档和书籍等分析。

LFM模型背后是一支MIT计算科学与人工智能实验室衍生出来的小团队,名叫Liquid AI。

其后训练负责人Maxime Labonne在X上为自家模型疯狂打Call:

这三个具有SOTA性能的模型,是我职业生涯中最值得骄傲的版本。

AI畅销书《人工直觉》作者也表示看好。

一直等的就是这样的模型,基于物理学或神经元的“第一性原理”

目前LFM系列模型还在预览测试中,大伙儿可通过Liquid官方平台、Lambda Chat、Perplexity AI来访问。

基于液态神经网络打造

具体来看看这三个模型的性能和特点。

LFM 1.3B在MMLU、MMLU-Pro、ARC-C、GSM8K基准上相较于下表其它模型,取得SOTA性能。

LFM 3B,还能和Mistral 7B、Llama3.1 8B两倍大模型打得有来有回。

LFM 40B性能也可与比其自身更大的模型相媲美,MoE架构可实现更高吞吐可部署在更具成本效益的硬件上。

与Transformer架构相比,LFM的一个突出优势就是内存占用更少。

对于长输入效果更明显,基于Transformer的LLM中的KV缓存随着序列长度线性增长。通过有效压缩输入,LFM可以在同一硬件上处理更长的序列。

以下是LFM 3B与其它3B级模型的对比,LFM 3B能始终保持较小的内存占用。

处理100万个token,LFM 3B只需16 GB内存,而Llama-3.2-3B模型则需48 GB+。

LFM上下文有效长度为32k。

当相应得分高于85.6时,长度被认为是“有效的”(Hsieh等人,2024 RULER)。

LFM 3B在32k的上下文长度上,仍能保持89.5的高分。

实验结果中Llama 3.2生成128k上下文窗口,但实际只在4k上有效,也引起一波关注。

除此之外,LFM由结构化运算符组成,为基础模型打开了一个新的设计空间。

不仅限于语言,还可以将其应用于音频、时间序列、图像等等其它模态。

还具有高适应性,可针对特定平台(如苹果、高通、Cerebras、AMD)优化架构,或匹配给定的参数要求和推理缓存大小。

Liquid AI团队直接把目前LFM模型的优缺点都一一列了出来。

现在LFM语言模型擅长通用和专业知识、数学和逻辑推理、长上下文任务。

主要语言是英语,还支持西班牙语、法语、德语、中文、阿拉伯语、日语和韩语。

但LFM语言模型不擅长零样本代码任务、精确的数值计算、时效性信息,人类偏好优化相关技术也尚未广泛应用。

有意思的是,Liquid AI团队还明确表示LFM现在不会数“Strawberry”中“r”的数量。

经网友测试,它确实不会。

关于LFM架构更多技术细节,官方表示将持续发布技术Blog。

背后团队来自MIT CSAIL

下面简单介绍一下LFM模型背后团队——Liquid AI。

Liquid AI是一家从MIT计算机科学与人工智能实验室衍生出来的公司。

目标是在每一个规模上构建能力强大且高效的通用人工智能系统。

联合创始人共有四位。

CEO Ramin Hasani,MIT CSAIL人工智能科学家、前Vanguard Group首席人工智能和机器学习科学家。

博士论文研究主题就是关于液态神经网络(Liquid Neural Networks),由维也纳工业大学Radu Grosu教授和麻省理工学院Daniela Rus教授共同指导。

CTO Mathias Lechner,MIT CSAIL研究员。

维也纳工业大学计算机科学的学士、硕士学位,奥地利科学与技术研究所(ISTA)博士学位。

专注于开发稳健可信的机器学习模型。

首席科学官Alexander Amini,在MIT完成了计算机科学学士、硕士和博士学位,同时辅修数学。

研究的领域包括自主系统的端到端控制学习、神经网络的置信度公式化、人类移动性的数学建模以及复杂惯性精细化系统的构建。

另外一位联合创始人是MIT CSAIL主任Daniela Rus,她还是MIT电气工程与计算机科学系的Andrew&Erna Viterbi教授。

Liquid AI成立初就致力于从第一性原理出发构建新一代基础模型,是一个基于深度信号处理和状态空间层扩展语言模型的团队。

之前研究有一箩筐:

感兴趣的的家人们可以自行查阅:https://www.liquid.ai/blog/liquid-neural-networks-research

对新模型感兴趣的家人们可以测试起来了:https://playground.liquid.ai/chat?model=cm1ooqdqo000208jx67z86ftk

参考链接:[1]https://x.com/LiquidAI_/status/1840768722665189596[2]https://venturebeat.com/ai/mit-spinoff-liquid-debuts-non-transformer-ai-models-and-theyre-already-state-of-the-art/

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/46956.html

(0)
上一篇 2025年7月5日
下一篇 2025年7月5日

相关推荐

  • 加拿大英属哥伦比亚大学(加拿大英属哥伦比亚大学怎么样)

    总有一个地方是你想去的。 这是BC省学术水平最高的学府,在加拿大最佳大学排行榜中名列前茅,是加拿大世界著名公立研究性大学 坐落于风光如画的温哥华市,UBC始建于1908年,前身为麦吉尔大学不列颠哥伦比亚分校,并于1915获批独立,是BC省历史最悠久的大学。 今天就为大家介绍不列颠哥伦比亚大学,2023QS世界大学排名第47名。 1 学校简介 不列颠哥伦比亚大…

    2023年10月31日
  • 威廉姆斯学院94年9月5日入学

    央视网消息:北京时间12月8日,2024赛季F1收官站阿布扎比大奖赛正赛落下帷幕,诺里斯率先冲过终点拿下本站比赛的冠军,迈凯伦锁定了车队年度总冠军,这是迈凯伦在时隔26年之后再次获得F1车队总冠军。 最终的车手积分榜,维斯塔潘以437分排名第一,连续四年拿下车手总冠军,诺里斯以374分拿下年度亚军,勒克莱尔356分排名第三,接下来依次是皮亚斯特里292分、塞…

    2024年12月17日
  • 中国刑事警察学院几本

    中国刑事警察学院2024年招生章程已出来了,今年本科公安专业招生计划共1840人。其中面向地方公安机关入警就业1745人,面向铁路公安机关入警就业80人、面向移民管理机构入警就业15人。招收的11个本科专业均为公安专业,同比2023年10个专业新增1个专业。 以下中国刑事警察学院2023年普通类招生31个省(区、市)各专业录取人数和分数情况: 31个省(区、…

    2025年4月25日
  • 伦敦玛丽女王大学材料专业

    伦敦玛丽女王大学(Queen Mary University of London),又名伦敦大学玛丽王后学院,1887年建立于英国伦敦,得名于英王乔治五世之妻玛丽王后,1915年成为伦敦大学成员、是一所公立综合研究型大学。 伦敦玛丽女王大学为英国罗素集团、科学与工程南联盟等组织成员,在医学、法学、社会科学和工程学界享有声誉。 伦敦玛丽女王大学拥有伦敦地区最大…

    2024年1月9日
  • 日语能力考试报名时间(2023日语能力考试报名时间)

    2023年12月日本语能力测试(JLPT)将于12月3日举行,网上报名的个人信息注册将于2023年8月15日7:00正式开放。 JLPT网上报名分两个阶段进行 第一阶段:考生仅进行个人信息注册和上传电子照片; 第二阶段:除考生可继续注册外,按N1、N2、N3-N5的顺序依次分别开放考试名额,供已完成个人信息注册与上传电子照片的考生选择级别和考点,此阶段要求考…

    2023年10月12日
  • 建国大学相当于国内几本

    建国大学成立于1946年,历史悠久,一直是韩国前十的名牌大学,但近些年滑落到了13名左右,因为媒体评分的综合因素很多,但在韩国学生心里,建国一直是名校的存在,下面来为大家从几个角度来介绍一下。 综合排名 建国大学韩国排名13名左右 亚洲排名114 世界排名601 相当于国内985/211大学,比如我们的深圳大学/北京航天航空大学 知名校友 崔珉豪(SHINe…

    2024年12月9日
  • 英国纽卡斯尔(英国纽卡斯尔大学排名)

    2024年QS世界大学排名收录了全球104个地区的1500所院校,是同类排名中唯一强调就业能力和可持续性的排名。今年引入了三个新的衡量标准——可持续性、就业结果和国际研究网络。榜单结果借鉴了对1750万篇学术论文的分析,以及超过24万名学术界人士和雇主的专家意见。 Newcastle University纽卡斯尔大学是罗素大学集团、N8大学联盟、欧洲大学协会…

    2023年11月20日
  • 布朗大学高考成绩要求

    转载声明本文系《留学》杂志转载整理自公众微信号“TTL星腾科美国留学专家(ttl1708)”,媒体转载请联系原出处。 心得申请季又要开始了,一些美国老牌名校通过官方网站发布了有关今年申请的新规定。比如乔治城大学(Georgetown University),波士顿学院(Boston College),麻省理工学院(MIT),还有个重头戏布朗大学(Brown …

    2025年4月28日
  • 威廉玛丽学院与威廉姆斯学院_威廉姆斯学院和威廉玛丽学院

    最近,棕榈君上网冲浪,看到了两件相当炸裂的事情! 其一,今年6月21日,罗切斯特大学大学控诉罗切斯特大学。 别懵也别误会,其实是U.S.News全美综排Top 36、位于纽约州的University of Rochester,控诉无U.S.News排名、位于密歇根州的Rochester University。 诉讼原因正是罗切斯特大学认为Rochester …

    2024年3月6日
  • 去新加坡留学要多少钱

    留学新加坡的费用因学校、专业和地区的不同而差异较大。 首先,学费是留学中最大的开支之一。新加坡的公立大学和私立大学每年的学费都有所不同。一般来说,新加坡公立大学本科学费一年大概在11000到15000新币,折合人民币每年55000到75000元左右。而私立大学的本科课程学费一年大概在10000到18000新币,折合人民币每年50000到80000元。 其次,…

    2024年6月26日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信