维也纳大学有计算机系

西风 发自 凹非寺

量子位 | 公众号 QbitAI

挑战Transformer,MIT初创团队推出LFM(Liquid Foundation Model)新架构模型爆火。

LFM 1.3B、LFM 3B两个不同大小的模型,性能超越同等规模Llama3.2等Transformer模型。

LFM架构还有很好的可扩展性,团队还推出了基于MoE的LFM 40B(激活12B参数),能与更大规模的密集模型或MoE模型相媲美。

LFM用的是一种液态神经网络(LNN),从第一性原理出发而构建,其计算单元植根于动态系统理论、信号处理和数值线性代数。

这种架构还有一个特点:在内存效率方面特别强。

基于Transformer的LLM中的KV缓存在长上下文中会急剧增长,而LFM即使在处理100万个token时也能保持内存最小。

小巧便携,使得它能够直接部署在手机上进行文档和书籍等分析。

LFM模型背后是一支MIT计算科学与人工智能实验室衍生出来的小团队,名叫Liquid AI。

其后训练负责人Maxime Labonne在X上为自家模型疯狂打Call:

这三个具有SOTA性能的模型,是我职业生涯中最值得骄傲的版本。

AI畅销书《人工直觉》作者也表示看好。

一直等的就是这样的模型,基于物理学或神经元的“第一性原理”

目前LFM系列模型还在预览测试中,大伙儿可通过Liquid官方平台、Lambda Chat、Perplexity AI来访问。

基于液态神经网络打造

具体来看看这三个模型的性能和特点。

LFM 1.3B在MMLU、MMLU-Pro、ARC-C、GSM8K基准上相较于下表其它模型,取得SOTA性能。

LFM 3B,还能和Mistral 7B、Llama3.1 8B两倍大模型打得有来有回。

LFM 40B性能也可与比其自身更大的模型相媲美,MoE架构可实现更高吞吐可部署在更具成本效益的硬件上。

与Transformer架构相比,LFM的一个突出优势就是内存占用更少。

对于长输入效果更明显,基于Transformer的LLM中的KV缓存随着序列长度线性增长。通过有效压缩输入,LFM可以在同一硬件上处理更长的序列。

以下是LFM 3B与其它3B级模型的对比,LFM 3B能始终保持较小的内存占用。

处理100万个token,LFM 3B只需16 GB内存,而Llama-3.2-3B模型则需48 GB+。

LFM上下文有效长度为32k。

当相应得分高于85.6时,长度被认为是“有效的”(Hsieh等人,2024 RULER)。

LFM 3B在32k的上下文长度上,仍能保持89.5的高分。

实验结果中Llama 3.2生成128k上下文窗口,但实际只在4k上有效,也引起一波关注。

除此之外,LFM由结构化运算符组成,为基础模型打开了一个新的设计空间。

不仅限于语言,还可以将其应用于音频、时间序列、图像等等其它模态。

还具有高适应性,可针对特定平台(如苹果、高通、Cerebras、AMD)优化架构,或匹配给定的参数要求和推理缓存大小。

Liquid AI团队直接把目前LFM模型的优缺点都一一列了出来。

现在LFM语言模型擅长通用和专业知识、数学和逻辑推理、长上下文任务。

主要语言是英语,还支持西班牙语、法语、德语、中文、阿拉伯语、日语和韩语。

但LFM语言模型不擅长零样本代码任务、精确的数值计算、时效性信息,人类偏好优化相关技术也尚未广泛应用。

有意思的是,Liquid AI团队还明确表示LFM现在不会数“Strawberry”中“r”的数量。

经网友测试,它确实不会。

关于LFM架构更多技术细节,官方表示将持续发布技术Blog。

背后团队来自MIT CSAIL

下面简单介绍一下LFM模型背后团队——Liquid AI。

Liquid AI是一家从MIT计算机科学与人工智能实验室衍生出来的公司。

目标是在每一个规模上构建能力强大且高效的通用人工智能系统。

联合创始人共有四位。

CEO Ramin Hasani,MIT CSAIL人工智能科学家、前Vanguard Group首席人工智能和机器学习科学家。

博士论文研究主题就是关于液态神经网络(Liquid Neural Networks),由维也纳工业大学Radu Grosu教授和麻省理工学院Daniela Rus教授共同指导。

CTO Mathias Lechner,MIT CSAIL研究员。

维也纳工业大学计算机科学的学士、硕士学位,奥地利科学与技术研究所(ISTA)博士学位。

专注于开发稳健可信的机器学习模型。

首席科学官Alexander Amini,在MIT完成了计算机科学学士、硕士和博士学位,同时辅修数学。

研究的领域包括自主系统的端到端控制学习、神经网络的置信度公式化、人类移动性的数学建模以及复杂惯性精细化系统的构建。

另外一位联合创始人是MIT CSAIL主任Daniela Rus,她还是MIT电气工程与计算机科学系的Andrew&Erna Viterbi教授。

Liquid AI成立初就致力于从第一性原理出发构建新一代基础模型,是一个基于深度信号处理和状态空间层扩展语言模型的团队。

之前研究有一箩筐:

感兴趣的的家人们可以自行查阅:https://www.liquid.ai/blog/liquid-neural-networks-research

对新模型感兴趣的家人们可以测试起来了:https://playground.liquid.ai/chat?model=cm1ooqdqo000208jx67z86ftk

参考链接:[1]https://x.com/LiquidAI_/status/1840768722665189596[2]https://venturebeat.com/ai/mit-spinoff-liquid-debuts-non-transformer-ai-models-and-theyre-already-state-of-the-art/

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/46956.html

(0)
上一篇 2025年7月5日
下一篇 2025年7月5日

相关推荐

  • 大学生如何找实习

    如果你从未接触过职场,如果你还没有找过实习,请收藏本文,仔细阅读。 一文帮你理清“找实习”那些事儿。 01 为什么要实习? 不论你如何不想,只要你不是家里有矿,毕业后你都要踏入社会,踏入职场。 而在整个校招期间,当你的简历通过了初筛之后,大部分企业最看重的就是你大学期间的实习经历了。 因为: ❶ 你的实习经历可以让HR很直观的看到你目前具备什么样的能力。 以…

    2024年5月20日
  • 麦考瑞世界大学排名

    \r 提到澳大利亚麦考瑞大学,许多人首先想到的是它在世界大学排名中的亮眼表现。但你是否好奇,这所大学为何能屡屡跻身国际前列?麦考瑞大学不仅拥有强大的科研实力和卓越的师资队伍,更以创新课程和紧贴产业的实习机会,吸引着全球学子。\r它在商科、信息技术、医学等领域的突破,背后究竟有着怎样的“硬核实力”?带你深入探秘麦考瑞大学排名背后的真正底气。 \r\r\r\r\…

    2025年7月24日
  • 香港大学的学费

    香港大学2025年新生费用及生活成本指南一、学校概况所在城市:中国香港特别行政区,主校区位于香港岛西环薄扶林道,毗邻维多利亚港。校区分布:主校区(薄扶林校区):核心教学区,占地约16公顷,容纳绝大多数本科生及研究生。沙宣道校区:医学院及牙医学院专用教学与研究设施。嘉道理中心(位于市区):部分商科及跨学科课程教学场所。在校总人数:约2.2万人(含本科生、研究生…

    2025年10月31日
  • 史上首次!长假最后一天受理期货投资者开户

    自昨晚开始,“10月7日可受理期货开户”的消息刷屏期货圈。 多家期货公司提供的信息显示,因期货预约开户人数较多,中国期货市场监控中心(简称“中国期货监控”)拟于2024年10月7日(周一)8:30-17:30临时开放期货网开系统,投资者可以在10月7日完成网开手续。 据悉,这是史上首次期货投资者可在“十一”长假期间办理开户手续。 “今天就已经有技术的同事去上…

    2024年10月6日
  • 英国中央兰开夏大学硕士奖学金

    在全球化教育竞争白热化的2025年,北京两大高校的国际本科项目正引发考生与家长的深度关注。北京理工大学(北理工)与首都经济贸易大学(首经贸)的英澳方向1+3/2+2项目,因其培养模式差异和资源禀赋分野,形成了“理工硬核”与“商科柔性”的鲜明对比。 合作院校的“隐形门槛”:QS排名背后的资源博弈 北理工依托985工科强校背景,其英澳方向合作院校如英国中央兰开夏…

    2025年7月29日
  • 德国室内设计专业大学

    1600㎡豪宅 |孙建亚 孙建亚的空间,总带着一种瞬间抚平心绪的魔力。你找不到任何“设计”的痕迹,仿佛一切皆是自然生长而成。这恰恰是最高级的设计:用举重若轻的笔触,勾勒出空间的骨架,却将最蓬勃的生命力,如气血般充盈其中。 大家好,我是《德国室内设计中文版》的主理人Lily,专为设计师分享国内外优秀设计作品。我们致力于为设计师带来源源不断的设计活力,让中国设计…

    2026年1月9日
  • 中国为何不承认沙特大学学历

    从上世纪末开始,在我国开始了高校扩招。20多年来,尽管大学生人数猛增,可是仍有非常一部分青年人沒有高校上,这与现阶段大学招生贴近饱和状态相关。可是今日详细介绍的这所名牌大学沒有传统定义上的“院墙”,有着几百万的学员,这所院校便是我国开放大学。 (此处已添加小程序,请到今日头条客户端查看) 这所2012年创立的高校还十分年轻,可是早已是教育部直属的我国名牌大学…

    2025年3月6日
  • loughborough大学排名

    传媒学科向来是留学申请的热门方向之一。英国传媒产业极为发达,坐拥世界上第一座电视台BBC、最早的通讯社之一路透社,还有《经济学人》《泰晤士报》等全球知名杂志报刊。正因如此,英国成为了众多传媒学子梦寐以求的留学目的地。 QS最新发布了2025年世界大学学科排名,汇英留学为大家精心整理了传媒学科在英国排名前10的大学名单,下面就和汇英留学一同来了解一下吧! 1 …

    2025年9月15日
  • 加拿大留学签证办理流程

    每年都有申请加拿大留学的同学因为加拿大签证未申请下来的问题,不得不推迟入学时间。那么在申请加拿大留学签证的准备阶段,哪些材料是必须准备的呢?下面是小编为大家整理了加拿大留学签证材料清单,希望能对申请加拿大留学的同学能有所帮助。 办加拿大留学签证时,申请人须携带加拿大院校发出的入学证明书,并附一份影印件(申请人学历、英语或法语水平、入学注册截止日期等),向使、…

    2025年10月31日
  • 名古屋市立大学病院

    近日,一则沉痛的消息传出:华中科技大学教授、博士生导师牟阳灵于2019年10月19日因病去世,年仅45岁。 牟阳灵教授,中组部“青年千人”,华中科技大学教授、博导、脑研究所研究员。课题组主要运用电生理、光遗传学、动物行为学、病毒示踪、双光子/共聚焦显微成像等技术手段研究学习记忆相关的神经环路和细胞学基础,近期研究成果发表在Cell Reports,PNAS,…

    2025年9月9日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信