维也纳大学有计算机系

西风 发自 凹非寺

量子位 | 公众号 QbitAI

挑战Transformer,MIT初创团队推出LFM(Liquid Foundation Model)新架构模型爆火。

LFM 1.3B、LFM 3B两个不同大小的模型,性能超越同等规模Llama3.2等Transformer模型。

LFM架构还有很好的可扩展性,团队还推出了基于MoE的LFM 40B(激活12B参数),能与更大规模的密集模型或MoE模型相媲美。

LFM用的是一种液态神经网络(LNN),从第一性原理出发而构建,其计算单元植根于动态系统理论、信号处理和数值线性代数。

这种架构还有一个特点:在内存效率方面特别强。

基于Transformer的LLM中的KV缓存在长上下文中会急剧增长,而LFM即使在处理100万个token时也能保持内存最小。

小巧便携,使得它能够直接部署在手机上进行文档和书籍等分析。

LFM模型背后是一支MIT计算科学与人工智能实验室衍生出来的小团队,名叫Liquid AI。

其后训练负责人Maxime Labonne在X上为自家模型疯狂打Call:

这三个具有SOTA性能的模型,是我职业生涯中最值得骄傲的版本。

AI畅销书《人工直觉》作者也表示看好。

一直等的就是这样的模型,基于物理学或神经元的“第一性原理”

目前LFM系列模型还在预览测试中,大伙儿可通过Liquid官方平台、Lambda Chat、Perplexity AI来访问。

基于液态神经网络打造

具体来看看这三个模型的性能和特点。

LFM 1.3B在MMLU、MMLU-Pro、ARC-C、GSM8K基准上相较于下表其它模型,取得SOTA性能。

LFM 3B,还能和Mistral 7B、Llama3.1 8B两倍大模型打得有来有回。

LFM 40B性能也可与比其自身更大的模型相媲美,MoE架构可实现更高吞吐可部署在更具成本效益的硬件上。

与Transformer架构相比,LFM的一个突出优势就是内存占用更少。

对于长输入效果更明显,基于Transformer的LLM中的KV缓存随着序列长度线性增长。通过有效压缩输入,LFM可以在同一硬件上处理更长的序列。

以下是LFM 3B与其它3B级模型的对比,LFM 3B能始终保持较小的内存占用。

处理100万个token,LFM 3B只需16 GB内存,而Llama-3.2-3B模型则需48 GB+。

LFM上下文有效长度为32k。

当相应得分高于85.6时,长度被认为是“有效的”(Hsieh等人,2024 RULER)。

LFM 3B在32k的上下文长度上,仍能保持89.5的高分。

实验结果中Llama 3.2生成128k上下文窗口,但实际只在4k上有效,也引起一波关注。

除此之外,LFM由结构化运算符组成,为基础模型打开了一个新的设计空间。

不仅限于语言,还可以将其应用于音频、时间序列、图像等等其它模态。

还具有高适应性,可针对特定平台(如苹果、高通、Cerebras、AMD)优化架构,或匹配给定的参数要求和推理缓存大小。

Liquid AI团队直接把目前LFM模型的优缺点都一一列了出来。

现在LFM语言模型擅长通用和专业知识、数学和逻辑推理、长上下文任务。

主要语言是英语,还支持西班牙语、法语、德语、中文、阿拉伯语、日语和韩语。

但LFM语言模型不擅长零样本代码任务、精确的数值计算、时效性信息,人类偏好优化相关技术也尚未广泛应用。

有意思的是,Liquid AI团队还明确表示LFM现在不会数“Strawberry”中“r”的数量。

经网友测试,它确实不会。

关于LFM架构更多技术细节,官方表示将持续发布技术Blog。

背后团队来自MIT CSAIL

下面简单介绍一下LFM模型背后团队——Liquid AI。

Liquid AI是一家从MIT计算机科学与人工智能实验室衍生出来的公司。

目标是在每一个规模上构建能力强大且高效的通用人工智能系统。

联合创始人共有四位。

CEO Ramin Hasani,MIT CSAIL人工智能科学家、前Vanguard Group首席人工智能和机器学习科学家。

博士论文研究主题就是关于液态神经网络(Liquid Neural Networks),由维也纳工业大学Radu Grosu教授和麻省理工学院Daniela Rus教授共同指导。

CTO Mathias Lechner,MIT CSAIL研究员。

维也纳工业大学计算机科学的学士、硕士学位,奥地利科学与技术研究所(ISTA)博士学位。

专注于开发稳健可信的机器学习模型。

首席科学官Alexander Amini,在MIT完成了计算机科学学士、硕士和博士学位,同时辅修数学。

研究的领域包括自主系统的端到端控制学习、神经网络的置信度公式化、人类移动性的数学建模以及复杂惯性精细化系统的构建。

另外一位联合创始人是MIT CSAIL主任Daniela Rus,她还是MIT电气工程与计算机科学系的Andrew&Erna Viterbi教授。

Liquid AI成立初就致力于从第一性原理出发构建新一代基础模型,是一个基于深度信号处理和状态空间层扩展语言模型的团队。

之前研究有一箩筐:

感兴趣的的家人们可以自行查阅:https://www.liquid.ai/blog/liquid-neural-networks-research

对新模型感兴趣的家人们可以测试起来了:https://playground.liquid.ai/chat?model=cm1ooqdqo000208jx67z86ftk

参考链接:[1]https://x.com/LiquidAI_/status/1840768722665189596[2]https://venturebeat.com/ai/mit-spinoff-liquid-debuts-non-transformer-ai-models-and-theyre-already-state-of-the-art/

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/46956.html

(0)
上一篇 2025年7月5日
下一篇 2025年7月5日

相关推荐

  • 雪城大学世界排名冬天冷吗_雪城大学很冷吗

    不久前,有一则令人痛心的新闻,UIUC的一名学生被发现冻死在大学校园西部一栋大楼的后门走廊上。美国有部分地区,冬天真的会非常非常冷,气温可能长时间在零下20度到零下30度之间,真的有可能会有危险!今天,我们就来看看美国冷到爆炸、雪下起来不要命的10所大学吧!文末还附上了在寒冷地区大学就读的注意事项,被流放到北美宁古塔的小伙伴们千万别错过了! Universi…

    2024年3月6日
  • 查普曼大学来历真的和电影里一样吗

    2月10日(北京时间),第92届奥斯卡奖正式落下帷幕,电影《1917》斩获最佳摄影、最佳视觉效果、最佳音响效果三项大奖。 《1917》由萨姆·门德斯执导,迪恩·查尔斯·查普曼、乔治·麦凯主演,电影的故事主线很简单,第一次世界大战期间,两名士兵被分派必须在有限时间内前往前线送达撤退任务,否则前线第二军团的1600名士兵将陷入德军的陷阱全部阵亡。电影围绕这两名士…

    2025年9月12日
  • 杜伦大学times排名

    对于学生们来说,出国留学除了追求知识和文化修养之外,他们更关心的可能是毕业后的职业发展以及潜在的薪资水平。 毕竟,谁不想在付出时间和金钱后,收获一份体面的工作和令人羡慕的薪水呢? 在哪所大学求学会影响你以后的收入吗?《每日邮报》最新的英国大学指南的证据表明,确实会。 那么,在这个竞争激烈的就业市场中,哪些英国大学的毕业生能够脱颖而出,成为高收入群体的一员呢?…

    2025年8月18日
  • 美国威廉玛丽学院的及时发展

    威廉玛丽学院(The College of William and Mary,或称威廉与玛丽学院)是一所位于美国弗吉尼亚州威廉斯堡的著名小型公立大学,创立于1693年,是美国历史继哈佛大学之后第二悠久的大学,校园极具历史价值。学校的硬件和软件环境都是一流,更是公立常春藤之一,可以用便宜的价格使学生享受和私立大学同等的教学质量。校园所在地威廉斯堡是历史名城,位…

    2025年6月18日
  • 苏州第三套房可贷款、首付两成?多家银行:未收到通知 要等消息

    近日,有市场消息称,苏州购买第三套房可贷款,且利率最低3.75%。对此,2月29日,新京报记者采访苏州多家银行,对方均表示,没有收到通知,需要等具体消息。 据上述消息显示,苏州已有两套房,贷款全结清,如果购买第三套房,首付2成,利率3.75%;如果一套房全款或贷款已结清,另一套房仍在按揭,购买第三套房首付3成,利率4.25%;如果两套房都有按揭在还,购买第三…

    2024年3月16日
  • 广东理工大学学费

    一、学校基本信息所在城市:广东省广州市校区分布: 五山校区(主校区,含工科、理科等传统优势学科) 大学城校区(理工科及部分新兴学科) 广州国际校区(前沿交叉学科,如生物医学工程、智能制造工程)在校总人数:约4.5万人(含本科生、研究生,2024年数据)。二、2025年新生学费标准本科阶段理工外语体育类:6850元/年(软件工程3-4年级16000元/年)文科…

    2025年8月11日
  • 南哈蒙理工学院(南哈蒙理工学院真实存在吗)

    这是一件真实故事,美国电影《录取通知书》讲述了一个名叫巴特的学渣男孩由于没有考上大学,但是又不想让对自己期盼已久的父母失望,于是自己假办了一份录取通知书并建立了学校,百年以后居然成为了世界名校! 巴特在高考过后由于分数太低没考上大学,于是他先开始建立学校网站,他给自己创办的大学取名叫“南哈蒙理工学院”,为了显得更加逼真,他找来自己的好朋友一起帮他制作学校网站…

    2023年9月27日
  • 香港的大学学费_香港的大学学费一年多少人民币

    注意: -以下分析基于23fall的学费数据; -港币与人民币汇率截止至发文时间(1港币=0.92人民币)。 放眼港八大,学费最贵无疑就是香港大学,除了牙医学院专业特殊(很多3年学制,学费甚至超过100万人民币)。 其次最贵就是商学院和建筑学院,硕士学费最高在50w+人民币。 港大商学院所有专业全部读完,总费用基本都偏高,相比于英国、澳洲、美国(一年制课程)…

    2024年4月19日
  • 爱丁堡大学2023硕士申请

    爱丁堡大学每年都会公布上一年度申请数据,近几年由于中国申请者数量众多,所以学校也非常贴心的专门把中国申请者的数据单列出来。今年的申请季很快就要开始了,对于要申请爱丁堡大学的同学们,在选校阶段我们不妨来参考一下上一年度的申请数据,做到有的放矢,才能一击即中。 ‬商科类专业热度不减 商科类专业还是所有申请专业中竞争最激烈的,其中传统的商科项目比如会计、金融、经济…

    2024年9月21日
  • 美国东北大学本科申请条件_美国东北大学本科申请条件是什么

     日本东北大学本科留学申请条件 1、无日本国籍 2、在国内读完高中,毕业两年之内 3、参加日本留学生考试(EJU)

    2024年2月26日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信