维也纳大学有计算机系

西风 发自 凹非寺

量子位 | 公众号 QbitAI

挑战Transformer,MIT初创团队推出LFM(Liquid Foundation Model)新架构模型爆火。

LFM 1.3B、LFM 3B两个不同大小的模型,性能超越同等规模Llama3.2等Transformer模型。

LFM架构还有很好的可扩展性,团队还推出了基于MoE的LFM 40B(激活12B参数),能与更大规模的密集模型或MoE模型相媲美。

LFM用的是一种液态神经网络(LNN),从第一性原理出发而构建,其计算单元植根于动态系统理论、信号处理和数值线性代数。

这种架构还有一个特点:在内存效率方面特别强。

基于Transformer的LLM中的KV缓存在长上下文中会急剧增长,而LFM即使在处理100万个token时也能保持内存最小。

小巧便携,使得它能够直接部署在手机上进行文档和书籍等分析。

LFM模型背后是一支MIT计算科学与人工智能实验室衍生出来的小团队,名叫Liquid AI。

其后训练负责人Maxime Labonne在X上为自家模型疯狂打Call:

这三个具有SOTA性能的模型,是我职业生涯中最值得骄傲的版本。

AI畅销书《人工直觉》作者也表示看好。

一直等的就是这样的模型,基于物理学或神经元的“第一性原理”

目前LFM系列模型还在预览测试中,大伙儿可通过Liquid官方平台、Lambda Chat、Perplexity AI来访问。

基于液态神经网络打造

具体来看看这三个模型的性能和特点。

LFM 1.3B在MMLU、MMLU-Pro、ARC-C、GSM8K基准上相较于下表其它模型,取得SOTA性能。

LFM 3B,还能和Mistral 7B、Llama3.1 8B两倍大模型打得有来有回。

LFM 40B性能也可与比其自身更大的模型相媲美,MoE架构可实现更高吞吐可部署在更具成本效益的硬件上。

与Transformer架构相比,LFM的一个突出优势就是内存占用更少。

对于长输入效果更明显,基于Transformer的LLM中的KV缓存随着序列长度线性增长。通过有效压缩输入,LFM可以在同一硬件上处理更长的序列。

以下是LFM 3B与其它3B级模型的对比,LFM 3B能始终保持较小的内存占用。

处理100万个token,LFM 3B只需16 GB内存,而Llama-3.2-3B模型则需48 GB+。

LFM上下文有效长度为32k。

当相应得分高于85.6时,长度被认为是“有效的”(Hsieh等人,2024 RULER)。

LFM 3B在32k的上下文长度上,仍能保持89.5的高分。

实验结果中Llama 3.2生成128k上下文窗口,但实际只在4k上有效,也引起一波关注。

除此之外,LFM由结构化运算符组成,为基础模型打开了一个新的设计空间。

不仅限于语言,还可以将其应用于音频、时间序列、图像等等其它模态。

还具有高适应性,可针对特定平台(如苹果、高通、Cerebras、AMD)优化架构,或匹配给定的参数要求和推理缓存大小。

Liquid AI团队直接把目前LFM模型的优缺点都一一列了出来。

现在LFM语言模型擅长通用和专业知识、数学和逻辑推理、长上下文任务。

主要语言是英语,还支持西班牙语、法语、德语、中文、阿拉伯语、日语和韩语。

但LFM语言模型不擅长零样本代码任务、精确的数值计算、时效性信息,人类偏好优化相关技术也尚未广泛应用。

有意思的是,Liquid AI团队还明确表示LFM现在不会数“Strawberry”中“r”的数量。

经网友测试,它确实不会。

关于LFM架构更多技术细节,官方表示将持续发布技术Blog。

背后团队来自MIT CSAIL

下面简单介绍一下LFM模型背后团队——Liquid AI。

Liquid AI是一家从MIT计算机科学与人工智能实验室衍生出来的公司。

目标是在每一个规模上构建能力强大且高效的通用人工智能系统。

联合创始人共有四位。

CEO Ramin Hasani,MIT CSAIL人工智能科学家、前Vanguard Group首席人工智能和机器学习科学家。

博士论文研究主题就是关于液态神经网络(Liquid Neural Networks),由维也纳工业大学Radu Grosu教授和麻省理工学院Daniela Rus教授共同指导。

CTO Mathias Lechner,MIT CSAIL研究员。

维也纳工业大学计算机科学的学士、硕士学位,奥地利科学与技术研究所(ISTA)博士学位。

专注于开发稳健可信的机器学习模型。

首席科学官Alexander Amini,在MIT完成了计算机科学学士、硕士和博士学位,同时辅修数学。

研究的领域包括自主系统的端到端控制学习、神经网络的置信度公式化、人类移动性的数学建模以及复杂惯性精细化系统的构建。

另外一位联合创始人是MIT CSAIL主任Daniela Rus,她还是MIT电气工程与计算机科学系的Andrew&Erna Viterbi教授。

Liquid AI成立初就致力于从第一性原理出发构建新一代基础模型,是一个基于深度信号处理和状态空间层扩展语言模型的团队。

之前研究有一箩筐:

感兴趣的的家人们可以自行查阅:https://www.liquid.ai/blog/liquid-neural-networks-research

对新模型感兴趣的家人们可以测试起来了:https://playground.liquid.ai/chat?model=cm1ooqdqo000208jx67z86ftk

参考链接:[1]https://x.com/LiquidAI_/status/1840768722665189596[2]https://venturebeat.com/ai/mit-spinoff-liquid-debuts-non-transformer-ai-models-and-theyre-already-state-of-the-art/

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/46956.html

(0)
上一篇 2025年7月5日
下一篇 2025年7月5日

相关推荐

  • 君诚国际学校(北京君诚国际学校)

    记者丨殷建 立了多年的学霸人设,却在一夜之间塌了房。这事儿最近发生在了演员黄磊的女儿黄多多身上。 此前,黄多多开通了一个公众号,名为《陪你多读书》,公众号推送的大多是黄多多讲故事并录制视频的相关内容,主要采用的是中英两种语言。 不过,有网友发现,黄多多在视频里阅读的时候,出现了几处明显错误,例如:河堤(dī)读成河堤(tí),木屑(xiè)读成木屑(xuè)…

    2023年11月8日
  • 美国签证拒签后多久可以再申请

    又到8月底了,8月的美签是惨不忍睹的,很多伙伴问我9月会不会改善一些,我的答案是:暂时不会有多大改善。什么原因导致?很多人认为是疫情原因导致,其实并不然,主要是因为中美关系发生变化了。在想回到奥巴马时代的美签,是不可能了。 老胡我说签证就说签证,并不想牵扯或者发表政治观点,但是目前申请美签,肯定是离不开中美关系这个存量的。大家想一想,如果中美关系好得像亲兄弟…

    2024年4月17日
  • 有美国签证可以去哪些国家

    申请美国签证是很多人梦寐以求的事情,因为成功获得美国签证不仅可以去美国旅游,还可以帮助他们免签前往其他国家。这是因为美国签证通常被公认为信誉度很高的证明文件,很多国家相信美国签证申请人的信息真实性,并认为拥有美国签证的持有人属于“低风险”人员。 同时,美国签证的申请条件较为苛刻,申请人需要提供一系列证明文件来证明自己符合美国签证的要求,因此持有美国签证的人在…

    2024年4月26日
  • 美国密苏里州立大学(美国密苏里州立大学世界排名)

    密苏里大学(University of Missouri,缩写UM)成立于1839年,是1862年的莫里尔联邦赠地法案的受益者,也是美国历史上密西西比河以西的第一所州立大学,也是目前密苏里州最大的学校。该校现已发展成为著名的密苏里州大学系统,拥有四个校区,分别是哥伦比亚校区、罗拉校区、堪萨斯城校区和圣路易斯校区。 密苏里大学共有学生约63,000名。因在历史…

    2023年9月16日
  • 浙大爱丁堡大学19年分数线

    学校概况 浙江大学是一所历史悠久、声誉卓著的高等学府,坐落于中国历史文化名城、风景旅游胜地杭州。浙江大学的前身求是书院创立于1897年,为中国人自己最早创办的新式高等学校之一。120余年来,浙江大学始终秉承“求是创新”为校训的优良传统,以天下为己任、以真理为依归,逐步形成了“勤学、修德、明辨、笃实”的浙大人共同价值观和“海纳江河、启真厚德、开物前民、树我邦国…

    2024年11月10日
  • 建筑研究生留学

    建筑学专业是日本的大学、专科学校开设的课程名称,研究方向根据学校会有所不同,每个学校开设的课程以及教学内容也多少会有些不同。在这里蔚蓝小编以东京大学工学部建筑学科为例来介绍一下建筑学的学习内容: 由于建筑学设计的知识面极其广泛,因此学生要对专业知识有系统的学习。到大二下学期的必修课程包括建筑史、建筑构法、环境工学、建筑材料、建筑计划、建筑构造等,大三下学期以…

    2025年12月25日
  • 高中去澳大利亚留学需要考雅思吗

    随着移民潮的流行和增长,留学也呈现低龄化发展,其实,早早出去让孩子提早适应国外的环境,对尽快融入生活环境也是有好处的,那其中高中去澳洲读书需要什么条件呢?下面随小编一起往下来了解吧。 一、高中去澳洲读书学术成绩 成绩单:学校通常会要求提供初中三年的成绩单,成绩要达到一定标准,比如各科成绩至少要在中等偏上,这是评估学生学习能力的重要依据。 入学测试:有些学校可…

    2025年11月3日
  • uci大学作词研究生

    一提到明星,就觉得他风光无限,但是每个成功的人士背后都有一段心酸的历程,满世界巡演的王力宏也是如此。让我们一起来看看明星队他的评价吧! 潘玮柏:他就是那么个人。一直让我吃惊的是,一个人怎么能在那么多的方面如此的有才能,还表现得这么平常,沉浸在快乐里。你会想到他在音乐上做了大量的工作,他也是个几乎完美的人,但实际上他在现实生活中很随意。力宏家里很空,只有的床,…

    2025年1月23日
  • 澳大利亚一年留学费用_澳大利亚一年留学费用多少钱

    澳大利亚一直是热门留学国家之一,而澳洲八大因其高排名等优势也是吸引了不少学生前往深造学业。 小编整理了澳洲八大本科和硕士申请要求,供大家参考。 澳洲八大本科·硕士申请要求 墨尔本大学 2024QS世界大学排名14 墨尔本大学(TheUniversity ofMelbourne,简称UniMelb)位于澳大利亚墨尔本市,是一所世界知名的公立综合类研究型大学,也…

    2024年4月18日
  • 技校出国留学_技校出国留学需要什么条件吗

    当然可以!虽然很多人认为只有大学毕业才有资格去留学,但其实不然。职业学校毕业生也完全可以申请留学。 首先,留学申请的关键在于申请人的能力和条件,而不是学历。如果你有良好的学业成绩、语言能力和实践经验,就有机会赢得留学机会。其次,在申请留学之前,你需要了解目标国家的教育政策和学校要求,为自己的申请做好充分的准备。 职业学校毕业生有另外一个优势,就是在实践经验方…

    2024年2月2日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信