维也纳大学有计算机系

西风 发自 凹非寺

量子位 | 公众号 QbitAI

挑战Transformer,MIT初创团队推出LFM(Liquid Foundation Model)新架构模型爆火。

LFM 1.3B、LFM 3B两个不同大小的模型,性能超越同等规模Llama3.2等Transformer模型。

LFM架构还有很好的可扩展性,团队还推出了基于MoE的LFM 40B(激活12B参数),能与更大规模的密集模型或MoE模型相媲美。

LFM用的是一种液态神经网络(LNN),从第一性原理出发而构建,其计算单元植根于动态系统理论、信号处理和数值线性代数。

这种架构还有一个特点:在内存效率方面特别强。

基于Transformer的LLM中的KV缓存在长上下文中会急剧增长,而LFM即使在处理100万个token时也能保持内存最小。

小巧便携,使得它能够直接部署在手机上进行文档和书籍等分析。

LFM模型背后是一支MIT计算科学与人工智能实验室衍生出来的小团队,名叫Liquid AI。

其后训练负责人Maxime Labonne在X上为自家模型疯狂打Call:

这三个具有SOTA性能的模型,是我职业生涯中最值得骄傲的版本。

AI畅销书《人工直觉》作者也表示看好。

一直等的就是这样的模型,基于物理学或神经元的“第一性原理”

目前LFM系列模型还在预览测试中,大伙儿可通过Liquid官方平台、Lambda Chat、Perplexity AI来访问。

基于液态神经网络打造

具体来看看这三个模型的性能和特点。

LFM 1.3B在MMLU、MMLU-Pro、ARC-C、GSM8K基准上相较于下表其它模型,取得SOTA性能。

LFM 3B,还能和Mistral 7B、Llama3.1 8B两倍大模型打得有来有回。

LFM 40B性能也可与比其自身更大的模型相媲美,MoE架构可实现更高吞吐可部署在更具成本效益的硬件上。

与Transformer架构相比,LFM的一个突出优势就是内存占用更少。

对于长输入效果更明显,基于Transformer的LLM中的KV缓存随着序列长度线性增长。通过有效压缩输入,LFM可以在同一硬件上处理更长的序列。

以下是LFM 3B与其它3B级模型的对比,LFM 3B能始终保持较小的内存占用。

处理100万个token,LFM 3B只需16 GB内存,而Llama-3.2-3B模型则需48 GB+。

LFM上下文有效长度为32k。

当相应得分高于85.6时,长度被认为是“有效的”(Hsieh等人,2024 RULER)。

LFM 3B在32k的上下文长度上,仍能保持89.5的高分。

实验结果中Llama 3.2生成128k上下文窗口,但实际只在4k上有效,也引起一波关注。

除此之外,LFM由结构化运算符组成,为基础模型打开了一个新的设计空间。

不仅限于语言,还可以将其应用于音频、时间序列、图像等等其它模态。

还具有高适应性,可针对特定平台(如苹果、高通、Cerebras、AMD)优化架构,或匹配给定的参数要求和推理缓存大小。

Liquid AI团队直接把目前LFM模型的优缺点都一一列了出来。

现在LFM语言模型擅长通用和专业知识、数学和逻辑推理、长上下文任务。

主要语言是英语,还支持西班牙语、法语、德语、中文、阿拉伯语、日语和韩语。

但LFM语言模型不擅长零样本代码任务、精确的数值计算、时效性信息,人类偏好优化相关技术也尚未广泛应用。

有意思的是,Liquid AI团队还明确表示LFM现在不会数“Strawberry”中“r”的数量。

经网友测试,它确实不会。

关于LFM架构更多技术细节,官方表示将持续发布技术Blog。

背后团队来自MIT CSAIL

下面简单介绍一下LFM模型背后团队——Liquid AI。

Liquid AI是一家从MIT计算机科学与人工智能实验室衍生出来的公司。

目标是在每一个规模上构建能力强大且高效的通用人工智能系统。

联合创始人共有四位。

CEO Ramin Hasani,MIT CSAIL人工智能科学家、前Vanguard Group首席人工智能和机器学习科学家。

博士论文研究主题就是关于液态神经网络(Liquid Neural Networks),由维也纳工业大学Radu Grosu教授和麻省理工学院Daniela Rus教授共同指导。

CTO Mathias Lechner,MIT CSAIL研究员。

维也纳工业大学计算机科学的学士、硕士学位,奥地利科学与技术研究所(ISTA)博士学位。

专注于开发稳健可信的机器学习模型。

首席科学官Alexander Amini,在MIT完成了计算机科学学士、硕士和博士学位,同时辅修数学。

研究的领域包括自主系统的端到端控制学习、神经网络的置信度公式化、人类移动性的数学建模以及复杂惯性精细化系统的构建。

另外一位联合创始人是MIT CSAIL主任Daniela Rus,她还是MIT电气工程与计算机科学系的Andrew&Erna Viterbi教授。

Liquid AI成立初就致力于从第一性原理出发构建新一代基础模型,是一个基于深度信号处理和状态空间层扩展语言模型的团队。

之前研究有一箩筐:

感兴趣的的家人们可以自行查阅:https://www.liquid.ai/blog/liquid-neural-networks-research

对新模型感兴趣的家人们可以测试起来了:https://playground.liquid.ai/chat?model=cm1ooqdqo000208jx67z86ftk

参考链接:[1]https://x.com/LiquidAI_/status/1840768722665189596[2]https://venturebeat.com/ai/mit-spinoff-liquid-debuts-non-transformer-ai-models-and-theyre-already-state-of-the-art/

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/46956.html

(0)
上一篇 2025年7月5日
下一篇 2025年7月5日

相关推荐

  • 出国留学需要出生证吗

    视频加载中… 前面几期小拼给大家讲了出国留学需要开具的无犯罪记录证明开具流程,这期继续给大家说说留学申请材料中也很重要的一份文件,出生证明,它的存在意义主要是记录着你的出生年月以及你与你父母的血缘关系。有了出生证明才能去办理出生公证,出生证明有以下三种形式第一种就是你出生的时候医院开具的【出生医学证明】。第二个种就是独生子女证;第三种是你原户籍地…

    2024年5月24日
  • 辽宁大学档案学

    2021年档案学基础理论学术委员会学术年会暨辽宁大学档案学专业创办40周年纪念会议于10月22日至25日在沈阳市方特花园酒店隆重举办。 1981级全体辽大档案学专业毕业生向辽大历史学院赠送具有长白山脉特色的松花玉作品,预示着辽大档案专业将蓬勃向前,再创辉煌! 档案学基础理论学术委员会学术年会是中国档案学领域具有年度性的、高规格的、广影响力的大型学术会议,历年…

    2025年9月5日
  • 伦敦国王学院qs2023

    英国热门院校 (QS全球排名Top100英国院校) 英国的大学录取基于先到先得的录取政策,每年的硕士网申开放时间一般不会有太大的变动,但请时刻关注申请院校官网,以实际时间为准! 帝国理工学院(2025QS全球排名第2名) 商学院: 录取模式:滚动录取 开放申请时间参考: 23FALL开放时间:2022/08 24FALL开放时间:2023/08/21 25F…

    2025年8月25日
  • 美国旅游优势

    在海外游的众多目的地中,美国一直是热门之选。然而,面对美国丰富多样的旅游资源,如何规划一次的定制旅游成为了许多人的难题。今天,就为大家深入剖析美国定制旅游行业,推荐一家靠谱的旅游公司——北京达美国际旅行社有限责任公司。 美国定制旅游行业优势与特点 美国定制旅游具有独特的优势和特点。从资源上看,美国地域广阔,拥有众多知名景点。东部有纽约的繁华都市、华盛顿的政治…

    2025年12月25日
  • 泰国留学优势

    最近几年泰国留学越来越火,很多人都不能理解,美、加、澳、新才是留学大国,为什么要去泰国?去泰国留学靠谱吗?今天立思辰留学小编为大家列了几条赴泰留学的优势,看完你心里就有答案了。 性价比高 花国内大学同样的钱就可以在泰国大学接受欧美式的全英文教学,大学所授文凭受中国教育部直接认可。 泰国与中国教育部签订了《中泰高等学历学位互认协议》,所以留学回国到中国教育部进…

    2026年1月15日
  • 日本筑波大学留学费用

    筑波大学是日本一所新建国立综合大学,与那些历史悠久,靠丰硕的学术成果,培养了不计其数名士要人而扬名世界的老牌大学相比,它的出名是由于它顺应世界科技发展的潮流,站在日本大学改革的前沿,完全以一所新型办学模式而出现在东方的一所现代化大学。 2015年度入学金 入学金:282,000日元 一、2015年度筑波校区本科生及硕士·博士生学费 筑波地区 第1期(4月~9…

    2025年7月10日
  • 留学生管理系统

    为落实教育数字化战略行动,提升来华留学管理服务水平,6月27日,由教育部国际合作与交流司指导、教育部留学服务中心主办的“全国来华留学管理信息系统升级改造全面上线试运行动员培训会”在浙江工业大学举行。来自教育部、国家移民管理局、外交部,以及120余所高校、30个省级教育主管部门的170余位代表线下参会,同时有来自30个省区市的外事部门及近千所院校的2000多位…

    2024年1月26日
  • 东京市立大学

    高考结束了,很多人开始考虑“Plan B”——不考国内大学,直接出国。很多人也在犹豫:高考完去日本读大学到底有没有用?值不值得? 今天我们就从升学、费用、就业等多个角度,给大家讲清楚这个问题,尤其适合高考成绩不理想但不甘心的同学认真看看。 一、日本留学到底有什么优势?1. 升学方式更灵活,压力没那么大 相比国内“一考定终身”,日本大学招生更灵活。比如你可以先…

    2025年7月31日
  • 英国斯特林大学世界排名_英国斯特林大学世界排名第几

     英国斯特林大学在2021年QS世界大学排名中排名第485名。 斯特林大学优势专业 物理科学 物理科学与生命系统领域无关,属于非生命系统研究。物理科学的分支包括物理学、文学、化学和地球科学。你看,你有很多选择。在物理科学领域有很多东西你还不懂。学完这个专业后,你就能学好了。 计算机科学 计算机科学专业所学的是支持社会日常使用计算机程序的所有理论。不管你喜不喜…

    2024年3月18日
  • 韩国梨花女子大学好吗

    26年的QS排名出炉了,韩国大学的QS大学排名变化总是让人期待,因为其他国家的大学排名好像总是一成不变,而韩国就不一样了,可以说是某些学校是翻天覆地,变化也会影响同学们选择院校,所以我们特别关注,今天来带大家回顾下韩国这些年哪些院校变化非常大。 西江大学 西江大学从我10多年前韩国留学的时候就是名校,15年的世界排名是421名,我记得那个时候西江就算排名降低…

    2025年8月8日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信