维也纳大学有计算机系

西风 发自 凹非寺

量子位 | 公众号 QbitAI

挑战Transformer,MIT初创团队推出LFM(Liquid Foundation Model)新架构模型爆火。

LFM 1.3B、LFM 3B两个不同大小的模型,性能超越同等规模Llama3.2等Transformer模型。

LFM架构还有很好的可扩展性,团队还推出了基于MoE的LFM 40B(激活12B参数),能与更大规模的密集模型或MoE模型相媲美。

LFM用的是一种液态神经网络(LNN),从第一性原理出发而构建,其计算单元植根于动态系统理论、信号处理和数值线性代数。

这种架构还有一个特点:在内存效率方面特别强。

基于Transformer的LLM中的KV缓存在长上下文中会急剧增长,而LFM即使在处理100万个token时也能保持内存最小。

小巧便携,使得它能够直接部署在手机上进行文档和书籍等分析。

LFM模型背后是一支MIT计算科学与人工智能实验室衍生出来的小团队,名叫Liquid AI。

其后训练负责人Maxime Labonne在X上为自家模型疯狂打Call:

这三个具有SOTA性能的模型,是我职业生涯中最值得骄傲的版本。

AI畅销书《人工直觉》作者也表示看好。

一直等的就是这样的模型,基于物理学或神经元的“第一性原理”

目前LFM系列模型还在预览测试中,大伙儿可通过Liquid官方平台、Lambda Chat、Perplexity AI来访问。

基于液态神经网络打造

具体来看看这三个模型的性能和特点。

LFM 1.3B在MMLU、MMLU-Pro、ARC-C、GSM8K基准上相较于下表其它模型,取得SOTA性能。

LFM 3B,还能和Mistral 7B、Llama3.1 8B两倍大模型打得有来有回。

LFM 40B性能也可与比其自身更大的模型相媲美,MoE架构可实现更高吞吐可部署在更具成本效益的硬件上。

与Transformer架构相比,LFM的一个突出优势就是内存占用更少。

对于长输入效果更明显,基于Transformer的LLM中的KV缓存随着序列长度线性增长。通过有效压缩输入,LFM可以在同一硬件上处理更长的序列。

以下是LFM 3B与其它3B级模型的对比,LFM 3B能始终保持较小的内存占用。

处理100万个token,LFM 3B只需16 GB内存,而Llama-3.2-3B模型则需48 GB+。

LFM上下文有效长度为32k。

当相应得分高于85.6时,长度被认为是“有效的”(Hsieh等人,2024 RULER)。

LFM 3B在32k的上下文长度上,仍能保持89.5的高分。

实验结果中Llama 3.2生成128k上下文窗口,但实际只在4k上有效,也引起一波关注。

除此之外,LFM由结构化运算符组成,为基础模型打开了一个新的设计空间。

不仅限于语言,还可以将其应用于音频、时间序列、图像等等其它模态。

还具有高适应性,可针对特定平台(如苹果、高通、Cerebras、AMD)优化架构,或匹配给定的参数要求和推理缓存大小。

Liquid AI团队直接把目前LFM模型的优缺点都一一列了出来。

现在LFM语言模型擅长通用和专业知识、数学和逻辑推理、长上下文任务。

主要语言是英语,还支持西班牙语、法语、德语、中文、阿拉伯语、日语和韩语。

但LFM语言模型不擅长零样本代码任务、精确的数值计算、时效性信息,人类偏好优化相关技术也尚未广泛应用。

有意思的是,Liquid AI团队还明确表示LFM现在不会数“Strawberry”中“r”的数量。

经网友测试,它确实不会。

关于LFM架构更多技术细节,官方表示将持续发布技术Blog。

背后团队来自MIT CSAIL

下面简单介绍一下LFM模型背后团队——Liquid AI。

Liquid AI是一家从MIT计算机科学与人工智能实验室衍生出来的公司。

目标是在每一个规模上构建能力强大且高效的通用人工智能系统。

联合创始人共有四位。

CEO Ramin Hasani,MIT CSAIL人工智能科学家、前Vanguard Group首席人工智能和机器学习科学家。

博士论文研究主题就是关于液态神经网络(Liquid Neural Networks),由维也纳工业大学Radu Grosu教授和麻省理工学院Daniela Rus教授共同指导。

CTO Mathias Lechner,MIT CSAIL研究员。

维也纳工业大学计算机科学的学士、硕士学位,奥地利科学与技术研究所(ISTA)博士学位。

专注于开发稳健可信的机器学习模型。

首席科学官Alexander Amini,在MIT完成了计算机科学学士、硕士和博士学位,同时辅修数学。

研究的领域包括自主系统的端到端控制学习、神经网络的置信度公式化、人类移动性的数学建模以及复杂惯性精细化系统的构建。

另外一位联合创始人是MIT CSAIL主任Daniela Rus,她还是MIT电气工程与计算机科学系的Andrew&Erna Viterbi教授。

Liquid AI成立初就致力于从第一性原理出发构建新一代基础模型,是一个基于深度信号处理和状态空间层扩展语言模型的团队。

之前研究有一箩筐:

感兴趣的的家人们可以自行查阅:https://www.liquid.ai/blog/liquid-neural-networks-research

对新模型感兴趣的家人们可以测试起来了:https://playground.liquid.ai/chat?model=cm1ooqdqo000208jx67z86ftk

参考链接:[1]https://x.com/LiquidAI_/status/1840768722665189596[2]https://venturebeat.com/ai/mit-spinoff-liquid-debuts-non-transformer-ai-models-and-theyre-already-state-of-the-art/

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/46956.html

(0)
上一篇 2025年7月5日
下一篇 2025年7月5日

相关推荐

  • 匹兹堡大学与南加州大学

    相比其他任何事情,美国总统唐纳德·特朗普最喜欢取得胜利。然而,通过简单三步,他已经把美国置于失去21世纪的境地:第一,疏远朋友;第二,破坏营商环境;第三,宰杀金鹅(即科学和研究)。 特朗普在椭圆形办公室对盟友发怒,最生动地展示了第一步。但这也包括他对朋友的无端侮辱,突然终止应对全球公共卫生威胁(包括美国造成的一些威胁)的项目,以及在没有明确目标的情况下威胁惩…

    2025年9月15日
  • 中国大学最大的学校

    在中国众多高校中,有一所大学以其广阔的校园面积脱颖而出,成为全国面积最大的大学。这所大学就是东北林业大学。 东北林业大学位于黑龙江省哈尔滨市,占地面积高达49.5万亩,相当于一座中等城市的规模。校园内不仅有教学楼、实验室、图书馆等常规设施,还拥有大片的森林、湖泊和湿地,生态环境极其优美。学校的主校区更是被一片原始森林环绕,仿佛置身于大自然之中。 东北林业大学…

    2025年3月26日
  • 昆明新东方(昆明新东方学校官网)

    来源:【昆明日报-掌上春城】 掌上春城讯8月18日,云南新东方烹饪学校秋季人才招聘双选会举行,为380名毕业生提供了500多个就业岗位。 本次双选会以“校企合作育英才,产教融合共发展”为主题,为学生提供了更多的就业机会。重庆火宝宝餐饮文化有限公司行政人事经理介绍,他们今年计划在云南新东方烹饪学校招30-50名毕业生,对学生的要求除专业能力强外,还希望学生积极…

    2023年9月27日
  • 新加坡伯明翰大学mba

    重庆工商大学简介 重庆工商大学始创于 1952 年,2002 年由原渝州大学和原重庆商学院合并组建。它是国家 “中西部高校基础能力建设工程” 高校、重庆市国际人文特色高校。学校以经济学、管理学为优势,多学科协调发展,拥有应用经济学等 3 个一级学科博士学位授权点。工程学等 4 个学科进入 ESI 全球前 1%,在全国学科评估中,应用经济学、工商管理排名分别位…

    2025年8月12日
  • 土耳其商务签证(土耳其商务签证资料)

    土耳其,这是一个跨欧、亚、非三洲交通要塞的国家,北临黑海,南临地中海,东南与叙利亚、伊拉克接壤,西临爱琴海,与希腊以及保加利亚接壤,东部与格鲁吉亚、亚美尼亚、阿塞拜疆和伊朗接壤,优秀的地理位置自古以来就是多元文化交汇处,是古文明发源地之一,是连接欧亚的十字路口。丰富的文化历史使土耳其拥有许多珍贵的文化瑰宝–阿尔忒弥斯神庙和摩索拉斯陵墓,不仅如此,…

    2023年9月14日
  • 吉林大学普林斯顿大学

    在北国春城,屹立着这样一所学府,它由六所大学合并而成,七十余载沐雨经霜,现在已经发展为我国国内规模最大、学科门类最全的高校之一——她就是"双一流"高校吉林大学。学校不仅学科门类齐全,且基础学科实力强劲。2020年,学校入选强基计划试点高校,数学、物理学、化学3个国家双一流学科在辽宁、吉林、黑龙江、山东、河南、河北、安徽、江西、湖南九个省份…

    2025年7月28日
  • 铭传大学录取分数

    关注子墨,关注您孩子的高考! @杜永堂的子墨课堂遨游大学的海洋…… 子墨生涯规划研究院-高考志愿填报指南 2024年东莞理工学院各专业招生录取情况表(广东省) 子墨高考志愿填报指南-东莞理工学院 子墨老师汇总了2024年,东莞理工学院普通类 (普通类+粤台计划+联合培养+中外合作办学) 其它模式录取数据请私信子墨老师 为您的高考志愿保驾护航 东莞理工学院,作…

    2025年7月27日
  • 办法国签证需要什么材料

    现在人们的经济承担能力变得越来越高,所以前期海外旅游的人数和留学的人数也变得越来越多。每年前往法国的留学人数和旅游人数,都是非常多的,所以办理签证的人士也非常多。办理任何国家的相关签证,都需要相应的材料来作为支撑。每个国家办理签证的条件要求不一样,准备的相关原材料也有一定的区别,所以,办理法国所需要材料具体包括什么呢? 法国签证所需材料 办理法国签证所需材料…

    2024年4月29日
  • 2025泰晤士前100的大学

    2025年泰晤士高等教育亚洲大学排名在中国澳门的澳门科技大学举行的2025年亚洲大学峰会上正式揭晓。 中国内地高校再次领跑亚洲大学排名,清华大学连续七年蝉联榜首,北京大学稳居亚洲第二。 前10名中国内地高校占据了五席,复旦大学和浙江大学的排名均上升一位,分别位列第七和第八。上海交通大学位列第10名。新加坡、日本和中国香港的高校占据前10中的其余席位,与202…

    2025年12月27日
  • 去英国办签证需要什么材料

    早在2020年9月10日,英国移民局发布了移民法修订法案,对学生签证制度进行了全面改革。该法案于2020年10月5日正式生效。新系统下,签证申请流程有所简化,资金证明要求和语言成绩要求等方面也有所放松,申请者能在计划前往英国的6个月内提出申请。那签证办理的流程是什么,需要准备哪些材料呢? 申请流程 1.在线申请表填写 最早可在课程开始前的6个月开始,首先登录…

    2024年4月30日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信