福坦莫大学llm

编辑:编辑部 JhY

【新智元导读】斯坦福大学最新AI进展!开源STORM&Co-STORM系统,只需填写主题,就可以全面整合资源,避开信息盲点生成高质量长文。

AI写作神器,竟被斯坦福开源了!

在OpenAI与Perplexity绞尽脑汁去动谷歌搜索的蛋糕时,斯坦福研究团队却「于无声处响惊雷」,一鸣惊人推出了支持避开信息盲点、全面整合可靠信息、从头写出维基长文的STORM&Co-STORM系统。

背后模型是由必应搜索,以及GPT-4o mini加持。

简单来讲,STORM&Co-STORM系统分为两部分。

STORM通过让「LLM专家」与「LLM主持人」进行多角度问答,以此从提纲,到段落与文章的迭代式生成。

Co-STORM则是能够通过让多智能体之间互相对话并生成可交互的动态思维导图,以避免遗漏掉用户没注意到的信息需求。

该系统只需输入英文主题词,就能生成有效整合了多源信息的高质量长文(如维基百科文章)。

体验链接:https://storm.genie.stanford.edu/

进入主页,可以自选模式STORM和Co-STORM。

给定主题后,STORM便可以在3分钟内就形成如下演示中的一篇「形神兼备」的结构化高质量长文。

我们也可以在给出的文章上面点击「See BrainSTORMing Process」来获取如下图所示中,不同LLM Role的头脑风暴过程。

在「发现」栏中,还可以参考当前其他学者生成的一些文章,以及聊天的示例。

另外,个人生成的文章和聊天记录,都可以在侧边栏My Library中找到。

系统一经发布,大家纷纷上手体验,许多人惊叹道,STORM & Co-STORM实在让人眼前一亮!

「你只需输入一个主题,它就会搜索数百个网站,然后把主要发现写成一篇文章。关键是每个人都可以免费使用!」

网友Josh Peterson更是利用STORM,第一时间去结合NotebookLLM自动生成了播客。

具体流程是这样的:使用STORM生成4篇文章,然后将其中2篇提交给GPT-4o分析并提出后续主题。最后再把它们添加到NotebookLM里,一期有声的播客就做好了。

网友Pavan Kumar则是认为STORM揭示了一个重大趋势:「 就算是没有博士学历,也可以创作出现阶段博士生才能有的成果。而将来一年的课程内容也足以媲美如今4-7年才能修读到的课程内容。」

STORM协助从头写出维基好文

论文链接:https://arxiv.org/pdf/2402.14207

传统长文写作(如维基百科文章)需要大量人工进行写作前的准备,包括资料搜集和大纲构建,而目前的生成式写作方法通常忽略这些步骤。

但是这也意味着生成文章往往面临着信息角度覆盖不周到,文章内容不够充实的问题。

而STORM可以通过多个LLM-Role互相提问与回答来让文章内容所涉及的角度更加详实周全。

如下图所示,STORM系统分为三大阶段:

1. 多视角问题生成:

– 为了覆盖主题的不同方面,系统引入多角色模拟(如专家、普通用户),并生成视角引导的问题- 图(A)显示了简单问题生成的效果有限,图(B)演示了通过视角引导问题生成的多样性提升

2. 大纲生成与完善:

– 使用模型的内置知识生成初步大纲。- 系统通过对话(图C)模拟提问并完善大纲,使其更具深度

3. 全文生成:

– 基于大纲逐节生成文章,利用检索到的信息增加内容可信度和引用

从给定的主题入手,STORM系统通过查阅相关的维基百科文章(步骤1-2)来确定涵盖该主题的各种视角。

接着,它会模拟这样一场对话:一方是维基百科撰写者,其会依据给定视角提出问题,另一方则是基于可靠网络来源的专家(步骤3-6)。

根据LLM的固有知识, 从不同视角收集到的对话内容, 最终精心编排了写作大纲(步骤7-8)。

STORM系统自动化写作的整体流程

由于早期的研究采用了不同的设置,并未使用大语言模型(LLM),因此难以直接进行比较。

所以研究者使用了以下三种基于LLM的基线方法:

1. Direct Gen:一种直接提示LLM生成提纲的基线方法,生成的提纲随后用于创作完整的文章。

2. RAG:一种检索增强生成(Retrieval-Augmented Generation)基线方法,该方法通过主题进行搜索,并利用搜索结果与主题一起生成提纲或完整的文章。

3. oRAG(提纲驱动的RAG):与RAG在提纲创建上完全一致,但进一步通过章节标题检索额外信息,以逐章节地生成文章内容。

从上表可以发现,利用STORM生成的文章完全不输于人类水平,并且也优于目前LLM生成文章的几种范式,如效果最强的oRAG。

但不可否认的是,STORM生成文章的质量在中立性和可验证性方面仍然落后于经过精心修订的人工撰写文章。

虽然STORM在研究给定主题时发现了不同的视角,但收集的信息可能仍然倾向于互联网的主流来源,并可能包含促销内容。

该研究的另一个局限性是,尽管研究者专注于从零开始生成类似维基百科文章,但他们也仅考虑生成自由组织的文本。而人工撰写的高质量维基百科文章通常包含结构化数据和多模态信息。

因此,目前利用LLM生成文章所面临的最关键的挑战,依然是基于事实去生成拥有多模态结构的高质量文章。

智能体沟通打破人类盲点,显著降低认知负担

对于一些学习任务来讲,在搜集整合信息中,通常会由于个人或搜索引擎偏好而造成信息遗漏,以至于无法触及信息盲点(即未意识到的信息需求)。

研究团队在下列论文中所提出的Co-STORM正是为了改善这一情况,以大幅促进学习效率。

论文链接:https://www.arxiv.org/abs/2408.15232

在学习工作中,使用搜索引擎面临着需要阅览过多的冗余信息,而和Chatbots问答聊天,则又不知道如何进行准确的提问。但是这两种获取信息的方式都无法触及「信息盲点」,况且认知负担还不小。

那如果阅读现有的一些报道呢?这虽然降低了认知负担,但并不支持交互,无法让我们去更进一步的进行深度学习。

而与上述信息获取方式不同,Co-STORM智能体能够代表用户提问,能够多方位地获取新信息,探索到自己的「信息盲点」。然后通过动态思维导图组织信息,并最终生成综合报告。

如下图所示,Co-STORM由以下模块组成:

– 多智能体协作对话:由「专家」和「主持人」进行模拟对话,探讨主题各个方面的相关内容。

– 动态思维导图:实时追踪对话内容,将信息按层次组织,帮助用户理解和参与。

– 报告生成:系统基于思维导图生成引用明确、内容翔实的总结报告。

为了更真实地反映用户体验,研究者对20名志愿者进行了人类评估,比较了Co-STORM与传统搜索引擎和RAG Chatbot的表现。结果显示:

1. 信息探索体验:

– Co-STORM显著提升了信息的深度和广度- 用户发现其能够有效引导探索盲点

2. 用户偏好:

– 70%的用户更喜欢Co-STORM,认为其显著减少了认知负担- 用户特别认可动态思维导图对跟踪和理解信息的帮助

不过,目前STORM&Co-STORM还仅支持英语交互,未来或许官方团队会将其扩展至拥有多语言交互能力。

最后,正如网友TSLA的感受一样,「我们正生活在一个非凡的时代。今天,不仅所有的信息都变得触手可及,甚至连信息获取的方式也可以完全根据自己的水平量身定制,让学习任何东西都成为可能。」

主要作者介绍

Yucheng Jiang是斯坦福大学计算机科学专业的硕士研究生。

他的研究目标是通过创建能够与用户无缝协作的系统,提升学习能力、决策效率和工作生产力。

Yijia Shao是斯坦福大学自然语言处理(NLP)实验室的二年级博士生,由杨笛一教授指导。

此前,她是北京大学元培学院的本科生,通过与Bing Liu教授的合作,开始接触并从事机器学习和自然语言处理的研究。

声明:壹贝网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者wangteng@admin所有,原文出处。若您的权利被侵害,请联系 756005163@qq.com 删除。

本文链接:https://www.ebaa.cn/40021.html

(0)
上一篇 2025年1月5日
下一篇 2025年1月5日

相关推荐

  • 澳大利亚留学的条件_澳大利亚留学的条件和要求是什么

    澳大利亚,一个充满多元文化和自然风光的国家,吸引着无数海外学子前来求学。那么,想要踏上这片神奇的土地,你需要满足哪些条件呢?本文将为你详细解析澳大利亚留学的各项条件,助你顺利开启留学之旅。 一、学历要求 澳大利亚的高等教育机构对国际学生的学历要求各不相同,但一般来说,申请者需要完成相当于澳大利亚12年级的高中教育,或者具备同等学历。此外,对于申请研究生课程的…

    2024年3月10日
  • 美国密苏里州立大学法学硕士

    从最初一个小小的经济贸易系,到如今本科专业、硕士点、研究机构、实验中心……的五脏俱全,历经十五载春秋,商学院缓缓走来、步步壮大,在融法通商的道路上稳步前行,在创新兴邦的征途中披荆斩棘!近日,商学院建院十五周年暨学院校友会(含经贸系及经济法原金融专业)成立大会举行,让我们一同去感受这十五载悠悠岁月。 十五岁,青春正当时;十五年,商学院正当年! 院系发展 商学院…

    2025年7月24日
  • 曼海姆大学全国排名

    【环球网留学综合报道】据英国《独立报》4月1日报道,QS周二发布经济学科领域院校最新排名,伦敦政治经济学院名列欧洲院校排行榜榜首。 据了解,每年QS会根据院校声望和在特定学科发表论文被引用数量对大学进行排名,排名采用百分制。《独立报》列举了欧洲院校在经济学科领域的前16名。 1.伦敦政治经济学院 伦敦政治经济学院2015年排名就位居欧洲榜首,该校校友中共有1…

    2024年11月23日
  • 布拉德福德大学转学

    匹兹堡大学 (University of Pittsburgh),又称“匹大” (PITT),位于美国东北部宾夕法尼亚州的一所公立研究型大学,是美国著名高等学府。拥有极高的学术声望,为“公立常春藤”院校之一以及美国大学协会成员之一。 美藤国际教育介绍,匹兹堡大学成立于1787年,是美国最早的十所大学之一,也是美国最早成立的五所顶尖私立大学之一(哈佛大学、耶鲁…

    2024年8月1日
  • 韩国大学费用明细

    对于即将前往韩国留学的同学们来说,住宿问题无疑是头等大事。而大学宿舍作为许多留学生的首选,其费用情况更是备受关注,建议第一学期申请宿舍。今天,绿皮动车韩国留学就用1分钟的时间,带你快速了解韩国5所大学宿舍的费用情况,让你在留学准备中更加得心应手! 延世大学GLC 延世大学 01 延世大学本科大一除了少量专业外,都需要到仁川国际校区上课,大二回首尔校区,以上面…

    2025年9月10日
  • 日本东北大学_日本东北大学世界排名

    哎呀呀~看标题这多少有点凡尔赛了噢! 哈哈哈这里真心推荐一下三峰日本语学校,真的是一所超级适合考研党的语言学校! 关于三峰日本语学校详情(点蓝字跳转):三峰日本语学校 | 招生严苛 升学为主 需提前一年申请! 目前这位同学应该已经选完学校啦,不过这个话题还是比较值得拿出来讨论一下的,如果是你,又会如何选择呢? 东北大学——位于日本宫城县仙台市,日本国立大学,…

    2024年3月15日
  • 出国留学体检中心(杭州出国留学体检中心)

    美国留学行前体检在哪儿做 首选当地的国际旅行卫生保健中心。可在高德地图搜索中心地址,以及拨打114查询联系电话,致电咨询预约流程和需要携带的资料。 以广州国际旅行卫生保健中心为例,可以在公众号“广州国际旅行卫生保健中心”查看《出境体检须知》,以及根据指示预约体检。 美国留学行前体检要做什么 大致分两部分: 中国公民出入境健康体检 一般健康体检:内科,外科,五…

    2023年10月12日
  • 除夕不放假A股还正常开市吗?上交所向各基金公司进行意愿调研

    10月31日,界面新闻获悉,就2024年2月9日除夕当天A股是否开市,上交所于近日向各基金公司进行了意愿调研。该调研共设置“支持正常开市交易”或“建议休市”两个选项。 界面新闻记者致电多家券商营业部,多名工作人员均表示除夕当日可进行正常交易。 “根据我们公司通知,除夕当天正常开市,投资者可正常操作APP进行交易。”沪上一位营业部人员称。 此外,有多位券商人士…

    2023年10月31日
  • 康奈尔大学毕业名人

    说梁启超是跨界通才,应该没有人有意见吧?他的头衔很长:伟大的思想家、政治家、教育家、史学家、文学家…… 但今天要讲的这个人,比梁启超还有通才范儿,跨界之大,百年难得一见:有人说他是物理学家,有人说他是数学家,有人说他是哲学家,有人说他是音乐家,有人说他是语言学家…… 说辜鸿铭是语言天才,大家也没意见吧?据说他精通9国语言,靠背诵《浮士德》学成德语,靠背诵莎士…

    2025年9月11日
  • 美国夏威夷大学世界排名

    近年来,侵害在外访学人员安全案例时有发生。随着恐袭、枪击案、自然灾害等先后成为各国关注的焦点,出国访学安全也上升到了一个新的高度。平安是成功访学的基本保障,对于访问学者来说选择一个安全可靠的院校,则是平安的先决条件。 今天,51访学网小编就带大家一起盘点美国大学治安排名。 美国最安全大学 TOP10AH 美国一家提供安全系统服务的公司Safeatlast通过…

    2025年11月12日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信