当前位置：首页 > news >正文

解码知识整理，使您的研究更高效！

news 2025/8/18 22:58:15

在当今知识爆炸的数字世界中，信息的获取与整理越来越受到关注。为了应对这一挑战，斯坦福大学的研究团队开发了一个名为STORM（Synthesis of Topic Outlines through Retrieval and Multi-perspective Question Asking）的开源系统。此系统基于大语言模型（LLM），通过检索和多视角问题提出实现对主题的知识梳理，自动生成带有引注的完整报告，为用户提供高效的知识探索和创建体验。

什么是STORM？

STORM是一个创新的LLM驱动系统，能够从零开始构建类似Wikipedia的文章。它通过互联网搜索和引用整理，生成完整的带有引注的长篇文章。STORM系统特别适合那些希望轻松探索新领域，获取相关信息并将其组织成知识体系的用户。尽管尚无法生产出无需编辑的发布级文章，但STORM在前期创作阶段为经验丰富的维基百科编辑者提供了极大帮助。迄今为止，已有超过七万人参与该系统的实时研究预览，反馈积极。

核心功能详解

双阶段知识生成过程

STORM的知识生成过程分为两个主要阶段：

预写阶段：系统进行互联网研究，收集参考资料并生成大纲。
写作阶段：利用生成的大纲和参考资料，撰写出带有引用的完整长篇文章。

双阶段知识生成过程

在这两阶段中，STORM依靠自动问题生成机制提升信息深度和广度。具体策略包括：

视角引导问题提出：STORM通过调查相似主题的现有文章，发现不同视角指导问题提出过程。
模拟对话：通过模拟维基百科写作者和主题专家间的对话，基于互联网资源扩展模型对主题的理解，提问后续问题。

人机协作扩展：Co-STORM

Co-STORM进一步推进了人机协作，以实现更准确且符合用户期望的信息组织。此模式通过对话协议支持人与AI的高效同步交流，协作地生成内容。

Co-STORM实现了以下几项关键功能：

联合LLM专家和主持人共同提出、解答问题，收集外部知识，并帮助用户进行更深入的主题理解。
动态更新的思维导图，通过层次结构整理收集的信息，帮助用户与系统共享概念空间，降低长时间深入讨论时的认知负荷。

Co-STORM工作流程

应用场景和使用方法

安装与配置

STORM项目提供了简单易用的安装方式，用户可使用以下命令安装所需的Python包：

pip install knowledge-storm

如需对STORM引擎进行深入定制，用户可以克隆项目代码库，并安装必要的依赖：

git clone https://github.com/stanford-oval/storm.git
cd storm
conda create -n storm python=3.11
conda activate storm
pip install -r requirements.txt

API使用示例

STORM和Co-STORM提供了丰富的API接口，支持各种语言模型和检索模块。一个典型的使用例子如下：

from knowledge_storm import STORMWikiRunner, STORMWikiRunnerArguments, LitellmModel
from knowledge_storm.rm import YouRMlm_configs = STORMWikiLMConfigs()
openai_kwargs = {'api_key': '<YOUR_OPENAI_API_KEY>', 'temperature': 1.0, 'top_p': 0.9}gpt_35 = LitellmModel(model='gpt-3.5-turbo', max_tokens=500, **openai_kwargs)
gpt_4 = LitellmModel(model='gpt-4o', max_tokens=3000, **openai_kwargs)lm_configs.set_conv_simulator_lm(gpt_35)
lm_configs.set_article_gen_lm(gpt_4)engine_args = STORMWikiRunnerArguments()
rm = YouRM(ydc_api_key='<YOUR_YDC_API_KEY>', k=engine_args.search_top_k)
runner = STORMWikiRunner(engine_args, lm_configs, rm)topic = '人工智能的发展'
runner.run(topic=topic,do_research=True,do_generate_outline=True,do_generate_article=True,do_polish_article=True,
)
runner.post_run()
runner.summary()

用户可以通过设置不同的语言模型与检索方式，实现个性化的知识生成体验。根据自己的需求，用户能选择性地激活研究、生成大纲、生成文章、优化文章等不同模块。

扩展与贡献

STORM项目接纳并鼓励开发者自行扩展和调整系统模块。通过接口自定义，用户能更好地适配自己的特殊使用场景，例如文章段落格式的定制等。项目代码的模块化设计为这一方面提供了良好的基础。

解码知识整理，使您的研究更高效！

什么是STORM？

核心功能详解

双阶段知识生成过程

人机协作扩展：Co-STORM

应用场景和使用方法

扩展与贡献

同类项目推荐

相关文章：