当前位置: 首页 > news >正文

解码知识整理,使您的研究更高效!

在当今知识爆炸的数字世界中,信息的获取与整理越来越受到关注。为了应对这一挑战,斯坦福大学的研究团队开发了一个名为STORM(Synthesis of Topic Outlines through Retrieval and Multi-perspective Question Asking)的开源系统。此系统基于大语言模型(LLM),通过检索和多视角问题提出实现对主题的知识梳理,自动生成带有引注的完整报告,为用户提供高效的知识探索和创建体验。

什么是STORM?

STORM是一个创新的LLM驱动系统,能够从零开始构建类似Wikipedia的文章。它通过互联网搜索和引用整理,生成完整的带有引注的长篇文章。STORM系统特别适合那些希望轻松探索新领域,获取相关信息并将其组织成知识体系的用户。尽管尚无法生产出无需编辑的发布级文章,但STORM在前期创作阶段为经验丰富的维基百科编辑者提供了极大帮助。迄今为止,已有超过七万人参与该系统的实时研究预览,反馈积极。

核心功能详解

双阶段知识生成过程

STORM的知识生成过程分为两个主要阶段:

  1. 预写阶段:系统进行互联网研究,收集参考资料并生成大纲。
  2. 写作阶段:利用生成的大纲和参考资料,撰写出带有引用的完整长篇文章。

双阶段知识生成过程

在这两阶段中,STORM依靠自动问题生成机制提升信息深度和广度。具体策略包括:

  • 视角引导问题提出:STORM通过调查相似主题的现有文章,发现不同视角指导问题提出过程。
  • 模拟对话:通过模拟维基百科写作者和主题专家间的对话,基于互联网资源扩展模型对主题的理解,提问后续问题。
人机协作扩展:Co-STORM

Co-STORM进一步推进了人机协作,以实现更准确且符合用户期望的信息组织。此模式通过对话协议支持人与AI的高效同步交流,协作地生成内容。

Co-STORM实现了以下几项关键功能:

  • 联合LLM专家和主持人共同提出、解答问题,收集外部知识,并帮助用户进行更深入的主题理解。
  • 动态更新的思维导图,通过层次结构整理收集的信息,帮助用户与系统共享概念空间,降低长时间深入讨论时的认知负荷。

Co-STORM工作流程

应用场景和使用方法

安装与配置

STORM项目提供了简单易用的安装方式,用户可使用以下命令安装所需的Python包:

pip install knowledge-storm

如需对STORM引擎进行深入定制,用户可以克隆项目代码库,并安装必要的依赖:

git clone https://github.com/stanford-oval/storm.git
cd storm
conda create -n storm python=3.11
conda activate storm
pip install -r requirements.txt

API使用示例

STORM和Co-STORM提供了丰富的API接口,支持各种语言模型和检索模块。一个典型的使用例子如下:

from knowledge_storm import STORMWikiRunner, STORMWikiRunnerArguments, LitellmModel
from knowledge_storm.rm import YouRMlm_configs = STORMWikiLMConfigs()
openai_kwargs = {'api_key': '<YOUR_OPENAI_API_KEY>', 'temperature': 1.0, 'top_p': 0.9}gpt_35 = LitellmModel(model='gpt-3.5-turbo', max_tokens=500, **openai_kwargs)
gpt_4 = LitellmModel(model='gpt-4o', max_tokens=3000, **openai_kwargs)lm_configs.set_conv_simulator_lm(gpt_35)
lm_configs.set_article_gen_lm(gpt_4)engine_args = STORMWikiRunnerArguments()
rm = YouRM(ydc_api_key='<YOUR_YDC_API_KEY>', k=engine_args.search_top_k)
runner = STORMWikiRunner(engine_args, lm_configs, rm)topic = '人工智能的发展'
runner.run(topic=topic,do_research=True,do_generate_outline=True,do_generate_article=True,do_polish_article=True,
)
runner.post_run()
runner.summary()

用户可以通过设置不同的语言模型与检索方式,实现个性化的知识生成体验。根据自己的需求,用户能选择性地激活研究、生成大纲、生成文章、优化文章等不同模块。

扩展与贡献

STORM项目接纳并鼓励开发者自行扩展和调整系统模块。通过接口自定义,用户能更好地适配自己的特殊使用场景,例如文章段落格式的定制等。项目代码的模块化设计为这一方面提供了良好的基础。

同类项目推荐

在机器辅助内容创作领域,Plagiarism Checker、大数据分析工具Tableau、以及类似ChatGPT的交互式生成模型,也提供了不同的自动化撰稿辅助功能。相比之下,STORM和Co-STORM通过人机协作,多视角问题设计等特点,在复杂主题的深度信息获取与知识整理上具有显著优势。

通过STORM和Co-STORM的支撑,用户不仅能够快速获取互联网广泛信息,并能够高效地整理成有逻辑、有深度的文章,使得从信息获取到知识创造成为可能。如果您对信息自动化整理或机器辅助撰稿感兴趣,STORM无疑值得一试。

http://www.lqws.cn/news/601975.html

相关文章:

  • 分区表设计:历史数据归档与查询加速
  • [论文阅读] 人工智能 + 软件工程 | 从软件工程视角看大语言模型:挑战与未来之路
  • python训练day46 通道注意力
  • 2025-0701学习记录19——“问题-方法-洞见”框架做汇报
  • 半导体和PN结
  • socket编程
  • Android11 添加自定义物理按键事件监听回调
  • Vite 7.0 与 Vue 3.5:前端开发的性能革命与功能升级
  • 【Linux】进程
  • NLP——RNN变体LSTM和GRU
  • Android布局管理器实战指南:从LinearLayout到ConstraintLayout的优化之旅
  • Redis——常用指令汇总指南(一)
  • 【Python】断言(assert)
  • 监听器模式
  • [Python] -基础篇8-Python中的注释与代码风格PEP8指南
  • 【C++】inline的作用
  • InnoDB数据页
  • 61、【OS】【Nuttx】【构建】向量表
  • OpenCv基础(C++)
  • 6.Docker部署ES+kibana
  • 无人机目标检测数据集介绍-14,751张图片 无人机检测 航拍图像
  • 路科V0—基础(2)设计特性与接口
  • 【第二章:机器学习与神经网络概述】04.回归算法理论与实践 -(3)决策树回归模型(Decision Tree Regression)
  • 融智学定律3:流动创造价值仅当跨域协同
  • Arduino LED立方体3D公告板制作指南
  • uniapp+vue3 中使用echart 以及echart文件过大需要分包的记录
  • imx6ull芯片中断机制6.24-6.25
  • Redis为什么是单线程
  • UE5.6 官方文档笔记 [1]——虚幻编辑器界面
  • 6.2 实现文档加载和切分和简易向量数据库的功能