当前位置: 首页 > news >正文

阿里开源千问3向量模型 超越Google与OpenAI

阿里正式开源了通义千问3全新的向量模型系列Qwen3-Embedding(简称千问3向量模型)。该模型以千问3为底座,专门为文本表征、检索和排序等核心任务进行优化训练,相较于上一个版本,在文本检索、聚类、分类等核心任务上提升最高40%以上的性能。

在MTEB等专项榜单中,Qwen3-Embedding-8B超越谷歌的Gemini Embedding 、Open AI的 text-embedding-3-large及微软的multilingual-e5-large-instruct等顶尖模型,拿下同类模型的最佳性能SOTA。

向量模型可以看做是AI的“翻译器”,它可以将文本、图片等非结构化信息,映射(embedding)到机器更易理解的向量空间,再基于这些向量实现高效的信息分类、检索或排序。

基于千问3模型,通义团队通过对比训练、SFT、模型融合等方法,打造出全新的千问3向量模型,包含文本嵌入模型Qwen3-Embedding 以及文本排序模型Qwen3-Reranker。

同时,得益于千问3的多语言能力,千问3向量模型系列率先支持超100种语言,并涵盖多种编程语言,可实现强大的多语言、跨语言及代码检索能力。

此次共有9款千问3向量模型开源,涵盖0.6B、4B 、8B等不同尺寸及GGUF版本,开发者可从中找到最符合需求的模型,自由组合模块,还可自定义向量或指令,实现特定任务、语言和场景的深度优化。

目前,千问3 Embedding和Reranker模型均已在魔搭社区、 Hugging Face和GitHub等平台上开源,开发者也可直接通过阿里云百炼使用API服务。

据了解,千问3大模型自4月29日开源以来,已揽获Artificial Analysis、LiveBench、LiveCodeBench、SuperClue多个榜单的全球开源冠军。

http://www.lqws.cn/news/194581.html

相关文章:

  • 六、【ESP32开发全栈指南:深入解析ESP32 IDF中的WiFi AP模式开发】
  • 数据结构与算法——并查集
  • DAX权威指南8:DAX引擎与存储优化
  • 【android bluetooth 协议分析 02】【bluetooth hal 层详解 8】【高通蓝牙hal-进程被杀之前日志收集流程】
  • Redis学习笔记
  • 面向开发者的提示词工程④——文本推断(Inferring)
  • AI预测3D新模型百十个定位预测+胆码预测+去和尾2025年6月6日第100弹
  • 从入门到进阶:Python 学习参考书的深度解析
  • Google机器学习实践指南(机器学习模型泛化能力)
  • 信号(瞬时)频率求解与仿真实践(1)
  • Truffle 和 Ganache 使用指南
  • 使用Python和TensorFlow实现图像分类
  • 33 C 语言字符串转数值函数详解:atoi、atol、atoll、atof
  • KuiperInfer跟学第二课——张量的构建与实现
  • awk处理xml文件封装集合变量和调用
  • C++11 Move Constructors and Move Assignment Operators 从入门到精通
  • 【JJ斗地主-注册安全分析报告】
  • Pycharm中添加不了新建的Conda环境(此篇专门给Daidai写的)
  • 2025年全国青少年信息素养大赛 scratch图形化编程挑战赛 小高组初赛 真题详细解析
  • Ubuntu系统下交叉编译cJSON
  • 使用python把json数据追加进文件,然后每次读取时,读取第一行并删除
  • MySQL的优化部分介绍
  • MySQL体系架构解析(三):MySQL数据存储的揭秘
  • 第四讲:类和对象(下)
  • mamba架构和transformer区别
  • 导出pcap文件中的特定数据包
  • STM32外设问题总结
  • 六级作文--句型
  • Abaqus模拟弯曲问题之剪力自锁与沙漏化现象
  • 学习日记-day23-6.6