新京報貝殼財經(jīng)訊(記者羅亦丹)6月6日,阿里開源通義千問3全新的向量模型系列Qwen3-Embedding(簡稱千問3向量模型)。該模型以千問3為底座,專門為文本表征、檢索和排序等核心任務(wù)進行優(yōu)化訓(xùn)練,性能較上一版本可提升40%,在MTEB等權(quán)威專項榜單中超越了谷歌、OpenAI、微軟等公司的模型。
MTEB等榜單排名情況。
向量模型像是AI的“翻譯器”,它可以將文本、圖片等人類可認知的非結(jié)構(gòu)化信息映射(embedding)到機器更易理解的向量空間,再基于這些向量實現(xiàn)高效的信息分類、檢索或排序。也正因此,向量模型對于提升AI的語義理解、信息檢索、多模態(tài)融合等核心能力至關(guān)重要?;谇?模型,通義團隊通過對比訓(xùn)練、SFT、模型融合等方法,打造出全新的千問3向量模型,包含文本嵌入模型Qwen3-Embedding以及文本排序模型Qwen3-Reranker。
為方便開發(fā)者,此次有9款千問3向量模型開源,涵蓋0.6B、4B、8B等不同尺寸及GGUF版本。目前,千問3Embedding和 Reranker模型均已在魔搭社區(qū)、Hugging Face和GitHub等平臺上開源,開發(fā)者也可直接通過阿里云百煉使用API服務(wù)。
編輯 楊娟娟
校對 楊利