跳到主要内容

📚 RAG 知识库构建

RAG 系统架构、向量数据库、Embedding 选型与评估优化

📄️Embedding 模型选型与微调

上周我负责的 RAG 系统上线了一个新的法律文档问答功能。用户问"合同违约金上限是多少",系统检索回来的文档却是关于"劳动法试用期规定"的——语义完全不相关。排查下来发现,不是检索逻辑有问题,而是我们用的 Embedding 模型对中文法律术语的语义理解不够好。这次事故让我意识到:Embedding 模型选型是 RAG 系统中最容易被忽视、但影响最大的环节。