Pinecone Vector Workflow
这个方案回答的是:当你已经确定底层向量库就是 Pinecone,AI4J 里最自然的工作流应该怎么搭。
1. 适合什么场景
- 明确使用 Pinecone
- 需要 namespace 级知识隔离
- 想把入库、检索、rerank 串成一条工作流
它是标准 RAG 基线在 Pinecone 场景下的具体落地。
2. 核心模块组合
主链通常是:
PineconeVectorStoreIngestionPipelineRagService- 可选
Reranker - citations / trace
重点是:
面向统一
VectorStore/RagService抽象做业务,而不是把逻辑绑死在旧式PineconeService上。
3. 这条方案的优势
- Pinecone 作为托管向量库,上手直接
- namespace 语义适合做知识隔离
- 和统一 RAG 抽象兼容,后续仍可升级 rerank、citation
4. 和标准 RAG 的关系
它不是另一套完全不同的架构,而是:
- 标准 RAG 主线
- 在 Pinecone 这个具体后端上的更具体实践
如果你还没确定向量库,先回到:
5. 先补哪些主线页
6. 继续看实现细节
如果你要看:
- Pinecone 配置
- namespace 策略
- embedding 模型选择
- rerank 组合方式
继续看深页:
7. 关键对象
如果你准备直接看代码,优先关注:
vector/store/pinecone/PineconeVectorStore.javaVectorStoreCapabilitiesIngestionPipelineRagService
这组对象能帮助你区分“Pinecone 特有配置”和“统一 RAG 抽象”。
8. 为什么这一页单独成立
相比通用 RAG 基线,Pinecone 场景通常更早遇到:
- namespace 规划
- 托管向量库接入策略
- 外部网络与成本治理
所以这页的重点不是重复 RAG 基线,而是把“特定后端约束”说清楚。
9. 实施时优先确认什么
- namespace 如何和租户、数据域或知识库边界对应
- embedding 模型是否与已有索引保持一致
- 检索与重排是否仍通过统一抽象组合,而不是写死到后端实现里