Agent Session Runtime

AgentSession 是 ai4j-agent 的长程运行态入口。它不是另一个模型客户端，也不是 CLI 会话的替代品，而是把一次 Agent 任务的状态收拢到一个可保存、可恢复、可观测的容器里。

1. 它解决什么问题

普通 agent.run(...) 适合一次性调用：宿主把请求交给 runtime，拿到 AgentResult 后结束。

agent.newSession() 适合长程任务：

每个 session 有稳定 sessionId。
每个 session 有独立 memory。
runtime 事件会进入 session event log。
session 可以生成 snapshot。
配置了 AgentSessionStore 后可以保存和恢复。
旧的 Agent.run(...) 语义保持不变。

这让上层产品可以把 Agent 当作一个可持续运行的任务容器，而不是一串散落的模型请求。

2. 当前最小能力

P0-A 先落地基础容器，不一次性塞入 sandbox、artifact、fork、rewind 等远期能力。

当前最小结构是：

Agent
  ├─ run(...)                 // 兼容的一次性运行入口
  └─ newSession()
       └─ AgentSession
            ├─ sessionId / metadata
            ├─ independent AgentMemory
            ├─ AgentSessionEventLog
            ├─ snapshot / restore
            └─ optional AgentSessionStore

类	职责
`AgentSession`	面向使用者的 session 运行入口
`AgentSessionMetadata`	`sessionId`、创建/更新时间和业务 attributes
`AgentSessionEventLog`	session 内 runtime 事件日志接口
`InMemoryAgentSessionEventLog`	默认内存事件日志实现
`AgentSessionSnapshot`	metadata、memory、events 的可携带快照
`AgentSessionStore`	保存、读取、删除和列出 session snapshot
`InMemoryAgentSessionStore`	进程内 store，适合测试和轻量 demo

3. 最小用法

Agent agent = Agents.react()
    .modelClient(modelClient)
    .model("gpt-4.1")
    .memorySupplier(InMemoryAgentMemory::new)
    .build();

AgentSession session = agent.newSession();
session.putMetadata("project", "demo");

AgentResult result = session.run("先分析这个问题");

System.out.println(session.getSessionId());
System.out.println(result.getOutputText());
System.out.println(session.getEventLog().getEvents().size());

重点是 memorySupplier(...)：每次 newSession() 都应该拿到独立 memory。否则多个 session 可能共享同一个 memory 实例。

4. 保存和恢复

如果需要让 session 跨请求或跨进程边界恢复，给 Agent 配置 AgentSessionStore。

InMemoryAgentSessionStore store = new InMemoryAgentSessionStore();

Agent agent = Agents.react()
    .modelClient(modelClient)
    .model("gpt-4.1")
    .memorySupplier(InMemoryAgentMemory::new)
    .sessionStore(store)
    .build();

AgentSession session = agent.newSession();
session.run("记住这次任务上下文");
session.save();

AgentSession resumed = agent.resumeSession(session.getSessionId());

InMemoryAgentSessionStore 只适合本地测试和 demo。生产环境应实现自己的 AgentSessionStore，例如 JDBC、Redis、对象存储或业务自有 session 表。

5. Snapshot 包含什么

session.snapshot() 会生成：

字段	内容
metadata	session id、created/updated 时间、attributes
memory	`MemorySnapshot`，由当前 `AgentMemory` 提供
events	`AgentSessionEvent` 列表

snapshot 会做防御性复制。读取 snapshot 后修改返回对象，不应该反向污染当前 session。

6. Event Log 和 Trace 的关系

AgentSessionEventLog 记录的是 session 内发生过的 runtime events，例如：

STEP_START
MODEL_REQUEST
MODEL_RESPONSE
TOOL_CALL
TOOL_RESULT
FINAL_OUTPUT
STEP_END
ERROR

它和 trace 不是同一个东西：

能力	主要用途
Event Log	恢复、调试、产品 UI 时间线、session 事实历史
Trace	可观测性、外部 tracing/exporter、性能和调用链分析

session 创建时会从基础 AgentEventPublisher 复制已有 listener，并额外挂载 event log listener。因此已有 trace listener 不会因为使用 session 而失效。

7. 与 Memory / Compact 的边界

P0-A 先提供 session 容器边界；P0-B 已补上基础 compact/context projection 能力。

推荐心智是：

SessionEventLog = 完整事件历史
AgentMemory     = 可投喂模型的状态和历史
Compact         = 把 event / memory / artifact 投影成更短的工作上下文

P0-B 已补上：

CompactPolicy
CompactResult
ContextProjector
ContextBudget
ContextReport
AgentSession.compact(...)
AgentSessionSnapshot.compactResult

使用细节见 Memory Compact Context Projector。

8. 与 Coding Agent / CLI 的关系

AgentSession 是通用 SDK 层能力。

ai4j-coding 和 ai4j-cli 后续可以在它之上继续绑定：

workspace
file/shell/git/browser tool state
approvals
checkpoint
compact
sandbox
TUI session timeline

但这些不应该反向污染 ai4j-agent 的通用运行时。SDK 层只保留通用会话、事件、memory、snapshot 和 store 合同。

9. 生产实现建议

生产侧实现 AgentSessionStore 时建议注意：

session id 必须按租户或项目隔离。
snapshot 中不要保存明文 provider token。
event payload 可能包含 prompt、工具参数和模型输出，必要时应脱敏。
store 写入应该由业务决定同步或异步，不要让每个事件都强制阻塞主 loop。
如果 memory 或 event 很大，应结合 compact / retention policy。

10. 下一步

P0-A 只是运行态容器基础。完整 Agent SDK 还会继续推进：

Plugin lifecycle hooks
YAML Agent Blueprint
Sandbox SPI
Coding Agent sandbox routing
CLI /sandbox 体验
远端 Agent Runner

完整路线见 AI4J Agent SDK Roadmap。

1. 它解决什么问题​

2. 当前最小能力​

3. 最小用法​

4. 保存和恢复​

5. Snapshot 包含什么​

6. Event Log 和 Trace 的关系​

7. 与 Memory / Compact 的边界​

8. 与 Coding Agent / CLI 的关系​

9. 生产实现建议​

10. 下一步​