 kv-cache的记忆只能开源模型才能使用吧? 那端到端评估就只用到了明文记忆吗