— Tag
#ai
1 bài viết
Prompt caching: kiến trúc 4 tầng cho ứng dụng AI
Tiết kiệm 93% token không phải bằng cách viết ít, mà bằng cách viết đúng tầng. Phân tích cách tổ chức prompt cho hệ thống multi-tenant.
1 bài viết
Tiết kiệm 93% token không phải bằng cách viết ít, mà bằng cách viết đúng tầng. Phân tích cách tổ chức prompt cho hệ thống multi-tenant.