— Tag

#ai

1 bài viết

Prompt caching: kiến trúc 4 tầng cho ứng dụng AI

Tiết kiệm 93% token không phải bằng cách viết ít, mà bằng cách viết đúng tầng. Phân tích cách tổ chức prompt cho hệ thống multi-tenant.