技
— Chuyên mục
Công nghệ
Code, kiến trúc, AI, và những thứ giữa các tầng abstraction.
1 bài viết
Prompt caching: kiến trúc 4 tầng cho ứng dụng AI
Tiết kiệm 93% token không phải bằng cách viết ít, mà bằng cách viết đúng tầng. Phân tích cách tổ chức prompt cho hệ thống multi-tenant.