#Optimization
3 bài viết
LVSA: Giải quyết bài toán video dài mà không cần retrain model
Sparse attention không cần training, giảm compute đến 3.33x, và còn fix được cái bug video bị lặp vòng mà VBench-Long không detect ra.
Nguyễn Nhật Long
6 phút
κ-SwiGLU: Khi MoE Router Tự Biết Mình Đang Confident Đến Đâu
κ-SwiGLU dùng chính router logits của MoE để điều chỉnh độ sắc nét của expert gate thêm cực ít params nhưng pretraining performance cải thiện rõ rệt.
Nguyễn Nhật Long
6 phút
React Performance: Đừng đoán mò, hãy đo rồi mới optimize
Profiling thực tế, React Compiler, code splitting, virtualization tất cả những gì bạn cần để tối ưu React app mà không cần đoán mò.
Nguyễn Nhật Long
7 phút