DefTruth

Follow

🎯

#pragma unroll

DefTruth DefTruth

🎯

#pragma unroll

Follow

AI Infra Engineer @vipshop, Owner @xlite-dev, Prev @PaddlePaddle🤖

2k followers · 181 following

@xlite-dev, @vipshop
Guangzhou, China
04:08 (UTC +08:00)
https://github.com/xlite-dev

Achievements

Achievements

Organizations

DefTruth/README.md

Pinned Loading

xlite-dev/LeetCUDA xlite-dev/LeetCUDA Public

📚LeetCUDA: Modern CUDA Learn Notes with PyTorch for Beginners🐑, 200+ CUDA Kernels, Tensor Cores, HGEMM, FA-2 MMA.🎉

Cuda 9.6k 953
xlite-dev/lite.ai.toolkit xlite-dev/lite.ai.toolkit Public

🛠A lite C++ AI toolkit: 100+ models with MNN, ORT and TRT, including Det, Seg, Stable-Diffusion, Face-Fusion, etc.🎉

C++ 4.4k 773
xlite-dev/Awesome-LLM-Inference xlite-dev/Awesome-LLM-Inference Public

📚A curated list of Awesome LLM/VLM Inference Papers with Codes: Flash-Attention, Paged-Attention, WINT8/4, Parallelism, etc.🎉

Python 5k 339
PaddlePaddle/FastDeploy PaddlePaddle/FastDeploy Public

High-performance Inference and Deployment Toolkit for LLMs and VLMs based on PaddlePaddle

Python 3.6k 698
vipshop/cache-dit vipshop/cache-dit Public

🤗 A PyTorch-native and Flexible Inference Engine with Hybrid Cache Acceleration and Parallelism for DiTs.

Python 1k 62
xlite-dev/ffpa-attn xlite-dev/ffpa-attn Public

🤖FFPA: Extend FlashAttention-2 with Split-D, ~O(1) SRAM complexity for large headdim, 1.8x~3x↑🎉 vs SDPA EA.

Cuda 249 13