Chris Thi

2025 — NowMetaStaff Software Engineer, Kernels & Numerics

2025 — Now

GPU Kernel development with CUDA, CUTLASS, CK, Triton

FP8, FP4 quantization & GEMM kernel development

Performance optimization

Open source development

2024 — 2025MetaStaff Software Engineer, LLM Inference

2024 — 2025

New York, New York, United States

Distributed & Disaggregated LLM Inference

vLLM Performance Optimization

Production debugging and fleet management

2024 — 2024MetaStaff Production Engineer, LLM Inference

2024 — 2024

New York, New York, United States

2022 — 2024MetaSenior Production Engineer, Inference Platform

2022 — 2024

New York, New York, United States

2022 — 2022MetaSenior Production Engineer, Messaging Infrastructure

2022 — 2022

New York, New York, United States