我致力于研究云—边—端一体化的大模型推理优化与工程落地,聚焦模型压缩、异构并行与隐私安全。目前,任 CALAS 算法研究员,曾并在中科院香港创新研究院担任 LLM 应用工程师(智慧医疗方向),主导垂直场景微调与评测体系建设。我获得香港城市大学电子信息工程硕士(优秀毕业生),本科毕业于福州大学。当前研究覆盖跨层压缩(低秩/量化/KV 压缩)、云边协同并行切分、存储协同(SSD 直通、NUMA 优化)与 HE/TEE 等安全推理实践。