洪锦法

云-边融合的AI推理优化

让大模型在云--边--端实现高吞吐、低时延与强安全的统一优化与价值转化
异构计算与边缘AI算法 香港 18959707260 Jeffrey_Hong@163.com

Biography

我致力于研究云—边—端一体化的大模型推理优化与工程落地,聚焦模型压缩、异构并行与隐私安全。目前,任 CALAS 算法研究员,曾并在中科院香港创新研究院担任 LLM 应用工程师(智慧医疗方向),主导垂直场景微调与评测体系建设。我获得香港城市大学电子信息工程硕士(优秀毕业生),本科毕业于福州大学。当前研究覆盖跨层压缩(低秩/量化/KV 压缩)、云边协同并行切分、存储协同(SSD 直通、NUMA 优化)与 HE/TEE 等安全推理实践。

相关背景

  • 方向:LLM垂直化微调模型压缩与异构计算云-边协同推理隐私计算
  • 经历:CALAS 算法研究员;中科院香港创新研究院 LLM 应用工程师(智慧医疗);徐工集团研究院物联网算法工程师(工程机械部)
  • 教育:香港城市大学 电子信息工程 硕士(优秀毕业生);福州大学 本科
  • 成果:2025 IEIG 世界专利赛银奖;第一作者 EI 1 篇、SCI 3 篇(在投);US 专利 1 项(在投);
垂直LLM实证
+30% 准确率
手术知识QA;有害幻觉 -80%
边缘加速收益
5--10× 计算降幅
内存占用 -70%+
系统适配
硬件验收经验
鲲鹏 vs A100 标准化评测

代表工作与可迁移价值

  • 垂直领域LLM微调(手术场景):LoRA/PEFT + Partial Freezing;百万级 Token 语料与评测基准;QA +30%,幻觉 -80%
  • 工业边缘AI加速与安全:张量分解×量化×KV 压缩;同态加密推理预研;算力成本大幅下降
  • 硬件与系统:鲲鹏/A100 对齐测评与报告,标准化验收与工具链

未来研究方向:AI on Edge vs Cloud

研究兴趣与问题域

感兴趣的工作