CV

Education

B.S. in Computer Science and Communication Engineering, Zhejiang University, 2017-2021

Work experience

2024 - Present: Researcher
- Shanghai AI Lab
- Research focus: Large Language Model Post-training, Reinforcement Learning, Multi-agent Systems, and Multimodal AI
2021 - 2024: Research Engineer
- Huawei Technologies Co., Ltd.
- Research focus: Intersection of Communication and Artificial Intelligence

Skills

Large Language Models (Post-training, Fine-tuning)
Reinforcement Learning
Multi-agent Systems
Multimodal AI (Vision-Language Models)
Deep Learning
Python, PyTorch
Research Tools Development (MCP servers)

Publications

Reflector: Internalizing Step-wise Reflection against Indirect Jailbreaks

Ma, J., Zhang, J., Li, X., Zou, B., Lu, C., & Yang, C. (2026). "REFLECTOR: Internalizing Step-wise Reflection against Indirect Jailbreak." ICML 2026.

TrinityGuard: A Unified Framework for Safeguarding Multi-Agent Systems

Native Reasoning Models: Training Language Models to Reason on Unverifiable Data

Wang, Y., Liu, Z., Li, X., Lu, C., & Yang, C. (2026). "Native Reasoning Models: Training Language Models to Reason on Unverifiable Data." ICLR 2026 Poster.