1、负责大模型全链路研发(SFT/RL),提升逻辑推理、任务规划等核心认知能力;
2、探索System2等新型架构在复杂推理任务中的应用,通过”慢思考”机制提升模型性能;
3、提升模型工具调用、API 交互能力,使其具备构建Agent、Multi-agent解决复杂问题的能力;
4、推进数据建设、研究数据合成及 Scalable oversight,突破数据瓶颈,降低对人类标注依赖,为模型训练提供更优质数据支持;
5、探索大模型在金融业务场景下的解决方案,擅长发现优化大模型的简单、普适的想法,并应用到各个规模模型及业务场景中提升效果,拓展模型的应用范围;
6、持续跟进 LLM 前沿技术进展,对大模型算法做深入研究。