岗位职责:
1、负责密切跟踪大语言模型的业界前沿技术,对技术能够快速有效的复现以及优化
2、负责大语言模型的训练优化,效果评估体系设计,提高模型的生产质量、生产效能,持续优化模型推理架构和效率
3、负责优化大语言模型适配实际业务场景,推动技术落地
任职资格:
1、5年以上NLP经验,硕士及以上学历,计算机/人工智能/数学等相关专业优先
2、扎实的深度学习理论知识,对CNN/LSTM/Transformer网络结构有深入理解和应用
3、丰富的编程经验,熟悉Python/C++等编程语言,了解模型推理加速方法,具备DeepSpeed、Megatron等训练加速框架的使用经验
4、扎实的自然语言处理理论和方法,有智能对话、机器翻译之类等项目经历,对GPT等大语言模型的训练方式有深入的理解
5、高度的责任感,良好的合作能力,优秀的技术影响力,跨团队协同的沟通能力