工作职责
1.负责AI加速硬件的性能评估分析,在单机单卡/大规模集群等场景进行全方位的软硬件系统性能评估,分析调优和业务交付落地,2.配合算法工程师,推动深度学习相关算法的落地,打造高吞吐、低延时的推理系统:
3.参与过 ASR, TTS 语音工程化落地项目 或参与过 CV 项目,
4.大模型技术前沿追踪以及框架应用。
5.深入研究和优化大模型的训练方法,提高模型的效率和效果经验者优先
6.优化大模型推理性能,提升吞吐并控制成本经验者优先
7.优化大模型推理框架,提升框架扩展性,易用性和可调试性经验者优先。
任职资格
1.具备4年以上相关领域的工作经验,有推理大模型或大语言模型的设计、研发、部署经验者优先;
2.熟悉Linux开发环境,掌握Python/C++等语言,有良好的编程基础、系统设计优化能力;
3.熟悉各类深度学习网络和算子底层实现细节,训练和推理模型调试、调优有实操经验优先;
4.熟悉CPU/GPU异构加速瓶颈分析方法,有服务器端 AI芯片、GPU加速经验优先;
5.熟悉分布式推理常用加速方法,有超大模型分布式部署经验优先。
6.熟悉容器化、分布式系统、缓存技术、消息队列、rpc等相关技术;
7.具备良好的技术热情和责任感,优秀的分析解决问题能力,良好的团队意识和沟通能力。
年薪:70-100万
|
8年以上
|
本科及以上
工作地:重庆市
|
招2人
年薪:65-95万
|
8年以上
|
本科及以上
工作地:重庆市,上海市
|
招1人
年薪:20-50万
|
2-5年
|
本科及以上
工作地:非洲,一带一路沿线国家
|
招3人
年薪:60-120万
|
8年以上
|
本科及以上
工作地:上海市,重庆市
|
招2人
年薪:90-120万
|
8年以上
|
本科及以上
工作地:上海市,重庆市
|
招2人