大型语言模型微调工程师


工作职责:

  • 负责对大型语言模型进行微调,以提高其在特定任务上的性能。
  • 设计和实现微调算法,调整超参数,优化模型性能。
  • 对微调过程中的数据进行预处理和分析,确保数据集的质量和适用性。
  • 评估和分析微调结果,调整模型以提高其性能。
  • 与其他团队成员合作,确保微调过程的顺利进行和结果的高质量。
  • 深入了解最新的大型语言模型技术和应用,不断提高微调技能和知识水平。

任职要求:

  • 计算机、人工智能、数学等相关专业本科及以上学历(硕士优先),具备机器学习、深度学习和自然语言处理等领域的相关背景知识。
  • NLP相关领域及岗位3年以上工作经验,或有相关实习经验的应届硕士毕业生。
  • 熟悉主流大语言模型,有调优经验者优先。
  • 熟悉深度学习框架(如TensorFlow、PyTorch等)以及常用的模型评估和调优技术,熟悉常用的AI生成模型框架,包括GAN、VAE、VQGAN/Diffusion等。
  • 熟练掌握数据处理和分析技能,能够处理和分析大规模的文本数据集。
  • 具备团队合作和沟通能力,能够与其他团队成员紧密合作,共同完成微调任务。
  • 具备快速学习和解决问题的能力,能够不断学习最新的技术和解决实际问题。

地点: 上海、新加坡、或美国

如果您对这些职位空缺感兴趣,请在shandahr@shanda.com联系我们,我们也欢迎招聘机构的帮助。