北京
若干
全职
职位类别:
工作内容: ◾ 参与收集、处理、清洗各种渠道的原始文本数据,包括但不限于网页数据、电子书数据等 ◾ 与大模型算法团队、数据采集团队、分布式训练工程团队密切合作,建立数据系统迭代流程 ◾ 建立针对大模型的数据质量评估方法,持续提高数据质量和多样性,安全性,有用性 我们希望你是: ◾ 有搜索、推荐、广告等业务数据的处理经验 ◾ 有⼤规模中文网页数据收集和清洗经验者优先 ◾ 有文本数据集搭建和数据质量管理经验者优先 ◾ 工作地:北京,全职 我们的优势: ◾ 顶尖 GPU 集群算力支持,快速迭代实验建立数据 scaling-law ◾ 深度参与到千亿至万亿大型语言模型训练的数据系统迭代流程 公司简介: 我们相信,AGI 是 数据x算法x算力的完美实践, 科研+工程+组织的优雅艺术。 我们正在寻找并长期培养优秀的数据研发人才,与我们一起进行高水平的科学研究和工程实践。如果你对人工智能有浓厚的兴趣,如果你想在一个充满挑战和机遇的初创环境中展现你的才华,如果你想参与构建下一代通用人工智能(AGI),那么请不要犹豫,加入 DeepSeek,与我们共同在 AGI 征程上“深度求索”吧!
浙江省杭州市拱墅区浙江省杭州市拱墅区环城北路169号汇金国际大厦查看大图
杭州深度求索人工智能基础技术研究有限公司
行业: 互联网/电子商务 规模: 100-200 性质: 私营·民营企业 当前职位: 数据研发工程师(AGI 北京)
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司。DeepSeek是一家创新型科技公司,成立于2023年7月17日,使用数据蒸馏技术,得到更为精炼、有用的数据 。 由知名私募巨头幻方量化孕育而生,专注于开发先进的大语言模型(LLM)和相关技术。经营范围包括技术服务、技术开发、软件开发等。 投递网站:https://app.mokahr.com/social-recruitment/high-flyer/140576#/