崗位職責
1. 負責大型語言模型(LLM)和多模態(tài)大模型(MLLM)的研究與開發(fā),包括模型預訓練、理論創(chuàng)新、性能評估與優(yōu)化;
2. 大模型訓練數(shù)據(jù)構(gòu)建, 訓練策略迭代和調(diào)優(yōu),推動大模型涌現(xiàn)能力的實現(xiàn)與提升;
3. 參與大模型的對齊技術(shù)研究與優(yōu)化,聚焦于解決模型在復雜指令遵循、推理、幻覺、工具使用等問題中的表現(xiàn)瓶頸,提升模型的實用性與可靠性;
4. 負責大型語言模型的微調(diào)、偏好對齊、知識增強等技術(shù)探索,積極跟進AIGC業(yè)內(nèi)應用趨勢,包括并不限于MoE、RLHF、Long context、RAG、Agent等方向;
5. 優(yōu)化算法性能,提升系統(tǒng)在復雜場景下的魯棒性與高效性;
6. 跟進前沿技術(shù)(如多模態(tài)大模型、推理模型、CoT、diffusion和flow matching等),推動技術(shù)落地;
7. 與軟硬件團隊協(xié)作,完成算法模塊的工程化部署與測試。
任職要求 :
1. 計算機科學、人工智能、機器人學、數(shù)學等相關專業(yè)碩士及以上學歷;
2.具有扎實的編程功底和 DL/ML 基礎,熟悉LLM,MLLM大模型等訓練和推理;
3. 精通至少一種主流深度學習框(PyTorch/TensorFlow),熟練使用C++/Python編程;
4. 具有自然語言處理、計算機視覺、 模型壓縮和推理優(yōu)化等領域的實際項目經(jīng)驗;
5. 較強的論文復現(xiàn)能力或算法創(chuàng)新能力,能快速實現(xiàn)并優(yōu)化前沿技術(shù)方案;
6. 良好的團隊協(xié)作與溝通能力,對技術(shù)落地有強烈熱情。