職位描述
1.負(fù)責(zé)強(qiáng)化學(xué)習(xí)算法的設(shè)計(jì)、實(shí)現(xiàn)和優(yōu)化,推動(dòng)算法從理論到實(shí)踐的落地。2.與前端人員緊密合作,參與產(chǎn)品需求分析,并為產(chǎn)品提供算法支持。3.根據(jù)不同的業(yè)務(wù)場(chǎng)景,調(diào)整和優(yōu)化現(xiàn)有的算法框架,提升算法的穩(wěn)定性、魯棒性和執(zhí)行效率。4.撰寫技術(shù)文檔,進(jìn)行算法的性能評(píng)估和實(shí)驗(yàn)驗(yàn)證。任職要求:1.教育背景: 計(jì)算機(jī)科學(xué)、人工智能、數(shù)學(xué)或相關(guān)專業(yè)碩士及以上學(xué)歷。2.工作經(jīng)驗(yàn): 至少3年以上強(qiáng)化學(xué)習(xí)相關(guān)領(lǐng)域的研究與開發(fā)經(jīng)驗(yàn)。3.熟練掌握強(qiáng)化學(xué)習(xí)的基本理論與算法(如DQN、Rainbow、DDPG、PPO、MAPPO、QMIX等),并有實(shí)際項(xiàng)目經(jīng)驗(yàn)。4.精通Python編程,熟悉TensorFlow、PyTorch等深度學(xué)習(xí)框架,能夠獨(dú)立實(shí)現(xiàn)和優(yōu)化強(qiáng)化學(xué)習(xí)算法。5.熟悉強(qiáng)化學(xué)習(xí)框架,如Ray、RLlib等,能夠基于這些框架進(jìn)行算法開發(fā)與調(diào)優(yōu)。6.熟悉多線程和并行計(jì)算,具備一定的分布式計(jì)算經(jīng)驗(yàn)者優(yōu)先。7.熟悉容器化技術(shù)(如Docker)以及容器編排平臺(tái)(如Kubernetes),具備大規(guī)模分布式系統(tǒng)部署經(jīng)驗(yàn)者優(yōu)先。8.熟悉大模型部署與微調(diào)技術(shù),了解RLHF、混合專家模型(MOE)開發(fā)經(jīng)驗(yàn)者優(yōu)先。9.具備良好的溝通能力,能夠發(fā)揮主觀能動(dòng)性,不懼迎接挑戰(zhàn),并在壓力下高效工作。
企業(yè)介紹
中國(guó)科學(xué)院自動(dòng)化研究所(以下簡(jiǎn)稱自動(dòng)化所)成立于1956年,以智能科學(xué)與技術(shù)為主要定位,是中國(guó)科學(xué)院率先布局成立的“人工智能創(chuàng)新研究院”的總體牽頭單位,是我國(guó)最早開展智能科學(xué)與技術(shù)基礎(chǔ)理論、關(guān)鍵技術(shù)和創(chuàng)新性應(yīng)用研究的科研機(jī)構(gòu),也是國(guó)內(nèi)“人工智能學(xué)院”牽頭承辦單位?! ×嗄陙?lái),自動(dòng)化所為我國(guó)國(guó)民經(jīng)濟(jì)建設(shè)、社會(huì)進(jìn)步、科技發(fā)展和國(guó)家安全做出了重要的貢獻(xiàn)。建國(guó)發(fā)展初期,自動(dòng)化所開拓了我國(guó)的控制科學(xué),為“兩彈一星”做出了歷史性的貢獻(xiàn);改革開放年代,自動(dòng)化所開創(chuàng)了我國(guó)模式識(shí)別智能信息處理的新領(lǐng)域;1990年代,自動(dòng)化所以控制科學(xué)為基礎(chǔ),率先布局了人工智能研究;2016年起,自動(dòng)化所率先布局博弈智能研究,逐步形成了數(shù)據(jù)智能、類腦智能和博弈智能的完整布局,并產(chǎn)出了一系列重要成果。 自動(dòng)化所長(zhǎng)期堅(jiān)持“智能科學(xué)與技術(shù)”研究,在復(fù)雜系統(tǒng)智能集成、模式識(shí)別、機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺、語(yǔ)音語(yǔ)言信息處理、類腦智能、智能機(jī)器人、智能系統(tǒng)和智能芯片等領(lǐng)域形成了鮮明的學(xué)科優(yōu)勢(shì)和技術(shù)特色,具有從原始創(chuàng)新、核心關(guān)鍵技術(shù)研發(fā)到技術(shù)轉(zhuǎn)移轉(zhuǎn)化的完整智能技術(shù)創(chuàng)新鏈。 當(dāng)前,緊密圍繞國(guó)家人工智能戰(zhàn)略,面向新一代人工智能的挑戰(zhàn),自動(dòng)化所確立了“自主進(jìn)化智能”的核心發(fā)展目標(biāo),“類腦智能與機(jī)器人系統(tǒng)”“多模態(tài)認(rèn)知智能系統(tǒng)”“博弈決策智能系統(tǒng)”三大主攻方向,并牽頭建設(shè)了懷柔國(guó)家綜合性科學(xué)中心的“腦認(rèn)知功能圖譜與類腦智能交叉研究平臺(tái)”、中科院香港創(chuàng)新研究院人工智能與機(jī)器人創(chuàng)新中心。 自動(dòng)化所現(xiàn)有包括多模態(tài)人工智能系統(tǒng)實(shí)驗(yàn)室、復(fù)雜系統(tǒng)認(rèn)知與決策實(shí)驗(yàn)室、國(guó)家專用集成電路設(shè)計(jì)工程技術(shù)研究中心等國(guó)家平臺(tái),數(shù)個(gè)北京市及中國(guó)科學(xué)院科研平臺(tái),與國(guó)際及港澳臺(tái)地區(qū)研究機(jī)構(gòu)共建了中歐聯(lián)合實(shí)驗(yàn)室、中國(guó)科學(xué)院香港創(chuàng)新研究院人工智能與機(jī)器人創(chuàng)新中心等五個(gè)國(guó)際合作創(chuàng)新平臺(tái)?! ∽詣?dòng)化所科研隊(duì)伍實(shí)力雄厚,截至2022年底,自動(dòng)化所共有在職職工1106人。其中研究員及正高級(jí)工程技術(shù)人員134人、副研究員及高級(jí)工程技術(shù)人員337人。共有中國(guó)科學(xué)院院士3人,發(fā)展中國(guó)家科學(xué)院院士1人,IEEE Fellow15人,國(guó)家杰出青年科學(xué)基金獲得者17人,“萬(wàn)人計(jì)劃”科技創(chuàng)新人才入選者10人,百千萬(wàn)人才工程入選者10人,科技部中青年科技人才8人,國(guó)家優(yōu)秀青年基金獲得者16人。 自動(dòng)化所歷來(lái)重視人才培養(yǎng),含本科生、碩士研究生、博士研究生在內(nèi)的在學(xué)人數(shù)已達(dá)到1402人,是1981年國(guó)務(wù)院學(xué)位委員會(huì)批準(zhǔn)的博士、碩士學(xué)位授予權(quán)單位之一。并設(shè)有控制科學(xué)與工程等1個(gè)一級(jí)學(xué)科博士后流動(dòng)站,在站博士后58人。 自動(dòng)化所是全國(guó)一級(jí)學(xué)會(huì)中國(guó)自動(dòng)化學(xué)會(huì)和中國(guó)圖象圖形學(xué)學(xué)會(huì)的掛靠單位。自動(dòng)化所主辦3種學(xué)術(shù)期刊《IEEE/CAA Journal of Automatica Sinica》(SCI期刊)、《Machine Intelligence Research》和 《自動(dòng)化學(xué)報(bào)》。 新的征程上,中國(guó)科學(xué)院自動(dòng)化研究所始終圍繞“打造新時(shí)代智能科學(xué)與技術(shù)國(guó)家戰(zhàn)略科技力量”的使命目標(biāo),面向國(guó)家戰(zhàn)略需求和布局,心無(wú)旁騖,銳意進(jìn)取,為實(shí)現(xiàn)中華民族偉大復(fù)興的中國(guó)夢(mèng)提供有力的科技支撐。