職位描述
工作內(nèi)容:1、基于transformer的視頻任務(wù)推進(jìn)(可能如****Recognition、Temporal****Detection、VideoCaptioning、video-LLM、LongVideoUnderstanding等)2、視頻foundation預(yù)訓(xùn)練模型調(diào)研和推進(jìn)任職要求:1、熟悉CNN基礎(chǔ)模型,transformer基礎(chǔ)模型(如resnet、vit、clip等)2、了解視頻相關(guān)的基礎(chǔ)任務(wù)、基礎(chǔ)開源數(shù)據(jù)等3、碩士研究生以上學(xué)歷,計(jì)算數(shù)學(xué)、模式識別、圖像處理、多媒體技術(shù)等專業(yè)方向4、熟練掌握pytorch深度學(xué)習(xí)平臺5、熟悉圖像處理、模式識別算法,熟悉了解OpenCV、decord、CvCuda等圖像處理平臺6、熟悉Linux平臺下腳本程序Shell、Python等,并能解決實(shí)際問題,可以針對數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)注靈活定制開發(fā)相關(guān)工具7、積極主動(dòng)、性格開朗,樂于接受挑戰(zhàn),具有主動(dòng)學(xué)習(xí)能力。
企業(yè)介紹
格靈深瞳是一家行業(yè)領(lǐng)先的人工智能公司,專注于將先進(jìn)的計(jì)算機(jī)視覺技術(shù)、大數(shù)據(jù)分析技術(shù)、機(jī)器人和人機(jī)交互技術(shù)與應(yīng)用場景深度融合,提供面向智慧金融、城市管理、商業(yè)零售、軌交運(yùn)維、體育健康、元宇宙等領(lǐng)域的人工智能產(chǎn)品及解決方案。公司成立于 2013 年,2022年3月在上海證券交易所科創(chuàng)板掛牌上市,成為A股第一家AI計(jì)算機(jī)視覺上市公司。