職位描述
崗位職責:
1、負責設計和開發(fā)分布式的網(wǎng)絡爬蟲應用,進行互聯(lián)網(wǎng)相關信息的抓取和分析
2、負責爬蟲系統(tǒng)維護和與現(xiàn)有業(yè)務系統(tǒng)的對接
3、負責網(wǎng)頁信息抽取技術的研究和開發(fā);
4、設計爬取、調(diào)度和抽取算法,優(yōu)化系統(tǒng);
5、負責抓取數(shù)據(jù)的深度提取和挖掘。
職位要求:
1、 熟悉常見種類驗證碼的處理;
2、精通網(wǎng)頁抓取原理及技術,精通正則表達式,從結(jié)構(gòu)化的和非結(jié)構(gòu)化的數(shù)據(jù)中獲取信息;
3、熟悉linux平臺開發(fā);
4、熟悉搜索引擎和網(wǎng)絡爬蟲相關技術;
5、熟悉Scrapy/Lucene/Nutch/Heritrix/HtmlParser等開源工具;
企業(yè)介紹
深圳市新國都技術股份有限公司
優(yōu)秀的電子支付技術服務提供商。
新國都是我國金融POS主要品牌供應商之一
2009年,公司先后在廣州、南京成立了全資子公司
2010年10月,公司成功登陸深交所,掛牌上市
我們的客戶
中國銀聯(lián)體系、各大商業(yè)銀行、通聯(lián)支付等
企業(yè)愿景
電子支付技術服務商
員工關懷與發(fā)展
新國都致力于人才的培養(yǎng)與發(fā)展,注重對員工的正確引導,提供廣泛發(fā)展機會,保障員工的勞動利益,公司管理規(guī)范且人性化,員工一經(jīng)錄用,享有以下福利: