データエンジニア at Trendx

Full Time 1年前

雇用情報

業界 Data & AI

職務レベル Experienced Professional

給与 $2,000 - $2,800 / monthly

経験 2 Year

職務タイプ Full Time

場所 China, Remote

応募締切 25 9月, 2025

職務内容

当チームに参加するスキルのあるデータクローリングスペシャリストを募集しています。理想的な候補者は、さまざまなソースからデータを収集するためのウェブクローラーの開発と保守を担当し、高品質なデータ抽出と保存を確保します。

主な責任

静的ウェブページ、動的ウェブページ（JSレンダリング）、APIインターフェースデータなど、データクローリングを担当します。
User Agentの偽装、プロキシポーリング、キャプチャバイパス、クッキー暗号化、ボディパラメータ暗号化などのアンチクローリング戦略を処理し、クローリングの成功率を向上させます。
XPath、CSSセレクター、正規表現などの技術を使用してウェブページデータを分析し、情報を抽出します。
MySQL、MongoDB、Redis、Selectdbなどのデータベースにデータを保存およびクロールします。
データクリーニングと重複排除に関連するコードを記述し、データ品質を向上させます。
クローラーの実行状況を監視し、クローリング戦略を最適化してデータクローリングの安定性を確保します。

求めるスキル

ウェブスクレイピングおよびデータクローリング技術の実績ある経験。
アンチクローリングメカニズムと戦略の処理に関する強力な知識。
XPath、CSSセレクター、正規表現などのデータ抽出技術に精通していること。
MySQL、MongoDB、Redis、Selectdbなどのさまざまなデータベースの経験。
効率的なデータクリーニングと重複排除スクリプトを記述する能力。
強力な問題解決能力と細部への注意。
クローラーのパフォーマンスを監視および最適化する経験はプラスです。

🤖

AI職務分析

ディープラーニングに基づくインテリジェントな職務推薦

分析準備完了

職務の核心要件を分析

このポジションは、データクローイングスペシャリストを求めています。主に、ウェブからデータを収集し、品質を高める技術を活用する責任が伴います。

静的・動的ウェブページやAPIからのデータクローイング
アンチクローイング対策（User Agent偽装、プロキシプール、CAPTCHA回避など）
データ抽出技術（XPath、CSSセレクタ、正規表現）
MySQL、MongoDB、Redisなどのデータベースでのデータストレージ
データクリーンアップと重複除去

雇用主の採用意図を理解

Trendxは、データ駆動型の企業として、競合他社に対抗できる高品質なデータ収集能力を求めています。このポジションは、長期的なプロジェクトで安定したデータ供給を確保するための基盤を築く役割です。採用意図は、技術力の高い人材を通じて、ビジネスのデータ分析やAI開発などの分野で強みを発揮できる環境を整えることです。また、Trendxの成長段階から、スケーラブルなソリューションと柔軟な適応力を重視しています。