@ManhTran.
All jobs

Khối Dịch vụ xe

Data Engineer

Hà Nội/Hồ Chí MinhSeniorFulltime

About the company

VinSmart Future (VSF) là công ty công nghệ trụ cột của Tập đoàn Vingroup, được hình thành từ việc sáp nhập toàn bộ hệ sinh thái công nghệ của tập đoàn, trong đó có VinApp, VinIT, VinBigdata, và các đơn vị công nghệ khác thuộc Tập đoàn. VinSmart Future được xác định là động lực tiềm năng phát triển mới cho Tập đoàn Vingroup. Quy tụ đội ngũ gần 4.000 chuyên gia và nhân sự công nghệ, VSF tập trung vào phát triển các mảng công nghệ với trí tuệ nhân tạo (AI) là cốt lõi, cho phép kết nối các lớp năng lực từ dữ liệu, mô hình đến hạ tầng, tạo điều kiện để phát triển các công nghệ có tính ứng dụng cao phục vụ đời sống của mọi người. VSF là nơi quy tụ những nhân tài trong lĩnh vực công nghệ thông tin, dữ liệu, AI trong nước và quốc tế

Chúng tôi đang tìm kiếm một Data Engineer để xây dựng và vận hành hệ thống dữ liệu cốt lõi cho nền tảng Mapping & Mobility, bao gồm: Search Engine (địa điểm/địa chỉ/autocomplete), Routing/Navigation, Traffic Realtime, Map Ads, Custom Map và Custom Geofences.  Data Engineer trong team chịu trách nhiệm thiết kế và vận hành các data pipeline, data warehouse/lakehouse, và serving layer dữ liệu — đảm bảo dữ liệu địa lý, hành vi người dùng và dữ liệu vận hành luôn sẵn sàng, chính xác và có thể khai thác ở quy mô lớn, phục vụ cả backend systems và analytical/reporting use cases.

Responsibilities

1) Data Platform & Pipeline cho Search & Geocoding

  • Xây dựng và vận hành pipeline ingest/transform dữ liệu địa điểm, địa chỉ, POI từ nhiều nguồn (third-party, internal, user-contributed).

  • Thiết kế luồng xử lý dữ liệu cho enrichment, deduplication, normalization địa chỉ/địa điểm trước khi đưa vào search index (OpenSearch/Elasticsearch).

  • Xây dựng quality gate: phát hiện anomaly, validate schema, kiểm soát data freshness và coverage theo thị trường/market.

  • Thiết kế CDC (Change Data Capture) và reindex pipeline để đồng bộ dữ liệu zero downtime với search platform.

2) Traffic & Routing Data Pipeline

  • Xây dựng pipeline stream processing cho traffic realtime: ingest probe data/GPS signals, aggregation theo road segment, tính toán speed profile, confidence scoring và freshness.

  • Thiết kế batch pipeline tính toán historical traffic pattern, ETA baseline và speed band cho từng segment/time-of-day.

  • Xây dựng data serving layer (time-series/KV) tối ưu cho routing engine truy vấn ở low-latency.

  • Quản lý road network data: cập nhật graph, schema versioning và delta update cho routing engine.

3) Analytics & Reporting Platform

  • Xây dựng data warehouse/lakehouse tập trung cho toàn bộ domain: search queries, routing requests, geofence events, map ads impressions/clicks.

  • Thiết kế data model (dimensional modeling / star schema) phù hợp cho BI reporting và ad-hoc analytics.

  • Xây dựng và maintain các data mart phục vụ Map Ads reporting: impression, click ,frequency, budget burn, attribution pipeline.

  • Tự động hóa data quality checks, SLA monitoring trên pipelines và alerting khi có anomaly.

4) Geospatial Data Processing

  • Xây dựng pipeline xử lý dữ liệu không gian địa lý (geospatial): tile processing, polygon simplification, geofence ingestion và indexing theo S2/H3/Geohash.

  • Tối ưu spatial join và point-in-polygon queries ở quy mô lớn: batching, partitioning theo spatial index, caching.

  • Hỗ trợ pipeline tạo và cập nhật custom map styles, layer data và feature flags theo tenant/market.

5) Feature Store & ML Data Serving

  • Xây dựng feature store phục vụ các mô hình ML trong team: ranking features cho search, ETA correction, traffic anomaly detection.

  • Thiết kế offline (batch) và online (low-latency) feature pipeline, đảm bảo consistency giữa training và serving.

  • Quản lý lineage dữ liệu, versioning features và audit trail

Requirements

  • 3–5 năm kinh nghiệm Data Engineering; ưu tiên đã làm hệ thống data ở quy mô lớn, production-grade.

  • Tốt nghiệp Đại học chính quy loại khá trở lên chuyên ngành CNTT, Điện tử Viễn thông, Toán Tin hoặc tương đương (ưu tiên các trường ĐH lớn: Bách Khoa, Công Nghệ, Bưu chính Viễn Thông, Khoa học Tự nhiên).

  • Thành thạo Python và/hoặc Scala/Java cho data engineering; hiểu rõ về distributed data processing.

  • Kinh nghiệm với distributed data processing frameworks: Apache Spark, Flink hoặc tương đương; nắm vững batch và stream processing.

  • Kinh nghiệm với Kafka/Kinesis hoặc message streaming platform; xây dựng real time ingestion pipeline.

  • Kinh nghiệm thiết kế data warehouse/lakehouse: data modeling, partitioning strategy, query optimization trên Redshift/BigQuery/Snowflake hoặc tương đương.

  • Kinh nghiệm với workflow orchestration: Apache Airflow hoặc tương đương; quản lý DAG, retry logic, alerting.

  • Kinh nghiệm với SQL nâng cao: window functions, CTEs, query plan optimization trên large datasets.

  • Tư duy data quality ownership: chủ động xây dựng validation, monitoring và alerting cho pipeline; không chờ downstream phát hiện lỗi.

Ưu tiên

  • Kinh nghiệm với dữ liệu không gian địa lý (geospatial): PostGIS, GeoPandas, S2/H3/Geohash, spatial indexing.

  • Kinh nghiệm domain mapping/mobility: road network data, GPS trace processing, map tiles, traffic data. Kinh nghiệm dbt hoặc tương đương cho data transformation, lineage và documentation.

  • Kinh nghiệm feature store (Feast, Tecton, hoặc in-house): offline/online serving, versioning. Kinh nghiệm xây dựng data lakehouse: Delta Lake, Apache Iceberg, Hudi — ACID transactions, time travel, schema evolution. Kinh nghiệm Kubernetes và cloud (EKS/GKE), container hóa data workloads, autoscaling.

  • Hiểu biết về ad-tech data: impression/click pipeline, attribution, budget reporting.

  • Kinh nghiệm với BI tools (Superset, Metabase, Looker) hoặc xây dựng reporting API Kinh nghiệm A/B testing data infrastructure và experimentation platform

Benefits

  • Mức thu nhập, các gói thưởng hấp dẫn, cạnh tranh mạnh mẽ so với thị trường.
  • Phụ cấp ăn trưa.
  • Được hưởng chế độ ưu đãi khi sử dụng các dịch vụ thuộc hệ sinh thái Tập đoàn: Ưu đãi học phí (Vinschool), khám chữa bệnh (Vinmec), nghỉ dưỡng (Vinpearl), mua xe (VinFast), thuê hoặc/và mua nhà (Vinhomes) … theo chế độ của Tập đoàn.
  • Được hưởng đầy đủ các chế độ bảo hiểm theo quy định của Luật Lao động (BHXH, BHYT, BHTN) và được Công ty mua Bảo hiểm sức khỏe cá nhân theo cấp bậc vị trí, khám sức khỏe định kỳ tại Bệnh viện và Trung tâm khám sức khỏe uy tín trên toàn quốc.
  • Cơ hội tiếp cận dự án chiến lược công nghệ trọng điểm, quy mô lớn.
  • Cơ hội làm việc trong môi trường công nghệ chuyên nghiệp, quy tụ các nhà khoa học, chuyên gia, kỹ sư đến từ các Công ty công nghệ hàng đầu Việt Nam và thế giới.
  • Cung cấp các nguồn học tập miễn phí trên các nền tảng Udemy, Coursera, O’Reilly; hội thảo nội bộ; tài trợ chứng chỉ và chương trình cố vấn đặc biệt từ Ban lãnh đạo Tập đoàn và Công ty.
  • Cơ hội tham gia các Câu lạc bộ công nghệ của Tập đoàn, các sự kiện công nghệ nội bộ để học hỏi, phát triển những dự án, ý tưởng cá nhân vào thực tế.
  • Cung cấp các chương trình đào tạo để trở thành "Giảng viên nội bộ" tham gia chia sẻ chuyên môn với những quyền lợi đặc biệt.
  • 12 ngày nghỉ phép năm, nghỉ các ngày lễ, Tết theo quy định của pháp luật.
  • Tham gia các hoạt động nội bộ, hoạt động teambuilding, sự kiện hàng năm của Công ty