@ManhTran.
All jobs

Khối Dịch vụ xe

Data Scientist

Hà Nội/Hồ Chí MinhSeniorFulltimeDeadline: June 30, 2026

About the company

VinSmart Future (VSF) là công ty công nghệ trụ cột của Tập đoàn Vingroup, được hình thành từ việc sáp nhập toàn bộ hệ sinh thái công nghệ của tập đoàn, trong đó có VinApp, VinIT, VinBigdata, và các đơn vị công nghệ khác thuộc Tập đoàn. VinSmart Future được xác định là động lực tiềm năng phát triển mới cho Tập đoàn Vingroup. Quy tụ đội ngũ gần 4.000 chuyên gia và nhân sự công nghệ, VSF tập trung vào phát triển các mảng công nghệ với trí tuệ nhân tạo (AI) là cốt lõi, cho phép kết nối các lớp năng lực từ dữ liệu, mô hình đến hạ tầng, tạo điều kiện để phát triển các công nghệ có tính ứng dụng cao phục vụ đời sống của mọi người. VSF là nơi quy tụ những nhân tài trong lĩnh vực công nghệ thông tin, dữ liệu, AI trong nước và quốc tế

Tham gia trực tiếp xây dựng và cải tiến các mô hình và hệ thống đo lường cho nền tảng Mapping  & Mobility Intelligence, bao gồm: ETA prediction, traffic forecasting, dynamic routing,  OCR/data understanding và automated data QA tooling. Data Scientist trong team này tập trung vào thực thi và deliver: xây dựng features, train/evaluate  models, phân tích kết quả và phối hợp chặt chẽ với Data Engineering và Backend để đưa models  vào production - dưới sự dẫn dắt kỹ thuật của Lead DS

Responsibilities

A. ETA & Trip Intelligence

  • Tham gia phát triển và cải tiến ETA models theo các context (pickup, en-route, multi-stop): feature engineering, model training, offline evaluation và phân tích lỗi.

  • Thực hiện feature engineering từ map và trip signals: road class, intersection density, turn types, speed profile theo time-of-day, congestion signals, driver behavior patterns.

  • Xây dựng và duy trì offline evaluation pipeline: tracking metrics (MAE, p90/p95 error, calibration), so sánh model versions và phát hiện regression.

  • Hỗ trợ chuẩn hóa dữ liệu GPS và trajectory: denoising, outlier detection, sampling normalization — cung cấp inputs sạch cho ETA, traffic và routing models.

B. Traffic Forecasting & Map Signals

  • Xây dựng và cải tiến các spatiotemporal traffic models ở cấp độ road segment: speed/flow estimation, incident impact, time-of-day và day-of week seasonality.

  • Tạo map intelligence signals: phát hiện road closure, abnormal slowdown, tính toán freshness và coverage quality metrics.

  • Phân tích và validate dữ liệu traffic: kiểm tra consistency, phát hiện noise source và đề xuất cải tiến data pipeline cùng Data Engineering.

C. Dynamic Routing & Decisioning

  • Hỗ trợ phát triển dynamic routing logic (reroute khi có congestion/incident): implement và thử nghiệm heuristics/model-based approaches. Xây dựng và maintain evaluation metrics cho routing: reroute rate, route deviation, on-time pickup/dropoff, stability và consistency.

  • Phân tích kết quả A/B tests cho routing experiments và tổng hợp insights cho Lead DS và Product D. OCR & Data Understanding

  • Tham gia xây dựng OCR và document/image understanding pipeline cho dữ liệu mapping được thu thập thực địa: signage, house numbers, POI storefronts.

  • Thực hiện post-OCR normalization và entity extraction: address, POI name, opening hours; đánh giá confidence và xử lý edge cases.

  • Hỗ trợ xây dựng active learning / human-in-the-loop workflow: lựa chọn samples để label, đánh giá labeling quality và cải thiện model liên tục.

E. Automated Data QA & Approval

  • Xây dựng models/rules để tự động approve/reject/flag các submissions về map, POI, địa chỉ: duplicate detection, spam/fraud detection, consistency checks.

  • Thiết kế và tuning confidence scoring và threshold cho các approval policies; đánh giá trade-off giữa auto-approval rate và false positive.

  • Theo dõi và báo cáo impact của auto-approval: tỷ lệ giảm manual review, precision/recall theo từng loại submission

Requirements

  • Từ 3 năm kinh nghiệm Applied Data Science / Machine Learning trong môi trường production. Tốt nghiệp Đại học chính quy loại khá trở lên chuyên ngành Toán Tin, CNTT, Thống kê, hoặc tương đương (ưu tiên các trường ĐH lớn: Bách Khoa, Công Nghệ, Khoa học Tự nhiên, Kinh tế Quốc dân).

  • Thành thạo Python cho data science: pandas, numpy, scikit-learn; kinh nghiệm với ít nhất một deep learning framework (PyTorch hoặc TensorFlow).

  • Nền tảng thống kê và xác suất vững: hiểu bias/variance trade-off, calibration, hypothesis testing, A/B testing.

  • Kinh nghiệm xây dựng và đánh giá ML models trong môi trường production: data leakage prevention, reproducibility, model versioning.

  • Khả năng phân tích và làm sạch dữ liệu tốt: xử lý missing values, outliers, schema inconsistency; viết SQL và làm việc với large datasets.

  • Tư duy metric-driven: xác định đúng metric đánh giá, phát hiện regression và đề xuất cải tiến có đo lường rõ ràng.

  • Giao tiếp tốt bằng tiếng Anh (đọc/viết): đọc tài liệu kỹ thuật, viết documentation và trao đổi với team quốc tế

  • Ưu tiên

  • Kinh nghiệm với dữ liệu không gian địa lý (geospatial): GPS noise, map matching concepts, spatial indexing (S2/H3/Geohash), spatial joins.

  • Kinh nghiệm xây dựng spatiotemporal models: time-series forecasting, sequence models (LSTM/Transformer), graph-based features.

  • Kinh nghiệm với OCR/Document AI: text detection, recognition, multilingual, postprocessing và entity extraction.

  • Kinh nghiệm MLOps cơ bản: MLflow hoặc tương đương cho experiment tracking, model registry và monitoring.

  • Kinh nghiệm xử lý dữ liệu lớn với Spark/PySpark hoặc streaming với Kafka/Kinesis. Kinh nghiệm tham gia active learning hoặc human-in-the-loop annotation workflow.

  • Kinh nghiệm với NLP/text normalization cho địa chỉ, tên địa điểm hoặc tiếng Việt có dấu

Benefits

  • Mức thu nhập, các gói thưởng hấp dẫn, cạnh tranh mạnh mẽ so với thị trường.
  • Phụ cấp ăn trưa.
  • Được hưởng chế độ ưu đãi khi sử dụng các dịch vụ thuộc hệ sinh thái Tập đoàn: Ưu đãi học phí (Vinschool), khám chữa bệnh (Vinmec), nghỉ dưỡng (Vinpearl), mua xe (VinFast), thuê hoặc/và mua nhà (Vinhomes) … theo chế độ của Tập đoàn.
  • Được hưởng đầy đủ các chế độ bảo hiểm theo quy định của Luật Lao động (BHXH, BHYT, BHTN) và được Công ty mua Bảo hiểm sức khỏe cá nhân theo cấp bậc vị trí, khám sức khỏe định kỳ tại Bệnh viện và Trung tâm khám sức khỏe uy tín trên toàn quốc.
  • Cơ hội tiếp cận dự án chiến lược công nghệ trọng điểm, quy mô lớn.
  • Cơ hội làm việc trong môi trường công nghệ chuyên nghiệp, quy tụ các nhà khoa học, chuyên gia, kỹ sư đến từ các Công ty công nghệ hàng đầu Việt Nam và thế giới.
  • Cung cấp các nguồn học tập miễn phí trên các nền tảng Udemy, Coursera, O’Reilly; hội thảo nội bộ; tài trợ chứng chỉ và chương trình cố vấn đặc biệt từ Ban lãnh đạo Tập đoàn và Công ty.
  • Cơ hội tham gia các Câu lạc bộ công nghệ của Tập đoàn, các sự kiện công nghệ nội bộ để học hỏi, phát triển những dự án, ý tưởng cá nhân vào thực tế.
  • Cung cấp các chương trình đào tạo để trở thành "Giảng viên nội bộ" tham gia chia sẻ chuyên môn với những quyền lợi đặc biệt.
  • 12 ngày nghỉ phép năm, nghỉ các ngày lễ, Tết theo quy định của pháp luật.
  • Tham gia các hoạt động nội bộ, hoạt động teambuilding, sự kiện hàng năm của Công ty