@ManhTran.
Tất cả việc làm

Khối Dịch vụ xe

Trưởng phòng Vận hành (NOC)

Tòa Technopark, Hà NộiManagerFulltimeHạn nộp: 30 tháng 6, 2026

Về công ty

VinSmart Future (VSF) là công ty công nghệ trụ cột của Tập đoàn Vingroup, được hình thành từ việc sáp nhập toàn bộ hệ sinh thái công nghệ của tập đoàn, trong đó có VinApp, VinIT, VinBigdata, và các đơn vị công nghệ khác thuộc Tập đoàn. VinSmart Future được xác định là động lực tiềm năng phát triển mới cho Tập đoàn Vingroup. Quy tụ đội ngũ gần 4.000 chuyên gia và nhân sự công nghệ, VSF tập trung vào phát triển các mảng công nghệ với trí tuệ nhân tạo (AI) là cốt lõi, cho phép kết nối các lớp năng lực từ dữ liệu, mô hình đến hạ tầng, tạo điều kiện để phát triển các công nghệ có tính ứng dụng cao phục vụ đời sống của mọi người. VSF là nơi quy tụ những nhân tài trong lĩnh vực công nghệ thông tin, dữ liệu, AI trong nước và quốc tế.

Dẫn dắt xây dựng và vận hành trung tâm App NOC 24/7, đảm bảo tính ổn định, sẵn sàng và liên tục của các ứng dụng phục vụ hàng triệu người
dùng. Chịu trách nhiệm quản lý sự cố, tối ưu quy trình vận hành, giám sát hệ thống và phát triển đội ngũ NOC theo các tiêu chuẩn vận hành hiện
đại

Mô tả công việc

  • Xây dựng và vận hành bộ phận NOC 24/7 từ nền tảng: tuyển dụng & đào tạo đội L1 Operator, thiết lập quy trình vận hành, lịch ca, quy chế bàn giao ca và kho tri thức runbook.

  • Chuẩn hóa toàn bộ quy trình xử lý sự cố end-to-end.

  • Kiêm vai trò Incident Manager: chủ trì war-room sự cố P1/P2, chủ trì postmortem, đảm bảo 100% sự cố P1/P2 có RCA và action items được theo dõi đến đóng.

  • Hợp nhất giám sát trên stack kỹ thuật hiện hữu (Grafana, Datadog APM, logging, Jira Service Desk): chuẩn hóa tagging, alert routing tập trung, dashboard tổng hợp Tier 1 theo từng ứng dụng / thị trường; phối hợp với Devops tối ưu alert precision.

  • Quản lý KPI vận hành NOC.

  • Xây dựng và ký kết SLA nội bộ với các đơn vị chủ quản ứng dụng; phát hành báo cáo sức khỏe dịch vụ định kỳ tháng gửi Ban Giám đốc và các bên liên quan.

  • Thiết kế lộ trình tối ưu và tự động hóa từng bước: hiệu chỉnh ngưỡng cảnh báo, runbook automation, khai thác AIOps (Datadog Watchdog và tương đương) giảm tải vận hành thủ công.

  • Chủ trì nhịp vận hành định kỳ: Daily standup, Weekly Review (cập nhật Bảng Hành động, KPI tuần, blockers), Monthly Health Report cho lãnh đạo.

  • Phát triển năng lực đội ngũ L1: đào tạo kỹ thuật, kỹ năng xử lý sự cố, giao tiếp đa quốc gia (tiếng Anh); xây dựng lộ trình thăng tiến L1 → L2.

Yêu cầu

  • Tốt nghiệp Đại học các ngành Công nghệ thông tin, Kỹ thuật máy tính,

  • Khoa học máy tính hoặc lĩnh vực liên quan.

  • Tối thiểu 6–8 năm kinh nghiệm trong lĩnh vực vận hành hệ thống IT, trong đó ít nhất 2–3 năm kinh nghiệm quản lý đội trực ca hoặc NOC/SOC.

  • Kinh nghiệm trực tiếp điều phối và xử lý sự cố hệ thống quy mô lớn tại các tổ chức có yêu cầu cao về availability: ngân hàng, tổ chức tài chính, sàn thương mại điện tử, viễn thông hoặc công ty công nghệ có hàng triệu người dùng.

  • Ưu tiên:

  • Kinh nghiệm thiết lập NOC/SOC mới từ đầu (greenfield) hoặc chuẩn hóa lại quy trình NOC đang vận hành.

  • Kinh nghiệm với môi trường đa thị trường / đa múi giờ.

  • Hiểu biết về AIOps, anomaly detection, runbook automation.

  • Có chứng chỉ liên quan: ITIL 4, AWS/GCP/Azure Operations, Datadog Fundamentals, Kubernetes Administrator (CKA).

  • Thành thạo ít nhất 2 trong số các công cụ giám sát/observability Grafana, Datadog, ELK Stack, Prometheus, Zabbix, New Relic hoặc tương đương; có kinh nghiệm thiết lập alert, dashboard và SLO.

  • Kinh nghiệm làm việc với hệ thống logging tập trung; đọc hiểu và viết

  • SQL để truy vấn, phân tích log và cơ sở dữ liệu phục vụ điều tra sự cố.

  • Kinh nghiệm vận hành hệ thống triển khai trên cloud (AWS, GCP hoặc Azure): hiểu kiến trúc microservices, container (Docker/Kubernetes), service mesh, queue, cache.

  • Nắm vững ITIL hoặc các framework quản lý sự cố tương đương; ưu tiên có chứng chỉ ITIL Foundation trở lên.

  • Tiếng Anh làm việc tốt (đọc tài liệu kỹ thuật, giao tiếp với đội kỹ thuật đa quốc gia trong tình huống sự cố).

  • Kỹ năng & phẩm chất:

  • Tư duy hệ thống: khả năng đọc metric, trace, log để chẩn đoán sự cố nhanh trong điều kiện áp lực cao.

  • Kỹ năng lãnh đạo vận hành: quản lý đội ca đa ca, duy trì kỷ luật quy trình và chất lượng bàn giao trong môi trường 24/7.

  • Khả năng giao tiếp rõ ràng, ngắn gọn trong tình huống war-room và báo cáo lên lãnh đạo cấp cao.

  • Chủ động, chịu được áp lực cao, không né tránh trách nhiệm trong sự cố nghiêm trọng.

Quyền lợi

  • Môi trường Agile, làm việc với team quốc tế, sản phẩm thực sự có impact.
  • Làm việc trong môi trường công nghệ hiện đại, năng động với quy mô sản phẩm lớn thuộc hệ sinh thái Vingroup.
  • Tham gia phát triển các sản phẩm thực tế trong lĩnh vực Giáo dục, mang lại giá trị trực tiếp cho người dùng.
  • Lộ trình phát triển nghề nghiệp rõ ràng, được hỗ trợ nâng cao chuyên môn và kỹ năng kỹ thuật.
  • Chế độ lương, thưởng cạnh tranh cùng các chính sách phúc lợi hấp dẫn theo quy định của công ty.
  • Môi trường đề cao tinh thần học hỏi, chia sẻ kiến thức và chủ động phát triển bản thân