Quay lại danh sách

AI ENGINEER

Hà Nội Full-time Upto 50tr/tháng (Gross)

"CMC OpenAI – Thành viên trẻ tuổi nhất của Tập đoàn Công nghệ CMC – nơi những con người Việt Nam đang không ngừng khai phá giới hạn của công nghệ, xây dựng nên một thế hệ trí tuệ nhân tạo mở, minh bạch và hướng đến con người."

CMC OpenAI tiên phong phát triển các sản phẩm trong lĩnh vực trí tuệ nhân tạo, hướng tới trở thành nền tảng AI mở và an toàn do Việt Nam xây dựng, phát triển.

Chúng tôi trân trọng sự khác biệt của từng cá nhân – và tin rằng sự đa dạng trong tư duy là cốt lõi của sáng tạo. Tại CMC OpenAI, đội ngũ kỹ sư đang cùng nhau xây dựng các nền tảng AI và ứng dụng dựa trên Large Language Models/Agents cho những bài toán thực tế như legal document intelligence, conversational AI và AI platform nội bộ.

Chúng tôi tìm kiếm những AI Engineers ở nhiều hướng chuyên môn khác nhau, từ LLM/Agents Applications, Model Training đến AI Platform & Infrastructure, để cùng mở ra hành trình bước vào kỷ nguyên AI toàn diện và ghi dấu những sản phẩm Make in Viet Nam trên bản đồ AI thế giới.

MÔ TẢ CÔNG VIỆC

  • Ứng viên có thể tập trung vào một hoặc nhiều mảng chuyên môn như LLM Applications, Model Training hoặc AI Platform, tùy theo kinh nghiệm và định hướng.
  • Nghiên cứu, đánh giá và cập nhật liên tục các xu hướng, mô hình và kỹ thuật mới nhất trong lĩnh vực Natural Language Processing (NLP), Computer Vision (CV) và Generative AI, phục vụ các sản phẩm chuyển đổi số và hệ thống AI nội bộ.
  • Thiết kế, phát triển và tối ưu hóa các Large Language Models (LLMs)Multimodal LLMs (MLLMs) cho nhiều bài toán thực tế, bao gồm nhưng không giới hạn:
    • Retrieval-Augmented Generation (RAG)
    • Chatbot / Virtual Assistant
    • Document Understanding, Information Extraction
    • Text Classification, Summarization, Question Answering
  • Xây dựng và tối ưu pipeline fine-tuning, instruction-tuning, preference tuning cho LLMs (SFT, LoRA/QLoRA, PEFT, RL).
  • Làm việc với các mô hình mã nguồn mở và thương mại như LLaMA, DeepSeek, Qwen, Mistral, kết hợp với Vector Database để xây dựng hệ thống tìm kiếm ngữ nghĩa và RAG ở quy mô lớn.
  • Thiết kế và tối ưu embedding pipelines, vector indexing, retrieval strategy (hybrid search, reranking).
  • Đánh giá, phân tích và cải thiện hiệu suất mô hình theo các tiêu chí:
    • Accuracy, latency, throughput, memory footprint
    • Hallucination, factuality, robustness
  • Phối hợp với các nhóm Backend, Data, DevOps để:
    • Tích hợp mô hình AI vào hệ thống sản phẩm
    • Triển khai mô hình ở môi trường production (on-premise hoặc cloud)
  • Thực hiện tài liệu hóa kỹ thuật, báo cáo nghiên cứu và báo cáo tiến độ theo yêu cầu của ban quản lý.
  • Phát triển và triển khai các hệ thống Speech AI, bao gồm:
    • Automatic Speech Recognition (ASR) với Whisper, WhisperX, Wav2Vec2
    • Alignment, diarization và hậu xử lý dữ liệu âm thanh

YÊU CẦU CÔNG VIỆC

  • Kiến thức & Kỹ năng chuyên môn
    • Tối thiểu 3 năm kinh nghiệm trong lĩnh vực Machine Learning, NLP hoặc phát triển các hệ thống AI.
    • Thành thạo các framework và thư viện học sâu:
      • PyTorch (ưu tiên), TensorFlow
      • Hugging Face ecosystem (Transformers, Datasets, PEFT, Accelerate)
    • Nắm vững các nền tảng và khái niệm cốt lõi của NLP và Large Language Models, bao gồm:
      • Word / Sentence / Document Embeddings
      • Transformer, Attention Mechanism
      • Sequence-to-Sequence hoặc Decoder-only Models
      • Tokenization, context length, prompt engineering
    • Có kinh nghiệm xử lý dữ liệu NLP quy mô lớn, bao gồm:
      • Data cleaning, normalization, deduplication
      • Dataset curation phục vụ fine-tuning và evaluation
    • Có kinh nghiệm làm việc với Vector Databases hoặc hệ thống tìm kiếm ngữ nghĩa, ví dụ:
      • Milvus, Weaviate, Chroma, FAISS
      • Hiểu các khái niệm như embedding dimension, indexing strategy và recall–latency tradeoff
    • Có kinh nghiệm làm việc với LLMs mã nguồn mở hoặc thương mại: LLaMA, Mixtral, DeepSeek, Qwen, Mistral hoặc các mô hình tương đương.
    • Hiểu biết về các kỹ thuật tối ưu và triển khai mô hình AI, bao gồm:
      • Quantization (INT8, INT4, FP8)
      • Model parallelism, inference optimization
      • Các công cụ như vLLM, Triton, TensorRT-LLM
  • Kỹ năng bổ trợ
    • Có tư duy nghiên cứu, khả năng đọc – phân tích paper, benchmark và mã nguồn.
    • Có kinh nghiệm triển khai mô hình trong môi trường production là một lợi thế: REST/gRPC API, Docker, Kubernetes.
    • Có khả năng đọc hiểu và viết tài liệu kỹ thuật bằng tiếng Anh.
  • Phẩm chất cá nhân
    • Tinh thần chủ động, ham học hỏi và sẵn sàng cập nhật công nghệ mới.
    • Khả năng làm việc độc lập và phối hợp nhóm tốt.
    • Tư duy hệ thống, chú trọng chất lượng và khả năng mở rộng của giải pháp.

QUYỀN LỢI

  • Thu nhập hấp dẫn theo năng lực: upto 50tr/tháng (Gross).
  • Bảo hiểm sức khỏe và các chương trình, chế độ phúc lợi của Tập đoàn CMC (ngày nghỉ sinh nhật, thưởng các dịp lễ/tết/sinh nhật Tập đoàn,…) cùng các chế độ BHXH, BHYT, v.v. theo quy định Pháp luật.
  • Thưởng hiệu quả công việc, đánh giá năng lực, review lương hàng năm.
  • Cơ hội học hỏi, tham gia đào tạo và phát triển bản thân tại một Tập đoàn công nghệ lớn hàng đầu Việt Nam, với lộ trình thăng tiến nghề nghiệp rõ ràng.
  • Môi trường làm việc trẻ trung, năng động, cởi mở, sáng tạo, đồng nghiệp vui vẻ và luôn được tạo cơ hội tiếp cận những công nghệ mới, tiên tiến nhất.

Thông tin chung

Địa điểm

Tòa nhà CMC – số 11 Duy Tân – Dịch Vọng Hậu – Cầu Giấy – Hà Nội.

Thời gian

Từ 8h30 – 18h (Thứ 2 - Thứ 6, nghỉ trưa từ 12h – 13h30)

Cấp bậc

Senior

Cách thức ứng tuyển

Email nhận CV:

hr@cmcai.vn

Ms. Ngọc Bích – Bộ phận Nhân sự

085 7075 246 (Zalo)

Email: bichnn@cmcai.vn

Gửi CV ngay