Lộ diện team phát triển game AI Trike A Pose tại CO-WELL Đà Nẵng

27/07/2023 350
Avatar Team AI

CWDN1

1. Bạn giới thiệu qua về team của mình? (team gồm bao nhiêu thành viên và có kinh nghiệm như thế nào trong lĩnh vực AI?)

Tuyến DV:Xin chào mọi người, Team R&D hiện có 2 thành viên chính thức là TuyếnDV, vai trò Leader và QuânTLT – AI Engineer chính của team và 3 thành viên mở rộng: DưỡngLC, NgânPT, TrânHNB – Phụ trách mảng application. 

QuânTLT mới ra trường và đang tập trung thực hiện các dự án nghiên cứu ban đầu: điển hình là việc tìm hiểu Pose Estimation, đọc hiểu nghiên cứu Face Recognition.

Bản thân mình đã có kinh nghiệm về AI. Trong đó, năm cấp 2, mình đã đạt giải Nhất thành phố về thiết kế forum nhà, đến năm cấp 3, mình tham gia đội tuyển chuyên Tin, đạt giải khuyến khích tin học HSG Quốc Gia.

Trong quá trình học Đại Học mình đã đạt giải Nhì toàn quốc (hơn 600 dự án tham gia) trong cuộc thi Khởi nghiệp Quốc Gia với dự án AI về ứng dụng hỗ trợ người cao tuổi – theo đề án 1665 của Chính Phủ. Mình nhận học bổng vào làm tại 1 công ty lĩnh vực AI tại Hà Nội. Trong 3 năm làm nghiên cứu & làm dự án về Computer Vision mình đã đảm nhận các vị trí trong các dự án bao gồm:

    • Leader dự án eKYC của Bkac CA.
    • Leader nghiên cứu bài toán Face Anti-Spoofing áp dụng chống giả mạo cho eKYC.
    • Leader nghiên cứu Face Recognition và đã  áp dụng vào bài toán điểm danh thuộc dự án Chính Phủ Điện Tử tỉnh ủy Quảng Ninh.
    • Dự án điểm danh Hành chính công Tỉnh Bình Thuận, Lào Cai, Long An.
    • Tham gia phát triển các dự án liên quan đến OCR: Bill OCR, microservice reCaptcha,..

CWDN4

2. Bạn hãy kể về quá trình lên ý tưởng và phát triển sản phẩm Strike A Pose?

Tuyến DV:Ý tưởng của game này đến từ phía Giám đốc chi nhánh, anh YênNQ. Anh Yên muốn một trò chơi tương tác mang tính “AI” trong sự kiện DevDay Đà Nẵng. Ý tưởng ban đầu là xây dựng một tựa game bắt chước cảm xúc khuôn mặt. Sau khi bàn bạc về việc triển khai, do giới hạn về cảm xúc khuôn mặt đã chuyển sang sử dụng tư thế con người ( Ước tính tư thế dáng – Pose Estimation).

Sau buổi họp, team tập hợp và phân công nhiệm vụ: Mình tập trung hoàn thiện API cung cấp Core nhận diện khuôn mặt và matching với đăng ký người chơi. Sau đó, mình và QuânTLT đảm nhận tìm kiếm phương án phát hiện, ước tính “tư thế dáng người”, đánh giá và chốt công nghệ sử dụng.DưỡngLC & NgânPT đảm nhận phần website cho trò chơi.

Có những dấu mốc đặc biệt, ban đầu là trong quá trình tìm hiểu khi áp dụng  xử lý ước tính tư thế dáng người vào thực tế không phù hợp, không đúng yêu cầu, lúc đó mình đưa ra quyết định thay đổi hướng đi mới, QuânTLT tập trung tính toán các dáng chơi và đẩy nhanh tiến độ dự án. Dấu mốc đáng nhớ thứ 2 đó là ngày lauching thử tại văn phòng và nhận đóng góp từ các ý kiến mọi người. Thay đổi và chỉnh sửa cho phù hợp. Sau cùng, sản phẩm đã dần hoàn thiện và chỉn chu hơn từng ngày. Cuối cùng team đã hoàn thành trò chơi và launching tại sự kiện DevDay.

CWDN3

3. Khó khăn và thuận lợi của các bạn khi phát triển sản phẩm này?

Tuyến DV: Có chứ, tất nhiên không thể hoàn hảo toàn bộ mà cũng gặp những khó khăn. Chủ quan là tiến độ tìm hiểu công nghệ của team giới hạn trong thời gian ngắn, deadline gấp. Mình nhận thức rõ vai trò tiến độ dự án phải hoàn thành đúng chỉ tiêu, có những lúc phải cùng gỡ lỗi cùng nhau cho đến khi ra vấn đề.

Yếu tố khách quan là thiết bị demo, webcam,… Cuối cùng, team đã vượt qua. Đó là công sức của cả một tập thể chứ không chỉ riêng bất kỳ cá nhân nào.

4. Thường khi làm sản phẩm AI cần cả thuật toán và dữ liệu? Trong quá trình làm phần này, các bạn có chuyện gì đáng nhớ?

Tuyến DV: Chính xác, AI nói chung hay lĩnh vực Computer Vision nói riêng, cả thuật toán và dữ liệu đều quan trọng. Điều đáng nhớ mình có trong lúc thực hiện đó là khi việc minh đưa ra quyết định thay đổi hướng xử lý Pose Estimation từ phía server lên phía website và Quân kết hợp viết xử lý các dạng trò chơi cùng ngay trên đó.

Lúc ấy mình suy nghĩ nhất đó là độ chính xác và hiệu năng khi xử lý. Nếu viết một thuật toán xử lý mà không mang lại hiệu năng tốt khi chơi thì đó cũng là một trải nghiệm không tốt cho người chơi. Vì thế, chúng mình quyết định lựa chọn thuật toán có thể mang lại hiệu suất và trải nghiệm tốt nhất cho người chơi.

CWDN 2

5. Kết quả khi mang sản phẩm Strike A Pose đến DevDay tại Đà Nẵng? Các bạn nhận được phản hồi như thế nào từ người dùng trải nghiệm thực tế?  Sau khi kết thúc, các bạn đã có cải tiến nào thêm cho sản phẩm này?

Tuyến DV: Sau sự kiện DevDay, điều đọng lại trong cá nhân mình là các bạn sinh viên hào hứng tham gia trò chơi, đặt câu hỏi cho mình về cách mình xử lý thuật toán,“sao model của anh tốt vậy”, “làm sao model biết ai là người đăng ký trò chơi”, v..v.. và chủ động xin kết nối để được học hỏi nhiều hơn sau sự kiện.

Ngoài ra, team AI đã có được những thử nghiệm ban đầu để cải tiến thuật toán Pose Estimation. Đó là 1 phần trong dự án Skeleton-based Action Recognition đang thực hiện song song.

Team R&D đang có kế hoạch thực hiện các dự án về Computer Vision bao gồm: Office Monitoring (Áp dụng Face Recognition để thực hiện bài toán giám sát, điểm danh,…), Skeleton-based Action Recognition (Phát hiện hành động bất thường), Face Anti-Spoofing (Chống tấn công giả mạo bằng khuôn mặt),…

 Với việc tối ưu hóa, mình tập trung vào 2 việc:

  + Phần mềm: Trong thuật toán nhận diện, mình đã áp dụng các phương pháp tính toán tối ưu khác nhau, giảm bớt layer, tăng thời gian học tập khuôn mặt, áp dụng tăng cường dữ liệu training, thay đổi các siêu tham số trong model qua nhiều lần thử nghiệm. Và đặc biệt là đã viết lại toàn bộ thuật toán, không sử dụng các thư viện ngoài hay framework gây tốn tài nguyên, giảm thời gian xử lý và tự chủ được các tham số trong việc tính toán.

  + Phần cứng: Khai thác tối đa công nghệ giúp cải thiện tốc độ, tăng tốc như: Chuyển Model sang ONNX, sử dụng môi trường cài đặt CUDA & cuDNN, cùng với đó là tích hợp TensorRT.

6. Điều gì khiến bạn tự hào nhất, hạnh phúc nhất khi làm việc ở CO-WELL? 

 Điều mình tự hào đó chính là mình được chứng tỏ, thể hiện năng lực bản thân, có những thành viên nhiệt tình, ham học hỏi và cầu tiến. Dự án được đón nhận và có phản hồi ngay lập tức giúp team nắm bắt nhanh chóng vấn đề và xử lý trong thời gian ngắn. Đó là những nguồn động viên lớn trong quá trình làm việc tại công ty.

 
Join us