Kết thúc Zalo AI Challenge 2018:

Khi nhạc Trịnh, nhạc bolero vào đề thi AI

15:03 | Thứ ba, 18/09/2018 0

Đa số các kỹ sư đều từng xây dựng thuật toán nhận diện các loại nhạc Pop, Rock, Jazz nhưng chắc ít AI nào của thế giới phải tìm cách nhận diện ra nhạc Trịnh hay nhạc bolero, nhạc tiền chiến.Đây chính là điểm khó khăn mang màu sắc bản địa của đề thi tại Zalo AI Challenge 2018.

Với sự quy tụ của 200 người tham dự từ thí sinh cho đến những người trẻ có chung mối quan tâm về AI, đây thực sự là một môi trường để cộng đồng AI gặp gỡ và chia sẻ kinh nghiệm.

Sau hơn 1 tháng tổ chức, Zalo AI Challenge - cuộc thi đầu tiên về trí tuệ nhân tạo (AI) tại Việt Nam theo mô hình Kaggle, đã kết thúc với buổi chia sẻ kiến thức, thuật toán giữa các kỹ sư trong cộng đồng AI. Cũng tại sự kiện này, những đội chơi có thành tích xuất sắc nhất trong số 700 đội thi đã được vinh danh.

Trong hơn 3 tuần diễn ra cuộc thi, trên khắp các diễn đàn về khoa học máy tính đã có hàng trăm chủ đề thảo luận xung quanh giải pháp của từng thử thách kéo theo sự đóng góp chất xám của rất nhiều kỹ sư hàng đầu Việt Nam. Được biết, tất cả các phần chia sẻ thuật toán của những đội đoạt giải sẽ được BTC Zalo AI Challenge chia sẻ công khai trên các diễn đàn về khoa học máy tính để tất cả các kỹ sư AI có thể tham khảo.

Sức hấp dẫn từ đề thi đậm bản sắc Việt

Để vượt qua được thách thức của Zalo AI Challenge, các đội tham gia phải trải qua ba hạng mục nhận diện bài hát Việt, phân biệt cảnh quan và nhận biết giọng nói. Hiện tại đa phần các kỹ sư Việt khi muốn xây dựng mô hình AI đều phải bỏ một số tiền lớn để mua các dữ liệu chuẩn đã được phân loại chính xác để về “dạy” cho AI. Tuy nhiên, các nguồn dữ liệu lớn chi tiết liên quan đến Việt Nam khá khan hiếm. Chính vì thế, những bài toán mà Zalo đưa ra vừa có tính cạnh tranh cực cao, vừa giúp xây dựng bộ data chuẩn thuần Việt.

Ông Trần Công Thiên Qui - đại diện hội đồng chuyên môn, đánh giá về đề thi và bài làm của thí sinh.

Trong buổi chia sẻ với sự tham gia của hơn 200 kỹ sư đang làm việc trong mảng trí tuệ nhân tạo, trưởng ban tổ chức cuộc thi Phan Kim Long, cho biết nhận dạng giọng nói, địa điểm, giai điệu không phải là bài toán xa lạ trên thế giới nhưng đưa vào trường hợp của người Việt lại trở nên khác biệt hoàn toàn do vấn đề ngôn ngữ, văn hóa.

Lấy ví dụ về thách thức phân loại giai điệu, ông Trần Công Thiên Qui – đại diện hội đồng chuyên môn, cho biết đa số các kỹ sư đều từng xây dựng thuật toán nhận diện các loại nhạc Pop, Rock, Jazz nhưng chắc ít AI nào của thế giới phải tìm cách nhận diện ra nhạc Trịnh hay nhạc bolero, nhạc tiền chiến. Đây chính là điểm khó khăn mang màu sắc bản địa của đề thi.

Đặc biệt, yếu tố mà tất cả những thí sinh tham gia đều đánh giá cao là vấn đề “độ nhiễu” của dữ liệu. Điều này thường xuyên bắt gặp trong thực tế khi người dùng chụp một bức ảnh ruộng bậc thang ở Hà Giang nhưng lại gắn thẻ nhầm ở Sapa hoặc sinh ra ở Hà Nội nhưng chuyển vào Sài Gòn sinh sống.

Nguyễn Bá Dũng chia sẻ giải pháp nhận diện đoạn nhạc.

Trong bài chia sẻ giải pháp của mình, Nguyễn Hoàng Bảo Đại - đại diện đội VietAI, quán quân trong bài toán nhận diện giọng nói đã đánh giá bộ dữ liệu khá mất cân bằng khi có đoạn thu âm dài 3 giây nhưng cũng có dữ liệu dài tới 10 phút, có những đoạn thu âm lại có 30 giây đầu chỉ là nhạc không lời khiến thuật toán phải xử lý vô cùng khó khăn. “Đội còn tình cờ phát hiện ra có một đoạn ghi âm là của một người miền Nam đang giả giọng Huế và nói một câu tiếng Anh.” – Bảo Đại chia sẻ.

Được biết, để tìm cách xử lý, đội thi đã phải tìm mọi sự trợ giúp từ Google cho tới các diễn đàn chuyên sâu về machine learning (học máy) và dùng tới 7 model (mô hình) khác nhau để tìm cách xác định đúng câu trả lời.

Đòn bẩy cho sự kết nối trong cộng đồng AI Việt

Con số 700 đội thi ở mùa đầu tiên tổ chức, trong đó có 140 thí sinh là những kỹ sư AI người Việt đang sống và làm việc ở các nước Nhật, Mỹ, Tây Ban Nha, Singapore… đã cho thấy các vấn đề AI tại Việt Nam đang nhận được sự quan tâm lớn của cộng đồng trong và ngoài nước.

Bảo Đại –đại diện đội VietAI chia sẻ giải pháp nhận diện giọng nói.

Phỏng vấn một số thí sinh tham gia cuộc thi năm nay, Nguyễn Bá Dũng (DungNB), người đoạt giải nhất phần nhận diện giai điệu chia sẻ rằng động lực tham gia cuộc thi là muốn mọi người vượt qua mình: “Mình chỉ muốn thúc đẩy phong trào AI của Việt Nam, giống như bên Nga có một cộng đồng ODS.AI rất mạnh. Khi bạn đạt một điểm số cao trên bảng xếp hạng thì những thành viên khác sẽ phải cải thiện model của mình và mình cũng phải cải thiện để nếu không muốn tụt khỏi bảng xếp hạng”.

Khác với Dũng, Bảo Đại – đại diện đội VietAI, cho biết cuộc thi là cơ hội để gặp gỡ với những người cùng ngành, để tìm hiểu thêm về các giải pháp của những kỹ sư khác cho những vấn đề rất Việt Nam này. Bảo Đại cũng chia sẻ rằng, đội gồm 4 thành viên hiện đang học và làm việc tại 4 quốc gia khác nhau, nếu không có cuộc thi, 4 kỹ sư người Việt này cũng không lý do để cùng bù đầu làm việc chung.

Chia sẻ của Bảo Đại khá đúng với thực tế đã diễn ra, ngay sau ngày phát động 9.8.2018, hàng loạt các topic (chủ đề) được lập ra trên các diễn đàn, hội nhóm công nghệ như forum machine learning cơ bản, Data Science & Big Data Vietnam để thảo luận đề bài cũng như kêu gọi lập đội nhóm tham gia thi. Có thể thấy, những thách thức từ Zalo AI Challenge đã tạo thành một đòn bẩy để cộng đồng các kỹ sư AI tương tác và chia sẻ chuyên môn với nhau nhiều hơn.

Không chỉ là các chủ đề trực tuyến, ngay trong buổi tổng kết cuộc thi, các kỹ sư đã không ngần ngại trao đổi các vấn đề thực tiễn của mình trong quá trình xây dựng AI ví dụ như làm cách nào để xác định đúng trọng số (weight) cho mỗi một model hay tinh chỉnh các bộ lọc (Filter) khi áp dụng trong từng bài toán.

Hỏi đáp và chia sẻ kiến thức, thuật toán giữa các kỹ sư trong cộng đồng AI.

Tại buổi trao giải, ông Vương Quang Khải, người đứng đầu Zalo, cho biết mình rất hạnh phúc khi gặp được nhiều người trẻ có cùng mối quan tâm về trí thông minh nhân tạo.

Ông Khải tỏ ra lạc quan về tương lai của công nghệ AI tại Việt Nam, khi lượng thí sinh tham gia Zalo AI Challenge tuổi đời còn rất trẻ (dưới 27 tuổi) mà đã giải quyết được những bài toán có độ khó rất cao. "Tôi có niềm tin là những người trẻ ở đây sẽ tiếp tục phát triển và làm những sản phẩm AI đẳng cấp thế giới", ông Khải chia sẻ.

Sau hơn ba tuần tham gia giải quyết các thách thức của Zalo Ai Challenge, 3 đội thi đạt thành tích xuất sắc nhất mỗi thử thách đã được xướng tên với phần thưởng giải nhất lên tới 30 triệu đồng.

Thử thách nhận dạng địa điểm, giải nhất: TQT – độ chính xác 94%, giải nhì: 2ez4Zalo – độ chính xác 93,5%, giải ba: DungNB – độ chính xác 93,2%

Thử thách nhận dạng giọng nói, giải nhất: VietAI – độ chính xác 84,7%, giải nhì: AIS-HelloKitty – độ chính xác 83,2%, giải ba: ZE – độ chính xác 82,2%

Thử thách phân loại giai điệu, giải nhất: DungNB – độ chính xác 70,1%, giải nhì: Toppan – độ chính xác 65,2% , giải ba: Ezio – độ chính xác 64,9%

T.Văn

Kết thúc Zalo AI Challenge 2018:

Khi nhạc Trịnh, nhạc bolero vào đề thi AI

Đọc tin nhanh