Hợp lực vươn mình:

Đưa AI tới gần hơn với đời sống người Việt

 12:11 | Thứ hai, 03/02/2025  0
Với việc cung cấp cho thị trường hàng loạt sản phẩm từ công nghệ trí tuệ nhân tạo (AI) mà nổi bật như trợ lý ảo Kiki, công nghệ nhận dạng khuôn mặt, định danh điện tử hay mới đây là các ứng dụng từ AI tạo sinh (AI Avatar, AI Sticker, AI thiệp...), các kỹ sư tại Zalo AI không chỉ góp phần đưa AI trở nên gần gũi hơn với đời sống người Việt mà còn cung cấp nhiều giải pháp giúp các doanh nghiệp trong và ngoài nước nội địa hóa sản phẩm ngay tại thị trường Việt Nam.

Ngay khi Kiki Auto, một sản phẩm của Zalo AI, cán mốc 1 triệu lượt cài đặt chỉ sau 4 năm phát triển, Người Đô Thị đã có cuộc trò chuyện với các kỹ sư trẻ xoay quanh những sản phẩm công nghệ “make in Vietnam” mà họ đang trực tiếp phụ trách, gồm: anh Nguyễn Hoàng Khánh Duy (Quản lý sản phẩm - Product Manager tại Zalo), Nguyễn Anh Huy (Kỹ sư trưởng công nghệ AI của dự án Kiki Auto) và chị Lê Trần Trúc Vân (Quản lý sản phẩm Thiệp AI).

Kiki Auto vừa đạt 1 triệu lượt cài đặt và sử dụng trên ô tô. Cột mốc này có ý nghĩa như thế nào đối với các bạn?

Khánh Duy: Đây là con số rất ý nghĩa khi Kiki Auto đã vào “câu lạc bộ 1 triệu người dùng”. Bởi có một điều chúng tôi rất tự hào đó là các sản phẩm của “nhà Zalo” từ trước tới nay đều có người dùng tính bằng đơn vị triệu, thậm chí hàng chục triệu. Nay một sản phẩm vốn đặc thù dành cho xe hơi cũng đã vươn lên được cột mốc đơn vị triệu người dùng, “chung mâm” với các ứng dụng hàng đầu khác của nhóm. Để phủ được số lượng ô tô đạt đến đơn vị hàng triệu cần nhiều thời gian vì số lượng xe hơi ngoài thị trường hiện nay khoảng 5 triệu xe, theo Tổng cục Đăng kiểm Việt Nam.

Ngoài ra, dịp này chúng tôi cũng nâng cấp tính năng cảnh báo tốc độ cho Kiki Auto. Với thế mạnh sẵn có về AI cũng như nền tảng kinh nghiệm phát triển sản phẩm cho người Việt, đội ngũ đã tích hợp các thuật toán xử lý dữ liệu và tín hiệu phức tạp để đảm bảo độ chính xác cũng như tối ưu trải nghiệm người dùng.

Trong tương lai, chúng tôi sẽ tiếp tục nâng cấp tính năng này để giúp các bác tài vững tay lái trên mọi cung đường.

Anh Nguyễn Hoàng Khánh Duy - Quản lý sản phẩm tại Zalo.


Ra đời chưa đến 5 năm nhưng Kiki đã góp phần đưa công nghệ AI trở nên gần gũi hơn với đời sống mà còn cung cấp một giải pháp giúp các doanh nghiệp trong và ngoài nước nội địa hóa sản phẩm ngay tại thị trường Việt Nam. Các bạn đã bắt tay thực hiện dự án này từ nguồn cảm hứng nào?

Anh Huy: Sản phẩm trợ lý ảo trên thế giới nói chung thường đi theo mô hình trợ lý tiếng nói. Chúng tôi bắt đầu dự án Kiki từ tháng 12.2020, riêng với Kiki Auto là tháng 6.2021. Ngay từ ý tưởng Kiki đã có sự khác biệt với các trợ lý khác, đó là làm cho nó không quá thông minh mà hướng tới sự thực dụng. Nếu hình ảnh hóa thì nó khớp với hình ảnh chú chó, do đó Kiki trở thành tên thương hiệu của sản phẩm.

Khánh Duy: Các trợ lý ảo hiện nay trên thị trường người ta thường định vị sản phẩm của họ phải giống và thông minh như con người. Định vị cho sản phẩm như thế sẽ phát sinh vấn đề đó là người dùng sẽ kỳ vọng rất cao ở trợ lý ảo, trong khi để sử dụng thực tế, họ cần những tính năng hữu ích và thực dụng hơn; chưa kể đến tính khả thi của công nghệ để một trợ lý có thể thông minh giống người thật. Chúng tôi chọn hướng đi khác, không đặt kỳ vọng Kiki phải như một con người mà nó như một chú chó, những thứ mình ra lệnh nó sẽ làm rất tốt chứ không khiến người dùng nghĩ rằng nó sẽ làm được tất cả mọi thứ.

Chúng tôi cũng chọn những tính năng rất thực dụng, gần gũi chẳng hạn trên xe hơi sẽ có hai tính năng là nghe nhạc và chỉ đường. Chúng tôi tập trung làm kỹ hai tính năng sao cho tốt hơn các trợ lý ảo khác trên thị trường. Tất nhiên chúng tôi cũng bổ sung thêm một số tính năng khá hữu ích cho người lái ô tô như hỏi giá xăng, hay kiểm tra phạt nguội.

 

Kiki Auto - Trợ lý ảo trên ô tô với công nghệ AI.


Công nghệ AI nào nhóm sử dụng chính cho Kiki?

Anh Huy: Trợ lý Kiki là tổng hợp của nhiều công nghệ khác nhau. Ví dụ, để hiểu giọng nói cần mô hình nhận diện giọng nói, một trong số đó là mô hình ngôn ngữ lớn (LLM) mà thế giới đang quan tâm. Từ tổ hợp giọng nói từ nhiều vùng miền khác nhau, sau đó chúng tôi phải huấn luyện, tinh chỉnh lại theo phương ngữ của mỗi vùng miền để sao cho khớp.

Chúng tôi cũng ứng dụng một số kỹ thuật xử lý về âm thanh trong ngữ cảnh sử dụng vì môi trường ở trong nhà sẽ khác với trong xe hơi. Khi đã ghi nhận được giọng, ví dụ: Hôm nay là thứ mấy? lúc này cần hiểu câu này như thế nào, lại cần đến một kỹ thuật khác. Tương tự mô hình LLM, cần huấn luyện để AI hiểu ý định của người dùng. Khi hiểu được rồi thì trợ lý ảo sẽ phản hồi lại như thế nào? Đối với nền tảng nhà thông minh thì có cách phản hồi khác, và trên xe hơi cũng cần cách phản hồi tương ứng với ngữ cảnh sử dụng.

Việc bắt tay nghiên cứu AI ở thời điểm 5 năm trước có thuận lợi và khó khăn gì?

Anh Huy: Khó khăn là thời điểm đó chúng tôi là một trong những nhóm đầu tiên đặt chân vào lĩnh vực này. Khi ấy ở Việt Nam chưa có mô hình nào thành công để nhóm học hỏi, đa số phải tham khảo từ các mô hình trên thế giới. Chúng tôi phải xông xáo đọc những bài báo khoa học, tìm hiểu nghiên cứu những kỹ thuật mà nhiều khi ngôn ngữ được viết không phải bằng tiếng Anh. Cứ vừa học, vừa làm, vừa tinh chỉnh và dựa vào điều kiện hạ tầng, kỹ thuật ở Việt Nam để áp dụng các kỹ thuật mới sao cho tương thích.

Nhưng công bằng mà nói khó khăn này thật ra cũng thuận lợi, do mình là những người đầu tiên nghiên cứu thì có nhiều tự do hơn về mặt sáng tạo, không phải đi theo khuôn mẫu hay định kiến như lúc làm các ứng dụng trên điện thoại.

Anh Nguyễn Anh Huy - Kỹ sư trưởng công nghệ AI của dự án Kiki Auto.


Cần bao nhiêu thành viên để nhóm thực hiện những dự án AI này và mất thời gian bao lâu thì ra được thành phẩm?

Anh Huy: Thời điểm ban đầu nhóm có khoảng 20 thành viên. Điều thuận lợi là năm 2020 chúng tôi đã có một sản phẩm ra mắt thị trường sau hơn một năm nghiên cứu. Được như vậy là trước đó nhóm đã có ý tưởng và kế hoạch nghiên cứu. Sau này số lượng thành viên tăng lên nên chúng tôi ra nhiều sản phẩm hơn và đều đặn hơn.

Theo các bạn, yếu tố nào quyết định thành công khi nghiên cứu AI?

Khánh Duy: Có nhiều yếu tố. Đầu tiên là tầm nhìn của các lãnh đạo Zalo. Từ rất sớm, khoảng đầu 2019 chúng tôi đã làm ra bản thử nghiệm demo đầu tiên là trợ lý ảo của Zalo. Các lãnh đạo cấp cao của Zalo đã đặt vấn đề rằng phương thức giọng nói sẽ là phương thức của tương lai và yêu cầu phải “rèn quân” ngay chứ không phải đến khi mọi người đã thành công rồi thì mới bắt tay vào làm. Đây là yếu tố then chốt quyết định thành công.

Thứ hai là sự kiên định. Năm 2019 dù mới ra được sản phẩm đầu tiên là bản demo nhưng chúng tôi vẫn tiếp tục phát triển đội ngũ, cho làm nghiên cứu theo nhiều hướng khác nhau để xem sản phẩm AI này sẽ có cơ hội ở những hướng nào. May mắn là chúng tôi gặp được đối tác có cùng mục tiêu, lại tìm được môi trường mà trợ lý ảo này thực sự đắc dụng đó là trong xe hơi. Chúng tôi thấy khi đang lái xe thì người ta không thể vừa lái vừa bấm điện thoại, hay các thao tác trên màn hình cảm ứng khác. Ra lệnh bằng giọng nói là phương cách khả thi. Nhận ra đây là nhu cầu của thị trường, trong khi đó chúng tôi đã chuẩn bị sẵn về mặt con người và công nghệ nên có thể bắt tay thực hiện dự án ngay khi cơ hội đến. Như vậy sự hội tụ của các yếu tố về tầm nhìn, về sự kiên trì và một chút may mắn đã làm nên Kiki ngày hôm nay.

Anh Huy: Một yếu tố tôi nghĩ cũng quan trọng, đó là quay về cái tên Kiki. Nó là triết lý sản phẩm lúc đầu nhóm đặt ra. Như đã nói cái chúng tôi nhắm đến là tính thực dụng và độ ổn định của những tính năng mà chúng tôi đưa ra cho người dùng. Cái người ta dùng hàng ngày, mình chú ý phục vụ tốt thì họ sẽ tin dùng và thậm chí còn giới thiệu cho người thân, bạn bè biết đến rộng rãi hơn.

Đại diện Kiki Auto (trái) nhận giải thưởng “Trợ lý ảo tiếng Việt xuất sắc nhất” từ Ban Tổ chức giải thưởng công nghệ thường niên Tech Awards 2024.


Kiki giải quyết được rào cản ngôn ngữ cho nhiều người dùng Việt Nam. Các bạn có thể kể về quá trình huấn luyện để trợ lý này xử lý ngôn ngữ nhiều vùng miền mượt mà như hiện nay?

Anh Huy: Thời gian Kiki ra đời và phát triển cũng là thời gian chúng tôi huấn luyện bởi công việc này cần thực hiện đều đặn và liên tục cập nhật. Vì số lượng người dùng ngày một tăng nên độ đa dạng trong cách nói cũng nhiều hơn. Cập nhật ở đây có hai phần chính, đầu tiên là là phần âm thanh. Âm thanh lại bao gồm phương ngữ và môi trường (không gian người ta nói và thiết bị thu âm). Mà thiết bị thu âm thì đa dạng, thiết bị tốt sẽ thu được âm thanh rõ, đằng này đa số chất lượng chỉ đạt tầm trung trở xuống. Vì âm thanh lẫn nhiều tạp âm nên việc xử lý đòi hỏi một mô hình AI có thể tiến hóa...

Vấn đề thứ hai là nội dung người ta nói. Chẳng hạn muốn chỉ đường tới một vị trí nào đó, họ có thể ra lệnh: Chỉ đường đến chợ Bến Thành hoặc nói ngắn gọn là: Đến chợ Bến Thành. Có nhiều cú pháp, lại pha lẫn với tiếng địa phương, tạp âm… thì độ khó lại tăng lên. Có vô vàn tình huống như vậy. Cho nên ngoài việc xử lý sự đa dạng về âm thanh thì chúng tôi phải huấn luyện mô hình học những cách mà người ta nói. Nó đòi hỏi những mô hình phải đủ độ linh hoạt về việc xử lý âm thanh và xử lý văn bản. Mô hình đó phải đáp ứng được việc mình càng đổ dữ liệu vào thì nó càng tiến hóa lên để đáp ứng sự đa dạng người dùng. Theo thời gian chúng tôi hiện có thể tự tin là đáp ứng được khá tốt các ngữ cảnh sử dụng.

Có một con số hơi kỹ thuật và đã công bố nhưng tôi muốn nhắc lại, đó là cuối năm 2023, chỉ mất 6 tháng huấn luyện, mô hình LLM với 7 tỷ tham số (tập trung vào tiếng Việt) của chúng tôi đã đạt 150% năng lực so với GPT-3.5 của OpenAI trên bộ tiêu chuẩn đánh giá năng lực tiêu chuẩn VMLU (Vietnamese Multitask Language Understanding Benchmark Suite), gồm hơn 10.000 câu hỏi thuộc hơn 50 lĩnh vực khác nhau về khoa học tự nhiên, xã hội, STEM...

 Kiki Auto đã vào “câu lạc bộ 1 triệu người dùng”


Khánh Duy: Tỉ lệ lỗi từ (Word Error Rate - WER) hiện chỉ khoảng 4-5%. Tuy nhiên chúng tôi còn phải quan tâm tới một số yếu tố khác, chẳng hạn những tình huống không phải là do máy tính nhận diện giọng nói sai, mà vô tình người dùng nhớ sai nên ra câu lệnh không đúng. Chẳng hạn tên bài hát Lỡ hẹn với dòng Lam nhưng người ta lại nhớ nhầm là Lỡ hẹn bên dòng Lam hay Lỡ hẹn với sông Lam. Hay do phương ngữ nên từ bị đọc chệch… Lúc này chúng tôi phải giải quyết bài toán đó là đưa ra kết quả không phải là từ A ra B mà là từ A ra một số khả năng có thể, rồi cuối cùng xác định đâu là khả năng hợp lý nhất…

Do nhắc đến nhạc nên ở đây cần mở rộng câu chuyện một chút. Trước khi ra mắt Kiki Auto chúng tôi đã ứng dụng AI khá nhiều trên Zing MP3, cụ thể là nút micro tích hợp trợ lý Kiki. Trợ lý giọng nói này được tối ưu hóa dành riêng cho âm nhạc, có thể thực hiện nhiều yêu cầu như mở bài hát, tìm bài hát, lời nhạc nên chúng tôi tự tin khá hiểu cách người dùng nghe nhạc cũng như cách họ truy vấn nhạc… Chúng tôi cũng thử nghiệm sản phẩm loa Kiki từ năm 2020 có thể ra lệnh mở nhạc, kể chuyện, đặt báo thức…

Kiki Auto đã hợp tác với 25 đối tác trong lĩnh vực màn hình thông minh như: Zestech, Gotech, Bravigo, Safeview, TexPad, Steelmate, Teyes… Gần đây, phiên bản thử nghiệm Kiki Auto cũng được tích hợp trên mẫu xe điện Atto 3 của “ông lớn” BYD để điều khiển các tính năng quan trọng của xe như mở camera, tăng giảm âm lượng hay xoay màn hình vật lý. Các đối tác quốc tế tự tìm đến hay Kiki mời gọi họ?

Khánh Duy: Sản phẩm Kiki Auto hiện tại đang hợp tác với các đối tác trong nước trong thị trường "after market", tức các xe đã là thành phẩm họ muốn tích hợp thêm những thiết bị thông minh vào. Mong muốn của chúng tôi đó là được tích hợp sâu vào sản phẩm và ngay từ nhà máy.

Chúng tôi mong muốn mở rộng thì trường ngách này, bởi các hãng xe nước ngoài khi vào Việt Nam cần những mảnh ghép để sản phẩm của họ hoàn chỉnh. Họ không có sẵn những công nghệ tối ưu tốt cho người Việt vì vậy sẽ đi tìm kiếm những sản phẩm có thể đáp ứng được nhu cầu của người Việt khi bán tại thị trường này. Đó cũng là cách để tăng lợi thế cạnh tranh trên thị trường. Tất nhiên chúng tôi cũng quan tâm đến thị trường này và đang tích cực làm việc với các hãng xe.

Các thành viên nhóm nghiên cứu và phát triển Kiki trước cột mốc Kiki Auto đạt 1 triệu người cài đặt sử dụng trên xe hơi.


Con đường theo đuổi công nghệ AI tiếp theo của Zalo AI là gì, đặc biệt trong việc nghiên cứu, ứng dụng nó vào cuộc sống?

Khánh Duy: Như đã chia sẻ, triết lý làm sản phẩm là một trong những yếu tố quyết định sự thành công và chúng tôi sẽ luôn giữ điều này. Nhiều người nghĩ rằng khi làm ra sản phẩm thương mại thành công là xong nhưng thực tế không hẳn vậy. Sẽ có những thứ luôn thay đổi và mình phải luôn cập nhật để giữ vững vị thế. Ngoài ra, với Kiki Auto, chúng tôi đang nhắm đến việc tích hợp nó lên sản phẩm ô tô ngay từ nhà máy.

Anh Huy: Chúng tôi đang có những thử nghiệm thú vị. Ví dụ trên xe hơi, ngoài nhu cầu nghe nhạc và chỉ đường, người dùng còn có nhu cầu về những thông tin giao thông. Vì vậy nhóm đang nghiên cứu để làm sao tích hợp các thông tin hữu ích này vào trợ lý giao thông nhằm phục vụ nhiều hơn nhu cầu của người dùng hiện tại cũng như đối tượng người dùng tiềm năng...

Trúc Vân: Mục tiêu ban đầu chúng tôi đặt ra là sử dụng AI để phục vụ cho cuộc sống của người Việt vì vậy với các sản phẩm từ công nghệ AI tạo sinh, đặc biệt là thiệp chúng tôi cũng chưa có ý thương mại sản phẩm này. Chúng tôi sẽ tiếp tục phát triển tính năng lõi, tối ưu tốc độ xử lý, tối ưu hóa trải nghiệm cá nhân của người dùng và tương tác của họ trên thiệp.

Nhóm đang hướng tới sử dụng mô hình thơ, hình ảnh hay tích hợp mô hình video để tăng tương tác của người dùng với sản phẩm.

Chị Lê Trần Trúc Vân - Quản lý sản phẩm Thiệp AI.


Đánh giá của các bạn về việc nghiên cứu, ứng dụng AI hiện nay của Việt Nam? Điểm mạnh và điểm hạn chế trong vấn đề nghiên cứu ứng dụng AI tại Việt Nam hiện nay là gì?

Anh Huy: Tôi thấy điểm mạnh là tinh thần hưởng ứng của người Việt khá nhanh. Khi có làn sóng AI thì các bạn đổ công sức tìm hiểu kiến thức, chịu khó trau dồi, cộng với đó có những cộng đồng nghiên cứu AI hình thành, thảo luận sôi nổi. Do vậy, về mặt kiến thức thì việc nghiên cứu AI của Việt Nam không lo thiếu hụt. Nhưng có một vấn đề có thể coi là nhược điểm, đó là tính ứng dụng chưa cao. Sản phẩm ra mắt ở Việt Nam đa số là những demo nhằm minh họa một ý tưởng nào đó mà chưa có định hướng cụ thể vào một sản phẩm thực tế.

Cảm nhận của các bạn về khả năng của trí tuệ Việt trong việc ứng dụng AI và tạo ra những sản phẩm đáp ứng nhu cầu người dùng, đặc biệt cho người Việt?

Khánh Duy: Về mặt công nghệ tôi thấy năng lực, khả năng học hỏi của người Việt là không thua kém quốc gia nào. Điều này có thể thấy nhiều người Việt đang làm ở những bộ phận rất quan trọng của các tập đoàn công nghệ hàng đầu thế giới.

Thời điểm hiện tại, tôi thấy thế giới đang có rất nhiều kỳ vọng về AI tạo sinh và người ta đang nghiên cứu, thử nghiệm nhiều thứ với công nghệ này để xem nó sẽ phù hợp với những lĩnh vực nào. Khi nhu cầu cuộc sống và công nghệ gặp gỡ nhau tôi tin rằng sẽ tạo ra được sản phẩm đột phá.

Năng lực nghiên cứu của người Việt không phải là trở ngại lắm, nhưng chúng ta đang thua kém bạn bè quốc tế ở điều kiện máy móc để nghiên cứu, làm việc. Những tập đoàn công nghệ lớn trên thế giới có thể mua sắm thiết bị phục vụ nghiên cứu AI (hạ tầng tính toán, ví dụ các GPU của Nvidia) lên tới con số chục ngàn, thậm chí trăm ngàn mà điều này các công ty Việt Nam khó có thể với tới. Người ta nói có bột mới gột nên hồ, chúng ta có nhân lực, có kỹ năng tay nghề, tạm gọi là "có bột" rồi nhưng bột còn rất thô, cứng thì cần những loại máy nghiền bột, nhào bột hiện đại nữa để thúc đẩy sớm làm ra những chiếc bánh chất lượng.

Trúc Vân: Tôi đồng ý với anh Khánh Duy quan điểm về nguồn nhân lực IT của Việt Nam. Nền khoa học cơ bản của Việt Nam đang phát triển, chỉ có phần máy móc, hạ tầng của chúng ta vẫn chưa bằng các các nước tiên tiên trên thế giới. Nhưng theo dõi chuyển động gần đây trên truyền thông tôi thấy nhiều tín hiệu tốt, ví dụ Nvidia - công ty chip mạnh nhất về AI đang đầu tư vào Việt Nam. Vì vậy mặc dù còn những hạn chế nhưng phía quản lý đã nhìn ra AI là công nghệ tương lai và đang nỗ lực đầu tư vào công nghệ này. Phát triển AI ở Việt Nam do vậy vẫn là tiềm năng lớn trong tương lai.

Anh Huy: Tôi nghĩ người Việt Nam thông minh và chịu khó nên trong môi trường nào cũng vậy, rất chuyên tâm làm việc. Nhưng cá nhân tôi thấy tính sáng tạo, sức đột phá và tính cộng đồng là điều cần cải thiện thêm. Ngoài ra đa số kỹ sư Việt Nam đang làm tại công ty nước ngoài. Thúc đẩy ngành công nghiệp IT nói chung và công nghệ AI nói riêng tại các đơn vị nhà nước tôi nghĩ cũng cần quan tâm nhiều hơn.

Là những người làm trong lĩnh vực công nghệ, các bạn cảm nhận như thế nào về những chuyển động trong chính sách của Nhà nước gần đây như công nghiệp bán dẫn, nguồn nhân lực IT? Cùng với đó là nhiều “đại bàng” công nghệ đang chọn Việt Nam để “làm tổ”?

Trúc Vân: Tôi thấy đây là tín hiệu khởi sắc cho sự phát triển công nghệ của Việt Nam vì trước đây khi lựa chọn địa điểm để đặt hạ tầng quan trọng, các tập đoàn hàng đầu này sẽ nghĩ tới những nước khác. Tuy nhiên hiện nay họ đã chọn nước ta, thậm chí ông Jensen Huang còn cam kết "biến Việt Nam thành quê hương thứ hai của NVIDIA". Nhưng tôi cho rằng phát triển nhanh thì có những vấn đề cần phải quan tâm như sự sẵn sàng về bảo mật dữ liệu, vốn đi kèm với phát triển công nghệ. Nhiều nước đã đi qua giai đoạn này và họ đã có những bài học, vì vậy Việt Nam cần vừa học vừa theo dõi những nước tiên tiến này thì mới phát triển một cách bền vững được.

Khánh Duy: Tôi cũng cho rằng đây là những tín hiệu tốt, thể hiện sự quan tâm và tầm nhìn của lãnh đạo Nhà nước. Trước đây, vì là nước nông nghiệp nên có giai đoạn người ta cho rằng Việt Nam chưa làm nổi con ốc, cái vít trong chuỗi cung ứng. Tuy nhiên, điều kiện bây giờ đã khác và các nhà quản lý cũng nghiêm túc muốn thay đổi điều này nên đã thúc đẩy, tạo điều kiện để nhân lực Việt tiến tới làm được những công nghệ cao hơn.

Anh Huy: Tôi thấy đây là động lực để Việt Nam chuyển mình từ một nước gia công (về phần mềm, về công nghệ) chuyển sang nghiên cứu phát triển, sản xuất và tự chủ về công nghệ lõi. Cái mà tôi quan tâm đó là công nghệ lõi, những kỹ thuật sâu về phần cứng là cái mà đội ngũ IT của Việt Nam phải trau dồi và đẩy mạnh thêm nhằm nắm bắt cơ hội này.


Có những nghi ngại về AI có thể lấy đi công việc của con người. Là những người đang trực tiếp nghiên cứu ứng dụng AI, các bạn có cảm nghĩ gì về vấn đề này? Theo các bạn AI trong tương lai tới đây sẽ như thế nào?

Trúc Vân: Quan sát làn sóng AI bên Mỹ tôi thấy người ta đang hướng tới trí tuệ nhân tạo tổng quát AGI (Artificial General Intelligence), tức là công nghệ AI có thể đáp ứng được tất cả mọi thứ. Thay vì một AI chuyên làm tác vụ thì nay có thể làm từ đầu đến cuối, mình chỉ cần ra lệnh bằng giọng nói. Cũng kèm theo đó có nhiều tranh cãi là con người có nên hướng tới giai đoạn này không? Một mặt người ta thấy tiềm năng rất lớn nhưng mặt khác cũng lo sợ vì vậy vấn đề này vẫn còn tranh cãi và có lẽ sẽ không bao giờ ngã ngũ.

Ngay như sản phẩm thiệp AI, khi đón nhận các phản hồi của người dùng, đa số tích cực thì vẫn có những ý kiến nghi ngại về AI, cho rằng những hình ảnh AI làm bị giả quá. Chúng tôi cho rằng AI tạo ra làn sóng trên toàn cầu, được người ta đón nhận rộng rãi chứng tỏ công nghệ này mang lại giá trị cho họ. AI không thể thay thế hoàn toàn các hành vi, thói quen truyền thống mà nó sẽ là công cụ hỗ trợ. Tôi nghĩ trong tương lai AI vẫn là mảnh đất màu mỡ, là giai đoạn phát triển công nghệ tiếp theo sau kỷ nguyên mobi.

Về những điều nghi ngại AI trong tương lai, tôi nghĩ trong thời gian phát triển con người sẽ tìm cách để đưa ra những chính sách bảo vệ người dùng.

Khánh Duy: AGI là chủ đề mà các lãnh đạo của những tập đoàn lớn nhất thế giới đang có những tranh cãi và việc hiện thực hóa hay không chúng ta vẫn phải tiếp tục chờ. Tuy nhiên tôi nghĩ thời gian đến AI sẽ trở thành công cụ, nó là loại máy móc mới, giúp con người làm những công việc hàng ngày và những việc mang tính lặp đi lặp lại.

Ví dụ từ việc gặt lúa bằng tay đã có thể chuyển sang bằng máy, hay nhiều công việc tay chân khác thì máy móc cơ khí cơ bản đã có thể thay thế con người, giúp tăng năng suất lao động lên cao hơn. Nhưng sắp tới những công việc phức tạp hơn, một số lập trình cơ bản, công việc viết, tổng hợp thông tin… AI có thề thực hiện và những người lao động trình độ cao sẽ sử dụng AI như một công cụ để giúp họ nâng cao hiệu suất, hiệu quả công việc.

Vì vậy, lúc này những người không dùng được những công nghệ máy móc mới thì có thể sẽ kém cạnh tranh trên thị trường lao động hơn so với những người có khả năng sử dụng AI để làm việc.

Anh Huy: Công nghệ AI không phải là khát vọng mới đây mà từ những năm 1970. Thời đó những nhà khoa học máy tính đã lên nhiều ý tưởng về AI nhưng điều kiện máy móc chưa đáp ứng được. Vì vậy tôi vẫn tự tin nói rằng công nghệ này sẽ tiếp tục phát triển vì nó thai nghén từ rất lâu rồi. Trong giai đoạn này tôi cảm nhận rằng AI vẫn đang trải qua giai đoạn định hình để tìm các khả năng ứng dụng vào cuộc sống của con người.

Còn vấn đề AI có cướp đi công việc của con người hay không, có khiến con người trở nên lười biếng… thì những ý kiến trái chiều này là điều không quá ngạc nhiên trong quá trình định hình này. Trước đây cũng có những lo ngại khi có nhiều máy móc, có nhiều thiết bị di động hơn thì sức khỏe con người có bị suy giảm và thực tế cho thấy con người cũng ý thức được mặt trái, những tác hại của công nghệ nên họ chủ động cảnh báo, nhắc nhở nhau hạn chế dùng, chú ý hơn về rèn luyện thể chất, tận hưởng cuộc sống... Con người có đủ thông minh để ý thức được các mặt khác nhau của công nghệ đang theo đuổi.

Tôi thấy rằng tiềm năng của AI khá xán lạn bởi mục tiêu và khát vọng để công nghệ này ra đời là ứng dụng giúp cho cuộc sống con người trở nên tốt đẹp hơn.

Thiệp AI và thơ AI cũng là những sản phẩm sáng tạo của team Zalo AI. Dựa vào nguồn cảm hứng nào để các bạn ra mắt những sản phẩm độc đáo này?

Trúc Vân: Chúng tôi thấy trong đời sống thường ngày, vào dịp lễ người Việt có thói quen gửi thiệp, gửi những lời yêu thương và họ thích gửi để thể hiện sự quan tâm. Từ thói quen người dùng Zalo, chúng tôi thấy điều này càng rõ nét hơn, họ có thể gửi nhiều cách như tin nhắn, hình ảnh. Đúng dịp làn sóng AI ập đến, chúng tôi muốn tận dụng làn sóng này bằng việc kết hợp giữa công nghệ hiện đại với hành vi gửi thiệp truyền thống xem người dùng có đón nhận không.

Vừa làm, chúng tôi liên tục cập nhật, tinh chỉnh làm sao thiệp vừa trọn vẹn thông điệp trao gửi yêu thương nhưng cũng mang cảm giác vui để thu hút người dùng sử dụng. Ví dụ chúng tôi sử dụng thể thơ lục bát của Việt Nam, câu nhạc rap… Hay sử dụng tính năng về hình ảnh như thay đổi gương mặt. Sản phẩm chính thức ra mắt vào tháng 8.2024 và nhận được phản hồi cực tốt từ cộng đồng Zalo.  Chúng tôi cảm thấy vui vì đáp ứng đúng nhu cầu của đông đảo mọi người.

Cảm nhận khi bắt đầu làm quen AI và nghiên cứu hàng ngày như hiện nay, điều ấn tượng của bạn về công nghệ này trong chặng đường đã qua?

Anh Huy: Trước đây tôi đã nghiên cứu, đi sâu vào ứng dụng web, ứng dụng điện thoại cũng khá thú vị. Nhưng phải thừa nhận cũng như đi một con đường lâu khó tránh khỏi cảm giác lặp lại. Vì vậy ấn tượng ban đầu khi tham gia vào dự án AI đó là mọi thứ rất mới lạ, có vô vàn kiến thức để mình tìm hiểu và cảm thấy mảnh đất này khá tự do.

Sau khi đi được một thời gian với nhóm Zalo AI và ra được sản phẩm, ấn tượng tiếp đó là công nghệ này cho tôi cảm giác có nhiều tiềm năng để có thể ứng dụng để làm ra các sản phẩm phục vụ cuộc sống thường ngày. Điều may mắn là tôi được tham gia vào dự án của Kiki, được tạo nhiều điều kiện để làm những sản phẩm AI đầu tiên của Việt Nam.

Là đơn vị đi đầu (từ năm 2017) trong lĩnh vực AI tại Việt Nam Zalo AI hiện sở hữu 4 trung tâm nghiên cứu AI Lab với hơn 80 nhà nghiên cứu cùng hạ tầng mạnh mẽ, trong đó có hệ thống máy chủ gồm 8 DGX H100 có năng lực xử lý hàng đầu Việt Nam với hiệu suất lên đến 256 petaFLOPS (FLoating-point Operations Per Second). Các sản phẩm AI nổi bật của Zalo có thể kể đến: trợ lý giọng nói Kiki, công nghệ nhận dạng tiếng nói (dictation và voice-to-text), công nghệ tổng hợp tiếng nói (text-to-speech), công nghệ nhận dạng khuôn mặt (FaceID), công nghệ định danh điện tử (eKYC), công nghệ AI tạo sinh (AI Avatar, AI Sticker, AI thiệp)...

Adtima và Zalo AI vừa được vinh danh ở hạng mục “Enabling Technology Company of the Year” nhờ ứng dụng thành công AI vào các giải pháp marketing tại lễ trao giải thường niên Vietnam MMA Smarties 2024, “Trợ lý ảo tiếng Việt xuất sắc nhất” tại Tech Awards 2024. Trước đó, sản phẩm trợ lý Kiki được vinh danh tại Giải thưởng Sản phẩm Sáng tạo 2020 do Báo điện tử Vnexpress tổ chức. Ngoài ra, các sản phẩm của Zalo AI cũng liên tục lập những kỷ lục về số người sử dụng (có hơn 5 triệu thiệp Zalo AI được tạo trên nền tảng Zalo trong dịp 20.10) hay số lượt cài đặt, sử dụng...

Trà My thực hiện - Ảnh: CTV 

bài viết liên quan
để lại bình luận của bạn
có thể bạn quan tâm

Đọc tin nhanh

*Chỉ được phép sử dụng thông tin từ website này khi có chấp thuận bằng văn bản của Người Đô Thị.