Chris Penn: AI và tầm nhìn về tương lai

N

AI hiện đang là một chủ đề nóng, vậy chúng ta nên mong chờ điều gì từ AI trong tương lai?

Một câu hỏi quan trọng nhận được nhiều sự chú ý trong thời gian gần đây trong giới công nghệ marketing là cách trí tuệ nhân tạo có thể ảnh hưởng đến nó – sự ảnh hưởng không phải trong một năm hay 10 năm, mà ngay ở thời điểm hiện tại. Để tìm hiểu vấn đề này, chúng tôi đang tổ chức một loạt các cuộc phỏng vấn với chuyên gia trong ngành; và Chris Penn – đồng sáng lập kiêm nhà nghiên cứu dữ liệu chính ở TrustInsights.ai – là người được phỏng vấn đầu tiên.

Q: Trong bối cảnh thị trường marketing vẫn đang tìm hiểu về AI tạo sinh, thì yếu tố nào là mấu chốt mà các marketer phải hiểu được?

A: Chúng là các mô hình ngôn ngữ. Chúng giỏi về mặt ngôn ngữ, nhưng không giỏi những thứ không liên quan đến ngôn ngữ, như toán chẳng hạn. Thế nhưng, chính ngôn ngữ lại là nền tảng của gần như là mọi thứ. Cho nên là, dù chúng không thể tự làm toán nhưng chúng có thể viết code, vì code là một dạng ngôn ngữ và nó có thể được sử dụng để tính toán.

Nói một cách đơn giản thì, mọi gói phần mềm và công ty phần mềm trên thị trường hiện nay, nếu có một ngôn ngữ kịch bản riêng hay một API (Application Programming Interface – giao diện lập trình ứng dụng), thì họ đều nên – hoặc đang – tích hợp một mô hình ngôn ngữ vào sản phẩm đó.

Lấy ví dụ như Adobe chẳng hạn. Họ có một ngôn ngữ kịch bản riêng trong sản phẩm của mình. Và Adobe đã làm gì? Họ tích hợp AI tạo sinh vào Firefly và các sản phẩm của họ. Cho nên khi bạn tương tác với nó, về cơ bản là nó sẽ lấy prompt của bạn và viết lại theo ngôn ngữ kịch bản riêng sau đó xử lí bằng lệnh. Cách này giúp AI vận hành tốt hơn.

Tương tự như vậy, đây cũng là cách Microsoft tiếp cận vấn đề AI. Nếu bạn nhìn vào Bing, thì Bing không nêu câu hỏi trực tiếp với mô hình GPT4 để lấy kiến thức. Thay vào đó, Bing sẽ nhờ chúng ta nhập từ khóa tìm kiếm vào Bing để Bing xử lý, sau đó lấy kết quả rồi viết lại các kết quả này.

Kết quả chúng ta có ở đây về cuộc chuyển đối lớn đang diễn ra, hay nói chính xác hơn là phải diễn ra, đó là nếu bạn có API thì bạn nên có một mô hình ngôn ngữ có thể giao tiếp với API đó, và kết quả cuối cùng sẽ là những gì khách hàng có thể thấy được.

Một trong số những người đầu tiên thực hiện điều này là Dharmesh Shah ở HubSpot. Tôi vẫn nhớ khi GPT3 Turbo mới ra mắt và ông ấy đã nói “Chúng ta sẽ làm như vậy, tôi sẽ làm một chatbot.” Rồi ông ấy chạy thử bản alpha của chatbot và nói rằng “Ừ, nó dở tệ. Nó hỏng toàn tập rồi. Nhưng đây chính là hướng đi trong tương lai của chúng ta.”

Cho nên nếu bạn là một công ty công nghệ marketing và bạn không sử dụng một hệ thống AI như vừa nhắc tới, thì công ty của bạn tiêu rồi. Hãy đem bán nó đi.

Q: OK, giờ khi tôi đã biết về vấn đề này, thì có còn điều gì tôi nên biết khi sử dụng AI không?

A: Có hai mấu chốt mà mọi người cần hiểu để tận dụng tối đa AI tạo sinh. Điểm đầu tiên là dữ liệu, vì các công cụ này hoạt động tốt nhất là khi bạn cung cấp dữ liệu cho chúng. Chúng không giỏi việc tạo ra nội dung bằng việc so sánh các nội dung – phân tích và so sánh, đại loại như vậy.

Điểm thứ hai đó là số lượng và chất lượng của ý tưởng đầu vào, yếu tố này phải đảm bảo có cả số và chất. Đây là điểm khác biệt, vì kĩ năng đâu còn quan trọng nữa, phải không? Nếu các bạn có một bài hát nhưng không biết chơi nhạc cụ, không sao cả, AI sẽ giúp bạn. Nó có kĩ năng để làm điều đó, nhưng bạn phải cho nó ý tưởng để bắt đầu làm việc.

Theo kinh nghiệm cá nhân thì, tốc độ lập trình của tôi hiện giờ đang ở mức độ mà chỉ sáu tháng trước thôi tôi còn nghĩ sẽ không bao giờ đạt đến được. Một hệ thống gợi ý viết bằng Python, một ngôn ngữ lập trình tôi còn không biết sử dụng, chỉ mất có 1 tiếng 30 phút để hoàn thành, và nó hoạt động vô cùng ổn.

Nhưng, điểm mấu chốt ở đây là tôi biết rõ mình cần hỏi cái gì, vì tôi có đủ hiểu biết về lập trình để biết nó hoạt động ra sao. Kể cả nếu tôi không biết cú pháp của chúng thì tôi cũng biết cấu trúc dữ liệu nên như thế nào, và tôi biết nó nên hay không nên làm cái gì ở đâu.

Q: Nhiều người không biết những điều này.

A: Đúng vậy. Những điều này không có ai dạy cho các bạn cả, và đây cũng là một vấn đề khá lớn. Nó sẽ góp phần nhiều vào các vấn đề mà AI tạo sinh có thể gây ra.

Ngay hệ thống giáo dục hiện nay cũng không chuẩn bị gì cho học sinh để đối mặt với hiện thực xã hội thời hiện đại như thế này. Để rồi nó lại càng tệ hơn khi rất nhiều các nhiệm vụ mà chúng ta liên kết với khả năng học thuật giờ đã trở nên vô nghĩa, như việc viết bài luận chẳng hạn. Đơn giản thôi, một cái máy sẽ viết ra bài luận tốt hơn bạn. Chấm hết.

Trong khi đó, những thứ như tư duy phản biện lại không được giảng dạy ở trường. Thực ra thì – điều này sẽ nghe hơi giống thuyết âm mưu một chút – cấu trúc của hệ thống giáo dục hiện nay đã được sử dụng từ những năm 20 của thế kỉ trước. Rockefeller, Carneige và Mellon về cơ bản đã định hình hệ thống giáo dục hiện đại để tạo ra các công nhân có tri thức, và chúng ta chưa bao giờ vượt qua được rào cản này. Giờ đây, khi AI tạo sinh xuất hiện, chúng ta mới thấy rõ mồn một các hạn chế của kiểu giáo dục này, vì chính lối suy nghĩ cũ kĩ đó lại là điểm mạnh nhất của AI.

Vậy các công ty cần phải suy nghĩ xem: làm sao có thể huấn luyện nhân viên của mình để họ có một lối suy nghĩ mới? Làm sao có thể huấn luyện nhân viên thành các máy tạo ý tưởng tần suất cao, rồi kết hợp AI vào để hiện thực hóa các ý tưởng này?

Công cụ AI cho chúng ta sự linh động và tốc độ, nhưng chúng không chắc đã cho chúng ta được những ý tưởng đột phá, vì khả năng của chúng chính là giới hạn mà ta đã đặt lên. Đây là một khoảng trống khá lớn.

Và các công ty đang làm tốt nhất hiện nay là các công ty với một đội ngũ nhân viên với suy nghĩ cấp tiến và có kinh nghiệm. Họ không nhất thiết phải già hơn chúng ta, nhưng họ không sợ sệt công nghệ và sẵn sàng đón nhận nó. Khi ta đặt kinh nghiệm lên bàn cân và kết hợp nó với sức mạnh của các công cụ, thì thảnh quả tạo ra sẽ luôn tốt hơn những gì một người trẻ không có kinh nghiệm có thể làm được, dù họ có thông thạo công nghệ đến đâu đi nữa. Đó chính là khoảng cách.

Q: Tôi nghĩ mình là người phù hợp và cũng có chút hứng thú với công nghệ. Vậy tôi có nên học lập trình không?

A: Dù quá trình này khá tốn sức, nhưng tôi nghĩ học lập trình không phải chuyện xấu. Có một quyển sách mà tôi luôn khuyên mọi người đọc, gọi là “Tự động hóa những thứ nhàm chán với Python”. Mọi người có thể đọc quyển sách này, các ví dụ về lập trình trong đó ta không nhất thiết phải làm theo vì đã có ChatGPT, nhưng nó sẽ giới thiệu cho người đọc các yếu tố cơ bản như cấu trúc kiểm soát, vòng lặp, lưu trữ dữ liệu và các khái niệm liên quan.

Q: Chúng ta có thể kỳ vọng điều gì trong tương lai?

ANgay ở thời điểm này có một số điều đáng chú ý. Đầu tiên đó là các mô hình đa phương tiện hiện giờ vẫn còn khá thô sơ. Cho dễ hình dung, thì nó như thể một mớ hỗn độn của hai thứ bị dính vào với nhau, và bạn sẽ thấy điều này khi sử dụng ChatGPT tích hợp với động cơ sáng tạo hình ảnh DALL.E. Bạn có thể nói chuyện với nó nhưng nó không hiểu nó đang nhìn cái gì, và cũng không có cách nào để nó có thể nhìn lại vào bức ảnh và nói “à đúng rồi, ở đây có năm người nhưng anh chỉ cần bốn thôi.” Thật sự khá là ngu ngốc.

Dù vậy, nhưng cốt lõi là ta đang thấy những sản phẩm sơ khai rồi. Dù còn thô sơ, nhưng nó là một mô hình đa phương tiện đúng chuẩn, và nó có thể hoạt động được. Cho nên, tôi nghĩ chúng ta có thể kỳ vọng những bước nhảy và cải tiến đáng kể trong khoảng 12 tháng tiếp theo, thậm chí là đến mức có một mô hình lặp hoàn chỉnh. Bạn có thể đưa một video vào, nhập chữ, rồi nhập thêm chữ và để nó tiếp tục chỉnh sửa video và cứ tiếp diễn như vậy, tất cả gói gọn trong một mô hình duy nhất.

Điểm thứ hai là chúng ta đang thấy các cấu trúc mô hình mới. Một trong số đó là mô hình MOE (Mixture Of Experts, tạm dịch là hỗn hợp chuyên gia). Ý tưởng của mô hình MOE là họ sẽ lấy mạng thần kinh truyền thẳng và thay nó bằng một “hỗn hợp chuyên gia”. Về căn bản, thì đây là một mô hình có khả năng tự tạo ra các “chuyên gia” và để các “chuyên gia” này nói chuyện sau đó đưa ra kết quả cuối cùng dựa trên cuộc nói chuyện này.

Thử lấy một ví dụ đơn giản: bạn có một mô hình ngôn ngữ, rồi bạn lại có một “chuyên gia” với cùng cấu trúc chương trình, cùng một meta model đi cũng được, “chuyên gia” này sẽ đóng vai trò như một người đọc kiểm và nó sẽ nói với mô hình rằng “này, cái này là phân biệt chủng tộc, sửa lại đi.”

Ngoài ra, có một bài báo xuất bản vào ngày hôm qua nói là có một bộ phần mềm mã nguồn mở đã đạt được mức độ gần chạm đến GPT-4 và có thể hoạt động trên 40 gigabyte RAM. Tức là, một chiếc Macbook dạng “trâu bò” có thể chạy một thứ mà trước đây bạn sẽ cần cả một phòng server để chạy.

Điểm thứ ba chính là hệ thống mạng máy tính. Giờ đây chúng ta đang nhìn thấy những hệ sinh thái mạng máy tính được xây dựng dựa trên các mô hình ngôn ngữ nơi mà người dùng sử dụng nó như một bộ công nghệ để sản sinh nội dung thông qua các ứng dụng.

Tuy nhiên, có một thứ mà nhiều người hiện giờ vẫn chưa hiểu đó là họ vẫn nghĩ các mô hình ngôn ngữ có thể làm mọi thứ. Không hề. Mô hình ngôn ngữ chỉ có thể xử lí ngôn ngữ mà thôi. Nếu bạn muốn nó đọc cơ sở dữ liệu của bạn, thì đó không phải thứ nó có thể làm.

Tuy nhiên, với những thứ như RAG (retrieval augmented generation, tạm dịch là tạo sinh tích hợp truy xuất thông tin) hay kết nối API, thì đang dần xuất hiện các mô hình ngôn ngữ đóng vai trò như một phần của cấu trúc máy tính. Andrej Karpathy đã nhắc đến khái niệm này trước đây trong một buổi trò chuyện về một hệ điều hành máy tính với hệ thống mô hình ngôn ngữ thay cho hệ điều hành thông thường.

Và đây là một điều mà chúng ta đang thấy dần dần diễn ra, nhưng câu chuyện sẽ còn tiếp diễn trong 12 tháng tới. Bạn sẽ còn thấy nhiều những tiến bộ trong các cấu trúc này.

Hiện đang có một ứng dụng gọi à Llamafile do Mozilla phát hành có khả năng lấy một mô hình ngôn ngữ và gói nó lại theo cấu trúc ứng dụng, nhờ đó mà chúng ta có một tập tin nhị phân có thể sử dụng được ngay mà không cần chạy công cụ phát triển. Theo một cách khác, thì chúng ta có thể thiết kế các mô hình ngôn ngữ riêng, tinh chỉnh nó, đưa nó vào ứng dụng hoặc vào USB, rồi đưa chúng cho ai đó và nói “của bạn đây, bạn có thể dùng nó trực tiếp mà không cần lập trình thêm gì cả”, và nó khiến cho mọi thứ tiện lợi hơn rất nhiều.

Một yếu tố mà tôi đang theo dõi rất sát sao ở thời điểm này là mã nguồn mở. Các nhà phát triển hiện tại đang mở rộng nó vượt xa những gì mà các công ty công nghệ lớn đã cho ra mắt. OpenAI, Google, Meta, những thứ chúng ta tưởng như chỉ thấy trong phòng thí nghiệm của các ông lớn công nghệ bây giờ đang ở trên GitHub và Hugging Face để mọi người tải về và thử nghiệm. Nó thật sự rất tuyệt.

Q: Các marketer nên lưu ý những rủi ro nào khi nói đến AI?

A: Điểm mấu chốt là đây: họ không được để mô hình AI tạo sinh nói chuyện với khách hàng mà không có ai theo sát trong bất cứ trường hợp nào. Dù vậy, nhưng chúng ta vẫn thấy rất nhiều người copy và dán nội dung từ ChatGPT lên blog công ty,  và tôi thấy chuyện này khá buồn cười. Các công cụ này hoạt động độc lập mà không có sự giám sát của con người được.

Tất nhiên là sẽ có một số ngoại lệ, nhưng khi quan sát vấn đề từ góc nhìn rộng thì điều này là chính xác. Thứ nguy hiểm nhất khi sử dụng AI đó là sử dụng chúng một cách bất cẩn. Tôi đã nghe một người nói là “bọn tôi mới sa thải 80% đội content marketing của chúng tôi vì AI có thể làm thay họ.”
Và câu trả lời của tôi là “Vậy thì trong một quý nữa tôi sẽ xem bạn đi tuyển lại nhân viên cũ với mức lương cao gấp ba lần vì máy móc không thể làm cái mà bạn nghĩ chúng có làm được.”

Và đây chỉ là một trong số những cái nhìn thiển cận của con người khi nhắc đến AI. Nếu nói ra, thì việc các lãnh đạo và cổ đông hiểu được khả năng của các công cụ và điều chỉnh lại bộ máy của họ cho hợp lý là một vấn đề mang tính chiến lược. Mọi người có xu hướng nghĩ chatbot là một công cụ biết tuốt nhưng không, nó là một máy đoán từ. Nó chỉ có khả năng như vậy mà thôi.

(Chris Penn: Looking forward with AI (martech.org), Quang Anh dịch)


Leave a comment
Your email address will not be published. Required fields are marked *