AI tạo sinh sau năm 2023 sẽ đi vào đời sống Công nghệ AI trong tương lai được dự đoán là sẽ cá nhân hóa hơn và chuyên môn hóa hơn.
Ảnh: Shutterstock |
Những chân trời mới
Bản thân tôi là một người “mù” photoshop, không biết dùng nó để chỉnh ảnh. Tuy nhiên, hồi tháng 8 vừa qua, một người bạn đã cho tôi trải nghiệm với công cụ trí tuệ nhân tạo (AI) của Adobe Photoshop. Tôi đã có thể tự xóa hình nền một tấm hình của mình và thay vào bằng một hình nền “hoa vàng trên cỏ xanh, sau lưng là cánh rừng” (bằng tiếng Anh). Mọi thứ diễn ra trong chưa đầy một phút, chỉ với một câu lệnh trên công cụ đang thử nghiệm của photoshop, với một người không biết thao tác gì với photoshop, chỉ cần gõ vào một dòng lệnh trên một khung chat nhỏ. Công cụ này tất yếu còn nhiều thiếu sót và với dân rành photoshop như bạn tôi, thì nó vẫn còn quá thô sơ, và nhiều khi làm sai. Nhưng với một người không biết gì như tôi, nó mở ra hẳn một chân trời mới.
Từ đây tôi có thể làm nhiều việc chỉnh sửa hình ảnh đơn giản mà không cần nhờ bạn bè nữa nếu công cụ này chính thức được ra đời. Bạn tôi nói về các khái niệm “nghệ thuật tạo sinh” (generative art), “biến chữ thành hình nâng cao” (advanced text to image) mà tôi chỉ hiểu mù mờ. Nhưng tôi hiểu rằng nó sẽ không còn đơn giản chỉ là tôi tạo ra vài tấm hình vui vui bằng cách gõ vài chữ vào trong prompt của DALL-E hay Midjourney nữa. Tôi nay có thể tạo ra một số thứ cá nhân hóa cho chính tôi, như một tấm hình mình làm hiệp sĩ trong thế giới Lord of the Rings hay tự làm một poster phim mà mình nghĩ ra.
Đây là một ví dụ sinh động của việc ứng dụng các công nghệ AI tạo sinh (generative AI) vào trong nhiều khía cạnh của đời sống, và AI tạo sinh không còn buồn chán như việc giúp chỉnh sửa một đoạn văn hay giúp viết một cái e-mail nữa.
Công cụ AI nội bộ và chuyên môn hóa
Công nghệ AI trong tương lai được dự đoán là sẽ cá nhân hóa hơn và chuyên môn hóa hơn. Trước tiên, các công ty lo ngại nhân viên mình chia sẻ dữ liệu trọng yếu của công ty và khách hàng cho các nền tảng AI tạo sinh, họ có thể tự xây dựng công cụ nội bộ của mình. Ví dụ cho đến lúc này, một bạn tôi làm ở KPMG cho biết anh không thể sử dụng ChatGPT trên laptop của mình, nhưng anh cũng muốn dùng nó cho công việc, và sẽ rất tuyệt với nếu công ty có một công cụ nội bộ như vậy.
Có thể từ năm 2024, chúng ta sẽ nghe đến những ứng dụng thú vị của những công cụ AI cao cấp được huấn luyện từ những nguồn dữ liệu sạch, hiếm và đắt tiền. Ứng dụng đầu tiên mà nhiều người ưa thích tất nhiên là dùng nó để đoán giá cổ phiếu kiếm tiền. |
Có hai hướng cho việc này. Một là sử dụng công cụ mã nguồn đóng AI có sẵn, nhưng có thể cá nhân hóa, tức là tự huấn luyện AI cho riêng mình và dùng một công cụ của OpenAI hay Google cung cấp. Lợi thế của công cụ này là người dùng cần rất ít kiến thức về AI và lập trình, chỉ tập trung dùng dữ liệu do mình cung cấp để xây dựng công cụ AI cho riêng mình.
Nhược điểm của nó là phụ thuộc vào phía nhà cung cấp, giống như một dạng mua quyền franchise mà mình vẫn phải phụ thuộc vào nguồn nguyên liệu của người bán franchise, họ nắm đằng chuôi về công nghệ, nhưng ít ra mình có thể tự kiểm soát mình huấn luyện “con AI” của mình như thế nào, và ít nhiều tự kiểm soát dữ liệu (theo quảng cáo của những nền tảng này). Đây là đứng trên vai của những người khổng lồ “AI đóng”, và xây cái riêng của mình trên nền tảng đó.
Có một cách làm khác, mà tôi đang tiếp cận nhiều hơn trong công việc của mình, đó là tự xây dựng công cụ AI của mình từ mã nguồn mở. Với xu hướng AI mở (chia sẻ mã nguồn mở của các công cụ AI), nhiều công cụ AI riêng cho từng cá nhân sẽ được tạo ra. Ví dụ, có một nền tảng chia sẻ là Hugging Face, với lời quảng cáo là “dân chủ hóa AI” qua mã nguồn mở và khóa học mở. Nhìn chung thì rất nhiều công cụ trên Hugging Face được chia sẻ miễn phí, mã nguồn miễn phí, và người ta có thể trả tiền sử dụng một số dịch vụ của Hugging Face để xây dựng AI cá nhân mà không cần biết lập trình bao nhiêu cả (tận dụng nguồn công cụ mã nguồn mở chia sẻ sẵn có). Nếu không thích trả tiền thì có thể tự xây dựng công cụ của riêng mình với một ít kiến thức lập trình có sẵn (và vay mượn từ ChatGPT hoặc công cụ khác). Không tốn tiền.
Một trong những công cụ như vậy mà nhóm nghiên cứu của chúng tôi đang xây dựng là áp dụng mô hình dựa trên công cụ ngôn ngữ tự nhiên BERT của Google để chấm điểm xem một công ty đưa ra một báo cáo về bền vững (sustainability report) phù hợp bao nhiêu phần trăm so với yêu cầu do các chuẩn mực của cơ quan quản lý báo cáo công ty (corporate reporting) của Anh đưa ra. Cũng công cụ đó, nếu được huấn luyện trên dữ liệu khác, ví dụ như các tài liệu về chuẩn mực cho thuê tài sản, chuẩn mực báo cáo dự phòng tài chính, thì cũng có thể giúp các nhà phân tích biết được trong báo cáo thường niên của công ty có bao nhiêu phần, chủ đề thảo luận về nội dung liên quan.
Tất nhiên nói nghe đơn giản vậy nhưng thực tế đưa vào ứng dụng, huấn luyện mô hình và “chạy” dữ liệu thì không hề đơn giản, mà ngay cả mã nguồn mô hình là mở thì chi phí thử nghiệm cũng rất tốn kém. Rất may là trường Đại học Bristol đã đầu tư một trung tâm máy tính hiệu suất cao để hỗ trợ cho các tác vụ này. Ngoài ra, cũng may mắn là trường tôi cũng vừa được chọn làm nơi nhận đầu tư 225 triệu bảng Anh để xây dựng siêu máy tính nhanh nhất nước Anh nên cũng có nguồn lực để thử nghiệm.
Nguồn dữ liệu chất lượng và những sản phẩm AI chất lượng, nhưng sẽ phải quay lại với câu hỏi đầu tiên là “tiền đâu?”
Những ứng dụng kiểu như thế này đang mọc lên như nấm sau mưa với các nền tảng AI mở và đóng, cho phép nhiều người, tổ chức thử nghiệm nhiều thứ khác nhau (đương nhiên phù hợp với nguồn lực tự có của mình). Một trong những cải thiện so với các công cụ AI tạo sinh hiện tại đó là nâng cấp nguồn dữ liệu và tập trung vào một mục tiêu cụ thể.
Lấy ví dụ, một buổi sáng ngồi cà phê ở Tây Ban Nha trong tháng 10 vừa qua với một người bạn đến từ Hà Lan, anh chỉ ra cho tôi rằng vấn đề là các công cụ AI hiện tại đang “đào bới” hoặc “học” trên các nguồn dữ liệu chất lượng thấp, và không có ý nghĩa gì nhiều trong việc ra quyết định của các nhà đầu tư và các CEO công ty. Vì vậy, một công cụ AI khai thác các dữ liệu mà những người ra quyết định đầu tư thật sự nhìn vào, ví dụ các nguồn dữ liệu chất lượng từ báo cáo phân tích phải trả tiền, dữ liệu thị trường ít ai có… thì có thể sẽ rất hữu ích.
Đây cũng là hướng mà tôi được nghe một vài đại diện của các quỹ đầu tư ở Anh và Đức nói tới. Vấn đề ở chỗ nguồn dữ liệu, chứ không phải mô hình bao nhiêu tỉ biến số hay là thuật toán gì. Có thể từ năm 2024, chúng ta sẽ nghe đến những ứng dụng thú vị của những công cụ AI cao cấp được huấn luyện từ những nguồn dữ liệu sạch, hiếm và đắt tiền. Ứng dụng đầu tiên mà nhiều người ưa thích tất nhiên là dùng nó để đoán giá cổ phiếu kiếm tiền.
Không được đến mức như vậy, nhưng Bloomberg đã quảng cáo rằng họ đã tận dụng nguồn dữ liệu khổng lồ của mình để xây dựng công cụ BloombergGPT – được quảng cáo là dựa trên mô hình ngôn ngữ lớn 50 tỉ biến số và sử dụng bộ dữ liệu chất lượng cao của Bloomberg. Công cụ này có thể giảm thiểu khối lượng công việc phân tích dữ liệu, định giá công ty và thậm chí xuất bản báo cáo của các chuyên gia phân tích xuống mức thấp nhất.
Cho đến nay tôi vẫn chưa được sử dụng công cụ này. Nhưng nếu tiềm năng như lời quảng cáo, kết hợp với những công cụ vẽ biểu đồ và phân tích dữ liệu cơ bản (và cho bạn luôn cả mã nguồn vẽ đồ thị lẫn chạy phân tích) đang có sẵn trên mạng như Plotly – Chart studio, những công cụ này sẽ mở ra một cơ hội đổi mới việc dạy và học phân tích tài chính ở đại học và mở rộng nó cho cả những người không hiểu nhiều về tài chính.
Nhu cầu học về tài chính và kinh doanh ở nhiều ngành như y tế công, dược, thú y, truyền thông… đang tăng lên rất nhanh ở Anh mà khả năng của những trường dạy kinh doanh không thể đáp ứng nổi. Đây có thể là những công cụ làm thay đổi cuộc chơi, vì người ta có được công cụ “làm sẵn hết” các phân tích, và người ta chỉ cần hiểu về kết quả đầu ra của nó mà thôi.
Tất nhiên, tất cả những ứng dụng hấp dẫn ở trên đều ít nhiều phụ thuộc vào một nhân tố đầu tiên: “tiền đâu”. Những công cụ như BloombergGPT chắc chắn không miễn phí. Phiên bản nâng cao của Plotly cũng phải trả tiền. Và ngay cả bạn dùng công cụ AI mở, mã nguồn mở, thì tự huấn luyện AI cho riêng mình cũng cần một cái máy tính đủ mạnh. Bạn tôi trước đi lắp máy đào coin cho biết dạo này bạn đi lắp máy huấn luyện AI để kiếm tiền. Cuộc chạy đua AI đang thúc đẩy lợi nhuận cho những công ty bán các loại chip chuyên dụng và có hạ tầng tính toán, lưu trữ dữ liệu lớn. Tất nhiên, những tay chơi mới cũng xuất hiện trên thị trường này. Ví dụ, Microsoft đã ra một loại chip mới cho các tác vụ AI, để bớt phụ thuộc vào các nhà cung cấp như Nvidia.
(*) Giảng viên Đại học Bristol, Anh
Hồ Quốc Tuấn TBKTSG
|