Tất tần tật về DeepSeek của Trung Quốc - AI đang khiến thế giới dậy sóng
Chỉ mới thành lập hơn một năm, DeepSeek - một startup AI đến từ Trung Quốc đã tạo nên cơn địa chấn tại Thung lũng Silicon. Startup này gây chú ý khi giới thiệu các mô hình trí tuệ nhân tạo (AI) đột phá, có khả năng cạnh tranh ngang ngửa với những chatbot hàng đầu thế giới nhưng chi phí chỉ bằng một phần nhỏ.
Sự xuất hiện của DeepSeek đang thách thức quan điểm thông thường cho rằng để phát triển AI trong tương lai sẽ cần ngày càng nhiều năng lượng và sức mạnh tính toán.
Tác động của DeepSeek đến thị trường tài chính rất rõ ràng khi cổ phiếu công nghệ toàn cầu lao dốc trong ngày 27/01. Điều này xảy ra khi làn sóng phấn khích về đổi mới của DeepSeek dâng cao, khiến các nhà đầu tư phải cân nhắc lại triển vọng của các đối thủ cạnh tranh tại Mỹ cùng các nhà cung cấp phần cứng của họ.
![](https://image.vietstock.vn/2025/01/27/deepseek-2.png)
DeepSeek chính xác là gì?
Ra đời vào năm 2023, DeepSeek là thành quả của Liang Wenfeng - Giám đốc quỹ phòng hộ định lượng có áp dụng AI High-Flyer. Điểm đặc biệt của công ty này là phát triển các mô hình AI mã nguồn mở, cho phép cộng đồng lập trình viên tự do kiểm tra và nâng cấp phần mềm. Ngay sau khi ra mắt vào đầu tháng 1/2025, ứng dụng di động của họ đã nhanh chóng chiếm lĩnh vị trí dẫn đầu bảng xếp hạng tải xuống trên App Store của Apple tại Mỹ.
Không giống các chatbot khác như ChatGPT của OpenAI, ứng dụng này tạo ấn tượng bằng cách trình bày chi tiết quá trình lập luận trước khi đưa ra câu trả lời cuối cùng. DeepSeek tuyên bố phiên bản R1 của họ không chỉ ngang tầm với phiên bản mới nhất của OpenAI mà còn mở rộng cơ hội cho các cá nhân muốn phát triển chatbot bằng cách cấp phép sử dụng công nghệ này.
DeepSeek đã xây dựng AI như thế nào?
Các chuyên gia AI hàng đầu của Mỹ đánh giá cao phương pháp xây dựng công nghệ AI với số lượng chip hạn chế được DeepSeek trình bày trong báo cáo nghiên cứu của họ. Đây là cách tiếp cận thông minh và ấn tượng trong việc tối ưu hóa hiệu suất phần cứng.
Về cơ bản, các kỹ sư của startup này đã chứng minh một phương pháp hiệu quả hơn trong việc phân tích dữ liệu trên chip. Thay vì theo cách truyền thống - khi các hệ thống AI hàng đầu học kỹ năng bằng cách xác định mẫu trong khối lượng lớn dữ liệu như văn bản, hình ảnh và âm thanh, DeepSeek đã phát triển cách phân phối việc phân tích này qua nhiều mô hình AI chuyên biệt. Phương pháp này được giới nghiên cứu gọi là "mixture of experts" (tạm dịch: tổ hợp các chuyên gia), đồng thời giảm thiểu thời gian mất đi khi di chuyển dữ liệu giữa các điểm xử lý.
Dù các công ty khác đã từng áp dụng phương pháp tương tự, nhưng việc truyền tải thông tin giữa các mô hình thường làm giảm hiệu suất. DeepSeek đã giải quyết được vấn đề này, cho phép họ sử dụng ít năng lực tính toán hơn nhưng vẫn đạt hiệu quả cao.
"Giờ đây đã rất rõ ràng rằng không chỉ những công ty như OpenAI mới có thể xây dựng các hệ thống như vậy", Tim Dettmers - nhà nghiên cứu tại Viện Trí tuệ Nhân tạo Allen ở Seattle và giáo sư khoa học máy tính tại Đại học Carnegie Mellon, chuyên về xây dựng hệ thống AI hiệu quả nhận định. "DeepSeek đã sử dụng những phương pháp mà bất kỳ ai cũng có thể áp dụng".
Báo cáo nghiên cứu của DeepSeek đặt ra câu hỏi liệu các công ty lớn của Mỹ có thể duy trì lợi thế đáng kể trong lĩnh vực AI hay không. Nhiều chuyên gia tin rằng công nghệ AI sẽ trở thành một loại hàng hóa thông thường, khi nhiều công ty cung cấp những sản phẩm tương tự nhau.
DeepSeek R1 thế nào khi so với OpenAI hoặc Meta AI?
Dù chưa công bố chi tiết, nhưng có thể thấy chi phí đào tạo và phát triển các mô hình của DeepSeek chỉ bằng một phần nhỏ so với những gì OpenAI hay Meta Platforms đã đầu tư. Hiệu quả đáng kinh ngạc này đặt ra câu hỏi lớn về tính cần thiết của việc chi tiêu khổng lồ để sở hữu các bộ tăng tốc AI mới nhất và mạnh mẽ nhất từ những công ty như Nvidia. Điều này cũng khiến nhiều người chú ý đến lệnh cấm xuất khẩu chất bán dẫn tiên tiến của Mỹ sang Trung Quốc - một biện pháp vốn nhằm ngăn chặn những bước đột phá như DeepSeek đang thể hiện.
DeepSeek khẳng định R1 có thể sánh ngang hoặc vượt trội các mô hình đối thủ trong nhiều tiêu chuẩn quan trọng: Từ AIME 2024 về khả năng toán học, MMLU về kiến thức tổng quát đến AlpacaEval 2.0 về hiệu suất hỏi đáp. Mô hình này cũng được xếp vào nhóm hiệu suất cao nhất trên bảng xếp hạng Chatbot Arena của UC Berkeley.
Tại sao Mỹ cần phải lo ngại?
Lệnh cấm xuất khẩu công nghệ cao cấp như chip GPU của Washington đang cho thấy những kẽ hở khi các kỹ sư AI Trung Quốc tìm ra cách đột phá với nguồn lực bị hạn chế.
Mặc dù biện pháp này nhằm kiềm chế sự tiến bộ của Trung Quốc trong lĩnh vực AI - một lĩnh vực then chốt trong cuộc đua công nghệ Mỹ-Trung, thành công của DeepSeek đã chứng minh rằng các rào cản thương mại không hoàn toàn hiệu quả. Dù vẫn còn nhiều điều chưa rõ về việc DeepSeek tiếp cận phần cứng đào tạo AI tiên tiến như thế nào, nhưng những gì họ thể hiện đã đủ để gây lo ngại về hiệu quả của các biện pháp kiểm soát hiện tại.
Khi nào DeepSeek thu hút sự chú ý toàn cầu?
Cú hích đầu tiên đến từ việc phát hành mô hình AI đầu tay vào năm 2023, nhưng phải đến tháng 11 khi giới thiệu mô hình lập luận DeepSeek R1 - được thiết kế để mô phỏng tư duy con người, startup này mới thực sự gây tiếng vang.
Sự kết hợp giữa ứng dụng chatbot di động và giao diện web vào tháng 1 đã biến DeepSeek thành một hiện tượng toàn cầu, như một phiên bản giá rẻ của OpenAI. Nhà đầu tư Marc Andreessen thậm chí còn gọi đây là "thời khắc Sputnik của AI". Theo số liệu từ công ty theo dõi thị trường App Figures, ứng dụng di động DeepSeek đã đạt 1.6 triệu lượt tải xuống tính đến ngày 25/1, đồng thời dẫn đầu bảng xếp hạng App Store iPhone tại nhiều thị trường lớn như Úc, Canada, Trung Quốc, Singapore, Mỹ và Anh.
Người sáng lập DeepSeek là ai?
Sinh năm 1985 tại Quảng Đông, Liang không chỉ sở hữu bằng cử nhân và thạc sĩ về kỹ thuật điện tử và thông tin từ Đại học Chiết Giang, mà còn có tầm nhìn đặc biệt về tương lai của AI.
Với số vốn khởi điểm khiêm tốn 10 triệu Nhân dân tệ (1.4 triệu USD), ông đã xây dựng DeepSeek thành một hiện tượng toàn cầu. Trong cuộc phỏng vấn với tờ 36kr của Trung Quốc, Liang chỉ ra rằng thách thức lớn nhất không nằm ở việc gọi vốn, mà là những hạn chế từ phía Mỹ trong việc tiếp cận chip AI tiên tiến.
Đội ngũ nghiên cứu của ông chủ yếu là những tài năng trẻ vừa tốt nghiệp từ các trường đại học hàng đầu Trung Quốc. Liang nhấn mạnh tầm quan trọng của việc Trung Quốc cần phát triển một hệ sinh thái nội địa tương tự như cách Nvidia đã làm với các chip AI của họ. "Đầu tư nhiều hơn không đồng nghĩa với nhiều đổi mới hơn. Nếu không, các công ty lớn sẽ thâu tóm mọi đổi mới", ông nói.
DeepSeek đứng ở đâu trong bức tranh AI của Trung Quốc?
Trong làn sóng phát triển AI của Trung Quốc, các gã khổng lồ công nghệ như Alibaba Group Holding, Baidu và Tencent Holdings đã và đang đổ nguồn lực khổng lồ vào cuộc đua giành thị phần phần cứng và người dùng cho các dự án AI. Tuy nhiên, DeepSeek, cùng với startup 01.AI của Kai-Fu Lee, lại nổi bật với chiến lược khác biệt: Tập trung vào mô hình mã nguồn mở. Cách tiếp cận này được thiết kế để thu hút nhanh chóng lượng người dùng lớn, trước khi phát triển các chiến lược kiếm tiền dựa trên nền tảng người dùng đó. Với các mô hình chi phí thấp, DeepSeek đã góp phần làm giảm áp lực chi phí cho các nhà phát triển AI tại Trung Quốc, nơi các công ty lớn đã liên tục giảm giá trong suốt một năm rưỡi qua.
Hàm ý cho thị trường AI toàn cầu là gì?
Làn sóng DeepSeek đang tạo ra những tác động sâu rộng đến thị trường AI toàn cầu. Thành công của họ có thể buộc OpenAI và các đối thủ Mỹ phải điều chỉnh chiến lược giá để bảo vệ vị thế. Đặc biệt, nó đặt dấu hỏi lớn về tính hợp lý của khoản đầu tư khổng lồ từ Meta và Microsoft - mỗi công ty đã cam kết chi tiêu vốn lên tới 65 tỷ USD trong năm nay, chủ yếu cho cơ sở hạ tầng AI - khi các mô hình hiệu quả hơn có thể được phát triển với chi phí thấp hơn nhiều.
Tác động này đã lan rộng ra thị trường chứng khoán toàn cầu: Các cổ phiếu công nghệ phương Tây như Nvidia và ASML Holding NV, vốn hưởng lợi từ cơn sốt AI, đang chịu áp lực bán tháo mạnh. Ngược lại, các cổ phiếu Trung Quốc liên quan đến DeepSeek, điển hình như Iflytek Co., lại đang trên đà tăng trưởng.
Cộng đồng phát triển toàn cầu đang tích cực thử nghiệm và tìm cách ứng dụng công nghệ của DeepSeek. Xu hướng này không chỉ thúc đẩy việc áp dụng các mô hình lập luận AI tiên tiến mà còn làm dấy lên những lo ngại về việc cần thiết lập các rào cản kiểm soát. Thành công của DeepSeek có thể là chất xúc tác đẩy nhanh quá trình ban hành các quy định mới nhằm kiểm soát sự phát triển của AI.
Những hạn chế của DeepSeek là gì?
Giống như các mô hình AI khác của Trung Quốc, DeepSeek cũng phải tuân thủ các nguyên tắc kiểm duyệt nội địa. Chatbot này tránh đề cập đến các chủ đề nhạy cảm như cuộc biểu tình Quảng trường Thiên An Môn năm 1989 hay các vấn đề địa chính trị căng thẳng. Một điểm đáng chú ý là trong khi DeepSeek có thể cung cấp thông tin chi tiết về các nhà lãnh đạo nước ngoài như Thủ tướng Ấn Độ Narendra Modi, nó lại từ chối bình luận về Chủ tịch Trung Quốc Tập Cận Bình.
Bên cạnh đó, sự phát triển nhanh chóng cũng đặt ra thách thức về hạ tầng: Sự cố ngừng hoạt động lớn vào ngày 27/1 là một minh chứng cho việc công ty cần tăng cường khả năng quản lý lưu lượng truy cập khi số lượng người dùng tiếp tục tăng mạnh.
Vũ Hạo (Theo Bloomberg)
FILI - 22:10:04 27/01/2025
|