Với việc ra mắt trợ lý R1 AI, startup DeepSeek của Trung Quốc đã thu hút vô số sự chú ý và gây ra hoảng loạn trên thị trường chứng khoán khắp thế giới. DeepSeek “thổi bay” hơn 1.000 tỷ USD vốn hóa của các hãng công nghệ, trong đó Nvidia bị mất gần 600 tỷ USD chỉ trong một phiên giao dịch ngày 27/1.
“Cơn địa chấn” mang tên DeepSeek cũng kéo theo không ít tò mò cho nhà sáng lập Liang Wenfeng. Cựu quản lý quỹ đầu cơ 40 tuổi có bằng cử nhân AI là một nhân vật tương đối bí ẩn. Không nhiều thông tin về ông xuất hiện trên mặt báo Trung Quốc, trừ việc ông từng tham dự một hội nghị chuyên đề kín ngày 20/1 do Thủ tướng Trung Quốc Lý Cường chủ trì. Tháng 7/2024, ông cũng có mặt tại một phiên đối thoại cấp quốc gia, nơi ông nói về tầm nhìn đối với bình dân hóa AI và thách thức AI phương Tây.
Liang Wenfeng (áo xám) trong buổi họp kín ngày 20/1 do Thủ tướng Trung Quốc Lý Cường chủ trì. Ảnh: CCTVTại đây, ông cho rằng “AI Trung Quốc không thể mãi là người đi sau”, đồng thời khẳng định các công ty Trung Quốc đã “quen với việc tận dụng các đổi mới công nghệ của các nước khác”.
"Sam Altman của Trung Quốc"
Liang Wenfeng được xem là “ngựa ô” trong ngành công nghiệp AI. Ông sinh ngày 22/5/1985 tại Sơn Đông, Quảng Đông, Trung Quốc, trong một gia đình có bố làm giáo viên tiểu học.
Ông tốt nghiệp Đại học Chiết Giang, một trong những trường đại học lâu đời nhất và xếp hạng cao nhất tại Trung Quốc. Nhà sáng lập sàn thương mại điện tử Pinduoduo Colin Huang cũng theo học ở đây.
Năm 2015, ông và hai bạn học đại học thành lập phòng hộ High-Flyer, dựa vào toán học, phân tích thống kê và thuật toán máy tính để ra các chiến lược đầu tư. Theo website, năm 2019, High-Flyer quản lý ít nhất 10 tỷ NDT, tăng từ 1 tỷ NDT năm 2016.
Financial Times đưa tin, năm 2021, Wenfeng bắt đầu mua hàng nghìn GPU của Nvidia trong khi đang điều hành High-Flyer, ngay trước khi Mỹ thực hiện các lệnh cấm vận chip nhằm vào Trung Quốc.
Một trong các đối tác kinh doanh mô tả Wenfeng là “một gã mọt sách với mái tóc kinh khủng, nói về việc xây dựng cụm 10.000 chip để đào tạo mô hình riêng”. Trong khi đó, CNN gọi Liang là “một nhà truyền bá AI”, “Sam Altman của Trung Quốc”.
Nhà báo điều tra Gregory Zuckerman nhớ lại, Liang từng đóng góp lời tựa cho bản dịch tiếng Trung cuốn sách về nhà toán học Jim Simons của ông. Khi ấy, Liang tiết lộ Simons đóng vai trò quan trọng trong sự nghiệp và niềm tin của mình xoay quanh việc sử dụng toán học để phân tích số liệu giao dịch và tài chính.
Wenfeng ra mắt startup DeepSeek tháng 5/2023 như một nhánh của High-Flyer và lấy ngân sách từ đây. DeepSeek đã gây sốt vào cuối năm 2024 với mô hình V3. Trong báo cáo mà công ty công bố tháng 12 năm ngoái, các nhà nghiên cứu DeepSeek ước tính họ dùng 2.000 chip Nvidia H800 để đào tạo mô hình với chi phí dưới 6 triệu USD, ít hơn đáng kể so với các đối thủ AI khác.
Chẳng hạn, Elon Musk – ông chủ xAI – cho biết, chatbot Grok được đào tạo trên 100.000 GPU H100. Tháng 1/2024, CEO Meta Mark Zuckerberg nói, công ty sẽ mua 350.000 GPU Nvidia H100 vào cuối năm. Tiếp đó, DeepSeek thực sự gây chấn động với chatbot R1 ngày 20/1. Nó nhanh chóng truất ngôi ChatGPT trên chợ ứng dụng App Store tại Mỹ.
Trong một tuyên bố năm 2023, High-Flyer chia sẻ, đã dành phần lớn lợi nhuận từ AI để xây dựng hạ tầng AI hàng đầu và tiến hành nghiên cứu quy mô lớn.
Bình dân hóa AI
Chi phí AI tăng vọt do các mô hình ngày càng phức tạp, chi phí tuyển dụng nhân tài và nhu cầu phần mềm hiệu suất cao. Các công ty Mỹ như Meta, Microsoft tuyên bố đầu tư hàng chục tỷ USD để duy trì năng lực AI. Dù vậy, Liang kiên trì quyết tâm “bình dân hóa AI” để ai cũng có thể sử dụng được công nghệ này.
Liang Wenfeng chưa có phát ngôn gì sau khi DeepSeek bất ngờ nổi tiếng. Ảnh: SohuTrong một bình luận trên CCTV News, Liang khẳng định nguyên tắc “không bán lỗ hay không tìm lợi nhuận khủng”. Mức giá hiện tại DeepSeek đưa ra đủ thu về lợi nhuận khiêm tốn. Ông cũng cho biết, mục tiêu chính của họ không phải là thu nạp người dùng. Công ty giảm giá là vì tin rằng cả AI và API (giao diện lập trình ứng dụng) nên có giá phải chăng và ai cũng tiếp cận được.
Theo Forbes, mô hình tài trợ độc đáo của DeepSeek – được High-Flyer hỗ trợ hoàn toàn – cho phép startup theo đuổi các dự án AI tham vọng mà không bị áp lực từ nhà đầu tư bên ngoài. Nó giúp họ tập trung vào R&D dài hạn.
Các thành viên của DeepSeek đều là những nhân tài kiệt xuất đến từ các trường đại học hàng đầu trong nước. Công ty thúc đẩy văn hóa đổi mới và nhấn mạnh vào ngôn ngữ, văn hóa Trung Quốc. Khi tuyển dụng nhân sự, họ ưu tiên vào năng lực kỹ thuật hơn là kinh nghiệm làm việc, dẫn đến một nhóm với những góc nhìn và ý tưởng mới mẻ trong phát triển AI.
Liang cũng lên tiếng về tiềm năng của Trung Quốc trong cuộc đua AI, nhắc đến ByteDance và Tencent như những lực lượng đáng gờm trên toàn cầu. “Những gì chúng ta thiếu không phải là vốn mà là sự tự tin và khả năng tổ chức nhân tài để đổi mới hiệu quả. Chúng tôi tin rằng cùng với sự phát triển kinh tế, Trung Quốc phải dần dần chuyển đổi từ một bên thụ hưởng sang một người đóng góp, thay vì tiếp tục dựa trên thành công của các nước khác".
Liang chưa có bất kỳ phát ngôn nào kể từ khi DeepSeek nổi tiếng toàn cầu. Dù vậy, ông đã nhận được sự ngưỡng mộ từ các cư dân mạng Trung Quốc. Một người dùng Weibo gọi ông là “bố già AI”.
Liang vẫn duy trì phong cách kín đáo của mình, chỉ phỏng vấn độc quyền với Anyong, một công ty con của công ty truyền thông 36Kr. Với Liang, DeepSeek không phải là một doanh nghiệp thương mại mà nghiêng về dự án bên lề được thúc đẩy bằng sự hiếu kỳ và cam kết của ông đối với nghiên cứu cơ bản.
Tác giả: Du Lam
Nguồn tin: vietnamnet.vn
Ý kiến bạn đọc
Những tin mới hơn
Những tin cũ hơn