Thương chiến 2.0 mang tên AI DeepSeek R1

Mang đến một cái nhìn cơ bản và thời đại về thương chiến thế giới năm 2025

2/2/20258 phút đọc

man in white dress shirt beside man in white dress shirt
man in white dress shirt beside man in white dress shirt

Hôm nay rảnh rỗi ngồi tìm hiểu về thương trường Mẽo - Tung. Cuộc chiến dường như đi đến một trận địa khác, tiếp nối cuộc chiến trước nhưng giờ đây nó không còn hoàn toàn là cấm vận, nó chuyển sang một chiến trường mang tên AI. và người mở ra chiến trường đó mang tên DeepSeek

Giải thích ngắn gọn và hài hước về DeepSeek

DeepSeek (R1) thực chất là một mô hình ngôn ngữ “distilled”. Khi huấn luyện một mô hình AI khổng lồ, nó có thể có hàng trăm tỉ hoặc thậm chí cả ngàn tỉ tham số, tiêu thụ dữ liệu khổng lồ và cần cả một trung tâm dữ liệu GPU chỉ để vận hành. Nhưng đôi khi, không cần tất cả sức mạnh đó để xử lý các tác vụ thông thường, đó là lúc “distillation” xuất hiện.

Bạn dùng một mô hình lớn như GPT-4 (hoặc phiên bản khủng 671 tỉ tham số của DeepSeek) và dùng nó để “dạy” những mô hình nhỏ hơn. Cách làm giống như một nghệ nhân bậc thầy truyền nghề cho một người học việc: không cần người học việc phải nắm mọi thứ, chỉ cần họ đủ giỏi để làm tốt công việc. Nó giống như dạy theo kiểu “học lỏm”: bạn có một mô hình lớn, biết hết về vật lý thiên văn, Shakespeare, và lập trình Python. Bằng cách cẩn thận chọn ví dụ và lặp lại quá trình huấn luyện, bạn có thể dạy mô hình nhỏ sinh ra những câu trả lời tương tự mà không cần chứa toàn bộ lượng thông tin khổng lồ bên trong. Nó giống như chép được lời giải, nhưng không mang theo cả thư viện.

Hàm ý của việc này là gì?

  • Hạ thấp chi phí và rào cản tiếp cận AI: Phiên bản 32 tỉ tham số có thể chạy tốt trên MacBook Pro, và các phiên bản nhỏ hơn có thể chạy trên Orin Nano giá khoảng 249 đô la.

  • Dân chủ hóa quyền truy cập AI: DeepSeek R1 được phát hành dưới dạng mã nguồn mở, cho phép các doanh nghiệp và chính phủ toàn cầu xây dựng dựa trên mô hình này mà không phải lo về giấy phép hay hạn chế từ các công ty Mỹ.

Chi phí thực sự của DeepSeek là bao nhiêu?

Có ý kiến cho rằng DeepSeek chỉ tốn 6 triệu đô la, nhưng SemiAnalysis cho rằng con số thực tế là 1,3 tỷ đô la. Phần lớn tiền này được đổ vào xây dựng và duy trì "bếp đám mây" với hàng chục ngàn GPU của Nvidia. Thay vì chỉ dùng "bếp H100 xịn xò," họ còn tận dụng cả H800 và H20. Dù chi phí khủng, DeepSeek vẫn ghi điểm nhờ công nghệ MLA, giúp tiết kiệm đến 93.3% công sức.

Tác động của DeepSeek R1 lên các cổ phiếu Big Tech Mỹ

Thị trường cho thấy sự độc quyền của các Big Tech Mỹ không còn đúng nữa. Các công ty như Nvidia sẽ bị ảnh hưởng đầu tiên, vì DeepSeek không cần đến chip mới nhất của Nvidia. Các công ty dự kiến sẽ kiếm nhiều tiền từ việc tính phí AI cũng sẽ bị ảnh hưởng. Các tham số tăng trưởng trong các mô hình định giá big tech sẽ phải điều chỉnh lại.

Vì sao các công ty Mỹ mở mã nguồn AI?

Có ý kiến cho rằng AI có thể phải là bí mật quốc phòng, nhưng điều này không dễ dàng vì AI không chỉ có Mỹ phát triển. Các nước châu Âu ủng hộ ý tưởng AI mở, và nếu Trung Quốc và các startup châu Âu hợp tác, Mỹ sẽ gặp khó khăn.

Kỹ sư đã nghỉ hưu của Microsoft giải thích về DeepSeek R1

DeepSeek R1 được coi là một cột mốc chấn động trong giới công nghệ, như "Khoảnh khắc Sputnik". Trước đây, nhiều người tin rằng cuộc đua AI nằm chắc trong tay các công ty lớn như OpenAI, nhưng DeepSeek R1 đã vượt qua những kỳ vọng cao nhất.

DeepSeek R1 hoạt động như thế nào?

DeepSeek R1 là một mô hình ngôn ngữ "distilled", được huấn luyện ở quy mô nhỏ hơn nhưng vẫn có thể trả lời câu hỏi, sinh văn bản và nắm bắt bối cảnh. DeepSeek đã sử dụng các mô hình AI lớn như GPT-4 hay Meta LLaMA làm "khung sườn" để tạo ra một thứ còn lớn hơn. Mô hình tập trung bắt chước đầu ra (output) của mô hình lớn trong nhiều dạng câu hỏi và tình huống. DeepSeek không chỉ dựa vào một mô hình lớn mà dùng nhiều AI khác nhau để tạo ra các góc nhìn đa dạng trong quá trình huấn luyện.

Vì sao DeepSeek R1 quan trọng?

  • Hạ thấp rào cản tiếp cận AI: Không cần cơ sở hạ tầng khổng lồ, có thể chạy trên các hệ thống nhỏ hơn.

  • Có thể chạy trên các thiết bị cá nhân: Phiên bản 32 tỉ tham số chạy tốt trên MacBook Pro, và các phiên bản nhỏ hơn có thể chạy trên Orin Nano.

Những điểm cần lưu ý về DeepSeek R1:

  • Dễ "ảo giác": Mô hình nhỏ có thể đưa ra những câu trả lời sai.

  • Khó bao quát kiến thức rộng: Không thể bao quát phạm vi kiến thức rộng như các mô hình lớn.

  • Phụ thuộc vào "người thầy": Chất lượng phụ thuộc vào dữ liệu huấn luyện từ các mô hình lớn.

  • Không cạnh tranh trực tiếp về khả năng tiên tiến: Tập trung vào chi phí và khả năng tiếp cận rộng rãi.

DeepSeek R1 mở đường cho một bối cảnh AI "dân chủ hóa" hơn, nơi công nghệ cao cấp không chỉ gói gọn trong tay một số ít đại gia.

Tác động lên AI Mỹ

DeepSeek R1 cho phép nhà phát triển trên toàn thế giới sáng tạo với chi phí thấp hơn, có thể làm giảm lợi thế cạnh tranh của các mô hình độc quyền. Các công ty Mỹ dựa vào doanh thu từ dịch vụ đăng ký hoặc cung cấp API sẽ phải đối mặt với áp lực cạnh tranh tăng lên. DeepSeek R1 làm "dân chủ hóa" quyền truy cập vào AI, có thể làm giảm nhu cầu đối với các mô hình phát triển tại Mỹ. Các công ty phụ thuộc vào việc bán giấy phép công nghệ AI có thể sẽ bị ảnh hưởng.

Có một giả thuyết cho rằng Trung Quốc có thể đang cố gắng gây biến động thị trường Mỹ bằng cách tỏ ra làm AI "rẻ như cho" trong khi thực chất đã được bơm tiền khủng.

Tóm lại: DeepSeek R1 là một mô hình AI nhỏ gọn nhưng mạnh mẽ, được xây dựng để đưa công nghệ AI đến gần hơn với nhiều người.

Thương chiến và tác động lên khu vực ASEAN

Cụ Trump sẽ áp thuế 25% lên Canada và Mexico, và 10% lên Trung Quốc. Điều này có thể có lợi cho ASEAN nói chung, và Việt Nam nói riêng.

Sản xuất đang chuyển dịch từ Trung Quốc sang Đông Nam Á, với Việt Nam, Thái Lan, Malaysia và Indonesia trở thành những điểm nút quan trọng trong chuỗi cung ứng toàn cầu. Chiến tranh thương mại Mỹ-Trung đóng vai trò quan trọng trong sự dịch chuyển này. Các công ty Trung Quốc đang đầu tư vào các cơ sở sản xuất ở Việt Nam, Mexico và các nơi khác để giảm tác động của thuế quan.

Các ngành như điện tử, ô tô, và pin lithium quang điện đang dẫn đầu sự dịch chuyển sang Đông Nam Á. Các ngành như dược phẩm, chất bán dẫn, thiết bị gia dụng và sản xuất thực phẩm đang chuyển dịch chậm hơn. Một số công ty quang điện đã chậm đầu tư vào Việt Nam, Thái Lan, Campuchia và Malaysia và đang chuyển sang Indonesia, Lào hoặc các nước Nam Á.

Mỹ có thể sẽ quay sang Trung Quốc và EU sau khi xử lý xong Canada và Mexico, trong khi năm nay ASEAN vẫn sẽ hưởng lợi.

Mở bát 2025 là một cuộc chiến không hồi kết, và ở trên đất nước hình chữ S. Việt Nam cần phải làm gì để sống sót? và Bạn sẽ làm gì để sinh tồn trong cuộc chiến đó?

Nguồn tham khảo : https://hoquoctuan.substack.com/p/oc-cham-01022025-giai-thich-ngan