Buy Wordpress, WHM , Plesk , SMTP , Cpanel
DeepSeek thách thức các ông lớn bằng AI giá rẻ

DeepSeek thách thức các ông lớn bằng AI giá rẻ

Ngày cập nhật: 18/02/2025 lúc 4:42:23

 

Ngày 20 tháng 1 năm 2025, công ty khởi nghiệp trí tuệ nhân tạo (AI) Trung Quốc DeepSeek đã ra mắt DeepSeek-R1, một mô hình suy luận với hiệu suất tương đương với mô hình o1 mới nhất của OpenAI. Sự ra mắt của mô hình này đã nhanh chóng thu hút sự chú ý lớn vì nó mang đến các khả năng tương tự với mức giá thấp hơn.

Ngay sau khi R1 được ra mắt, cổ phiếu của Nvidia đã giảm 17%, dẫn đến việc mất gần 600 tỷ đô la Mỹ vốn hóa thị trường , mức giảm trong một ngày lớn nhất trong lịch sử công ty. Các nhà phân tích cho rằng sự sụt giảm này phản ánh sự lo ngại về sự thay đổi trong thị trường AI, với DeepSeek nổi lên như một đối thủ tiềm tàng. Dù cổ phiếu của Nvidia đã phục hồi phần nào, sự phát triển của các công ty AI Trung Quốc đã thúc đẩy các cuộc thảo luận về sự cạnh tranh trong cơ sở hạ tầng AI và tính hiệu quả về chi phí.

Bên cạnh đó, DeepSeek cũng đối mặt với những đồn đoán về việc áp dụng phương pháp chưng cất mô hình, một kỹ thuật được sử dụng để chuyển kiến thức từ mô hình quy mô lớn đã được đào tạo trước sang mô hình nhỏ hơn. Một số dịch vụ hiện nay đã cấm việc sử dụng phương pháp này trong các điều khoản sử dụng đối với các mô hình ngôn ngữ lớn (LLM). Mặc dù vậy, phương pháp này vẫn được sử dụng phổ biến trong ngành vì nó giúp tạo ra các mô hình hiệu quả và tiết kiệm chi phí.

Trong một tuyên bố gửi qua email cho tờ New York Times, đại diện của OpenAI, Liz Bourgeois cho biết OpenAI đang xem xét khả năng DeepSeek lạm dụng các mô hình của mình. “Chúng tôi thực hiện các biện pháp đối phó chủ động và mạnh mẽ để bảo vệ công nghệ của mình và sẽ tiếp tục hợp tác chặt chẽ với chính phủ Mỹ để bảo vệ các mô hình mạnh mẽ nhất đang được phát triển tại đây” bà nói.

Giám đốc điều hành của OpenAI, Sam Altman trong khi đó đã hoan nghênh sự ra mắt của DeepSeek nói rằng “thật thú vị khi có một đối thủ mới”. Trong một bài đăng trên mạng xã hội, ông đã mô tả mô hình R1 của DeepSeek là “ấn tượng, đặc biệt là về những gì họ có thể cung cấp với mức giá đó”. Về khả năng kiện tụng Altman đã thông báo với các phóng viên tại Tokyo rằng họ “hiện không có kế hoạch kiện DeepSeek”.

Vào tháng 12 năm 2024, DeepSeek đã cung cấp các mô hình của mình cho phép sử dụng và sửa đổi miễn phí bao gồm DeepSeek-V3. Ngày 10 tháng 1 năm 2025 công ty đã phát hành một ứng dụng chatbot miễn phí sử dụng mô hình V3, nhanh chóng trở nên phổ biến và vươn lên đứng đầu bảng xếp hạng tải xuống của Apple và Google. Chỉ trong vài ngày, ứng dụng này đã vượt qua ChatGPT về số lượng tải xuống.

DeepSeek tuyên bố rằng LLM miễn phí mã nguồn mở này chỉ mất hai tháng và 5,6 triệu đô la Mỹ để phát triển, sử dụng khoảng 2.000 chip H800 từ Nvidia. Tuy nhiên, các nhà phân tích cho rằng chi phí thực tế có thể đã bị đánh giá thấp, vì nó có thể chưa tính đến các chi phí khác. Mặc dù vậy, họ lưu ý rằng con số này vẫn chỉ là một phần nhỏ so với hàng trăm triệu đến hàng tỷ đô la mà các công ty Mỹ như Google, Microsoft và OpenAI đã chi cho các mô hình của họ.

Một yếu tố quan trọng cho sự thành công của DeepSeek là việc sử dụng phương pháp hỗn hợp chuyên gia (MoE), cho phép DeepSeek chọn lọc kích hoạt các phân đoạn phù hợp nhất trong mạng nơron của mình cho mỗi truy vấn, từ đó tối ưu hóa hiệu suất và giảm chi phí tính toán. Ngược lại, ChatGPT nổi bật với khả năng giao tiếp rộng rãi và dễ dàng trên nhiều chủ đề khác nhau. Trong khi ChatGPT xuất sắc trong việc xử lý các truy vấn phức tạp và sắc thái, DeepSeek lại phản hồi nhanh hơn trong các nhiệm vụ kỹ thuật và chuyên biệt.

Liệu DeepSeek có thể duy trì được tốc độ tăng trưởng nhanh chóng của mình hay không vẫn chưa rõ, nhưng tác động đột phá của nó đã và đang định hình lại thị trường AI.

Nguồn http://asiaiplaw.com/

RELATED ARTICLES: