AI - Winco

Adobe hiện đang phải đối mặt với một vụ kiện tập thể liên quan tới cáo buộc sử dụng trái phép các tác phẩm có bản quyền để huấn luyện công cụ trí tuệ nhân tạo (AI) SlimLM.

Các công ty công nghệ AI toàn cầu hiện đang phải đối mặt với làn sóng kiện cáo lan rộng liên quan tới vấn đề bản quyền, quyền tác giả và tài sản trí tuệ.

Giống như hầu hết các công ty công nghệ khác hiện nay, Adobe đã đẩy mạnh ứng dụng trí tuệ nhân tạo trong vài năm trở lại đây. Kể từ năm 2023, hãng phần mềm này đã ra mắt nhiều dịch vụ AI khác nhau, trong đó có Firefly, bộ công cụ tạo nội dung đa phương tiện dựa trên AI.

Tuy nhiên, việc mạnh tay triển khai công nghệ này dường như đang khiến Adobe gặp rắc rối, khi một vụ kiện mới cáo buộc công ty đã sử dụng sách lậu để huấn luyện một trong các mô hình AI của mình.

Trong đơn kiện tập thể nộp lên tòa án liên bang bang California hôm 16/12 (giờ địa phương), bà Elizabeth Lyon, một tác giả đến từ bang Oregon, cho rằng Adobe đã sử dụng sai mục đích nhiều cuốn sách, bao gồm cả các tác phẩm của bà, để huấn luyện các mô hình AI SlimLM nhằm tạo ra phản hồi cho các yêu cầu của con người.

Adobe mô tả SlimLM là một mô hình ngôn ngữ nhỏ, có thể được “tối ưu hóa cho các tác vụ hỗ trợ tài liệu trên thiết bị di động”. Theo Adobe, SlimLM được tiền huấn luyện trên SlimPajama-627B, một bộ dữ liệu mã nguồn mở đa nguồn, đã được loại bỏ trùng lặp, do Cerebras phát hành vào tháng 6/2023.

Bà Lyon, tác giả của nhiều sách hướng dẫn viết phi hư cấu, cho biết một số tác phẩm của bà đã bị đưa vào bộ dữ liệu tiền huấn luyện mà Adobe sử dụng.

Theo Reuters, đơn kiện của tác giả Elizabeth Lyon ban đầu cho rằng các tác phẩm của bà đã xuất hiện trong một tập con đã qua xử lý của bộ dữ liệu bị thao túng, vốn là nền tảng cho chương trình của Adobe. Đơn kiện nêu rõ, bộ dữ liệu SlimPajama được tạo ra bằng cách sao chép và chỉnh sửa bộ dữ liệu RedPajama, bao gồm cả việc sao chép Books3. Vì là bản sao phái sinh của RedPajama, SlimPajama chứa bộ dữ liệu Books3, trong đó có các tác phẩm được bảo hộ bản quyền của nguyên đơn và các thành viên trong nhóm khởi kiện.

Books3 được biết đến là một bộ sưu tập khổng lồ gồm khoảng 191.000 cuốn sách được sử dụng để huấn luyện các hệ thống AI tạo sinh. Vốn dĩ, Books3 cũng đang vướng vào nhiều rắc rối pháp lý đối với các công ty công nghệ.

RedPajama cũng đã bị nhắc đến trong nhiều vụ kiện. Vào tháng 9, một vụ kiện nhằm vào Apple cáo buộc công ty này đã sử dụng tài liệu có bản quyền để huấn luyện mô hình Apple Intelligence. Đơn kiện đề cập đến bộ dữ liệu này và cho rằng Apple đã sao chép các tác phẩm được bảo hộ mà không có sự đồng ý, không ghi nhận tác giả và không bồi thường. Tháng 10, một vụ kiện tương tự nhắm vào Salesforce cũng cáo buộc công ty đã sử dụng RedPajama cho mục đích huấn luyện AI.

Vụ kiện này là diễn biến mới nhất trong làn sóng các vụ kiện quy mô lớn tại Mỹ do các chủ sở hữu bản quyền khởi xướng nhằm vào các công ty công nghệ liên quan đến việc huấn luyện AI, đồng thời cũng là vụ việc đầu tiên kiểu này nhắm vào Adobe.

Đại diện của Adobe chưa đưa ra phản hồi ngay lập tức trước yêu cầu bình luận về vụ kiện vào ngày thứ Tư. Phía bà Lyon và luật sư đại diện của bà cũng không phản hồi trước đề nghị bình luận.

Song song với sự bùng nổ của AI, các vụ kiện tương tự hiện nay cũng ngày càng trở nên phổ biến. Các thuật toán AI được huấn luyện trên những bộ dữ liệu khổng lồ và trong một số trường hợp, các bộ dữ liệu này bị cho là có chứa tài liệu sao chép trái phép.

Tháng 9 vừa qua, Anthropic đã đồng ý chi trả 1,5 tỷ USD cho một nhóm tác giả khởi kiện, những người cáo buộc công ty đã sử dụng các bản sao lậu tác phẩm của họ để huấn luyện chatbot Claude. Vụ việc này được xem là một bước ngoặt lớn trong chuỗi các cuộc chiến pháp lý xoay quanh vấn đề bản quyền trong dữ liệu huấn luyện AI, lĩnh vực vốn đang có rất nhiều tranh chấp.

Nguồn: sohuutritue.net.vn

Việt Nam đang đặt tham vọng bứt phá trong cuộc đua trí tuệ nhân tạo (AI) toàn cầu. Tuy nhiên, trong khi tiềm năng phát triển công nghệ là rất lớn, nền tảng pháp lý bảo vệ quyền tác giả và các quyền sở hữu trí tuệ (SHTT) khác vẫn còn khá mong manh.

Chính trong bối cảnh đó, các quy định mới liên quan đến việc sử dụng dữ liệu cho huấn luyện AI, theo đề xuất của Dự thảo Luật SHTT (sửa đổi) và dự thảo Luật AI đã thu hút được nhiều sự quan tâm.

‏Đáng chú ý, cả hai Dự thảo Luật đều đã hoặc đang đưa ra những cơ chế ngoại lệ hoặc miễn trừ trách nhiệm cho hành vi sao chép và sử dụng dữ liệu cho mục đích huấn luyện AI. Từ góc độ phát triển công nghệ, đây được coi là cách gỡ bỏ rào cản. Tuy nhiên, từ góc độ bảo vệ quyền SHTT, những quy phạm này có thể tạo ra xung đột nội tại, dẫn đến khoảng trống pháp lý và nguy cơ bị lạm dụng.

Ngoại lệ quá rộng khi cơ chế bảo hộ còn yếu‏

‏Theo quy định mới nhất tại khoản 5 Điều 7 Dự thảo Luật SHTT (sửa đổi) trình Quốc hội thông qua: “Tổ chức, cá nhân ‏‏được phép sử dụng‏‏ văn bản và dữ liệu đã được công bố hợp pháp và công chúng được phép tiếp cận, nhằm mục đích nghiên cứu, huấn luyện và phát triển hệ thống AI, ‏‏với điều kiện:‏‏ (i) không sao chép, phân phối, truyền đạt, công bố, làm tác phẩm phái sinh hoặc khai thác thương mại văn bản, dữ liệu gốc ‏‏và‏‏ (ii) không gây thiệt hại đến lợi ích hợp pháp của tác giả, chủ sở hữu theo quy định của Luật này và pháp luật khác có liên quan”.

‏Như vậy, Dự thảo đang đặt ra một ngoại lệ cho việc sử dụng đối tượng quyền SHTT. Tuy nhiên ngoại lệ này lại không nằm trong quy định hiện hành về các trường hợp sử dụng hợp lý, được quy định tại Điều 25 và 26. Khi được đề xuất thêm vào Điều 7 quy định về giới hạn quyền SHTT, ngoại lệ huấn luyện AI đang trở thành “ngoại lệ nguyên tắc”, cung cấp một cơ chế “siêu miễn trừ”. Quy định này dường như không phù hợp với với Công ước Berne, dễ đẩy Việt Nam vào tình huống bị khiếu nại vì không tuân thủ điều ước quốc tế.‏

‏Theo quy định hiện nay, miễn là chủ thể đáp ứng được điều kiện, họ có thể sử dụng mọi dạng dữ liệu, để nghiên cứu, huấn luyện và phát triển hệ thống AI. Trong khi đó ý chí của tác giả và chủ sở hữu quyền bị loại trừ hoàn toàn. Khi hầu hết các mô hình AI không cần tái tạo hoàn toàn dữ liệu gốc để cạnh tranh, tác giả có thể sẽ phải đối mặt với nguy cơ bị thay thế nhưng không có căn cứ để đấu tranh bảo vệ lợi ích chính đáng của mình.‏

‏Đối với điều kiện phát sinh trường hợp ngoại lệ, mâu thuẫn phát sinh khi điều luật cho phép sử dụng nhưng cấm “sao chép, phân phối, công bố, làm tác phẩm phái sinh hoặc khai thác thương mại văn bản, dữ liệu gốc”. Trên thực tế, việc huấn luyện mô hình chính là sao chép dữ liệu (token hóa, tạo cookies, cache, nhúng, lập chỉ mục). Khi pháp luật không có hướng dẫn rõ ràng, tranh luận khi soi chiếu các hoạt động này trong phạm vi “sao chép” theo quy định tại khoản 10 Điều 4 Luật SHTT hiện hành sẽ xảy ra. Cho đến khi “sao chép” được tái định nghĩa , quy định mới sẽ mở cánh cửa để các nhà phát triển AI khai thác miễn phí quyền SHTT của người Việt. ‏

‏Đối với yêu cầu không gây thiệt hại đến lợi ích hợp pháp của tác giả, chủ sở hữu quyền SHTT, quy định lại đặt ra câu hỏi về thẩm quyền, tiêu chí đánh giá, thủ tục giám định, nghĩa vụ chứng minh… Ví dụ, khi AI không tiết lộ nguồn dữ liệu đã học, tác giả không thể chứng minh thiệt hại. Rất có thể điều luật sẽ được hướng dẫn thêm. Tuy nhiên cho đến khi có văn bản cụ thể, đây vẫn là một quy định quá mơ hồ và rủi ro cho các bên liên quan.‏

‏Do cơ chế bảo hộ – thực thi quyền SHTT ở Việt Nam hiện nay còn nhiều bất cập, việc mở ngoại lệ như Dự thảo đang làm có nguy cơ tạo khoảng trống pháp lý lớn. Trong bối cảnh chưa có tòa chuyên trách về SHTT và các tranh chấp vẫn thường được giải quyết thông qua cơ chế hành chính hơn là tố tụng, ngoại lệ huấn luyện AI trong Dự thảo Luật SHTT đang tạo ra nhiều rủi ro nhiều hơn lợi ích. Bởi lẽ, hướng quy định hiện hành dường như chỉ tạo “lối thoát” cho các nhà phát triển AI muốn khai thác dữ liệu mà không chịu ràng buộc trách nhiệm chứ không tạo ra thêm giá trị nào khác.‏

‏Dự thảo Luật AI – Đã tháo gỡ nguy cơ xung đột nhưng vẫn còn khoảng trống pháp lý‏

‏Trước đây, theo quy định tại điểm c Khoản 2 Điều 19 dự thảo Luật AI lần thứ nhất ngày 29/9/2025: “Việc ‏‏sao chép, trích xuất‏‏ các tác phẩm, cơ sở dữ liệu đã được tiếp cận một cách hợp pháp nhằm ‏‏mục đích duy nhất là huấn luyện AI không được xem là hành vi xâm phạm quyền tác giả và quyền liên quan‏‏, trừ khi Luật SHTT có quy định khác”.

Theo đó, điều luật này cũng cung cấp ‏‏hai điều kiện ‏‏để được miễn trừ trách nhiệm, bao gồm: (i) Áp dụng các biện pháp kỹ thuật phù hợp để bảo đảm an ninh và ngăn chặn việc tái sử dụng dữ liệu cho mục đích khác ‏‏và‏‏ (ii) Tôn trọng quyền của chủ sở hữu trong việc từ chối không cho phép sử dụng tác phẩm của mình cho mục đích huấn luyện AI thông qua các tín hiệu máy có thể đọc được. ‏

‏Như vậy, ở Dự thảo cũ, việc cung cấp một cơ chế an toàn (safe harbor) cho các nhà cung cấp mô hình AI. Ngược lại với quy định của khoản 5 Điều 7 Dự thảo Luật SHTT cấm sao chép, Điều 19 này quy định việc sao chép/trích xuất cho mục huấn luyện AI không cấu thành xâm phạm nếu nhà cung cấp đáp ứng điều kiện. Dù điều luật đã đưa ra quy định “trừ khi Luật SHTT có quy định khác”. Theo Khoản 3 Điều 6 bản dự thảo này: “Trường hợp có sự khác nhau giữa quy định của Luật này với luật khác về cùng một vấn đề liên quan đến AI, áp dụng quy định của Luật này”‏

‏Về mặt kỹ thuật, việc xuất hiện một điều khoản phi-xâm-phạm quyền tác giả và quyền liên quan trong một đạo luật không phải luật SHTT là điều chưa từng có tiền lệ. Điều khoản ưu tiên áp dụng cũng khiến ngoại lệ AI gần như đương nhiên được chấp nhận. Hệ quả là (i) Trật tự hệ thống pháp luật bị xáo trộn, (ii) Cơ chế bảo vệ quyền SHTT bị đẩy ra ngoài rìa, và (iii) Luật AI vô hình trung can thiệp vào phạm vi điều chỉnh vốn thuộc Luật SHTT, tạo ra hiệu ứng tương tự như một luật bản quyền thứ hai đối với dữ liệu.‏

‏Riêng đối với điều kiện để đạt được ngoại lệ, việc sử dụng các thuật ngữ như ‏‏“biện pháp kỹ thuật phù hợp”‏‏, ‏‏“tín hiệu máy có thể đọc được” ‏‏tiếp tục tạo ra các quy phạm mơ hồ và phụ thuộc nhiều vào hướng dẫn/tiêu chuẩn chi tiết về sau. Khi không có các tiêu chuẩn thống nhất, thẩm quyền đánh giá, thẩm định, điều luật tiếp tục xa rời thực tiễn và đặt các chủ thể liên quan vào tình huống tiến thoái lưỡn nan.‏‏ ‏

Đến Dự thảo số 2 ngày 22/11/2025 trình Quốc hội, các quy định ngoại lệ này đã được lược bỏ. Tuy nhiên, khoản 2 Điều 36 vẫn giữ quy tắc ưu tiên áp dụng trong trường hợp xảy ra mâu thuẫn về cùng một vấn đề, dẫn đến nguy cơ các cơ chế bảo hộ của Luật SHTT rơi vào tình huống bị vô hiệu. Đồng thời, các nghĩa vụ kỹ thuật như minh bạch, gắn nhãn, giải trình (Điều 9) và nghĩa vụ của nhà cung cấp và bên triển khai hệ thống trí tuệ nhân tạo có rủi ro cao (Điều 13) vẫn không được thiết kế để điều chỉnh hoạt động huấn luyện mô hình. Trong giai đoạn thu thập và sử dụng dữ liệu, gần như không có ràng buộc pháp lý nào để bảo vệ chủ thể quyền SHTT. ‏

Cân bằng giữa khuyến khích phát triển và phòng ngừa rủi ro‏

‏Thời gian qua, sự quan tâm đối với khoản 5 Điều 7 dự thảo sửa đổi Luật SHTT đã tạo được làn sóng dư luận không nhỏ. Tuy nhiên, khi kết hợp với các quy định về SHTT tại dự thảo Luật AI, bức tranh có lẽ sẽ còn ảm đạm hơn. ‏

‏Mặc dù cả hai Dự thảo đều nhằm mục tiêu tạo điều kiện phát triển AI, tiếp sức cho Việt Nam tiếp tục “vươn mình”, ngoại lệ được luật SHTT đề xuất cho huấn luyện AI đang quá rộng. Điều này vô hình trung đẩy AI phát triển theo hướng hấp thụ dữ liệu nhưng không hoàn trả giá trị. Khi Luật SHTT đã mở cửa nhưng không kèm nghĩa vụ và Luật AI bỏ qua hoạt động huấn luyện AI, thị trường AI Việt Nam sẽ phát triển theo hướng khai thác nội dung thay vì đổi mới sáng tạo‏

‏Một mặt, các quy định này đẩy Việt Nam trở thành “mỏ dữ liệu” (data mine) cho các nhà phát triển AI nước ngoài. Trong khi đó dữ liệu nước ngoài lại thường bị khóa bởi hợp đồng, khiến mô hình Việt Nam không thể thu thập. Lâu dần, các nhà phát triển AI nội địa sẽ dần bị đào thải khỏi thị trường. Mặt khác, khi người sáng tạo bị cạnh tranh bởi chính nội dung của họ, động lực sáng tạo sẽ không còn. Người dùng thì sẽ dần quen với nội dung mô phỏng được tạo bởi AI, chất lượng thấp nhưng giá rẻ. Đây là điểm khởi đầu cho các xói mòn sâu hơn trong hệ sinh thái sáng tạo, mất cân bằng dữ liệu, và mất chủ quyền văn hóa – công nghệ trong kỷ nguyên AI tổng quát.‏

‏Đối diện với các thách thức đặt ra khi xem xét vấn đề bảo hộ quyền SHTT trong kỷ nguyên AI và tham vọng của quốc gia trong cuộc đua AI toàn cầu, đã đến lúc cần chuyển trọng tâm sang tìm kiếm điểm cân bằng giữa khuyến khích phát triển và phòng ngừa rủi ro, giữa đổi mới và an toàn.‏

‏Theo đó, khuyến khích phát triển AI không có nghĩa là phải hy sinh quyền SHTT. Điều quan trọng là người làm luật phải hiểu được cơ chế hoạt động của các mô hình AI và mục tiêu của bảo hộ quyền SHTT. Về mặt nguyên tắc, các quy định của Luật SHTT cần được ưu tiên áp dụng trong trường hợp xảy ra xung đột pháp luật. Điều này rất quan trọng vì Luật SHTT mới là luật chuyên ngành trực tiếp điều chỉnh các vấn đề liên quan đến quyền SHTT. ‏

‏Soi chiếu ở thị trường Việt Nam, có lẽ chúng ta chưa đủ điều kiện để đưa ngoại lệ huấn luyện AI vào Luật SHTT. Khoản 5 nên được lược bỏ khỏi quy định tại Điều 7. Trong trường hợp muốn giữ ngoại lệ về huấn luyện AI, có thể cân nhắc chuyển nội dung này xuống các Điều 25 và 26 nhưng phải tham khảo mô hình các nước để quy định với phạm vi hẹp hơn, cụ thể hơn, như chỉ áp dụng cho nghiên cứu phát triển mô hình AI thử nghiệm và cam kết phi thương mại… Phải cực kỳ cẩn thận để tránh vi phạm điều ước quốc tế về SHTT.‏

‏Tương tự, đối với Luật AI, mặc dù Dự thảo mới nhất đã xử lý được nguy cơ xung đột trực tiếp với Luật SHTT, nhưng không đưa ra bất kỳ cơ chế thực chất nào để bảo đảm quyền SHTT trong bối cảnh huấn luyện AI. Vẫn còn một khoảng trống lập pháp rất lớn, đặc biệt liên quan đến minh bạch dữ liệu, công cụ quản trị quyền, trách nhiệm đối với sản phẩm AI và tiêu chuẩn lưu giữ nguồn dữ liệu. Chỉ khi hai đạo luật được thiết kế theo hướng bảo đảm quyền SHTT trước, thúc đẩy AI sau, Việt Nam mới đạt được cân bằng giữa phát triển và bảo vệ hệ sinh thái sáng tạo. ‏

‏Riêng đối với mục tiêu kép trong phát triển AI, cần làm rõ rằng việc khai thác dữ liệu trong vận hành mô hình AI là điều không thể tránh khỏi. Nói cách khác, nguy cơ không đến từ việc luật SHTT cho phép AI sử dụng dữ liệu mà đến từ việc tạo ra quy định mở quá rộng nhưng không đi kèm công cụ bảo vệ thực chất. Việc đặt quyền SHTT làm nền tảng không làm chậm đổi mới. Ngược lại, đây là điều kiện tiên quyết để Việt Nam phát triển AI bền vững và có chủ quyền.‏

‏Đáng lưu ý, khi thị trường SHTT còn phân mảnh, Việt Nam vẫn đang thiếu các tổ chức đại diện tập thể đủ năng lực để thương lượng và quản lý dữ liệu ở quy mô lớn. Chúng ta cũng cũng chưa có hạ tầng kỹ thuật để truy vết, đo lường hay định lượng mức độ sử dụng tác phẩm trong quá trình huấn luyện, một hoạt động vốn mang tính “hộp đen”.

Khi chưa có cơ chế định giá và biểu giá thống nhất, việc cấp phép đòi hỏi sự tham gia của các chuyên gia, làm tăng chi phí giao dịch. Quan trọng hơn, ngay cả khi đã cấp phép, tác giả và chủ sở hữu quyền vẫn không thể kiểm soát hoặc đánh giá tác động của việc mô phỏng phong cách và khai thác giá trị từ tác phẩm của họ. Do đó, chỉ dựa vào cơ chế cấp phép (licensing) trong luật SHTT có lẽ không khả thi.‏

‏Một hướng tiếp cận cân bằng, kết hợp giải pháp kỹ thuật, pháp lý và kinh tế sẽ có lợi hơn. Cụ thể, các cơ chế nên được bổ sung vào Luật AI bao gồm: (i) Kiểm soát bằng biện pháp kỹ thuật như ban hành tiêu chuẩn tín hiệu từ chối sử dụng dữ liệu; (i) Yêu cầu các mô hình minh bạch nguồn dữ liệu, lịch sử thu thập dữ liệu.., trong huấn luyện AI và (iii) Xây dựng cơ chế bồi hoàn tập thể thông qua việc thu phí từ mô hình AI thương mại và phân bổ lại cho cộng đồng sáng tạo. Những quy định này không những khả thi, mà còn giúp hướng dẫn các mô hình AI hoạt động hiệu quả, tuân thủ tại Việt Nam.‏

‏Mặc dù có ý kiến lo ngại rằng, việc đặt ra nghĩa vụ tuân thủ nghiêm ngặt có thể kìm hãm đổi mới sáng tạo, các nghiên cứu học thuật và bằng chứng thực nghiệm cho thấy các thị trường công nghệ mới nổi thường phản ứng theo cùng một quy luật. Khi khung pháp lý rõ ràng và ổn định, niềm tin của thị trường được củng cố thay vì bị suy giảm. Điều này gợi mở một bài học quan trọng cho bối cảnh AI. ‏

‏Đối với Việt Nam, việc thu hút và phát triển một hệ sinh thái AI bền vững không phụ thuộc vào việc nới lỏng tối đa nghĩa vụ, mà ở khả năng xây dựng một môi trường nơi các doanh nghiệp minh bạch, tuân thủ và có trách nhiệm được khuyến khích phát triển. Để bứt phá trong cuộc đua toàn cầu, Việt Nam không cần mạo hiểm với những thí nghiệm pháp lý quá táo bạo vốn tiềm ẩn rủi ro hệ thống. Điều cần thiết hơn là một khuôn khổ pháp luật ổn định, có thể dự đoán và bảo đảm an toàn cho tất cả chủ thể liên quan.

Nguyễn Ngọc Phương Hồng‏

Trường Đại học Kinh tế – Luật, Đại học Quốc gia TP Hồ Chí Minh

Ngày 20-1-2025, công ty khởi nghiệp về trí tuệ nhân tạo (Artificial Intelligence – AI) DeepSeek của Trung Quốc đã cho ra mắt mô hình AI mới mang tên R1 và ngay lập tức làm chao đảo cả thế giới và thị trường chứng khoán công nghệ. Câu chuyện của DeepSeek không chỉ dừng lại trong lĩnh vực công nghệ mà còn gợi mở nhiều điều liên quan đến quản lý kinh doanh, sử dụng tài sản trí tuệ và chính sách.

Khác biệt công nghệ

Điểm khác biệt đầu tiên trong cách DeepSeek tiếp cận công nghệ phải kể đến phương pháp công ty này áp dụng với các mô hình ngôn ngữ lớn (Large Language Models – LLMs). Có thể hiểu LLM là một loại AI được huấn luyện trên khối lượng dữ liệu văn bản khổng lồ, giúp nó có thể hiểu, tạo và xử lý ngôn ngữ tự nhiên như con người. Chính phủ Mỹ từ vài năm nay đã áp dụng các quy định hạn chế nguồn cung cấp chip AI hiệu suất cao cho các công ty Trung Quốc. Vì vậy, hầu hết các LLM của Trung Quốc đều dựa vào việc huấn luyện phân tán trên nhiều GPU (bộ xử lý chuyên dụng giúp tăng tốc các tác vụ tính toán phức tạp trong AI) yếu hơn. Tuy nhiên, nhờ tối ưu kiến trúc, chúng vẫn đạt được hiệu suất cạnh tranh, dù chưa thể sánh ngang với công nghệ tiên phong.

DeepSeek ứng dụng kiến trúc Multi – Head Latent Attention (MLA) – cơ chế phân bổ trọng số linh hoạt giúp tối ưu bộ nhớ và Mixture of Experts (MOE) – mô hình kết hợp nhiều chuyên gia xử lý chuyên biệt, từ đó cải thiện hiệu suất tính toán. Vì thế DeepSeek giảm được mức sử dụng bộ nhớ và cho phép tận dụng tài nguyên một cách hiệu quả hơn. Sử dụng phương pháp đào tạo trên các GPU hiệu suất thấp thay vì các cụm Nvidia tiên tiến – điều đòi hỏi nguồn vốn đầu tư khổng lồ – cũng giúp DeepSeek giảm thiểu được chi phí xây dựng và vận hành.

Ngoài ra, việc áp dụng các mã nguồn mở cũng đóng vai trò quan trọng trong sự phát triển các mô hình LLM của DeepSeek. Mô hình của DeepSeek được phát hành theo giấy phép sử dụng mã nguồn mở (open – source license) của Học viện Công nghệ Massachusetts – MIT (Mỹ).

Lợi thế của kiến trúc hiệu quả và cách tiếp cận mã nguồn mở thể hiện rõ nhất khi so sánh chi phí huấn luyện mô hình: DeepSeek công bố chỉ tốn khoảng 5,6 triệu đô la Mỹ cho mô hình R1, trong khi các công ty Mỹ như OpenAI và Alphabet được cho là phải bỏ ra từ 40-200 triệu đô la để xây dựng các mô hình LLM.

Các chỉ số đánh giá mức độ hiệu quả của LLM còn cho thấy DeepSeek có khả năng tư duy và đưa ra đáp số nhanh, có độ chính xác cao trong lập trình. Ngoài ra, mô hình này còn thể hiện sự vượt trội ở khả năng giải toán và đưa ra câu trả lời cho câu hỏi liên quan đến Trung Quốc (ngoại trừ một số câu hỏi nhạy cảm về mặt chính trị) được cho là chính xác hơn nhiều mô hình tiên phong như GPT-4o của OpenAI hay Claude-3.5 của Anthropic.

Sáng tạo đột phá

Từ những khác biệt trong cách tiếp cận công nghệ và các mô hình LLM, không khó hiểu khi DeepSeek đã gây bất ngờ cho các công ty AI tên tuổi của Mỹ. Tuy nhiên, nếu quan sát dưới góc nhìn của lý thuyết quản trị, cụ thể là lý thuyết “đổi mới đột phá” (disruptive innovation) được khởi xướng bởi Giáo sư Clayton Christensen của trường Kinh doanh Harvard vào năm 1995, sự xuất hiện của DeepSeek là có thể dự báo được.

Có thể thấy AI sẽ không dừng lại ở đây và có thể năm 2025 sẽ chứng kiến nhiều “khoảnh khắc DeepSeek” hơn nữa, báo hiệu một sự chuyển dịch mạnh mẽ trong nền kinh tế và công nghệ toàn cầu.

Theo lý thuyết này, đổi mới đột phá là quá trình một công ty nhỏ với nguồn lực ít hơn từng bước thành công trong việc thách thức các công ty lớn đã thành danh. Cụ thể, khi những công ty lớn tập trung nguồn lực để cải thiện sản phẩm và dịch vụ của mình nhằm phục vụ cho những phân khúc khách hàng khó tính nhất (thường là khách hàng mang lại lợi nhuận cao nhất), họ sẽ bỏ qua nhu cầu của những phân khúc khách hàng khác.

Khi đó, những công ty nhỏ mới thành lập, sẽ tạo được “đột phá” khi nhắm vào việc phục vụ những phân khúc khách hàng bị bỏ qua đó. Các công ty này cung cấp các giải pháp thay thế với chi phí thấp, từng bước cải thiện chất lượng và cuối cùng chiếm lĩnh thị phần của các công ty kia.

Đây có thể là hướng đi mà DeepSeek đã lựa chọn. Vị thế của DeepSeek đã phần nào được khẳng định khi công ty này có thể cạnh tranh với các tập đoàn công nghệ hàng đầu tại Mỹ, bất chấp mức chi phí vận hành và đầu tư ban đầu thấp hơn rất nhiều.

Cũng theo lý thuyết này thì mô hình AI của DeepSeek vẫn chưa phải là cuối cùng. Có thể trong khoảng thời gian ngắn như vài tháng tới, sẽ xuất hiện những đối thủ mới cạnh tranh trực tiếp với DeepSeek hay sẽ xuất hiện các công ty AI sáng tạo trên mô hình ngôn ngữ nhỏ (Small Language Models – SLM) cạnh tranh trực tiếp với các công ty khai thác mô hình LLM. Và đây cũng không phải là điều bất ngờ trong sự phát triển mạnh mẽ của các công nghệ AI hiện nay.

Quản lý tài sản trí tuệ theo mô hình sáng tạo mở

Để phát triển các mô hình LLM đủ sức thách thức các ông lớn AI trên thế giới, DeepSeek đã vận dụng mô hình “sáng tạo mở” (open innovation). Sáng tạo mở là lý thuyết do Giáo sư Henry Chesbrough, Đại học California, Berkeley đề xuất lần đầu tiên vào năm 2003. Theo đó, khi các công ty tìm cách phát triển công nghệ, họ có thể và nên sử dụng cả ý tưởng nội bộ và ý tưởng bên ngoài.

Liang Wenfeng (Lương Văn Phong), ông chủ của DeepSeek, là người sáng lập và điều hành quỹ đầu cơ High-Flyer. Tại đây, ông gây dựng tài sản bằng cách sử dụng AI và thuật toán để nhận diện các mô hình có thể tác động đến giá cổ phiếu. Đội ngũ của ông từ lâu đã thành thạo trong việc sử dụng chip Nvidia để kiếm lợi nhuận từ giao dịch chứng khoán. Năm 2023, khi thành lập DeepSeek, vị thuyền trưởng này đưa những người giỏi nhất từ quỹ đầu cơ – là những người thực sự hiểu rõ cách các con chip hoạt động, sang công ty mới. Khi Mỹ cấm Nvidia xuất khẩu các con chip mạnh nhất sang Trung Quốc, DeepSeek buộc phải tìm cách sáng tạo để tối ưu hóa sức mạnh tính toán của số lượng chip nội địa có hạn.

Đây là vấn đề mà đội ngũ của DeepSeek vốn đã biết cách giải quyết: họ đã có thể khai thác tối đa tiềm năng của những GPU kém tiên tiến hơn. Ông chủ DeepSeek định hình DeepSeek là một công ty thuần nội địa, khi tuyển dụng nhân sự từ những trường đại học hàng đầu Trung Quốc thay vì các chuyên gia từ Mỹ hay châu Âu. Chính sự kết hợp bài bản giữa ý tưởng của đội ngũ nhân sự bản địa cùng với nguồn lực bên ngoài như chip Nvidia và mã nguồn mở của MIT đã góp phần tạo nên thành công của DeepSeek.

Ở hướng ngược lại, DeepSeek cũng tham gia gây dựng hệ sinh thái mã nguồn mở. Giống như Alibaba, DeepSeek đi theo hướng của Meta – công ty mẹ của Facebook: cung cấp ứng dụng theo phương pháp cấp phép mã nguồn mở. Chính sách này cũng thúc đẩy yếu tố minh bạch thông tin: khi ra mắt mô hình mới, DeepSeek đã công bố kèm theo một tài liệu giải thích chi tiết cách thức xây dựng một LLM với ngân sách hạn chế, có thể tự động học hỏi và cải thiện mà không cần sự giám sát của con người.

Góc nhìn chính sách

Từ lâu, Trung Quốc đã theo đuổi chiến lược đổi mới sáng tạo dựa cả trên việc tiếp thu nguồn công nghệ nước ngoài lẫn sáng tạo bản địa. Phát huy sức mạnh nội lực được cho là chính sách ưu tiên trong bối cảnh Mỹ liên tiếp có các động thái hạn chế nguồn cung thiết bị bán dẫn cho Trung Quốc và được cho là với mục đích kìm hãm năng lực công nghệ của Trung Quốc nói chung và trong lĩnh vực AI nói riêng.

Tuy nhiên, việc Mỹ siết chặt các hạn chế đối với công nghệ AI và thiết bị bán dẫn dường như đã tạo động lực để các doanh nghiệp Trung Quốc sáng tạo hơn. Các công ty Trung Quốc tìm cách tối ưu hóa thuật toán thay vì phụ thuộc vào phần cứng. DeepSeek đã huấn luyện thành công mô hình chỉ với số lượng chip Nvidia chuyên dụng thấp hơn rất nhiều so với số lượng chip tối tân mà các công ty Mỹ cần để huấn luyện các mô hình của mình.

Có vẻ DeepSeek đang góp phần thể hiện sức mạnh nội tại của các công ty công nghệ Trung Quốc và nỗ lực trở thành niềm tự hào về mặt công nghệ của Trung Quốc trên phạm vi toàn cầu – với số lượng còn khiêm tốn mà thành công nhất là Huawei.

DeepSeek, dù xuất hiện như một hiện tượng, vẫn không phải là bước ngoặt thay đổi tất cả. Đây chỉ là dấu hiệu cho thấy AI đang tiến đến giai đoạn mới – từ nhận diện sang tư duy và giải quyết vấn đề. Sự cạnh tranh giữa hướng tiếp cận mã nguồn mở (như DeepSeek đang triển khai) và mô hình độc quyền (mà một số tập đoàn AI của Mỹ với sự bảo trợ của các nhà đầu tư đang áp dụng) sẽ tiếp tục thúc đẩy sáng tạo, giảm chi phí thiết kế và do đó hứa hẹn sẽ mở ra nhiều ứng dụng thực tiễn hơn. Có thể thấy AI sẽ không dừng lại ở đây và có thể năm 2025 sẽ chứng kiến nhiều “khoảnh khắc DeepSeek” hơn nữa, báo hiệu một sự chuyển dịch mạnh mẽ trong nền kinh tế và công nghệ toàn cầu.

(*) Trường Quản trị và Kinh doanh, Đại học Quốc gia Hà Nội
(**) Edtech Agency
(***) VNPT Technology

Thách thức, Triển Vọng Mới và Hành Trình Hợp Tác Sáng Tạo

Sau khi chúng ta cùng nhau khám phá sự bùng nổ của trí tuệ nhân tạo (AI) và những bước tiến vượt bậc của nó trong bài viết trước, giờ đây chúng ta sẽ cùng nhìn nhận một khía cạnh hết sức thiết thực nhưng cũng đầy phức tạp: quyền sở hữu trí tuệ trong thời đại của AI.

Trước hết chúng tôi sẽ dùng AI Copilot của Microsoft để tóm tắt bài 1 qua 1 bài thơ.

Dưới đây là một bài thơ dựa trên nội dung của Bài 1, tôn vinh sự bùng nổ và tiềm năng của trí tuệ nhân tạo để cho thấy tiềm năng của một AI:

Xem lại bài 1

Kỷ Nguyên Mới – Ánh Sáng AI

Trong kỷ nguyên mới, ánh sáng AI,

Đưa bước nhân gian, mộng lớn mở dài.

Cảm hứng người hòa, máy trí thông minh,

Sáng tạo bừng nở, rực rỡ hành trình.

Thách thức chẳng ngại, vượt mọi đường xa,

Công nghệ hòa chung, lòng chẳng hề nhòa.

Tương lai ta viết, cùng giấc mơ xanh,

AI kết nhân loại, tay nắm trời lành.

Hết bài thơ.

Bạn nghĩ sao về bài thơ do AI sáng tạo tuy nhiên nó không được vần điệu cho lắm và đó là yếu điểm của AI: sự thiếu cảm xúc chân thực và tư duy dựa trên logic ngôn ngữ. Nhưng nó lại rất đầy đủ ý và ngôn từ tóm tắt cho cả 1 bài viết dài.

Và chúng ta tới nội dung bài viết số 2: Bảo vệ quyền Sở hữu trí tuệ trong kỷ nguyên AI.

Trong một thế giới mà những tác phẩm sáng tạo không chỉ đến từ cảm hứng của con người mà còn được “hợp tác” cùng các hệ thống AI, định nghĩa truyền thống về sáng tạo và tác giả đang phải đối mặt với những thách thức lớn. Tuy nhiên, thay vì đắm chìm trong lo lắng, chúng ta hãy cùng nhìn nhận đây như một cơ hội để tái cấu trúc, mở rộng và làm giàu thêm giá trị của ngành sáng tạo.

1. Bản Chất Mới của Sáng Tạo: Khi Con Người Gặp Gỡ AI

AI không chỉ là trợ thủ đắc lực mà còn là đối tác sáng tạo.

Tác phẩm lai: Trong những giây phút “hội ngộ” giữa cảm xúc con người và sự chính xác của AI, các tác phẩm mới có thể ra đời với chất lượng và tính sáng tạo vượt xa truyền thống. Bài thơ trên chính là thể hiện yếu tố lai giữa con người và AI khi tôi cố gắng sửa lại câu từ của nó cho gọt rũa.
Vấn đề tác giả: Khi hệ thống AI có khả năng tự động hoàn thiện bài viết, âm nhạc, hay thiết kế, câu hỏi “Ai là tác giả?” sẽ không chỉ đơn thuần là tranh cãi pháp lý, mà sẽ mở ra góc nhìn mới về sự chung tay hợp tác.

Trong thập kỷ qua, AI đã tiến xa đến mức:

Tự động hóa quy trình sáng tạo: Các hệ thống AI hiện nay có thể tạo ra bài thơ, âm nhạc, hình ảnh và cả phim hoạt hình chỉ sau vài phút. Sự xuất hiện của những sản phẩm “lai” – kết hợp giữa cảm hứng con người và sức mạnh tính toán của máy móc – đã mở ra một thời kỳ mới, nơi mà ranh giới giữa tác giả con người và trí tuệ nhân tạo trở nên mờ nhạt.
Gia tăng tốc độ đổi mới sáng tạo: Những đột phá công nghệ như ChatGPT, DALL·E hay các công cụ sáng tạo khác đang thay đổi cách thức sản xuất nội dung, giúp người dùng tiết kiệm thời gian và vượt qua giới hạn của khả năng sáng tạo cá nhân.
Thách thức khái niệm truyền thống: Các mô hình AI có khả năng “học tập” từ dữ liệu khổng lồ trên internet, từ đó tạo ra sản phẩm mới dựa trên những tác phẩm đã tồn tại. Điều này khiến câu hỏi về bản quyền, quyền tác giả và nguồn gốc sáng tạo trở nên phức tạp hơn rất nhiều.

2. Hệ Thống Pháp Lý Linh Hoạt – Bước Đệm Cho Thời Đại Số

Để bảo vệ quyền sở hữu trí tuệ trong bối cảnh tốc độ phát triển của AI, hệ thống pháp lý phải:

Thích ứng nhanh chóng: Điều chỉnh, cập nhật các quy định để không chỉ bảo vệ các nhà sáng tạo truyền thống mà còn thúc đẩy đổi mới từ các nền tảng công nghệ. Nhưng cũng phải rõ ràng trong quy định, ví dụ một bài thơ dù do AI tạo ra nhưng người yêu cầu và cho ý tưởng của bài thơ vẫn là người sáng tạo gốc, tức là chủ thể sở hữu quyền tác giả. Một bài viết phải sửa đi sửa lại đến khi hoàn thiện dù nó có sự tham gia của AI nhưng chính tác giả bài viết mới là người có sự sáng tạo chính khi sửa lại và hoàn thiện bài viết, bài thơ, luận giải…
Xác định vai trò: Phân định vai trò của các “nhà sáng tạo” – người lập trình, người điều hành, và thậm chí là dữ liệu đầu vào từ cộng đồng – nhằm xây dựng một khung pháp lý toàn diện, công bằng.

Thách Thức Pháp Lý Trong Kỷ Nguyên AI

Khi AI dần trở thành công cụ sáng tạo chủ đạo, các hệ thống pháp lý đang gặp không ít khó khăn trong việc điều chỉnh các quy định về quyền sở hữu trí tuệ. Một số thách thức nổi bật bao gồm:

Xác định chủ quyền sáng tạo: Khi một tác phẩm được tạo ra bởi sự kết hợp giữa con người và AI, việc xác định “tác giả” thực sự của sản phẩm đó là một vấn đề nan giải. Các nước và tổ chức quốc tế đang phải xem xét việc cập nhật định nghĩa pháp lý để phản ánh đúng thực tế của kỷ nguyên số.
Bảo vệ sản phẩm lấy cảm hứng từ dữ liệu hiện có: AI “học” từ hàng tỷ dữ liệu có sẵn trên internet để tạo ra nội dung mới. Điều này đặt ra thách thức trong việc xác định liệu sản phẩm của AI có vi phạm bản quyền của các tác phẩm gốc hay không. Trường hợp tranh chấp có thể trở nên phức tạp khi bằng chứng về “nguồn cảm hứng” bị mất mát trong quãng thời gian dài dữ liệu số.
Đảm bảo công bằng cho nhà sáng tạo: Người sáng tạo truyền thống có thể cảm thấy bất lợi khi so sánh với sức mạnh tổng hợp và tốc độ của các hệ thống AI. Việc xây dựng khung pháp lý phải đảm bảo rằng quyền lợi của những người lao động sáng tạo, những người đã đầu tư công sức và tài năng của mình, được bảo vệ tương xứng trong mọi tình huống.

3. Hợp Tác Sáng Tạo: Con Người và AI Đồng Sáng Tác Tương Lai

Thay vì lo ngại sự thay thế, chúng ta hãy tận dụng sức mạnh cộng hưởng khi con người hợp tác với AI:

Cộng sinh ý tưởng: Nhờ AI, các nghệ sĩ, nhà văn hay nhà thiết kế có thể “nhảy xa” khỏi giới hạn truyền thống, mở ra những phong cách nghệ thuật và hình thức tương tác mới. Chẳng hạn AI SORA đã làm được việc mà ít người làm được đó là tạo ra các tác phẩm số dựa trên ý tưởng ban đầu của 1 tác giả.

Hiệu quả trong công việc: Hãy tưởng tượng bạn chỉ việc chia sẻ ý tưởng và dữ liệu thô – AI sẽ lo phần xử lý, phân tích và thậm chí tổng hợp thành một sản phẩm hoàn chỉnh, giúp tiết kiệm thời gian và công sức.

4. Kết Luận

Kỷ nguyên số với sự bùng nổ của trí tuệ nhân tạo đang mở ra một chương mới cho các lĩnh vực sáng tạo trên toàn cầu, đặc biệt trong lĩnh vực nghệ thuật, vẽ tranh, sáng tác văn thơ. Trong bối cảnh đó, việc bảo vệ quyền sở hữu trí tuệ không chỉ là vấn đề pháp lý đơn thuần mà đồng thời còn là sự đổi mới nhận thức về quy định Pháp Lý.

Chúng ta cần cùng nhau đẩy mạnh hợp tác giữa các nhà làm luật, các chuyên gia công nghệ và cộng đồng sáng tạo để xây dựng một khung pháp lý linh hoạt, minh bạch và đúng thời kỳ. Chỉ khi đó, những giá trị đích thực của sự sáng tạo – dù là của con người hay của AI – mới thực sự được bảo vệ và phát huy, hướng dẫn chúng ta bước vào một tương lai đầy hy vọng và đổi mới.

Đầu tư vào nguyên cứu và phát triển (R&D) đang ở mức độ cao chưa từng thấy. Ước tính rằng đầu tư vào R&D toàn cầu đã đạt 2.476 nghìn tỉ USD vào năm 2022, thúc đẩy sự tăng trưởng mạnh mẽ liên tục về số lượng đơn xin cấp bằng sáng chế điều này đang đặt hệ sinh thái bằng sáng chế toàn cầu, đặc biệt là các văn phòng bằng sáng chế, vào tình trạng căng thẳng. Sự gia tăng về số lượng và độ phức tạp của các đơn xin cấp bằng sáng chế có thể dẫn đến sự chậm trễ đáng kể trong việc cấp bằng, dẫn đến sự không chắc chắn về mặt pháp lý, có thể kìm hãm sự đổi mới, không khuyến khích đầu tư vào R&D và làm xói mòn khả năng cạnh tranh của các nền kinh tế quốc gia.

Một nghiên cứu của Văn phòng Bằng sáng chế Nhật Bản vào năm 2018, ước tính rằng các thẩm định viên của họ đã dành 30% trong tổng thời gian của mình để tìm kiếm tình trạng kỹ thuật (minh chứng về sáng chế đã được biết đến) và thêm 10% thời gian nữa để hiểu về nó.

Dùng AI hỗ trợ trong việc xác định tình trạng kỹ thuật tiềm năng

Một phương pháp đang được các văn phòng cấp bằng sáng chế áp dụng để cải thiện khả năng cấp bằng sáng chế kịp thời là sử dụng các giải pháp trí tuệ nhân tạo (AI) để hỗ trợ xác định tình trạng kỹ thuật tiềm năng trong quá trình thẩm định. AI có thể bắt chước, với tốc độ nhanh, khả năng của con người trong việc so sánh dữ liệu giữa các đơn xin cấp bằng sáng chế với các bằng sáng chế hiện có và các ấn phẩm không phải bằng sáng chế để phát hiện ra những điểm tương đồng mà thẩm định viên có thể đánh giá khi tìm kiếm về tình trạng kỹ thuật. Mặc dù điều này không thay thế được yêu cầu phải đánh giá kết quả tìm kiếm bằng thẩm định viên con người, nhưng nó có thể tăng tốc đáng kể việc đánh giá trong hơn 70% số đơn.

Kathy Van Der Herten (ảnh trên) cho biết , sự gia tăng về số lượng và độ phức tạp của các đơn xin cấp bằng sáng chế có thể dẫn đến sự chậm trễ đáng kể trong việc cấp bằng, nhưng AI có thể giúp đẩy nhanh quá trình đó. (Ảnh: Được sự cho phép của CAS)

“AI có thể bắt chước, với tốc độ nhanh, khả năng của con người trong việc so sánh dữ liệu giữa các đơn xin cấp bằng sáng chế với các bằng sáng chế hiện có và các ấn phẩm không phải bằng sáng chế để phát hiện ra những điểm tương đồng mà thẩm định viên có thể đánh giá…”

Sự gia tăng về số lượng và độ phức tạp của các đơn xin cấp bằng sáng chế

Dựa trên dữ liệu của WIPO, CAS, một bộ phận của Hiệp hội Hóa học Hoa Kỳ, ước tính rằng năm cơ quan cấp bằng sáng chế hàng đầu đã có tốc độ tăng trưởng gộp hàng năm là 4,4% về số lượng đơn xin cấp bằng sáng chế từ năm 2012 đến năm 2021. Thêm vào sự gia tăng về số lượng đơn là sự tăng lên về mức độ phức tạp của bằng sáng chế, như đã thấy trong số lượng yêu cầu bảo hộ cho bằng sáng chế, bằng sáng chế được trích dẫn cho mỗi yêu cầu, trích dẫn về tình trạng kỹ thuật cho mỗi bằng sáng chế và các định lượng khác.

Tìm kiếm tình trạng kỹ thuật là một quá trình phức tạp, lặp đi lặp lại và tốn thời gian. Đối với mỗi đơn, người tìm kiếm và thẩm định viên phải đưa ra chiến lược tìm kiếm, lựa chọn sử dụng cơ sở dữ liệu nào, thực hiện việc tìm kiếm, xác minh kết quả và nếu cần, tinh chỉnh và lặp lại việc tìm kiếm sử dụng các tham số khác nhau.

Quy mô của công việc tìm kiếm này rất đáng kinh ngạc. Theo một nghiên cứu của Văn phòng Bằng sáng chế Châu Âu, việc tìm kiếm đơn xin cấp bằng sáng chế toàn diện có thể dựa trên tìm kiếm tình trạng kỹ thuật trong khoảng 1,3 tỷ hồ sơ kỹ thuật có trong 179 cơ sở dữ liệu, dẫn đến khoảng 600 triệu tài liệu xuất hiện trong kết quả tìm kiếm mỗi tháng.

“Tìm kiếm tình trạng kỹ thuật trong khoảng 1,3 tỷ hồ sơ kỹ thuật có trong 179 cơ sở dữ liệu, dẫn đến khoảng 600 triệu tài liệu xuất hiện trong kết quả tìm kiếm mỗi tháng.”

Sự phát triển của các công nghệ mới và sự phức tạp của các đơn xin cấp bằng sáng chế đòi hỏi các thẩm định viên phải liên tục mở mang trình độ trong lĩnh vực chuyên môn của họ. Nếu được cấp cho dữ liệu có cấu trúc và được quản lý chặt chẽ, AI có thể tăng tốc quá trình bằng cách sàng lọc hàng triệu bộ dữ liệu và cung cấp các tài liệu tham khảo có khả năng xung đột với đơn đăng ký sáng chế mục tiêu.

Tăng tốc thẩm định bằng sáng chế với các giải pháp có AI hỗ trợ

Nhiều văn phòng cấp bằng sáng chế đang chuyển sang sử dụng các giải pháp được AI hỗ trợ để giúp họ giải quyết số lượng và độ phức tạp ngày càng tăng lên của các đơn xin cấp bằng sáng chế. Theo WIPO, hơn 70 ứng dụng liên quan đến AI đang được triển khai ở 27 văn phòng bằng sáng chế quốc gia, trong đó có 13 ứng dụng tập trung vào tìm kiếm tình trạng kỹ thuật. Mặc dù đây không phải là giải pháp hoàn chỉnh trong toàn bộ quy trình thẩm định, nhưng chúng nhằm mục đích đẩy nhanh thời gian thẩm định, điều này thúc đẩy sự kịp thời và cuối cùng là sự hài lòng của khách hàng.

AI có thể đẩy nhanh quá trình thẩm định bằng sáng chế bằng cách sàng lọc hàng triệu bộ dữ liệu và cung cấp các tài liệu tham khảo có khả năng xung đột với một đơn xin cấp bằng sáng chế đã nộp. (Ảnh: koto_feja/iStock/Getty Images Plus)

Chẳng hạn, Văn phòng Sở hữu Trí tuệ Canada đang sử dụng các công cụ tìm kiếm AI có sẵn trên thị trường để tìm ra mối liên kết giữa các trích dẫn, đơn đăng ký sáng chế và tình trạng kỹ thuật hiện tại. Văn phòng Bằng sáng chế Nhật Bản (JPO) đang sử dụng AI để lập chỉ mục tệp, đề xuất các phân loại sáng chế có liên quan và các từ khóa và xếp hạng các tài liệu tình trạng kỹ thuật sáng chế theo mức độ liên quan. Trong khi đó, Văn phòng Nhãn hiệu và Bằng sáng chế Hoa Kỳ (USPTO) đang sử dụng AI để giúp xác định khả năng cấp bằng sáng chế, phân tích lịch sử truy tố bằng sáng chế và cải thiện quyền truy cập công khai vào dữ liệu USPTO.

“Học máy có hiệu quả đối với việc tìm kiếm văn bản và các thuật ngữ được lập chỉ mục, nhưng kém hiệu quả hơn đối với các bằng sáng chế liên quan đến thành phần cấu thành của vật chất, vốn thường chứa dữ liệu quan trọng ẩn chứa ở các cấu trúc bên trong.”

Gần đây, Viện sở hữu công nghiệp quốc gia (INPI) của Brazil đã làm việc với CAS để hoàn thành một dự án sử dụng quy trình làm việc tối ưu hóa có sự hỗ trợ của AI để tăng tốc tìm kiếm tình trạng kỹ thuật trong lĩnh vực hóa học. Các đơn sáng chế lĩnh vực hóa học, chiếm khoảng 15% số hồ sơ tồn đọng của INPI Brazil, cực kỳ phức tạp và yêu cầu cả sự tìm kiếm dựa trên văn bản và dựa trên cấu trúc của các ấn phẩm bằng sáng chế và không phải bằng sáng chế. Thành phần AI của giải pháp được tích hợp bốn luồng thuật toán, diễn đạt những kiểu tương đồng khác nhau và các phân tích khác để đảm bảo kết quả có tính liên quan cao.

Mỗi thuật toán đều có điểm mạnh của nó. Học máy hiệu quả đối với việc tìm kiếm văn bản và các thuật ngữ đã được lập chỉ mục, nhưng kém hiệu quả hơn đối với các bằng sáng chế liên quan đến thành phần cấu thành của vật chất (trong đó có hai hoặc nhiều hơn các hợp chất được trộn lẫn với nhau) vốn thường chứa dữ liệu quan trọng ẩn chứa ở các cấu trúc bên trong. Tương tự như vậy, một cơ sở dữ liệu đồ thị có thể tìm thấy những điểm tương đồng và các liên kết mà học máy không thể. Một thuật toán tổng hợp sau đó phân tích kết quả từ bốn luồng và đi đến một danh sách duy nhất các ấn phẩm có nhiều khả năng có xung đột với đơn đăng ký sáng chế mục tiêu nhất.

Những lợi ích đối với năng suất là rất đáng kể:

Giảm thời gian thẩm định lên đến 50%;
Giảm thời gian tìm kiếm cho hơn 75% các đơn đăng ký được xử lý;
Đóng góp vào việc giảm tổng thể 80% số lượng hồ sơ tồn đọng bằng sáng chế của INPI.

Dữ liệu có chất lượng, kết quả có chất lượng

Dữ liệu có chất lượng rất quan trọng để huấn luyện các thuật toán AI. Các thuật toán học máy có thể truy cập càng nhiều dữ liệu thì kết quả của chúng càng phù hợp, chắc chắn và đáng tin cậy. Phần lớn dữ liệu công khai có sẵn không được tuyển chọn có thể bao gồm lỗi sao chép, gắn nhãn sai cho các đơn vị, và ngôn ngữ bằng sáng chế phức tạp quá mức, tất cả đều cản trở việc tìm kiếm. Điều này đặc biệt khó khăn trong lĩnh vực hóa học và khoa học đời sống, nơi các khái niệm được mô tả không nhất quán giữa các ấn phẩm hoặc có các từ khóa được ẩn sâu trong bảng biểu hoặc hình ảnh. Việc sử dụng dữ liệu do nhà khoa học tuyển chọn đã được chuẩn hóa, được chuẩn bị và được kết nối ở định dạng có cấu trúc giúp thông tin có thể được tìm kiếm dễ dàng hơn và cải thiện việc huấn luyện các thuật toán AI cũng như hiệu suất tìm kiếm về tình trạng kỹ thuật của sáng chế.

“Mặc dù việc huấn luyện các nhóm có thể khác nhau giữa các công nghệ, chuyên ngành và các đơn sáng chế, nhưng cách tiếp cận cơ bản để áp dụng AI vẫn giống nhau.”

Đối với dự án INPI Brazil, chúng tôi chủ yếu dựa vào Bộ sưu tập nội dung CAS™, bộ sưu tập dữ liệu khoa học đời sống và hóa học lớn nhất thế giới, được trích xuất, lập chỉ mục và liên kết để đơn giản hóa việc truy cập và truy xuất thông tin liên quan. Ngoài ra, chúng tôi đã tạo ra một mẫu bằng sáng chế ngẫu nhiên từ thuật toán huấn luyện mà chúng tôi đã sử dụng như nhóm kiểm soát để đo lường độ chính xác của kết quả và tỷ lệ tìm trúng. Những bằng sáng chế này đã được đánh giá bởi các thẩm định viên tại các văn phòng bằng sáng chế ở Trung Quốc, Nhật Bản, Hoa Kỳ và Châu Âu, đồng thời được nhóm chuyên gia tìm kiếm IP của chúng tôi xác thực về mức độ phù hợp.

Mặc dù việc huấn luyện các nhóm có thể khác nhau giữa các công nghệ, chuyên ngành và các đơn sáng chế, nhưng cách tiếp cận cơ bản để áp dụng AI vẫn giống nhau. Đối với bất kỳ lĩnh vực công nghệ nào, các trích dẫn xung đột được sử dụng để xác định trong suốt quá trình kiểm tra cho mọi nhóm huấn luyện. Các chuyên môn có độ phức tạp cao như hóa học có thể hoạt động tốt hơn với nhóm huấn luyện theo chủ đề cụ thể, nhưng các chuyên môn khác có thể không cho thấy sự cải thiện đáng kể khi sử dụng nhóm huấn luyện nhắm mục tiêu. Trong nhiều lĩnh vực, miễn là công nghệ được hiện diện trong một nhóm huấn luyện chung, các mô hình sẽ hoạt động tốt.

Tuy vậy, chất lượng của dữ liệu có tầm quan trọng đáng kể.

Sự tích hợp tận dụng chuyên môn con người và quy trình làm việc và công nghệ

Các nhóm dự án AI yêu cầu một phạm vi rộng lớn trình độ chuyên môn về các lĩnh vực khác nhau. Dự án INPI Brazil đã kết hợp công nghệ với các chuyên gia về phân tích dữ liệu, tích hợp quy trình làm việc, điện toán hiệu suất cao, sự tìm kiếm mang tính khoa học và nhiều lĩnh vực khác.

Các thành viên trong nhóm cần có chuyên môn liên chức năng trong các thử thách và kết quả đầu ra đang được đề cập đến. Chẳng hạn, một người có kinh nghiệm về khoa học dữ liệu có thể không phát triển được các thuật toán hiệu quả hoàn toàn nếu họ không hiểu các sắc thái của cấu trúc hóa học. Các nhà khoa học máy tính tạo ra các mô hình học máy cũng phải hiểu cấu trúc và dữ liệu hóa học.

Tích hợp quy trình làm việc là một nguyên tắc quan trọng khác trong việc tạo ra một giải pháp toàn diện cho các văn phòng bằng sáng chế. Những thẩm định viên phải truy cập nhiều hệ thống và thư mục để tìm kiếm tài liệu trong quá trình đánh giá có thể hưởng lợi từ những cải tiến quy trình làm việc và những cải tiến công nghệ hướng đến một bảng điều khiển kỹ thuật số duy nhất nơi có thể truy cập và phân tích tất cả các đơn đăng ký và tài liệu hỗ trợ cũng như nơi họ có thể thấy lý do tại sao một số tài liệu tham khảo nhất định được trả về và kết quả được tạo ra như thế nào, cung cấp khả năng truy xuất nguồn gốc mà họ cần để ghi lại các quyết định truy tố và đánh giá chất lượng nội bộ.

Tổng kết lại

Có thể cải thiện đáng kể năng suất, hiệu quả và dịch vụ khách hàng của văn phòng bằng sáng chế khi các thẩm định viên có thể sử dụng các công cụ được xây dựng dựa trên các công nghệ mới nhất, chẳng hạn như AI. Khi sự đổi mới tăng nhanh, số lượng và độ phức tạp của các đơn xin cấp bằng sáng chế cũng tăng theo. Điều này có nghĩa là các văn phòng bằng sáng chế sẽ tiếp tục yêu cầu các phương pháp mới để tối ưu hóa quy trình thẩm định bằng sáng chế và do đó đáp ứng kỳ vọng của các bên liên quan về mức độ hài lòng cao hơn đối với dịch vụ.

Mặc dù các giải pháp AI có thể giúp giải quyết những thách thức không ngừng phát triển này, nhưng chúng vẫn sẽ yêu cầu chuyên môn để triển khai các phương pháp phù hợp. Cách tiếp cận với “một mô hình phù hợp cho tất cả” sẽ không hiệu quả vì không có hai văn phòng cấp bằng sáng chế nào có nhu cầu giống nhau. Các văn phòng sáng chế có các hoạt động chung giống nhau nhưng khác nhau về trình độ nhân sự và công nghệ cần thiết để hỗ trợ từng lĩnh vực. Mặc dù các thuật toán có thể giải quyết một nhu cầu chung, nhưng cách thẩm định viên tương tác với kết quả đầu ra có thể rất khác nhau dựa trên môi trường công nghệ hiện có của họ.

“Có thể cải thiện đáng kể năng suất, hiệu quả và dịch vụ khách hàng của văn phòng bằng sáng chế khi các thẩm định viên có thể sử dụng các công cụ được xây dựng dựa trên các công nghệ mới nhất, chẳng hạn như AI.”

Những văn phòng sáng chế đang tìm cách đạt được các kết quả chiến lược của mình sẽ yêu cầu những đổi mới tùy chỉnh đáp ứng mong đợi của các bên liên quan bất chấp những hạn chế về nguồn lực. Sự kết hợp giữa dữ liệu tổng hợp đúng đắn, công nghệ và chuyên môn của con người có thể mang lại sự linh hoạt cần thiết để hỗ trợ những cải tiến bền vững trong tương lai.

Đọc thêm về cách AI có thể nâng cao năng suất của hệ thống bằng sáng chế toàn cầu trong sách trắng của CAS có tựa đề “Tính bền vững của hệ thống bằng sáng chế toàn cầu: vai trò của AI trong việc nâng cao năng suất.”

Lời cảm ơn: Matthew Bryan và Andras Jokuti , Lĩnh vực Bằng sáng chế và Công nghệ, WIPO
Bruno Poulequen , Ulrike Till và Young-Woo Yun , Lĩnh vực Cơ sở hạ tầng và Nền tảng, WIPO

Biên tập: Catherine Jewell

Nguồn: tạp chí WIPO Magazine của tổ chức SỞ HỮU TRÍ TUỆ QUỐC TẾ:

https://www.wipo.int/wipo_magazine_digital/en/2023/article_0001.html

AI là gì?

Trí tuệ nhân tạo (AI) là lĩnh vực công nghệ đang có bước phát triển mạnh mẽ hiện nay. Nhưng lĩnh vực này vô cùng phức tạp với những thuật ngữ kỹ thuật và toán học, và việc cố gắng hiểu chúng là gì và cách thức hoạt động ra sao đủ khiến bất cứ ai cũng cảm thấy nản lòng. Trong khoa học máy tính, trí tuệ nhân tạo hay AI (tiếng Anh: artificial intelligence), đôi khi được gọi là trí thông minh nhân tạo, là trí thông minh được thể hiện bằng máy móc, trái ngược với trí thông minh tự nhiên của con người. Thông thường, thuật ngữ “trí tuệ nhân tạo” thường được sử dụng để mô tả các máy móc (hoặc máy tính) có khả năng bắt chước các chức năng “nhận thức” mà con người thường phải liên kết với tâm trí, như “học tập” và “giải quyết vấn đề” theo Wikipedia.

Sự phát triển của AI trong những thập niên tới sẽ là xu hướng công nghệ chủ đạo?

MICROSOFT mất tới 25 năm để trở thành 1 hãng phần mềm tên tuổi hàng đầu thế giới, GOOGLE mất 15 năm để thống lĩnh thị trường quảng cáo online, marketing và nội dung số, APPLE mất 10 năm để vươn lên trở thành một hãng sản xuất điện thoại thông minh hàng đầu thế giới, còn SamSung mất tới hơn 25 năm để trở thành 1 Chaebol mạnh nhất trong lĩnh vực công nghệ và sản xuất điện tử ở Châu Á Thái Bình Dương. Nhưng ngày hôm qua thôi, CHATGPT từ 1 phần mềm, trang web vô danh chỉ mất 3 tháng để nổi danh hàng đầu trong lĩnh vực AI với hơn 100 triệu tài khoản đăng ký. Tất nhiên trước ChatGPT đã có nhiều hãng công nghệ thử nghiệm công nghệ AI nhưng chưa có ai dám đưa ra thử nghiệm thực sự cho người dùng vì họ sợ rằng các yếu điểm của lĩnh vực này có thể bộc lộc và thất bại, nhưng hãng công nghệ đứng sau Open AI đã sẵn sàng bước ra sân khấu trong vai trò được hoặc mất tất cả và họ đã thành công.

Họ đã được đầu tư và cam kết mạnh mẽ từ hãng phần mềm và điện toán đám mây hàng đầu thế giới Microsoft sẵn lòng tài trợ dài hạn, cấp vốn và phát triển lâu dài. Có lẽ chưa bao giờ Microsoft nhận ra rằng mình đã tụt hậu nhanh đến thế nào khi bỏ mất thị phần phần mềm trực tuyến vào tay Google, Apple và mất hẳn miếng bánh Điện thoại thông minh vào tay Apple, Samsung, Oppo, Huewei.. Nhưng họ đã nhìn ra 1 tương lai mới khi nhìn thấy ChatGPT. Về lâu dài thế giới vẫn còn ai đó đang xài Windows và Office offline trên những máy Laptop cũ kỹ và cố gắng mỗi năm đóng mức phí 30-40 USD cho 1 năm sử dụng Office 365 hoặc vài trăm USD cho hệ điều hành WINDOWS, nhưng nó đang dần thành quá khứ.khi mà Open Office, Android trực tuyến hay trợ lý Siri sẵn lòng hỗ trợ. Có gì đâu chỉ là 1 vài trang văn bản, vài bảng tính mô tả mà hiện tại bạn phải đau đầu học các kỹ năng Word, Excel, PowerPoint để thuyết trình cho đồng nghiệp và đối tác. Nhưng điều này sẽ là quá khứ vì trong tương lai với khả năng của AI, bạn chỉ nêu ý tưởng, gửi dữ liệu thô và hô.. ACTION… tất cả đã có Siri hay trợ lý Google lo. Bạn sẽ có 1 bản thuyết trình đẹp như tranh, thậm chí nếu bạn lười đọc đã có trợ lý ảo đọc hộ hoặc thậm chí nó sẽ giả giọng bạn luôn nếu bạn đã cung cấp dữ liệu giọng nói cho nó. Trong 1 cuộc họp trực tuyến thì hoàn toàn không ai biết là bạn đang đọc hay trợ lý ảo đang thuyết trình.

Phải chăng chúng ta đang nghe 1 câu chuyện giả tưởng, không đó là sự thực không xa vời mà trong chỉ vài năm nữa thôi khi các phiên bản cải tiến của ChatGPT ưu việt hơn, thông minh hơn và.. tốn điện hơn ra đời. Nhưng cô lễ tân, y tá mặt đầy cau có khó chịu khi hàng trăm người xếp hàng chờ đến lượt khám ở Bệnh Viện Việt Đức Hà nội sẽ mất việc… Thay vào đó là giọng nói thỏ thẻ nhẹ nhàng hướng dẫn người bệnh tại bệnh viện rằng bạn nên đi chụp Citi tự động ở phòng A, nội soi tự động tại phòng B…, tất nhiên trước đó bạn đã được khám tổng quát bởi 1 bác sĩ AI chuyên nghiệp ngay tại nhà và bạn sẽ trả tiền khám tùy theo phiên bản khám bệnh chuyên sâu tới mức nào của.. các hãng Y dược học đã sáng tạo ra AI đó.

ChatGPT chỉ là 1 đứa trẻ thơ dù nó đã biết làm toán, viết code, soạn văn… nhưng nó chỉ là khởi đầu của các AI hậu bối chuyên sâu hơn, phức tạp hơn và ít lỗi hơn.

Hơn bao giờ hết con người thấy mình trở nên yếu kém đến vậy trong thế giới máy móc. Hôm nay chúng ta cười lộn ruột trước câu trả lời ngô nghê của ChatGPT nhưng ngày mai chúng ta sẽ đau điếng khi nghe 1 phiên bản ChatGPT khác nói rằng bạn đang đạo văn, bạn đang copy dữ liệu từ 1 nguồn website khác. Tất nhiên bài viết này là độc quyền trên WINCOLAW.COM.VN và trợ lý Google sẽ nhận ra điều đó.

Chào mừng bạn đã đến với kỷ nguyên công nghệ mới: TRÍ TUỆ NHÂN TẠO.

Ở phần 2 của bài viết chúng tôi sẽ nói về “Bảo Vệ Quyền Sở Hữu Trí Tuệ Trong Kỷ Nguyên AI”