Trên bản đồ công nghệ thế giới, chúng ta đã chứng kiến sự ra đời của hàng loạt các dự án nổi bật. Đặc biệt, dưới đây là 06 dự án về Trí tuệ Nhân tạo (AI) tiên phong mà chúng ta tin rằng sẽ định hình tương lai công nghệ.
1. Photo Editing Outside the Box: Adobe Photoshop – Công Cụ Trí Tuệ Nhân Tạo Độc Đáo
Trong năm 2023, Adobe đã mang đến cho hàng triệu người khả năng sử dụng trí tuệ nhân tạo thông qua ứng dụng chỉnh sửa ảnh phổ biến nhất thế giới: Adobe Photoshop. Sử dụng Firefly, công cụ tạo hình ảnh dựa trên trí tuệ nhân tạo của Adobe, Photoshop hiện đã tích hợp các tính năng Generative Expand và Generative Fill. Hai tính năng này cho phép người dùng thực hiện những công việc mà trước đây có thể đòi hỏi kiến thức kỹ thuật sâu hoặc nhiều giờ làm việc.
- Generative Expand: Tính năng này cho phép bạn dễ dàng điền nội dung ảo vào bức ảnh vượt ra ngoài biên hình ảnh gốc. Bạn có thể mở rộng ảo tưởng và tạo ra những khung cảnh mà trước đây không thể có trong ảnh gốc.
- Generative Fill: Tính năng này cho phép bạn thêm hoặc xóa các yếu tố trong một bức ảnh hiện có chỉ bằng cách nhập vài từ đơn giản. Bạn không cần kiến thức kỹ thuật đặc biệt để thực hiện công việc này, mà chỉ cần nhập mô tả ngắn về điều bạn muốn thay đổi hoặc thêm vào ảnh.
Những tính năng này không chỉ tiết kiệm thời gian mà còn giúp người dùng trực quan hóa những ý tưởng và sáng tạo của họ một cách nhanh chóng. Theo lời của Ashley Still, Phó Chủ tịch cao cấp của phòng truyền thông số của Adobe, những lựa chọn này cho phép “khách hàng biến các tưởng tượng của họ thành hiện thực với tốc độ của tư duy.” Điều này là một ví dụ rõ ràng về cách AI đã đánh bại rào cản kỹ thuật và giúp tạo ra những sản phẩm sáng tạo và dễ sử dụng hơn cho mọi người.
2. OpenAI GPT-4: Bước Đột Phá Mới Về Trí Tuệ Nhân Tạo
Khoảng tám tháng kể từ khi ra mắt vào tháng 3, GPT-4 của OpenAI vẫn là mô hình trí tuệ nhân tạo mạnh mẽ nhất để điều khiển một chatbot mà công chúng có thể truy cập. So với người tiền nhiệm của nó, ChatGPT, chỉ vượt qua được 10% thí sinh trong bài thi luật sư, GPT-4 đã vượt qua 90% trong cùng bài thi. GPT-4 không chỉ giỏi về lý luận ngôn ngữ mà còn có khả năng phân tích những khái niệm phức tạp thành ngôn ngữ đơn giản và thậm chí có thể giải thích tại sao một câu đùa lại hài hước.
Vào tháng 9, OpenAI đã bắt đầu triển khai khả năng tương tác với mô hình bằng giọng nói và sử dụng hình ảnh làm đầu vào. Cập nhật này, GPT-4V, đã được thử nghiệm với tổ chức Be My Eyes, một tổ chức xây dựng công cụ cho người mắc khuyết tật về thị giác, và có khả năng mô tả nội dung của hình ảnh bằng ngôn ngữ tự nhiên.
Khả năng của GPT-4 là một bước tiến quan trọng trong lĩnh vực trí tuệ nhân tạo và chatbot. Không chỉ là một công cụ mạnh mẽ cho việc giao tiếp ngôn ngữ, mà còn là một cỗ máy thông minh có khả năng xử lý thông tin âm thanh và hình ảnh. Điều này mở ra nhiều ứng dụng mới trong việc giúp người khuyết tật thị giác, trong việc đào tạo, và trong việc hỗ trợ người dùng trực tiếp trong nhiều ngữ cảnh khác nhau. GPT-4 thể hiện sự tiến bộ liên tục trong lĩnh vực trí tuệ nhân tạo và hứa hẹn mang lại lợi ích to lớn cho mọi người.
3. Runway’s Gen-2: Biểu tượng mới của Trí Tuệ Nhân Tạo trong Lĩnh Vực Thị Giác
Trong tháng 6, Runway – một công ty khởi nghiệp được Google hậu thuẫn và được sử dụng công cụ hiệu ứng hình ảnh của họ để tạo ra đồ họa động ấn tượng trong bộ phim đoạt giải Oscar “Everything Everywhere All At Once” – đã giới thiệu phiên bản Gen-2 của họ. Phiên bản mới này cho phép bất kỳ ai tạo ra các video hoàn chỉnh chỉ dựa trên các gợi ý văn bản, hình ảnh hoặc video khác.
Cristóbal Valenzuela, người sáng lập và CEO của Runway, so sánh công nghệ mới với sự phát minh của máy ảnh cách đây 200 năm. Ông nói, “Trí tuệ nhân tạo là một loại máy ảnh mới,” và công nghệ này sẽ làm thay đổi cách chúng ta kể chuyện mãi mãi và dẫn đến sự xuất hiện của các bộ phim toàn bộ được tạo ra hoàn toàn bằng máy tính.
Runway Gen-2 đánh dấu một bước tiến đột phá trong lĩnh vực trí tuệ nhân tạo và thị giác máy tính. Khả năng tạo video từ các gợi ý văn bản, hình ảnh hoặc video trước đây là điều khó kìm lại, nhưng với sự phát triển nhanh chóng của công nghệ, nó trở nên hiện thực. Điều này sẽ có tác động lớn đến ngành công nghiệp giải trí và tạo ra cơ hội mới cho việc sáng tạo nội dung truyền hình và điện ảnh. Runway Gen-2 chứng tỏ rằng trí tuệ nhân tạo đang thay đổi cách chúng ta sáng tạo và chia sẻ câu chuyện, mở ra một tương lai đầy triển vọng trong ngành công nghiệp nghệ thuật.
4. FeaturePrint: Giải Pháp Trí Tuệ Nhân Tạo Chống Hàng Giả
Một giải pháp đối phó với vấn đề hàng giả trị giá hàng nghìn tỷ đô la có thể đơn giản như việc đưa điện thoại di động của bạn vào một chiếc đồng hồ hoặc chiếc túi xách và để phần mềm thông minh xác định tính hợp pháp của nó. FeaturePrint, một công nghệ trí tuệ nhân tạo quang học, đầu tiên “nhìn thấy” các chi tiết bề mặt nhỏ nhất của các sản phẩm vật lý và “vân tay” chúng thành các danh tính toán học duy nhất. Sau đó, nó có thể cho bạn biết liệu một món đồ có giả mạo hay thật bằng một cú nhấp chuột. “Không cần dán, nhãn, hoặc đánh dấu,” theo lời của CEO Alitheon Roei Ganzarski. Một trong những khách hàng của họ là Argor-Heraeus, công ty sản xuất thanh vàng cho các ngân hàng quốc gia.
FeaturePrint đại diện cho một xu hướng quan trọng trong cuộc chiến chống hàng giả, sử dụng trí tuệ nhân tạo và công nghệ quang học để phát hiện sự giả mạo. Điều này có tiềm năng thay đổi cách mà chúng ta kiểm tra tính xác thực của các sản phẩm và tránh hàng giả. Nó không chỉ giúp bảo vệ quyền lợi của người tiêu dùng mà còn giúp bảo vệ các thương hiệu và sản phẩm của họ khỏi việc bị làm giả. FeaturePrint đang mang đến một giải pháp đột phá cho vấn đề hàng giả toàn cầu, và hứa hẹn giúp làm cho thị trường trở nên minh bạch và an toàn hơn.
5. Dedrone’s City-Wide Drone Detection: Bảo Vệ Không Gian Đô Thị Khỏi Rối Loạn Của Drone
Drone có thể gây rối loạn cũng như mang lại lợi ích. Sản phẩm Dedrone City-Wide Drone Detection tạo ra một nguyên tắc bảo vệ ảo xung quanh một khu vực địa lý, cảnh báo cho cơ quan thực thi pháp luật chỉ trong vài giây nếu một drone xâm nhập vào không gian được chỉ định. Dedrone theo dõi một loạt tín hiệu độc quyền từ các drone, bao gồm tần số radio, dữ liệu ADS-B (cũng được sử dụng trong máy bay), và các bộ đèn RemoteID, để xác định vị trí của sự xâm phạm. Mary-Lou Smulders, giám đốc tiếp thị chính của công ty, so sánh nó với một hệ thống kiểm soát giao thông hàng không dành cho drone – điều mà trước đây chưa từng tồn tại. Các khách hàng bao gồm Con Edison, đang sử dụng nó để bảo vệ cơ sở hạ tầng của họ; lực lượng cảnh sát của Barcelona; và một số sân bay không được tiết lộ số lượng.
Dedrone City-Wide Drone Detection đại diện cho một giải pháp quan trọng trong việc quản lý và kiểm soát hoạt động của drone trong môi trường đô thị. Việc theo dõi và phát hiện sớm drone có thể giúp đảm bảo an ninh và bảo vệ cơ sở hạ tầng quan trọng, cũng như tránh nguy cơ xâm nhập và sử dụng trái phép của drone. Điều này có ý nghĩa lớn đối với các tổ chức và cơ quan chức năng như cơ quan điện lực, cảnh sát địa phương và các sân bay, giúp họ quản lý an ninh và an toàn của các khu vực quan trọng trong thành phố một cách hiệu quả hơn.
6. Ghostwriter and So-VITS-SVC: Cách Sáng Tạo Âm Nhạc Mới Với Trí Tuệ Nhân Tạo
Trước đây trong năm nay, một người sáng tạo vô danh tự gọi mình là Ghostwriter đã tạo nên sự xôn xao với bản nhạc mang tựa đề “Heart on My Sleeve,” trong đó có sử dụng giọng ca được tạo ra bằng trí tuệ nhân tạo mà nghe như Drake và The Weeknd. (Bản nhạc này sau đó bị gỡ bỏ khỏi các dịch vụ phát trực tuyến hợp pháp, nhưng không trước khi trở nên phổ biến trên mạng.) Các giọng ca này được tạo ra bằng phần mềm mã nguồn mở được biết đến với tên gọi So-VITS-SVC, cho phép những người có kiến thức về công nghệ huấn luyện một mạng thần kinh dựa trên giọng ca của một ca sĩ và sau đó sản xuất bất kỳ bài hát nào bằng giọng ca do trí tuệ nhân tạo tạo ra.
Những người yêu thích âm nhạc đã bắt đầu trao đổi các mô hình giọng ca – từ Bad Bunny đến Taylor Swift và James Hatfield – trong cộng đồng trên nền tảng Discord. Trong khi đó, các trang web thân thiện với người dùng sử dụng phần mềm này đã nảy mầm và trở nên phổ biến.
Ghostwriter và So-VITS-SVC đại diện cho một sự thay đổi quan trọng trong cách chúng ta tạo âm nhạc và sáng tác bài hát. Trí tuệ nhân tạo giúp cho việc tạo ra giọng ca và âm nhạc trở nên dễ dàng và linh hoạt hơn bao giờ hết. Tuy nhiên, điều này cũng đặt ra nhiều câu hỏi về bản quyền âm nhạc và vấn đề về đạo đức trong việc sử dụng giọng ca được tạo ra bằng trí tuệ nhân tạo trong âm nhạc thương mại.