Facebook dùng một tỷ bức ảnh Instagram để đào tạo AI

Facebook đã tận dụng cơ sở dữ liệu hình ảnh khổng lồ của Instagram để xây dựng thành công AI có khả năng “nhìn” được nội dung đang thấy.

Theo bộ phận FacebookAI Research, chương trình thị giác máy tính mới có biệt danh là Seer (SElf-SupERvised). Trong bài kiểm tra nhận dạng vật thể do ImageNet – cơ sở dữ liệu hình ảnh quy mô lớn được thiết kế để sử dụng trong nghiên cứu phần mềm nhận dạng đối tượng trực quan – Seer đã đạt “điểm phân loại chính xác” lên tới 84,2%, cao nhất từ trước đến nay.

Facebook đang tận dụng dũ liệu hình ảnh của Instagram để đào tạo AI. Ảnh: Facebook AI Research.

Facebook đang tận dụng dữ liệu hình ảnh của Instagram để đào tạo AI. Ảnh: Facebook AI Research.

Hiện tại, hầu hết chương trình AI ở lĩnh vực thị giác máy tính đều được huấn luyện dựa trên các bức ảnh đã phân loại kỹ và dán nhãn nội dung cẩn thận. Tuy nhiên, Facebook cho biết Seer đã có thể tự “học” thông qua việc phân tích hình ảnh Instagram ngẫu nhiên, không cần dựa trên nhãn gắn và chưa được xác định nội dung. Kỹ thuật này được gọi là học tập tự giám sát (self-supervised learning).

Học tập tự giám sát là kỹ thuật về AI được giới khoa học chú ý gần đây. Mô hình này có ưu điểm là cần ít dữ liệu, cũng như không cần phân loại và quản lý dữ liệu, qua đó có thể hoạt động với các tập dữ liệu lớn hơn và đa dạng hơn.

“Tương lai của AI là tạo ra các hệ thống có thể tự học trực tiếp từ bất kỳ thông tin nào chúng được cung cấp, kể cả đó là văn bản, hình ảnh hay một loại dữ liệu nào khác. Chúng sẽ tự học cách nhận ra các đối tượng trong một bức ảnh, diễn giải một khối văn bản hoặc thực hiện bất kỳ tác vụ nào được yêu cầu”, đại diện Facebook viết trên blog. “Hiệu suất của Seer đang chứng minh việc học tập tự giám sát của AI có thể thực hiện được. Có thể xem đây là bước đột phá cuối cùng, mở ra con đường cho các mô hình thị giác máy tính linh hoạt, chính xác và thích ứng hơn trong tương lai”.

Cũng theo đại diện Facebook, dù chỉ là một dự án nghiên cứu, tiềm năng ứng dụng của Seer là rất lớn. Chẳng hạn, AI này có thể tối ưu hóa văn bản mô tả hình ảnh trên Facebook cho những người bị khiếm thị, phân loại tự động chính xác các mặt hàng được bán trên Facebook Marketplace cũng như xác định và loại bỏ các hình ảnh có nội dung độc hại trên Facebook.

Tuy nhiên, việc sử dụng hình ảnh công khai trên Instagram để đào tạo AI của Facebook đang vấp phải chỉ trích rất lớn. Theo CNBC, nhiều người dùng mạng xã hội này ngạc nhiên khi biết rằng hình ảnh của họ đang được sử dụng để dạy AI.

“Chúng tôi đã thông báo cho các chủ tài khoản Instagram trong chính sách dữ liệu, rằng Facebook có quyền sử dụng thông tin trên nền tảng để hỗ trợ nghiên cứu và đổi mới, bao gồm cả những công nghệ như thế này”, Priya Goyal, kỹ sư phần mềm tại Facebook AI Research, nói với CNBC.

Đại diện Facebook cũng cho biết sẽ mở mã nguồn Seer để các nhà nghiên cứu có thể thử nghiệm. Tuy nhiên, công ty khẳng định sẽ không chia sẻ hình ảnh của người dùng ra bên ngoài.

Bên cạnh Facebook, một số “ông lớn” công nghệ khác cũng đang quan tâm đến lĩnh vực thị giác máy tính. Năm ngoái, Google công bố chương trình thị giác máy tính có tên SimCLRv2, trong khi OpenAI cũng giới thiệu iGPT 2.

Bảo Lâm

Nguồn : vnexpress.net