Meta представила AI, который может вырезать любой объект на изображении, и поделилась исходным кодом AI.

Meta представила AI, который может вырезать любой объект на изображении

В среду компания Meta анонсировала модель AI под названием Segment Anything Model (SAM), которая может идентифицировать отдельные объекты на изображениях и видео, даже те, которые не встречались во время обучения, сообщает Reuters.

Согласно сообщению в блоге компании Meta, SAM - это модель сегментации изображений, которая может реагировать на текстовые подсказки или нажатия пользователя для выделения конкретных объектов на изображении. Сегментация изображения - это процесс в компьютерном зрении, который предполагает разделение изображения на несколько сегментов или областей, каждая из которых представляет собой определенный объект или область интереса.

Meta представила AI, который может вырезать любой объект на изображении

Цель сегментации изображения - сделать изображение более легким для анализа или обработки. Meta также считает, что технология может быть полезна для понимания содержания веб-страниц, приложений дополненной реальности, редактирования изображений и помощи в научных исследованиях путем автоматической локализации животных или объектов для отслеживания на видео.

Обычно, по словам Meta, создание точной модели сегментации “требует высокоспециализированной работы технических экспертов, имеющих доступ к инфраструктуре обучения ИИ и большим объемам тщательно аннотированных данных”. Создавая SAM, Meta надеется “демократизировать” этот процесс, уменьшив необходимость в специализированном обучении и опыте, что, как она надеется, будет способствовать дальнейшим исследованиям в области компьютерного зрения.

Meta представила AI, который может вырезать любой объект на изображении

В дополнение к SAM, Meta собрала набор данных, который она называет “SA-1B”, включающий 11 миллионов изображений, лицензированных у “крупной фотокомпании”, и 1,1 миллиарда сегментационных масок, созданных ее моделью сегментации. Meta сделает SAM и его набор данных доступными для исследовательских целей по лицензии Apache 2.0.

В настоящее время код (без весов) доступен на GitHub, и Meta создала бесплатную интерактивную демонстрацию своей технологии сегментации. В демонстрации посетители могут загрузить фотографию и использовать “Hover & Click” (выделение объектов с помощью мыши), “Box” (выделение объектов в пределах поля выделения) или “Everything” (попытка автоматически идентифицировать каждый объект на изображении).

Segment Anything Demo: https://segment-anything.com/demo
SA-1B Dataset: https://ai.facebook.com/datasets/segment-anything/
GitHub: https://github.com/facebookresearch/segment-anything