Meta представила AI, который может вырезать любой объект на изображении, и поделилась исходным кодом AI.
В среду компания Meta анонсировала модель AI под названием Segment Anything Model (SAM), которая может идентифицировать отдельные объекты на изображениях и видео, даже те, которые не встречались во время обучения, сообщает Reuters.
Согласно сообщению в блоге компании Meta, SAM - это модель сегментации изображений, которая может реагировать на текстовые подсказки или нажатия пользователя для выделения конкретных объектов на изображении. Сегментация изображения - это процесс в компьютерном зрении, который предполагает разделение изображения на несколько сегментов или областей, каждая из которых представляет собой определенный объект или область интереса.
Цель сегментации изображения - сделать изображение более легким для анализа или обработки. Meta также считает, что технология может быть полезна для понимания содержания веб-страниц, приложений дополненной реальности, редактирования изображений и помощи в научных исследованиях путем автоматической локализации животных или объектов для отслеживания на видео.
Обычно, по словам Meta, создание точной модели сегментации “требует высокоспециализированной работы технических экспертов, имеющих доступ к инфраструктуре обучения ИИ и большим объемам тщательно аннотированных данных”. Создавая SAM, Meta надеется “демократизировать” этот процесс, уменьшив необходимость в специализированном обучении и опыте, что, как она надеется, будет способствовать дальнейшим исследованиям в области компьютерного зрения.
В дополнение к SAM, Meta собрала набор данных, который она называет “SA-1B”, включающий 11 миллионов изображений, лицензированных у “крупной фотокомпании”, и 1,1 миллиарда сегментационных масок, созданных ее моделью сегментации. Meta сделает SAM и его набор данных доступными для исследовательских целей по лицензии Apache 2.0.
В настоящее время код (без весов) доступен на GitHub, и Meta создала бесплатную интерактивную демонстрацию своей технологии сегментации. В демонстрации посетители могут загрузить фотографию и использовать “Hover & Click” (выделение объектов с помощью мыши), “Box” (выделение объектов в пределах поля выделения) или “Everything” (попытка автоматически идентифицировать каждый объект на изображении).
- Segment Anything Demo: https://segment-anything.com/demo
- SA-1B Dataset: https://ai.facebook.com/datasets/segment-anything/
- GitHub: https://github.com/facebookresearch/segment-anything