Почему фото пользователей Instagram превратились в текст
Пользователям Instagram предоставился шанс вспомнить «Матрицу», а именно момент, когда главный герой Нео достигает статуса цифрового мессии и видит подлинную «реальность» — зеленые символы кода.
Внезапный сбой в работе сервиса явил инстаграмерам похожую картину: вместо своих фотографий они увидели набор тегов, описывающих содержимое изображения. Кроме того, во время технической неисправности никому не удавалось опубликовать новый снимок или посмотреть сторис. Но если последние неудобства всего лишь привычно раздражали, то «текстовый» вариант Instagram изрядно позабавил пользователей и превратился в мем.
В Facebook объяснили, как появились теги и для чего они нужны. Если говорить кратко, то именно так — сухим набором букв на белом фоне — выглядит цветной или черно-белый снимок, когда его анализирует искусственный интеллект Instagram.
Если подробно, тегами нейросеть помечает ключевые элементы на фотографиях, не обделяя вниманием даже аватары пользователей. Технология распознавания лиц Facebook помогает ИИ узнавать людей на снимке и идентифицировать их имена. В результате получаются надписи, начинающиеся с одной и той же фразы «На данном изображении может находиться», затем идет перечисление возможных элементов.
В компании объясняют, что машинное обучение используется с апреля 2016 года как важная часть мероприятий Facebook по обеспечению доступности информации. Например, теги помогают описывать снимки и видео для людей с нарушениями зрения. Неясно, использует ли Facebook эту технологию для таргетинга, ведь описания предоставляют много данных о деятельности пользователей: есть ли у них домашнее животное, какие у них увлечения, где они чаще всего отдыхают и что покупают в магазинах.
The Verge напоминает, что вопросы о целесообразности распознавания информации на изображениях поднимал в 2017 году некий программист, который заметил, что большинство интернет-юзеров не понимает, насколько огромный объем данных можно извлечь из одной фотографии.
Сбой в работе Instagram приоткрыл дверь в закулисье одной из крупнейших компаний по сбору данных и показал, в какой степени визуальный мир стал доступен для анализа ИИ. Изображения и видео в интернете так же легко читаются машинным зрением, как и текст глазами человека.