Поскольку все больше компаний понимают, что создание генеративного контента ИИ стоит довольно дорого, возможно, мы приближаемся к концу бесплатных моделей ИИ с открытым исходным кодом. Одна из крупнейших компаний, которая когда-то провозглашала открытый исходный код, сейчас пытается продать более значительную, более мощную модель deepfake ИИ, любому человеку с глубокими карманами (он же бизнес), готовому заплатить за нее.
В четверг компания Stability AI объявила о выпуске новой версии своего программного обеспечения с открытым исходным кодом под названием Stable Diffusion XL. Почему мы используем лексику Magic Mike? Потому что, по словам компании, эта новейшая версия генератора изображений использует 2,3 миллиарда параметров, что намного больше, чем 900 миллионов параметров в Stable Diffusion V2.1. Вице-президент по разработке Stability AI Скотт Дрейвс сказал VentureBeat, что новая версия является улучшением Stable Diffusion 2.1, но не должна называться 3.0, по крайней мере, пока.
Одна из главных возможностей новой модели заключается в том, что она «превосходит фотореализм» при работе с лицами и композицией изображений. Компания заявила, что пользователи могут использовать менее подробные подсказки для создания более качественных изображений ИИ с разрешением 512×512. Компания утверждает, что ее ИИ может обрабатывать такие печально известные сложные части изображений, как естественный текст и руки. После создания изображения пользователи SDXL могут использовать продукт компании Dream Studio, чтобы изменить его с помощью дополнительных инструментов редактирования на основе ИИ. Stability AI также сообщает, что компании могут интегрировать SDXL в свои собственные продукты через API. Пользователи Dream Studio также должны иметь доступ к более расширеной модели ИИ.
SDXL находится только в бета-версии и ее ограниченная доступность не позволяет сравнить ее с другими новыми версиями генеративного ИИ, такими как Midjourney V5. Конкурирующий генератор изображений ИИ также недавно закрыл бесплатный доступ к своей модели распространения на базе Discord, сославшись на «чрезвычайный спрос и злоупотребления в процессе использования». Генеральный директор Midjourney Дэвид Хольц сказал, что компания вернет бесплатную пробную версию после того, как она внедрит «следующие улучшения в систему».
После генератора изображений ИИ DALL-E 2 от OpenAI, модель Stability Diffusion с открытым исходным кодом от Stability AI была следующим большим проектом, который ввел генеративный ИИ в мейнстрим. Он также регулярно упоминался за то, что пользователи в свободной форме могли создавать порнографические и необъективные изображения без согласия, пока в версии 2.0 не появились дополнительные препятствия. И это не говоря уже о том, как обучающие данные ИИ соскабливали миллионы изображений из Интернета, что привело к судебным искам со стороны художников и компании Getty Images, специализирующейся на стоковых фотографиях.
Похоже, что Stability AI полным ходом идет к новым корпоративным партнерствам. В четверг Amazon заявила, что Stable Diffusion является одной из немногих моделей, доступных для новой интеграции ИИ в Amazon Web Services. Компания пообещала, что SDXL получит релиз с открытым исходным кодом «в ближайшем будущем».
На прошлой неделе Semafor сообщил, что компания Stability AI испытывает финансовые трудности даже после того, как в прошлом году она получила крупные инвестиции в размере 100 миллионов долларов. По словам анонимных источников в инвестиционных компаниях, упомянутых в отчете, она «проела» большую часть этих денег, и другие венчурные фирмы рассматривают возможность отказа от дальнейших инвестиций.
Эмад Мостак, бывший менеджер хедж-фонда, который помог основать Stability AI, является одним из самых больших сторонников разработки генеративного ИИ с открытым исходным кодом. В своих твитах и интервью он не раз давал понять, что является сторонником любого развития ИИ.
Однако разработка ИИ является невероятно дорогой и ресурсоемкой, и, согласно отчету Semafor, Мостак подвергся внутренней критике за свой открытый подход к предоставлению исследователям ИИ дорогостоящего серверного времени. По сообщениям, генеральный директор намерен остаться на своем посту, но компания, возможно, ищет другого руководителя, готового сосредоточиться на зарабатывании денег. Поскольку компания надеется привлечь средства для оценки в 4 миллиарда долларов, время покажет, сможет ли она сохранить свои идеалы и заработать достаточно денег, чтобы выжить.
Перевод статьи: Новый сверхмощный генератор дипфейков от Stability AI