Яндекс и Сбер выпустили нейросетевые генераторы картинок. У Яндекса первые шаги!

Автор Тема: Яндекс и Сбер выпустили нейросетевые генераторы картинок. У Яндекса первые шаги!  (Прочитано 1019 раз)

Оффлайн Владимир75Автор темы

  • telegram:@xiceer
  • Администратор
  • Бизнес оценка: (4, 100%)
  • *****
  • СПАСИБО: 7418
  • Сообщений: 11138
  • Карма: 657
  • Пол: Мужской
  • Это я такой уже старый
  • Награды Гроссмейстер поисковой оптимизации SEO Профессионал Более трех тысяч спасибо За благотворительность Почетный гражданин нашего форума
    • Оптимизация и Продвижение

Оффлайн Владимир75Автор темы

  • Администратор
  • *****
  • Доп. информация
    • telegram:@xiceer
    • Бизнес оценка: (4, 100%)
    • СПАСИБО: 7418
    • Сообщений: 11138
    • Карма: 657
    • Пол: Мужской
    • Это я такой уже старый
    • Награды Гроссмейстер поисковой оптимизации SEO Профессионал Более трех тысяч спасибо За благотворительность Почетный гражданин нашего форума
      • Оптимизация и Продвижение
Яндекс и Сбер выпустили нейросетевые генераторы картинок. У Яндекса первые шаги, у Сбера следующая версия!!!

Яндекс показал прототип собственной нейросети для генерации картинок по текстовым запросам пользователей, рассказала компания. Это бета-версия мобильного приложения "Шедеврум" для iOS и Android. Чтобы генерировать собственные картинки, надо оставить заявку и получить её подтверждение; все пользователи могут смотреть и лайкать все картинки в общей ленте и лучшие на отдельной вкладке.

Шедеврум понимает русский и английский языки и очень любит конкретику. Чем подробнее описание, тем точнее результат. Нейросеть учитывает особые пожелания (например, «фотореализм» или «высокая детализация»), способна подражать известным живописцам и работать в заданных художественных стилях.

Нейросеть Шедеврума формирует изображения по методу каскадной диффузии: сначала создаёт картинки в соответствии с запросом, а затем поэтапно увеличивает их разрешение, насыщая деталями. Первую версию генеративной модели для бета-теста разработчики обучили на 240 миллионах примеров картинок с текстовыми описаниями. Обучение продолжается на наборе данных из 500 миллионов примеров — в следующих обновлениях качество будет поэтапно улучшаться.

К моменту финального релиза приложение сможет генерировать баннеры, иллюстрации, создавать изображения для интернет-витрин и не только.

Днём ранее "Сбер" выпустил уже следующую версию своей генеративной модели для создания изображений по описанию на естественном языке Kandinsky 2.1.

Она также может смешивать несколько рисунков, изменять их по текстовому описанию, генерировать изображения, похожие на заданное, дорисовывать недостающие части картинки и формировать изображения в режиме бесконечного полотна (inpainting/outpainting). Модель понимает запросы на 101 языке (включая русский и английский) и умеет рисовать в различных стилях.

Kandinsky 2.1 унаследовала веса предыдущей версии, обученной на один миллиард пар «текст — изображение», и была дополнительно обучена на 170 млн пар «текст — изображение» высокого разрешения. Затем она дообучалась на отдельно собранном датасете из двух миллионов пар качественных изображений. В данный сет попали картинки с описаниями в таких традиционно сложных для нейросетей областях, как тексты и лица людей.

Нейросеть также была усовершенствована за счет новой обученной модели автоэнкодера, которая используется в том числе в качестве декодера векторных представлений изображений. Это кардинально улучшило генерацию изображений в высоком разрешении: лица, сложные объекты и так далее. Благодаря этому новая модель содержит 3,3 млрд параметров вместо двух миллиардов в Kandinsky 2.0.

Кроме того, Kandinsky 2.1 использует не только закодированное текстовое описание, но и специальное представление изображения моделью CLIP. В таком виде нейросеть формирует представление картинки на основе текстовой информации и подает его на вход основной генеративной модели.

Модель умеет визуализировать любой контент и может применяться в различных отраслях. К примеру, в банковской сфере ее можно использовать для создания персонализированных маркетинговых решений, ярких образов продуктов, привлечения и удержания внимания клиентов.

Александр Ведяхин, первый заместитель председателя правления Сбербанка: "Обучая Kandinsky 2.1, мы учли мнения пользователей и реализовали смелую гипотезу, изучив самые передовые концепции. В результате мы разработали мощное универсальное решение для широкого круга задач на уровне лучших мировых аналогов. Оно открывает колоссальные возможности как для бизнеса, так и для населения. По сути, это еще один важный шаг к AGI — сильному искусственному интеллекту".

Оценить возможности нейросети можно на промостранице модели, при помощи команды «Запусти художника» на умных устройствах Sber и в мобильном приложении «Салют» и на платформе ML Space в хабе предобученных моделей и датасетов DataHub. Модель также доступна для использования на платформе Fusion Brain и в Telegram-боте.
Услуги: Сайты в топ за две неделм Мобильный, WatsApp., Viber +79964788889, telegram @xiceer.


Оффлайн Val_Ery

  • Бизнес оценка: (0)
  • Старожил
  • ****
  • СПАСИБО: 181
  • Сообщений: 317
  • Карма: 35

Оффлайн Val_Ery

  • Старожил
  • ****
До чего дошёл прогресс:
- тексты пишут в любом стиле (хочешь стихами, хочешь как Толстой... с вставками на французском);
- картины рисуют не как Малевич;
- распознают морды даже сильно размытого лица...

Следующей новостью, вероятно, будет:
"пoрноХаб представил третью версию своего генератора-бота. Пока она доступна в тестовом режиме владельцам устройств 'Настоящая реальность 3.0'."


Оффлайн vold57

  • Бизнес оценка: (6, 100%)
  • Мастер
  • *****
  • СПАСИБО: 5496
  • Сообщений: 7731
  • Карма: 300
  • Пол: Мужской
  • Награды Более трех тысяч спасибо Мастер поисковой оптимизации
    • Аудит и продвижение сайтов

Оффлайн vold57

  • Мастер
  • *****
Теперь стоит ждать от Яндекса выпуск своего дорвеегенератора.


 

Похожие темы

  Тема / Автор Ответов Последний ответ
6 Ответов
2758 Просмотров
Последний ответ 03-05-2011, 20:57:40
от john22207
3 Ответов
1512 Просмотров
Последний ответ 31-01-2012, 13:13:56
от nemetc
19 Ответов
5777 Просмотров
Последний ответ 30-11-2012, 14:16:25
от serioga81
14 Ответов
4264 Просмотров
Последний ответ 20-04-2013, 12:11:29
от Lex_idi
16 Ответов
4172 Просмотров
Последний ответ 30-10-2014, 21:58:52
от AMGH