«Мы искусственно сдерживаем рост» Интервью одного из основателей Prisma Алексея Моисеенкова
Российскому приложению Prisma, которое с помощью нейросетей превращает любую фотографию в картину, всего десять дней. За это время пользователи скачали его миллион раз, с его помощью нарисовали миллионы картин, а сама Prisma стала одним из обязательных приложений для тех, кто активно ведет инстаграм. Заместитель главного редактора «Медузы» Александр Поливанов и издатель Илья Красильщик поговорили с одним из основателей Prisma Алексеем Моисеенковым — о том, как работает приложение и почему нейросети изменят нашу жизнь.
— Давайте начнем с актуальных цифр. Сколько у приложения скачиваний?
— У нас миллион скачиваний за пять дней. Мы в сторе [в AppStore] с 11 июня. До 16-го было пять тысяч скачиваний, причем из них я сам сделал около двух тысяч, чтобы просто проверить сервер. Вчера мы обработали два с половиной миллиона фотографий.
— Как сервера поживают?
— Ну, плохо. Но мы потихоньку стабилизируемся, добавляем мощность, увеличиваемся, к какому-то моменту мы станем очень стабильны, где-то, наверное, к концу недели. У нас был один реальный форс-мажор — вырубилось три ключевых сервера, и мы, как я это называю, горели. Легли на 30 минут.
— А что происходит не в России?
— Мы пока искусственно сдерживаем рост не в России. Во-первых, если какая-то знаменитость хочет запостить что-то с помощью Prisma, мы просим пока этого не делать. Во-вторых, я могу закрывать сторы руками в риалтайме (AppStore дает возможность не распространять приложение в конкретных странах; например, вы можете дать возможность скачивать приложения пользователям российского AppStore, но не выпускать приложение в США — прим. «Медузы»).
— Сколько человек делают Prisma?
— Сооснователей четыре человека, ну и кто-то еще просто помогал. Одна моя знакомая стили помогала подбирать, например. Сам я давно кодингом уже не занимаюсь.
— А сколько вы делали приложение?
— Два месяца.
— У вас есть план по поводу того, что делать дальше?
— Да. Мы явно многое улучшим. У нас уже есть запас из 50 фильтров — но сначала разберемся с нагрузкой.
— Каких фильтров ждать?
— Я еще даже сам не знаю, но мне нравятся комиксные фильтры. Ждите, что еще будет какой-то комиксный фильтр.
— Как делается новый фильтр?
— Есть нейросеть, точнее, комплекс нейросетей, его надо будет обучить, прогнать через кучу-кучу изображений, потом подсунуть ему изображение художника — или телевизора, что угодно, любое изображение ему подсунуть, сказать, что надо делать. И дальше нужно смотреть, какой выходит результат. Ты один раз сделал такую операцию, получил какой-то результат. Результат может быть совершенно разный, от совсем непотребности до «вау, как круто».
— Идиотский вопрос. Как работают нейросети?
— Как работают нейросети? Это слои. Слой — набор нейронов, правил прохождения каждой цифры. Мы настраиваем правила для прохождения через слои.
— Окей, мы ничего не поняли. Тогда такой вопрос: мы постоянно видим какие-то удивительные вещи, связанные с нейросетями. Что в последнее время случилось? Почему такое невероятное количество проектов построено на нейросетях именно сейчас? Что с этой технологией произошло за последнее время?
— Фишка в том, что за последний год — может, даже чуть больше — произошел существенный рывок в нескольких областях, которые помогают нейросетям работать. Во-первых, стали сильно лучше понимать математику, вот именно саму модель, как все устроено.
Второе — возросли допустимые мощности, стало легче вычислять. Еще получилось так, что к текущему моменту в случае нейросетей можно решать достаточно узкий класс задач — и это очень хорошо, потому что под конкретную задачу все проще настраивать. Можно, например, взять и сказать: я буду распознавать китайские крики болельщиков. И для этой задачи можно создать очень-очень хорошего качества продукт, он будет реально распознавать эти китайские крики болельщиков, но не будет распознавать не крики, не китайские — и не болельщиков.
— То есть все задачи очень прикладные.
— Да, да. Еще очень важный момент: нейросети решают только три категории задач, не надо их распространять на все. Это: изображение — в том числе видео, речь и текст. Все остальное не очень хорошо подходит.
— Еще один дилетантский вопрос. А где в нейросетях человек? Вот машина что-то тебе нарисовала. Ты понимаешь: это не подходит. Выходит, все равно нужен человек, редактор, за которым последнее слово.
— Допустим, мы распознаем китайские крики болельщиков, и нам машина говорит, что это — китайский крик. А ты говоришь: блин, не может быть! Проблема в том, что машина не может оценить общую модель, ее параметры. Они как-то там настраиваются, но оценить параметры автоматически очень сложно. Например, мы скормим нейросети Льва Толстого, она будет писать Львом Толстым. Но когда ты прочитаешь это, ты узнаешь стиль Льва Толстого, но, например, не будет связности текста. Вот тут нужен человек.
— «Призма» — это очень круто, но это игрушка. Все восхищаются, как невероятно круто она работает. Какой следующий этап для технологии в целом? Как она сможет помочь нам в жизни?
— Все идет к некоему искусственному интеллекту, который умеет под тебя подстраиваться. Это генеральная мысль. А если более близко к современной реальности, то нейросети — это, скорее, очень хорошее решение для прикладных задач. Например, ты — ГИБДД, и ищешь машину. Тогда ты обращаешься к нейросетям, которые могут распознавать номера. Тебе не нужен человек, ты пустил дрона какого-нибудь, он все пролетел и все рассказал автоматом — очень быстро, стопроцентное попадание, все номера распознались.
— Вам не кажется, что все это ведет к тотальному уничтожению приватности?
— Это может случиться. Если везде будут стоять камеры, можно будет распознавать все лица. Такой сценарий возможен.
— Вернемся к Prisma. Если к вам завтра придет Facebook, вы продадитесь?
— Завтра он не придет.
— К MSQRD же пришел.
— К ним пришел через несколько месяцев.
— Это одно и то же.
— Вопрос сложный. Вероятность есть, конечно. Просто это все может зарабатывать само по себе, но, действительно, если думать глобально, то, скорее, оно логично бы смотрелось у какого-то крупного социального игрока, с большой аудиторией, которая уже каким-то образом потребляет фотографии или видео.
— А сколько вы своих денег потратили уже на проект?
— Я не могу сосчитать точную сумму, но там немного. То есть нет речи о каких-то там миллионах. Это немного денег, в рамках зарплат. К тому же у нас практически сразу был партнер по серверам.
— Сегодня стало известно, что инвестором Prisma стала Mail.ru. Сколько компания в вас вложила?
— Я не могу об этом говорить.
— Правильно ли мы понимаем, что проект к Mail.ru изначально не имеет отношения никакого, кроме того, что вы являлись до сегодняшнего дня сотрудником Mail.ru?
— Да.
— То есть это абсолютно независимый проект?
— Конечно.
— У вас есть какие-то дальнейшие планы по поводу применения этой технологии?
— Изначально мы делали именно Prisma. Но мысль, конечно, сильно дальше есть.
— Это секрет?
— Если придете ко мне через неделю, расскажу.
— Давайте начнем с актуальных цифр. Сколько у приложения скачиваний?
— У нас миллион скачиваний за пять дней. Мы в сторе [в AppStore] с 11 июня. До 16-го было пять тысяч скачиваний, причем из них я сам сделал около двух тысяч, чтобы просто проверить сервер. Вчера мы обработали два с половиной миллиона фотографий.
— Как сервера поживают?
— Ну, плохо. Но мы потихоньку стабилизируемся, добавляем мощность, увеличиваемся, к какому-то моменту мы станем очень стабильны, где-то, наверное, к концу недели. У нас был один реальный форс-мажор — вырубилось три ключевых сервера, и мы, как я это называю, горели. Легли на 30 минут.
— А что происходит не в России?
— Мы пока искусственно сдерживаем рост не в России. Во-первых, если какая-то знаменитость хочет запостить что-то с помощью Prisma, мы просим пока этого не делать. Во-вторых, я могу закрывать сторы руками в риалтайме (AppStore дает возможность не распространять приложение в конкретных странах; например, вы можете дать возможность скачивать приложения пользователям российского AppStore, но не выпускать приложение в США — прим. «Медузы»).
— Сколько человек делают Prisma?
— Сооснователей четыре человека, ну и кто-то еще просто помогал. Одна моя знакомая стили помогала подбирать, например. Сам я давно кодингом уже не занимаюсь.
— А сколько вы делали приложение?
— Два месяца.
— У вас есть план по поводу того, что делать дальше?
— Да. Мы явно многое улучшим. У нас уже есть запас из 50 фильтров — но сначала разберемся с нагрузкой.
— Каких фильтров ждать?
— Я еще даже сам не знаю, но мне нравятся комиксные фильтры. Ждите, что еще будет какой-то комиксный фильтр.
— Как делается новый фильтр?
— Есть нейросеть, точнее, комплекс нейросетей, его надо будет обучить, прогнать через кучу-кучу изображений, потом подсунуть ему изображение художника — или телевизора, что угодно, любое изображение ему подсунуть, сказать, что надо делать. И дальше нужно смотреть, какой выходит результат. Ты один раз сделал такую операцию, получил какой-то результат. Результат может быть совершенно разный, от совсем непотребности до «вау, как круто».
Алексей Моисеенков, обработанный одним из фильтров Prisma
Фото из личного архива
Фото из личного архива
— Идиотский вопрос. Как работают нейросети?
— Как работают нейросети? Это слои. Слой — набор нейронов, правил прохождения каждой цифры. Мы настраиваем правила для прохождения через слои.
— Окей, мы ничего не поняли. Тогда такой вопрос: мы постоянно видим какие-то удивительные вещи, связанные с нейросетями. Что в последнее время случилось? Почему такое невероятное количество проектов построено на нейросетях именно сейчас? Что с этой технологией произошло за последнее время?
— Фишка в том, что за последний год — может, даже чуть больше — произошел существенный рывок в нескольких областях, которые помогают нейросетям работать. Во-первых, стали сильно лучше понимать математику, вот именно саму модель, как все устроено.
Второе — возросли допустимые мощности, стало легче вычислять. Еще получилось так, что к текущему моменту в случае нейросетей можно решать достаточно узкий класс задач — и это очень хорошо, потому что под конкретную задачу все проще настраивать. Можно, например, взять и сказать: я буду распознавать китайские крики болельщиков. И для этой задачи можно создать очень-очень хорошего качества продукт, он будет реально распознавать эти китайские крики болельщиков, но не будет распознавать не крики, не китайские — и не болельщиков.
— То есть все задачи очень прикладные.
— Да, да. Еще очень важный момент: нейросети решают только три категории задач, не надо их распространять на все. Это: изображение — в том числе видео, речь и текст. Все остальное не очень хорошо подходит.
— Еще один дилетантский вопрос. А где в нейросетях человек? Вот машина что-то тебе нарисовала. Ты понимаешь: это не подходит. Выходит, все равно нужен человек, редактор, за которым последнее слово.
— Допустим, мы распознаем китайские крики болельщиков, и нам машина говорит, что это — китайский крик. А ты говоришь: блин, не может быть! Проблема в том, что машина не может оценить общую модель, ее параметры. Они как-то там настраиваются, но оценить параметры автоматически очень сложно. Например, мы скормим нейросети Льва Толстого, она будет писать Львом Толстым. Но когда ты прочитаешь это, ты узнаешь стиль Льва Толстого, но, например, не будет связности текста. Вот тут нужен человек.
— «Призма» — это очень круто, но это игрушка. Все восхищаются, как невероятно круто она работает. Какой следующий этап для технологии в целом? Как она сможет помочь нам в жизни?
— Все идет к некоему искусственному интеллекту, который умеет под тебя подстраиваться. Это генеральная мысль. А если более близко к современной реальности, то нейросети — это, скорее, очень хорошее решение для прикладных задач. Например, ты — ГИБДД, и ищешь машину. Тогда ты обращаешься к нейросетям, которые могут распознавать номера. Тебе не нужен человек, ты пустил дрона какого-нибудь, он все пролетел и все рассказал автоматом — очень быстро, стопроцентное попадание, все номера распознались.
— Вам не кажется, что все это ведет к тотальному уничтожению приватности?
— Это может случиться. Если везде будут стоять камеры, можно будет распознавать все лица. Такой сценарий возможен.
— Вернемся к Prisma. Если к вам завтра придет Facebook, вы продадитесь?
— Завтра он не придет.
— К MSQRD же пришел.
— К ним пришел через несколько месяцев.
— Это одно и то же.
— Вопрос сложный. Вероятность есть, конечно. Просто это все может зарабатывать само по себе, но, действительно, если думать глобально, то, скорее, оно логично бы смотрелось у какого-то крупного социального игрока, с большой аудиторией, которая уже каким-то образом потребляет фотографии или видео.
— А сколько вы своих денег потратили уже на проект?
— Я не могу сосчитать точную сумму, но там немного. То есть нет речи о каких-то там миллионах. Это немного денег, в рамках зарплат. К тому же у нас практически сразу был партнер по серверам.
— Сегодня стало известно, что инвестором Prisma стала Mail.ru. Сколько компания в вас вложила?
— Я не могу об этом говорить.
— Правильно ли мы понимаем, что проект к Mail.ru изначально не имеет отношения никакого, кроме того, что вы являлись до сегодняшнего дня сотрудником Mail.ru?
— Да.
— То есть это абсолютно независимый проект?
— Конечно.
— У вас есть какие-то дальнейшие планы по поводу применения этой технологии?
— Изначально мы делали именно Prisma. Но мысль, конечно, сильно дальше есть.
— Это секрет?
— Если придете ко мне через неделю, расскажу.
Заметили ошибку? Пожалуйста, выделите её и нажмите Ctrl+Enter
Дорогие читатели, не имея ресурсов на модерацию и учитывая нюансы белорусского законодательства, мы решили отключить комментарии. Но присоединяйтесь к обсуждениям в наших сообществах в соцсетях! Мы есть на Facebook, «ВКонтакте», Twitter и Одноклассники