Новая компания сооснователя Maps.Me Юрия Мельничка AIMatter сложилась совсем недавно, но к Новому году они уже успели запустить первый продукт — мобильное приложение Fabby. Оно играет в модной сейчас нише «нейросети для селфи», но у Мельничка большие планы и на приложение, и на компанию. О желании развивать IT в Беларуси, серьёзности забавных картинок, старой команде в новом проекте и новой команде в старом проекте Мельничек рассказал в интервью «Роем!».
Сергей Уланкин: Ты отошёл от операционного руководства Maps.me в начале года, но некоторое время оставался консультантом. Ты участвовал в выборе Евгения Лисовского на пост руководителя?
Юрий Мельничек: Конечно.
И почему выбрали именно его?
Мы смотрели в первую очередь на профессиональные качества: хотелось увидеть, с одной стороны, лидера, с другой стороны, чтобы он понимал и в маркетинге, и в бизнесе, и в мобильных продуктах. «Литрес» — это как раз история про мобильные продукты и маркетинг. И по личным, лидерским качествам Женя всем очень понравился. Как оказалось, мы не ошиблись. Мне очень нравится, какую он деятельность сейчас ведёт.
Ты имеешь в виду планы монетизировать сервис через Uber и доставку еды?
Это да. Но ещё пиар в open-source-сообществе, интеграция с Open Street Map — там тоже всё не просто, в этом он тоже молодец.
Лисовский, CEO Maps.me: Зачем Uber нужен свой картографический проект
Первый партнёр по монетизации Maps.me был Booking. Это же была ещё твоя идея?
На самом деле это была идея в самом первом бизнес-плане ещё лет пять назад. (смеётся) Но об этом лучше говорить в интервью с Женей.
Но раз задумка была твоя, то ты можешь оценить, правильно ли Maps.me сейчас всё делает. Есть Booking, Uber, Delivery Club, а дальше что? Ведь не так много таких глобальных компаний. Придётся спускаться на локальный уровень.
Есть глобальные агрегаторы еды, экскурсий и многих других вещей. Но я бы не сказал, что идея моя, она просто лежала на поверхности.
Что вы ещё пять лет назад в бизнес план написали?
Мы думали так: когда человек пользуется картой, то он либо знает, куда ему нужно, но не знает, как туда попасть, либо знает, какая ему услуга нужна, но не знает где. Ближайшие магазины, аптеки — все запросы так или иначе связаны с коммерцией. А путь из точки А в точку Б — это транспорт, не обязательно такси, есть и самолёты, и общественный транспорт.
Я правильно понимаю, что ты намекаешь на схему, отработанную в 2ГИС. Если ты ищешь ближайшую крафтовую бургерную, то первой строчкой тебе покажет ту бургерную, которая заплатила 2ГИС.
Такая схема тоже имеет право на жизнь. Вопрос в том, как это сделать не так навязчиво, как в 2ГИС. Если есть задача зарабатывать деньги, то можно смотреть и на конкурентов тоже.
Когда ты начинал Maps.me, не было ощущения, что вы выходите на занятый рынок?
Нет. Скорее был такой момент, когда все вокруг говорили, что Google всё-всё захватит.
И ещё когда мы начинали, все говорили, что пройдёт ещё три года и интернет будет везде, вообще везде. Зачем какой-то офлайн, кеширование делать? Чуть-чуть подождать, и интернет будет в каждой точке планеты.
А сейчас, Google советует разработчикам учитывать то, что их приложения используются часто там, где интернета нет.
Мы пошли против тренда. А оказалось, что тренд-то был ошибочным, а наше мнение — верным.
А сейчас у тебя нет ощущения, что Fabby тоже выходит на переполненный рынок?
Нет. Сейчас такое время, что технологии уже позволяют, а приложений мало. Можно придумать с десяток крутых применений, которые до сих пор не реализованы. Мне кажется, что сейчас ситуация диаметрально противоположная.
Есть мнение, что это быстро схлопывающийся тренд: вирусная волна популярности, которая быстро схлынет.
Если ничего не делать, может так и будет. Наша первоочередная задача сейчас — посмотреть реакцию рынка и кейсы, где наши технологии не работают. Пока это только развлекательное применение. Намного круче это всё будет работать в режиме реального времени. Например, можно будет менять фон, разговаривая по видео связи, что может быть полезно в корпоративной среде.
Сейчас уже есть идеи, как это можно применить на b2b-рынке?
Я уже сказал про самое очевидное — заменять фон во время видеосвязи, чтобы человек не видел, что происходит у тебя за спиной. К нам приходят запросы от товарищей, которые, условно говоря, пользуются продуктами Adobe — им нужно обтравливать фотографии, снимать на фоне зелёного экрана, но мы фокусируемся на b2c-рынке.
Я тоже хотел намекнуть на съёмку кино и наложение спецэффектов.
Когда технология будет на таком уровне, чтобы она подходила для тех, кто снимает кино — посмотрим. Мы ещё смотрим в сторону Twitch и прочих подобных вещей. Стримеры же обычно показывают себя поверх экрана с игрой.
Если набрать массив публичных фотографий и натренировать сеть на нём, то пользователи всё равно будут использовать приложение по-другому. Когда мы запустили пилот Fabby, то оказалось, что люди не фотографируются так, как выкладывают себя в публичное поле. В реальности и освещение хуже, и шумов больше, и позы немного другие. Всё приходит к тому, что идеально модель может обучаться только на реальных пользователях. Сейчас наша задача — научить модель всему разнообразию, что ей подсовывают. Как оказалось, люди любят специально фотографировать кошек, собак…
И это ты ещё про неприличные фотографии не говоришь.
(смеётся) Но я пока таких не видел, но думаю, что и они будут. Если серьёзно, мы будем либо их выкидывать, используя для определения другую нейронную сеть, либо делать так, чтобы у людей к ним не было доступа, только у алгоритмов.
Ты говорил, что спонсорские фильтры у вас будут проще, чем у конкурентов.
Если мы говорим про абстрактную Coca-Cola, то мне легко представить как сделать из неё прикольный фон. Если мы говорим про Prisma, то неочевидно, как натренировать сеть так, чтобы это было похоже на Coca-Cola. У Prisma очень круто получился стиль Gett, например. Но у Gett очень узнаваемая корпоративная стилистика. Это если мы говорим про нейростили. Если говорить про маски, то понятно, как можно рекламировать фильмы и некоторых других рекламодателей, но в основном это менее очевидные способы. Если говорить про замену фона, то здесь это сделать проще и вариативность больше.
Расскажи про скорый запуск видео — как это будет выглядеть? Движущийся человек и движущийся фон или статичный фон?
Движущийся человек и слегка движущийся фон. Мы хотим, чтобы с помощью Fabby можно было записать новогоднее поздравление и отправить его друзьям.
Можно сказать, что вы специально торопились запуститься до Нового года?
Да. И ещё мы хотели успеть чуть раньше, чем начнётся зашумление всех каналов брендами, распродажами и всем остальным.
Юрий Гурский был ментором Prisma, ментором MSQRD. Можно сказать, что он серийный ментор приложений с прикольными картиночками. Чем он занимается в Fabby?
Он помогает со стратегией, с маркетингом, с продуктом.
Со всем то есть?
Кодить не помогает.
Какая у вас долгосрочная цель? Хотите растить большую компанию, которая будет заниматься компьютерным зрением, или цель — продаться Facebook или Snapchat?
Долгосрочная цель у нас такая — делать в Беларуси исследовательский центр по нейросетям, компьютерному зрению и распознаванию звука. Fabby мы сейчас немного отделяем от этих планов. AIMatter сейчас работает над одним продуктом, а потом посмотрим. Мне нравится такой пример: все школьники хотят стать космонавтами, а в процессе обучения их планы меняются. Я, правда, программистом хотел стать…
Мечта сбылась.
(смеётся) Но вообще дети хотят стать космонавтами, а потом как сложится. Сложно строить стратегию в начале пути. Понятно, кому бы это хотелось купить. Понятно, как на этом зарабатывать, если строить отдельный продукт и развивать. Сейчас мы просто работаем над тем, чтобы алгоритмы работали идеально и продукт был интересен пользователю. Если всё это получится, то куда это потом вести — меньший из вопросов.
Ты упомянул компьютерное звукораспознавание. Чем вам эта сфера интересна и что в ней сейчас происходит?
Вся концепция нейронных сетей хорошо зашла в компьютерное зрение. А в звуке всё ещё много проблем, поэтому говорю я об этом осторожно. Сейчас у нас есть путь от фото к видео, а звук является важной частью видео. Потому он нам и интересен с продуктовой точки зрения.
Я слышал много команд, которые пытались применить концепцию Леона Гатиса для звука (она используется для нейростилей, когда алгоритм учиться воспроизводить одно изображение в стиле другого — «Роем!»), но никаких выдающихся результатов пока не добились. Я думаю, что во многом это — вопрос времени, но, с другой стороны, дух предпринимательства заставляет нас заниматься этим. Но афишировать что-то пока ещё очень рано.
В чём разница между Prisma, Artisto и Vinci — с технической точки зрения
Looksery из Украины, MSQRD из Беларуси, Prisma из России. Почему именно славяне делают популярные приложения для обработки картинок?
Во-первых, здесь нужно сказать, что у Prisma и MSQRD был общий ментор.
Когда что-то начинает хорошо расти, то информация распространяется по кругу общения. Я не был в Китае, но говорят, что у них есть области, которые занимаются только одним каким-то видом производства. Просто исторически так сложилось — у кого-то стало получаться, информация стала распространяться в этой области, и все стали заниматься этим. Возможно это просто близкий язык и география.
Хочешь сказать, что делать приложения для обработки фото — это наш особый славянский путь?
Ну это не то чтобы путь. Просто случился перенос знаний. Сейчас как раз есть такая модная концепция в нейронных сетях — когда ты её учишь чему-то одному, а потом она быстро принимает другие знания.
Ещё нужно понимать, что, не буду говорить за Россию, но в Беларуси, если ты молодой умный человек, ты хочешь остаться в стране и жить достойной жизнью, идти в IT — это единственное, что ты можешь сделать. В России есть ещё газ и нефть, а в Беларуси только IT. В Украине такая же ситуация, насколько я знаю.
Добавить 13 комментариев
Стоит добавить, что со времени интервью вышла вот эта интересная работа в области стилизации звука http://dmitryulyanov.github.io/audio-texture-synthesis-and-style-transfer/
Так и в России похоже скоро достойная жизнь будет только на экспортном IT
Почему, ещё на попиле бюджетов всех уровней.
«Looksery из Украины, MSQRD из Беларуси, Prisma из России. Почему именно славяне делают популярные приложения для обработки картинок?»
Это не совсем правильный вопрос. Славяне — не единый этнос.
Между Богемией и Карелией не может быть такого.
Славяноязычные.
Вот вы нашли к чему придраться. :-)
Это не славяноязычные, это русские.
Ну приедь в Прагу, Львов, Варшаву. Заяви им что они русские.
Они тебе объяснят кто они.
> Looksery из Украины, MSQRD из Беларуси, Prisma из России
> Прагу, Львов, Варшаву
>Между Богемией и Карелией
>Это не славяноязычные, это русские.
Вникай кто ваши этнические родственники. http://cs10252.vkontakte.ru/u7012630/128426563/z_e6071fd9.jpg
Белорусы — балты, Россияне — фино-угры, Украинцы — скифы.
Черепомер в треде!
Русские фашисты дерутся с нерусскими фашистами! Мимими!
Археологию приравняли к фашизму?
Ну вы больные люди..
И какое отношение эта древняя археология имеет к современным государствообразующим народам? Я чот залип на карту минут на 5 и вообще связь не смог вычленить. Какая-то она очень абстрактная. Там даже Америки нет — вот бы они удивились, чьими родственниками их бы назвали согласно «археологии не равной фашизму».