Лянь Вэньфэн - таинственный основатель DeepSeek, который перевернул мир ИИ
До 20 января лицо создателя китайского инструмента искусственного интеллекта не было известно широкой публике. В тот день 40-летнего мужчину показало китайское телевидение. Что о нем известно?
Еще несколько недель назад мало кто за пределами мира китайских финансов знал имя Лян Вэньфэна (Liang Wenfeng). 20 января по китайскому телевидению был показан сюжет о встрече премьер-министра Госсовета Китая Ли Цяна с небольшой группой экспертов в области искусственного интеллекта во главе с этим 40-летним мужчиной.
Для Китая это было первое знакомство с новым героем технологической гонки с США, который 20 января представил свою новую модель искусственного интеллекта DeepSeek-R1, открытую и бесплатную, созданную с использованием в разы меньшего финансирования и вычислительных мощностей.
Так кто же этот человек, создатель стартапа, который вызвал ажиотаж в Силиконовой долине и нервозность на Уолл-стрит?
Лян Вэньфэн, родился в 1985 году в портовом городе Чжанчжоу на юге Китая. Еще во время учебы в университете в Ханчжоу он увлекся финансовым моделированием, вдохновленный успехами хедж-фонда Renaissance.
Парень писал первые алгоритмы для анализа рынка, а в 2013 году, через несколько лет после получения диплома, вместе с однокурсниками основал количественный инвестиционный фонд, который использовал моделирование больших данных для прогнозирования рыночной динамики и частичной автоматизации инвестиционных решений.
В 2015 году, когда китайский фондовый рынок пережил бурный рост, а затем кризис, это открыло возможности для опытных трейдеров. Основанный в тот же год второй фонд Лян Вэньфэна, High-Flyer, принес значительную прибыль. К 2019 году его активы выросли с 1 до 10 миллиардов юаней (с 130 миллионов до 1,3 миллиарда евро).
Полноценно сосредоточившись на трейдинге с использованием ИИ, Вэньфэн инвестировал в вычислительные мощности: High-Flyer закупил суперкомпьютеры на 156 миллионов евро и успел приобрести 10 000 карток Nvidia A100 до введения санкций США против Китая в 2022 году. Но уже тогда его внимание было направлено дальше — на создание «общего искусственного интеллекта», который должен превзойти человеческий.
Инвестиции для DeepSeek Вэньфэн берет из High-Flyer и привлекает на работу молодых выпускников без опыта, считая, что «те, кто не знает готовых решений, ищут новые». Сам он продолжает писать код, читать научные статьи и участвовать в обсуждениях DeepSeek. Как отмечают эксперты, Китай имеет два ключевых преимущества: многочисленные таланты в математике и большие массивы данных для обучения ИИ.
DeepSeek нашел новый подход к обучению ИИ. В то время как другие модели просто накапливают знания, DeepSeek был обучен лучше искать ответы с помощью метода «обучения с подкреплением». При нем система сама задает себе вопросы и получает награды (например, дополнительные баллы или улучшение ее возможностей), если ее решения верны. Это делает ее менее быстрой, но значительно более эффективной в потреблении энергии.
В результате DeepSeek-R1 оказался до 27 раз дешевле OpenAI o1 в расчете на запрос. Кроме того, DeepSeek был обучен всего на 2 048 видеокартах, которые Nvidia теперь поставляет в Китай в ограниченном виде, что ставит под вопрос эффективность американских санкций.
Такой подход вызвал интерес даже в США. По мнению экспертов, эффективность китайской модели ИИ по отношению к стоимости делает их более доступными.
Однако DeepSeek имеет и свои ограничения. Модель склонна к генерации недостоверных фактов. Кроме того, при вопросах о политике или истории КНР она часто предлагает «поговорить о чем-то другом», что свидетельствует о встроенной цензуре.
Как отмечает издание, после запуска ChatGPT в 2022 году Китай столкнулся с американской превосходством в ИИ и технологическими ограничениями, введенными Вашингтоном. Первоначальные попытки китайских разработчиков не дотягивали до уровня OpenAI. Однако теперь DeepSeek убедил даже национальных лидеров в возможности технологической победы.
Сам Лян Вэньфэн заявляет, что больше не ищет богатства, а стремится к прорывам, чтобы Китай мог находиться в авангарде технологий. И теперь именно американские инженеры изучают код DeepSeek, чтобы увидеть его секреты.
Лян Вэньфэн (справа) во время встречи с премьером Госсовета Китая Ли Цян. Скрин фото: ShanghaiEyeMagic / YouTube
Еще несколько недель назад мало кто за пределами мира китайских финансов знал имя Лян Вэньфэна (Liang Wenfeng). 20 января по китайскому телевидению был показан сюжет о встрече премьер-министра Госсовета Китая Ли Цяна с небольшой группой экспертов в области искусственного интеллекта во главе с этим 40-летним мужчиной.
«Одет в светлый костюм и светло-серый свитер, когда все остальные выбрали темные пиджаки. Непослушные пряди волос небрежно падали на массивную оправу очков, что еще больше придавало его внешнему облику вид гика. Таким он появился впервые в главном выпуске новостей государственного телевидения в 7 вечера», — пишет Le Mond.
Для Китая это было первое знакомство с новым героем технологической гонки с США, который 20 января представил свою новую модель искусственного интеллекта DeepSeek-R1, открытую и бесплатную, созданную с использованием в разы меньшего финансирования и вычислительных мощностей.
Так кто же этот человек, создатель стартапа, который вызвал ажиотаж в Силиконовой долине и нервозность на Уолл-стрит?
Лян Вэньфэн, родился в 1985 году в портовом городе Чжанчжоу на юге Китая. Еще во время учебы в университете в Ханчжоу он увлекся финансовым моделированием, вдохновленный успехами хедж-фонда Renaissance.
Парень писал первые алгоритмы для анализа рынка, а в 2013 году, через несколько лет после получения диплома, вместе с однокурсниками основал количественный инвестиционный фонд, который использовал моделирование больших данных для прогнозирования рыночной динамики и частичной автоматизации инвестиционных решений.
В 2015 году, когда китайский фондовый рынок пережил бурный рост, а затем кризис, это открыло возможности для опытных трейдеров. Основанный в тот же год второй фонд Лян Вэньфэна, High-Flyer, принес значительную прибыль. К 2019 году его активы выросли с 1 до 10 миллиардов юаней (с 130 миллионов до 1,3 миллиарда евро).
Полноценно сосредоточившись на трейдинге с использованием ИИ, Вэньфэн инвестировал в вычислительные мощности: High-Flyer закупил суперкомпьютеры на 156 миллионов евро и успел приобрести 10 000 карток Nvidia A100 до введения санкций США против Китая в 2022 году. Но уже тогда его внимание было направлено дальше — на создание «общего искусственного интеллекта», который должен превзойти человеческий.
Лян Вэньфэн в 2019 году. Фото: VCG/VCG via Getty Images
Создание DeepSeek
Инвестиции для DeepSeek Вэньфэн берет из High-Flyer и привлекает на работу молодых выпускников без опыта, считая, что «те, кто не знает готовых решений, ищут новые». Сам он продолжает писать код, читать научные статьи и участвовать в обсуждениях DeepSeek. Как отмечают эксперты, Китай имеет два ключевых преимущества: многочисленные таланты в математике и большие массивы данных для обучения ИИ.
DeepSeek нашел новый подход к обучению ИИ. В то время как другие модели просто накапливают знания, DeepSeek был обучен лучше искать ответы с помощью метода «обучения с подкреплением». При нем система сама задает себе вопросы и получает награды (например, дополнительные баллы или улучшение ее возможностей), если ее решения верны. Это делает ее менее быстрой, но значительно более эффективной в потреблении энергии.
В результате DeepSeek-R1 оказался до 27 раз дешевле OpenAI o1 в расчете на запрос. Кроме того, DeepSeek был обучен всего на 2 048 видеокартах, которые Nvidia теперь поставляет в Китай в ограниченном виде, что ставит под вопрос эффективность американских санкций.
Такой подход вызвал интерес даже в США. По мнению экспертов, эффективность китайской модели ИИ по отношению к стоимости делает их более доступными.
Однако DeepSeek имеет и свои ограничения. Модель склонна к генерации недостоверных фактов. Кроме того, при вопросах о политике или истории КНР она часто предлагает «поговорить о чем-то другом», что свидетельствует о встроенной цензуре.
Как отмечает издание, после запуска ChatGPT в 2022 году Китай столкнулся с американской превосходством в ИИ и технологическими ограничениями, введенными Вашингтоном. Первоначальные попытки китайских разработчиков не дотягивали до уровня OpenAI. Однако теперь DeepSeek убедил даже национальных лидеров в возможности технологической победы.
Сам Лян Вэньфэн заявляет, что больше не ищет богатства, а стремится к прорывам, чтобы Китай мог находиться в авангарде технологий. И теперь именно американские инженеры изучают код DeepSeek, чтобы увидеть его секреты.
Заметили ошибку? Пожалуйста, выделите её и нажмите Ctrl+Enter
Дорогие читатели, не имея ресурсов на модерацию и учитывая нюансы белорусского законодательства, мы решили отключить комментарии. Но присоединяйтесь к обсуждениям в наших сообществах в соцсетях! Мы есть на Facebook, «ВКонтакте», Twitter и Одноклассники