Deprecated: Creation of dynamic property Yoast\Presenters\CommonArticlePresenter::$metaPropertyType is deprecated in /var/www/html/web/app/themes/tutortop-blog/Yoast/Presenters/CommonArticlePresenter.php on line 26

Deprecated: Creation of dynamic property Yoast\Presenters\CommonArticlePresenter::$metaPropertyType is deprecated in /var/www/html/web/app/themes/tutortop-blog/Yoast/Presenters/CommonArticlePresenter.php on line 26

Deprecated: Creation of dynamic property Yoast\Presenters\CommonArticlePresenter::$metaPropertyType is deprecated in /var/www/html/web/app/themes/tutortop-blog/Yoast/Presenters/CommonArticlePresenter.php on line 26
Кто создал нейросети: история от первых моделей до ChatGPT и Midjourney
Дата обновления: 01 Августа 2025
11.07.2025
263
14.5 мин

Кто создал нейросети: от пионеров до современных архитекторов искусственного интеллекта

Пионеры нейросетей: закладка фундамента (1940-1960)

История нейронных сетей начинается с революционной работы Уоррена Маккалоха и Уолтера Питтса в 1943 году. Эти два ученых из Чикагского университета опубликовали статью «A Logical Calculus of the Ideas Immanent in Nervous Activity», которая стала краеугольным камнем всей современной нейроинформатики.

Маккалох, нейрофизиолог по образованию, и Питтс, математик-самоучка, создали первую математическую модель искусственного нейрона. Их модель была крайне упрощенной — нейрон мог находиться только в двух состояниях (активен или неактивен), но это было началом. Как позже вспоминал сам Маккалох: «Мы понимали, что создаем нечто фундаментально новое — мост между биологией и математикой».

Следующий важный шаг сделал Дональд Хебб в 1949 году, сформулировав знаменитое «правило Хебба»: «Нейроны, которые активируются вместе, связываются вместе». Это правило до сих пор является основой многих алгоритмов обучения нейросетей. Хебб работал в Университете Макгилла в Монреале и его книга «The Organization of Behavior» заложила теоретические основы машинного обучения.

Но настоящий прорыв произошел в 1957 году, когда Фрэнк Розенблатт из Корнельского университета создал перцептрон — первую обучаемую нейронную сеть. Розенблатт не только разработал теоретическую модель, но и построил физическое устройство «Марк-1», которое могло распознавать простые изображения. Устройство весило около 5 тонн и занимало целую комнату, но это была первая в мире работающая нейросеть.

Люди создают первую нейросеть

Кто придумал ChatGPT: от OpenAI до современных языковых моделей

ChatGPT — это результат работы команды OpenAI, основанной в 2015 году группой предпринимателей и исследователей во главе с Сэмом Альтманом, Илоном Маском, Грегом Брокманом и другими. Однако технические корни ChatGPT уходят гораздо глубже.

Ключевую роль в создании ChatGPT сыграл Алек Рэдфорд, главный исследователь OpenAI, который возглавил разработку серии моделей GPT (Generative Pre-trained Transformer). Первая версия GPT была представлена в 2018 году и содержала 117 миллионов параметров. GPT-2, выпущенная в 2019 году, уже имела 1.5 миллиарда параметров, а GPT-3 (2020) — поражающие 175 миллиардов.

Архитектура трансформера, лежащая в основе ChatGPT, была разработана командой Google в 2017 году под руководством Ашиша Васвани. Их статья «Attention Is All You Need» произвела революцию в обработке естественного языка. Васвани и его коллеги — Ноам Шазир, Ники Пармар, Якоб Ушкорайт, Ллион Джонс, Айдан Гомес, Лукаш Кайзер и Илья Полосухин — создали механизм внимания (attention), который позволил нейросетям эффективно работать с последовательностями данных.

Интересный факт: команда разработчиков ChatGPT потратила более 100 миллионов долларов только на вычислительные ресурсы для обучения модели нейросети. По данным OpenAI, процесс обучения GPT-3 занял несколько месяцев и потребовал использования тысяч GPU.

Кто придумал Midjourney: революция в генерации изображений

Midjourney создал Дэвид Хольц — предприниматель и исследователь, ранее работавший в области аппараты дополненной реальности в компании Leap Motion. Хольц основал Midjourney Inc. в 2021 году в Сан-Франциско, собрав небольшую команду из 11 человек.

В отличие от многих других AI-стартапов, Midjourney изначально фокусировалась исключительно на генерации изображений. Хольц и его команда построили свою систему на основе диффузионных моделей — технологии, которая была разработана в академических кругах несколькими годами ранее.

Технологические основы Midjourney базируются на работах нескольких исследовательских групп. Ключевую роль сыграли исследования Яна Гудфеллоу по генеративно-состязательным сетям (GAN), опубликованные в 2014 году, и более поздние работы по диффузионным моделям от команд Стэнфордского университета и OpenAI.

Особенность подхода Midjourney заключается в том, что они не публикуют научные статьи и держат многие технические детали в секрете. Как говорит сам Хольц: «Мы больше сосредоточены на создании продукта, который люди любят использовать, чем на публикации в академических журналах».

К концу 2023 года Midjourney обслуживает более 15 миллионов пользователей и генерирует свыше 2 миллионов изображений в день. Удивительно, но вся эта система управляется командой из менее чем 20 человек.

Другие создатели нейросетей: от академических лабораторий до технологических гигантов

Развитие нейросетей — это не история одного или двух прорывов, а результат десятилетий исследований сотен ученых по всему миру. Рассмотрим ключевые фигуры, которые определили современный облик искусственного интеллекта.

Джеффри Хинтон, которого часто называют «крестным отцом глубокого обучения», работал над нейросетями с 1970-х годов. В Университете Торонто он разработал алгоритм обратного распространения ошибки (backpropagation) совместно с Дэвидом Румельхартом и Рональдом Уильямсом в 1986 году. Этот алгоритм до сих пор является основой обучения большинства нейросетей.

Ян Лекун, работавший в Bell Labs, а затем в Facebook (Meta), создал сверточные нейронные сети (CNN) в 1980-х годах. Его работы легли в основу современного компьютерного зрения. Лекун также разработал знаменитую базу данных MNIST для распознавания рукописных цифр, которая стала стандартом для тестирования алгоритмов машинного обучения.

Йошуа Бенджио из Университета Монреаля внес фундаментальный вклад в развитие рекуррентных нейронных сетей и алгоритмов обработки естественного языка. Вместе с Хинтоном и Лекуном он получил Тьюринговскую премию в 2018 году за вклад в развитие глубокого обучения.

В корпоративном мире особую роль играют исследовательские подразделения технологических гигантов. Google DeepMind, основанная Демисом Хассабисом, создала AlphaGo — первую AI-систему, победившую чемпиона мира по го. Команда DeepMind также разработала AlphaFold, которая решила проблему предсказания структуры белков.

Facebook AI Research (FAIR) под руководством Яна Лекуна разработала множество открытых инструментов для машинного обучения, включая PyTorch — одну из самых популярных библиотек для работы с нейросетями.

Исследователь/КомандаКлючевой вкладГодВлияние на современные нейросети
Маккалох и ПиттсПервая модель искусственного нейрона1943Теоретическая основа всех нейросетей
Фрэнк РозенблаттПерцептрон и первая обучаемая нейросеть1957Концепция обучения с учителем
Джеффри ХинтонАлгоритм обратного распространения1986
Основа обучения глубоких сетей
Команда Google (Васвани и др.)Архитектура трансформера2017Основа ChatGPT и языковых моделей
OpenAI (Альтман, Рэдфорд)Серия моделей GPT2018-2022Коммерциализация больших языковых моделей

Современные архитекторы нейросетевых систем

Современный этап развития нейросетей характеризуется переходом от академических исследований к масштабному коммерческому применению. Ключевые игроки сегодня — это не только отдельные исследователи, но и крупные команды в технологических компаниях.

В Google работает команда из более чем 2000 исследователей AI, включая таких звезд как Джефф Дин (архитектор TensorFlow), Орьол Виньялс (создатель AlphaStar) и Барбара Краус (специалист по этике AI). Google Brain и DeepMind объединились в 2023 году, создав мощнейшую исследовательскую группу в области AI.

Microsoft инвестировала более 10 миллиардов долларов в OpenAI и интегрировала технологии GPT в свои продукты. Команда Microsoft Research под руководством Питера Ли разрабатывает собственные модели и работает над интеграцией AI в корпоративные продукты.

Интересный кейс представляет Anthropic — компания, основанная бывшими сотрудниками OpenAI Дарио Амодеи и Даниэлой Амодеи в 2021 году. Они разработали модель Claude, которая конкурирует с ChatGPT, делая акцент на безопасности и этичности AI-систем.

Стабильность AI, создатели Stable Diffusion, представляют другой подход — открытую разработку генеративных моделей. Эмад Мостак, основатель компании, сделал ставку на открытый исходный код и демократизацию доступа к AI-технологиям.

Мужчина проверяет архитектору нейросетей

Развитие нейросетей в России и странах СНГ

Российские и советские ученые внесли значительный вклад в развитие нейросетевых технологий, хотя их работы часто остаются менее известными на международном уровне.

Александр Галушкин, профессор МГТУ имени Баумана, является одним из ведущих российских специалистов по нейросетям. Его работы по самоорганизующимся нейронным сетям получили международное признание. Галушкин также основал Международную ассоциацию нейросетевых технологий и выпустил более 200 научных работ в области нейроинформатики.

Владимир Красилов из Института системного анализа РАН разработал оригинальные подходы к созданию эволюционных нейросетей. Его работы по генетическим алгоритмам для оптимизации архитектуры нейросетей опередили многие западные исследования.

Современные российские AI-компании также заявляют о себе на международном уровне. Яндекс разработал YandexGPT и активно применяет нейросети в поиске, переводе и рекомендательных системах. Команда Яндекса под руководством Андрея Себранта создала несколько прорывных решений в области обработки естественного языка для русского языка.

Сбер через свой исследовательский центр SberAI разработал модель ruGPT и активно инвестирует в AI-технологии. По данным компании, они потратили более 50 миллиардов рублей на развитие AI-направления в 2020-2023 годах.

Кто создавал первые персептроны и как они работали?

Первый персептрон создал Фрэнк Розенблатт в Корнельском университете в 1957 году. Устройство «Марк-1» представляло собой электромеханическую систему с 400 фотоэлементами, которая могла распознавать простые геометрические фигуры. Персептрон обучался методом проб и ошибок, корректируя веса соединений между нейронами до тех пор, пока не начинал правильно классифицировать входные изображения. Это был первый в мире пример самообучающейся машины.

Какие технологии лежат в основе современных нейросетей типа ChatGPT?

ChatGPT основан на архитектуре трансформера, разработанной Google в 2017 году. Ключевые технологии включают: механизм внимания (attention mechanism), который позволяет модели фокусироваться на важных частях входных данных; многоголовочное внимание для параллельной обработки информации; позиционное кодирование для понимания порядка слов; и слои нормализации для стабильного обучения. Модель обучается на огромных текстовых данных методом самоконтролируемого обучения, предсказывая следующее слово в последовательности.

Чем отличаются подходы разных компаний к созданию AI-систем?

Компании используют разные стратегии: OpenAI фокусируется на создании мощных универсальных моделей и постепенном расширении доступа; Google развивает широкую экосистему AI-инструментов и интегрирует их в существующие продукты; Anthropic делает акцент на безопасности и этичности AI; Stability AI продвигает открытый исходный код; а такие компании как Midjourney специализируются на конкретных задачах. Различия касаются также объемов инвестиций, подходов к данным, вычислительных ресурсов и философии развития технологий.

Практические выводы и перспективы развития нейросетей

История создания нейросетей показывает, что революционные технологии рождаются на пересечении фундаментальной науки, инженерных решений и предпринимательского видения. От первых теоретических работ Маккалоха и Питтса до современных систем как ChatGPT прошло 80 лет непрерывного развития.

Ключевые тенденции, которые определят будущее нейросетей, включают: мультимодальность (объединение текста, изображений, звука и видео в единых моделях), специализацию под конкретные задачи и отрасли, развитие edge-computing для запуска AI на локальных устройствах, и появление новых архитектур, превосходящих трансформеры по эффективности.

Для специалистов и предпринимателей это означает несколько практических выводов:

  • Изучайте фундаментальные принципы — понимание базовых концепций поможет лучше оценивать новые технологии и принимать стратегические решения
  • Следите за академическими исследованиями — многие коммерческие прорывы начинаются в университетских лабораториях за 3-5 лет до массового внедрения
  • Экспериментируйте с доступными инструментами — современные API и открытые модели позволяют тестировать AI-решения без больших инвестиций
  • Развивайте междисциплинарные команды — успешные AI-проекты требуют сочетания технических навыков, понимания предметной области и продуктового мышления
  • Готовьтесь к этическим вызовам — вопросы безопасности, приватности и справедливости AI становятся ключевыми для долгосрочного успеха

Современные инструменты и образовательные ресурсы делают участие в AI-революции доступным для любого мотивированного профессионала, независимо от его текущего уровня технических знаний.

Оцените статью

4.8 5 (26 оценок)
Хочу изучать нейронные сети!
Специально для вас мы собрали отдельную подборку лучших онлайн-курсов по нейронным сетям на рынке и сравнили их по цене, продолжительности и отзывам студентов.
Все онлайн-курсы по нейросетям