Уже сегодня с помощью нейросетей создают комиксы, пишут сочинения и создают портреты несуществующих людей. Но что же такое нейросети, как они работают и чем могут помочь вам? Давайте разбираться.
Как работают нейросети?
Каждый нейрон в сети хранит какую-либо информацию. Один нейрон передает эти данные другому: тот их получает, обрабатывает и передает результаты вычислений следующему. Так и создается нейронная сеть, внутри которой постоянно меняются коэффициенты. Подробнее об этом можно узнать из этой
лекции TEDxTUM.
Кроме импульсов, благодаря которым передается информация, очень важна последовательность. Например, нейросети, работающие с текстом, подбирают наиболее вероятные смысловые комбинации. А вероятность следования одного слова за другим определяется данными, которые были использованы при обучении нейросети.
Обучении? Это как?
Нейронные сети обучаются с помощью обработки большого объема данных. Информации дают много, как минимум в десять раз больше, чем содержится нейронов в сети.
На основе предоставленных и уже обработанных данных сети смогут распознавать неизвестные входные данные.
Например, разработчики обучают нейросеть, цель которой — генерация случайных лиц. Ей предоставляют миллионы фотографий людей: с разным возрастом, мимикой и цветом кожи. После обработки такого массива информации нейросеть сможет создать лицо, которое раньше не видела, позаимствовав фрагменты из реально существующих фото.
А каких видов бывают нейросети?
Первая — модель перцептрона, пример самой простой архитектуры нейросети. Состоит из четырех компонентов — входа, веса, сумматора и функции активации. Сейчас эта модель в чистом виде практически не используется (все-таки ее придумали в 1958 году), но она послужила базой для многих других нейросетей.
Многослойные нейронные сети используют для обработки числовых данных. Они состоят из искусственных нейронов, объединенных в слои.
Сверточные нейронные сети переиспользуют части самих себя для обработки небольших участков изображений. Каждый слой такой сети фокусируется на маленьких участках изображения: благодаря этому нейросеть легко отличает нос от уха, а рот — от глаза.
Нужно обработать последовательность? Тогда приходит очередь рекуррентных нейронных сетей, способных хранить внутри себя информацию о предыдущих данных. Благодаря такой «памяти» рекуррентные сети часто используются для обработки аудио, видео и текста.