«Машинное обучение»: Потенциал и возможности


Облачные технологии широко применяются в самых разных научных сферах: от физики и астрономии до географии и генетикиВиртуальные инфраструктуры позволяют ученым обрабатывать огромное количество информации в кратчайшие сроки, что приводит к новым открытиям.

Но есть еще одна технология, способная изменить наше представление об обработке информации. Речь идет о машинном обучении, которое в последнее время приобрело особую популярность. 

Несколько лет назад Google полностью переделали свои сервисы поиска картинок и распознавания речи, внедрив элементы машинного обучения, а 16 июня этого года интернет-гигант объявил о расширении исследовательского центра в Цюрихе, который займется разработками в сфере ИИ, обработки естественного языка и машинного восприятия. Это значит, что Google собирается разрабатывать системы, которые способны думать, слушать и видеть.

Старший научный сотрудник компании Грег Коррадо (Greg Corrado) утверждает, что активное внедрение машинного обучения способно принести не меньше пользы, чем создание интернета. Это может привести к тому, что нам не нужно будет разбираться во всех деталях определённых процессов, достаточно будет загрузить в систему данные, на основе которых она начнет самообучаться.


Самое перспективное направление в машинном обучении – это так называемое глубокое обучение. Оно строится на нейронных сетях (НС), которые требуют большого объема данных, чтобы учиться. Впервые НС были описаны в 30-х годах прошлого века, но активно их начали использовать только в последние 3–4 года, так как мощность компьютеров резко возросла.

В прошлом году Google выложили в открытый доступ свою библиотеку для глубокого машинного обучения TensorFlow. Так компания пытается привлечь внимание к проекту и развить его с помощью сторонних разработчиков.  Главная ее особенность – в отличие от других платформ вроде Theano и Torch – поддержка распределенных вычислений.

В компании систему TensorFlow используют практически во всех проектах: от распознавания речи до поиска фотографий, но на деле она будет больше полезна ученым, проводящим эксперименты по глубокому обучению нейронных сетей, а также компаниям, которым нужно быстро обучить и протестировать свои модели. Пощупать TensorFlow своими руками можно, перейдя по этой ссылке.

ИИ идет в писатели


Журналист The Guardian Алекс Херн (Alex Hern) в своей статье рассказал о своей попытке обучить простейшую рекуррентную НС, чтобы та могла логично завершать предложения. В качестве обучающих данных он взял 119 МБ текста из статей The Guardian. О других интересных вариантах применения рекуррентных НС читайте в этой статье.

Спустя полчаса после запуска процесса обучения Алекс увидел, что прогресс составляет всего 1%. Он понял, что мощности его компьютера недостаточно и решил арендовать сервер в облаке. Это позволило завершить процесс обучения за 8 часов.

Получилось, мягко говоря, не очень здорово. Компьютеру нужно было продолжить следующую фразу: «Судьбоносное решение остаться в ЕС, принятое в четверг, было…». В итоге система предложила такие варианты, как «…основано на обещании, сделанном в нескольких заявлениях» и «…членом оппозиционной партии 2015 года». С одной стороны, полный бред, с другой – в этом есть и положительный момент: если бы машина научилась писать статьи для The Guardian, Алекс и его коллеги остались бы без работы.

Такой результат вполне объясним. Нейронная сеть, использованная в обучении, могла распознавать только символы: она не знала, что такое слово, и не понимала грамматики. Чтобы сеть могла адекватно составлять предложения на основании данных о реальном мире, ей нужно передать гораздо больший объем информации для обучения. Набора статей одного издания – недостаточно. Этот факт подтолкнул людей к разработке системы, которая бы помогла «научить» машину.

 Человечество спешит на помощь

 

Одним из наиболее ярких примеров глубокого обучения является AlphaGo, программа на базе ИИ, недавно обыгравшая чемпиона мира по игре в го. В программе задействовано два типа обучения: обучение с учителем, когда используются данные всех матчей, сыгранных между людьми, и обучение с подкреплением, которое подразумевает, что программа играет против самой себя и учится на своих ошибках. Но при всем при этом, как оказалось, некоторым вещам AlphaGo просто не может научиться самостоятельно.

По мнению лидера исследовательской группы DeepMind, занимавшейся разработкой программы, система хорошо понимала, на каких областях игрового поля она должна сосредоточить свое внимание. Однако программа не знает, когда ей следует прекратить «мыслительный процесс» и сделать свой ход. Это важный момент в игре, так как в профессиональных матчах действует сложная система контроля времени. 

Разработчики не стали добавлять в программу правила учета времени, а лишь ввели ограничение, разработав специальный алгоритм. Позже он был оптимизирован программой на основе ряда экспериментов, но факт в том, что без помощи человека AlphaGo не удалось бы обыграть чемпиона.

Эта ситуация, сложившаяся с AlphaGo, приводит нас к мысли, что прогресс обучения ИИ можно ускорить, если привлекать обычных пользователей к обучению систем. Например, площадкой для совместной работы человека и машины сейчас становится популярная компьютерная игра Minecraft.


Недавно выложенный на GitHub Project Malmo, запущенный корпорацией Microsoft, представляет собой платформу для исследования возможностей искусственного интеллекта. Задача – обучить персонажа игры выполнять различные действия: от перехода по мосту до строительства сложных объектов. Кроме того, проект позволяет организовать совместную игру ИИ с человеком, а также общение между ними с помощью специального чата.

По словам  руководителя проекта Кати Хофманн (Katja Hofmann), цель Project Malmo – создание ИИ, который будет учиться у пользователей и помогать им решать свои задачи. Программа задействует алгоритмы обучения с подкреплением. К примеру, можно научить машину ориентироваться в комнате с множеством препятствий. Обычные игроки могут давать подсказки или инструкции, которые ИИ постепенно научиться распознавать и принимать на их основе правильные решения. 

Платформа Minecraft также использовалась при обучении робота в Университете Брауна (смотрите видео). По мнению одного из профессоров университета, Project Malmo станет эффективным методом сбора данных о взаимодействии человека с ИИ. Возможно уже в скором времени мы сможем полноценно общаться с искусственным интеллектом.

Об авторе
Начальник группы интернет-маркетинга в компании ИТ-ГРАД
+5 1 3242 4
Автор ivankarpuhin Рейтинг +2.85 Сила 1.91
Блог Программы, ПО, сайты 82 86 RSS

4 комментария

B230F
В заголовке и теме не хватает «опасности».

«нам не нужно будет разбираться во всех деталях определённых процессов, достаточно будет загрузить в систему данные, на основе которых она начнет самообучаться.»
Т.е. произойдет узурпация знаний машинокомплексами, с последующей их утерей при выходе из строя систем хранения. В условиях разницы стоимости обучения специалистов и системы на порядки, ведь знания системы после обучения можно тиражировать практически «бесплатно» — это лишь вопрос времени.
Булат95
на мой личнй взгляд, всё так и будет, независио от наших желаний. ИИ просто будет на порядолк умнее человека, и люди будут становиться совершенно неконкурентоспособны — в одной области за другой. так же как сейчас нелепо строить, например, интернет, на основе человеческой памяти исходя из опасения, что при выходе из строя компьютеров все эти данные окажутся утрачены
B230F
Это уже было в истории человечества, не раз и не два. Было радио в древнем Египте (простейший детекторный приемник — анкх-джед-уас, это на виду). Было радио в Римской Имерии (любая церковь, это на виду. Физики получили доказательство при схождении благодатного огня). Латиноамериканские пирамиды можно смело причислить к той же технологии. Утеряно. Почему — в легенде о вавилонской башне. Изобретено заново, и применено принципиально иначе — массово. Потому что всеобщее религиозное образование было заменено на всеобщее академическое. Технологии сегодняшнего дня требуют дальнейшего повышения уровня образования и уж, тем более, его охвата — оно уже серьёзно отстает, средний человек до сих пор не имеет знаний даже о критериях выбора своей пары.
Последний раз редактировалось

Добавить комментарий