«…Однажды, осеннею слякотью, проходя по Петербургской стороне, я поднял с панели бумажку, на которой малограмотный человек записал себе те книги, которые хотел взять из библиотеки. Так и было записано: взять то-то, взять то-то и «третий том Чехова – милаго человека!» <…> Долго я думал над тем, каким должен быть, наконец, человек, чтобы от его личности не торчали во все стороны острые углы прямо в ребра его ближним. И только найдя эту бумажку, в которой какой-то наивный брат мой от всего...
«…Однажды, осеннею слякотью, проходя по Петербургской стороне, я поднял с панели бумажку, на которой малограмотный человек записал себе те книги, которые хотел взять из библиотеки. Так и было записано: взять то-то, взять то-то и «третий том Чехова – милаго человека!» <…> Долго я думал над тем, каким должен быть, наконец, человек, чтобы от его личности не торчали во все стороны острые углы прямо в ребра его ближним. И только найдя эту бумажку, в которой какой-то наивный брат мой от всего немудрого сердца воскликнул по адресу Чехова «милый!», – я кое-что уразумел и нарисовал, наконец, себе настоящего Человека. Это не величественный образ и это слава Богу, ибо от величий всех сортов на свет смотреть стало тошно…»
Глубокое обучение с подкреплением (глубокое RL) сочетает в себе два подхода к машинному обучению. В ходе такого обучения виртуальные агенты учатся решать последовательные задачи о принятии решений. За последнее десятилетие было много неординарных достижений в этой области — от однопользовательских и многопользовательских игр, таких как го и видеоигры Atari и Dota 2, до робототехники. Эта книга —...
Оставить комментарий