Содержание
Предисловие .............................................................................................................8
Об авторах ...............................................................................................................11
Глава 1. Глубокое обучение и науки о жизни .................................................13
Почему все говорят о глубоком обучении?..............................................................13
Современные науки о жизни – это науки о данных ...............................................14
О чем эта книга? ........................................................................................................15
Глава 2. Введение в глубокое обучение...........................................................19
Линейные модели......................................................................................................20
Многослойные персептроны ....................................................................................21
Обучение модели.......................................................................................................24
Проверка модели .......................................................................................................26
Регуляризация............................................................................................................27
Оптимизация гиперпараметров...............................................................................28
Другие типы моделей................................................................................................29
Сверточные нейронные сети................................................................................30
Рекуррентные нейронные сети ............................................................................31
Дополнительное чтение............................................................................................32
Глава 3. Машинное обучение с DeepChem......................................................33
Наборы данных DeepChem........................................................................................34
Обучение модели для предсказания токсичности молекул ...................................35
Пример: обучение модели MNIST ............................................................................42
Набор данных распознавания цифр MNIST ........................................................42
Сверточная архитектура для набора MNIST........................................................43
Заключение ................................................................................................................47
Глава 4. Машинное обучение и молекулы.......................................................48
Что такое молекула? ..................................................................................................48
Что такое внутримолекулярные связи? ...................................................................50
Ковалентные связи................................................................................................51
Нековалентные связи............................................................................................51
Молекулярные графы................................................................................................52
Конформации молекулы ...........................................................................................53
Хиральность молекул ............................................................................................54
Фичеризация молекулы ........................................................................................55
Строки SMILES и пакет RDKit ...............................................................................55
Расширенные отпечатки связей...........................................................................56
Молекулярные дескрипторы ....................................................................................57
Графовые свертки......................................................................................................57
6  Содержание
Обучение модели для прогнозирования растворимости.......................................58
MoleculeNet................................................................................................................60
Строки SMARTS..........................................................................................................60
Заключение ................................................................................................................63
Глава 5. Глубокое обучение и биофизика........................................................64
Белковые структуры ..................................................................................................65
Белковые последовательности .............................................................................67
Общие принципы связывания с белками............................................................70
Биофизическая фичеризация...................................................................................71
Координатная фичеризация.................................................................................71
Атомная фичеризация ..........................................................................................76
Пример использования PDBBind..............................................................................76
PDBBind Dataset.....................................................................................................76
Представление набора данных PDBBind..............................................................79
Заключение ................................................................................................................82
Глава 6. Глубокое обучение и геномика...........................................................85
ДНК, РНК и белки.......................................................................................................85
Реальное положение дел ...........................................................................................87
Сайты связывания и факторы транскрипции .........................................................90
Сверточная модель связывания TF ......................................................................90
Доступность хроматина ............................................................................................93
РНК-интерференция .................................................................................................95
Заключение ................................................................................................................98
Глава 7. Машинное обучение и микроскопия.................................................99
Краткое введение в микроскопию .........................................................................101
Современная оптическая микроскопия ............................................................102
Дифракционный предел .........................................................................................104
Электронная и атомно-силовая микроскопия ..................................................105
Микроскопия сверхвысокого разрешения ........................................................107
Глубокое обучение и дифракционный предел ..................................................109
Подготовка биологических препаратов для микроскопии ..................................109
Окрашивание.......................................................................................................109
Фиксация препаратов .........................................................................................110
Секционирование препаратов ...........................................................................111
Флуоресцентная микроскопия ...........................................................................111
Артефакты пробоподготовки .............................................................................113
Применение глубокого обучения в микроскопии.................................................114
Подсчет клеток.....................................................................................................114
Клеточная сегментация ......................................................................................117
Вычислительные анализы...................................................................................121
Заключение ..............................................................................................................121
Глава 8. Глубокое обучение в медицине........................................................123
Компьютерная диагностика....................................................................................123
Вероятностные диагнозы с байесовскими сетями................................................124
Содержание  7
Данные электронных медицинских карт ..............................................................126
В чем опасность больших баз данных ЭМК пациентов?...................................128
Глубокая радиология ...............................................................................................129
Рентгенография и компьютерная томография .................................................131
Гистология............................................................................................................133
Магниторезонансная томография .....................................................................133
Модель глубокого обучения в качестве лечебного средства ................................134
Диабетическая ретинопатия...................................................................................135
Перспективы глубокого обучения в медицине .....................................................139
Этические соображения......................................................................................139
Потеря работы .....................................................................................................140
Заключение ..............................................................................................................140
Глава 9. Генеративные модели .........................................................................141
Вариационные автоэнкодеры.................................................................................141
Генеративные состязательные сети .......................................................................143
Применение генеративных моделей в науках о жизни........................................144
Генерация новых идей для соединений-прототипов .......................................144
Разработка белков ...............................................................................................145
Инструменты для научного поиска....................................................................145
Будущее генеративного моделирования ...........................................................146
Работа с генеративными моделями .......................................................................146
Анализ вывода генеративной модели ...............................................................148
Заключение ..............................................................................................................151
Глава 10. Интерпретация глубоких моделей................................................154
Как объяснить предсказания? ................................................................................154
Оптимизация входов...............................................................................................158
Прогнозирование неопределенности ....................................................................161
Интерпретируемость, объяснимость и последствия для реального мира ..........165
Заключение ..............................................................................................................165
Глава 11. Практический пример виртуального скрининга........................166
Подготовка набора данных для прогнозного моделирования.............................167
Обучение прогностической модели.......................................................................172
Подготовка набора данных для прогнозирования................................................177
Применение прогностической модели..................................................................180
Заключение ..............................................................................................................186
Глава 12. Ожидания и перспективы................................................................188
Медицинская диагностика......................................................................................188
Персонализированная медицина...........................................................................190
Фармацевтические исследования ..........................................................................191
Биологические исследования .................................................................................193
Заключение ..............................................................................................................194
Колофон..................................................................................................................195
Предметный указатель.......................................................................................196