191
Примером использования рекуррентные нейронные сети (RNN) в качестве
алгоритма машинногог при моделировании предсказания рисков сердечно-
сосудистых заболеваний можно описать в следующей форме:
import keras from keras.layers import Input, Embedding, LSTM, Dense
from keras.models import Model
# Ввод данных о пациенте
inputs = Input(shape=(1,))
# Эмбеддинг данных embedding = Embedding(input_dim=1000,
output_dim=64)(inputs)
# LSTM слой lstm = LSTM(32)(embedding)
# Выходной слой outputs = Dense(1, activation='sigmoid')(lstm)
# Создание модели
model = Model(inputs=inputs, outputs=outputs)
model.compile(optimizer='adam', loss='binary_crossentropy',
metrics=['accuracy']) model.fit(x_train, y_train, epochs=10, batch_size=32).
После удовлетворительной проверки работы модели, она может быть
использована для прогнозирования сердечно-сосудистых заболеваний.
Анализ последних исследования показывают, что применение искусственного
интеллекта увеличивает точность прогнозирования риска сердечно-сосудистых
заболеваний. Однако также установлено, что применение различных моделей
машинного обучения в анализе клинических данных имеет ряд проблем, связанных:
риском «вымышленных» результатов; «дыры» в данных; «проблемы» связанные с
«мультиколлинеарностью».
В целях избежание мультиколлинеарности в анализе данных для предсказания
сердечно-сосудистых заболеваний является использование техники регуляризации.
В этих целях используются различные процедуры анализа данных, которые могут
определить мультиколлинеарность, такие как матричные ранги, VIF и т.д. На ряду с
этим в ряде исследований использованы методы регуляризации, такие как Lasso,
Ridge и Elastic Net, чтобы снизить коэффициенты при признаках с
мультиколлинеарностью. Также используются алгоритмы, которые могут работать
с мультиколлинеарностью, такие как случайный лес и XGBoost или можно
использовать методы моделирования исключающие признаки, имеющие высокую
корреляцию, а также использовать связанные признаки, такие как суммы, разности,
произведения и т.д., чтобы уменьшить количество признаков.
Таким образом, залогом успешного применения алгоритмов машинного обучения
к конкретной медицинской-задаче является не только правильно подобранная
модель, но и признаки, на которых модель обучается.