В 2023 году словарь Cambridge Dictionary выбрал глагол «галлюцинировать» в контексте искусственного интеллекта словом года. Сегодня мы расскажем про галлюцинацию галлюциногенов.
🧟♂️Последние 20 лет наблюдается бум дизайнерских наркотиков: на улицах находят людей-зомби с передозировкой неизвестными соединениями. Эти молекулы по сравнению с уже запрещенными имеют химические модификации, что позволяет им легально продаваться на рынке. У пострадавших берут на анализ мочу и кровь для масс-спектрометрии, чтобы определить, чем они отравлены и оказать медпомощь. Но для быстрой идентификации веществ нужно сравнение с чистыми образцами, а взять их негде, ведь новинки синтезируют подпольно. Что делать?
В 2021 году Майкл Скиннидер из Принстона с коллегами создали глубокую генеративную модель DarkNPS. Она была вдохновлена языковыми моделями, которые понимают, какое слово в предложении подходит следующим по смыслу. Точно также DarkNPS умеет предсказывать символы, но не в тексте, а в SMILES-строках — линейном представлении химструктур для компьютера. Однако первоначально была проблема — ничтожно малая обучающая выборка всего из 1753 психоактивных веществ, с огромным трудом собранных в базе данных департамента судебной химии университета Копенгагена. Тогда ученые применили аугментацию: размножили одни и те же данные и представили их как новенькие. Трюк сработал! После этого обученный ИИ сгаллюцинировал 9 млн правдоподобных наркотиков. Оказалось, что ИИ предсказал 90% веществ, которые вошли в оборот у драгдилеров уже после обучения алгоритма. Но главное, что модель научилась выделять, какие из сгенерированных молекул вероятнее появятся на черном рынке в будущем. И тем самым с высокой точностью определять структуру наркотиков из образцов пациентов только по массе!
За решение ранее нерешаемой задачи Скиннидер в 2023 году получил несколько престижных премий, а разработка уже внедряется в практику правоохранителей и врачей скорой помощи! 🚑