Управление cookie
🍪 Наш сайт использует cookie — это файлы, которые сохраняют данные о ваших прошлых посещениях, так мы сделать работу с сайтом удобнее. При желании вы можете отключить сохранение cookie в настройках браузера.
Управление cookie
Настройки cookie
Выберите, какие cookie вы разрешаете. Обязательные cookie всегда включены — без них сайт не сможет работать корректно. Остальные категории можно включать и отключать в любой момент.
Всегда включено
Эти cookie необходимы для работы сайта и его функций. Их нельзя отключить. Они устанавливаются в ответ на ваши действия, например, при выборе настроек конфиденциальности, входе в аккаунт или заполнении форм.
Аналитические cookie
Disabled
Эти cookie собирают информацию, чтобы мы понимали, как используется сайт, насколько эффективны наши маркетинговые кампании, и могли сделать сайт удобнее для вас.
Рекламные cookie
Disabled
Эти cookie помогают рекламным компаниям понимать вашу онлайн-активность, чтобы показывать более релевантную рекламу или ограничивать количество показов одного и того же объявления.
Другие cookie
Disabled
Эти cookie не относятся к обязательным, аналитическим или рекламным. Они помогают включать дополнительные функции сайта (например, настройки языка и интерфейса) и могут устанавливаться сторонними сервисами.

Может ли ИИ заменить клинического интерпретатора NGS-данных?

15 января 19:00 мск

Блог новостей о биотехе — Бластим

От УЛЫБКИ станет всем светлей

В учебниках химии органические вещества представляют в виде структурных формул. Это удобно для человека и используется с XIX в. Вообще, в печатной литературе накоплен огромный пласт информации в виде текста и графики, который до сих пор не включен в базы данных. Но почему? Сейчас же эра высоких технологий. Огромная проблема — превратить изображения молекул в машиночитаемый вид. Для алгоритмов рисунки формул не более, чем набор пикселей. Им нужен формат SMILES — упрощенное линейное представление. Скажем, кофеин для компьютера выглядит вот так: CN1C=NC2=C1C(=O)N(C(=O)N2C)C

Немецкие химики из Вестфальского и Йенского университетов, вдохновившись историей, где ИИ обыграл человека в го, для извлечения ценных данных создали бесплатное приложение с открытым исходным кодом DECIMER.ai (Deep lEarning for Chemical ImagE Recognition). Разработка впитала последние достижения глубокого обучения, компьютерного зрения и обработки естественного языка. DECIMER — первая автоматизированная и комплексная платформа: туда загружается статья, далее инструмент сегментации находит изображение среди текста, а потом классификатор проверяет, есть ли на картинке химструктура. И, наконец, трансформер с высокой точностью преобразует визуальное преставление в SMILES. Всё благодаря тому, что ученые обучили глубокую нейросеть на 450 млн изображений из PubChem, арендуя вычислительные мощности Google Cloud. Decimer Image Transformer превзошел доступные инструменты оптического распознавания химических структур (OCSR), запрограммированные по жестким правилам.

Теперь можно сканировать старые печатные статьи и оцифровывать структуры, в том числе и нарисованные учеными от руки! А еще моментально распознавать молекулы, снятые на мобильный телефон во время конференций. Новинка должна улучшить доступность данных в химии, хемоинформатике и быть полезной для фармы, с/х и биотеха.
Архивное Машинное обучение