Управление cookie
🍪 Наш сайт использует cookie — это файлы, которые сохраняют данные о ваших прошлых посещениях, так мы сделать работу с сайтом удобнее. При желании вы можете отключить сохранение cookie в настройках браузера.
Управление cookie
Настройки cookie
Выберите, какие cookie вы разрешаете. Обязательные cookie всегда включены — без них сайт не сможет работать корректно. Остальные категории можно включать и отключать в любой момент.
Всегда включено
Эти cookie необходимы для работы сайта и его функций. Их нельзя отключить. Они устанавливаются в ответ на ваши действия, например, при выборе настроек конфиденциальности, входе в аккаунт или заполнении форм.
Аналитические cookie
Disabled
Эти cookie собирают информацию, чтобы мы понимали, как используется сайт, насколько эффективны наши маркетинговые кампании, и могли сделать сайт удобнее для вас.
Рекламные cookie
Disabled
Эти cookie помогают рекламным компаниям понимать вашу онлайн-активность, чтобы показывать более релевантную рекламу или ограничивать количество показов одного и того же объявления.
Другие cookie
Disabled
Эти cookie не относятся к обязательным, аналитическим или рекламным. Они помогают включать дополнительные функции сайта (например, настройки языка и интерфейса) и могут устанавливаться сторонними сервисами.

Могут ли 500 миллионов лет эволюции помочь понять, как жить дольше?

6 февраля 19:30 мск

Блог новостей о биотехе — Бластим

Python и R — напарники из хорошего бадди-муви

Python, конечно, хорош — он автоматизирует рутину, собирает данные, обучает модели, делает все быстро, четко. Но если нужна хайлевел статистика и визуализация, то без R сложно. Почти под каждый тест в R есть готовый пакет с нормальной документацией. Всё написано исследователями для исследователей — понятно, достоверно и воспроизводимо.

🐍 В Python-сообществе это подтверждается делом:

  • Питонисты и там, и тут придумывают способы «выхода» в R прямо из своих скриптов. Так, библиотека rpy2 позволяет запускать R-функции из Python.
  • Еще имеется plotnine — попытка воссоздать ggplot2. Ведь ни matplotlib, ни seaborn, ни plotly не дают эффектного сочетания гибкости и выразительности. Но все равно ggplot2 остается на голову выше.
  • Да, в Python есть statsmodels и scipy. Но их интуитивность меньше, документация сухая, а некоторые стандартные тесты реализованы неудобно.

Даже разработчики scikit-learn честно признают: статистический анализ — не их цель. Вот и получается, что многие исследователи переходят на R, когда начинается хардкорная статистика.

👩‍🎨 Визуализация в R — отдельное удовольствие. Знакомо чувство легкой зависти, когда у других графики выглядят как обложка научного Vogue, а у тебя — как Excel в понедельник утром? Цвета не сочетаются, глаза устают, и хочется просто всё оставить черно-белым?

Чаще всего «у других» — это не про дар в дизайне, а про знание, где взять хорошие палитры 🎨. В R их — на любой вкус. Хочешь цвета, как в фильмах Уэса Андерсона? Пожалуйста, wesanderson. Нравятся оттенки в духе столпов искусства? Вот тебе MetBrewer — основано на картинах из The Metropolitan Museum of Art. И всё это добавляется в пару строк. Результат — графики, которые не только доносят смысл. Ими приятно делиться в презентациях, статьях, отчетах.

R может показаться хаотичным: тысячи пакетов, синтаксис, который не сразу укладывается в голове, и подход, который сложно назвать строгим. Но за этим скрывается огромная свобода.

🤝 Хорошо, что не нужно выбирать. Python и R — напарники из хорошего бадди-муви. Один тащит логику и структуру, второй — глубину и душу анализа. Если даже питонисты придумывают способы запуска мощных инструментов «конкурента», может, и вам стоит познакомиться с тем, что предлагает R?

Именно про это наш интенсив «Статистика, R и анализ данных», который идет прямо сейчас. Это не курс «смены языка». Мы хотим, чтобы каждый стал статистически экипированным исследователем — тем, кто понимает, что делает, и умеет объяснить это другим.
Факты