Управление cookie
🍪 Наш сайт использует cookie — это файлы, которые сохраняют данные о ваших прошлых посещениях, так мы сделать работу с сайтом удобнее. При желании вы можете отключить сохранение cookie в настройках браузера.
Управление cookie
Настройки cookie
Выберите, какие cookie вы разрешаете. Обязательные cookie всегда включены — без них сайт не сможет работать корректно. Остальные категории можно включать и отключать в любой момент.
Всегда включено
Эти cookie необходимы для работы сайта и его функций. Их нельзя отключить. Они устанавливаются в ответ на ваши действия, например, при выборе настроек конфиденциальности, входе в аккаунт или заполнении форм.
Аналитические cookie
Disabled
Эти cookie собирают информацию, чтобы мы понимали, как используется сайт, насколько эффективны наши маркетинговые кампании, и могли сделать сайт удобнее для вас.
Рекламные cookie
Disabled
Эти cookie помогают рекламным компаниям понимать вашу онлайн-активность, чтобы показывать более релевантную рекламу или ограничивать количество показов одного и того же объявления.
Другие cookie
Disabled
Эти cookie не относятся к обязательным, аналитическим или рекламным. Они помогают включать дополнительные функции сайта (например, настройки языка и интерфейса) и могут устанавливаться сторонними сервисами.

Не NGS-ом единым: спектр методов в медицинской генетике — бесплатный вебинар

пт, 17 апреля 19:00 мск

Блог новостей о биотехе — Бластим

Ребята, давайте жить дружно: Уэс МакКинни

Уэс с детства любил точные науки и участвовал в олимпиадах. Неудивительно, что он поступил в MIT ботать чистую математику. В будущем он планировал решать диффуры, заниматься оптимизацией, все дела.

Но судьба распорядилась иначе. В августе 2007 года 22-летний выпускник устроился в хедж-фонд AQR Capital Management. И тут грянул мировой финансовый кризис. Несложно догадаться, что сотрудникам пришлось вовсе не разрабатывать новые финмодели для прогнозирования доходов и рисков, а сломя голову анализировать потоки цифр, чтобы тушить пожары из-за падения рынков. Уэс осознал, что огромную часть его рабочего времени сжирают утомительные операции над данными: очистка, фильтрация, группировка, слияние и т.п.

Со студенчества Уэс был знаком с Java. В фонде он столкнулся с Excel, SQL, MATLAB и R, но этот опыт оказался скорее разочаровывающим. Отметим, что в то время R был не таким удобным, как сейчас: ни pipe, ни tidyverse еще не существовало. Поэтому когда коллеги показали ему Python, Уэс поразился элегантности языка. Но было одно но! Python тогда не обладал функционалом для обработки таблиц, регрессионного анализа и временных рядов. Поэтому Уэс решил сам для себя выковать инструментарий. МакКинни подмечал плюсы и минусы R (например, ему не нравился синтаксис, но зашла концепция Data Frame) и кодил втайне от начальства. Скажем, с нуля написал парсер CSV-файлов. Постепенно Уэс пришел к мысли, что созданные им вещи могут пригодиться другим. Так, в 2009 году была выложена первая версия Pandas — ныне самой популярной библиотеки для датасайенс. AQR, что было редкостью, особенно для инвестфонда, разрешил опубликовать Pandas в open source. Правда, только после нескольких месяцев споров Уэса с боссами:)

Поварившись три года в финансах, Уэс решил продолжить образование и поступил делать PhD по байесовской статистике в университет Дьюка. Но к нему обращалось всё больше людей по поводу Pandas. В конце 2011 он бросил аспирантуру и целый год, живя в Нью-Йорке на сбережения, посвятил допиливанию библиотеки и параллельно писал книгу «Python for Data Analysis» — впоследствии бестселлер.

Так вышло, что тогда же Уэс начал посещать NY R-митапы и стал там завсегдатаем. А позже на конференции R/Finance в Чикаго он познакомился с Джеем Джеем Аллером — основателем RStudio, который в тот момент трудился над известной всем IDE для языка R. МакКинни и Аллер подружились — их объединило то, что они были противниками закрытого ПО, такого как MATLAB, и ратовали за открытый исходный код.

Но вернемся к Pandas. В 2012 году вышла улучшенная версия библиотеки, которая уже завирусилась. Уэс выступал на конференциях, а спустя год передал инструмент в руки сообщества разработчиков, которое до сих пор его успешно поддерживает. Дальше в жизни МакКинни было множество других идей и стартапов в Кремниевой Долине. Одним из самых значимых проектов стал Apache Arrow — платформа хранения табличных данных и обмена ими независимо от языка программирования.

6 ноября 2023 года Уэс МакКинни устроился в компанию Posit на должность старшего архитектора ПО. Вы не поверите, но Posit — новое название хорошо знакомой всем RStudio. Ребрендинг состоялся летом 2022 года и отразил сменившуюся парадигму — компания больше не фокусируется только на R, а позиционирует себя как комьюнити полиглотов.

Сегодня Уэс МакКинни, легенда питоновской экосистемы анализа данных, продолжает работать в Posit, буквально сидя за одним столом с другой звездой — Хэдли Уикхэмом, основоположником вселенной tidy в R и главным научным сотрудником компании. История Уэса показывает, что в мире датасайенс всё давно переплетено, а языковые войны «Python vs R» — это пережиток прошлого.
Статистика, R и анализ данных Программирование на Python