Уэс с детства любил точные науки и участвовал в олимпиадах. Неудивительно, что он поступил в MIT ботать чистую математику. В будущем он планировал решать диффуры, заниматься оптимизацией, все дела.
Но судьба распорядилась иначе. В августе 2007 года 22-летний выпускник устроился в хедж-фонд AQR Capital Management. И тут грянул мировой финансовый кризис. Несложно догадаться, что сотрудникам пришлось вовсе не разрабатывать новые финмодели для прогнозирования доходов и рисков, а сломя голову анализировать потоки цифр, чтобы тушить пожары из-за падения рынков. Уэс осознал, что огромную часть его рабочего времени сжирают утомительные операции над данными: очистка, фильтрация, группировка, слияние и т.п.
Со студенчества Уэс был знаком с Java. В фонде он столкнулся с Excel, SQL, MATLAB и R, но этот опыт оказался скорее разочаровывающим. Отметим, что в то время R был не таким удобным, как сейчас: ни pipe, ни tidyverse еще не существовало. Поэтому когда коллеги показали ему Python, Уэс поразился элегантности языка. Но было одно но! Python тогда не обладал функционалом для обработки таблиц, регрессионного анализа и временных рядов. Поэтому Уэс решил сам для себя выковать инструментарий. МакКинни подмечал плюсы и минусы R (например, ему не нравился синтаксис, но зашла концепция Data Frame) и кодил втайне от начальства. Скажем, с нуля написал парсер CSV-файлов. Постепенно Уэс пришел к мысли, что созданные им вещи могут пригодиться другим. Так, в 2009 году была выложена первая версия Pandas — ныне самой популярной библиотеки для датасайенс. AQR, что было редкостью, особенно для инвестфонда, разрешил опубликовать Pandas в open source. Правда, только после нескольких месяцев споров Уэса с боссами:)
Поварившись три года в финансах, Уэс решил продолжить образование и поступил делать PhD по байесовской статистике в университет Дьюка. Но к нему обращалось всё больше людей по поводу Pandas. В конце 2011 он бросил аспирантуру и целый год, живя в Нью-Йорке на сбережения, посвятил допиливанию библиотеки и параллельно писал книгу «Python for Data Analysis» — впоследствии бестселлер.
Так вышло, что тогда же Уэс начал посещать NY R-митапы и стал там завсегдатаем. А позже на конференции R/Finance в Чикаго он познакомился с Джеем Джеем Аллером — основателем RStudio, который в тот момент трудился над известной всем IDE для языка R. МакКинни и Аллер подружились — их объединило то, что они были противниками закрытого ПО, такого как MATLAB, и ратовали за открытый исходный код.
Но вернемся к Pandas. В 2012 году вышла улучшенная версия библиотеки, которая уже завирусилась. Уэс выступал на конференциях, а спустя год передал инструмент в руки сообщества разработчиков, которое до сих пор его успешно поддерживает. Дальше в жизни МакКинни было множество других идей и стартапов в Кремниевой Долине. Одним из самых значимых проектов стал Apache Arrow — платформа хранения табличных данных и обмена ими независимо от языка программирования.
6 ноября 2023 года Уэс МакКинни устроился в компанию Posit на должность старшего архитектора ПО. Вы не поверите, но Posit — новое название хорошо знакомой всем RStudio. Ребрендинг состоялся летом 2022 года и отразил сменившуюся парадигму — компания больше не фокусируется только на R, а позиционирует себя как комьюнити полиглотов.
Сегодня Уэс МакКинни, легенда питоновской экосистемы анализа данных, продолжает работать в Posit, буквально сидя за одним столом с другой звездой — Хэдли Уикхэмом, основоположником вселенной tidy в R и главным научным сотрудником компании. История Уэса показывает, что в мире датасайенс всё давно переплетено, а языковые войны «Python vs R» — это пережиток прошлого.