Рекомендуемый дистрибутив Linux для статистики?

Учитывая, что R , Python и многие другие библиотеки с открытым исходным кодом, используемые для статистики, имеют лучшую поддержку в Linux, чем Windows / OSX ( rPy приходит на ум), мне показалось странным, что никто не задавал этот вопрос раньше. Итак, я делаю сейчас:

Какие пользователи дистрибутива Linux делают статистику / анализ данных / Machine Learning предпочитают / рекомендуют?

PS: Я немного смущен, спрашивая об этом, поскольку, используя встроенное управление пакетами Python и R, я теоретически не должен испытывать конфликтов с базовой системой. :П

Я думаю, что вы найдете, что под капотом дистрибутива не имеет значения. Особенно, если вы используете R и Python.

Обычно люди управляют собственной версией Python, используя virtualenv или virtualenvwrapper, и устанавливают в нее различные пакеты, а не пытаются сосуществовать с Python дистрибутива.

Большинство языков программирования, таких как Perl, Python, Ruby и R, обеспечивают этот уровень управления сейчас. Ruby имеет rvm , Perl имеет perlbrew , а R имеет Renv .

Кроме того, они обеспечивают свой собственный уровень управления пакетами, чтобы систематически устанавливать различные библиотеки и инструменты, поэтому дистрибутив действительно не имеет значения в отношении этих типов инструментов.

Примеры

На моем ноутбуке сейчас у меня есть несколько версий Ruby:

 $ rvm list rvm rubies ruby-1.9.2-head [ x86_64 ] jruby-1.5.6 [ amd64-java ] ruby-1.9.2-p290 [ x86_64 ] => ruby-1.9.2-p180 [ x86_64 ] ree-1.8.7-2011.03 [ x86_64 ] 

В настоящее время я настроен на использование ruby-1.9.2-p290:

 $ which ruby ~/.rvm/rubies/ruby-1.9.2-p180/bin/ruby 

В этой версии также установлены несколько камней (библиотек):

 $ gem list|head -10 abstract (1.0.0) actionmailer (3.0.10, 3.0.5) actionpack (3.0.10, 3.0.5) activemodel (3.0.10, 3.0.5) activerecord (3.0.10, 3.0.5) activeresource (3.0.10, 3.0.5) activesupport (3.0.10, 3.0.5) akami (1.2.0) albino (1.3.3) anemone (0.7.2) 

Большинство уровней управления предоставляют те же функции, что и этот. Вот, например, perlbrew :

 $ perlbrew list local (5.14.0) * perl-5.14.0 $ which perl ~/apps/perl5/perlbrew/perls/perl-5.14.0/bin/perl 

Python & R ничем не отличается. Преимущество управления средой таким образом заключается в том, что мои установки поддерживаются в моем домашнем каталоге, поэтому я могу переместить их с машины на машину и сохранить их с моей работой, а не тратить время на управление самим дистрибутивом для этих ресурсов.