Получи случайную криптовалюту за регистрацию!

#IT | Data analysis AutoViz выполняет автоматическую визуали | Garland | $AltOOshka

#IT | Data analysis

AutoViz выполняет автоматическую визуализацию любого набора данных с помощью одной строки кода Python. Дайте ему любой входной файл (CSV, txt или json) любого размера, и AutoViz визуализирует его.
https://github.com/AutoViML/AutoViz

Numba переводит функции Python в оптимизированный машинный код во время выполнения, используя стандартную библиотеку компилятора LLVM. Численные алгоритмы, скомпилированные Numba в Python, могут приблизиться по скорости к C или FORTRAN.
https://numba.pydata.org

NetworkX — это пакет Python для создания, управления и изучения структуры, динамики и функций сложных сетей.
https://networkx.org

Pandas — это быстрый, мощный, гибкий и простой в использовании инструмент для анализа и обработки данных с открытым исходным кодом, созданный на основе языка программирования Python.
https://pandas.pydata.org

Vaex — это высокопроизводительная библиотека Python для ленивых Out-of-Core DataFrames (аналогичных Pandas) для визуализации и изучения больших наборов табличных данных.
https://github.com/vaexio/vaex

PyMC — это пакет Python для байесовского статистического моделирования, в котором основное внимание уделяется расширенным алгоритмам Монте-Карло с цепями Маркова (MCMC) и вариационного вывода (VI). Его гибкость и расширяемость делают его применимым к большому набору задач.

statsmodels — это пакет Python, который дополняет scipy для статистических вычислений, включая описательную статистику, а также оценку и вывод для статистических моделей.
https://github.com/statsmodels/statsmodels

Bokeh — интерактивная библиотека визуализации для современных веб-браузеров. Он обеспечивает элегантное и лаконичное построение универсальной графики и обеспечивает высокопроизводительную интерактивность при работе с большими или потоковыми наборами данных.
https://github.com/bokeh/bokeh

Blaze транслирует подмножество модифицированного синтаксиса, подобного NumPy и Pandas, в базы данных и другие вычислительные системы. Blaze предоставляет пользователям Python знакомый интерфейс для запроса данных, хранящихся в других системах хранения данных.
https://github.com/blaze/blaze

SparklingPandas стремится упростить использование распределенной вычислительной мощности PySpark для масштабирования анализа данных с помощью Pandas. SparklingPandas основан на классе Spark DataFrame, чтобы предоставить вам отточенный, pythonic и Pandas-подобный API.
https://github.com/sparklingpandas/sparklingpandas

Superset — это современная платформа для исследования и визуализации данных. Superset может заменить или дополнить проприетарные инструменты бизнес-аналитики для многих команд. Superset хорошо интегрируется с различными источниками данных.
https://github.com/apache/superset

PyCM — это библиотека матриц путаницы с несколькими классами, написанная на Python, которая поддерживает как векторы входных данных, так и прямую матрицу, а также подходящий инструмент для оценки модели после классификации, который поддерживает большинство классов и общие параметры статистики.
https://github.com/sepandhaghighi/pycm

Созданный на основе Plotly.js, React и Flask, Dash связывает современные элементы пользовательского интерфейса, такие как раскрывающиеся списки, ползунки и графики, непосредственно с вашим аналитическим кодом Python.
https://github.com/plotly/plotly

«В колледже меня совершенно не научили анализу данных.
Поэтому я потратил более 10 000 часов на изучение Python.
Затем я выбрал 13 лучших библиотек для машинного обучения и анализа данных.
Но в отличие от колледжа, они не обойдутся вам в 120 000 долларов.»
Thanks to the man from the Persian Community for providing the material! Luv