2022-10-22 10:57:08
#IT |
Data analysis AutoViz выполняет автоматическую визуализацию любого набора данных с помощью одной строки кода Python. Дайте ему любой входной файл (CSV, txt или json) любого размера, и AutoViz визуализирует его.
https://github.com/AutoViML/AutoViz
Numba переводит функции Python в оптимизированный машинный код во время выполнения, используя стандартную библиотеку компилятора LLVM. Численные алгоритмы, скомпилированные Numba в Python, могут приблизиться по скорости к C или FORTRAN.
https://numba.pydata.org
NetworkX — это пакет Python для создания, управления и изучения структуры, динамики и функций сложных сетей.
https://networkx.org
Pandas — это быстрый, мощный, гибкий и простой в использовании инструмент для анализа и обработки данных с открытым исходным кодом, созданный на основе языка программирования Python.
https://pandas.pydata.org
Vaex — это высокопроизводительная библиотека Python для ленивых Out-of-Core DataFrames (аналогичных Pandas) для визуализации и изучения больших наборов табличных данных.
https://github.com/vaexio/vaex
PyMC — это пакет Python для байесовского статистического моделирования, в котором основное внимание уделяется расширенным алгоритмам Монте-Карло с цепями Маркова (MCMC) и вариационного вывода (VI). Его гибкость и расширяемость делают его применимым к большому набору задач.
statsmodels — это пакет Python, который дополняет scipy для статистических вычислений, включая описательную статистику, а также оценку и вывод для статистических моделей.
https://github.com/statsmodels/statsmodels
Bokeh — интерактивная библиотека визуализации для современных веб-браузеров. Он обеспечивает элегантное и лаконичное построение универсальной графики и обеспечивает высокопроизводительную интерактивность при работе с большими или потоковыми наборами данных.
https://github.com/bokeh/bokeh
Blaze транслирует подмножество модифицированного синтаксиса, подобного NumPy и Pandas, в базы данных и другие вычислительные системы. Blaze предоставляет пользователям Python знакомый интерфейс для запроса данных, хранящихся в других системах хранения данных.
https://github.com/blaze/blaze
SparklingPandas стремится упростить использование распределенной вычислительной мощности PySpark для масштабирования анализа данных с помощью Pandas. SparklingPandas основан на классе Spark DataFrame, чтобы предоставить вам отточенный, pythonic и Pandas-подобный API.
https://github.com/sparklingpandas/sparklingpandas
Superset — это современная платформа для исследования и визуализации данных. Superset может заменить или дополнить проприетарные инструменты бизнес-аналитики для многих команд. Superset хорошо интегрируется с различными источниками данных.
https://github.com/apache/superset
PyCM — это библиотека матриц путаницы с несколькими классами, написанная на Python, которая поддерживает как векторы входных данных, так и прямую матрицу, а также подходящий инструмент для оценки модели после классификации, который поддерживает большинство классов и общие параметры статистики.
https://github.com/sepandhaghighi/pycm
Созданный на основе Plotly.js, React и Flask, Dash связывает современные элементы пользовательского интерфейса, такие как раскрывающиеся списки, ползунки и графики, непосредственно с вашим аналитическим кодом Python.
https://github.com/plotly/plotly
«В колледже меня совершенно не научили анализу данных.
Поэтому я потратил более 10 000 часов на изучение Python.
Затем я выбрал 13 лучших библиотек для машинного обучения и анализа данных.
Но в отличие от колледжа, они не обойдутся вам в 120 000 долларов.»
Thanks to the man from the Persian Community for providing the material! Luv
549 views07:57