1. Pandas
Pandas, Python’da veri analiziyle ilgili en temel kütüphanelerden biridir. Tablo verilerini işlemek ve analiz etmek için mükemmel bir yapıya sahiptir. DataFrame yapısını kullanarak verilerinizi kolayca yönetebilirsiniz.
import pandas as pd
data = pd.read_csv('data.csv')
print(data.head())2. NumPy
NumPy, sayısal hesaplamalar için güçlü bir kütüphanedir. Çok boyutlu dizilerle çalışmanıza olanak tanır ve temel matematiksel işlemleri hızlı bir şekilde yapmanızı sağlar. Veri analizi için vazgeçilmez bir araçtır.
import numpy as np
array = np.array([1, 2, 3, 4])
print(np.mean(array))3. Matplotlib
Veri görselleştirme konusunda Matplotlib, en çok tercih edilen kütüphanelerden biridir. Verilerinizi grafiklerle temsil ederek daha anlaşılır hale getirmenize yardımcı olur.
import matplotlib.pyplot as plt
plt.plot([1, 2, 3, 4], [1, 4, 9, 16])
plt.ylabel('Y değerleri')
plt.xlabel('X değerleri')
plt.show()4. Seaborn
Seaborn, Matplotlib üzerine inşa edilmiş bir kütüphanedir ve daha estetik grafikler oluşturmanıza yardımcı olur. İstatistiksel verileri görselleştirmek için idealdir.
import seaborn as sns
sns.set_theme(style="darkgrid")
tips = sns.load_dataset("tips")
sns.histplot(tips["total_bill"])
plt.show()5. SciPy
Bilimsel hesaplamalar için en iyi kütüphanelerden biri olan SciPy, optimizasyon, entegrasyon ve istatistik gibi birçok alanda fonksiyonlar sunar.
from scipy import stats
data = [1, 2, 3, 4, 5]
mean = stats.tmean(data)
print(mean)6. Statsmodels
İstatistiksel modelleme için harika bir kütüphanedir. Regresyon analizi ve hipotez testleri gibi konularda kapsamlı araçlar sunar.
import statsmodels.api as sm
X = sm.add_constant(data)
model = sm.OLS(y, X).fit()
print(model.summary())7. Plotly
Etkileşimli grafikler oluşturmak için mükemmel bir kütüphanedir. Kullanıcıların verilerle etkileşime geçmesini sağlar.
import plotly.express as px
fig = px.scatter(x=[1, 2, 3], y=[4, 5, 6])
fig.show()8. Dask
Büyük veri setleriyle çalışmak için harika bir seçenektir. Pandas ile benzer bir API sunar ve işlemleri paralel olarak gerçekleştirir.
import dask.dataframe as dd
df = dd.read_csv('large_data.csv')
result = df.groupby('column').sum().compute()
print(result)9. PySpark
Dağıtık veri işleme için kullanılan PySpark, büyük veri setleri üzerinde işlem yapmanıza olanak tanır. Apache Spark ile entegre çalışır.
from pyspark.sql import SparkSession
spark = SparkSession.builder.appName('Example').getOrCreate()
df = spark.read.csv('big_data.csv')
df.show()10. Orange3
Görsel programlama arayüzü ile veri madenciliği ve makine öğrenimi için kullanılan bu kütüphane, kullanıcı dostu bir deneyim sunar.
# Orange3 örnek kodları genellikle görsel arayüzde çalışır.Sonuç olarak, veri analizi yaparken kullanabileceğiniz bu 10 kütüphane, projelerinizi zenginleştirerek size farklı bakış açıları kazandırabilir. Python’un sunduğu bu güçlü araçlarla, veri setlerinizi daha anlamlı hale getirebilir, içgörüler elde edebilir ve sonuçlarınızı etkili bir biçimde görselleştirebilirsiniz.