1. Pandas: Veri Manipülasyonu ve Analizi
Uygulama Örneği: Bir CSV dosyasındaki verileri Pandas ile okuyup, eksik verileri temizleyebilir ve basit bir analiz yapabilirsiniz.
import pandas as pd
# CSV dosyasını okuma
data = pd.read_csv('veri_seti.csv')
# Eksik verileri kontrol etme
missing_data = data.isnull().sum()
# Veriyi sıralama
sorted_data = data.sort_values(by='Yaş', ascending=False)
print(sorted_data.head())
Pandas sayesinde, verilerinizi hızlıca düzenleyip analiz edebilirsiniz. Veri biliminin temel taşlarından biridir!
2. NumPy: Sayısal Hesaplamalar için Temel Kütüphane
Uygulama Örneği: NumPy ile matris çarpma işlemi yapabilir ve büyük veri kümeleri üzerinde hızlı hesaplamalar gerçekleştirebilirsiniz.
import numpy as np
# İki matris oluşturma
matris1 = np.array([[1, 2], [3, 4]])
matris2 = np.array([[5, 6], [7, 8]])
# Matris çarpma
result = np.dot(matris1, matris2)
print(result)
NumPy, özellikle makine öğrenmesi algoritmalarında ve veri analizi süreçlerinde çok önemli bir rol oynar.
3. Matplotlib: Veri Görselleştirme
Uygulama Örneği: Basit bir çizgi grafiği ile veri görselleştirme yapabilirsiniz.
import matplotlib.pyplot as plt
# Basit bir çizgi grafiği
x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]
plt.plot(x, y)
plt.title("Basit Çizgi Grafiği")
plt.xlabel("X Ekseni")
plt.ylabel("Y Ekseni")
plt.show()
Veri görselleştirme, analizlerinizi daha net bir şekilde paylaşmanıza yardımcı olur. Matplotlib ile verilerinizi görsel hale getirerek daha etkili sunumlar yapabilirsiniz.
4. Scikit-Learn: Makine Öğrenmesi İçin Güçlü Bir Araç
Uygulama Örneği: Basit bir sınıflandırma algoritması kullanarak, veriler üzerinde makine öğrenmesi modelini eğitebilirsiniz.
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
# Veriyi yükleme
data = pd.read_csv('veri_seti.csv')
# Özellikler ve hedef değişken
X = data.drop('hedef', axis=1)
y = data['hedef']
# Eğitim ve test setlerine ayırma
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
# Model oluşturma ve eğitme
model = RandomForestClassifier()
model.fit(X_train, y_train)
# Test seti üzerinde tahmin yapma
predictions = model.predict(X_test)
# Model doğruluğu
accuracy = accuracy_score(y_test, predictions)
print(f"Model Doğruluğu: {accuracy * 100:.2f}%")
Scikit-Learn ile güçlü makine öğrenmesi modelleri geliştirebilir ve verilerinizi daha derinlemesine analiz edebilirsiniz.
5. TensorFlow: Derin Öğrenme İçin Güçlü Bir Kütüphane
Uygulama Örneği: Basit bir yapay sinir ağı modeli oluşturarak, temel bir sınıflandırma problemi çözebilirsiniz.
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
# Basit bir yapay sinir ağı modeli oluşturma
model = Sequential()
model.add(Dense(32, activation='relu', input_dim=10))
model.add(Dense(1, activation='sigmoid'))
# Modeli derleme
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])
# Modeli eğitme
model.fit(X_train, y_train, epochs=10, batch_size=32)
# Modeli değerlendirme
loss, accuracy = model.evaluate(X_test, y_test)
print(f"Model Kaybı: {loss:.4f}, Model Doğruluğu: {accuracy * 100:.2f}%")
TensorFlow, derin öğrenme alanında en güçlü araçlardan biridir ve büyük projeler için mükemmel bir tercihtir.
Sonuç
Unutmayın, veri bilimi bir yolculuktur ve her geçen gün yeni şeyler öğrenirsiniz. Şimdi bu kütüphaneleri keşfetmeye başlayın ve veri bilimi dünyasına adım atın!