Veri bilimi dünyasına adım atmak isteyenler için Python, açık ara en popüler programlama dillerinden biri. Peki, Python’u veri bilimi projelerinde nasıl kullanabilirsiniz? Başlangıçta ne tür araçlara ihtiyacınız olacak ve hangi kütüphaneleri öğrenmelisiniz? Gelin, adım adım Python ile veri bilimine dair temel araçları keşfederek bu yolculuğa birlikte çıkalım.
Python ile Veri Bilimine Giriş
1. NumPy: Matematiksel İşlemler İçin Temel Kütüphane
NumPy ile Başlangıç
NumPy kullanarak çok boyutlu diziler oluşturabilir ve bunlarla çeşitli işlemler yapabilirsiniz. Aşağıda basit bir örnek yer alıyor:
import numpy as np
# Bir dizi oluşturma
dizi = np.array([1, 2, 3, 4])
# Dizinin elemanlarının karesini alma
kareler = np.power(dizi, 2)
print(kareler)
2. Pandas: Veri Manipülasyonu ve Analizi
Pandas ile Veri Manipülasyonu
Pandas’la basit bir veri çerçevesi oluşturalım ve bir kaç temel işlem gerçekleştirelim:
import pandas as pd
# Örnek veri çerçevesi
data = {'Ad': ['Ali', 'Veli', 'Ayşe'], 'Yaş': [22, 35, 28]}
df = pd.DataFrame(data)
# Yaşı 30'dan büyük olanları filtreleyelim
df_filtreli = df[df['Yaş'] > 30]
print(df_filtreli)
3. Matplotlib ve Seaborn: Veri Görselleştirme
Veri Görselleştirme ile Analizleri Daha Anlaşılır Hale Getirme
Verilerinizi basit bir şekilde görselleştirmek için Matplotlib kullanabilirsiniz:
import matplotlib.pyplot as plt
# Örnek veri
x = [1, 2, 3, 4, 5]
y = [1, 4, 9, 16, 25]
# Basit bir çizgi grafik
plt.plot(x, y)
plt.title('Y = X^2 Grafiği')
plt.xlabel('X')
plt.ylabel('Y')
plt.show()
4. Scikit-learn: Makine Öğrenmesi İçin En İyi Araç
Scikit-learn ile İlk Makine Öğrenmesi Modelinizi Kurun
Basit bir model oluşturmak için Scikit-learn’ü şu şekilde kullanabilirsiniz:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score
# Iris veri setini yükleyelim
data = load_iris()
X = data.data
y = data.target
# Veriyi eğitim ve test setlerine bölelim
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# Bir model oluşturup eğitelim
model = LogisticRegression(max_iter=200)
model.fit(X_train, y_train)
# Test seti ile tahmin yapalım
y_pred = model.predict(X_test)
# Başarı oranını değerlendirelim
accuracy = accuracy_score(y_test, y_pred)
print(f'Model Doğruluğu: {accuracy*100:.2f}%')
5. TensorFlow ve Keras: Derin Öğrenme İçin Güçlü Araçlar
Sonuç: Veri Bilimi Yolculuğuna Başlamak
Başlangıç için bu kütüphaneleri öğrenmeye başlamak, veri bilimi yolculuğunuzda size büyük bir avantaj sağlayacak. Unutmayın, bu yolculuk eğlenceli olduğu kadar, aynı zamanda bilgi dolu ve keşiflerle doludur!