Python ile Veri Bilimi: Temel İstatistiksel Yöntemleri Kolayca Anlatan 5 Pratik Kod Örneği

Veri bilimi dünyasına adım atmaya karar verdiniz ve Python, bu yolculuğunuzda size rehberlik etmek için harika bir araç. Ancak veri bilimi, başta karmaşık gibi görünebilir, değil mi? Neyse ki, Python'un sunduğu araçlarla, karmaşık görünen istatistiksel analizleri daha kolay bir şekilde anlayabilir ve uygulayabilirsiniz. Bugün sizlere, Python ile veri bilimi öğrenmeye başlarken kullanabileceğiniz 5 pratik istatistiksel yöntemden bahsedeceğiz.

1. Ortalama Hesaplama

Veri biliminin en temel istatistiksel kavramlarından biri "ortalama"dır. Ortalama, veri setindeki tüm değerlerin toplamının, veri setindeki eleman sayısına bölünmesiyle bulunur. Python’da bu hesaplamayı yapmak çok basit!


import numpy as np

# Örnek veri seti
data = [10, 20, 30, 40, 50]

# Ortalama hesaplama
mean = np.mean(data)
print("Ortalama:", mean)

Bu kod, veri setindeki sayıları alır ve onların ortalamasını hesaplar. Python’un NumPy kütüphanesi, istatistiksel hesaplamalar için çok kullanışlıdır ve bu tür işlemleri hızlı bir şekilde yapmanızı sağlar.

2. Medyan Hesaplama

Ortalamanın yanı sıra, bir diğer önemli kavram medyandır. Medyan, veri setindeki sıralanmış değerlerin ortasında yer alan değerdir. Eğer veri seti çift sayıda elemandan oluşuyorsa, ortadaki iki değerin ortalaması alınır.


# Medyan hesaplama
median = np.median(data)
print("Medyan:", median)

Medyan, özellikle verilerde aşırı uç değerlerin (outliers) bulunduğu durumlarda ortalama yerine daha güvenilir bir ölçü olabilir.

3. Varyans ve Standart Sapma

Varyans, veri setindeki değerlerin ortalamadan ne kadar sapma gösterdiğini ölçer. Varyans ne kadar yüksekse, veri setindeki değerler o kadar geniş bir aralığa yayılır. Standart sapma ise varyansın kareköküdür ve daha anlaşılır bir ölçü sağlar. İşte Python’da nasıl hesaplanır:


# Varyans hesaplama
variance = np.var(data)
print("Varyans:", variance)

# Standart sapma hesaplama
std_dev = np.std(data)
print("Standart Sapma:", std_dev)

Bu hesaplamalar, verilerin ne kadar değişken olduğunu anlamanızı sağlar. Veri analizi yaparken, varyans ve standart sapma gibi ölçütleri kullanarak, modelinizin doğruluğunu değerlendirebilirsiniz.

4. Korelasyon Hesaplama

İstatistiksel analizde korelasyon, iki değişken arasındaki ilişkiyi gösterir. Eğer iki değişken arasında pozitif bir korelasyon varsa, birinin artması diğerinin de artmasına neden olur. Negatif korelasyon ise tersi bir ilişkiyi ifade eder. Python’da korelasyon hesaplamak için şu kodu kullanabilirsiniz:


# İki veri seti
data1 = [1, 2, 3, 4, 5]
data2 = [5, 4, 3, 2, 1]

# Korelasyon hesaplama
correlation = np.corrcoef(data1, data2)[0, 1]
print("Korelasyon:", correlation)

Bu kod, iki veri seti arasındaki korelasyonu hesaplar. Korelasyon değeri, -1 ile 1 arasında bir değer alır; 1 pozitif, -1 ise negatif korelasyonu gösterir.

5. Basit Lineer Regresyon

Regresyon analizi, iki değişken arasındaki ilişkiyi modellemeye yardımcı olan bir tekniktir. Basit lineer regresyon, bir bağımlı değişkenin (y) bir bağımsız değişken (x) ile nasıl ilişkilendiğini keşfeder. Python'da basit bir regresyon analizi yapmak için şu adımları izleyebilirsiniz:


from sklearn.linear_model import LinearRegression

# Bağımsız ve bağımlı değişkenler
x = np.array([1, 2, 3, 4, 5]).reshape(-1, 1)  # Bağımsız değişken
y = np.array([5, 4, 3, 2, 1])  # Bağımlı değişken

# Modeli oluşturma
model = LinearRegression()
model.fit(x, y)

# Regresyon doğrusu
print("Eğik: ", model.coef_)
print("Kesit: ", model.intercept_)

Bu örnekte, `x` bağımsız değişken (örneğin, zaman) ve `y` bağımlı değişkeni (örneğin, satışlar) temsil eder. Model, veriye en uygun doğruyu bulur ve eğimini ve kesitini çıkarır.

Sonuç

Yukarıda bahsettiğimiz 5 pratik istatistiksel yöntem, Python kullanarak veri bilimi dünyasında daha güçlü bir temele sahip olmanıza yardımcı olacaktır. Her biri, veri analizi yaparken sıklıkla kullanacağınız ve verinizin anlamını daha iyi kavrayabilmeniz için çok değerli araçlardır. Bu kodları ve kavramları öğrenmek, size veri setlerinizle daha derinlemesine çalışabilme imkanı sağlayacak ve daha doğru analizler yapmanıza olanak tanıyacaktır.

Veri bilimi bir yolculuk gibidir, ve Python bu yolculukta en iyi arkadaşınızdır. Yavaşça adımlarınızı atın ve bu temel istatistiksel yöntemleri kullanarak veri dünyasının kapılarını aralayın. Unutmayın, her yeni adım sizi daha yetkin bir veri bilimci yapacak.

1. Ortalama Hesaplama

2. Medyan Hesaplama

3. Varyans ve Standart Sapma

4. Korelasyon Hesaplama

5. Basit Lineer Regresyon

Sonuç

Kategori

Tags

Yazar Hakkında

BFS

Yazarın Diğer Yazıları:

Kategoriler

Popüler Yazılar

ApiUp Nedir?

"Veri Güvenliği: MySQL Veritabanınızı Hack’lere Karşı Nasıl Korursunuz?"

NetBeans Debugging Başlatılmıyor – Çözüm Adımları ile Sorunu Gidermek

Tags

İlgili Yazılar

Yapay Zeka ile Veritabanı Yönetimi: Geleceğin Veri Tabanlarını Bugünden Keşfedin

Yapay Zeka ve İnsan Duyguları: Python’da Duygu Analizine Giriş ve Uygulama

Yapay Zeka Destekli Veri Analizi ile İş Zekasını Nasıl Geliştirirsiniz? - 2025'in En Yeni Trendleri ve Uygulamaları