Python ile Veri Bilimi: Temel İstatistiksel Yöntemleri Kolayca Anlatan 5 Pratik Kod Örneği

 Python ile Veri Bilimi: Temel İstatistiksel Yöntemleri Kolayca Anlatan 5 Pratik Kod Örneği

**

BFS


Veri bilimi dünyasına adım atmaya karar verdiniz ve Python, bu yolculuğunuzda size rehberlik etmek için harika bir araç. Ancak veri bilimi, başta karmaşık gibi görünebilir, değil mi? Neyse ki, Python'un sunduğu araçlarla, karmaşık görünen istatistiksel analizleri daha kolay bir şekilde anlayabilir ve uygulayabilirsiniz. Bugün sizlere, Python ile veri bilimi öğrenmeye başlarken kullanabileceğiniz 5 pratik istatistiksel yöntemden bahsedeceğiz.

1. Ortalama Hesaplama


Veri biliminin en temel istatistiksel kavramlarından biri "ortalama"dır. Ortalama, veri setindeki tüm değerlerin toplamının, veri setindeki eleman sayısına bölünmesiyle bulunur. Python’da bu hesaplamayı yapmak çok basit!


import numpy as np

# Örnek veri seti
data = [10, 20, 30, 40, 50]

# Ortalama hesaplama
mean = np.mean(data)
print("Ortalama:", mean)


Bu kod, veri setindeki sayıları alır ve onların ortalamasını hesaplar. Python’un
NumPy kütüphanesi, istatistiksel hesaplamalar için çok kullanışlıdır ve bu tür işlemleri hızlı bir şekilde yapmanızı sağlar.

2. Medyan Hesaplama


Ortalamanın yanı sıra, bir diğer önemli kavram medyandır. Medyan, veri setindeki sıralanmış değerlerin ortasında yer alan değerdir. Eğer veri seti çift sayıda elemandan oluşuyorsa, ortadaki iki değerin ortalaması alınır.


# Medyan hesaplama
median = np.median(data)
print("Medyan:", median)


Medyan, özellikle verilerde aşırı uç değerlerin (outliers) bulunduğu durumlarda ortalama yerine daha güvenilir bir ölçü olabilir.

3. Varyans ve Standart Sapma


Varyans, veri setindeki değerlerin ortalamadan ne kadar sapma gösterdiğini ölçer. Varyans ne kadar yüksekse, veri setindeki değerler o kadar geniş bir aralığa yayılır. Standart sapma ise varyansın kareköküdür ve daha anlaşılır bir ölçü sağlar. İşte Python’da nasıl hesaplanır:


# Varyans hesaplama
variance = np.var(data)
print("Varyans:", variance)

# Standart sapma hesaplama
std_dev = np.std(data)
print("Standart Sapma:", std_dev)


Bu hesaplamalar, verilerin ne kadar değişken olduğunu anlamanızı sağlar. Veri analizi yaparken, varyans ve standart sapma gibi ölçütleri kullanarak, modelinizin doğruluğunu değerlendirebilirsiniz.

4. Korelasyon Hesaplama


İstatistiksel analizde korelasyon, iki değişken arasındaki ilişkiyi gösterir. Eğer iki değişken arasında pozitif bir korelasyon varsa, birinin artması diğerinin de artmasına neden olur. Negatif korelasyon ise tersi bir ilişkiyi ifade eder. Python’da korelasyon hesaplamak için şu kodu kullanabilirsiniz:


# İki veri seti
data1 = [1, 2, 3, 4, 5]
data2 = [5, 4, 3, 2, 1]

# Korelasyon hesaplama
correlation = np.corrcoef(data1, data2)[0, 1]
print("Korelasyon:", correlation)


Bu kod, iki veri seti arasındaki korelasyonu hesaplar. Korelasyon değeri, -1 ile 1 arasında bir değer alır; 1 pozitif, -1 ise negatif korelasyonu gösterir.

5. Basit Lineer Regresyon


Regresyon analizi, iki değişken arasındaki ilişkiyi modellemeye yardımcı olan bir tekniktir. Basit lineer regresyon, bir bağımlı değişkenin (y) bir bağımsız değişken (x) ile nasıl ilişkilendiğini keşfeder. Python'da basit bir regresyon analizi yapmak için şu adımları izleyebilirsiniz:


from sklearn.linear_model import LinearRegression

# Bağımsız ve bağımlı değişkenler
x = np.array([1, 2, 3, 4, 5]).reshape(-1, 1)  # Bağımsız değişken
y = np.array([5, 4, 3, 2, 1])  # Bağımlı değişken

# Modeli oluşturma
model = LinearRegression()
model.fit(x, y)

# Regresyon doğrusu
print("Eğik: ", model.coef_)
print("Kesit: ", model.intercept_)


Bu örnekte, `x` bağımsız değişken (örneğin, zaman) ve `y` bağımlı değişkeni (örneğin, satışlar) temsil eder. Model, veriye en uygun doğruyu bulur ve eğimini ve kesitini çıkarır.

Sonuç


Yukarıda bahsettiğimiz 5 pratik istatistiksel yöntem, Python kullanarak veri bilimi dünyasında daha güçlü bir temele sahip olmanıza yardımcı olacaktır. Her biri, veri analizi yaparken sıklıkla kullanacağınız ve verinizin anlamını daha iyi kavrayabilmeniz için çok değerli araçlardır. Bu kodları ve kavramları öğrenmek, size veri setlerinizle daha derinlemesine çalışabilme imkanı sağlayacak ve daha doğru analizler yapmanıza olanak tanıyacaktır.

Veri bilimi bir yolculuk gibidir, ve Python bu yolculukta en iyi arkadaşınızdır. Yavaşça adımlarınızı atın ve bu temel istatistiksel yöntemleri kullanarak veri dünyasının kapılarını aralayın. Unutmayın, her yeni adım sizi daha yetkin bir veri bilimci yapacak.

İlgili Yazılar

Benzer konularda diğer yazılarımız

Yapay Zeka ile Veritabanı Yönetimi: Geleceğin Veri Tabanlarını Bugünden Keşfedin

Günümüzde teknoloji hızla ilerliyor ve bu ilerleme, veritabanı yönetimini de derinden etkiliyor. Ancak bir soru var: “Veritabanları nasıl daha verimli, güvenli ve hızlı hale getirilebilir?” Cevap aslında çok yakın: Yapay zeka! Evet, veritabanı yönetimi...

Yapay Zeka ve İnsan Duyguları: Python’da Duygu Analizine Giriş ve Uygulama

Yapay zekanın hayatımıza olan etkisi her geçen gün artıyor. Teknolojinin bu hızlı gelişimiyle birlikte, sadece işlemler değil, duygular da dijital dünyada bir yer buluyor. Peki, yapay zeka insan duygularını nasıl anlayabilir? Python’da duygu analizi yaparak,...

Yapay Zeka Destekli Veri Analizi ile İş Zekasını Nasıl Geliştirirsiniz? - 2025'in En Yeni Trendleri ve Uygulamaları

Veri analizi, iş dünyasında bugüne kadar görülmemiş bir hızla evrildi. 2025 yılına girerken, iş zekasını geliştirmek için kullanılan yapay zeka destekli araçlar, şirketlerin karar alma süreçlerini köklü bir şekilde dönüştürmeye devam ediyor. Peki, bu...