Veri Analitiği Nedir?
Veri analitiği, verilerden anlam çıkarma ve bu anlamı iş kararlarına dönüştürme sürecidir. Hangi sektörde olursan ol, veri her zaman önemli bir kaynak olacaktır. Ancak bu verilerin doğru şekilde analiz edilmesi, onlardan değerli bilgiler elde edebilmeni sağlar.
Python ve Pandas ile İlk Adımlar
# Python Kurulumu
İlk olarak, bilgisayarına Python kurman gerekecek. Python’un en güncel sürümünü [resmi Python web sitesinden](https://www.python.org/downloads/) indirebilirsin. Kurulum oldukça basit, birkaç tıklama ile Python’u bilgisayarına yüklemiş olacaksın.
Pandas Kütüphanesini Kurmak
Python’u kurduktan sonra, verilerini işlemek için Pandas’ı kurman gerekecek. Bunun için terminal ya da komut satırına şu komutu yazman yeterli:
```bash
pip install pandas
```
Bundan sonra, Pandas’ı kullanmaya başlamak için Python kodunda şu şekilde import edebilirsin:
```python
import pandas as pd
```
Veri Yükleme ve İlk Analiz
Aşağıdaki gibi basit bir kod ile veri setini yükleyebiliriz:
```python
import pandas as pd
# Veri setini yükle
df = pd.read_csv('veri_seti.csv')
# İlk birkaç satırı görüntüle
print(df.head())
```
Bu kod, 'veri_seti.csv' adlı dosyanın içeriğini yükler ve ilk birkaç satırını ekrana yazdırır. Bu sayede, veriye dair bir fikir edinmiş olursun.
# Veri Temizleme
Veri analizi yaparken, verinin doğru ve temiz olması çok önemlidir. Pandas, eksik verileri ve hatalı girişleri tespit etmeni sağlar. Örneğin, eksik verileri nasıl doldurabileceğine bakalım:
# Eksik verileri kontrol et
print(df.isnull().sum())
# Eksik verileri ortalama ile doldur
df.fillna(df.mean(), inplace=True)
```
Basit Veri Analizleri
# Ortalama ve Toplam
Bir veri setinin ortalamasını ve toplamını hesaplamak oldukça basittir:
# Bir sütunun ortalamasını al
print(df['sütun_adı'].mean())
# Bir sütunun toplamını al
print(df['sütun_adı'].sum())
```
# Veri Gruplama
Veri setini daha ayrıntılı incelemek için gruplama yapabilirsin. Örneğin, kategorilere göre veriyi gruplayıp her grubun ortalama değerini bulabiliriz:
# Veri setini gruplandır ve her grubun ortalamasını al
grouped = df.groupby('kategori_sütunu')['sütun_adı'].mean()
print(grouped)
```
Görselleştirme: Verini Görselleştir
Örneğin, verinin dağılımını görmek için şu şekilde bir grafik çizebilirsin:
```python
import matplotlib.pyplot as plt
# Verinin histogramını çiz
df['sütun_adı'].hist(bins=10)
plt.show()
```