Zaman, modern veri biliminin en değerli parçalarından biridir. Her an değişen dünyamızda, geçmişin verilerine bakarak geleceği tahmin etmek neredeyse bir sanat haline gelmiştir. Finans, sağlık, hava durumu, iklim değişikliği ve daha fazlası… Hepsi zamanla şekillenen olaylar. İşte burada, zaman serisi analizi devreye giriyor.
Zaman serisi analizi, özellikle verilerin bir zaman dilimi içinde düzenli olarak toplandığı ve analiz edildiği bir tekniktir. Python ise bu alanda veri bilimcilerin en güçlü yardımcılarından biri olarak karşımıza çıkıyor. Gelin, Python’un popüler kütüphaneleriyle zaman serisi analizi nasıl yapılır, birlikte keşfedelim!
Python ve Zaman Serisi Analizi: İlk Adımlar
Python’daki en güçlü araçlardan biri olan pandas ile zaman serisi verisini nasıl yükleyebileceğimizi görelim:
import pandas as pd
# Zaman serisi verisini içeren CSV dosyasını yükleyelim
data = pd.read_csv('veri.csv', parse_dates=['Tarih'], index_col='Tarih')
data.head()
Bu basit kod parçası, zaman serisi verimizi bir DataFrame'e yükler. Burada, verimizin Tarih sütunu, zaman serisinin ana ekseni olacak. Pandas, tarihleri doğru bir şekilde okuyarak veriyi doğru formatta işlemenizi sağlar.
Veri Temizleme ve Görselleştirme
Öncelikle eksik verileri kontrol edelim:
# Eksik veri olup olmadığını kontrol edelim
data.isnull().sum()
Eğer eksik veriler varsa, bunları ortalama ya da medyan gibi yöntemlerle doldurabiliriz. Veya dilerseniz daha gelişmiş yöntemler kullanarak veriyi iyileştirebilirsiniz.
Veriyi görselleştirmek, modelinizi oluştururken doğru kararlar almanıza yardımcı olabilir. Matplotlib ve seaborn kütüphanelerini kullanarak veriyi çizelim:
import matplotlib.pyplot as plt
# Zaman serisi verisinin görselleştirilmesi
data['Fiyat'].plot(figsize=(10,6))
plt.title('Zaman Serisi Fiyatı')
plt.xlabel('Tarih')
plt.ylabel('Fiyat')
plt.show()
Bu çizim, zaman serisi verinizi görsel olarak analiz etmenizi sağlar ve gelecekteki modelleme için faydalı bir referans olabilir.
Python ile Öngörü Modelleri Kurma
Prophet, özellikle mevsimsellik ve tatil etkileri gibi faktörleri göz önünde bulundururken oldukça başarılıdır. Prophet ile basit bir model oluşturalım:
from fbprophet import Prophet
# Veri formatını Prophet için uyumlu hale getirelim
df = data[['Fiyat']].reset_index()
df.columns = ['ds', 'y']
# Modeli oluşturalım
model = Prophet()
model.fit(df)
# Gelecekteki verileri tahmin edelim
future = model.make_future_dataframe(df, periods=365)
forecast = model.predict(future)
# Tahmin sonuçlarını görselleştirelim
model.plot(forecast)
plt.show()
Bu kod, geçmiş verilerinizi alarak geleceğe yönelik 365 günlük tahminler oluşturacaktır. Prophet, zaman serisi verinizi başarılı bir şekilde modelleyip geleceği tahmin etme yeteneğine sahiptir. Bu model, finansal piyasalar, hava durumu tahminleri gibi birçok alanda kullanılabilir.
Sonuç: Zamanın Gücünü Keşfedin
Zaman serisi analizi, veri biliminde yalnızca bir başlangıçtır. Eğer bu alanda derinleşmek istiyorsanız, daha karmaşık modeller kurarak öngörü gücünüzü artırabilirsiniz. Bu yazı, Python ile veri bilimi yolculuğunuza başlamanızı sağlayacak bir rehber olabilir.
Hadi, zamanın gücünü keşfetmeye başlayalım!