Veri analizi
Tanımlayıcı İstatistikler / Frekans Analizi
Veri setinin temel özelliklerini özetleyen istatistiksel ölçümlerdir. Ortalama, medyan, mod, standart sapma gibi değerleri içerir. Verilerin dağılımını ve sıklığını anlamak için kullanılır.
Kullanım Örnekleri:
• Satış verilerinin aylık ortalama ve standart sapmasını hesaplamak
• Müşteri yaş dağılımını analiz etmek
• Ürün stok seviyelerinin frekans dağılımını incelemek
Regresyon Analizi
Bağımlı ve bağımsız değişkenler arasındaki ilişkiyi modellemek için kullanılan bir yöntemdir. Genellikle bir değişkenin diğer değişken(ler) üzerindeki etkisini ölçmek için kullanılır. Tahmin ve öngörü yapmak için yaygın olarak kullanılır.
Kullanım Örnekleri:
• Ev fiyatlarını tahmin etmek (alan, oda sayısı gibi özelliklerle)
• Reklam harcamalarının satışlar üzerindeki etkisini ölçmek
• Hava sıcaklığının enerji tüketimi üzerindeki etkisini modellemek
Çoklu Regresyon Analizi
Birden fazla bağımsız değişkenin bir bağımlı değişken üzerindeki etkisini incelemek için kullanılır. Karmaşık ilişkileri modellemek ve birden çok faktörün etkisini aynı anda değerlendirmek için kullanılır. Daha kapsamlı ve gerçekçi modeller oluşturmaya olanak tanır.
Kullanım Örnekleri:
• Araç yakıt tüketimini tahmin etmek (motor hacmi, ağırlık, aerodinamik vb. faktörlerle)
• Çalışan performansını etkileyen faktörleri analiz etmek
• Ürün satışlarını etkileyen çoklu faktörleri modellemek
Korelasyon Analizi
İki veya daha fazla değişken arasındaki ilişkinin gücünü ve yönünü ölçer. -1 ile +1 arasında değişen bir korelasyon katsayısı kullanır. Değişkenler arasındaki bağlantıları anlamak ve potansiyel nedensel ilişkileri keşfetmek için kullanılır.
Kullanım Örnekleri:
• Eğitim seviyesi ve gelir arasındaki ilişkiyi incelemek
• Hisse senedi fiyatları arasındaki korelasyonları analiz etmek
• Egzersiz süresi ve kilo kaybı arasındaki ilişkiyi ölçmek
Karar Ağaçları
Veri setini bir dizi kural kullanarak sınıflandıran veya tahmin eden bir makine öğrenmesi algoritmasıdır. Ağaç benzeri bir model oluşturur ve kararları görsel olarak temsil eder. Anlaşılması kolay ve yorumlanabilir sonuçlar sağlar.
Kullanım Örnekleri :
• Kredi riski değerlendirmesi yapmak
• Hastalık teşhisi koymak
• Müşteri kayıp (churn) tahmininde bulunmak
ANOVA (Varyans Analizi)
Farklı gruplar arasındaki ortalama farklılıklarının istatistiksel olarak anlamlı olup olmadığını belirlemek için kullanılır. Gruplar arası ve grup içi varyansları karşılaştırır. Deneysel tasarımlarda ve grup karşılaştırmalarında yaygın olarak kullanılır.
Kullanım Örnekleri:
• Farklı gübre türlerinin bitki büyümesi üzerindeki etkisini karşılaştırmak
• Çeşitli eğitim yöntemlerinin öğrenci performansına etkisini analiz etmek
• Farklı pazarlama stratejilerinin satış performansı üzerindeki etkisini değerlendirmek
t-Testleri
İki grup arasındaki ortalama farklılıklarının istatistiksel olarak anlamlı olup olmadığını belirlemek için kullanılır. Tek örneklem, bağımsız örneklem ve eşleştirilmiş örneklem t-testleri gibi çeşitleri vardır. Küçük örneklem boyutlarında da güvenilir sonuçlar verebilir.
Kullanım Örnekleri:
• İki farklı ilaç tedavisinin etkinliğini karşılaştırmak
• Erkek ve kadın çalışanların maaş farklılıklarını analiz etmek
• Bir ürünün eski ve yeni versiyonlarının kullanıcı memnuniyetini karşılaştırmak
Yapısal Eşitlik Modellemesi
Karmaşık ilişki yapılarını analiz etmek için kullanılan çok değişkenli bir istatistiksel tekniktir. Gözlenen ve gizli değişkenler arasındaki ilişkileri modelleyebilir. Teorik modelleri test etmek ve doğrulamak için sıklıkla kullanılır.
Kullanım Örnekleri:
• Müşteri memnuniyeti, sadakat ve satın alma davranışı arasındaki ilişkileri modellemek
• Çalışan motivasyonu, iş tatmini ve performans arasındaki bağlantıları incelemek
• Sosyal medya kullanımı, benlik saygısı ve depresyon arasındaki ilişkileri analiz etmek
Zaman Serisi Analizi
Zaman içinde düzenli aralıklarla toplanan veri noktalarını analiz etmek için kullanılır. Trend, mevsimsellik ve döngüsellik gibi zaman serisi bileşenlerini tanımlar. Gelecekteki değerleri tahmin etmek için kullanılabilir.
Kullanım Örnekleri:
• Hisse senedi fiyatlarını tahmin etmek
• Enerji tüketimini öngörmek
• Mevsimsel satış trendlerini analiz etmek
Temel Bileşenler Analizi (PCA)
Yüksek boyutlu veri setlerini daha düşük boyutlu bir uzaya indirgemek için kullanılan bir boyut azaltma tekniğidir. Veri setindeki varyansın çoğunu açıklayan temel bileşenleri belirler. Veri sıkıştırma ve özellik çıkarma için yaygın olarak kullanılır.
Kullanım Örnekleri:
• Görüntü sıkıştırma ve yüz tanıma uygulamalarında
• Genetik veri analizinde gen ekspresyonlarını incelemek
• Finansal veri setlerinde risk faktörlerini belirlemek
Kümeleme Analizi (Cluster Analysis)
Benzer özelliklere sahip veri noktalarını gruplara (kümelere) ayırmak için kullanılan bir yöntemdir. K-means, hiyerarşik kümeleme gibi çeşitli algoritmaları içerir. Müşteri segmentasyonu ve veri keşfi için yaygın olarak kullanılır.
Kullanım Örnekleri:
• Müşteri segmentasyonu yaparak hedefli pazarlama stratejileri geliştirmek
• Benzer özellikteki ürünleri gruplamak
• Dokümanlardaki benzer konuları kümelemek