Google, TabFM adını verdiği yeni yapay zeka modelini tanıttı. Model, tablo verileri üzerinde herhangi bir ek eğitim süreci olmadan tahmin yapabiliyor. Bu yaklaşım, veri bilimi ve iş analitiği süreçlerini önemli ölçüde hızlandırma potansiyeli taşıyor.
Detaylar haberimizde…
Google Research tarafından geliştirilen TabFM, özellikle finans, pazarlama ve müşteri analitiği gibi alanlarda kullanılan tabular (tablo) veriler için tasarlandı. Model, yeni bir veri seti için klasik makine öğrenmesi süreçlerinde gereken eğitim, özellik mühendisliği ve hiperparametre ayarlarını tamamen ortadan kaldırıyor.

TabFM’de Eğitim Yok, Doğrudan Tahmin Var
TabFM’in en dikkat çekici özelliği “zero-shot” yani sıfırdan öğrenme yaklaşımı. Model, daha önce görmediği bir veri setinde bile, yalnızca örnek satırları inceleyerek tahmin yapabiliyor. Bu süreç, tek bir ileri geçişte (forward pass) tamamlanıyor.
Modelin arka planında, satır ve sütun bazlı dikkat (attention) mekanizmalarıyla çalışan bir Transformer mimarisi bulunuyor. Her veri satırı yoğun bir vektöre dönüştürülüyor ve bu temsil üzerinden tahmin gerçekleştiriliyor.
Sentetik Veri ile Eğitildi
Google, TabFM’i gerçek veri yerine yüz milyonlarca sentetik veri setiyle eğitti. Bu veri setleri, “structural causal models” adı verilen yöntemlerle üretildi. Amaç, farklı veri yapılarını kapsayan geniş ve dengeli bir öğrenme ortamı oluşturmak.
Bu yaklaşım, özellikle açık kaynak dünyasında sıkça dile getirilen “yüksek kaliteli tabular veri eksikliği” sorununa da alternatif bir çözüm sunuyor.
Benchmark Sonuçlarında Zirvede
TabFM, 38 sınıflandırma ve 13 regresyon veri setinden oluşan TabArena benchmark’ında en yüksek Elo skoruna ulaşarak ilk sırada yer aldı. Test edilen veri setleri 700 ile 150 bin örnek arasında değişiyor.
Daha güçlü bir varyantta ise non-negative least squares, SVD tabanlı özellikler ve Platt scaling gibi tekniklerin kullanıldığı bir ensemble yaklaşımı tercih edildi.
BigQuery ile Doğrudan Kullanım Geliyor
Google, TabFM’i kısa süre içinde BigQuery’ye entegre etmeyi planlıyor. Bu entegrasyon sayesinde kullanıcılar, tek bir AI.PREDICT SQL komutuyla tahmin modelleri çalıştırabilecek.
Bu gelişme, özellikle veri ekipleri için önemli bir dönüşüm anlamına geliyor. Churn analizi, dolandırıcılık tespiti veya müşteri segmentasyonu gibi işlemler, ayrı bir makine öğrenmesi pipeline’ı kurmadan doğrudan SQL üzerinden yapılabilecek.
Model ağırlıkları Hugging Face üzerinden (ticari olmayan lisansla) paylaşılırken, kullanım kodları GitHub’da Apache 2.0 lisansı ile erişime açıldı.
TabFM, yapay zekanın tabular veri tarafında “AutoML sonrası” yeni bir dönemi işaret ediyor. Önümüzdeki süreçte benzer zero-shot yaklaşımların veri analitiği araçlarına daha fazla entegre olması bekleniyor.
Günde sadece 1 TL'ye abone olarak tüm içeriklerimize sınırsız erişebilir ve bağımsız haberciliğe destek olabilirsiniz! Hemen Abone Ol




