Google, Gemini API Maliyetini Düşürmek İçin ‘Örtülü Önbellekleme’yi Başlattı

Google, Gemini API’sinde üçüncü taraf geliştiriciler için en son yapay zeka modellerinin kullanım maliyetini düşürmeyi amaçlayan “örtülü önbellekleme” adlı yeni bir özelliği kullanıma sundu.

Detaylar haberimizde…

Google, Gemini API‘sinde, şirketin üçüncü taraf geliştiriciler için en son yapay zeka modellerinin kullanım maliyetini azaltacağını iddia ettiği “örtülü önbellekleme” adlı yeni bir özelliği kullanıma sundu.

Google, bu özelliğin Gemini API aracılığıyla modellere iletilen “tekrarlayan bağlam” üzerinde %75’e varan tasarruf sağlayabileceğini belirtiyor. Örtülü önbellekleme, Google’ın Gemini 2.5 Pro ve 2.5 Flash modellerini destekliyor.

Örtülü Önbelleklemenin İşleyişi ve Avantajları

Yapay zeka endüstrisinde yaygın olarak benimsenen bir uygulama olan önbellekleme, bilgi işlem gereksinimlerini ve maliyetleri azaltmak için modellerden sık erişilen veya önceden hesaplanmış verileri yeniden kullanır. Örneğin, önbellekler kullanıcıların bir modele sıkça sorduğu soruların yanıtlarını depolayabilir, bu da modelin aynı isteğe tekrar tekrar yanıt oluşturma ihtiyacını ortadan kaldırır.

Google daha önce model istemi önbellekleme sunuyordu, ancak yalnızca geliştiricilerin en sık kullanılan istemlerini tanımlaması gereken “açık” istem önbelleklemesini destekliyordu. Maliyet tasarrufu garanti edilmesi gerekse de, açık istem önbelleklemesi tipik olarak çok fazla manuel çalışma içeriyordu.

Google

Bazı geliştiriciler, Gemini 2.5 Pro için Google’ın açık önbellekleme uygulamasının beklenenden yüksek API faturalarına neden olabileceği yönünde eleştirilerde bulunmuşlardı. Geçtiğimiz hafta bu şikayetler yoğunlaşmış ve Gemini ekibinin özür dilemesine ve değişiklik yapma sözü vermesine yol açmıştı.

Açık önbelleklemenin aksine, örtülü önbellekleme otomatik olarak çalışır. Gemini 2.5 modelleri için varsayılan olarak etkinleştirilen bu özellik, bir Gemini API isteği bir önbellek isabeti aldığında maliyet tasarrufunu otomatik olarak uygular.

Google’ın Belgelerine Göre Teknik Detaylar ve Geliştirici Önerileri

Google’ın geliştirici belgelerine göre, örtülü önbellekleme için minimum istem belirteci sayısı 2.5 Flash için 1.024 ve 2.5 Pro için 2.048’dir. Google, geliştiricilerin örtülü önbellek isabet olasılığını artırmak için tekrarlayan bağlamı isteklerin başına eklemelerini öneriyor. İstekten isteğe değişebilecek bağlamın ise sona eklenmesi gerektiği belirtiliyor.

Google, yeni örtülü önbellekleme sisteminin vaat edilen otomatik tasarrufları sağlayacağına dair herhangi bir üçüncü taraf doğrulaması sunmadı. Bu nedenle, ilk kullanıcıların geri bildirimleri bekleniyor.

Derleye: Enis Yabar

En Son

Project Hail Mary: NASA Bilimi Bilim Kurgunun Gerçek Sınırlarını Zorluyor mu?

*Project Hail Mary* ile yeniden gündeme gelen derin uzay yolculuğu ve NASA’nın gerçek bilimsel çalışmaları, bilim kurgu ile gerçeklik arasındaki sınırın aslında ne kadar ince olduğunu bir kez daha tartışmaya açıyor.

Avatar Video Oyunu O Kadar İyi ki Filmlere Gerek Kalmayabilir

Avatar evreni uzun süredir sinema ile özdeşleşmiş olsa da, yeni video oyunu deneyimi bu dünyayı izlemekten çıkarıp doğrudan yaşanabilir bir gerçekliğe dönüştürerek filmlerin rolünü bile sorgulatıyor.

Bu Ay İzleyebileceğiniz En İyi 10 Dizi

Dijital platformların içerik bombardımanına dönüştüğü günümüzde, gerçekten izlemeye değer dizileri seçmek her zamankinden daha zor hale gelirken, öne çıkan yapımlar izleyicilere güçlü ve unutulmaz deneyimler sunmayı başarıyor.

Yılın En Aptalca Hack’i Çok Gerçek Bir Sorunu Ortaya Çıkardı

Silikon Vadisi’nde yaya geçidi butonlarının hacklenmesiyle ortaya çıkan tuhaf olay, ilk bakışta basit bir şaka gibi görünse de aslında modern şehirlerin siber güvenlik konusunda ne kadar savunmasız olduğunu gözler önüne serdi.

Bültene Kaydol

Üye Özel

Yapay Zekâ Damgası: Dünyanın Prestijli Girişim Gününde 16 Çarpıcı Startup

Y Combinator’ın Winter 2026 Demo Day etkinliğinde tanıtılan yaklaşık 190 girişim arasından öne çıkan 16 startup, yapay zekânın farklı sektörlerde nasıl dönüştürücü bir rol üstlendiğini gözler önüne serdi. Hukuktan sağlığa, güvenlikten enerjiye uzanan projeler dikkat çekti.

Kagi’nin İnsan Odaklı İnterneti: ‘Küçük Web’le Tanışın

Kagi’nin ‘Küçük Web’ girişimi, interneti sadece insanlar tarafından yazılmış içeriklerle keşfetmeye odaklanıyor. Kişisel bloglar, bağımsız videolar ve web çizgi romanları, mobil ve web uygulamaları üzerinden daha erişilebilir hâle geliyor.

Yapay Zekâyla Konuşmanın Doğru Yolu

Yapay zekâya “lütfen” demek işe yarıyor mu? Onu tehdit etmek mi, yoksa bir bilim kurgu dizisindeki karakter gibi konuşturmak mı daha etkili? Uzmanlara göre sohbet robotlarından daha iyi sonuç almanın yolu sandığınız kadar gizemli değil.

LGBTQ+ Sporcular 2026 Kış Olimpiyat Oyunlarında Ön Planda Olacak

Açık kimlikleriyle LGBTQ+ olan yaklaşık 50 Olimpiyat sporcusu, konuşma ve yarışma hakları saldırı altında olmasına rağmen Kış Olimpiyat Oyunları boyunca çeşitli etkinliklerde yer alıyor.

Kripto Parayla Finanse Edilen İnsan Ticareti Hızla Artıyor

Tahminlere göre, fuhuş ve dolandırıcılık amacıyla insan ticareti işlemlerinde kripto para birimlerinin kullanımı 2025 yılında neredeyse iki katına çıktı.

- dijitaliyidir Sponsor Desteği -

spot_imgspot_img

Project Hail Mary: NASA Bilimi Bilim Kurgunun Gerçek Sınırlarını Zorluyor mu?

*Project Hail Mary* ile yeniden gündeme gelen derin uzay yolculuğu ve NASA’nın gerçek bilimsel çalışmaları, bilim kurgu ile gerçeklik arasındaki sınırın aslında ne kadar ince olduğunu bir kez daha tartışmaya açıyor.

Bu Ay İzleyebileceğiniz En İyi 10 Dizi

Dijital platformların içerik bombardımanına dönüştüğü günümüzde, gerçekten izlemeye değer dizileri seçmek her zamankinden daha zor hale gelirken, öne çıkan yapımlar izleyicilere güçlü ve unutulmaz deneyimler sunmayı başarıyor.