Anthropic, bugün Opus 4.5’i tanıtarak hem performans hem de kullanıcı deneyimi açısından önemli iyileştirmeler sundu.
Detaylar haberimizde…
Anthropic, bugün amiral gemisi öncü modeli Opus 4.5‘i yayınladı. Bu model, kodlama performansında iyileştirmelerin yanı sıra, onu genel olarak OpenAI’nin en yeni öncü modelleriyle daha rekabetçi hale getiren bazı kullanıcı deneyimi iyileştirmeleri de sunuyor.

Belki de çoğu kullanıcı için en önemli değişiklik, tüketici uygulama deneyimlerinde (web, mobil ve masaüstü), Claude’un çok uzun süren ve aniden durdurulması zor konuşmalara daha az eğilimli olacak olması. Tek bir konuşmadaki bellek iyileştirmesi yalnızca Opus 4.5 için değil, uygulamalardaki mevcut tüm Claude modelleri için de geçerli.
Oturumlarında ve haftalık kullanım bütçelerinde yer olmasına rağmen ani sonlar yaşayan kullanıcılar, zorlu bir bağlam penceresine (200.000 token) ulaşıyordu. Bazı büyük dil modeli uygulamaları, bir konuşma penceredeki maksimum değeri aştığında önceki mesajları bağlamdan kesmeye başlarken, Claude, kullanıcının giderek daha tutarsız bir konuşma deneyimi yaşamasına izin vermek yerine konuşmayı sonlandırdı. Bu durumda, model, konuşmaların ne kadar eski olduğuna bağlı olarak bazı şeyleri unutmaya başlayacaktı.
Claude artık, konuşmanın önceki bölümlerindeki önemli noktaları özetleyerek perde arkasında bir süreç izleyecek ve önemli olanları korurken gereksiz gördüklerini atmaya çalışacak.
Anthropic’in API’sini kullanan geliştiriciler, bağlam yönetimi ve bağlam sıkıştırma yoluyla aynı prensiplerden yararlanabilirler.
Opus 4.5 Performansı
Opus 4.5, %80 doğruluk puanını aşan ilk model oldu ve OpenAI’nin yakın zamanda yayınlanan GPT-5.1-Codex-Max (%77,9) ve Google’ın Gemini 3 Pro (%76,2) modellerini kıl payı geride bıraktı. Model, özellikle aracı kodlama ve aracı araç kullanım kıyaslamalarında iyi performans gösterse de, görsel akıl yürütme (MMMU) konusunda GPT-5.1’in gerisinde kalıyor.

Anthropic ayrıca, Opus 4.5’in önceki Claude modellerine veya GPT-5.1 ve Gemini 3 Pro gibi rakip modellere kıyasla ani enjeksiyon saldırılarına karşı çok daha az hassas olduğunu iddia ediyor. Yine de, bu modellerin hiçbiri bu açıdan mükemmel bir performansa sahip değil.
Kıyaslama testlerindeki performans iyileştirmeleri kayda değer olsa da, Opus 4.5’teki en anlamlı iyileştirme, tartışmasız token’lar konusunda önemli ölçüde daha verimli olması.
Diğer Güncellemeler
Opus 4.5 lansmanına, geliştiriciler ve kullanıcılar için diğer yeni özellikler de eşlik ediyor.
Örneğin, geliştirici platformu artık yeni bir “çaba” parametresi içeriyor ve bu da geliştiricilerin verimlilik ve token kullanımı arasında istedikleri dengeyi daha hassas bir şekilde ayarlamalarına olanak tanıyor.
Ayrıca, Claude Code artık masaüstü Claude uygulamalarında da mevcut. Daha önce komut satırı, IDE uzantıları ve web gibi birkaç platform üzerinden kullanılabiliyordu, ancak yerel masaüstü uygulamalarında kullanılamıyordu. Claude masaüstü arayüzü artık geleneksel sohbet deneyimi ve Claude Code deneyimi arasında geçiş yapabiliyor.
Derleyen: Damla Şayan


