Çevrim İçi Veri Tabanlarının Hızını Artırmak için Yeni Bir Yöntem Bulundu

Araştırmacılar, bazı durumlarda geleneksel hash fonksiyonları yerine öğrenilmiş modellerin kullanılmasının yarı yarıya daha fazla çakışmaya neden olabileceğini buldular. Öğrenilmiş modeller, bir veri kümesi üzerinde bir makine öğrenimi algoritması çalıştırılarak oluşturulan modellere deniyor. Deneyler ayrıca öğrenilmiş modellerin, genellikle mükemmel hash fonksiyonlarından hesaplama açısından daha verimli olduğunu ortaya koydu.

Hashing Nedir?

Hashing, veri tabanı indekslemeden veri sıkıştırmaya ve kriptografiye kadar pek çok uygulamada kullanılan bir işlem. Hızlı ve verimli hash fonksiyonları, kritik öneme sahip. Geleneksel hash fonksiyonları, kodları rastgele ürettiğinden bazen iki veri parçası aynı değerle hashlenebilir ve bu da çakışmalara neden olur. Bir öge arandığında kullanıcı aynı hash değerine sahip birçok veri parçasına ulaşır ve doğru olanı bulmak çok daha uzun sürer, bu da aramaların yavaşlamasına ve performansın düşmesine neden olur. Bu nedenle araştırmacılar, daha iyi hash fonksiyonları oluşturmak için makine öğrenimini kullanıp kullanamayacaklarını görmek için harekete geçtiler.

Konferansta Sunulacak

Bilgisayar Bilimi ve Yapay Zekâ Laboratuvarı (CSAIL) MIT Veri Sistemleri Grubunda doktora sonrası araştırmacı olan İbrahim Sabek, “Bu çalışmada bulduğumuz şey bazı durumlarda hash fonksiyonunun hesaplanması ile karşılaşacağımız çakışmalar arasında daha iyi bir denge kurabileceğimizdir. Hash fonksiyonu için hesaplama süresini biraz artırabiliriz ancak aynı zamanda belirli durumlarda çarpışmaları çok önemli ölçüde azaltabiliriz.” açıklamasında bulundu.

Uluslararası Çok Büyük Veritabanları Konferansında sunulacak olan araştırma, büyük bir veri tabanındaki aramaları önemli ölçüde hızlandırmak için bir hash fonksiyonunun nasıl tasarlanabileceğini gösteriyor. Örneğin, geliştirdikleri teknik, bilim insanlarının DNA, amino asit dizileri veya diğer biyolojik bilgileri depolamak ve analiz etmek için kullandıkları hesaplama sistemlerini hızlandırabilir.

Araştırmacılar, öğrenilmiş modellerin oluşturulmasının mükemmel hash fonksiyonlarından daha kolay ve daha hızlı olduğunu buldular. Verilerin tahmin edilebilir bir şekilde dağıtılması durumunda ise geleneksel hash fonksiyonlarından daha az çakışmaya yol açtığını tespit ettiler. Ancak veriler, tahmin edilebilir bir şekilde dağıtılmamışsa veri noktaları arasındaki boşluklar, çok büyük farklılıklar gösterdiğinden öğrenilmiş modellerin kullanılması daha fazla çakışmaya neden olabiliyor.

Daha Az Çakışma, Daha Hızlı Sonuçlar

Veriler, tahmin edilebilir şekilde dağıtıldığında öğrenilen modeller, geleneksel hash fonksiyonlarına kıyasla bir veri kümesindeki çakışan anahtarların oranını %30’dan %15’e düşürebildi. Ayrıca mükemmel hash fonksiyonlarından daha iyi verim elde edebildiler. En iyi durumlarda öğrenilmiş modeller, çalışma süresini yaklaşık %30 oranında azalttı.

Araştırmacılar, hashing için öğrenilmiş modellerin kullanımını araştırırken en çok alt modellerin sayısının etkilendiğini de keşfettiler. Öğrenilen her model, veri dağılımına yaklaşan daha küçük doğrusal modellerden oluşuyor. Daha fazla alt modelle öğrenilen model, daha doğru bir yaklaşım üretiyor ancak daha fazla zaman alıyor.

Araştırmacılar, bu analizden yola çıkarak öğrenilmiş modelleri diğer veri türleri için hash fonksiyonları tasarlamak üzere kullanmak istiyorlar. Ayrıca verilerin eklenebildiği veya silinebildiği veri tabanları için öğrenilmiş hashlemeyi keşfetmeyi planlıyorlar. Veriler, bu şekilde güncellendiğinde modelin de buna uygun olarak değişmesi gerekiyor ancak doğruluğu koruyarak modeli değiştirmek zor bir süreç.

Sabek, “Topluluğu, makine öğrenimini daha temel veri yapıları ve işlemleri içinde kullanmaya teşvik etmek istiyoruz. Her türlü temel veri yapısı, bize veri özelliklerini yakalamak ve daha iyi performans elde etmek için makine öğrenimini kullanma fırsatı sunuyor. Hâlâ keşfedebileceğimiz çok şey var.” şeklinde konuştu.

Derleyen: Nazlı Koyuncu

En Son

Organ Naklinde İlaçsız Yaşam İçin İlk Büyük Umut

ABD’de Pittsburgh Üniversitesi tarafından yürütülen yeni bir klinik araştırma, bazı karaciğer nakli hastalarının deneysel bir hücresel tedavi sayesinde bağışıklık sistemini baskılayan (yani vücudun yeni organı reddetmesini engellemek için kullanılan) ilaçları kullanmadan yıllarca yaşamını sürdürebildiğini ortaya koydu. Bulgular, organ naklinde “ilaçsız dönem” ihtimalini ilk kez bu kadar güçlü şekilde gündeme taşıdı.

Project Hail Mary: NASA Bilimi Bilim Kurgunun Gerçek Sınırlarını Zorluyor mu?

*Project Hail Mary* ile yeniden gündeme gelen derin uzay yolculuğu ve NASA’nın gerçek bilimsel çalışmaları, bilim kurgu ile gerçeklik arasındaki sınırın aslında ne kadar ince olduğunu bir kez daha tartışmaya açıyor.

Avatar Video Oyunu O Kadar İyi ki Filmlere Gerek Kalmayabilir

Avatar evreni uzun süredir sinema ile özdeşleşmiş olsa da, yeni video oyunu deneyimi bu dünyayı izlemekten çıkarıp doğrudan yaşanabilir bir gerçekliğe dönüştürerek filmlerin rolünü bile sorgulatıyor.

Bu Ay İzleyebileceğiniz En İyi 10 Dizi

Dijital platformların içerik bombardımanına dönüştüğü günümüzde, gerçekten izlemeye değer dizileri seçmek her zamankinden daha zor hale gelirken, öne çıkan yapımlar izleyicilere güçlü ve unutulmaz deneyimler sunmayı başarıyor.

Bültene Kaydol

Üye Özel

Yapay Zekâ Damgası: Dünyanın Prestijli Girişim Gününde 16 Çarpıcı Startup

Y Combinator’ın Winter 2026 Demo Day etkinliğinde tanıtılan yaklaşık 190 girişim arasından öne çıkan 16 startup, yapay zekânın farklı sektörlerde nasıl dönüştürücü bir rol üstlendiğini gözler önüne serdi. Hukuktan sağlığa, güvenlikten enerjiye uzanan projeler dikkat çekti.

Kagi’nin İnsan Odaklı İnterneti: ‘Küçük Web’le Tanışın

Kagi’nin ‘Küçük Web’ girişimi, interneti sadece insanlar tarafından yazılmış içeriklerle keşfetmeye odaklanıyor. Kişisel bloglar, bağımsız videolar ve web çizgi romanları, mobil ve web uygulamaları üzerinden daha erişilebilir hâle geliyor.

Yapay Zekâyla Konuşmanın Doğru Yolu

Yapay zekâya “lütfen” demek işe yarıyor mu? Onu tehdit etmek mi, yoksa bir bilim kurgu dizisindeki karakter gibi konuşturmak mı daha etkili? Uzmanlara göre sohbet robotlarından daha iyi sonuç almanın yolu sandığınız kadar gizemli değil.

LGBTQ+ Sporcular 2026 Kış Olimpiyat Oyunlarında Ön Planda Olacak

Açık kimlikleriyle LGBTQ+ olan yaklaşık 50 Olimpiyat sporcusu, konuşma ve yarışma hakları saldırı altında olmasına rağmen Kış Olimpiyat Oyunları boyunca çeşitli etkinliklerde yer alıyor.

Kripto Parayla Finanse Edilen İnsan Ticareti Hızla Artıyor

Tahminlere göre, fuhuş ve dolandırıcılık amacıyla insan ticareti işlemlerinde kripto para birimlerinin kullanımı 2025 yılında neredeyse iki katına çıktı.

- dijitaliyidir Sponsor Desteği -

spot_imgspot_img

Organ Naklinde İlaçsız Yaşam İçin İlk Büyük Umut

ABD’de Pittsburgh Üniversitesi tarafından yürütülen yeni bir klinik araştırma, bazı karaciğer nakli hastalarının deneysel bir hücresel tedavi sayesinde bağışıklık sistemini baskılayan (yani vücudun yeni organı reddetmesini engellemek için kullanılan) ilaçları kullanmadan yıllarca yaşamını sürdürebildiğini ortaya koydu. Bulgular, organ naklinde “ilaçsız dönem” ihtimalini ilk kez bu kadar güçlü şekilde gündeme taşıdı.

Project Hail Mary: NASA Bilimi Bilim Kurgunun Gerçek Sınırlarını Zorluyor mu?

*Project Hail Mary* ile yeniden gündeme gelen derin uzay yolculuğu ve NASA’nın gerçek bilimsel çalışmaları, bilim kurgu ile gerçeklik arasındaki sınırın aslında ne kadar ince olduğunu bir kez daha tartışmaya açıyor.