Search engine for discovering works of Art, research articles, and books related to Art and Culture
ShareThis
Javascript must be enabled to continue!

Metin Benzerliği Algoritmaları ile Veri Tekilleştirme: Oteller Veri Tabanında Bir Uygulama

View through CrossRef
Hızla ve kontrolsüzce artan veri dünyasında, veri tekilleştirme büyük bir ihtiyaçtır. Veri tekilleştirme, veri tabanında yinelenen verilerin kopyalarını ortadan kaldırmak ya da onları tespit ederek, eşsiz kimlik numarası ile betimlemek için kullanılan bir tekniktir. Oteller veri tabanında; ismi, adresi, acente bilgisi, ve fiyat bilgisi bulunan bir otelin, kayıtlarda farklı isim ve kimlik numaları ile bulunması, karşılaştırma olanağı sunmamaktadır. Rakip analizinin tam anlamıyla yapılabilmesi, rakip fiyat durumlarının bilinmesi ve pazar takibi bütün bu otel isimlerinin tekilleştirilmesi ile mümkündür. Bu çalışmanın amacı, otel isimlerini eşleştirerek, eş olan otelleri tek bir kimlik numarası ile tanımlamak ve tekil veriyi elde etmektir. Veri tekilleştirme için çeşitli metin benzerliği algoritmaları kullanılır. Bu çalışmada, Metin Benzerliği algoritmaları otel isimleri üzerinden karşılaştırılmıştır. Mesafe düzenleme bazlı benzerlik, belirteç bazlı benzerlik, diziliş tabanlı benzerlik algoritmaları ile bulanık dize eşleme algoritmaları incelenmiştir. Çalışmanın sonucunda Bulanık dize eşleme algoritmasının ve Jaro Winkler mesafesinin birlikte kullanıldığı hibrit bir model önerilmiştir.
Title: Metin Benzerliği Algoritmaları ile Veri Tekilleştirme: Oteller Veri Tabanında Bir Uygulama
Description:
Hızla ve kontrolsüzce artan veri dünyasında, veri tekilleştirme büyük bir ihtiyaçtır.
Veri tekilleştirme, veri tabanında yinelenen verilerin kopyalarını ortadan kaldırmak ya da onları tespit ederek, eşsiz kimlik numarası ile betimlemek için kullanılan bir tekniktir.
Oteller veri tabanında; ismi, adresi, acente bilgisi, ve fiyat bilgisi bulunan bir otelin, kayıtlarda farklı isim ve kimlik numaları ile bulunması, karşılaştırma olanağı sunmamaktadır.
Rakip analizinin tam anlamıyla yapılabilmesi, rakip fiyat durumlarının bilinmesi ve pazar takibi bütün bu otel isimlerinin tekilleştirilmesi ile mümkündür.
Bu çalışmanın amacı, otel isimlerini eşleştirerek, eş olan otelleri tek bir kimlik numarası ile tanımlamak ve tekil veriyi elde etmektir.
Veri tekilleştirme için çeşitli metin benzerliği algoritmaları kullanılır.
Bu çalışmada, Metin Benzerliği algoritmaları otel isimleri üzerinden karşılaştırılmıştır.
Mesafe düzenleme bazlı benzerlik, belirteç bazlı benzerlik, diziliş tabanlı benzerlik algoritmaları ile bulanık dize eşleme algoritmaları incelenmiştir.
Çalışmanın sonucunda Bulanık dize eşleme algoritmasının ve Jaro Winkler mesafesinin birlikte kullanıldığı hibrit bir model önerilmiştir.

Related Results

A risky journey for Break-Induced Replication
A risky journey for Break-Induced Replication
Break Induced Replication (BIR) is one of the homologous recombination pathways to repair DNA double strand breaks. BIR plays important roles in main- taining genomic integrity. Fo...
YAZINSAL METİN BAĞLAMINDA KÜFE “METİN DİLBİLİMSEL BİR İNCELEME”
YAZINSAL METİN BAĞLAMINDA KÜFE “METİN DİLBİLİMSEL BİR İNCELEME”
Bir metnin doğru anlaşılabilmesi için anlatıcının kurgu düzleminde tutarlı ve sağlam bir yol izleyerek okuyucuya hem yüzey yapıda hem de derin yapıda bağlamdan kopmadan metin değer...
Mâtürîdîlerde İmanda Açıklık
Mâtürîdîlerde İmanda Açıklık
Bu araştırma Mâtürîdîlerin iman alanındaki temel görüş ve kabullerine dayanarak, bu anlayışın imanı örtülü, kapalı bir temelde ele almaya imkân verip vermediğini tartışmaktadır. İm...
Ayrılık da Sevdaya Dahil: Özgür Bırakın
Ayrılık da Sevdaya Dahil: Özgür Bırakın
Bu kitap, iki yazarın ortak belleğinden süzülen; edebiyat, psikoloji ve varoluş düşüncesinin kesişim noktasında duran editöryel bir yüzleşmedir. Biz bu kitabı yazarken bir “hikâye ...
Klasik Türk Edebiyatında Metin Şerhi, Metin Tahlili, Metin Tenkidi ve Uygulamalı Bir Örneği
Klasik Türk Edebiyatında Metin Şerhi, Metin Tahlili, Metin Tenkidi ve Uygulamalı Bir Örneği
Edebî metinlerin nasıl incelenmesi gerektiği konusu, öteden beri edebiyat araştırmacılarının üzerine en çok düşündükleri meselelerden biridir. Klasik Türk edebiyatı alanında metin ...
DENGESİZ PANEL VERİ İLE ATAMA YOLUYLA ELDE EDİLEN DENGELİ PANEL VERİ SONUÇLARININ KARŞILAŞTIRILMASI
DENGESİZ PANEL VERİ İLE ATAMA YOLUYLA ELDE EDİLEN DENGELİ PANEL VERİ SONUÇLARININ KARŞILAŞTIRILMASI
Veri setindeki gözlemlerde eksiklik olması durumu olarak ifade edilen eksik veri panel verilerde de sıklıkla ortaya çıkabilmektedir. Bu durum ise geniş bir veri seti ile çalışma av...
Dramatik Atasözü
Dramatik Atasözü
Göstergelerarası bir çözümleme yapabilmenin ön koşulu iki ayrı gösterge dizgesinin (örneğin bir metinle bir resmin) biçimsel olduğu kadar içeriksel bakımdan alışveriş içerisinde ol...
Bu Kaybın Adı Mı Kader?
Bu Kaybın Adı Mı Kader?
Bazı kitaplar okunmak için yazılmaz; insanın içinden geçmesi için yazılır. Bu Kaybın Adı mı Kader? tam olarak böyledir. Okurunu bilgilendirmeyi değil, onu sarsmayı; rahatlatmayı de...

Back to Top