Spam İçerikler, Yapay Zeka Sonrasında Tarih Olabilir
Bilim insanları, Arxiv.org'da yayınlanan bir makalede yapay zeka ve makine öğrenimi kullanılarak spam içeriklere müdahale edebilecek yeni bir sistem geliştirildiğini açıkladılar.
Günümüzde ürün ile servis incelemelerinin ve yorumlarının satışları etkilediği herkesçe bilinen bir gerçek. Tüketicilerin yaklaşık %71'i, diğer kişilerin izlenimlerini okuduktan sonra bir ürünü satın almanın daha ??iyi sonuç verdiğini söylerken %88'i de incelemelerin satın alma kararlarını etkilediğini söylüyor. Bu nedenle kötü niyetli üçüncü taraflarca yazılmış spam ve yanıltıcı incelemeleri azaltmak için ciddi çalışmalar yürütülüyor. Hartman Group ve Washington Üniversitesi'ndeki bilim insanları, bu zorlu alanda büyük bir ilerleme kaydetti.
Arxiv.org'da yayınlanan bir makalede araştırmacılar, "spamGAN"ı (Yarı Denetimli Görüş Spam Tespiti için GAN) açıkladılar. GAN, makine öğrenimi sisteminde üretken ters ağlar sınıfına verilen isimdir.
Makalenin yazarları, "İstenmeyen incelemeler ve yorumlar; e-ticaret sitelerinde, sosyal medyada, seyahat sitelerinde ve film inceleme sitelerinde yaygın bir sorun. Spam incelemelerini bir sınıflandırma problemi olarak tanımlamanın ve bir inceleme verildiğinde 'spam' veya 'spam olmayan' şeklinde sınıflandırılmanın gerektiğini düşünüyoruz" açıklamasında bulundular.
Bu yöntemde, etiketlenmemiş içerikler az miktarda etiketlenmiş içeriklerle birlikte kullanılır. Bu sayede, makine öğrenmesinde iyileştirme sağlanır ve bu tekniğe 'denetimli öğrenme' ismi verilmiştir.
Makalenin yazarları, "Spam incelemeler hakkındaki mevcut araştırmaların çoğu (derin öğrenme yöntemleri dışında), spam davranışını sınıflandırmak ve tanımlamak için deneyimsel yaklaşımları kullanmaktadır. Ancak GAN tabanlı yaklaşımımızda özellikler sinir ağı tarafından öğreniliyor. Aynı zamanda SpamGAN'ın, kesin gerçekliği olmayan durumlarda yapay veri üretimi için kullanılabilecek spam ve spam olmayan içerikler de oluşturabileceğine inanıyoruz" açıklamasında bulundular.
Ayrıca spamGAN, gelecekteki çalışmalarda ve deneylerde kullanılmak üzere veri setleri ve daha sofistike bir sınıflandırıcı sağlayacaktır.