Reddit’in Kalbinde: Subreddit’ler Arası Etkileşim ve Merkezilik Analizi

Reddit Hyperlinks Veri Seti, Stanford Üniversitesi tarafından sağlanmıştır ve Reddit platformunda farklı subreddit’ler arasındaki hiperlink ilişkilerini içerir. Amacı, Reddit üzerindeki topluluklar arasındaki etkileşimleri ve sosyal bağları incelemek için zengin bir veri kaynağı sağlamaktır.

Bu veri seti, subreddit’ler arasındaki hiperlinklerin yanı sıra, bu linklerin pozitif veya negatif olarak etiketlenmiş olup olmadığını, zaman damgalarını ve ilgili subreddit’leri içerir. Bu, sosyal medyada topluluklar arasındaki ilişkilerin ve etkileşimlerin analiz edilmesi için mükemmel bir kaynaktır.

Veri seti, genellikle kenar listesi formatında düzenlenmiştir. Her kayıt, bir kaynaktan bir hedefe olan bağlantıyı, bu bağlantının türünü (pozitif veya negatif) ve oluşturulduğu zamanı temsil eder. Bu, ağ analizi için ideal bir yapıdır.

Veri seti, sosyal medyada bilgi yayılımı, topluluk dinamikleri, etkileşim kalıpları ve topluluklar arasındaki ilişkilerin doğası gibi konularda derinlemesine analizler yapmak için kullanılabilir. Ayrıca, sosyal medya platformlarında nasıl alt-kültürler ve topluluklar oluştuğunu anlamak için de kullanışlıdır.

Veri Seti Alanları

SOURCE_SUBREDDIT
TARGET_SUBREDDIT
POST_ID
TIMESTAMP
LINK_SENTIMENT
PROPERTIES

571927 satır veri içermekte

Ağ Yapısını Görsel Olarak Oluşturma

Veri setini Gephi’ye yükledikten sonra LINK_SENTIMENT ve PROPERTIES alanları kaldırıldı. Daha sonra graph sekmesine geçilerek görsel olarak görüntülenmesi sağlandı.

Renklendirme

Gephi’de renklendirme işlemi gerçekleştirildi. Ancak veri boyutu büyük olduğundan görsel olarak renkli görmek mümkün olmadı =)

Her Düğüm İçin Merkezilik Hesaplaması

Hesaplama Sonucunun Yorumlanması

Düğümlerin derecelikleri sıralandığında en yüksek dereceye sahip 10 düğümün sırasıyla;

1.Askreddit
2.Iama
3.Bestof
4.Subredditdrama
5.Funny
6.Pics
7.Titlegore
8.Todayilearned
9.Videos
10.Gaming

Olduğu görünüyor. Yüksek derece merkeziliğe sahip subreddit’ler, bilgi veya içerik yayılımında önemli roller oynayabilirler ve genellikle topluluk içinde merkezi ve tanınmış konumda bulunurlar.

Derece Merkeziliği

Grafikler Gephi’de aşağıdaki gibi oluştu.

Mevcut veri seti sisteme yönsüz olarak kaydedilip Modularity Rapor çekilmiştir.

Modülerlik değeri, ağın ne kadar iyi topluluklara (veya modüllere) ayrıldığını gösterir. Değer 1’e ne kadar yakınsa, o kadar iyi tanımlanmış topluluklar vardır.

Rapor, 0.476 modülerlik değeri göstermektedir. Bu, ağın belirgin topluluk yapılarına sahip olduğunu gösterir ancak bu yapılar mükemmel olarak ayrılmış değildir. Yine de, bu değer ağın makul derecede modüler olduğunu ve belirgin toplulukların var olduğunu gösterir.

Rapor, ağda 826 farklı topluluğun tespit edildiğini belirtmektedir. Bu, ağın çok sayıda farklı alt-grup veya topluluğa sahip olduğunu gösterir.

Grafiğe bakarak, birkaç topluluğun oldukça büyük olduğunu (düğüm sayısı açısından), ancak çoğu topluluğun daha küçük olduğunu söyleyebiliriz. En büyük toplulukların düğüm sayıları 8 ile 2 arasında değişirken, birçok topluluğun sadece birkaç düğüm içerdiği görülüyor.

Topluluk boyutlarının geniş bir dağılıma sahip olması, ağın karmaşık yapısını ve subreddit’lerin geniş bir etkileşim yelpazesine sahip olduğunu gösterir.

Ağdaki büyük topluluklar, belki de ortak ilgi alanlarına veya sık etkileşimlere sahip kullanıcı gruplarını temsil ederken, küçük topluluklar daha niş veya özelleşmiş grupları temsil edebilir.

Mevcut veri seti sisteme yönsüz olarak kaydedilip Clustering Coefficent Metric Report çekilmiştir.

Rapor, ortalama kümelenme katsayısının 0.385 olduğunu gösteriyor. Bu değer, düğümlerin komşuları arasında ne kadar çok üçgen ilişki (kapalı üçlü) olduğunun bir göstergesidir. 0 ile 1 arasında bir değer alan kümelenme katsayısı, 0’a yaklaştıkça komşu düğümler arasında daha az, 1’e yaklaştıkça ise daha fazla kapalı üçlü olduğunu gösterir. 0.385 değeri, ortalamanın üzerinde bir kümelenme seviyesine işaret eder ve ağın belli bölgelerinde düğümlerin birbirleriyle sıkı bir şekilde bağlı olduğunu gösterir.

Rapor, ağda 132,978 toplam üçgen bulunduğunu belirtiyor. Bu, ağın genelinde birçok kapalı üçlü olduğunu ve dolayısıyla birçok düğümün birbirleriyle yoğun bir şekilde bağlantılı olduğunu gösterir.

Dağılım grafiği, çoğu düğümün düşük kümelenme katsayısına sahip olduğunu gösteriyor, ancak bazı düğümler yüksek kümelenme katsayısına sahiptir. Bu, ağın bazı kısımlarında düğümlerin birbirleriyle yoğun bir şekilde etkileşime girdiği, ancak ağın çoğunun daha az bağlantılı olduğu anlamına gelebilir.

Yoğunluk (density)

Yoğunluğun 0 çıkması ağın çok seyrek bir yapıda olduğunu gösterebilir.

Ortalama uzaklık (mean distance) & En uzun mesafe (diameter)

Bu grafik, düğümlerin arasındalık merkeziliklerinin dağılımını gösterir. Değerlerin büyük çoğunluğu düşük, bu da çoğu düğümün ağdaki yol üzerinde kritik bir konumda olmadığını gösterir.

Yakınlık merkeziliğinin dağılımı, çoğu düğümün düşük yakınlık merkeziliğine sahip olduğunu gösterir, yani düğümlerin ağın geri kalanına ortalama olarak uzak olduğunu gösterir.

Eksantriklik dağılımı, düğümlerin ağın en uzak noktalarına olan mesafesini gösterir. Düğümlerin çoğunun düşük eksantrikliğe sahip olduğunu görebiliriz, yani çoğu düğüm ağın merkezine nispeten yakın. Ancak, ağın çapı 26 olduğundan, bazı düğümlerin ağın uç noktalarına oldukça uzak olduğunu da gösterir.

Harmonik yakınlık merkeziliği, ulaşılamayan düğümleri hesaba katarak yakınlık merkeziliği ölçer. Bu dağılım, çoğu düğümün düşük harmonik merkeziliğe sahip olduğunu gösterir, bu da düğümlerin genel olarak birbirlerine ulaşılabilir olmadığını belirtir.

Geçişlilik (transitivity)

Gözlemlediğimiz gibi, yönsüz ağ için kümelenme katsayısı daha yüksektir, bu da yönlü ağa göre düğümlerin birbirleriyle daha yoğun bir şekilde etkileşim içinde olduğunu ve daha sıkı kümelenmiş topluluklar oluşturduğunu gösterir. Bu, genellikle yönsüz ağlarda düğümler arasında çift yönlü etkileşimlerin daha yaygın olmasıyla ilişkilidir.

Sonuçların Yorumlanması

Tüm nodelar için bu büyüklükteki veriyi yapamayacağımdan, en yüksek derecelere sahip 10’ar veri üzerinden yorumlama yapacağım.

askreddit: En yüksek ‘In-Degree’ ve ‘Degree’ değerlerine sahip. Bu, askreddit’in diğer subredditlerden en fazla referans alan ve ağın en merkezi noktalarından biri olduğunu gösterir. Ayrıca, ‘Clustering Coefficient’ ve ‘Number of Triangles’ değerleri de oldukça yüksek, bu da kullanıcıların yoğun etkileşim içinde olduğu ve sıkı bir topluluk oluşturduğu anlamına gelir.

iama: ‘In-Degree’ değeri yüksek fakat ‘Out-Degree’ değeri düşük. Bu, iama’nın daha çok alıcı konumunda olduğu ve diğer subreddit’lere göre daha az yönlendirmede bulunduğunu gösterir.

Pics ve funny: İkisi de yüksek ‘In-Degree’ ve ‘Out-Degree’ değerlerine sahip. Bu, sadece popüler olduklarını değil, aynı zamanda aktif olarak içerik paylaştıklarını ve büyük etkileşimlere sahip olduklarını gösterir.

todayilearned ve videos: İki subreddit de yüksek ‘In-Degree’ ve ‘Out-Degree’ değerleriyle aktif etkileşim gösteriyorlar.

worldnews ve gaming: ‘Out-Degree’ değerleri ‘In-Degree’ değerlerinden daha yüksek. Bu, dünya haberleri ve oyunlarla ilgili içeriklerin diğer subreddit’lere yoğun bir şekilde dağıtıldığını gösteriyor.

gifs ve news: İki subreddit de yüksek ‘Clustering Coefficient’ ve ‘Number of Triangles’ değerlerine sahip, bu da her ikisinin de sıkı kümelenmiş topluluklar oluşturduğunu gösterir.

Karşılaştırma

askreddit, ağın en etkili ve en merkezi subreddit’i olarak öne çıkıyor ve büyük olasılıkla en yüksek kullanıcı etkileşimine sahip.

iama, özel etkinlikler ve “soru-cevap” oturumları nedeniyle yüksek ‘In-Degree’ değerine sahipken, diğer içeriklere daha az bağlantı veriyor olabilir.

Eğlence odaklı subreddit’ler olan pics, funny, ve gifs, yüksek ‘In-Degree’ ve ‘Out-Degree’ değerleriyle kullanıcıların sıkça içerik paylaştığı ve etkileşimde bulunduğu popüler alanlar.

todayilearned, öğretici içeriğiyle yüksek etkileşim ve paylaşım gösteriyor.

worldnews ve gaming, dışa dönük etkileşimleriyle dikkat çekiyor; diğer subreddit’lere yoğun içerik yönlendiriyorlar.

news, sıkı bir topluluk yapısı ve yüksek etkileşim gösteren bir haber kaynağı olarak karşımıza çıkıyor.