Günümüzde Google ve Bing gibi arama motorları, içeriklerin konusunu ve kalitesini her zamankinden daha iyi kavramaktadır. Bu bakımdan, entity’lerin nasıl tanımlandığı, hangi türlere ait oldukları, niteliklerinin ve ilişkilerinin nasıl ifade edildiği, semantik SEO çalışmalarında giderek daha kritik hâle gelmektedir.
İçeriklerde entity’lerin ve birbirleriyle ilişkilerinin doğru, konuyla ilgili ve anlaşılması kolay bir şekilde tanımlanması semantik SEO’nun temel ilkelerinden biridir. Çünkü bu, hem kullanıcıların hem de arama motorlarının içeriklerinizi anlamasını kolaylaştırır.
Entity Nedir?
Entity (varlık), açıkça tanımlanabilen bir nesne veya kavramdır (örn. insanlar, şirketler, ürünler, etkinlikler, ülkeler/şehirler/vs…).
Bu her zaman basit ve net olmayabilir. Örneğin “Donnie Brasco” entity’sini inceleyelim. Burada “Donnie Brasco (1997)” filmindeki karakter mi, filmin kendisi mi, filmdeki karakteri canlandıran oyuncu mu, Joseph D. Pistone’un kendisi mi yoksa yazdığı kitabı mı kastediliyor?
Entity kimliği ele alınması zor bir konudur. Sorunun bir kısmı gerçek dünyayı tanımlamakla ilgilidir.
Bu tür konular semantik SEO’da entity kavramını anlamayı biraz zorlaştırabilir, ancak temel fikir, bir varlığın açıkça ayırt edilebilir bir nesne ya da kavram olduğu yönündedir.
Named Entity’ler ve Kavramlar
Entity’leri genellikle uygun bir isimle ifade edilen somut ögeler olarak düşünebiliriz. İki ana entity sınıfı vardır:
- Named entity’ler – uygun isimle tanımlanabilen ögelerdir. Örneğin, belirli kişiler, mekânlar, kurumlar, ürünler, etkinlikler vb.
- Kavramlar – soyut ögelerdir. Bunlar matematiksel ve felsefi (örn, “uzaklık”, “miktar”, “aura”…), fiziksel ve doğal olaylar (örn, “yerçekimi”, “kuvvet”, “rüzgâr”…), psikolojik (örn, “duygu”, “düşünce”…) ve sosyal (örn, “otorite”, “barış”…) gibi pek çok farklı alanda karşımıza çıkabilir.
Bu iki sınıf, felsefedeki somut ve soyut ögeler arasındaki ayrımdan pek de farklı değildir.
Entity’lerin Özellikleri
Bir entity hakkında sahip olduğumuz tüm bilgileri – örneğin benzersiz tanımlayıcı, isimler, türler, nitelikler (attribute’ler) ve ilişkiler – entity özellikleri olarak tanımlayabiliriz.
- Benzersiz Tanımlayıcı (Unique Identifier veya UID): Entity’lerin benzersiz bir şekilde tanımlanabilir olması gerekir. Her entity tanımlayıcısı ile temsil ettiği nesne arasında birebir bir ilişki olmalıdır. Örneğin, bir şirketteki kişilerin e-posta adresleri, Wikipedia sayfa ID’leri, benzersiz kaynak tanımlayıcıları (URI’ler)…
- İsim(ler): Entity’ler uygun adlarla anılır. Tanımlayıcıların aksine, isimler entity’leri benzersiz bir şekilde tanımlamaz (birden fazla entity aynı ismi paylaşabilir, örneğin, “John Smith”). Ayrıca, aynı entity birden fazla isimle bilinebilir (örneğin, “Meyer Lansky”, “Maier Suchowljansky”, “Mob’s Accountant”). İnsanlar çoğu zaman, entity imalarının belirsizliğini, söz konusu bağlamdan kolayca çözebilirler. Makinelerin ise entity imalarını otomatik olarak anlaması pek de basit değildir, fakat günümüzde Google ve Bing gibi arama motorları bu sorunu yapay zeka araçları ile kolayca çözebilir.
- Tür(ler): Entity’ler birden fazla entity türüne kategorize edilebilir. Türler ayrıca benzer özelliklere sahip varlıkları bir araya getiren semantik kategoriler olarak da düşünülebilir. Bu, nesne yönelimli programlamaya benzerdir. Olası entity türlerinin kümesi genellikle hiyerarşik bir yapıda, yani tür taksonomisinde düzenlenir. Örneğin, “Nikola Tesla” entity’si, “insan”ın bir alt türü olan “bilim insanı” türünün bir örneğidir.
- Nitelikler: Bir entity’nin özellikleri bir dizi nitelikle tanımlanır. Farklı entity türleri genellikle farklı nitelik kümeleriyle tanımlanır. Örneğin, bir kişinin nitelikleri doğum tarihi ve yeri, kilo, boy, ebeveynler, eş vb. içerir. Bir şehrin nitelikleri enlem, boylam, nüfus, posta kodu, ülke, kıta vb. içerir.
- İlişkiler: İlişkiler, iki entity’nin birbirleriyle nasıl ilişkilendirildiğini tanımlar. Dilbilimsel bir bakış açısından, entity’ler özel isimler ve aralarındaki ilişkiler de fiiller olarak düşünülebilir. Örneğin, “J. R. R. Tolkien Yüzüklerin Efendisi’ni yazdı” veya “Elektron J. J. Thomson tarafından keşfedildi”.
Entity’ler hakkında bilgi yarı yapılandırılmış veya yapılandırılmış biçimde temsil edilebilir.
Bilgi deposu (knowledge repository), entity türü bilgilerini ve isteğe bağlı olarak entity’lerin açıklamalarını veya özelliklerini yarı yapılandırılmış veya yapılandırılmış bir biçimde içeren bir entity kataloğudur. Wikipedia, bilgi deposunun klasik bir örneğidir. Wikipedia’daki her içerik, belirli bir entity’yi tanımlar. Bu içerikler ayrıca kategorilere (entity türleri) atanır ve diğer makalelerin linklerini içerebilir (böylece iki entity arasında bir ilişkinin olduğunu gösterir). Wikipedia makaleleri ayrıca entity’lerin nitelikleri ve ilişkileri hakkında bilgi içerir. Ancak tabii bu makaleler yapılandırılmış formatta değildir.
Entity’ler hakkında bilgileri yapılandırılmış bir biçimde düzenlemek ve saklamak için bir bilgi temsil modeline ihtiyaç vardır. Kaynak Tanımlama Çerçevesi (RDF), entity’leri (ve daha genel olarak kaynakları) tanımlamak için kullanılan yaygın standarttır. Bir entity, bir dizi RDF ifadesi olarak temsil edilebilir. Bu ifadeler, o entity hakkında gerçekler veya iddialar olarak görülebilir. Bir bilgi tabanı, entity’ler hakkında bilgileri depolamak ve düzenlemek için yapılandırılmış bir bilgi deposudur.
Tüm bilgi tabanları aynı zamanda bilgi depolarıdır; ancak bunun tersi doğru değildir.