TRG Blog Yazısı

Teknoloji Rejenerasyon Girişimi

Teknoloji Araştırma Geliştirme Yazılım Mühendislik Danışmanlık ve Ticaret Limited Şirketi

Ontoloji Mühendisliği

Ekonomik küreselleşme ve İnternet sayesinde giderek daha fazla birbirine bağlı ve karmaşık olan bir dijital gerçeklikte yaşıyoruz. Dijitalleşmeyi daha iyi anlamamıza yardımcı olabilecek semantik teknoloji çözümlerine ihtiyaç vardır.

Ontoloji Mühendisliği

Ekonomik küreselleşme ve İnternet sayesinde giderek daha fazla birbirine bağlı ve karmaşık olan bir dijital gerçeklikte yaşıyoruz. Dijitalleşmeyi daha iyi anlamamıza yardımcı olabilecek semantik teknoloji çözümlerine ihtiyaç vardır.

Ontolojiler, veri ağı ve semantik   uygulamalarının geliştirilmesinde önemli bir bileşendir. Bir ontoloji gözlemlenen gerçekliğin kavramsal bir modelidir. Özünde, belirli bir uygulama alanına ait olan birbirine bağlı kavramların bir deposudur. Geleneksel olarak, bir ontolojinin inşası (ve gerçeğe uygun olması için gerekli olan sürekli evrimi) uzun ve maliyetlidir.

Yüksek kaliteli bir ontoloji sağlam, sistematik bir mühendislik yaklaşımı gerektirir. Bununla birlikte, tam ölçekli bir ontoloji projesine başlamadan önce, semantik teknolojilerin bir işletmede uygulanabilirliğini test ederek deneysel uygulamalarla pilot projeleri takip etmek yararlı olacaktır.

Bu açıdan bakıldığında, mevcut ontoloji mühendisliği metodolojileri çoğu zaman uygun değildir, aşırı karmaşıktır ve zaman, maliyet ve yetenekli insan kaynakları açısından zordur.

Bir ontoloji kurma projesinin sorumluluğu, etki alanı uzmanlarıyla çalışan ontoloji mühendisleri ekibine verilir. Bununla birlikte, birkaç nedenden dolayı ontolojilerin ve daha genel olarak semantik teknolojiler kullanılması ile ilgili ciddi kısıtlamalar içerir.

Birincisi, genel olarak iş piyasasında pek bulunmayan özel teknik yeterliliğe sahip ontoloji mühendislerinin yetersizliğidir. İkincisi, ontoloji mühendisleri, ne kadar deneyimli olursa olsun, uygulama alanının ilgili tüm yönlerini karşılayamaz ve bir ontoloji ilk piyasaya sürüldüğünde, alan odaklı düzeltmelere, entegrasyonlara ve uzantılara her zaman ihtiyaç duyulur.

Ontoloji gerçekliğin bir tür “kavramsal imgesi” olduğundan, zaman içinde “mükemmel” bir ontoloji bile sürekli güncellenmeli ve alan uzmanlarının önerileri ile değişimlere yeniden uyarlanmalıdır.

Ontoloji mühendisliğinden temel adımlar aşağıdaki gibidir.

  •  Etki alanı terminolojisi. Gözlenen etki alanını karakterize eden, etki alanı terimlerini listeleyen tanımlamalar,
  •  Etki alanı sözlüğü. Olası eş anlamlıları da gösteren, yazılı bir tanımla ilişkilendirilen sözlük terimleri,
  •  Taksonomi. Alan uzmanlığı hiyerarşisinde düzenlenen alan terimleri,
  •  İsnat. Tanımlanan ve karakterize ettikleri varlıklara bağlı sözlükteki özellikleri temsil eden terimler,
  •  Parça ile bütün arasındaki anlam ilgisi. Bileşenlerine bağlı karmaşık varlık isimleri, sözlükte bulunması gereken tüm isimler,
  •  Ontoloji. Bu son adım, önceki adımlarda toplanan kavramsal bilgiyi içeren Web Ontoloji Dili veya OWL kullanarak, kodlanmış ontolojiyi üretir.

Terminolojik Seviye

İlk adım, alana özgü bir terminoloji veya eldeki alanı karakterize eden terimler listesini oluşturmayı içerir. Bu adımın sonucu, bir etki alanı sözlüğü (domain lexicon) veya “bu alanda iş yaparken tipik olarak kullanılan karakterizasyondaki kelimeler, isimler, fiiller ve sıfatlar nelerdir? " gibi sorulara cevap vermek için kullanılan bilgi yapısıdır.

Bu, alan bilgisini belirlemeye ve gözlemlenen alanın sınırlarını çizmeye başlamak için bir ön adımdır. Bu seviyedeki terminoloji ayrı girişler olarak eşanlamlılar dahil, basit, düz, ayırt edilemeyen (örneğin isimler ve fiiller) bir terimler listesidir.

Bir sözlüğü oluştururken, kullanıcıların sıfırdan başlaması gerekmez. İnternet, iş sektörüyle ilgili bilgi kaynaklarını (metin belgeleri, dizinler, sözlükler, taksonomiler, standartlar ve ontolojiler gibi) bulmayı mümkün kılar. Standartlar varsa, bunlardan yararlanılabilir. Diğer bir yöntem, terminolojinin referans metinsel belgelerden çıkarılmasıdır (kılavuzlar, ders kitapları ve resmi makaleler gibi).

Zorluklar: Asıl zorluk, bir terimin uygun olup olmadığına karar vermektir ve bu nedenle sözlüğe sadece uygun terminolojiyi dahil etmek için hedef uygulama alanının sınırlarını tanımlamaktır. Bu sınırı belirlemek kolay değildir, çünkü doğada etki alanı sınırı yoktur ve hepsi birbirine bağlıdır.

İlgili kapsamı tanımlamanın iki ana stratejisi vardır: etki alanı ontolojisini “yabancı” terimlerle zenginleştirmek veya “yabancı” bir ontoloji varsa, ona uygun bağlantılar oluşturmak. Bir diğer önemli zorluk, referans olarak kullanılacak ilk kaynakları içerir. Tüm olası uygulama alanları için çok fazla terminolojik kaynak olabilir. Sorun, kullanıcıların en çok temsili gördüklerini nasıl seçmeleri gerektiğidir.

Sosyal doğrulama, bir diğer önemli zorluktur. Kullanıcılar çevrimiçi olarak belirli bir sözlüğü yayınlama konusunda hiçbir sorun yaşamasa da karşılaştıkları zorluk seçtikleri yöntemle ilgilidir. Daha zengin bir sosyal katılım yöntemi, yeni terimler ve daha karmaşık oylama yöntemleri önerme seçeneğini içerebilir.

Sözlük Seviyesi

Terminoloji oluşturduktan sonra, kullanıcılar bu adımda, her bir terimle ilgili yazılı bir açıklama ilişkilendirerek terminolojiyi zenginleştirebilirler. Aslında, düzenlemeler ve yasalar tarafından tanımlanmış olsa bile, iyi tanımlanmış ve yaygın olarak kabul edilen bir anlama sahip terimler vardır. Ancak farklı iş durumlarında farklı bir anlama sahip olabilecek yaygın olarak kullanılan terimler de vardır. Örneğin, “gecikmeli ödeme” nedir? ve bir ödemeyi "gecikmeli" olarak sınıflandırmak için kaç gün geçmesi gerekir?

Açıklamaların yanı sıra, kullanıcılar bu adımda fazladan anlambilim parçaları eklemeye başlayabilir. Bu amaçla, kavramları üç ana kategoride gruplayan bir ontoloji yapılandırma yöntemi- nesne, süreç ve aktör- kullanılır.

Aktör kategorisi, bir işlemi aktif hale getirebilen, gerçekleştirebilen veya izleyebilen bir iş alanının aktif varlıklarını toplar. Nesne kategorisi, bir işlemin üzerinde çalıştığı pasif varlıkları toplar. Süreç kategorisi, bir iş hedefine ulaşılmasına yardımcı olmayı amaçlayan faaliyetler ve operasyonları toplar.

Zorluklar: Kullanıcılar, bir muhasebe departmanının bir stok yönetimi departmanından farklı olarak “envanteri” tarif ettiği gibi, farklı bakış açılarıyla kurumdaki farklı rollerle ilgili çelişkili açıklamalar bulabilirler. Birden fazla açıklama olması durumunda, kullanıcılar bir sentez oluşturabilir veya ontolojinin amacına ve kapsamına göre birbiri üzerine ayrıcalık yaratabilir. Bu karar genellikle ontoloji uzmanına veya “toplum öngörüsüne” bırakılır. Bu nedenle, sözlük ilk önce birden fazla açıklamaya sahip terimlerle yayınlanır ve benzersiz bir terim tanımına yakınlaşmak için sosyal doğrulama aşamasına bırakılır. Diğer bir zorluk, “tercih edilen terimin” ne olduğuna karar vermeyi gerektiren eş anlamlılarla ilgilidir. Bu durumda oylama, sonucu elde etmek için iyi bir yoldur.

Bu karar genellikle ontoloji uzmanına veya “toplum öngörüsüne” bırakılır. Bu nedenle, sözlük ilk önce birden fazla açıklamaya sahip terimlerle yayınlanır ve benzersiz bir terim tanımına yakınlaşmak için sosyal doğrulama aşamasına bırakılır. Diğer bir zorluk, “tercih edilen terimin” ne olduğuna karar vermeyi gerektiren eş anlamlılarla ilgilidir. Bu durumda oylama, sonucu elde etmek için iyi bir yoldur.

Taksonomi Seviyesi

Alfabetik sıraya göre düzenlenmiş ilk iki bilgi seviyesi terminolojik bir niteliği yansıtır. Ancak listelenen terimlerle belirtilen kavramlar, kullanıcıların üç farklı hiyerarşi yoluyla temsil etmeyi amaçlayan zengin bir kavramsal organizasyonu gizler.

Birincisi, uzmanlık ilişkisine veya daha spesifik bir kavramı daha genel bir ilişkiye bağlayan genelleme/özelleştirme ilişkisine dayanan bir taksonomidir. Bir taksonomi bir ontolojinin bel kemiğini temsil eder ve inşası zor olabilir. Kullanıcılar, yalnızca mevcut terimler arasındaki genelleme/özelleştirme ilişkilerini tanımlamakla kalmayıp, aynı zamanda günlük yaşamda nadiren kullanılan daha soyut terimleri veya genel kavramları, iyi bir etki alanı uzmanlığı ve tutarlı bir bilgi modelleme çalışması ile tanımlanır.

Böylece, bu adım sırasında kullanıcılar, önceki bilgi seviyelerine (terminoloji ve sözlük) geri bildirimde bulunur. Çünkü taksonomi yapısı aynı zamanda önceki iki seviyeyi doğrulamak ve yeni terimlerle genişletmek için bir fırsattır.

Zorluklar: İyi bir taksonomi tanımlamak zordur. Aynı zamanda kavram isimleri listesi veya terimlerin bir taksonomide düzenlenmesidir. Farklı bakış açıları ve görüşler dikkate alındığına özen gösterilmelidir. Temel mekanizma, onları daha genel bir konsepte (aşağıdan yukarıya yaklaşım) bağlayan kavramların veya terimlerin kümelenmesinden oluşur.

Genel bir kavramı tanımlamak çoğu zaman kolay değildir ve kavramlar farklı şekillerde kümelenebilir. Basitleştirilmiş yaklaşımımızda, bir konsept için çoklu genellemelerden kaçınırız. Dahası, kullanıcılar taksonominin genişliği veya uzmanlık seviyeleri ile taksonomi ayrıntı dereceleri arasında iyi bir denge bulmalıdır.

İsnat Seviyesi

Bu adım, eldeki alanda ilgili varlıkları karakterize eden özelliklere odaklandığından, bir veri tabanı tasarım aktivitesine benzer. Kullanıcılar genel olarak atomik özellikleri ve karmaşık özellikleri belirler. İlki, veri alanları (birim fiyat gibi) olarak görülebilir ve ikincisi, bir iç yapı sergiler ve bileşenleri (örneğin, cadde, şehir, posta kodu ve eyaletten oluşan adres gibi) içerir. Son olarak, bir mülk diğer varlıklara atıfta bulunuyorsa (faturada belirtilen müşteri gibi) referans mülkiyeti olarak adlandırılır. İlişkisel bir veri tabanında bir referans mülkiyeti bir dış anahtarla temsil edilir. Sonuç olarak ortaya çıkan yordamın hiyerarşisi en üst varlık ile düzenlenir, ardından düğümlerin etiketlendiği bir özellik hiyerarşisi bulunur.

Zorluklar: Bu aşamada, özellikleri temsil etmedeki ayrıntı derecesinden başlayarak çeşitli kararlar alınmalıdır. Örneğin, bir adres karmaşık bir özellik olabilir veya tüm adresin bir dize olarak kodlandığı bir atomik özellikleri olabilir. Diğer önemli noktalar, atomik özelliklerin yazılması (string, integer ve Boolean gibi) veya bir özelliğin kaç değer alabileceğini belirleyen kriterler gibi.

Parça ile Bütün Arasındaki Anlam Seviyesi

Bu adım, ayrıştırma hiyerarşisini ortaya koyarak nesnelerin, süreçlerin veya aktörlerin parçalarına odaklanır. Bu amaçla, kullanıcı parça ile bütün ilişkisine dayanarak hiyerarşi yaratır ve sergilediği yapı ve bileşenleri analiz eder.

Bu hiyerarşi, mühendislik ve imalatta ve daha genel olarak karmaşık varlıklarla uğraşırken özellikle önemlidir. Örneğin, bir malzeme listesi bir ürünün parçalarına, alt parçalarına ve benzerlerine hiyerarşik bir ayrışmasıdır, ayrıştırma ağacının dallarını temsil eden, daha fazla ayrışamayan veya daha kesin olarak yönlendirilmiş bir grafiğe sahip olan genellikle çevrimsiz (zincir biçiminde olan) olur.

Anlam seviyesi, aynı zamanda maddi olmayan varlıklara da uygulanabilir (örneğin, maddelere bölünmüş bir düzenleme veya alt faaliyetlere bölünmüş bir süreç gibi). Alt süreçlerde ve aktivitelerde, kullanıcılar modeli (“öncelik” ve “senkronizasyon” gibi) zenginleştirebilirler.

Zorluklar: Bazı durumlarda, kullanıcılar hiyerarşik bir ilişkinin genelleme/özelleştirme veya parçası olup olmadığına karar vermekte zorlanabilir. Fiyatı ve birim fiyatı göz önüne alırsak, birim fiyatın özel bir durumu olup olmadığı açık değildir. Böyle bir ilişki, iş ve organizasyon seçeneklerine büyük ölçüde bağlıdır. Kullanıcılar için bir başka sorun da mülkten ayırt etmektir. Örneğin, bir faturada vergiyi ve nihai fiyatı raporlayabilecek bir altbilgi vardır. Yapısal açıdan (bir fatura basarken olduğu gibi), altbilgi faturanın bir bileşeni olarak kabul edilir, ancak bilgi açısından bakıldığında, yapılandırılmış bilgiyi tutan karmaşık özellik olarak kabul edilebilir. Genel olarak, kullanım bağlamı ilişkiyi belirler ve nihayetinde sosyal doğrulama, yorumlama için ontoloji uzmanı merkezi bir rol üstlenir.

Ontoloji Seviyesi

Önceki basamakların sonuçlarını kullanarak, ontoloji mühendisleri ontoloji inşa etmeye başlarlar. Bu adımlarda toplanan tüm bilgileri, özellikle kavramları ve ortaya çıkan anlamsal ilişkileri bir araya getirir. Ek olarak, kısıtlamaları (yazım ve doğruluk kısıtlamaları gibi) ve ihtiyaç duyulan alana özgü ilişkileri (teminatlar, tedarikçi, ürün vb.) eklemek mümkündür.

Tam teşekküllü bir ontolojinin uygulanmasındaki son adım Kaynak Tanımlama Çerçevesi (RDF) ve OWL gibi resmi bir dilde kodlanmasıdır. Bu, ontoloji mühendislerinin doğrudan müdahalesini gerektiren teknik bir iştir. Bununla birlikte, bazı teknik yenilikler, son kullanıcı katılımını daha da artırmasını kolaylaştırmayı amaçlamaktadır.

Gelişmiş ontolojinin önemli bir yönü, önceden tanımlanmış bazı kriterlere göre değerlendirilen kalitesidir.

Zorluklar: İlk zorluk, ontoloji mühendislerinin ontolojinin nasıl olmasını istediklerinin seçimi ile ilgilidir. Asgari bir seçenek, taksonomiyi ve referans özelliklerini, alana özgü ilişkiler biçiminde dahil etmektir. Ayrıca bir dizi kısıtlama ekleyebilir (örneğin yazma ve kardinalite kısıtlamaları). İkinci zorluk, ontolojiyi biçimsel olarak kodlamakla ilgilidir. Burada, ontoloji mühendisinin rolü, bu adımın gerektirdiği yüksek uzmanlık seviyesinden dolayı merkezidir.

Turgut Haspolat

20 Yıl BİT Sektör Deneyimi | 10 Yıl Uluslararası şirketlerde dijitalleşme, dijital teknolojiler mimari deneyimi | Semantik Teknolojiler, Ontoloji Mühendisliği AR-GE Deneyimi | Veri Merkezleri İş Sürekliliği Uygulamalı Deneyimi | Uluslararası seviyede “Dijital İnovasyon” alanında “Düşünce Lideri” ünvanı | Kurumsal Bilgi Yönetimi konusunda akademik çalışma

Yazar Hakkında
Blog Yazısını Paylaşın
YORUM GÖNDERİN
Blog Yazılar (22)
MESAJ GÖNDERİN

Merak ettiğiniz tüm konularda bize yazabilirsiniz! Size nasıl yardım edebiliriz?

veya iletişim sayfasına gidin
HATA! Tüm alanları doğru formatta girdiğinizden emin olun.
Gönderiniz iletildi. Teşekkür ederiz!