Açıköğretim Ders Notları

İşletme Analitiği Dersi 2. Ünite Özet

Açıköğretim ders notları öğrenciler tarafından ders çalışma esnasında hazırlanmakta olup diğer ders çalışacak öğrenciler için paylaşılmaktadır. Sizlerde hazırladığınız ders notlarını paylaşmak istiyorsanız bizlere iletebilirsiniz.

Açıköğretim derslerinden İşletme Analitiği Dersi 2. Ünite Özet için hazırlanan  ders çalışma dokümanına (ders özeti / sorularla öğrenelim) aşağıdan erişebilirsiniz. AÖF Ders Notları ile sınavlara çok daha etkili bir şekilde çalışabilirsiniz. Sınavlarınızda başarılar dileriz.

İşletme Analitiği: Yöntemler ve Yazılımları

Giriş

İşletme analitiği araçları (İAA), verileri anlamlandırarak durumbilgilerine ve yöntembilgilerine dönüştürmesinde kullanılan teknolojilerin bütünüdür. İAA’ ların, işletmelerin problemlerine çözüm üretme ve geleceğe dönük kestirimler yapma konusunda sağladığı bazı katkılar şunlardır:

  • Analiz çıktılarının kalitesini arttırmak ve bu çıktıların izlenebilirliklerine olanak tanımak,
  • Kullanıcıların ek iş yükünü minimize ederek daha neden yapılandırılmış sistemin maksimum fayda ile yeniden kullanılmasına imkân tanımak,
  • Farklı düzeydeki karar vericiler için farklı amaçlara uygun çıktılar üretmek
  • Çevrimiçi olarak işbirliği ve onay desteği sunarak işlemlerin paralel olarak yapılabilmesine imkân tanımak ve böylece verimlilik ve kar artışını sağlamak.

Rekabet gücünü arttırmak isteyen üstyönetimdeki karar vericilerin işletme analitiği araçlarından haberdar olması ve bu araçları iş anlayışlarının bir parçası haline getirmeleri gerekmektedir. Bu araçlardan en yaygın olanları:

İşlemtabloları, kullanımları kolay ve anlaşılırdır. Bundan dolayı yaygın olarak kullanılan işletme analitiği araçlarındandır. Karar verme süreci için oldukça somut sunumlar üretebildiği ve kapsamlı veri analiz yöntemlerinin kullanılmasını sağladığından analitiğin son basamağıdır.

Çevrimiçi Analiz İşleme (OLAP), verilerin analiz edilmesi için kullanılan veritabanlarıdır. OLAP’lar, verileri çok boyutlu küplerde tutmakta ve böylece yapılması planlanan analiz işlemlerinin daha hızlı bir şekilde yapılmasını sağlamaktadır.

İstatistiksel ya da Kantitatif Algoritmalar, karar vericilerin ve istatistikçilerin veri analizi yapmalarına olanak sağlamaktadır.

İş Kural Motorları (BRE), koşullu önermeleri kullanarak belirli iş kurallarını uygulayan yazılımlardır.

Veri Madenciliği Araçları, düz aritmetik hesaplamalardan yapay zekâ, istatistik, karar ağaçları, sinir ağları ve Bayes ağlarına kadar birçok teknikten yararlanmaktadır.

Benzetim araçları, bir dizi matematiksel, sembolik, bilimsel, finansal ve mühendislikte kullanılan fonksiyonlarla işletme süreçlerini modellemeye çalışan araçlardır.

Betimsel Analitik: Yöntemler

Betimsel analitikler, işletmelerin geçmişteki ve mevcut durumlarının, verecekleri stratejik kararları nasıl etkilediğinin belirlenmesinde kullanılır. Bunlar, işletmelerin durumunun kolay anlaşılabilmesi için verilerin sıralanması, düzenlenmesi, grafiğinin çizilmesi, özetlemesi ve raporlanması amaçlarına hizmet ederler.

Veri, sunum ya da yorum için gözlem, sayım ve ölçüm gibi tekniklerle toplanan, analiz edilen ve özetlenen gerçek durum ya da olay bilgileridir. Değişken, farklı değerler alabilen, bir nitelik ya da nicelik miktarı için kullanılan sembollerdir. Varyasyon, değişkenlerin alabileceği farklı olası değerlerdir. Betimsel analitik diğer bir deyişle, varyasyonları ve bu varyasyonların işletmeye olan etkilerini daha iyi anlamak için verinin toplanması ve analiz edilmesi işlemlerinin bütünüdür.

Verileri toplanma türlerine ya da zamanlarına göre farklı kategorilere ayırmak mümkündür

Sayısal ve Kategorik Veriler: Veriler, birimlerin değişken değerlerinin elde edilmesinde kullanılan ölçek türlerine göre iki temel grupta incelenir:

  1. Nitel (kalitatif),
  2. Nicel (kantitatif),

Toplama, çıkarma, çarpma ya da bölme gibi numerik ya da aritmetik işlemlerde kullanılabilen sayısal verilere nicel veriler denir. Nicel veriler iki gruba ayrılır:

  1. Kesikli veriler,
  2. Sürekli veriler

Kesikli veriler, birimlere ait özelliklerin tam sayılarla ifade edildiği, sürekli veriler ise teorik olarak herhangi iki nokta arasında sonsuz sayıda farklı değer alabilen değişkenlerdir. Numerik ya da aritmetik işlemlerde kullanılamayan kategorik verilere nitel veriler denir. Nitel verilerde, değişken değerlerin belirlenmesinde nominal ve ordinal ölçekler kullanılır. Nominal ölçek kullanılarak elde edilen değişken değerleri sözeldir. Ordinal ölçek kullanılarak elde edilen değişken değerleri doğal bir sıraya göre dizilmiştir.

Kesitsel Veriler ve Zaman Serisi Verileri: Kesitsel veriler, belirli bir anda ya da belirli bir zaman aralığında ölçümü yapılmış olan verilerdir. Zaman serisi verileri, farklı zaman periyotlarında toplanan verilerdir.

İşletmelerin, yapacak oldukları araştırmalarda analiz etmek istedikleri birimlerin özelliklerini uygun ölçek türü ile ölçmesine verinin derlenmesi denir. Veri derleme işlemi iki gruba ayrılır:

  1. Birinci elden veri derleme,
  2. İkinci elden veri derleme,

Veri derleme işini yapan kişi, verileri uygun araçlar kullanarak kendisi derliyorsa birinci elden veri derleme denir. Çalışma için gerekli olan veriler, çalışmayı yapacak olan kişiden farklı bir kişi ya da kaynak tarafından derlenmişse ikinci elden veri derleme denir.

Derlenmiş ve elde ediliş sırasına göre sunulmuş veriler ham veri olarak nitelendirilir. Ham verilerin artan ya da azalan şekilde sıraya konmuş, düzenlenmiş haline seri adı verilir. Seriler üç grupta incelenebilirler: Dağılım serileri, Zaman serileri, Mekân serileri

Dağılım serileri: Fekans dağılımı da denir. Dağılımlar hem kategorik hem de sayısal veriler için oluşturulabilir. Sayısal veriler için oluşturulan dağılım serilerine nicel dağılım serileri, kategorik veriler için oluşturulan dağılım serilerine de nitel dağılım serileri denir

Bir grup birime ait veriler, bir değişkenin düzeylerine göre ayrılıp aynı düzey veya düzeyler grubunda bulunan birimler kümelendiğinde, her kümede bulunan gözlem sayısına frekans denir. Frekans dağılımlarının belirlenmesi, temelde bir sayma ve sınama işlemidir. Frekans dağılımları hem nitel hem de nicel veriler için kullanılır. Frekans dağılımları iki sütundan oluşur. İlk sütunda rassal değişken değerleri, ikinci sütunda ise rassal değişken değerlerinin görülme sıklığı yer alır.

Histogram, sayısal veriler için yaygın olarak kullanılan grafiksel sunum yöntemidir.

Frekans poligonu, bir frekans dağılımının grafiksel gösterimidir. Frekans poligonu çizilirken öncelikle dağılımın histogramı çizilir. Histogram içerisinde bulunan dörtgenlerin tepe orta noktalarının doğrusal olarak bir çizgi ile birleştirilmesiyle frekans poligonu oluşur

Zaman serileri: Zamana bağlı bir değişkenin zaman içerisinde almış olduğu farklı değerlerin ölçülüp bu ölçüm sonuçlarının kronolojik olarak sıralanmasıyla oluşan serilerdir. İki sütundan oluşur; birinci sütunda zaman değişkeninin ölçme düzeyleri, ikinci sütunda ilgili zaman düzeyine karşılık gelen ölçüm değeri yer alır. Zaman serileri, nicel değerlerden oluşmaktadır. Zaman serisi analizinde, zaman içerisinde düzenli aralıklarla gözlemlenen verilerin incelenmesi ve gelecek dönemlerde elde edilebilecek tahminî verilerin öngörüsünün güvenilir bir şekilde yapılabilmesi amaçlanmaktadır.

Mekân serileri: Değişkenin aldığı değerlerin mekâna göre sınıflandırılmasıyla oluşan serilerdir. Mekân serilerinin ilk sütununda ilgili mekânlar, ikinci sütununda ise ölçülen değerler bulunur

Merkezi eğilim ölçüleri, veri setlerine ilişkin özet bilgilerin elde edilmesinde kullanılır. Ortalama olarak da adlandırılan bu ölçüm değerleri; içinde bulundukları serinin en küçük değeri ile en büyük değeri arasında yer alır. İki ana grupta incelenmektedir:

  1. Duyarlı ortalamalar
  2. Duyarlı olmayan ortalamalar

Duyarlı ortalamalar, veri setindeki tüm değerleri hesaplamaya katan ve set içerisindeki herhangi bir değişiklikten hemen etkilenen merkezi eğilim ölçüleridir.

Duyarlı olmayan ortalamalar, veri setindeki uç değerlerden etkilenmeyen ve hesaplamaya, veri setindeki tüm değerleri katmayan merkezî eğilim ölçüleridir.

Değişkenlik ölçüleri, veri setinin anlaşılması konusunda etkili bir yöntemdir. Seriyi oluşturan gözlem değerlerinin birbirlerinden ve duyarlı bir ortalama olan aritmetik ortalamadan ne derece uzaklaştıklarının bilgisi değişkenlik ölçüleriyle anlaşılabilir.

Bir serinin merkezî eğilim ölçülerinin ve değişkenlik ölçülerinin bilinmesi kadar dağılım şeklinin bilinmesi de önemlidir. Seriler incelendiğinde verilerin bazılarının ortadaki değere yakın noktalarda, bazılarının en büyük değere, bazılarının ise en küçük değere yakın bir noktada yoğunlaştıkları gözlenebilir. Normal dağılımdan uzaklaşan bu serilerin özellikleri basıklık ve çarpıklık ölçüleri ile anlamlandırılır. Basıklık ve çarpıklık veri setini içerisindeki değerlerin dağılımının şeklini ortaya koyan ölçülerdir. Basıklık, serinin frekans dağılımının normal dağılıma kıyasla daha sivri ya da daha düz olduğunun belirlenmesini sağlar. Pozitif bir sonuç daha sivri bir dağılımı gösterirken negatif bir sonuç daha düz bir dağılımı göstermektedir. Çarpıklık, seride bulunan değerlerin aritmetik ortalama etrafında dağılımının asimetri düzeyini vermektedir. Pozitif bir sonuç, değerlerin aritmetik ortalamadan daha büyük olduğu yönde bir çarpıklık gösterirken, negatif bir sonuç ise tam tersi bir sonucu ifade etmektedir. Verinin dağılım şekilleri işletmelerin karar verme süreçlerinde faydalandıkları önemli bir ölçüdür.

Endeks; bir veri ya da veri setinin, zamana ya da mekâna göre aldığı değerlerin oransal değişimini gösteren bir ölçüdür. Endekslerin hesaplanmasında, kıyaslanan ve baz alınan en az iki değere ihtiyaç vardır. Endeksler;

  • Çalışmanın amacına göre: Mekân endeksi, Zaman endeksi.
  • Değişken türüne göre: Sabit esaslı endeksler, Değişken esaslı endeksler.
  • Değişken sayısına göre: Basit esaslı endeksler, Bileşik esaslı endeksler olarak sınıflandırılır.

Korelasyon, betimsel bir ölçü olup iki ya da daha fazla değişken arasındaki doğrusal ilişkiyi ifade etmektedir. Korelasyon analizi, iki değişken arasındaki ilişkinin yönünü, derecesini ve önemini ortaya koyan istatistiksel bir yöntemdir. Değişkenler arasındaki ilişkinin yönünü ve derecesini belirten katsayıya korelasyon katsayısı denir. Korelasyon katsayısı (r), -1 ile +1 arasında değerler alır. r değeri, -1’e yakınsa değişkenler arasında negatif yönde, +1’e yakınsa pozitif yönde bir ilişki olduğu ifade edilir. r değeri sıfıra yakın değer aldığı durumda iki değişken arasında çok zayıf bir ilişki olduğu ya da hiçbir ilişki olmadığı sonucuna varılır. Yaygın olarak kullanılan korelasyon katsayıları: Pearson korelasyon katsayısı ve Spearman korelasyon katsayısıdır. Pearson korelasyon katsayısı, değişken değerleri, oranlı ya da aralıklı ölçek ile elde edilmiş ve normal dağılıma uygunluk gösteriyorsa hesaplanır. Spearman korelasyon katsayısı, değişken değerleri oranlı ya da aralıklı ölçek ile elde edilmiş ancak normal dağılıma uygunluk göstermiyorsa hesaplanır.

Görselleştirme teknikleri; yığın halinde olan verileri, tek bir alan içerisinde göstererek ya da özetleyerek, insanın algılama yeteneklerini ve insanlar arası yorumlama farklılıklarını dikkate alarak problem çözümüne olanak sağlamaktadır. Verilerin görselleştirilmesinde ilk karar en verimli görselleştirme tekniğinin seçilmesidir. Bu teknik bir tablo olabileceği gibi bir grafik ya da bir diyagram olabilir. Tabloların tercih edilmesi gereken durumlardan bazıları:

  • Okuyucunun tablo değerleri arasında göreceli karşılaştırmalar yerine kesin bir kıyaslama yapması gerekiyorsa,
  • Okuyucu göreceli olmayan belirli değerlere ihtiyaç duyuyorsa,
  • Değerler farklı birimler ya da çok farklı büyüklüklerden oluşuyorsa,

Kullanım amaçlarına göre farklı tablo türleri mevcuttur.

Çapraz tablolar: İki veya daha fazla değişken düzeyi arasındaki ilişkinin karşılaştırılması ve birbirleriyle olan ilişkilerinin anlaşılmasına olanak sağlar. Matris raporları olarak da bilinir. Veriler, kesişim noktalarındaki özetlenmiş bilgilerle birlikte satırlar ve sütunlar hâlinde gösterir

Özet tablolar (Pivot tablolar): Büyük veri yığınlarının, çok fazla satır içeren tabloların gruplanmasına, alt toplamlarının alınmasına, filtrelenmesine ve özetlenmesine olanak sağlayan önemli bir veri analiz aracıdır. Özet tablolar, genişletme ve daraltma yetenekleriyle verideki detayların gösterilmesi konusunda esneklik sağlamaktadır.

Gösterge panosu, bir ya da daha fazla amaca ulaşma konusunda gerekli olan bilgilerin bir bakışta anlaşılabilecek, tek bir ekrandaki derlenmiş ve organize edilmiş sunumudur. Gösterge panoları, özet tablolar, özet grafikler ve dilimleyicilerden oluşmaktadır. Bu panolar, en kritik ve sürekli değişen performans ölçümlerini hızlı bir şekilde yorumlamaya olanak sağlamaktadır. Bununla birlikte pano içerisindeki grafikler ve çizelgeler üzerinde filtreleme ya da ayrıntılara girip çıkma gibi etkileşimler isteğe bağlı olarak kullanılabilmektedir

Anahtar performans göstergeleri(KPI), işletmenin kurumsal hedeflerine ne derece ulaştığının ölçülmesinde kullanılan metriklerdir. KPI’lar stratejik, gerçekçi, ölçülebilir, anlaşılabilir, zaman çerçeveli ve belirli bir temele dayanan metrikler olmalıdırlar.

  • Stratejik olma: KPI’lar stratejik bir hedefi somutlaştırmak için belirlenmelidirler.
  • Gerçekçi olma: KPI’lar göreceli, belirsiz ya da somutlaştırılamayacak hedefler üzerine kurulmamalıdır.
  • Ölçülebilir olma: Hedefler belirli bir aralıkta belirlenmelidirler.
  • Anlaşılabilir olma: Kullanılan yazılımın görsel sunumu desteklemesi gerekir.
  • Zaman çerçeveli olma: Belirlenecek olan hedeflerin belirli bir zaman çerçevesi olması beklenmektedir.
  • Belirli bir temele dayanma: Hedefler belirli bir noktaya göre ölçülmelidir.

Kurumsal karne, birden fazla performans bileşeninin ölçülerek ölçüm sonuçlarının özet bir şekilde raporlanmasına dayanan performans karnesidir. İşletmenin kritik ve stratejik amaçlarını belirlemek, yönetmek ve ölçmek için kullanılır. Kurumsal karne kavramı, bir işletmenin genel amaçlarını dört boyuta indirgemekle birlikte buradaki amaç oluşturulan dört boyutlu modeli bütün işletmelerde bir şablon olarak kullanmaktır. Bu boyutlar:

  1. Finansal boyut; bir işletmenin finansal amaçlarını kapsamakla birlikte üstyönetimdeki karar vericilerin finansal süreci ve paydaş ilişkilerini değerlendirmesine olanak sağlamaktadır.
  2. Müşteri boyutu; müşteri memnuniyetini, ürün ve servis özelliklerini kapsamakla birlikte müşterilerin işletme hakkındaki görüşlerine önem vermektedir.
  3. Dâhilî iş süreçleri boyutu; müşteri hedeflerine ulaşmak için gerekli olan kritik süreçleri ve işletme içi operasyonların bütününü kapsamaktadır.
  4. Öğrenme ve gelişim boyutu; insan faktörleri, işletme faktörleri, bilgi kullanımı, kurumsal kültür ya da liderlik vasfı gibi somut olmayan başarı ölçütlerini kapsamakta ve bu ölçütlerin sürekliliğini ölçmektedir.

Kestirimci Analitik: Yöntemler

Kestirimci analitikler; tahmin teorisine dayalı ve işletmelerin gelecekte karşılaşabilecekleri durumları önceden öngörmeyi hedefleyen yöntemlerin bütünüdür. Genel amaçları; bağımsız değişkenlerin aldıkları değerlere dayanarak, bağımlı değişkenin değerini kestirmek için model geliştirerek gelecekteki bir durum için tahmin yapmaktır. Geleceğe dönük olarak yapılacak bu tahminler iki farklı tür olarak değerlendirilebilir:

  1. Bir kitle parametresini tahmin etmek için kullanılan örnek istatistiğinin değerini tahminlemeye yönelik nokta tahmini.
  2. Parametreyi tahmin etmek için kullanılan değerleri içeren bir aralığın tahmin edilmesinde kullanılan aralık tahmini.

Karar vericilerin en yaygın olarak kullandığı kestirimci analitik yöntemi veri madenciliğidir. Veri madenciliği, mevcut verilerden yola çıkılarak daha önceden keşfedilmemiş yeni bilgilerin ortaya çıkarılması ve bulunan bu bilgilerin karar verme aşamalarında kullanılması mantığına dayanan bir yöntemdir. Veri madenciliği işlemlerinde verilerin trendleri, veriler arasındaki ilişkiler ve verilerde zamana bağlı olarak görülen değişimler gibi istatistiksel yöntemlerle ortaya çıkarılabilecek bilgiler, uygun algoritma ve tekniklerle araştırılmakta ve anlamlandırılmaktadır. Veri madenciliği işlemleri için kullanılan model ve algoritmalarda regresyon analizi, lojistik regresyon, karar ağaçları, kümeleme teknikleri ve yapay sinir ağları gibi tekniklerden faydalanılır.

Regresyon Analizi, bir ya da daha fazla değişkenin (bağımlı değişken) başka değişkenler (bağımsız/açıklayıcı değişken) cinsinden tahmin edilmesini sağlayacak ilişkiler bulmak ve bu ilişkileri anlamlandırmaktır. Bağımlı ve bağımsız değişkenler arasında bulunan ilişkinin ifade edildiği matematiksel fonksiyona regresyon denklemi denir. Bu denklemde kullanılacak olan bağımlı ve bağımsız değişkenlerin sayılabilir ve ölçülebilir olması gerekir. Tek değişkenli regresyon modellerine basit doğrusal regresyon, birden fazla bağımsız değişkenin olduğu regresyon modellerine de çoklu regresyon modelleri denir.

Lojistik regresyon analizi, doğrusal regresyon analizine çok benzemesine rağmen, bağımlı değişkenin kategorik ya da kesikli bir değişken olması gerekir. Lojistik regresyon analizi, bağımlı değişkenin; iki, üç veya daha çok sayıda kategoride gözlemlendiği durumlarda açıklayıcı değişkenlerle ilişkisini belirlemek için yaygın olarak kullanılan bir tekniktir. Lojistik regresyonun kullanımında bir teklife yanıt verme ya da kesikli değerler arasından bir seçim yapma gibi amaçlar gözetilmektedir. Lojistik regresyon analizinde üç temel teknik kullanılır:

  1. İkili (binary) lojistik regresyon,
  2. Nominal lojistik regresyon,
  3. Sıralı (ordinal) lojistik regresyon,

İkili (Binary) Lojistik Regresyon Tekniği: Bağımlı değişken düzeylerinin ikili veya iki değere indirgenmiş olduğu durumlarda uygun bir tekniktir. Bağımlı değişken var-yok, başarılı-başarısız, olumlu-olumsuz gibi değerler alır. Bağımsız değişkenler iki grupta incelenir:

  1. Açıklayıcı değişkenler kategorik nominal ölçekli ise faktör değişken,
  2. Açıklayıcı değişkenler sürekli ise ortak değişken

Multi-Nominal Lojistik Regresyon Tekniği: Bağımlı değişkenin sınıflayıcı yani nominal ölçekli ve en az üç kategorili olduğu durumda uygulanır. Multi-Nominal lojistik regresyon modeli, sıralı lojistik regresyon modeli de olduğu gibi ikili lojistik regresyon modelinin genelleştirilmiş halidir. Bu modelde ikiden fazla kategori olduğu için ilk veya son kategori referans kategorisi olarak belirlenir. Belirlenen referans kategorisinin diğer kategoriler ile ilişkisi olasılık kurallarına uygun olarak incelenir.

Sıralı (Ordinal) Lojistik Regresyon Tekniği: Bağımlı değişkenin kategorilerinin sıralı ölçekle ölçüldüğü durumlarda uygulanan bir tekniktir. Bağımlı değişken en az üç kategoriye sahiptir ve kategoriler doğal bir sıraya göre ve küçükten büyüğe doğru kodlanmalıdır. Bu teknikte, bağımsız değişkenlerin tümünün sürekli veya kategorik olmasına ilişkin herhangi bir koşul yoktur. Ancak sürekli sayısal bağımsız değişkenlerin tercih edilmesi önerilmektedir.

Karar ağaçları, öngörü ve sınıflandırma için yaygın olarak kullanılan ve oldukça güvenilir olan bir veri madenciliği tekniğidir. Sınıflandırma ağacı da denir. Buradaki temel yöntem değişkenler arasındaki farkların en büyük olduğu durumların değerlendirilmesidir. Karar ağaçları; karar düğümleri, dal ve yapraklardan oluşmaktadır. Uygulanmasında düğümlerden yapraklara doğru inilerek kurallar yazılır ve karar verici bu kurallara bakarak anlamlı sınıflandırmaların gerçekleşip gerçekleşmediği konusunda bir fikir sahibi olur.

Kümeleme yöntemleri, verinin belirli özelliklerden yararlanılarak olabildiğince homojen gruplara ayrılması ve farklı gruplar arasındaki ilişkinin de olabildiğince az olması görüşüne dayanan veri madenciliği tekniğidir. Bu yöntemler, veriyi bölümleyerek belirlenmiş olan kriterlere göre değerlendirmektedir. Veriye ve istenilen kümeleme kriterlerine göre yaygın olarak k-means ve k-medoids algoritmaları kullanılmaktadır. k-means algoritmasında, her küme kendi merkezi ile k-medoids algoritmasında ise her küme, küme içerisindeki bir değişken ile temsil edilmektedir.

Yapay sinir ağları, insan beyninden yola çıkarak nöronların arasındaki iletişimin matematiksel olarak modellenmesi ve veri madenciliği işlemlerinde bu modellerden faydalanılmasına dayanır. Yapay sinir ağları, insan beyninin öğrenme ve öğrenilenlerden yeni bilgiler türetebilme sürecinde izlediği yolu kendisine model alarak, bunun otomatik olarak gerçekleştirilmesi konusunda geliştirilen sistemlerdir.

İşletme Analitiği Yazılımları

İşletme analitiği yazılım pazarı 3 alt yazılım grubundan oluşmaktadır;

  1. Veri ambarı platformu,
  2. İşletme analitiği araçları,
  3. Performans yönetimi ve analitik uygulamaları,

Betimsel analitik yazılımları, veri görselleştirme araçları ve betimsel istatistik analiz araçlarını kapsamaktadır. İşletmelerin sıkça başvurdukları, kaydı tutulan verilerden işletmenin mevcut durumunun gözlemlenebildiği yazılımlardır. Sık kullanılan betimsel analitik yazılımları:

  • Microsoft Business Intelligence Suite
  • Oracle Business Intellegence Suite: Yazılım kendi içerisinde 5 farklı özelliği içeren ek paketlerden oluşmaktadır:
    1. Oracle Warehouse Builder
    2. Oracle Business Intelligence Server
    3. Oracle Business Intelligence Interactive Dashboards
    4. Oracle Business Intelligence Answers
    5. Oracle Busıness Intellıgence Publisher
  • IBM Cognos Insight
  • SAP Business Objects
  • SAS Business Intelligence

Kestirimci analitik yazılımları, çeşitli analizler ile veri desenlerini inceleyerek geleceğe dönük tahminlerin yapılmasını sağlamaktadırlar. Bu yazılımlar; işletmelerin gelecek planlarını belirlemelerinde önemli teknolojiler olmakla beraber, analiz edilen verilerin kalitesiz olma durumunda, karar vericilerin yanlış kararlar almasına da yol açabilmektedirler. Yaygın olarak kullanılan kestirimci analitik yazılımları:

  • Microsoft Excel,
  • IBM SPSS Predictive Analytics Enterprise,
  • R,
  • Rapid Miner,
  • Weka,
  • Statistica,
  • Oracle Data Miner.

Giriş

İşletme analitiği araçları (İAA), verileri anlamlandırarak durumbilgilerine ve yöntembilgilerine dönüştürmesinde kullanılan teknolojilerin bütünüdür. İAA’ ların, işletmelerin problemlerine çözüm üretme ve geleceğe dönük kestirimler yapma konusunda sağladığı bazı katkılar şunlardır:

  • Analiz çıktılarının kalitesini arttırmak ve bu çıktıların izlenebilirliklerine olanak tanımak,
  • Kullanıcıların ek iş yükünü minimize ederek daha neden yapılandırılmış sistemin maksimum fayda ile yeniden kullanılmasına imkân tanımak,
  • Farklı düzeydeki karar vericiler için farklı amaçlara uygun çıktılar üretmek
  • Çevrimiçi olarak işbirliği ve onay desteği sunarak işlemlerin paralel olarak yapılabilmesine imkân tanımak ve böylece verimlilik ve kar artışını sağlamak.

Rekabet gücünü arttırmak isteyen üstyönetimdeki karar vericilerin işletme analitiği araçlarından haberdar olması ve bu araçları iş anlayışlarının bir parçası haline getirmeleri gerekmektedir. Bu araçlardan en yaygın olanları:

İşlemtabloları, kullanımları kolay ve anlaşılırdır. Bundan dolayı yaygın olarak kullanılan işletme analitiği araçlarındandır. Karar verme süreci için oldukça somut sunumlar üretebildiği ve kapsamlı veri analiz yöntemlerinin kullanılmasını sağladığından analitiğin son basamağıdır.

Çevrimiçi Analiz İşleme (OLAP), verilerin analiz edilmesi için kullanılan veritabanlarıdır. OLAP’lar, verileri çok boyutlu küplerde tutmakta ve böylece yapılması planlanan analiz işlemlerinin daha hızlı bir şekilde yapılmasını sağlamaktadır.

İstatistiksel ya da Kantitatif Algoritmalar, karar vericilerin ve istatistikçilerin veri analizi yapmalarına olanak sağlamaktadır.

İş Kural Motorları (BRE), koşullu önermeleri kullanarak belirli iş kurallarını uygulayan yazılımlardır.

Veri Madenciliği Araçları, düz aritmetik hesaplamalardan yapay zekâ, istatistik, karar ağaçları, sinir ağları ve Bayes ağlarına kadar birçok teknikten yararlanmaktadır.

Benzetim araçları, bir dizi matematiksel, sembolik, bilimsel, finansal ve mühendislikte kullanılan fonksiyonlarla işletme süreçlerini modellemeye çalışan araçlardır.

Betimsel Analitik: Yöntemler

Betimsel analitikler, işletmelerin geçmişteki ve mevcut durumlarının, verecekleri stratejik kararları nasıl etkilediğinin belirlenmesinde kullanılır. Bunlar, işletmelerin durumunun kolay anlaşılabilmesi için verilerin sıralanması, düzenlenmesi, grafiğinin çizilmesi, özetlemesi ve raporlanması amaçlarına hizmet ederler.

Veri, sunum ya da yorum için gözlem, sayım ve ölçüm gibi tekniklerle toplanan, analiz edilen ve özetlenen gerçek durum ya da olay bilgileridir. Değişken, farklı değerler alabilen, bir nitelik ya da nicelik miktarı için kullanılan sembollerdir. Varyasyon, değişkenlerin alabileceği farklı olası değerlerdir. Betimsel analitik diğer bir deyişle, varyasyonları ve bu varyasyonların işletmeye olan etkilerini daha iyi anlamak için verinin toplanması ve analiz edilmesi işlemlerinin bütünüdür.

Verileri toplanma türlerine ya da zamanlarına göre farklı kategorilere ayırmak mümkündür

Sayısal ve Kategorik Veriler: Veriler, birimlerin değişken değerlerinin elde edilmesinde kullanılan ölçek türlerine göre iki temel grupta incelenir:

  1. Nitel (kalitatif),
  2. Nicel (kantitatif),

Toplama, çıkarma, çarpma ya da bölme gibi numerik ya da aritmetik işlemlerde kullanılabilen sayısal verilere nicel veriler denir. Nicel veriler iki gruba ayrılır:

  1. Kesikli veriler,
  2. Sürekli veriler

Kesikli veriler, birimlere ait özelliklerin tam sayılarla ifade edildiği, sürekli veriler ise teorik olarak herhangi iki nokta arasında sonsuz sayıda farklı değer alabilen değişkenlerdir. Numerik ya da aritmetik işlemlerde kullanılamayan kategorik verilere nitel veriler denir. Nitel verilerde, değişken değerlerin belirlenmesinde nominal ve ordinal ölçekler kullanılır. Nominal ölçek kullanılarak elde edilen değişken değerleri sözeldir. Ordinal ölçek kullanılarak elde edilen değişken değerleri doğal bir sıraya göre dizilmiştir.

Kesitsel Veriler ve Zaman Serisi Verileri: Kesitsel veriler, belirli bir anda ya da belirli bir zaman aralığında ölçümü yapılmış olan verilerdir. Zaman serisi verileri, farklı zaman periyotlarında toplanan verilerdir.

İşletmelerin, yapacak oldukları araştırmalarda analiz etmek istedikleri birimlerin özelliklerini uygun ölçek türü ile ölçmesine verinin derlenmesi denir. Veri derleme işlemi iki gruba ayrılır:

  1. Birinci elden veri derleme,
  2. İkinci elden veri derleme,

Veri derleme işini yapan kişi, verileri uygun araçlar kullanarak kendisi derliyorsa birinci elden veri derleme denir. Çalışma için gerekli olan veriler, çalışmayı yapacak olan kişiden farklı bir kişi ya da kaynak tarafından derlenmişse ikinci elden veri derleme denir.

Derlenmiş ve elde ediliş sırasına göre sunulmuş veriler ham veri olarak nitelendirilir. Ham verilerin artan ya da azalan şekilde sıraya konmuş, düzenlenmiş haline seri adı verilir. Seriler üç grupta incelenebilirler: Dağılım serileri, Zaman serileri, Mekân serileri

Dağılım serileri: Fekans dağılımı da denir. Dağılımlar hem kategorik hem de sayısal veriler için oluşturulabilir. Sayısal veriler için oluşturulan dağılım serilerine nicel dağılım serileri, kategorik veriler için oluşturulan dağılım serilerine de nitel dağılım serileri denir

Bir grup birime ait veriler, bir değişkenin düzeylerine göre ayrılıp aynı düzey veya düzeyler grubunda bulunan birimler kümelendiğinde, her kümede bulunan gözlem sayısına frekans denir. Frekans dağılımlarının belirlenmesi, temelde bir sayma ve sınama işlemidir. Frekans dağılımları hem nitel hem de nicel veriler için kullanılır. Frekans dağılımları iki sütundan oluşur. İlk sütunda rassal değişken değerleri, ikinci sütunda ise rassal değişken değerlerinin görülme sıklığı yer alır.

Histogram, sayısal veriler için yaygın olarak kullanılan grafiksel sunum yöntemidir.

Frekans poligonu, bir frekans dağılımının grafiksel gösterimidir. Frekans poligonu çizilirken öncelikle dağılımın histogramı çizilir. Histogram içerisinde bulunan dörtgenlerin tepe orta noktalarının doğrusal olarak bir çizgi ile birleştirilmesiyle frekans poligonu oluşur

Zaman serileri: Zamana bağlı bir değişkenin zaman içerisinde almış olduğu farklı değerlerin ölçülüp bu ölçüm sonuçlarının kronolojik olarak sıralanmasıyla oluşan serilerdir. İki sütundan oluşur; birinci sütunda zaman değişkeninin ölçme düzeyleri, ikinci sütunda ilgili zaman düzeyine karşılık gelen ölçüm değeri yer alır. Zaman serileri, nicel değerlerden oluşmaktadır. Zaman serisi analizinde, zaman içerisinde düzenli aralıklarla gözlemlenen verilerin incelenmesi ve gelecek dönemlerde elde edilebilecek tahminî verilerin öngörüsünün güvenilir bir şekilde yapılabilmesi amaçlanmaktadır.

Mekân serileri: Değişkenin aldığı değerlerin mekâna göre sınıflandırılmasıyla oluşan serilerdir. Mekân serilerinin ilk sütununda ilgili mekânlar, ikinci sütununda ise ölçülen değerler bulunur

Merkezi eğilim ölçüleri, veri setlerine ilişkin özet bilgilerin elde edilmesinde kullanılır. Ortalama olarak da adlandırılan bu ölçüm değerleri; içinde bulundukları serinin en küçük değeri ile en büyük değeri arasında yer alır. İki ana grupta incelenmektedir:

  1. Duyarlı ortalamalar
  2. Duyarlı olmayan ortalamalar

Duyarlı ortalamalar, veri setindeki tüm değerleri hesaplamaya katan ve set içerisindeki herhangi bir değişiklikten hemen etkilenen merkezi eğilim ölçüleridir.

Duyarlı olmayan ortalamalar, veri setindeki uç değerlerden etkilenmeyen ve hesaplamaya, veri setindeki tüm değerleri katmayan merkezî eğilim ölçüleridir.

Değişkenlik ölçüleri, veri setinin anlaşılması konusunda etkili bir yöntemdir. Seriyi oluşturan gözlem değerlerinin birbirlerinden ve duyarlı bir ortalama olan aritmetik ortalamadan ne derece uzaklaştıklarının bilgisi değişkenlik ölçüleriyle anlaşılabilir.

Bir serinin merkezî eğilim ölçülerinin ve değişkenlik ölçülerinin bilinmesi kadar dağılım şeklinin bilinmesi de önemlidir. Seriler incelendiğinde verilerin bazılarının ortadaki değere yakın noktalarda, bazılarının en büyük değere, bazılarının ise en küçük değere yakın bir noktada yoğunlaştıkları gözlenebilir. Normal dağılımdan uzaklaşan bu serilerin özellikleri basıklık ve çarpıklık ölçüleri ile anlamlandırılır. Basıklık ve çarpıklık veri setini içerisindeki değerlerin dağılımının şeklini ortaya koyan ölçülerdir. Basıklık, serinin frekans dağılımının normal dağılıma kıyasla daha sivri ya da daha düz olduğunun belirlenmesini sağlar. Pozitif bir sonuç daha sivri bir dağılımı gösterirken negatif bir sonuç daha düz bir dağılımı göstermektedir. Çarpıklık, seride bulunan değerlerin aritmetik ortalama etrafında dağılımının asimetri düzeyini vermektedir. Pozitif bir sonuç, değerlerin aritmetik ortalamadan daha büyük olduğu yönde bir çarpıklık gösterirken, negatif bir sonuç ise tam tersi bir sonucu ifade etmektedir. Verinin dağılım şekilleri işletmelerin karar verme süreçlerinde faydalandıkları önemli bir ölçüdür.

Endeks; bir veri ya da veri setinin, zamana ya da mekâna göre aldığı değerlerin oransal değişimini gösteren bir ölçüdür. Endekslerin hesaplanmasında, kıyaslanan ve baz alınan en az iki değere ihtiyaç vardır. Endeksler;

  • Çalışmanın amacına göre: Mekân endeksi, Zaman endeksi.
  • Değişken türüne göre: Sabit esaslı endeksler, Değişken esaslı endeksler.
  • Değişken sayısına göre: Basit esaslı endeksler, Bileşik esaslı endeksler olarak sınıflandırılır.

Korelasyon, betimsel bir ölçü olup iki ya da daha fazla değişken arasındaki doğrusal ilişkiyi ifade etmektedir. Korelasyon analizi, iki değişken arasındaki ilişkinin yönünü, derecesini ve önemini ortaya koyan istatistiksel bir yöntemdir. Değişkenler arasındaki ilişkinin yönünü ve derecesini belirten katsayıya korelasyon katsayısı denir. Korelasyon katsayısı (r), -1 ile +1 arasında değerler alır. r değeri, -1’e yakınsa değişkenler arasında negatif yönde, +1’e yakınsa pozitif yönde bir ilişki olduğu ifade edilir. r değeri sıfıra yakın değer aldığı durumda iki değişken arasında çok zayıf bir ilişki olduğu ya da hiçbir ilişki olmadığı sonucuna varılır. Yaygın olarak kullanılan korelasyon katsayıları: Pearson korelasyon katsayısı ve Spearman korelasyon katsayısıdır. Pearson korelasyon katsayısı, değişken değerleri, oranlı ya da aralıklı ölçek ile elde edilmiş ve normal dağılıma uygunluk gösteriyorsa hesaplanır. Spearman korelasyon katsayısı, değişken değerleri oranlı ya da aralıklı ölçek ile elde edilmiş ancak normal dağılıma uygunluk göstermiyorsa hesaplanır.

Görselleştirme teknikleri; yığın halinde olan verileri, tek bir alan içerisinde göstererek ya da özetleyerek, insanın algılama yeteneklerini ve insanlar arası yorumlama farklılıklarını dikkate alarak problem çözümüne olanak sağlamaktadır. Verilerin görselleştirilmesinde ilk karar en verimli görselleştirme tekniğinin seçilmesidir. Bu teknik bir tablo olabileceği gibi bir grafik ya da bir diyagram olabilir. Tabloların tercih edilmesi gereken durumlardan bazıları:

  • Okuyucunun tablo değerleri arasında göreceli karşılaştırmalar yerine kesin bir kıyaslama yapması gerekiyorsa,
  • Okuyucu göreceli olmayan belirli değerlere ihtiyaç duyuyorsa,
  • Değerler farklı birimler ya da çok farklı büyüklüklerden oluşuyorsa,

Kullanım amaçlarına göre farklı tablo türleri mevcuttur.

Çapraz tablolar: İki veya daha fazla değişken düzeyi arasındaki ilişkinin karşılaştırılması ve birbirleriyle olan ilişkilerinin anlaşılmasına olanak sağlar. Matris raporları olarak da bilinir. Veriler, kesişim noktalarındaki özetlenmiş bilgilerle birlikte satırlar ve sütunlar hâlinde gösterir

Özet tablolar (Pivot tablolar): Büyük veri yığınlarının, çok fazla satır içeren tabloların gruplanmasına, alt toplamlarının alınmasına, filtrelenmesine ve özetlenmesine olanak sağlayan önemli bir veri analiz aracıdır. Özet tablolar, genişletme ve daraltma yetenekleriyle verideki detayların gösterilmesi konusunda esneklik sağlamaktadır.

Gösterge panosu, bir ya da daha fazla amaca ulaşma konusunda gerekli olan bilgilerin bir bakışta anlaşılabilecek, tek bir ekrandaki derlenmiş ve organize edilmiş sunumudur. Gösterge panoları, özet tablolar, özet grafikler ve dilimleyicilerden oluşmaktadır. Bu panolar, en kritik ve sürekli değişen performans ölçümlerini hızlı bir şekilde yorumlamaya olanak sağlamaktadır. Bununla birlikte pano içerisindeki grafikler ve çizelgeler üzerinde filtreleme ya da ayrıntılara girip çıkma gibi etkileşimler isteğe bağlı olarak kullanılabilmektedir

Anahtar performans göstergeleri(KPI), işletmenin kurumsal hedeflerine ne derece ulaştığının ölçülmesinde kullanılan metriklerdir. KPI’lar stratejik, gerçekçi, ölçülebilir, anlaşılabilir, zaman çerçeveli ve belirli bir temele dayanan metrikler olmalıdırlar.

  • Stratejik olma: KPI’lar stratejik bir hedefi somutlaştırmak için belirlenmelidirler.
  • Gerçekçi olma: KPI’lar göreceli, belirsiz ya da somutlaştırılamayacak hedefler üzerine kurulmamalıdır.
  • Ölçülebilir olma: Hedefler belirli bir aralıkta belirlenmelidirler.
  • Anlaşılabilir olma: Kullanılan yazılımın görsel sunumu desteklemesi gerekir.
  • Zaman çerçeveli olma: Belirlenecek olan hedeflerin belirli bir zaman çerçevesi olması beklenmektedir.
  • Belirli bir temele dayanma: Hedefler belirli bir noktaya göre ölçülmelidir.

Kurumsal karne, birden fazla performans bileşeninin ölçülerek ölçüm sonuçlarının özet bir şekilde raporlanmasına dayanan performans karnesidir. İşletmenin kritik ve stratejik amaçlarını belirlemek, yönetmek ve ölçmek için kullanılır. Kurumsal karne kavramı, bir işletmenin genel amaçlarını dört boyuta indirgemekle birlikte buradaki amaç oluşturulan dört boyutlu modeli bütün işletmelerde bir şablon olarak kullanmaktır. Bu boyutlar:

  1. Finansal boyut; bir işletmenin finansal amaçlarını kapsamakla birlikte üstyönetimdeki karar vericilerin finansal süreci ve paydaş ilişkilerini değerlendirmesine olanak sağlamaktadır.
  2. Müşteri boyutu; müşteri memnuniyetini, ürün ve servis özelliklerini kapsamakla birlikte müşterilerin işletme hakkındaki görüşlerine önem vermektedir.
  3. Dâhilî iş süreçleri boyutu; müşteri hedeflerine ulaşmak için gerekli olan kritik süreçleri ve işletme içi operasyonların bütününü kapsamaktadır.
  4. Öğrenme ve gelişim boyutu; insan faktörleri, işletme faktörleri, bilgi kullanımı, kurumsal kültür ya da liderlik vasfı gibi somut olmayan başarı ölçütlerini kapsamakta ve bu ölçütlerin sürekliliğini ölçmektedir.

Kestirimci Analitik: Yöntemler

Kestirimci analitikler; tahmin teorisine dayalı ve işletmelerin gelecekte karşılaşabilecekleri durumları önceden öngörmeyi hedefleyen yöntemlerin bütünüdür. Genel amaçları; bağımsız değişkenlerin aldıkları değerlere dayanarak, bağımlı değişkenin değerini kestirmek için model geliştirerek gelecekteki bir durum için tahmin yapmaktır. Geleceğe dönük olarak yapılacak bu tahminler iki farklı tür olarak değerlendirilebilir:

  1. Bir kitle parametresini tahmin etmek için kullanılan örnek istatistiğinin değerini tahminlemeye yönelik nokta tahmini.
  2. Parametreyi tahmin etmek için kullanılan değerleri içeren bir aralığın tahmin edilmesinde kullanılan aralık tahmini.

Karar vericilerin en yaygın olarak kullandığı kestirimci analitik yöntemi veri madenciliğidir. Veri madenciliği, mevcut verilerden yola çıkılarak daha önceden keşfedilmemiş yeni bilgilerin ortaya çıkarılması ve bulunan bu bilgilerin karar verme aşamalarında kullanılması mantığına dayanan bir yöntemdir. Veri madenciliği işlemlerinde verilerin trendleri, veriler arasındaki ilişkiler ve verilerde zamana bağlı olarak görülen değişimler gibi istatistiksel yöntemlerle ortaya çıkarılabilecek bilgiler, uygun algoritma ve tekniklerle araştırılmakta ve anlamlandırılmaktadır. Veri madenciliği işlemleri için kullanılan model ve algoritmalarda regresyon analizi, lojistik regresyon, karar ağaçları, kümeleme teknikleri ve yapay sinir ağları gibi tekniklerden faydalanılır.

Regresyon Analizi, bir ya da daha fazla değişkenin (bağımlı değişken) başka değişkenler (bağımsız/açıklayıcı değişken) cinsinden tahmin edilmesini sağlayacak ilişkiler bulmak ve bu ilişkileri anlamlandırmaktır. Bağımlı ve bağımsız değişkenler arasında bulunan ilişkinin ifade edildiği matematiksel fonksiyona regresyon denklemi denir. Bu denklemde kullanılacak olan bağımlı ve bağımsız değişkenlerin sayılabilir ve ölçülebilir olması gerekir. Tek değişkenli regresyon modellerine basit doğrusal regresyon, birden fazla bağımsız değişkenin olduğu regresyon modellerine de çoklu regresyon modelleri denir.

Lojistik regresyon analizi, doğrusal regresyon analizine çok benzemesine rağmen, bağımlı değişkenin kategorik ya da kesikli bir değişken olması gerekir. Lojistik regresyon analizi, bağımlı değişkenin; iki, üç veya daha çok sayıda kategoride gözlemlendiği durumlarda açıklayıcı değişkenlerle ilişkisini belirlemek için yaygın olarak kullanılan bir tekniktir. Lojistik regresyonun kullanımında bir teklife yanıt verme ya da kesikli değerler arasından bir seçim yapma gibi amaçlar gözetilmektedir. Lojistik regresyon analizinde üç temel teknik kullanılır:

  1. İkili (binary) lojistik regresyon,
  2. Nominal lojistik regresyon,
  3. Sıralı (ordinal) lojistik regresyon,

İkili (Binary) Lojistik Regresyon Tekniği: Bağımlı değişken düzeylerinin ikili veya iki değere indirgenmiş olduğu durumlarda uygun bir tekniktir. Bağımlı değişken var-yok, başarılı-başarısız, olumlu-olumsuz gibi değerler alır. Bağımsız değişkenler iki grupta incelenir:

  1. Açıklayıcı değişkenler kategorik nominal ölçekli ise faktör değişken,
  2. Açıklayıcı değişkenler sürekli ise ortak değişken

Multi-Nominal Lojistik Regresyon Tekniği: Bağımlı değişkenin sınıflayıcı yani nominal ölçekli ve en az üç kategorili olduğu durumda uygulanır. Multi-Nominal lojistik regresyon modeli, sıralı lojistik regresyon modeli de olduğu gibi ikili lojistik regresyon modelinin genelleştirilmiş halidir. Bu modelde ikiden fazla kategori olduğu için ilk veya son kategori referans kategorisi olarak belirlenir. Belirlenen referans kategorisinin diğer kategoriler ile ilişkisi olasılık kurallarına uygun olarak incelenir.

Sıralı (Ordinal) Lojistik Regresyon Tekniği: Bağımlı değişkenin kategorilerinin sıralı ölçekle ölçüldüğü durumlarda uygulanan bir tekniktir. Bağımlı değişken en az üç kategoriye sahiptir ve kategoriler doğal bir sıraya göre ve küçükten büyüğe doğru kodlanmalıdır. Bu teknikte, bağımsız değişkenlerin tümünün sürekli veya kategorik olmasına ilişkin herhangi bir koşul yoktur. Ancak sürekli sayısal bağımsız değişkenlerin tercih edilmesi önerilmektedir.

Karar ağaçları, öngörü ve sınıflandırma için yaygın olarak kullanılan ve oldukça güvenilir olan bir veri madenciliği tekniğidir. Sınıflandırma ağacı da denir. Buradaki temel yöntem değişkenler arasındaki farkların en büyük olduğu durumların değerlendirilmesidir. Karar ağaçları; karar düğümleri, dal ve yapraklardan oluşmaktadır. Uygulanmasında düğümlerden yapraklara doğru inilerek kurallar yazılır ve karar verici bu kurallara bakarak anlamlı sınıflandırmaların gerçekleşip gerçekleşmediği konusunda bir fikir sahibi olur.

Kümeleme yöntemleri, verinin belirli özelliklerden yararlanılarak olabildiğince homojen gruplara ayrılması ve farklı gruplar arasındaki ilişkinin de olabildiğince az olması görüşüne dayanan veri madenciliği tekniğidir. Bu yöntemler, veriyi bölümleyerek belirlenmiş olan kriterlere göre değerlendirmektedir. Veriye ve istenilen kümeleme kriterlerine göre yaygın olarak k-means ve k-medoids algoritmaları kullanılmaktadır. k-means algoritmasında, her küme kendi merkezi ile k-medoids algoritmasında ise her küme, küme içerisindeki bir değişken ile temsil edilmektedir.

Yapay sinir ağları, insan beyninden yola çıkarak nöronların arasındaki iletişimin matematiksel olarak modellenmesi ve veri madenciliği işlemlerinde bu modellerden faydalanılmasına dayanır. Yapay sinir ağları, insan beyninin öğrenme ve öğrenilenlerden yeni bilgiler türetebilme sürecinde izlediği yolu kendisine model alarak, bunun otomatik olarak gerçekleştirilmesi konusunda geliştirilen sistemlerdir.

İşletme Analitiği Yazılımları

İşletme analitiği yazılım pazarı 3 alt yazılım grubundan oluşmaktadır;

  1. Veri ambarı platformu,
  2. İşletme analitiği araçları,
  3. Performans yönetimi ve analitik uygulamaları,

Betimsel analitik yazılımları, veri görselleştirme araçları ve betimsel istatistik analiz araçlarını kapsamaktadır. İşletmelerin sıkça başvurdukları, kaydı tutulan verilerden işletmenin mevcut durumunun gözlemlenebildiği yazılımlardır. Sık kullanılan betimsel analitik yazılımları:

  • Microsoft Business Intelligence Suite
  • Oracle Business Intellegence Suite: Yazılım kendi içerisinde 5 farklı özelliği içeren ek paketlerden oluşmaktadır:
    1. Oracle Warehouse Builder
    2. Oracle Business Intelligence Server
    3. Oracle Business Intelligence Interactive Dashboards
    4. Oracle Business Intelligence Answers
    5. Oracle Busıness Intellıgence Publisher
  • IBM Cognos Insight
  • SAP Business Objects
  • SAS Business Intelligence

Kestirimci analitik yazılımları, çeşitli analizler ile veri desenlerini inceleyerek geleceğe dönük tahminlerin yapılmasını sağlamaktadırlar. Bu yazılımlar; işletmelerin gelecek planlarını belirlemelerinde önemli teknolojiler olmakla beraber, analiz edilen verilerin kalitesiz olma durumunda, karar vericilerin yanlış kararlar almasına da yol açabilmektedirler. Yaygın olarak kullanılan kestirimci analitik yazılımları:

  • Microsoft Excel,
  • IBM SPSS Predictive Analytics Enterprise,
  • R,
  • Rapid Miner,
  • Weka,
  • Statistica,
  • Oracle Data Miner.

İlgili Makaleler

Bir cevap yazın

E-posta hesabınız yayımlanmayacak.