Finansta Makine Öğrenme Yöntemleri: Son Uygulamalar ve Gelecek Beklentileri

Araştırmacıların finans alanında makine öğrenimi (ML) yöntemlerini nasıl uygulayabileceklerini inceliyoruz. İlk olarak, ML’in iki ana kategorisi (denetimli ve denetimsiz öğrenme) geleneksel ekonometri yaklaşımlarından temel olarak farklı sorunları ele aldığını belirtiyoruz. Ardından, finans alanında ML üzerine yapılan mevcut araştırmaları gözden geçiriyor ve üç ana uygulama türü tanımlıyoruz: (i) üstün ve yenilikçi ölçütlerin oluşturulması, (ii) tahmin hatasının azaltılması ve (iii) standart ekonometri araç setinin genişletilmesi. Bu sınıflandırma ile, araştırmacılar ve uygulayıcılar için olası gelecekteki yönleri değerlendiriyoruz. Sonuçlarımız, ML yöntemlerinin geleneksel yaklaşımlara kıyasla birçok fayda sağladığını ve finans alanında gelecekteki araştırmalar için büyük potansiyel taşıdığını göstermektedir.

Giriş

Yapay zeka, günlük hayatımıza yüz tanıma, ses tanıma ve chatbotlar gibi etkileyici uygulamalarla giderek daha fazla dahil oluyor. Makine öğrenimi (ML), yapay zekanın arkasındaki ana teknolojidir ve karmaşık görevleri gerçekleştirmesini sağlar. Bu çalışmada, finans araştırmalarında ML’nin nasıl kullanılabileceği ele alınmaktadır.

ML’nin finans alanında büyük bir potansiyele sahip olduğunu gösteren birçok genel makale bulunmaktadır. Varian (2014), ML’nin büyük verilerin ekonomik analizinde uygun bir araç olduğunu belirtirken, Mullainathan ve Spiess (2017) ML’nin ekonomik tahmin problemlerindeki ana kullanım alanlarını tanımlamaktadır. Athey ve Imbens (2019) ise ML’nin nedensellik gibi alanlardaki potansiyelini vurgulamaktadır.

Finans araştırmalarında ML kullanımı henüz başlangıç aşamasında olmasına rağmen, bu alandaki uygulamaların sayısı son birkaç yılda büyük bir artış göstermiştir. 2018’de ML ile ilgili yayınların sayısı, 2010-2017 yılları arasındaki yıllık ortalamanın üç katından fazlasına çıkmıştır. 2019’da bu artış beş katına, 2020’de yedi katına, 2021’de ise on bir katına ulaşmıştır. Ancak, finans alanında ML’nin nerede ve nasıl uygulanacağı hala belirsizdir.

Bu çalışmanın katkıları üç başlık altında toplanabilir. Birincisi, finansal ekonomistler için ML hakkında yüksek düzeyde bir başlangıç bilgisi sunmaktır. İkincisi, finans alanında mevcut ve gelecekteki ML uygulamaları için bir sınıflandırma oluşturmaktır. Üçüncüsü ise, ML uygulamalarının finans alanındaki gelecekteki potansiyelini incelemektir.

Geleneksel ekonometrinin amacı, ekonomik değişkenler arasındaki ilişkileri analiz ederek ekonomik fenomenlere nedensel açıklamalar getirmektir. ML ise, yüksek boyutlu verilerden benzersiz içgörüler elde etmeyi sağlar. Yüksek boyutlu veriler, çok sayıda değişken içerir ve ML bu tür verilerden ekonomik analizler için anlamlı bilgiler çıkarabilir.

ML, büyük veri kavramı ile güçlü bir şekilde ilişkilidir. Büyük veri, çok sayıda gözlem veya çok sayıda değişken içerebilir. ML, çok sayıda değişken içeren verilerle başa çıkabilir ve geleneksel yöntemlerden daha yüksek tahmin doğruluğu sağlar.

Finans literatürüne dayanarak, ML uygulamalarını üç ana kategoride sınıflandırıyoruz: (1) üstün ve yenilikçi ölçütlerin oluşturulması, (2) ekonomik tahmin problemlerinde tahmin hatasının azaltılması ve (3) mevcut ekonometri araç setinin genişletilmesi.

Örneğin, ML yöntemleri gayrimenkul varlık fiyatlandırmasında kullanıldığında, geleneksel yöntemlere göre daha doğru tahminler sağlayabilir. Almanya konut piyasasında, ML yöntemleri ile yapılan fiyat tahminleri, geleneksel yöntemlere göre gerçek fiyatlara daha yakın çıkmıştır

Makalenin son kısmında, 2010-2021 yılları arasında önemli finans dergilerinde yayınlanan makalelerin bibliyometrik analizi yapılmıştır. Spesifik olarak şu sorular ele alınmıştır: (1) ML, finans araştırmalarında ne kadar önemlidir? (2) ML’nin metodolojik amacı nedir (tahminin ötesinde)? (3) Bu bulgular finansın farklı alt alanlarında nasıl farklılık gösterir?

ML’nin finans araştırmalarında yeni bir yöntem olmasına rağmen, bilim camiasında geniş kabul gördüğünü bulduk. ML makalelerinin payı son yıllarda artmış ve 2021’de en iyi üç finans dergisindeki (The Journal of Finance, Journal of Financial Economics, The Review of Financial Studies) yayınların yaklaşık %3-4’ünü oluşturmuştur. Bu oran, daha düşük sıralamalı dergiler için de benzerdir. Analizimiz, finansın iki ana alanının (finansal piyasalar/varlık fiyatlandırma ve bankacılık/kurumsal finans) ML’nin potansiyelini temelde farklı şekillerde kullandığını ortaya koymaktadır. Finansal piyasalar/varlık fiyatlandırma alanındaki literatür genellikle ML’yi ekonomik tahmin problemlerine uygularken, bankacılık ve kurumsal finans alanlarındaki yayınlar çoğunlukla ML’yi üstün ve yenilikçi ölçütler oluşturmak için kullanmaktadır. En yüksek dereceli dergilerdeki yayınlar, ML’yi orantısız şekilde sık olarak üstün ve yenilikçi ölçütler oluşturmak için kullanmaktadır. Bu etki, özellikle bankacılık ve kurumsal finans alanlarında büyüktür. Sonuçlarımız, ML’nin finansal kurumlar ve kurumsal finansla ilgili konular için üstün ve yenilikçi ölçütler oluşturmak amacıyla geleneksel olmayan verilere uygulanmasında büyük bir potansiyel olduğunu göstermektedir.

Genel olarak, sonuçlarımız ML uygulamalarının finans alanında umut verici bir geleceğe sahip olduğunu göstermektedir. ML’nin geleneksel ekonometrik yöntemlere göre sağladığı birçok fayda, son birkaç yılda ML yayınlarındaki güçlü ve istikrarlı artış ve mesleğin en yüksek dereceli dergilerinde yayınlanan çalışmalar tarafından geniş çapta kullanılması, başka bir şey beklemek için çok az neden bırakmaktadır.

Makalemiz, finans alanında ML uygulamalarına odaklanan büyüyen bir literatürle ilgilidir. Örneğin, birkaç finans kitabı, ML tekniklerinin yakın zamanda ortaya çıktığı finansın belirli alanlarını (örneğin, varlık fiyatlandırması için Nagel, 2021; varlık yönetimi için De Prado, 2018) veya kantitatif finans alanında ML için matematiksel temelleri (örneğin, Dixon ve diğerleri, 2020) incelemektedir. Bu önemli katkıların amacı, ML tekniklerinin nasıl dikkatlice adapte edileceğini ve finansın belirli alt alanlarının özel özellikleriyle nasıl başa çıkılacağını göstermektir; özellikle finansal piyasalara odaklanmaktadır. ML’ye bakış açımız, bu önemli katkılardan açıkça farklıdır çünkü ilgimiz, finansal piyasalardaki tahmin problemlerinin ötesinde umut verici ML uygulamalarını tespit etmektedir. Ayrıca, finans alanında ML uygulamalarını inceleyen birkaç anket makaleye de katkıda bulunuyoruz. Bu çalışmalar, sınıflandırma teknikleri, kapsam ve odaklanma açısından bizimkinden farklıdır. Bir grup anket, tüm finans alt alanlarındaki ML uygulamalarını uygulama alanlarına (örneğin, risk tahmini veya finansal dolandırıcılık) sınıflandırmak için (çoğunlukla) otomatik teknikler, örneğin metin analizi (Aziz ve diğerleri, 2022) veya atıf tabanlı yaklaşımlar (Goodell ve diğerleri, 2021) kullanır. Diğer bir grup anket, finansın belirli alt alanlarındaki ML uygulamalarını, örneğin risk yönetimi (Aziz & Dowling, 2019) veya belirli ML yöntemlerinin uygulamalarını, örneğin derin öğrenme (Ozbayoglu ve diğerleri, 2020) manuel olarak inceler. Çalışmamız, literatürü finans alanında ML’nin metodolojik amacı (yani, ML’nin nasıl uygulandığı) temelinde sınıflandırmamız açısından bu çalışmalardan farklıdır. Bu biraz farklı bakış açısı -yeni taksonomimize dayalı olarak- finans alanında sıklıkla göz ardı edilen (ancak umut verici) bir grup ML uygulamasını ortaya çıkarmamızı sağlar: Mevcut anketlerin birçoğu (çoğunlukla) tahmin amaçlı ML’ye odaklanırken, biz ML uygulamalarının iki diğer türünün önem kazandığını gösteriyoruz: üstün ve yenilikçi ölçütlerin oluşturulması ve mevcut ekonometri araç setinin finans araştırmaları için genişletilmesi. Ayrıca, otomatik tekniklerin önemli bağlamı kaçırabileceği endişesiyle tüm bu ML makalelerini manuel olarak gözden geçiriyoruz. Ek olarak, bildiğimiz kadarıyla, mevcut incelemelerin hiçbiri, araştırma alanı ve metodolojik amaç temelinde yayın başarısına dayalı olarak finans alanında ML uygulamalarını bibliyometrik bir performans analizi ile incelememektedir.

Bu makalenin geri kalanı şu şekilde düzenlenmiştir: Bölüm 2, ML’ye yüksek düzeyde bir giriş yapar ve finansal bir probleme yönelik ML’nin örnek bir uygulamasını sunar. Bölüm 3’te, ML uygulamalarının üç ana arketipini sunuyor ve ilgili literatürü gözden geçiriyoruz. Bölüm 4, finans alanında ML uygulamaları için en umut verici gelecekteki yönleri özetliyor. Bölüm 5, makaleyi sonuçlandırıyor.

2. ML’nin Temelleri

Bu bölümde, ML’nin temellerini açıklayarak sonraki bölümler için zemin hazırlıyoruz. Odak noktamız, ML’nin farklı türlerinin işleyişi, hangi sorunlar için uygun olduğu ve finans literatüründe yaygın olarak kullanılan yöntemlerdir. Ayrıca ML ile geleneksel ekonometrik yöntemler arasındaki farklara da değiniyoruz.

Çoğu ampirik finans çalışması, ekonomik değişkenler arasındaki ilişkileri analiz etmeyi amaçlar. Örneğin, belirli faktörlerin sermaye yapısını nasıl etkilediği veya düzenleyici değişikliklerin ekonomik ajanların beklentilerini nasıl etkilediği gibi analizler yapılır. Geleneksel ekonometrik yöntemler, bu faktörlerin yönü ve gücü hakkında tahminler sağlar.

Buna karşılık, ML farklı amaçlara hizmet eder. ML, ekonomik değişkenler arasındaki ilişkiler hakkında doğrudan içgörüler sağlamak yerine, genellikle tahmin veya veri yapısını çıkarsama yöntemi olarak kullanılır. Tahmin yöntemleri, belirli gözlemlerden yola çıkarak yeni gözlemler için bağımlı değişken tahminleri çıkarır. Örneğin, gayrimenkul piyasasında gözlemlenen fiyatlar ve mülk özellikleri, gözlemlenmemiş mülklerin fiyatlarını tahmin etmek için kullanılabilir. İlk büyük ML türü olan denetimli öğrenme, bu tür tahminler yapmayı amaçlar (Bölüm 2.1’e bakın).

Veri yapısı çıkarsama yöntemleri, verilen verilerden yapısal bilgi elde eder. Tipik bir örnek, verilerdeki kümeleri belirleyerek farklı gözlemlerin birbirleriyle nasıl ilişkili olduğunu öğrenmektir. İkinci büyük ML türü olan denetimsiz öğrenme, bu tür yapısal bilgileri elde etmeyi amaçlar (Bölüm 2.2’ye bakın).

Tablo 1, geleneksel ekonometrik yöntemler ile denetimli ve denetimsiz öğrenmenin iki ana türü arasındaki farkları özetlemektedir. En önemlisi, bu üç yaklaşım farklı amaçlara hizmet eder. Geleneksel ekonometri, ekonomik ilişkileri çıkarmayı amaçlar ve bu nedenle “tanımlama problemlerini” çözer. Denetimli öğrenme tahminler sağlar ve esas olarak “tahmin problemlerini” çözmeyi amaçlar. Denetimsiz öğrenme, özel bir değişken olmaksızın verilen verilerden veri yapısını çıkarır ve “keşif problemlerini” çözer.

Üç yaklaşım ayrıca genel metodolojileri açısından da farklılık gösterir. Her yaklaşım veri kullanır. Geleneksel ekonometrikte, bağımlı bir değişken ve birden fazla bağımsız değişken bulunur. ML terminolojisinde, bu tür verilere “etiketli veri” denir, çünkü her gözlem için özel bir etiket vardır (regresyon terminolojisinde bağımlı değişken). Geleneksel ekonometrikte baskın yöntem, esnekliği ve yorumlanabilirliği nedeniyle lineer regresyondur. OLS tahmincisi ile yapılan lineer regresyon, regresyon çizgisi ve t-değerleri ve p-değerleri gibi istatistiksel anlamlılık ölçütleri sağlar. Bu sonuçlar, ekonomik değişkenler arasındaki nedensel ilişkileri gösterebilir.

Denetimli öğrenme de etiketli verilere dayanır. Özel etiket, tahmin edilmesi gereken hedef değişkeni temsil eder. Verilen veriye bir denetimli ML yöntemi uygulamak, bir tahmin modeli ve beklenen tahmin performansı tahminleri sağlar. Tahmin modeli, daha önce gözlemlenmemiş örneklerin özelliklerine dayanarak hedef değişkenin değerini tahmin etmek için kullanılabilir.

Denetimsiz öğrenme, denetimli öğrenme ile arasındaki belirleyici fark olan etiketsiz verilere dayanır. Etiketsiz veri, hiçbir etiketin (yani regresyon terminolojisinde bağımlı değişkenin) olmaması anlamına gelir; tüm değişkenler “eşit” kabul edilir. Verilen veriye bir denetimsiz ML yöntemi uygulamak, bir veri yapısı modeli ve veri yapısı özellikleri sağlar. Bu sonuçlar, veriden yapısal bilgi çıkarmak için kullanılabilir.

Sonraki bölümlerde, ML’nin iki ana kategorisini—denetimli ve denetimsiz öğrenme—daha ayrıntılı olarak açıklayacağız ve her kategori için ilgili yöntemlerin bir özetini sunacağız. Ardından, ML’nin ev finansmanı alanındaki tipik bir probleme, gayrimenkul fiyatlarının tahmini, bir örnek uygulamasını sağlayacağız. Son olarak, ML’nin sınırlamalarını, dikkat edilmesi gereken noktaları ve dezavantajlarını tartışacağız.

2.1 Denetimli Öğrenme

Denetimli öğrenme, yüksek tahmin performansı ile örnek dışı tahminler yapmayı amaçlar. Daha önce görülmemiş gözlemler üzerindeki beklenen tahmin performansını doğru bir şekilde değerlendirmek için, verilen veri eğitim ve test verisi olarak bölünür. Daha sonra, eğitim verisine bir denetimli ML yöntemi uygulanarak bir tahmin modeli oluşturulur. Son olarak, tahmin modelinin test verisine uygulanması, beklenen örnek dışı tahmin performansının bir tahminini sağlar.

Bir tahmin modeli oluşturmak için, farklı karmaşıklık seviyelerinde çeşitli denetimli ML yöntemleri geliştirilmiştir. Genel olarak, daha karmaşık yöntemler daha yüksek tahmin performansı sağlar ancak yorumlanabilirliği azaltır. Şekil 2, tipik tahmin performansı ve yorumlanabilirliğe göre düzenlenmiş yaygın denetimli ML yöntemlerinin bir özetini sunar.

**En basit yöntem, OLS tahmincisi ile lineer regresyondur. OLS mükemmel yorumlanabilirlik sağlar. Ancak, örnek dışı tahmin performansı genellikle zayıftır. Lineer OLS modelinin tahmin performansını artırmanın bir yolu, model tanımına orijinal tahmin değişkenlerinin doğrusal olmayan dönüşümlerini ve etkileşimlerini eklemektir. Ancak, hangi doğrusal olmayanlıkların ve etkileşimlerin gerçekten önemli olduğu önceden belirli değildir. Tüm olası kombinasyonların dahil edilmesi genellikle zordur çünkü bu, gözlem sayısını hızla aşabilecek aşırı sayıda değişkenle sonuçlanır. Sonuçtaki veri setlerinin büyüklüğü genellikle hesaplama sorunlarına da yol açar.

OLS’nin (belirli koşullar altında) en iyi doğrusal yansız tahminci (BLUE) olması nedeniyle, tahmin performansını artırmanın bir yolu yanlılığa izin vermektir. Açıklama problemlerinin aksine, tahmin problemleri en yüksek tahmin performansını elde etmeyi amaçlar; bu nedenle, değişken katsayılarının yansızlığına ihtiyaç duymazlar. Düzenlenmiş lineer yöntemler, OLS’nin tahmin performansını artırmak için sistematik olarak yanlılık ekleme imkanı sunar (Hastie ve diğerleri, 2009, s. 61-79). Daha spesifik olarak, düzenleme, bu tür yöntemlerin tahmin değişkenlerinin katsayılarını küçültmesi anlamına gelir. Düzenlenmiş lineer regresyon için en yaygın yöntem en küçük mutlak küçültme ve seçim operatörü (LASSO) ‘dur. LASSO, büyük bilgi içeriği olmayan değişken katsayılarını cezalandırmak için optimizasyon fonksiyonuna bir ceza terimi ekleyerek yanlılığı tanıtır. Ceza teriminin özel işlevsel formu, alakasız katsayıları sıfıra indirir. Bu nedenle, LASSO saf tahmine ek olarak değişken seçimi için de sıklıkla kullanılır ve nispeten iyi yorumlanabilirlik sağlar.

LASSO’ya ek olarak, ceza teriminin işlevsel formu açısından farklılık gösteren diğer düzenlenmiş lineer yöntemler de vardır. Ridge regresyonu, katsayıları tam olarak sıfıra indirmeyen bir ceza terimi kullanır ve bu nedenle daha az yorumlanabilir. Ancak, ridge regresyonu genellikle LASSO’ya kıyasla daha üstün tahmin performansı sağlar. Elastic net regresyonu, iki yöntemi birleştirir (Zou ve Hastie, 2005). Ceza terimi, LASSO ve ridge regresyonunun ceza terimlerinin doğrusal bir kombinasyonudur ve bunların sırasıyla güçlerini içerir.

Tartışılan lineer yöntemlerin aksine, daha karmaşık ML yöntemleri, ilgili doğrusal olmayanlıkları ve etkileşim etkilerini otomatik olarak dikkate alır. Sayısal veriler için, ağaç tabanlı ML yöntemleri yaygındır (Hastie ve diğerleri, 2009, s. 305-334). En basit ağaç tabanlı yöntem, aynı zamanda diğer tüm ağaç tabanlı yöntemlerin yapı taşı olan karar ağacıdır. Şekil 3’ün Panel A’sı, ev fiyat tahmini için eğitilmiş basitleştirilmiş bir karar ağacını göstermektedir. Belirli bir tahmin değişkeninin değerine bağlı olarak ağacın dallandığı düğümlerden oluşur. Karar ağaçları genellikle birden fazla düğüm katmanı içerir, bu nedenle birden fazla değişken arasındaki etkileşimleri dolaylı olarak dikkate alırlar. Ağaç bir yaprak düğümüne ulaştığında, yani daha fazla dallanmanın olmadığı bir düğüm, ağaç bir tahmin değeri döndürür. İlgili tahmin değişkenleri ve eşiklerin dallanmalarda doğrudan gözlemlenebilir olduğu düşünüldüğünde, karar ağaçları nispeten yüksek yorumlanabilirlik ile karakterize edilir.

 

Rassal ormanlar (random forests) birden çok karar ağacını birleştirir (Breiman, 2001). Daha spesifik olarak, rassal orman yöntemi verilen verilerden bootstrap örneklerini tekrar tekrar çeker ve her bir örnekten ayrı bir karar ağacı oluşturur. Rassal ormanın tahmini, farklı ağaçların ortalama tahmin değeridir. Rassal ormanlar, tek karar ağaçlarına göre çok daha yüksek tahmin performansı sağlar ancak doğası gereği daha az yorumlanabilirler.

Geliştirilmiş regresyon ağaçları (boosted regression trees) ise, rassal ormanların kavramını genişleterek tahmin performanslarını daha da artırır (Hastie ve diğerleri, 2009, s. 353–358). Birçok bağımsız karar ağacını birleştirmek yerine, geliştirilen regresyon ağaçları, ağaçları iteratif olarak inşa eder ve önceki ağaçların iyi tahmin edemediği gözlemleri dikkate alır. Geliştirilmiş regresyon ağaçları, genellikle rassal ormanlardan daha üstün performans gösterir ve veri bilimi yarışmalarında genellikle kazanan algoritmalar arasında yer alır, bu da tahmin performanslarının güncel seviyesini vurgular.

Ağaç tabanlı ML yöntemleri ve özellikle geliştirilen regresyon ağaçları sayısal verilerle güncel tahmin performansı sağlarken, sinir ağları genellikle metin, görüntü veya video gibi geleneksel olmayan verilerde üstün performans gösterir. Şekil 3’ün Panel B’si küçük bir sinir ağını gösterir. Bir sinir ağı iki bileşenden oluşur: nöronlar (katmanlar halinde düzenlenmiş) ve nöronlar arasındaki bağlantılar (Hastie ve diğerleri, 2009, s. 389–415). Bağlantılar, verilerin nöronlar arasındaki akışını açıklar. İlk olarak, bir sinir ağının giriş katmanı tahmin değişkenlerini alır, örneğin, piksel düzeyinde görüntü verisi. Ardından, gizli katmanlar verileri iteratif olarak işler ve çıkış katmanına iletir, bu da nihai tahmin değerini döndürür. En temel versiyonunda, bir nöron önce önceki katmanın nöronlarından gelen verilerin ağırlıklı bir toplamını hesaplar (ağırlıklar eğitim süreci sırasında endojen olarak belirlenir). Daha sonra, bu ağırlıklı toplama doğrusal olmayan bir fonksiyon (örneğin, lojistik fonksiyon) uygular. Son olarak, nöron, bu hesaplamanın sonucunu bağlı olduğu bir sonraki katmanın tüm nöronlarına gönderir. Katman sayısı, her katmandaki nöron sayısı, nöronlar arasındaki bağlantılar ve doğrusal olmayan fonksiyonların işlevsel formları, sinir ağı tasarımcısı tarafından (eksojen olarak) belirlenir ve verilen probleme bağlıdır. Gerçek uygulamalarda kullanılan sinir ağları, birçok gizli katman ve binlerce nöron ve bağlantı ile çok büyük olabilir. Ayrıca, tamamen bağlı olmak zorunda değildirler, bu nedenle bir katmandaki her nöronun bir sonraki katmandaki her nörona çıktısını iletmesi gerekmez. Sinir ağları oluşturmak için çeşitli mimariler önerilmiştir. En basit mimarilerden biri, ileri beslemeli ağdır (feed-forward network): nöronlar en temel varyantlarıyla gelir ve geribildirim bağlantıları olmadığı için veriler sadece soldan sağa akar.6 Yüksek karmaşıklıkları nedeniyle, sinir ağlarının yorumlanması doğası gereği zordur. Genel olarak, gizli katmanlardan çok az bilgi çıkarılabilir, bu da bir sinir ağının öğrenilmiş bilgisini temsil eder. Sinir ağlarının yorumlanabilirliğini artırmak, bilgisayar bilimlerinde devam eden bir araştırma konusudur.

Tartışılan yöntemlerin yanı sıra, genellikle daha kötü tahmin performansı ve/veya daha düşük yorumlanabilirlik sağlayan daha eski ML yöntemleri de vardır, örneğin, gözlemleri kategorilere sınıflandırmak için Bayes teoremini kullanan naif Bayes yöntemi (Rish, 2001) veya destek vektör makineleri (SVM) yöntemleri (Hastie ve diğerleri, 2009, s. 417–455). Bu yöntemler hakkında daha fazla bilgi için ilgili literatüre bakmanızı öneririz.

2.2 Denetimsiz Öğrenme

Denetimsiz öğrenmenin amacı, veri yapısını çıkarsamaktır. Veri yapısı birçok farklı bilgi türünü içerdiğinden, denetimsiz öğrenme yöntemlerini farklı alt kategorilere ayırıyoruz. Denetimsiz öğrenmede en yaygın iki alt kategori kümeleme ve boyut indirgemedir.

Kümeleme, gözlemleri grup içi benzerliğin yüksek ve grup arası benzerliğin düşük olduğu şekilde gruplandırır. Çeşitli kümeleme yöntemleri önerilmiştir. İlk olarak, merkez-tabanlı yöntemler gözlemleri birden çok merkezi nokta (merkezler) etrafında düzenleyerek kümeler oluşturur. Merkezlerin başlangıç konumlandırılmasının ardından, konumlarının iteratif güncellenmesi giderek daha uygun kümeler sağlar. Çok erken bir döneme ait ancak hala yoğun olarak kullanılan merkez-tabanlı bir yöntemin yaygın bir örneği K-means’tir (MacQueen, 1967). İkinci olarak, yoğunluk-tabanlı yöntemler, gözlem alanındaki farklı yoğunluklara bağlı olarak kümeler oluşturur. Başka bir deyişle, yakınlarında çok sayıda benzer gözlem olan gözlemleri kümelendirirler. Yoğunluk-tabanlı kümeleme yönteminin bir örneği, aynı zamanda en yaygın kullanılan kümeleme yöntemlerinden biri olan DBSCAN’dir (Ester ve diğerleri, 1996). Üçüncü olarak, dağılım-tabanlı yöntemler, gözlemleri aynı istatistiksel dağılıma ait olup olmadıklarına göre kümelere atar. Bu nedenle, bu yöntemler, altta yatan veri sürecinin dağılımının önceden bilinmesini gerektirir. Normal dağılımlı veriler için, Gaussian karışım modelleri yaygındır (Rasmussen, 1999). Son olarak, hiyerarşik yöntemler, verilerdeki hiyerarşik ilişkiyi dikkate alarak kümeler oluşturur. İlk olarak, her kümenin tek bir gözlemden oluştuğu başlangıç kümeleriyle başlarlar. Daha sonra, daha küçük kümeleri iteratif olarak daha büyük kümelerle birleştirerek bir hiyerarşi oluştururlar. Hiyerarşik kümeleme için yaygın bir yöntem BIRCH’tir (Zhang ve diğerleri, 1996).

Boyut indirgeme, verilen verilerin boyutunu azaltarak bilgi yoğunluğunu artırmayı amaçlar. Boyut indirgeme için çeşitli yöntemler vardır, ancak burada sadece en yaygın iki yöntemi ele alacağız. İlk olarak, temel bileşen analizi (PCA) tabanlı yöntemler, verilerin varyansının mümkün olduğu kadar çoğunu kapsayan orijinal değişkenlerin doğrusal kombinasyonlarını (‘temel bileşenler’) çıkarır. PCA’nın temel varyantı doğası gereği doğrusal olsa da, doğrusal olmayan genellemeler de mevcuttur. Farklı PCA tabanlı yöntemler hakkında daha fazla bilgi için, örneğin, Hastie ve diğerleri (2009, s. 534-552) bakabilirsiniz. İkinci olarak, sinir ağları tabanlı yöntemler, özel mimarilerle boyut indirir. Yaygın olarak kullanılan bir yöntem, otomatik kodlayıcı sinir ağıdır (Goodfellow ve diğerleri, 2016, s. 499-523). Bir otomatik kodlayıcı, giriş verilerinin yoğunlaştırılmış bir temsilini oluşturan bir kodlayıcı ağ ve yoğunlaştırılmış temsilden orijinal verileri yeniden oluşturan bir kod çözücü ağdan oluşur. Kodlayıcı ve kod çözücü ağları verilen veriler üzerinde eğitmek için özel bir darboğaz katmanı kullanılır. Otomatik kodlayıcı, orijinal verileri iyi bir şekilde yeniden oluşturabiliyorsa, darboğaz katmanındaki yoğunlaştırılmış veri temsili, verilerin çoğunu boyutunu azaltırken başarılı bir şekilde korumuş demektir.

Kümeleme ve boyut indirgeme dışında, denetimsiz öğrenme için daha az sıklıkla kullanılan ancak finans uygulamaları için önemli olabilecek başka alt kategoriler de vardır. Birliktelik kuralı madenciliği, değişkenler arasındaki ilişkileri belirlemeye çalışır (Agrawal ve diğerleri, 1993). Örneğin, müşteri satın alma verilerinden hangi ürünlerin birlikte satın alındığını öğrenebilir. Aykırı değer tespiti, kalan verilerden önemli ölçüde farklı olan gözlemleri bulmaya çalışır. Aykırı değer tespiti için birçok geleneksel yöntem mevcut olsa da, ML tabanlı yöntemler özellikle yüksek boyutlu ortamlarda üstün performans sağlar (Domingues ve diğerleri, 2018). Sentetik veri üretimi yöntemleri, belirli gereksinimleri karşılayan yeni veriler üretmeye çalışır. Örneğin, generatif adversarial ağlar (GAN), verilen eğitim verilerine çok benzeyen yeni, sentetik veriler oluşturmak için sinir ağlarını kullanır (Goodfellow ve diğerleri, 2020). Bu ağların mimarisi, mevcut görüntülere benzer yapay görüntüler oluşturmak gibi geleneksel olmayan veriler için özellikle kullanışlıdır.

2.3 Uygulama: Gayrimenkul Fiyat Tahmini

ML yöntemleri ile daha geleneksel yaklaşımlar arasındaki farkları göstermek için şimdi ML’yi gayrimenkul fiyat tahmini sorununa uyguluyoruz. Gayrimenkul fiyatlarının tahmini, finansal sorunları çözmede ML’nin faydalarını göstermek için özellikle iyi bir örnektir. Üç ana nedeni vardır:

  1. Gayrimenkul, ekonominin en önemli varlık sınıflarından biridir. ABD’de, toplam gayrimenkul varlıklarının değeri, hisse senedi ve sabit getirili piyasaların toplam büyüklüğüne yakındır. Çoğu hane için gayrimenkul, en büyük servet kaynağıdır. 2007/2008 Küresel Finansal Krizi, gayrimenkul sektöründen kaynaklanan yayılma etkilerinin ekonomileri nasıl istikrarsızlaştırabileceğini göstermiştir. Bu nedenle, gayrimenkul fiyatlandırma alanındaki tahmin hatalarının azaltılması, ekonomik açıdan büyük önem taşımaktadır.
  2. Gayrimenkul varlıkları yüksek düzeyde heterojenlik gösterir (her mülk benzersizdir), bu da gayrimenkul fiyatlandırmayı zorlaştırır.
  3. Mülk özellikleri değişkenlerinin yüksek sayısı ile potansiyel olarak ilgili doğrusal olmayanlıklar ve etkileşim etkileri, gayrimenkul fiyatlandırmayı doğası gereği yüksek boyutlu bir sorun haline getirir ve ML, geleneksel yöntemlere kıyasla benzersiz faydalar sağlar.

Bireysel mülkler için fiyat tahminleri elde etmek için geleneksel yaklaşım, hedonik fiyatlandırmadır. Hedonik fiyatlandırma, mülk özelliklerini gözlemlenen mülk fiyatlarına OLS kullanarak regrese eder ve doğrusal bir fiyatlandırma modeli elde eder. Bu model, yeni, daha önce gözlemlenmemiş mülkler için fiyat tahminleri üretebilir. Ayrıca, regresyon katsayılarını özelliklerin gölge fiyatları olarak yorumlamak mümkündür. Ancak, hedonik fiyatlandırma doğası gereği doğrusal bir modele dayanır ve bu nedenle doğrusal olmayanlıkları ve etkileşim etkilerini doğrudan dikkate almaz. Örneğin, arsa büyüklüğü ve konum arasındaki etkileşimlerin önemli olduğunu varsayabiliriz: şehir merkezindeki bir mülk için arsa büyüklüğünde ek bir m², bir banliyödekinden daha değerli olabilir. Bu tür spesifik etkileri doğrusal modele manuel olarak ekleyebilsek de, birçok bilinmeyen doğrusal olmayan ve etkileşim etkisi olabilir. Bu etkileri görmezden gelerek, hedonik fiyatlandırmanın doğrusal modeli, verilerdeki önemli bilgileri potansiyel olarak kullanılamaz hale getirir. ML yöntemleri ise, doğrusal olmayanlıkları ve etkileşimleri otomatik olarak dikkate alır. Bu nedenle, denetimli ML, hedonik fiyatlandırmanın doğrusal modelinden daha düşük fiyatlandırma hatası gösteren fiyat tahminleri üretebilir.

Aşağıda, ML’nin bireysel gayrimenkul varlıkları için üstün fiyat tahminleri sağlayıp sağlayamayacağını ve nasıl sağladığını inceleyeceğiz.

Ocak 2000 ile Eylül 2020 arasında Almanya’da beş büyük gayrimenkul online platformundan ve büyük gazetelerden elde edilen dört milyondan fazla konut gayrimenkul ilanını içeren kapsamlı bir koleksiyondan yararlanıyoruz. Veri seti, teklif fiyatlarını ve tüm ilgili bireysel mülk özelliklerini (kat alanı, oda sayısı, inşaat yılı, konum, arsa büyüklüğü, vb.) içermektedir. Bu verileri, bireysel mülk fiyatlarının tahmini için farklı ML modellerini eğitmek ve bu modelleri hedonik fiyatlandırmadan elde edilen doğrusal OLS modeliyle karşılaştırmak için kullanıyoruz. Şekil 4’ün Panel A’sı analizimizin ana sonucunu göstermektedir. ML yöntemleri, OLS temel çizgisine kıyasla fiyat tahminlerinin doğruluğunu büyük ölçüde artırır. En iyi performans gösteren ML yöntemimiz, geliştirilmiş regresyon ağaçları, örnek dışı R2’yi %77’ye çıkararak OLS’nin %40’ına kıyasla neredeyse iki katına çıkarır; bu da açıklanan fiyat varyasyon miktarını neredeyse iki katına çıkarır. Ortalama olarak, geliştirilmiş regresyon ağaçlarının tahminleri, OLS’nin %44’üne kıyasla gerçek fiyatlardan yaklaşık %27 sapmaktadır. Parasal terimlerle, geliştirilmiş regresyon ağaçlarının üstün tahmin performansı, OLS’nin 176.000 EUR’suna kıyasla yaklaşık 94.000 EUR’luk ortalama fiyatlandırma hatasına karşılık gelmektedir. Örneklemimizdeki ortalama mülk fiyatı 393.000 EUR olduğundan, ML’nin fiyatlandırma doğruluğundaki iyileştirmeler sadece istatistiksel olarak anlamlı değil, aynı zamanda ekonomik olarak da büyüktür.

2.3 Uygulama: Gayrimenkul Fiyat Tahmini

ML’nin fiyatlandırma doğruluğundaki iyileştirmeleri ortalamada etkileyici olsa da, bu faydalar fiyat aralığının üst ucunda daha da belirgin hale gelir. Şekil 4’ün Panel B’si, en iyi performans gösteren ML yöntemi olan geliştirilmiş regresyon ağaçlarının, OLS’ye kıyasla beş mülk fiyatı dilimindeki tahmin performansını göstermektedir. Geliştirilmiş regresyon ağaçları, tüm dilimlerde OLS’den daha iyi performans gösterir. OLS, fiyat aralığının uç noktalarında en kötü performansı sergilerken, ML, en pahalı mülkler için fiyatlandırma hatasını azaltmada özellikle faydalıdır. En yüksek fiyat diliminde, geliştirilmiş regresyon ağaçları ortalama fiyatlandırma hatasını %24’e düşürürken, OLS için bu oran %50’dir. Parasal olarak, geliştirilmiş regresyon ağaçlarının üstün tahmin performansı, en yüksek fiyat diliminde ortalama fiyatlandırma hatasında 240.000 EUR’dan fazla bir azalmaya karşılık gelir. En üst dilimdeki ortalama mülk fiyatının yaklaşık 884.000 EUR olduğu göz önüne alındığında, ML’nin fiyatlandırma gücündeki iyileştirmeler dramatiktir. Sonuçlarımız, gayrimenkul fiyatlandırmasında doğrusal olmayanlıkların ve etkileşim etkilerinin önemli olduğunu ve özellikle en pahalı mülkler için önemli olduğunu göstermektedir.

Sonuçlarımız, ekonomik tahmin problemlerinde ML kullanmanın faydalarını göstermektedir. ML, gayrimenkul fiyat tahmini sorununu ele alırken, OLS ile geleneksel lineer regresyona kıyasla tahmin hatasında istatistiksel ve ekonomik olarak anlamlı bir azalma sağlayabilir. ML’nin ortalama olarak zaten büyük olan faydaları, belirli fiyat aralıklarındaki varlıklar için daha da artar. Dolayısıyla, ML yöntemleri genel olarak tahmin doğruluğunu artırmakla kalmaz, aynı zamanda geleneksel yaklaşımların zorlandığı gözlemler için de özellikle faydalıdır.

2.4 ML’nin Sınırlamaları, Uyarılar ve Dezavantajları

ML’nin gayrimenkul varlık fiyatlandırmasına yönelik örnek uygulamasının sonuçları, yüksek boyutlu verilerle ilgili sorunlar için geleneksel yöntemlere göre ML’nin faydalarını gösterse de, ML kullanımının bazı sınırlamaları, uyarıları ve dezavantajları da vardır. Aşağıda, bu önemli üç yönü ayrıntılı olarak tartışacağız.

İlk olarak, ML yöntemleri genellikle düşük yorumlanabilirlik sergiler. ML modelleri düşük tahmin hatası ile tahminler üretebilirken, algoritmanın sonuçlarını nasıl ürettiği genellikle doğrudan gözlemlenemez. Bu nedenle, ML, tahmin hedefinin ekonomik belirleyicilerinin derinlemesine anlaşılmasını gerektiren problemler için genellikle uygun değildir. Bununla birlikte, hızla ilerleyen yorumlanabilir ML alanı, model yorumlanabilirliği sorununa çeşitli yaklaşımlarla çözümler sunmaya çalışmaktadır (örneğin, mevcut yöntemlerin bir özeti için bkz. Burkart & Huber, 2021).

İkinci olarak, ML genellikle büyük veri setleri gerektirir. Veri setleri iki boyutta büyük olabilir: ilgili değişkenlerin sayısı ve gözlem sayısı. ML, ilgili değişkenlerin sayısının gözlem sayısına göre büyük olduğu durumlarda geleneksel yöntemlere göre tahmin görevlerinde fayda sağlar. Aynı zamanda, ML genellikle yalnızca bir ML modelinin eğitilebileceği yüksek sayıda gözlem varsa iyi tahmin performansı sağlar. Ne yazık ki, birçok finans araştırma sorusu için büyük ölçekli veriler her zaman mevcut değildir. Bazı durumlarda, büyük miktarda karşılaştırılabilir veri ile önceden eğitilmiş ML modellerinin kullanılması bu sorunu çözebilir. Metin analizi veya yüz tanıma gibi birçok yaygın ML görevi için önceden eğitilmiş modeller mevcuttur, bu nedenle araştırmacılar, mevcut veri miktarından bağımsız olarak doğrudan ele alınacak soruna uygulayabilirler. Ayrıca, hayatın her alanında artan veri toplama eğilimi, veri sorununu giderek hafifletmelidir.

Son olarak, ML kullanımı genellikle yüksek hesaplama maliyetlerine sahiptir. Lineer regresyon gibi geleneksel yöntemlere kıyasla, ML modellerinin eğitilmesi önemli ölçüde daha fazla zaman ve hesaplama gücü gerektirir. Sorun genellikle daha sofistike ML yöntemleriyle daha da kötüleşir. Özellikle, karmaşık mimarilere sahip sinir ağları genellikle en yüksek hesaplama maliyetlerine sahiptir. Sonuç olarak, bu sorunla başa çıkmak için genellikle bulut bilişim hizmetlerinin kullanılması gerekli hale gelir.

3. FİNANSTA ML UYGULAMALARININ TAKSONOMİSİ

ML’nin en azından bir kısmını kullanan finans makalelerinin sayısı artmaktadır. Ancak, birçok araştırmacı finans alanında ML’nin nasıl ve nerede uygulanacağını hala bilmemektedir. Bu bölümde, mevcut ML uygulamalarının taksonomisini sunuyoruz. Bu taksonomi, finans araştırmalarında ML’nin nerede değer katabileceğini göstermekte, mevcut ML uygulamalarının sistematik bir özetini sunmakta, yeni katkıların mevcut literatürle nasıl ilişkili olduğunu anlamaya yardımcı olmakta ve araştırmacılara olası uygulamaları keşfetmelerinde rehberlik etmektedir.

Yukarıda açıklandığı gibi, ML geleneksel ekonometrik yöntemlere kıyasla farklı sorunları çözer. Finans araştırmalarının temel modeli olan OLS ile lineer regresyonun ana amacı, ekonomik değişkenler arasındaki nedensel ilişkileri belirlemektir. Buna karşılık, ML, tahmin hatasını minimize eden veya verilen verilerden yapısal bilgi çıkaran tahminler sağlar.

Finans literatüründeki ML çalışmalarını incelemek için, önce finans alanındaki büyük dergilerde, NBER çalışma kağıdı serilerinde ve SSRN ön baskı deposundaki Finansal Ekonomi Ağı’nda ML ile ilgili makaleleri belirledik; ardından ML yöntem adları ve varyasyonları (örneğin, LASSO, rassal ormanlar vb.) aradık. Bu makaleleri inceledik ve ML araştırma stratejilerini üç farklı arketipe ayırdık:

  1. Üstün ve yenilikçi ölçütlerin oluşturulması
  2. Ekonomik tahmin problemlerinde tahmin hatasının azaltılması
  3. Mevcut ekonometrik araç setinin genişletilmesi

Birinci arketip, bağımsız değişkenlerden biri için üstün veya yenilikçi bir ölçüt oluşturmak için ML’yi kullanır. Bu makalelerin ana analizleri hala büyük ölçüde OLS ile tahmin edilen geleneksel (doğrusal) bir modele dayanır. İkinci arketip, ekonomik tahmin problemlerinde tahmin hatasını azaltmak için ML’yi kullanır. Denetimli ML yöntemleri, tahmin modelinde esnek fonksiyonel formlar kullanarak üstün tahmin performansı elde eder. Üçüncü arketip, mevcut ekonometrik araç setini genişletmek için ML’yi kullanır. ML yöntemleri ya yeni ekonometrik yöntemler olarak hizmet eder ya da geleneksel bir ekonometrik yöntemin bir bölümünü optimize eder. Aşağıdaki alt bölümlerde, finans alanında ML uygulamalarının her üç arketipiyle ilgili literatürü ayrıntılı olarak inceleyeceğiz.

3.1 Üstün ve Yenilikçi Ölçütlerin Oluşturulması

Finansta ML uygulamalarının ilk arketipi, üstün ve yenilikçi ölçütlerin oluşturulmasıdır. Bu arketipin çalışmaları, yüksek boyutlu, geleneksel olmayan verilerden (metin, görüntü veya video gibi) bilgi çıkarmak ve bir ekonomik değişkenin sayısal bir ölçütünü oluşturmak için ML’yi kullanır. Metinsel veriler için geleneksel yaklaşımlar, alan spesifik sözlüklere dayalı kelime sayımlarını kullanır. Görüntü ve video verileri için, uzun süre yalnızca insan değerlendirmeleri mevcuttu. ML tabanlı yaklaşımlar, geleneksel olmayan verilerdeki bilgilere daha kolay ve aynı zamanda daha güçlü erişim sağlar. Tüm ML yöntem türleri uygulanabilir: denetimli öğrenmeden tahminler, denetimsiz öğrenmeden veri yapısı bilgileri ve diğer ML türlerinden sonuçlar ekonomik değişkenlerin ölçütlerini oluşturmak için kullanılabilir.

Üstün veya yenilikçi ölçüt, nihai olarak bir ekonomik ilişkinin ana analizinde bağımsız bir değişken olarak hizmet eder. Üstün ölçütler (yani, mevcut ölçütlerden daha düşük ölçüm hatası ile) kullanmak, ekonomik ilişkiyi tanımlayan parametrelerin daha doğru tahmin edilmesine yol açan zayıflama yanlılığını azaltır. Yenilikçi ölçütler, daha önce ölçülemeyen ekonomik yönlerle yeni analizlerin yapılmasını sağlar. Ana analizde, ML tabanlı ölçütler oluşturan çoğu çalışma, OLS ile lineer regresyon gibi geleneksel ekonometrik yöntemleri uygular.

Tablo 2, üstün veya yenilikçi ölçütler oluşturmak için ML kullanan çalışmaların bir seçimini sunar. Aşağıda, bu çalışmaları üç kategoride sunuyoruz: (1) duygu ölçütleri, (2) şirket yöneticilerinin özelliklerinin ölçütleri ve (3) firma özelliklerinin ölçütleri.

Category Subcategory Measures
Measures of Sentiment Stocks  

  • Investor sentiment in social media
  • Sentiment in news
  • Sentiment in analyst reports
  • Sentiment in annual reports

 

Sovereign Debt  

  • Sentiment in news

 

Products  

  • Consumer sentiment in social media
  • Expert sentiment in product-technology articles

 

Measures of Corporate Executives’ Characteristics Personality Traits  

  • Big Five scores
  • Risk tolerance

 

Beliefs  

  • Confidence in expressing opinions

 

Emotions  

  • Facial emotions (e.g., happiness, sadness, anger, fear, disgust)
  • Verbal emotions (e.g., positive, negative, warmth, ability)
  • Vocal emotions (e.g., valence, arousal, happiness, sadness)

 

Actions and Working Patterns  

  • Answer avoidance in conference calls
  • Working style (high- vs. low-level activities)
  • Communication style

 

Quality  

  • Expected shareholder support

 

Looks  

  • (Facial) Attractiveness
  • (Facial) Trustworthiness
  • (Facial) Dominance
  • (Facial) Masculinity

 

Measures of Firm Characteristics Financial Characteristics and Risk Exposures  

  • Financial constraints
  • Risk exposures (e.g., COVID-19, cybersecurity)

 

Corporate Culture  

  • Cultural values (e.g., innovation, integrity, teamwork)
  • Gender culture
  • Board responsibilities

 

Connectedness  

  • Political connectedness
  • Venture capital communities
  • Mutual fund voting behaviour

 

3.1.1 Duygu Ölçütleri

Duygu ölçütleri, genellikle olumlu-olumsuz bir ölçek üzerinde insanların inançlarını tanımlar. Bu alt kategorideki çoğu çalışma, metin verilerinden duygu ölçütleri oluşturur. Metin verilerinden tek boyutlu (olumlu-olumsuz) duygu ölçütü oluşturmanın çeşitli yaklaşımları vardır. Loughran ve McDonald (2011), finansal metinlerden duygu çıkarımı yapmak için bir sözlük yaklaşımı sunar. Daha spesifik olarak, finansal metinlerdeki olumsuz kelimeleri sayarlar. Ancak sözlük yaklaşımları, cümle içindeki kelimelerin bağlamını kaçırır (Loughran & McDonald, 2016). Buna karşılık, esnek ML tabanlı yaklaşımlar, sadece cümle içindeki kelimelerin bağlamını değil, aynı zamanda farklı cümlelerin birbirleriyle nasıl ilişkili olduğunu da dikkate alabilir. Geleneksel ekonometrik ve ML tabanlı yaklaşımlarla duygu üzerine geniş bir inceleme için Algaba ve diğerleri (2020) çalışmasına bakınız.

Duygular birçok konu için mevcut olup birçok kaynaktan türetilir. Finansal alanda, ilgimiz genellikle borsalar gibi piyasaların toplu duygularıdır; bu, ML tabanlı duygu ölçütlerinin en yaygın hedefidir. İlgili çalışmaların çoğu, duygu ölçütlerini kullanarak hisse senetlerinin gelecekteki getirileri ve çeşitli finansal raporlama rakamları üzerindeki etkilerini inceler.

Birçok çalışma, sosyal medyadan yatırımcı duygu ölçütleri oluşturur. Antweiler ve Frank (2004), Yahoo Finance mesaj panosundaki kullanıcı gönderilerini pozitif veya negatif olarak sınıflandırmak için ML yöntemleri olan naif Bayes ve SVM’yi kullanır. Daha sonra, sınıflandırmalarını toplu hale getirerek borsa duygu ölçütü oluştururlar. Renault (2017), benzer şekilde StockTwits’teki kullanıcı gönderilerini sınıflandırarak yatırımcı duygu ölçütü oluşturur. Vamossy (2021) de StockTwits’e dayanır ancak derin öğrenmeye dayalı metin analizi ile kullanıcı gönderilerinden farklı duygusal durumları çıkararak yatırımcı duygularını ölçer. Sprenger ve diğerleri (2014), Bartov ve diğerleri (2018), Giannini ve diğerleri (2018) ve Gu ve Kurov (2020) çalışmalarında Twitter’daki kullanıcı gönderilerinden yatırımcı duygu ölçütleri türetirler. Liew ve Wang (2016) da Twitter’dan duygu bilgilerini çıkarmak için ML uygular ancak pre-IPO duygusu için.

Sosyal medyanın yanı sıra, haber makaleleri de hisse senetleri için bir duygu kaynağıdır. Barbon ve diğerleri (2019), naif Bayes yöntemini geliştirerek firma spesifik haberler temelinde bir duygu değişkeni oluştururlar. Ke ve diğerleri (2019), hisse senedi getirileriyle ilgili bilgileri çıkarmada uzmanlaşmış özelleştirilmiş bir ML tabanlı yaklaşım uygular. Bu yöntem, Dow Jones Newswire makalelerinden hisse senetleri için bir duygu ölçütü çıkarmalarına olanak tanır. Benzer şekilde, Boudoukh ve diğerleri (2019) da Dow Jones Newswire makalelerini analiz eder ancak firma spesifik haberlerin öne çıkmasına odaklanır. Manela ve Moreira (2017), geleneksel olumlu-olumsuz ölçeklerini kullanarak duygu ölçütlerinden sapar. Bunun yerine, Wall Street Journal ön sayfa makalelerinden bir borsa belirsizliği ölçütü oluştururlar. Von Beschwitz ve diğerleri (2020), ML tabanlı haber analitiğinin (yani, yatırımcıların finansal haberleri yorumlamak için kullandıkları bilgisayar algoritmaları) hisse senedi fiyatları, işlem hacimleri ve likidite üzerindeki etkilerini inceler. Calomiris ve Mamaysky (2019), ülke düzeyindeki haber makalelerinden duygu ölçütü oluşturmak için ML kullanır ve bunun getiriler ve oynaklıklar üzerindeki etkisini inceler. Metin analizine ek olarak, Obaid ve Pukthuanthong (2022), haber fotoğraflarına ML uygulayarak hisse senetleri için bir duygu ölçütü çıkarır ve bunun metin tabanlı ölçütlerin yerine geçebileceğini bulur.

Diğer çalışmalar, duygu ölçütleri için analist raporları veya yıllık raporları kullanır. Huang ve diğerleri (2014), analist raporlarına naif Bayes yöntemini uygulayarak hisse senedi duygu ölçütü oluşturur. Azimi ve Agrawal (2021), 10-K’lere derin öğrenme yöntemleri uygulayarak duygu ölçütü çıkarır ve bunun anormal getiriler ve işlem hacimleri üzerindeki etkisini inceler.

Çoğu ML tabanlı duygu ölçütü çalışması, hisse senetleri için duyguları ele alırken, Cathcart ve diğerleri (2020), devlet borç piyasaları için duygu inceler. Daha spesifik olarak, Thomas Reuters Haber Analitiği’nden haber duygu bilgilerini kullanarak medya içeriğinin devlet kredi riski üzerindeki etkisini araştırırlar.

Finansal piyasaların ötesinde, iki çalışma ürünler için duyguları inceler. Tang (2018), Twitter gönderilerine dayalı olarak tüketici duygu ölçütü oluşturmak için ticari bir hizmet kullanır. Ardından yapılan ana analiz, tüketici duygusunun firma satışları üzerindeki etkisini inceler. Nauhaus ve diğerleri (2021), belirli teknoloji alanlarına ilişkin makalelerden uzman duygu ölçütü oluşturur ve ardından bunun firmaların bu alanlarda faaliyet gösteren iş birimleri arasında sermaye tahsisini nasıl etkilediğini inceler.

3.1.2 Şirket Yöneticilerinin Özelliklerinin Ölçütleri

Bir firmanın liderliğinin önemli rolü ve geniş etkileri, şirket yöneticilerinin çeşitli yönlerini inceleyen geniş bir finans literatürü oluşmasına yol açmıştır. Bu literatüre bağlı olarak, ML, yöneticilerin özelliklerinin üstün ve yenilikçi ölçütlerini oluşturmayı sağlar. Bu kategorideki ölçütlerin çoğu metin verilerine dayanırken, bazı çalışmalar görüntü ve videoları analiz ederek ölçütler oluşturur.

Birçok çalışma, ML tabanlı kişilik özellikleri ölçütleri oluşturur. Gow ve diğerleri (2016), konferans görüşme transkriptlerinin soru-cevap kısmından CEO’ların Big Five kişilik skorlarını (uyumluluk, vicdanlılık, dışadönüklük, nevrotiklik ve deneyime açıklık) çıkarmak için ML kullanır. Yazarlar, çıkarılan skorları, kişiliğin finansman seçimleri, yatırım seçimleri ve operasyonel performans üzerindeki etkisini analiz etmek için kullanır. Benzer şekilde, Hrazdil ve diğerleri (2020), IBM Watson Personality Insights ticari hizmetini kullanarak CEO’ların ve CFO’ların Big Five kişilik skorlarını belirler. Bu skorları kullanarak, denetim ücretleri üzerindeki etkisini analiz etmek için yöneticilerin risk toleransının yenilikçi bir ölçüsünü oluştururlar.

Diğer çalışmalar, yöneticilerin kendi inançlarının ölçütlerini oluşturur. Örneğin, Du ve diğerleri (2019), yatırım fonu yöneticilerinin hissedarlara yazdığı mektupları ML ile analiz ederek yöneticilerin görüşlerini ifade etme düzeyine dair bir ölçüt oluşturur. Ana analizleri, özgüvenin gelecekteki performans üzerindeki etkisini inceler.

Son yıllarda ML’deki ilerlemeler, yöneticilerin duygularının ölçütlerini oluşturan çalışmaları da mümkün kılar. Akansu ve diğerleri (2017), CEO’ların basın röportajlarındaki videolarına ML tabanlı yüz okuma yazılımı uygulayarak yüz ifadelerini ve CEO ruh halini nicelendirir. Öfke, tiksinti, korku, mutluluk, üzüntü veya şaşkınlık gibi duyguları ölçerler ve bu duyguların firma performansı üzerindeki etkisini incelerler. Hu ve Ma (2021), girişimci sunum videolarında startup kurucularının duygularının ölçütlerini oluşturmak için ML kullanır. Daha spesifik olarak, yüz ifadeleri, sözlü ifadeler ve sesli ifadeler olmak üzere üç boyutta duyguları ölçerler. Son olarak, bu üç boyutun risk sermayesi yatırımı elde etme olasılığı üzerindeki etkisini analiz ederler. Breaban ve Noussair (2018), deneysel bir ortamda tüccarların duygusal durumlarını çıkarmak için ML tabanlı yüz okuma yazılımı kullanır.

Literatürün bir diğer kolu, yöneticilerin eylemlerini ve çalışma modellerini ele alır. Barth ve diğerleri (2020), ML tabanlı bir ölçüt önererek, yöneticilerin yatırımcılar ve analistlerin sorularına yanıt vermeyerek bilgi akışını ne ölçüde engellediklerini değerlendirir. Bandiera ve diğerleri (2020), CEO anket verilerine ML uygulayarak CEO çalışma tarzının bir ölçütünü oluşturur. Bu ölçüt, belirli bir CEO’nun daha düşük seviyeli mi yoksa daha yüksek seviyeli mi faaliyetler yürüttüğünü yakalar. Bu yenilikçi ölçüt, yazarların firma-CEO atama sürtüşmelerini incelemelerine olanak tanır. Choudhury ve diğerleri (2019), gelişmekte olan piyasa CEO’larının röportajlarından transkript ve videolara ML uygulayarak yöneticilerin iletişim tarzının bir ölçütünü oluşturur. Dávila ve Guasch (2022), ML tabanlı bilgisayarla görme yazılımı kullanarak, sunumlar sırasında girişimcilerin sözsüz iletişim tarzının bir ölçütünü oluşturur ve bunun firma değerlemeleri ve fonlama başarı oranları ile ilişkisini analiz eder.

Erel ve diğerleri (2021) çalışması, yönetici kalitesini ölçmek için ML kullanır. Çeşitli ML yöntemlerini kullanarak, yöneticilerin ilk 3 yıllık görev süresi boyunca hissedar desteğinin (aşırı) seviyesini tahmin ederler. Bu tahminleri yönetici kalitesinin bir ölçütü olarak yorumlayarak, yazarlar şirketlerin yönetici seçim sürecini inceler.

Son olarak, internette serbestçe erişilebilen büyük miktarda görüntü verisi, şirket yöneticilerinin görünüşlerinin—özellikle yüz özelliklerinin—içerebileceği bilgileri sistematik olarak kullanmalarına olanak tanır. Hsieh ve diğerleri (2020), yöneticilerin iş başlığı fotoğraflarından güvenilirlik ölçütü çıkarır. Daha spesifik olarak, kaş açısı veya yüz yuvarlaklığı gibi belirli yüz özelliklerini tespit eder ve algılanan güvenilirliği tahmin etmek için kullanır. Ana analizleri, yöneticilerin güvenilirliğinin denetim ücretleri üzerindeki etkisini inceler. Peng ve diğerleri (2022), LinkedIn sosyal ağını kullanır ve satış tarafı analistlerinin profil fotoğraflarına ML uygulayarak güvenilirlik, baskınlık, çekicilik vb. ölçütler oluşturur. Kamiya ve diğerleri (2019), CEO’ların portre fotoğraflarından yüz genişlik-yükseklik oranını ölçmek ve bununla yüz erkeksiliğinin bir ölçütünü çıkararak firmaların riskliliği üzerindeki etkisini incelemek için ML kullanır.

3.1.3 Firma Özelliklerinin Ölçütleri

Üçüncü kategorideki çalışmalar, ML yöntemleri ile firma özelliklerinin ölçütlerini oluşturur. İlk alt kategori, firmaların finansal özellikleri ve risk maruziyetlerinin ölçütlerinden oluşur. Buehlmaier ve Whited (2018), yıllık raporları ML ile analiz ederek finansal kısıtlamaların bir ölçütünü oluşturur ve bu ölçüt mevcut ölçütlere göre üstün performans sağlar. Hanley ve Hoberg (2019), bireysel bankaların yıllık raporlarından ML tabanlı bir hizmet kullanarak finans sektöründeki toplam risk maruziyeti ölçütünü oluşturur. Bu ölçütü, finansal sektör riskinin bankaların hisse getirileri, volatilite ve iflas üzerindeki etkilerini incelemek için kullanırlar. Li ve diğerleri (2021a), kazanç çağrılarından elde edilen bilgilerle firmaların COVID-19’a maruziyeti ve tepkisinin ölçütlerini oluşturmak için ML tabanlı metin analizi yöntemlerini kullanır. Alan ve diğerleri (2021), hesaplamalı dilbilimden ML tabanlı yöntemlerle firma düzeyinde siber güvenlik riskini ölçer. Daha genel olarak, Lima ve Keegan (2020), siber güvenlik riskini değerlendirmek için sosyal medyaya nasıl ML tabanlı metin analizi uygulanabileceğine dair bir genel bakış sunar.

ML, ayrıca kurumsal kültürü incelemeye de yardımcı olabilir. Li ve diğerleri (2021b), konferans çağrısı transkriptlerinden ML ile kurumsal kültürün çeşitli yönlerini çıkarır ve beş farklı kurumsal kültür değerinin ölçütlerini oluşturur. Bu ölçütleri kullanarak, kurumsal kültürün yönetici tazminatı ve risk alma gibi firma politikaları üzerindeki etkisini analiz ederler. Ayrıca, operasyonel verimlilik ve firma değeri gibi performans ölçütleri üzerindeki etkisini de incelerler. Adams, Akyol ve diğerleri (2021), firmaların cinsiyet eşitliği ajansına raporlarını analiz etmek için ML kullanarak kurumsal cinsiyet kültürünün birden fazla ölçütünü oluşturur. Bu yenilikçi ölçütler, firmaların kadın çalışanları nasıl ele aldığını sistematik olarak incelemelerine olanak tanır. Adams, Ragunathan ve diğerleri (2021), yönetim kurulu ve komite sorumluluklarını ve toplantı sıklıklarını çıkarmak için ML tabanlı metin analizi uygular.

Son olarak, ML’nin yetenekleri, firmaların bağlantısallığının yenilikçi ölçütlerini oluşturmayı sağlar. Mazrekaj ve diğerleri (2021), potansiyel çıkar çatışmalarını belirlemeye yardımcı olan bir firmaların politik bağlantıları ölçütü oluşturmak için ML uygular. Bubna ve diğerleri (2020), risk sermayesi sendikasyonlarını inceleyerek risk sermayesi ilişkilerini ölçer. Daha spesifik olarak, risk sermayesi firmalarını ML ile kümelendirerek sendikasyon gruplarını belirler ve bunların girişimci olgunlaşma ve yenilik üzerindeki etkisini incelerler. Bubb ve Catan (2021), denetimsiz öğrenmeden kümelendirme yöntemlerini yatırım fonlarının vekil oylarına uygulayarak hangi oy verme taraflarına ait olduklarını belirlerler.

3.2 Ekonomik Tahmin Problemlerinde Tahmin Hatasının Azaltılması

Finansta ML uygulamalarının ikinci arketipi olan çalışmalar, ekonomik tahmin problemlerinde tahmin hatasını azaltmak için ML’yi kullanır. Ekonomide birçok problem ekonomik değişkenler arasındaki nedensel ilişkilerin belirlenmesini gerektirirken, bazı problemler doğrudan tahmin gerektirir. ML, bu tür problemler için tahmin hatasını azaltabilir, yani OLS ile lineer regresyon gibi daha basit yaklaşımlardan daha doğru tahminler üretebilir.

Tahminler, sayısal verilerden ve metin, görüntü veya video gibi geleneksel olmayan verilerden üretilebilir. Bu kategoride ML’nin amacı, ekonomik tahmin problemlerinde tahmin hatasını en aza indirmektir. Bu nedenle, yalnızca denetimli ML burada doğrudan uygulanabilir. Mevcut ML yöntemlerinin çokluğu göz önüne alındığında, çoğu çalışma, verilen veriler üzerinde hangi yöntemin en iyi çalıştığını değerlendirmek için birden fazla farklı yöntemi kullanır. Denetimli ML yöntemlerinin uygulanması, sonuçta ekonomik bir değişkenin tahminlerini üretir ve bu da doğrudan ekonomik bir tahmin probleminin çözülmesine yardımcı olur.

Tablo 3, ekonomik tahmin problemlerinde tahmin hatasını azaltmak için ML kullanan ilgili çalışmalara genel bir bakış sunar. Aşağıda, bu çalışmaları üç kategoride sunuyoruz: (1) varlık fiyatlarının ve ticaret mekanizmalarının tahmini, (2) kredi riskinin tahmini ve (3) firma sonuçları ve finansal politikanın tahmini.

Category Subcategory Prediction targets
Prediction of asset prices and trading mechanisms Equities  

  • Stock returns
  • Stock volatility
  • Stock covariance
  • Equity risk premium

 

Bonds  

  • Future excess returns of US treasury bonds

 

Foreign exchange  

  • Direction of changes in exchange rates

 

Derivatives  

  • Prices of options on index futures
  • Prices of general derivatives

 

General financial claims  

  • Stochastic discount factor
  • Financial crises

 

Investors  

  • Mutual fund performance
  • Retail investors’ portfolio allocations and performance

 

Market microstructure  

  • Lifespan of trading orders
  • General microstructure variables

 

Prediction of credit risk Consumer credit risk  

  • General consumer default
  • Credit card delinquency and default
  • Bill payment in developing countries
  • Credit card repayment patterns

 

Real estate credit risk  

  • Mortgage loan risk
  • Commercial real estate default

 

Corporate credit risk  

  • Firms’ credit rating changes
  • Corporate bankruptcy
  • Fintech loan default
  • Recovery rates of corporate bonds

 

Prediction of firm outcomes and financial policy Financial outcomes  

  • Capital structure
  • Earnings

 

Corporate misconduct  

  • Accounting fraud
  • Regulatory violations

 

Startups’ success  

  • Startup acquisitions
  • Startup valuations and success probabilities

 

3.2.1 Varlık Fiyatlarının ve Ticaret Mekanizmalarının Tahmini

Varlık fiyatlarının ve ticaret mekanizmalarının tahmini, sermaye piyasalarının incelenmesinde merkezi bir öneme sahiptir. ML, çeşitli tahmin problemlerinde tahmin hatasını azaltabilir. Bu tahminleri yedi farklı alt kategoride sınıflandırıyoruz: hisse senetleri, tahviller, döviz, türev ürünler, genel piyasa fiyatları, yatırımcılar ve piyasa mikro yapısı.

Hisse Senetleri: Bu alt kategoride en yaygın ML tabanlı tahmin, gelecekteki hisse getirilerinin tahminidir. Bu, kesitsel varlık fiyatlaması alanıyla yakından ilişkilidir. Rasekhschaffe ve Jones (2019), hisse senedi getirilerinin kesitini tahmin etmek ve bireysel hisse seçiminde ML kullanımına dair bir genel bakış sunar. Martin ve Nagel (2022), yüksek boyutlu verilerle kesitsel varlık fiyatlamasının zorluklarını vurgular. Gu ve diğerleri (2020), firma özelliklerine, tarihsel getirilere ve makroekonomik göstergelere dayanarak gelecekteki hisse getirilerini doğrudan tahmin eder. Çeşitli karmaşıklıklarda ML yöntemleri kullanırlar; düzenlenmiş doğrusal modellerden sinir ağlarına kadar. Ayrıca, hisse getirilerini tahmin ederken en bilgilendirici değişkenlerin hangileri olduğunu analiz ederler. Rossi (2018), Welch ve Goyal’in (2008) belirlediği değişkenlere dayanarak gelecekteki hisse getirilerini ve volatilitesini tahmin eder. Moritz ve Zimmermann (2016), Kelly ve diğerleri (2019), Gu ve diğerleri (2021) ve Freyberger ve diğerleri (2020) çalışmaları, firma özelliklerine ve tarihsel getirilere dayanarak gelecekteki hisse getirilerini tahmin eder. Ancak, uygulanan ML yöntemleri bakımından farklılık gösterirler. Grammig ve diğerleri (2020), finansal teoriye dayalı geleneksel yöntemleri ML ile birleştiren hibrit bir yaklaşım oluşturur. Chinco ve diğerleri (2019), ultra kısa vadeli tarihsel getirilerin kesitine dayanarak ultra kısa vadeli gelecekteki hisse getirilerini tahmin etmek için LASSO uygular. Akyildirim ve diğerleri (2021), yüksek frekanslı sipariş ve ticaret bilgilerine dayanarak gün içi fazla getirileri tahmin etmek için çeşitli ML yöntemleri kullanır. Amel-Zadeh ve diğerleri (2020), finansal tablo değişkenlerine dayanarak kazanç duyuruları etrafındaki anormal hisse getirilerini tahmin eder. LASSO, rassal ormanlar ve sinir ağları kullanırlar ve hangi finansal tablo değişkenlerinin en bilgilendirici olduğunu analiz ederler. Chinco ve diğerleri (2021), hisse getirisi anomalilerine rastlama olasılığını belirlemek için ridge regresyonu kullanır. Feng ve diğerleri (2020), ML tabanlı bir yöntem önerir ve potansiyel risk faktörlerinin hisse getirilerini açıklamadaki katkısını değerlendirir. İki çalışma finansal piyasa volatilitesine odaklanır: Kogan ve diğerleri (2009), yıllık raporlara dayanarak gelecekteki hisse volatilitesini tahmin eder; Osterrieder ve diğerleri (2020), opsiyon fiyatlarından gün içi volatilite endeksi VIX’i tahmin eder. Rossi ve Timmermann (2015), hisse getirileri ve ekonomik faaliyet arasındaki ilişkiyi incelemek için ML kullanır. Hisse getirileri ile günlük ekonomik faaliyet endeksi arasındaki kovaryansları tahmin etmek için geliştirilmiş regresyon ağaçları uygularlar.

Tahviller: Bazı çalışmalar, tahvillerin belirli yönlerini tahmin eder. Örneğin, Bianchi ve diğerleri (2021), genel getiri verileri ve makroekonomik göstergelere dayanarak ABD hazine tahvillerinin gelecekteki fazla getirilerini tahmin etmek için çeşitli ML yöntemlerini uygular.

Döviz: Colombo ve diğerleri (2019) çalışmasında, piyasa belirsizliği göstergelerine dayanarak döviz kurlarındaki değişikliklerin yönünü tahmin etmek için SVM uygular.

Türev Ürünler: Diğer çalışmalar, türev ürünleri fiyatlandırmak için ML kullanır. Bu, finans alanında ML’nin erken bir uygulamasıdır. Hutchinson ve diğerleri (1994), Black-Scholes değişkenlerine dayanarak S&P 500 vadeli işlem opsiyonlarını sinir ağlarının erken bir varyantı ile fiyatlandırır. Benzer şekilde, Yao ve diğerleri (2000), Nikkei 225 vadeli işlem opsiyonlarını fiyatlandırır. Daha yakın çalışmalarda, De Spiegeleer ve diğerleri (2018), ML yöntemlerinin türev ürünleri gelişmiş matematiksel modellerden çok daha hızlı fiyatlandırabileceğini, ancak sadece biraz daha düşük doğruluk sağladığını bulur.

Genel Piyasa Fiyatları: Bazı çalışmalar belirli varlık sınıflarına odaklanmak yerine genel finansal iddiaları tahmin eder. İki çalışma doğrudan stokastik indirim faktörünü tahmin eder. Chen ve diğerleri (2019), firma özellikleri, tarihsel getiriler ve makroekonomik göstergeler gibi çeşitli tahmincilerle derin sinir ağlarına dayalı üretici adversaryal ağlar kullanır. Kozak ve diğerleri (2020), stokastik indirim faktörünü firma özellikleri ve tarihsel getirilerden tahmin etmek için Bayes önceliklerine dayalı özel bir ML yöntemi geliştirir. Oh ve diğerleri (2006), finansal piyasa volatilitesinden finansal krizleri tespit etmek ve tahmin etmek için ML uygular. Benzer şekilde, Coffinet ve Kien (2019), bankacılık krizlerini tespit etmek için bir ML araç seti geliştirir.

Yatırımcılar: Varlık fiyatları ve getirilerinin yanı sıra, perakende ve profesyonel yatırımcıların ticaret kararları ve performansına ilişkin çalışmalarda da tahmin problemleri ortaya çıkar. Li ve Rossi (2020), yatırım fonlarının performansını tahmin etmek için geliştirilmiş regresyon ağaçları uygular ve bu da fon seçimine olanak tanır. Rossi ve Utkus (2020), hangi tür perakende yatırımcıların robo-danışmanlıktan en fazla yararlandığını inceler. Daha spesifik olarak, yatırımcıların portföy tahsislerindeki ve performanslarındaki değişiklikleri tahmin etmek için geliştirilmiş regresyon ağaçları uygularlar.

Piyasa Mikro Yapısı: Son olarak, bazı çalışmalar ML ile piyasa mikro yapısının belirli yönlerini tahmin etmeye odaklanır. McInish ve diğerleri (2019), sipariş ömrünü sipariş özellikleri ve piyasa verilerine dayanarak tahmin etmek için rassal ormanlar uygular. Easley ve diğerleri (2021), piyasa katılımcıları için önemli olan çeşitli değişkenleri (örneğin, alım-satım farkları, volatilite değişiklikleri ve ardışık getiri korelasyonları) rassal ormanlar ile tahmin eder.

3.2.2 Kredi Riskinin Tahmini

Kredi riski, nihai hedefi hangi potansiyel borçluların sonunda temerrüde düşeceğini bilmek olan tipik bir ekonomik tahmin problemidir. Bu nedenle, ML tahmin hatalarını azaltabilir ve karar verme süreçlerini, örneğin kredi verme sürecini iyileştirebilir. ML tabanlı kredi riski tahminlerine ilişkin mevcut literatürü üç alt kategoriye ayırıyoruz: tüketici kredi riski, gayrimenkul kredi riski ve kurumsal kredi riski.

Tüketici Kredi Riski: Tüketici kredi riski üzerindeki çalışmalar, herhangi bir tür tüketici kredisi için temerrüt tahminleri yapmak üzere ML kullanır. Albanesi ve Vamossy (2019), genel tüketici kredi temerrüdünü inceler ve kredi bürosu verilerinden daha doğru tahminler elde etmek için geliştirilmiş regresyon ağaçları ve derin sinir ağları gibi gelişmiş ML yöntemlerini kullanır. Ayrıca, hangi tahmincilerin en alakalı olduğunu ve farklı tahmincilerin tahminleri nasıl etkilediğini analiz ederler. Benzer şekilde, Tantri (2021), borçlu ve kredi özelliklerine dayalı olarak geliştirilmiş regresyon ağaçları ile tüketici kredi temerrüdünü tahmin eder ve ML tabanlı temerrüt tahminlerinin kredi verme verimliliğini artırabileceğini bulur. Khandani ve diğerleri (2010), işlem verilerine ve geleneksel kredi bürosu verilerine dayanarak tüketici kredi kartı temerrüdünü tahmin eder. Benzer şekilde, Butaru ve diğerleri (2016), daha genel hesap verileri ve makroekonomik göstergeleri dikkate alarak kredi kartı temerrüdünü tahmin eder. Her iki çalışma da tahminci değişkenler arasındaki doğrusal olmayanlıkları ve etkileşimleri otomatik olarak dikkate alan ağaç tabanlı ML yöntemleri kullanır. Butaru ve diğerleri (2016), ayrıca temerrüt tahminlerini yönlendiren tahminci değişkenleri belirlemeye çalışır. Björkegren ve Grissen (2018, 2020), gelişmekte olan ülkelerde mobil telefon meta verilerine rassal ormanlar uygulayarak tüketici faturalarının ödenmesini tahmin etmeye odaklanır. Mobil telefonlardan kolayca elde edilebilen verilere dayalı kredi riski tahminleri yapabilme yeteneği, kredi puanı olmayan gelişmekte olan ülkelerdeki bankasız kişilerin krediye erişim sağlamasına yardımcı olabilir. Yukarıdaki çalışmalardan biraz farklı olarak, Gathergood ve diğerleri (2019), kredi kartı işlem verilerini kullanarak kredi kartı geri ödeme modellerini tahmin eder. Müşterilerin kredi kartı faturalarını ödeyip ödemediğini değil, müşterilerin farklı faiz oranlarına sahip birden fazla kartta geri ödemeleri nasıl böldüklerini tahmin ederler. Ayrıca çeşitli ML yöntemleri uygularlar ve hangi tahmincilerin en bilgilendirici olduğunu analiz ederler.

Algoritma tabanlı kararlar insanları etkilediğinde, algoritmik önyargı potansiyel bir sorundur. Tüketici kredi riski tahminlerinin doğrudan kredi onay kararlarını etkilemesi nedeniyle, algoritmanın cinsiyet veya ırk gibi özelliklere dayalı olarak insanlara ayrımcılık yapmaması gereklidir. Literatür, ML’nin tüketici kredi kararlarındaki önyargıyı azaltıp artırmadığı konusunda tekdüze bir tablo sunmaz. Rambachan, Kleinberg, Ludwig ve diğerleri (2020) ve Rambachan, Kleinberg, Mullainathan ve diğerleri (2020), algoritmaların ayrımcılık yapmasının büyük ölçüde verilen verilere bağlı olduğunu savunur. Algoritmalar, kararlarını eğitim aldıkları verilere dayandırdıkları için, verilerde mevcut olan önyargıları yayabilirler. Fuster ve diğerleri (2022), kredi kararları için bir ML modeli oluşturmak üzere bir veri setine ML uygular ve ML’nin farklı gruplar arasındaki ve içindeki farklılıkları basit yöntemlere göre artırdığını bulur. Özellikle, geleneksel yaklaşımlara göre Hispanik ve Siyah borçlulara dezavantaj sağlar. Bu nedenle, ML tabanlı algoritmaların potansiyel ayrımcılığı konusunda farkındalık gereklidir.

Öte yandan, ML kullanımının tüketici kredi kararlarında önyargıyı azaltabileceğini gösteren çalışmalar da vardır. Teorik bir modele dayalı olarak, Philippon (2019), algoritmaların kredi piyasalarında ayrımcılığı nasıl azaltabileceğini gösterir. Dobbie ve diğerleri (2021), kredi başvurularından elde edilen beklenen karı maksimize etmek için bir ML modeli eğitir ve ortaya çıkan kredi verme kararlarının önyargıyı ortadan kaldırdığını bulur. Kleinberg ve diğerleri (2018), ML modellerine cinsiyet ve ırk gibi problemli değişkenleri dahil etmenin aslında ayrımcılığı azaltabileceğini gösterir. Tüketici kredi riskinde algoritmik önyargı konusundaki tartışmayı sonlandırmak için, bugüne kadar literatürde tekdüze bir tablo yoktur. Bazı çalışmalar, tüketici kredi riskini belirlemek için ML kullanmanın önyargıyı artırdığını bulurken, diğer çalışmalar azaltığını bulur.

Gayrimenkul Kredi Riski: ML tabanlı kredi riski tahminlerinin ikinci alt kategorisi, ipotek ve ticari gayrimenkul kredilerinin riskini içerir. Sadhwani ve diğerleri (2021), ipotek kredisi kaynak verileri, performans verileri ve makroekonomik göstergelere dayanarak ipotek kredi riskini tahmin etmek için derin sinir ağlarını kullanır. Ayrıca, hangi tahminci değişkenlerin en önemli olduğunu ve tahminleri nasıl etkilediğini analiz ederler. Cowden ve diğerleri (2019), mülk özelliklerine dayanarak ticari gayrimenkul temerrüdünü tahmin etmek için çeşitli ML yöntemlerini kullanır.

Kurumsal Kredi Riski: Kurumsal kredi riski, ML’nin üstün kredi riski tahminleri sağlayabileceği başka bir alandır. Jones ve diğerleri (2015), firma temelleri, analist tahminleri ve makroekonomik göstergelere dayanarak firmaların kredi notu değişikliklerini tahmin eder. Tian ve diğerleri (2015) ve Sermpinis ve diğerleri (2022), firmaların mali tabloları ve piyasa verilerinden doğrudan kurumsal iflası tahmin eder. Lahmiri ve Bekiros (2019) da benzer şekilde firma temellerine dayalı iflası tahmin eder, ancak ek olarak genel risk göstergelerini de içerir. Daha sofistike sinir ağları kullanırlar. Croux ve diğerleri (2020), kredi ve borçlu özelliklerinin yanı sıra makroekonomik göstergelere dayanarak fintech kredi temerrüdünü tahmin etmek için LASSO uygular. Yukarıdaki çalışmalardan farklı olarak, Nazemi ve Fabozzi (2018), kredi temerrüdü sonrasındaki zamanı odaklanarak çeşitli ML yöntemleriyle tahvil ve sektör özelliklerine ve makroekonomik göstergelere dayanarak kurumsal tahvillerin toparlanma oranlarını tahmin eder.

3.2.3 Firma Sonuçlarının ve Finansal Politikaların Tahmini

Özellikle kurumsal finans alanında, belirli firma sonuçlarının (örneğin, sermaye yapısı) belirleyicilerinin analizi, ML tabanlı tahminlerin hedefi olabilir. Bu kategorideki mevcut literatürü, tahminin belirli hedefine göre üç alt kategoriye ayırıyoruz: finansal sonuçlar, kurumsal suistimal ve girişimlerin başarısı.

Finansal Sonuçlar: İki çalışma, farklı finansal sonuçları tahmin etmek için ML kullanır. Amini ve diğerleri (2021), kurumsal finans alanındaki tipik bir sorun olarak firma sermaye yapısını inceler. Literatürdeki standart sermaye yapısı belirleyicilerine (Frank & Goyal, 2009) dayalı olarak, çeşitli ML yöntemleriyle kurumsal kaldıraç oranını tahmin ederler. Ayrıca, hangi belirleyicilerin sermaye yapısı için gerçekten bilgilendirici olduğunu ve tahminleri nasıl etkilediğini ayrıntılı olarak analiz ederler. Van Binsbergen ve diğerleri (2020), firmaların muhasebe verilerine, makroekonomik verilere ve analist tahminlerine dayanarak gelecekteki kazançlarını tahmin etmek için rassal ormanlar uygular.

Kurumsal Suistimal: Kurumsal suistimal, firma sonuçları ve finansal politikalar kategorisinde tipik bir tahmin problemidir. Literatürde en yaygın incelenen kurumsal suistimal türü muhasebe sahtekarlığıdır. Geleneksel yaklaşımlar muhasebe sahtekarlığını tahmin etmek için kullanılabilirken (örneğin, Beneish, 1999 model of earnings manipulation), bazı çalışmalar ML’nin üstün tahmin doğruluğu sağlayabileceğini savunur. Bao ve diğerleri (2020), muhasebe sahtekarlığını tahmin etmek için ham finansal tablo değişkenlerine geliştirilmiş regresyon ağaçları uygular. ML tabanlı tahminlerin, daha basit sahtekarlık modellerini geride bıraktığını bulurlar. Brown ve diğerleri (2020), yıllık raporlara ML tabanlı metin analizi uygulayarak muhasebe sahtekarlığını tahmin eder. Ayrıca, hangi konuların en bilgilendirici olduğunu ve sahtekarlık tahminlerini nasıl etkilediğini analiz ederler. Bertomeu ve diğerleri (2021), potansiyel tahminci değişkenlerin büyük bir setine dayalı olarak önemli yanlış beyanları tahmin etmek için geliştirilmiş regresyon ağaçları kullanır. Muhasebe sahtekarlığına ek olarak, Campbell ve Shang (2022), Glassdoor gibi web sitelerindeki çalışan incelemelerinden genel düzenleyici kuralların ihlallerini tahmin etmek için metin analizi ve ML uygular.

Girişimlerin Başarısı: Girişim finansmanı alanındaki çalışmalar, girişimlerin başarısını tahmin etmek için ML kullanır. Xiang ve diğerleri (2012), firma temellerine ve firma spesifik haberlere dayalı olarak girişimlerin satın alımlarını tahmin etmek için ML tabanlı metin analizi uygular. Benzer şekilde, Ang ve diğerleri (2022), girişimlerin değerlemelerini ve başarı olasılıklarını ML tabanlı metin analizi ve geliştirilmiş regresyon ağaçları ile tahmin eder.

3.3 Mevcut Ekonometrik Araç Setinin Genişletilmesi

ML uygulamalarının üçüncü arketipine ait çalışmalar, mevcut ekonometrik araç setini genişletir. Yaygın olarak kullanılan ekonometrik yöntemlerin çoğu bir tahmin bileşeni içerir. Örneğin, 2SLS ile araç değişkenli regresyonun ilk aşaması, etkili bir şekilde bir tahmin problemidir, çünkü sadece tahmin edilen (uydurulmuş) araç değişkeninin değeri ikinci aşamaya girer. ML yöntemleri, üstün tahminler sağlayabilir ve dolayısıyla bu tür ekonometrik yöntemlerin yeteneklerini artırabilir. Diğer yandan, bazı ML yöntemleri zaten mevcut ekonometrik yöntemlerle benzer amaçlara hizmet eder. Örneğin, kümeleme, ekonometriklerde ve ML’de bilinen bir problemdir. ML tabanlı yöntemler genellikle üstün performans sağlar, bu nedenle ekonometrik araç setini doğrudan genişletebilirler. Tablo 4, ML tabanlı ekonometrik yöntemlere dair literatürün genel bir bakışını sunar. ML’nin tedavi etkilerini tahmin etmek için kullanıldığı nedensel ML ve ekonometrikte ML’nin diğer izole uygulamaları arasında ayrım yaparız. Nedensel ML kategorisinde, literatürü araç değişkenli regresyon için ML ile geliştirilmiş yöntemler, nedensel ağaçlar ve nedensel ormanlar için yeni yöntemler ve nedensel ML ile ilgili diğer yaklaşımlar olarak daha fazla böleriz. Aşağıda, ilgili literatürü kısaca gözden geçiriyoruz.

Category Subcategory Approaches
Causal ML Instrumental variable regression  

  • 2SLS first stage with LASSO, ridge regression, or neural networks

 

Causal-tree based methods and applications  

  • Causal trees
  • Causal forests
  • Applications of causal forests

 

Other causal ML  

  • Direct prediction of treatment effects
  • ML-based propensity score
  • Balance verification between treatment and control groups
  • Counterfactual prediction

 

Special Applications  

  • Predictive power of economic theories
  • Completeness of economic theories
  • Handling of imbalanced data
  • Generation of artificial data
  • ML-augmented preanalysis plans

 

3.3.1 Nedensel ML

Geleneksel ekonometrik yöntemler nedenselliği hedeflerken, ML yöntemleri tahmin veya veri yapısı çıkarımı için tasarlanmıştır. Nedensel ML alanı, her iki yöntemin avantajlarını birleştirerek nedensellik ve özellikle tedavi etkilerinin tahmini için uygun üstün ekonometrik yöntemler oluşturmayı amaçlar. Nedensel ML içindeki en gelişmiş yöntemler, ML ile geliştirilmiş araç değişkenli regresyon ve nedensel ağaçlar ve ormanların yeni yöntemleridir.

Daha önce belirtildiği gibi, ML, araç değişkenli regresyonun ilk aşamasını doğrudan iyileştirebilir. Araç değişkeni için daha iyi tahminler sağlayarak, ilk aşamanın belirleme katsayısı R² iyileşir ve bu da ikinci aşamada daha hassas tahminler sağlar. Bu fikrin çeşitli ML yöntemleri için somut uygulamaları zaten mevcuttur, bunlar arasında LASSO (Belloni ve diğerleri, 2012), ridge regresyon (Carrasco, 2012; Hansen & Kozbur, 2014) ve sinir ağları (Hartford ve diğerleri, 2017) bulunur. Ancak, Angrist ve Frandsen (2022), ML ile geliştirilmiş araç değişkenli yöntemlerin, araç değişkenleri seçmede mevcut özel yaklaşımlardan üstün olmayabileceğini savunur.

Tedavi etkilerinin ML ile tahmini için nedensel ağaçlar ve nedensel ormanlar diğer iyi geliştirilmiş yöntemlerdir. Athey ve Imbens’in (2016) öncü çalışması, verileri farklı tedavi etkileri büyüklüklerine sahip alt popülasyonlara ayırmak için ağaç tabanlı ML yöntemlerini kullanan nedensel ağaç yaklaşımını tanıttı. Athey ve Wager’in (2019) önerdiği nedensel ormanlar, bu konsepti tüm bir nedensel ağaçlar topluluğunu kullanarak genişletir. Bazı çalışmalar, nedensel ormanları finans alanındaki somut problemlere uygular. Gulen ve diğerleri (2020), firmaların yatırım seviyeleri üzerindeki borç sözleşmesi ihlallerinin heterojen tedavi etkilerini tahmin etmek için nedensel ormanları kullanır. O’Malley (2021), ipotek temerrüdü üzerindeki yasal değişikliğin konut el koyma riskindeki tedavi heterojenliğini nedensel ormanlarla tahmin eder.

Nedensel ağaçlar ve nedensel ormanlara ek olarak, diğer yaklaşımlar tedavi etkilerinin tahminini iyileştirmek için ML kullanır. Lee ve diğerleri (2010), eğilim puanını ML ile tahmin eder. Mullainathan ve Spiess (2017), tedavi ve kontrol grupları arasındaki dengeyi doğrulamak için ML kullanmayı önerir. Eğer tedavi atamasını ML ile tahmin etmek mümkünse, tedavi ve kontrol gruplarına ayrılmanın dengeli olamayacağını savunurlar. Ancak, bu fikir sadece bir yönde çalışır: ML’yi uygulayarak dengesizlik çıkarılabilir, ancak dengenin olup olmadığını çıkarılamaz. Chernozhukov ve diğerleri (2017, 2018), tedavi ataması ve sonuçlarından ML tabanlı tahminlerle doğrudan tedavi etkilerini hesaplar. Son olarak, Athey ve diğerleri (2019), panel verilerden tedavi etkilerini tahmin etmek için toplu yöntemlerle karşıt-gerçek tahmininde bulunur.

3.3.2 Ekonometrikte ML’nin Özel Uygulamaları

Tedavi etkilerinin tahmini için nedensel ML, ekonometrikte ML’nin en gelişmiş uygulaması olmasına rağmen, ekonometrikte mevcut ekonometrik araç setini genişleten çeşitli özel ML uygulamaları da vardır.

Yukarıda, ML’nin ekonomik değişkenlerin ölçütlerini nasıl oluşturabileceğini sunduk. Bu kavramı genelleştirerek, ML, tüm ekonomik teorilerin tahmin edilebilirlik ölçüsünü de oluşturabilir. Peysakhovich ve Naecker (2017), ML’nin teorilerin tahmin gücünün üst sınırını elde etmek için kullanılabileceği fikrini ortaya koyar: ML yöntemleri ile verilen bir veri setindeki bağımlı değişkendeki açıklanabilir değişim. Fudenberg ve diğerleri (2019), bu fikri genişleterek ekonomik teoriler için bir tamlık ölçütü oluşturur. Tamlığı, model ve ekonomik teori tarafından varsayılan değişkenlerin kullanılmasıyla elde edilen hata ile ML ile elde edilebilecek hata arasındaki farkı karşılaştırarak hesaplarlar. Genel olarak, farklı veri setleri farklı bilgi seviyeleri içerir, bu nedenle farklı tahmin edilebilirlik seviyelerine izin verirler. Tahmin hatalarını ML yöntemleri ile elde edilebilecek hatalarla karşılaştırarak, farklı ekonomik teorilerin karşılaştırılması için daha adil ve bilgilendirici bir ölçüt oluşturmak mümkündür.

Ekonometrikte ve ML’de de ilgili bir sorun, dengesiz verilerdir. Örneğin, kredi performans verilerinde, gerçek temerrütler genellikle sorunsuz geri ödemelerden daha nadirdir. Sigrist ve Hirnschall (2019), bu tür problem türlerini ele almak için ML’yi geleneksel ekonometrik yöntemlerle birleştirir. Daha spesifik olarak, geleneksel Tobit modelini geliştirmek için geliştirilmiş regresyon ağaçları kullanırlar. Ayrıca, yöntemlerinin avantajlarını somut bir problemde, İsviçre’deki kredi temerrütlerine uygulayarak gösterirler.

Simülasyon alanında, Athey ve diğerleri (2021), geleneksel Monte Carlo yöntemleri yerine, gerçek verileri daha yakından taklit eden veriler simüle etmek için üretici adversaryal ağlar kullanır. Yöntemlerini, farklı ekonometrik tahminciler arasında performans karşılaştırmaları için simüle edilmiş veriler kullanarak gösterirler. Adams, Kräussl ve diğerleri (2021), sanal resimler oluşturmak için derin sinir ağlarını kullanarak sanat fiyatlarında cinsiyet ayrımcılığını incelemek için kullanır.

Son olarak, Ludwig ve diğerleri (2019), p-hacking’i önlemek için ML ile artırılmış ön analiz planlarını tanıtır. Standart doğrusal regresyonu, ML’den yeni regresörlerle artırırlar. Yeni regresörler, birçok potansiyel olarak ilgili değişkeni tek bir endekste toplar. Bu nedenle, yöntemleri standart ön analiz planlarında gerekli olan somut analiz seçimlerinin önceden belirlenmesini önler.

4 GELECEKTE FİNANSTA ML’NİN POTANSİYELİ

Yukarıda belirtildiği gibi, ML’nin geleneksel yöntemlere göre avantajları ve finansta mevcut ama sınırlı olan ML uygulamaları, gelecekteki araştırmalar için hala büyük ölçüde keşfedilmemiş bir potansiyel olduğunu düşündürmektedir. Ancak, ML yöntemlerinin finans topluluğunda geniş bir popülerlik kazanıp kazanmayacağı belirsizdir. Ayrıca, ML kullanıcıları, ML uygulamalarının mesleğin en prestijli dergilerine ulaşıp ulaşamayacağını veya sadece özel dergilerde mi yayınlanacağını bilmelidir. Son olarak, taksonomimizin tanımladığı ML uygulama kategorileri ve finans alanındaki geniş araştırma alanları, finansta ML’nin en umut verici uygulamalarının tam olarak nerede olduğunu belirlemeyi zorlaştırmaktadır. Bu bölümde, halihazırda ML yöntemlerini kullanan mevcut finans literatürünü sistematik olarak analiz ederek bu sorulara göstergeler sunuyoruz. Özellikle, bu tür makalelerin yayın başarısını ve bunun araştırma alanı ve uygulama türüne göre nasıl farklılık gösterdiğini araştırıyoruz. Sonuçlarımız, sadece finansta ML’nin gelecekteki potansiyelini göstermekle kalmayıp, aynı zamanda araştırmacıların ML’yi nerede ve nasıl uygulayabileceklerini de gösterebilir.

4.1 ML’yi Uygulayan Finans Araştırma Makalelerinin Örneği

ML uygulayan mevcut finans araştırmasının sistematik bir analizine başlamak için, ilgili yayınlardan oluşan bir örneklem oluşturuyoruz. Örneklemimizi, büyük finans dergilerinde yayınlanmış araştırma makalelerine odaklanarak oluşturuyoruz. Başlangıç noktası olarak, Alman Akademik İş Araştırmaları Birliği’nin (VHB-JOURQUAL3) dergi sıralamasındaki en yüksek sıralamaya sahip 45 finans dergisini (A+, A ve B kategorileri) seçiyoruz. Daha sonra her derginin web sitesini ziyaret ederek 2010’dan 2021’e kadar yayınlanmış ve başlık, özet veya tam metinlerinde aşağıdaki anahtar kelimelerden herhangi birini içeren tüm makaleleri indiriyoruz:

  • Genel ML ile ilgili terimler: “machine learning”, “big data”, “artificial intelligence”
  • ML yöntem kategorileri: “supervised learning”, “unsupervised learning”, “reinforcement learning”, “semisupervised learning”
  • Spesifik ML yöntemleri: “lasso”, “ridge”, “elastic net”, “decision tree”, “random forest”, “boosted regression trees”, “gradient boosting”, “support vector machine”, “support vector classification”, “support vector regression”, “neural network”, “naïve bayes”

Bu başlangıç örneğindeki her makaleyi okuyarak, analizlerinde makine öğrenimi kullanmayan makaleleri manuel olarak dışlıyoruz (örneğin, yukarıdaki anahtar kelimeleri sadece başkalarının çalışmalarını tanımlarken bahsederlerse). Sonuç olarak, 346 makaleden oluşan bir örneklem elde ediyoruz.

Araştırma alanı ve uygulama türüne göre yayın başarısındaki olası farklılıkları araştırmak için, her makaleyi her iki boyutta da sınıflandırıyoruz. Araştırma alanına göre sınıflandırma için JEL kodlarını kullanıyoruz. EconLit’in JEL kodları sağlamadığı birkaç durumda veya sağlanan kodların finansal ekonomi kod aralığına (G) girmemesi durumunda, bunun yerine makalelerden doğrudan elde edilen yazar tarafından sağlanan JEL kodlarını kullanıyoruz. Daha sonra örneklemimizdeki her makaleyi finansal ekonominin beş JEL alt alanından (G1–G5 kod aralığı) birine sınıflandırıyoruz. Bazı makaleler birden fazla JEL kodu taşıdığı için, örneklemimizde alt alan ataması belirsiz olan 68 makaleyi manuel olarak sınıflandırıyoruz. 29 durumda, belirsizliği bir makalenin JEL kodlarının çoğunluğuna göre alt alanı seçerek çözüyoruz. Kalan 39 durumda, en uygun alt alanı manuel olarak atıyoruz.

Uygulama türüne göre sınıflandırma için, her makalenin metodolojisini ayrıntılı olarak inceliyoruz ve ardından bunları taksonomimizin Bölüm 3’te tanımladığı üç arketipten birine sınıflandırıyoruz: (i) üstün ve yeni ölçütler, (ii) ekonomik tahmin problemleri ve (iii) yeni ekonometrik araçlar.

4.2 Finansta ML Uygulamaları Ne Kadar Umut Verici?

Finansta ML uygulamalarının gelecekteki potansiyeline dair göstergeler sunmak için, öncelikle mevcut ML uygulamalarının yayınlandığı dergileri analiz ediyoruz. Şekil 5, ML kullanımındaki büyük büyümeyi göstermektedir. 2018 yılında, ML kullanan yayınların sayısı önceki yılların ortalamasına göre üç katından fazla artmıştır. 2019 yılında, bu artış beş katından fazladır. 2020 yılında, ML kullanan yayınların sayısı önceki yıllara göre neredeyse yedi katına çıkmıştır ve 2021 yılında ML makalelerinin yayınlanma sayısında neredeyse on bir kat artış bulduk.

Bu analiz, ML uygulamalarının finans alanında ne kadar umut verici olduğunu değerlendirmek için önemli bir adım sunar. Son yıllarda ML kullanan yayınların sayısındaki büyük artış, ML’nin finans araştırmalarında giderek daha popüler hale geldiğini ve gelecekte daha fazla kullanılabileceğini göstermektedir.

4.2 Finansta ML Uygulamaları Ne Kadar Umut Verici?

Son yıllarda ML uygulayan finans yayınlarının sayısındaki güçlü artış, ML kullanımına yönelik net bir eğilim gösterse de, ML uygulamalarının mesleğin en prestijli dergilerinde yayınlanma potansiyeline sahip olup olmadığı sorusu cevapsız kalmaktadır. Tablo 5’in Panel A’sı, ML yayınlarının dergi sıralamasına göre zaman içinde nasıl evrildiğini göstermektedir. 2017 yılına kadar, erken dönem ML uygulamaları çoğunlukla B sıralamasındaki dergilerde yayınlanmıştı. Ancak, 2018’den itibaren, ML yayınlarının önemli bir kısmı en yüksek sıralamadaki dergilerde yayınlanmaya başlamıştır.

Daha düşük sıralamalı dergilerin (ve dolayısıyla ilgili dergilerdeki yayınların) sayısının daha yüksek sıralamalı dergilerden çok daha fazla olması gerçeğini kontrol etmek için, Panel B her yıl farklı sıralamadaki büyük finans dergilerinin yayınladığı toplam yayın sayısına göre ML yayınlarının oranını rapor eder. Sonuçlar, ML yayınlarının sayısındaki güçlü artışın, herhangi bir sıralamadaki dergilerin yayınladığı makale sayısındaki genel bir artıştan kaynaklanmadığını göstermektedir; mutlak sayılara benzer şekilde, ML kullanan yayınların nispi payı toplamda ve her dergi sıralaması için benzer şekilde artmıştır. 2021’de, dergi sıralamaları arasında ML yayınlarının nispi payında anlamlı bir fark yoktur: 2021’de yayınların yaklaşık %3-%4’ü, dergi sıralamasından bağımsız olarak ML kullanmıştır.

Year 2010 2011 2012 2013 2014 2015 2016 2017 Mean 2010–2017 2018 2019 2020 2021 Mean 2018–2021 Total
Panel A: Number of ML publications in major finance journals
Total 6 7 6 9 8 21 8 15 10 36 52 69 109 66.5 346
A+ 0 0 0 2 0 2 0 1 0.6 4 8 8 14 8.5 39
A 4 1 0 1 2 6 1 1 2.0 8 7 12 19 11.5 62
B 2 6 6 6 6 13 7 13 7.4 24 37 49 76 46.5 245
Panel B: Share of ML publications relative to all publications in major finance journals
Total 0.3% 0.3% 0.3% 0.4% 0.3% 0.9% 0.3% 0.6% 0.4% 1.4% 2.0% 2.3% 3.4% 2.3% 1.1%
A+ 0.0% 0.0% 0.0% 0.7% 0.0% 0.7% 0.0% 0.3% 0.2%b 1.3% 2.4% 2.2% 3.4% 2.4% 1.1%
A 0.6% 0.2% 0.0% 0.1% 0.3% 0.8% 0.2% 0.2% 0.3%c 1.2% 1.2% 1.9% 3.2% 1.9% 0.8%
B 0.2% 0.5% 0.5% 0.5% 0.4% 0.9% 0.4% 0.8% 0.5%b, c 1.5% 2.1% 2.5% 3.5% 2.5% 1.3%

4.2 Finansta ML Uygulamaları Ne Kadar Umut Verici?

Bu bölümdeki sonuçlarımız, ML’nin finansta gelecekteki potansiyeline dair iki ana gösterge sunmaktadır. İlk olarak, ML uygulayan finans yayınlarının sayısında istikrarlı ve sağlam bir büyüme vardır. Bu trendin önümüzdeki yıllarda daha fazla ML uygulamasıyla devam etmesi muhtemeldir. Yukarıda belirtilen ML’nin faydaları ve ML’nin akademi dışındaki artan önemi de başka bir sonuç beklemek için az neden bırakmaktadır. İkincisi, finansta ML uygulayan araştırmacılar, makalelerinin mesleğin en yüksek sıralamalı dergilerine ulaşma potansiyeline sahip olmasını makul bir şekilde bekleyebilirler. Şu anda bu tür dergilerde ML uygulamalarına dair birçok örnek bulunmakta olup, nispi payları artık daha düşük sıralamalı dergilerle karşılaştırılabilir bir seviyeye ulaşmıştır. Bu sonuçlar, finansta ML uygulamaları için parlak ve umut verici bir geleceğe işaret edebilir.

4.3 Finansta Hangi Tür ML Uygulamaları En Umut Verici?

Önceki bölümde, ML uygulamalarının son birkaç yılda en prestijli finans dergilerinde güçlü bir zaman serisi büyümesi gördüğünü gösterdik. Şimdi, hangi uygulamaların yayın başarısı açısından diğerlerinden daha umut verici olduğunu ele alıyoruz. Bu soruyu yanıtlamak için, önce araştırma alanına göre ML yayınlarının dağılımındaki farklılıkları ve dergi sıralamalarını inceliyoruz; ardından, analizimize üçüncü bir boyut olarak taksonomimizden (Bölüm 3’e bakın) sınıflandırmayı (metodolojik amaç) uyguluyoruz.

Tablo 6’da, ML yayınlarının araştırma alanına göre dağılımını incelemeye başlıyoruz. Sütun 1, çoğu ML yayınının (bugüne kadar) varlık fiyatlandırma ve ilgili alanlardan oluşan genel finansal piyasalar (G1) kategorisine ait olduğunu göstermektedir (%71,1). Finansal kurumlar ve hizmetler (G2, %13,6) ile kurumsal finans ve yönetişim (G3, %14,2) alanlarında önemli ölçüde daha az ML yayını yayınlanmıştır. Davranışsal finans (G4, %0,9) ve hanehalkı finansı (G5, %0,3) alanlarında çok küçük bir ML yayın payı vardır.

ML publications in major finance journals All publications in major finance journals z-stat for difference
(1) (2) (3) (4) (5) (6) (7) (8) (1)–(5) (2)–(6) (3)–(7) (4)–(8)
All A+ A B All A+ A B All A+ A B
General financial markets (G1) 71.1% 66.7% 53.2% 76.3% 47.1% 38.0% 36.1% 55.5% 8.84*** 3.67*** 2.78*** 6.49***
Financial institutions and services (G2) 13.6% 12.8% 32.3% 9.0% 25.4% 23.5% 31.3% 23.1% −5.03*** 1.56 0.15 −5.21***
Corporate finance and governance (G3) 14.2% 20.5% 14.5% 13.1% 27.3% 38.3% 32.4% 21.3% −5.44*** −2.27** −2.99*** −3.12***
Behavioural finance (G4) 0.9% 0.0% 0.0% 1.2% 0.0% 0.0% 0.0% 0.0% 9.72*** NA −0.11 9.64***
Household finance (G5) 0.3% 0.0% 0.0% 0.4% 0.1% 0.3% 0.2% 0.1% 0.73 −0.35 −0.31 1.75***
Nobs 346 39 62 245 18,605 3,241 5,089 10,275
Chi-squared statistics (p value): 0.000*** 0.004*** 0.025** 0.000***

Tüm yayınlanan finans makalelerinin araştırma alanına göre dağılımındaki heterojenliği hesaba katmak için, ML yayınlarının dağılımını büyük finans dergilerindeki tüm yayınların dağılımıyla karşılaştırıyoruz. Bu karşılaştırma, genel finansal piyasalar (G1) kategorisinin de büyük finans dergilerinde en büyük alanı temsil etmesi durumunda önemlidir. Eğer öyleyse, önceki sonuç sadece genel finansal piyasalar kategorisine (G1) ait büyük yayın sayısından kaynaklanabilir. Bu nedenle, Sütun 5, tüm (2010–2021) yayınların alanlara göre dağılımını göstermektedir ve ardından ML yayınlarının alanlara göre dağılımıyla karşılaştırıyoruz. Sütun 1 ve 5’in görsel olarak incelenmesi, araştırma alanı etkileri dikkate alındıktan sonra bile, ML makalelerinin diğer alanlara göre genel finansal piyasalar kategorisinde önemli ölçüde daha yaygın olduğunu göstermektedir. Kategorik değişkenlerle iki dağılım arasındaki sistematik farkları test eden bir Pearson χ² testi, bu gözlemi her olası anlamlılık düzeyinde doğrulamaktadır (bkz. Tablo 6’nın son satırı). Proportionlar arasındaki farklar için z-testleri kullanarak yapılan ek analizlerde, Sütun 9, ML yayınlarının dağılımının, genel finansal piyasalar alanındaki ML makalelerinin payının (G1: %71,1 vs. %47,1, z-istatistiği: 8,84) önemli ölçüde daha yüksek ve finansal kurumlar ve hizmetler (G2: %13,6 vs. %25,4, z-istatistiği: −5,03) ve kurumsal finans ve yönetişim (G3: %14,2 vs. %27,3, z-istatistiği: −5,44) alanlarındaki makalelerin payının daha düşük olduğunu göstermektedir. Davranışsal finans (G4) ve hanehalkı finansı (G5) alanlarında örneklem büyüklükleri ekonomik olarak anlamlı sonuçlar çıkarmak için çok küçüktür. Sütun 10–12’de her üç dergi sıralama kategorisi (A+, A ve B) için analizimizi tekrar ediyoruz ve niteliksel olarak benzer sonuçlar buluyoruz.

İkinci olarak, ML yayınlarının metodolojik amaca göre dağılımını inceliyoruz (taksonomimize bakın, Bölüm 3). Tablo 7 (Panel A, Sütun 1), tüm alanlardaki ML yayınlarının tam örneği için dağılımı gösterir. Yayınların büyük çoğunluğu (%69,1), ekonomik tahmin problemlerinde tahmin hatasını azaltmak için ML’yi uygular. Üstün ve yeni ölçütler oluşturmak için ML kullanmak ortalama olarak çok daha az yaygındır (%25,1). Çok az finans yayını (%5,8), ekonometrik araç setini genişletmek için ML kullanır. Sütun 2-4, dergi sıralamasına göre güçlü bir heterojenlik olduğunu ortaya koymaktadır. Özellikle, en yüksek sıralamalı dergilerdeki (A+) yayınlar, daha düşük sıralamalı dergilerdeki yayınlara kıyasla üstün ve yeni ölçütler oluşturmak için orantısız olarak daha sık ML kullanır (%56,4 vs. %32,3 ve %18,4). Bu farklılıklar, dergi sıralama kategorileri arasında z-testleri kullanılarak %5 düzeyinde istatistiksel olarak anlamlıdır. Öte yandan, ekonomik tahmin problemleri en yüksek sıralamalı dergilerde daha az yaygındır (%38,5 vs. %62,9 ve %75,5), bu da yine istatistiksel olarak anlamlıdır.

All A+ A B
(1) (2) (3) (4)
Panel A: Distribution of application types
n = 346 n = 39 n = 62 n = 245
Superior and novel measures 25.1% 56.4%a, b 32.3%a, c 18.4%b, c
Economic prediction problems 69.1% 38.5%a, b 62.9%a, c 75.5%b, c
New econometric tools 5.8% 5.1% 4.8% 6.1%
Panel B: Distribution of application types in each research field
General financial markets (G1) n = 246 n = 26 n = 33 n = 187
Superior and novel measures 22.0% 38.5%b 33.3%c 17.6%b, c
Economic prediction problems 71.1% 57.7% 63.6% 74.3%
New econometric tools 6.9% 3.8% 3.0% 8.0%
Financial institutions and services (G2) n = 47 n = 5 n = 20 n = 22
Superior and novel measures 29.8% 80.0%a, b 30.0%a 18.2%b
Economic prediction problems 66.0% 0.0%a, b 65.0%a 81.8%b
New econometric tools 4.3% 20.0%b 5.0% 0.0%b
Corporate finance and governance (G3) n = 49 n = 8 n = 9 n = 32
Superior and novel measures 32.7% 100.0%a, b 33.3%a 15.6%b
Economic prediction problems 65.3% 0.0%a, b 55.6%a 84.4%b
New econometric tools 2.0% 0.0% 11.1% 0.0%
Behavioural finance (G4) n = 3 n = 0 n = 0 n = 3
Superior and novel measures 100.0% NA NA 100.0%
Economic prediction problems 0.0% NA NA 0.0%
New econometric tools 0.0% NA NA 0.0%
Household finance (G5) n = 1 n = 0 n = 0 n = 1
Superior and novel measures 0.0% NA NA 0.0%
Economic prediction problems 100.0% NA NA 100.0%
New econometric tools 0.0% NA NA 0.0%
Farklı araştırma alanlarında uygulama türlerinin yayın başarısındaki farklılıkları tespit etmek için, önceki analizi Tablo 7’nin Panel B’sinde her araştırma alanı için ayrı ayrı tekrar ediyoruz. Özellikle, finansın belirli alanlarında üstün ve yeni ölçütlerin daha başarılı olup olmadığını belirlemek için sistematik kalıpları belirlemekle ilgileniyoruz. Panel B, Sütun 1’de gösterildiği gibi, üstün ve yeni ölçütler orantısız bir şekilde finansal kurumlar (G2) ve kurumsal finans (G3) literatürlerinde daha sık kullanılmaktadır (%29.8 ve %32.7 vs. %25.1). İlginçtir ki, bu iki alan içinde, A+ sıralamalı dergilerdeki yayınlar (Sütun 2) neredeyse tamamen üstün ve yeni ölçütler oluşturmak için ML kullanmaktadır (%80.0 ve %100.0).

4.3.1 Atıflarla Analiz

Bulgularımızı daha da desteklemek için, atıfları yayın başarısının alternatif bir ölçüsü olarak analiz ediyoruz. Örneklemimizdeki her ML yayını için Web of Science’dan (19 Eylül 2022 itibariyle) atıf sayısını alıyor ve bunu büyük finans dergilerinde yayınlanan tüm makalelerin ortalama atıf sayısıyla karşılaştırıyoruz. Bir makalenin atıf sayısının (19 Eylül 2022 itibariyle) doğal olarak yayınlandığı zamana bağlı olması nedeniyle, atıf sayısını şu şekilde düzeltiyoruz: Örneklemimizdeki her ML yayını için, fazladan atıfları hesaplıyoruz, bu da bir makalenin gerçek atıf sayısı ile aynı yıldaki büyük finans dergilerindeki tüm yayınların ortalama atıf sayısı arasındaki farktır. Daha sonra fazladan atıflardaki farklılıkları araştırma alanı ve uygulama türüne göre inceliyoruz ve fazladan atıfların sıfırdan istatistiksel olarak ayırt edilemez olduğunu (yani, bir yıldaki ML yayınları ile tüm yayınlar arasında atıf sayısında fark olmadığını) savunan null hipotezine karşı t-testleri uyguluyoruz. Tablo 8, sonuçlarımızı göstermektedir. Genel olarak, ML yayınları, aynı yıldaki büyük finans dergilerindeki ortalama yayından 3.0 daha fazla atıf almaktadır, bu da %10 düzeyinde istatistiksel olarak anlamlıdır. Uygulama türlerine göre, üstün ve yeni ölçütler oluşturmak için ML kullanan yayınlar, büyük finans dergilerindeki genel yayınlardan 10.2 daha fazla atıf almaktadır, bu da %1 düzeyinde oldukça anlamlıdır. Alanlar arasında, kurumsal finans/yönetişimdeki ML yayınları, büyük finans dergilerindeki genel yayınlardan 7.6 daha fazla atıf almaktadır, bu da %5 düzeyinde anlamlıdır. Son olarak, kurumsal finans/yönetişimle ilgili üstün ve yeni ölçütler oluşturmak için ML uygulayan yayınlar, 24.2 daha fazla atıf almakta ve bu da %1 düzeyinde oldukça anlamlıdır. Örneklemimizdeki ortalama ML yayınının 16.2 kez atıf aldığı göz önüne alındığında, bu etkiler sadece istatistiksel olarak anlamlı değil, aynı zamanda ekonomik olarak da büyüktür. Sonuç olarak, atıf analizinden elde edilen sonuçlar, dergi sıralamalarını kullanarak yapılan önceki analizle tutarlıdır ve bu nedenle destekleyici kanıt sağlar.

All types Superior and novel measures Economic prediction problems New econometric tools
Full Sample n = 346 3.0* 10.2*** 1.2 −7.0*
By field
General financial markets (G1) n = 246 2.3 9.3** 1.1 −8.0**
Financial institutions and services (G2) n = 47 2.4 1.0 3.7 −8.2
Corporate finance and governance (G3) n = 49 7.6** 24.2*** −0.9 13.7
Behavioural finance (G4) n = 3 −5.3** −5.3** NA NA
Household finance (G5) n = 1 −1.5 NA −1.5 NA

 

Bulgularımız Bu Bölümde Üç Önemli Sonuç Veriyor:

İlk olarak, ML’nin üstün ve yeni ölçütler oluşturmak için kullanılması, güçlü bir gelecek potansiyeline sahip bir uygulama türü gibi görünmektedir. Bugüne kadar çoğu yayın ML’yi ekonomik tahmin problemlerinde kullanırken, üstün ve yeni ölçütler için ML kullanan makaleler daha yüksek sıralamalı dergilerde yer almış ve daha fazla atıf almıştır. İkincisi, ML’yi kurumsal finans ve yönetişim alanında uygulayan makaleler, ML’nin üstün ve yeni ölçütler üretme yeteneğinden fayda sağlamaktadır. Son olarak, davranışsal finans ve hanehalkı finansı alanlarındaki mevcut araştırma azlığı, gelecekteki ML uygulamaları için başka cazip bir yol sunmaktadır.

5 SONUÇ

Bu makalede, araştırmacıların ML teknolojisini finansta nasıl kullanabileceklerini inceledik. İlk olarak, farklı ML türlerinin, OLS ile yapılan geleneksel doğrusal regresyondan farklı problemleri çözdüğünü belirledik. OLS’nin özellikleri açıklama problemleri için faydalı iken, gözetimli ML tahmin problemleri için üstün bir yöntemdir. Emlak varlık fiyatlandırma tahmini problemini kullanarak gösterdiğimiz gibi, ML tabanlı fiyat tahminleri, OLS’ye göre önemli ölçüde daha düşük fiyat hataları elde edebilir.

Makalenin ikinci bölümünde, finansta ML uygulamalarının şu şekilde bir taksonomisini geliştirdik: (1) üstün ve yeni ölçütlerin oluşturulması, (2) ekonomik tahmin problemlerinde tahmin hatasının azaltılması ve (3) mevcut ekonometrik araç setinin genişletilmesi. Bu taksonomi birçok amaca hizmet eder. İlk olarak, finansta mevcut ML literatürünün sistematik bir incelemesini sağlar. İkincisi, yeni katkıların ve bunların mevcut literatürle nasıl ilişkili olduğunun daha iyi anlaşılmasını sağlar. Son olarak, araştırmacıların olası uygulamaları keşfetmelerine rehberlik edebilir ve böylece finansta yeni ML çalışmalarını kolaylaştırabilir.

Son bölümde, büyük finans dergilerinde yayınlanan ML makalelerini analiz ederek finansta ML uygulamalarının gelecekteki potansiyeline dair göstergeler sunduk. Son birkaç yılda, finansta ML uygulamalarının sayısında güçlü bir artış olmuş ve bu uygulamaların birçoğu mesleğin en yüksek sıralamalı dergilerine ulaşmıştır. Sonuçlarımız, ML’nin önümüzdeki yıllarda finans araştırmalarında daha da yaygın hale gelebileceğini öne sürmektedir. Ayrıca, ML’nin, kurumsal finans ve yönetişimle ilgili konuların üstün ve yeni ölçütlerini oluşturmak için sıradışı verilere uygulanmasında büyük bir potansiyel taşıdığını göstermektedir. Davranışsal ve hanehalkı finansı alanları da gelecekteki araştırmalar için ML için büyük ölçüde kullanılmamış bir potansiyel sunabilir.

 

 

 

 

 

 

 

 

 

 

 

 

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir