Publication: Valuation of fixed income securities and estimation of term structure on international bond market using machine learning techniques
Institution Authors
Authors
Journal Title
Journal ISSN
Volume Title
Type
Master's thesis
Access
restrictedAccess
Publication Status
Unpublished
Abstract
In this study, I focus on predicting bond risk premia in Turkish Eurobonds market using machine learning methods. Machine learning uses statistical learning techniques to gather useful structures of a data set without being explicitly programmed. In recent years machine learning has become a very popular topic and shown very good results in a wide variety of fields, but there is a lack of research in the field of term structure modeling. In order to predict Turkish Eurobond returns, I implemented several machine learning models such as OLS, PCA, Ridge, Lasso, Elastic net and neural networks. The raw data set I used comprises of Turkey Government Eurobond yields between 2005 and 2020, inclusive. Both monthly and yearly returns are estimated separately. Zero-coupon rates and forward rates are calculated from the raw data and used as left-hand site elements for machine learning predictions. Macroeconomic variables are also added to forward rates as factors. I compared the out-of-sample performance of the models and I found that Penalized linear regression yields the best results for excess bond return prediction, providing nearly 10% out-of-sample R2. Neural networks are the second-best performer yielding around 3-4% out-of-sample R2. Plus, adding macroeconomic variables to the models slightly improved the results by 2-3%. Also, yearly returns estimation performed better than monthly returns for OLS, Ridge, Lasso and Elastic net regressions, but not for neural networks.
Bu tez çalışması, Türkiye Eurobond piyasası getiri eğrisini ve farklı vadelerdeki bono getirilerini makine öğrenmesi yöntemleri kullanılarak modellenmesine odaklanacaktır. Makine öğrenimi, detaylıca programlanmadan bir veri kümesinin yararlı yapılarını toplamak için istatistiksel öğrenme tekniklerini kullanır. Son yıllarda makine öğrenimi çok daha popüler bir konu haline geldi ve çeşitli alanlarda çok iyi sonuçlar gösterdi, ancak getiri eğrisini modelleme alanında araştırma eksikliği olduğu dikkatimizi çekmekte. Faiz oranlarının vade yapısını modellemek için yapay sinir ağları, derin öğrenme yöntemleri, doğrusal modeller, cezalı doğrusal regresyonlar ve boyutluluk azaltma teknikleri gibi makine öğrenmesi tekniklerini kullandık. Ham data, 2005 ve 2020 yılları arasındaki Turkiye Eurobondları faizlerinden oluşturulmuştur. Aylık ve yıllık getiriler ayrı ayrı tahmin edilmiştir. Ham data kullanılarak önce kuponsuz tahvil getiri eğrisi, sonraısında da ileri vadeli getiriler hesaplanmış ve modellerin bağımlı değişkenleri olarak dahil edilmiştir. Bu değişkenlere makro ekonomik veriler de eklenerek ayrıca tahmin yapılmıştır. Modellerin örneklem dışı performanslarını kıyaslarak incelendiğinde cezalı doğrusal regresyonların yaklaşık 10% R2OOS sağlayarak en başarılı modeller olduğu görülmüştür. Sinir ağları modelleri 3-4% R2OOS ile en başarılı ikinci performansı sergilemiştir. Makro verilerin modellere değişken olarak eklenmesi sonuçları 2-3% iyileştirmiştir. Ayıca, doğrusal ve cezalı doğrusal modeller için yıllık getiri tahminleri aylık getiri tahminlerine göre daha iyi sonuç vermiştir.
Bu tez çalışması, Türkiye Eurobond piyasası getiri eğrisini ve farklı vadelerdeki bono getirilerini makine öğrenmesi yöntemleri kullanılarak modellenmesine odaklanacaktır. Makine öğrenimi, detaylıca programlanmadan bir veri kümesinin yararlı yapılarını toplamak için istatistiksel öğrenme tekniklerini kullanır. Son yıllarda makine öğrenimi çok daha popüler bir konu haline geldi ve çeşitli alanlarda çok iyi sonuçlar gösterdi, ancak getiri eğrisini modelleme alanında araştırma eksikliği olduğu dikkatimizi çekmekte. Faiz oranlarının vade yapısını modellemek için yapay sinir ağları, derin öğrenme yöntemleri, doğrusal modeller, cezalı doğrusal regresyonlar ve boyutluluk azaltma teknikleri gibi makine öğrenmesi tekniklerini kullandık. Ham data, 2005 ve 2020 yılları arasındaki Turkiye Eurobondları faizlerinden oluşturulmuştur. Aylık ve yıllık getiriler ayrı ayrı tahmin edilmiştir. Ham data kullanılarak önce kuponsuz tahvil getiri eğrisi, sonraısında da ileri vadeli getiriler hesaplanmış ve modellerin bağımlı değişkenleri olarak dahil edilmiştir. Bu değişkenlere makro ekonomik veriler de eklenerek ayrıca tahmin yapılmıştır. Modellerin örneklem dışı performanslarını kıyaslarak incelendiğinde cezalı doğrusal regresyonların yaklaşık 10% R2OOS sağlayarak en başarılı modeller olduğu görülmüştür. Sinir ağları modelleri 3-4% R2OOS ile en başarılı ikinci performansı sergilemiştir. Makro verilerin modellere değişken olarak eklenmesi sonuçları 2-3% iyileştirmiştir. Ayıca, doğrusal ve cezalı doğrusal modeller için yıllık getiri tahminleri aylık getiri tahminlerine göre daha iyi sonuç vermiştir.