Ciencia de datos en sistemas de gestión de riesgos: Enfoque hacia la minería de datos
A lo largo de los años, los progresos en la tecnología y los enfoques utilizados en los modelos de riesgo y calificación crediticia han posibilitado la integración de tecnologías avanzadas de inteligencia artificial. Estas técnicas han demostrado significativamente la precisión de los algoritmos, aunque pueden carecer de explicaciones exhaustivas para la toma de decisiones.
Poco se ha explorado objetivamente sobre la ciencia de datos como metodología alternativa, la mayoría de las investigaciones se han enfocado en determinar qué tipos de información deberían utilizar las instituciones financieras para evaluar el peligro crediticio de las pequeñas y medianas empresas (PYME). No obstante, existen escasas pruebas disponibles acerca de los beneficios potenciales de aplicar metodologías de inteligencia artificial explicables para evaluar las calificaciones crediticias de las PYME. Por ende, no existen comparaciones significativas entre los enfoques paramétricos tradicionales y estrategias de aprendizaje supervisado en este contexto de investigación.
Hasta ahora se conoce de enfoques paramétricos tradicionales que ejecutan un modelo probit ordenado, mientras que otros métodos emplean un análisis no paramétrico mediante aprendizaje automatizado, denominado Bosque aleatorio histórico (HRF). Durante el análisis de estos dos enfoques, deseamos obtener una comprensión más detallada de su eficacia y ventajas potenciales al momento de evaluar la rentabilidad crediticia de las PYME. La adopción de métodos alternativos para predecir las calificaciones crediticias de las pequeñas y medianas empresas (PYME) ha tenido un impacto significativo en la investigación científica. Estas estrategias comprende técnicas de minería de datos, enfoque en árboles, inteligencia artificial (IA) y enfoques híbridos. Esta tendencia ha sido estudiada de manera amplia en estudios pasados, entre ellos, los mapas autoorganizados tipo SOM.
Asimismo, la reciente expansión de la digitalización de los mercados financieros, conocida como Fintech, ha dado lugar a progresos tecnológicos sin precedentes y al surgimiento de diversas metodologías estadísticas en el ámbito financiero.
En consecuencia, los bancos han comenzado a utilizar técnicas de estimación avanzadas para evaluar el peligro crediticio en las PYME. No obstante, los reguladores todavía no han estandarizado el uso de algoritmos de aprendizaje automático y de inteligencia artificial en este ámbito. Esto debido al poco dominio en la usabilidad y corrida de datos a través de las técnicas de aprendizaje automático y que puedan generar sesgos que amenacen la integración financiera y ocasionar cuestiones relacionadas con la protección del consumidor, la ética, la privacidad y la transparencia, que son de suma relevancia para los responsables e impulsores de políticas de mercado.
Los autores del libro disciernen en el campo de la predicción de mercados, finanzas y procesos en general y, el aprendizaje automático que se utiliza comúnmente para crear un modelo de evaluación de estos sistemas de riesgos basados en minería de datos y algoritmos. Este modelo tiene como objetivo clasificar una observación de contexto dado como resultado de "fallo" o "no fallo". Básicamente, el modelo examina variables o indicadores independientes que representan la situación de un mercado financiero durante un período de tiempo específico. Primero aprende de estos datos y luego predice, con cierto nivel de confianza, si el sistema enfrentará la quiebra o no. Esta es la ciencia de datos que se emplea en la actualidad para estimar parámetros, ajustar datos y aplicar propiedades estadísticas a las estimaciones.