Register
Login
Resources
Docs Blog Datasets Glossary Case Studies Tutorials & Webinars
Product
Data Engine LLMs Platform Enterprise
Pricing Explore
Connect to our Discord channel

preprocess.yaml 3.4 KB

You have to be logged in to leave a comment. Sign In
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
  1. # Configuración de preprocesamiento para el pipeline de Credit Scoring.
  2. # Define el target, features, nuevas features, parámetros de división,
  3. # traducciones, reglas de limpieza y codificación.
  4. target: Puntaje_Credito # Nombre de la columna objetivo para el modelo.
  5. features: # Lista de features seleccionadas, ajustada a columnas generadas.
  6. - Edad
  7. - Salario_Mensual
  8. - Num_Tarjetas_Credito
  9. - Tasa_Interes
  10. - Retraso_Pago
  11. - Num_Pagos_Retrasados
  12. - Cambio_Limite_Credito
  13. - Num_Consultas_Credito
  14. - Deuda_Pendiente
  15. - Edad_Historial_Credito
  16. - Total_Cuota_Mensual
  17. - Inversion_Mensual
  18. - Saldo_Mensual
  19. - Comportamiento_de_Pago_High_spent_Large_value_payments
  20. - Comportamiento_de_Pago_High_spent_Medium_value_payments
  21. - Comportamiento_de_Pago_High_spent_Small_value_payments
  22. - Comportamiento_de_Pago_Low_spent_Large_value_payments
  23. - Comportamiento_de_Pago_Low_spent_Medium_value_payments
  24. - Comportamiento_de_Pago_Low_spent_Small_value_payments
  25. - Mezcla_Crediticia_Bad
  26. - Mezcla_Crediticia_Good
  27. - Mezcla_Crediticia_Standard
  28. - Pago_Minimo_No
  29. - Pago_Minimo_Yes
  30. - Ocupacion_Architect
  31. - Ocupacion_Developer
  32. - Ocupacion_Doctor
  33. - Ocupacion_Engineer
  34. - Ocupacion_Entrepreneur
  35. - Ocupacion_Journalist
  36. - Ocupacion_Lawyer
  37. - Ocupacion_Manager
  38. - Ocupacion_Mechanic
  39. - Ocupacion_Media_Manager
  40. - Ocupacion_Musician
  41. - Ocupacion_Scientist
  42. - Ocupacion_Teacher
  43. - Ocupacion_Writer
  44. - debt_to_income
  45. - payment_to_income
  46. - credit_history_ratio
  47. new_features: # Nuevas features calculadas.
  48. - name: debt_to_income
  49. formula:
  50. operation: divide
  51. columns: [Deuda_Pendiente, Salario_Mensual]
  52. - name: payment_to_income
  53. formula:
  54. operation: divide
  55. columns: [Total_Cuota_Mensual, Salario_Mensual]
  56. - name: credit_history_ratio
  57. formula:
  58. operation: divide
  59. columns: [Edad_Historial_Credito, Edad]
  60. test_size: 0.2 # Proporción del dataset para prueba.
  61. random_state: 42 # Semilla para reproducibilidad.
  62. translations: # Traducciones de columnas crudas.
  63. ID: ID
  64. Customer_ID: ID_Cliente
  65. Month: Mes
  66. Name: Nombre
  67. Age: Edad
  68. SSN: Numero_Seguro_Social
  69. Occupation: Ocupacion
  70. Annual_Income: Ingreso_Anual
  71. Monthly_Inhand_Salary: Salario_Mensual
  72. Num_Bank_Accounts: Num_Cuentas_Bancarias
  73. Num_Credit_Card: Num_Tarjetas_Credito
  74. Interest_Rate: Tasa_Interes
  75. Num_of_Loan: Num_Prestamos
  76. Type_of_Loan: Tipo_Prestamo
  77. Delay_from_due_date: Retraso_Pago
  78. Num_of_Delayed_Payment: Num_Pagos_Retrasados
  79. Changed_Credit_Limit: Cambio_Limite_Credito
  80. Num_Credit_Inquiries: Num_Consultas_Credito
  81. Credit_Mix: Mezcla_Crediticia
  82. Outstanding_Debt: Deuda_Pendiente
  83. Credit_Utilization_Ratio: Ratio_Utilizacion_Credito
  84. Credit_History_Age: Edad_Historial_Credito
  85. Payment_of_Min_Amount: Pago_Minimo
  86. Total_EMI_per_month: Total_Cuota_Mensual
  87. Amount_invested_monthly: Inversion_Mensual
  88. Payment_Behaviour: Comportamiento_de_Pago
  89. Monthly_Balance: Saldo_Mensual
  90. Credit_Score: Puntaje_Credito
  91. cleaning: # Reglas de limpieza.
  92. min_age: 18
  93. max_age_credit_ratio: 1.5
  94. drop_columns:
  95. - ID
  96. - ID_Cliente
  97. - Mes
  98. - Ingreso_Anual
  99. - Ratio_Utilizacion_Credito
  100. - Num_Cuentas_Bancarias
  101. - Num_Prestamos
  102. - Nombre
  103. - Tipo_Prestamo
  104. - Numero_Seguro_Social
  105. encoding: # Reglas de codificación.
  106. Comportamiento_de_Pago:
  107. drop: null
  108. Mezcla_Crediticia:
  109. drop: null
  110. Pago_Minimo:
  111. drop: first
  112. Ocupacion:
  113. drop: first
  114. target_classes: # Clases del target.
  115. - Poor
  116. - Standard
  117. - Good
Tip!

Press p or to see the previous file or, n or to see the next file

Comments

Loading...