
Ciencia y Educación
(L-ISSN: 2790-8402 E-ISSN: 2707-3378)
Vol. 7 No. 1.1
Edición Especial I 2026
Página 911
using metrics such as accuracy, sensitivity, F1-
score, and AUC. Results indicate that Random
Forest + SMOTE achieves the best balance
between precision (PR-AUC: 0.345) and
positive case detection capacity, while Logistic
Regression + SMOTE reaches the highest F1-
score (0.404), standing out for its clinical
interpretability. The study demonstrates that
machine learning models significantly
outperform traditional linear approaches in
early identification of cardiovascular risk in
young adults.
Keywords: Cardiovascular risk, Young
adults, Machine learning, Longitudinal
data, Arterial hypertension, Clinical
prediction.
Sumário
O projeto concentra-se na previsão precoce do
risco cardiovascular incidente em população
jovem mediante avaliação e comparação de três
algoritmos de aprendizagem automática:
Regressão Logística, Random Forest e Redes
Neurais. As Doenças Cardiovasculares (DCV)
constituem a principal causa de mortalidade
global, e marcadores clínicos precoces como a
hipertensão arterial desempenham papel
determinante na evolução futura do risco. A
evidência científica indica que os fundamentos
desta patologia apresentam-se na idade adulta
precoce (18-35 anos). Os modelos tradicionais
de estratificação de risco mostraram
desempenho limitado em população jovem.
Para abordar esta limitação, emprega-se um
desenho metodológico baseado em dados
clínicos longitudinais harmonizados da
Pesquisa Nacional de Saúde e Nutrição do
Equador (ENSANUT), realizando uma
comparação sistemática de modelos de
aprendizagem automática. O desempenho
preditivo é avaliado mediante métricas como
precisão, sensibilidade, F1-score e AUC. Os
resultados indicam que Random Forest +
SMOTE alcança o melhor equilíbrio entre
precisão (PR-AUC: 0.345) e capacidade de
detecção de casos positivos, enquanto a
Regressão Logística + SMOTE atinge o maior
F1-score (0.404), destacando-se pela sua
interpretabilidade clínica. O estudo demonstra
que os modelos de aprendizagem automática
superam significativamente as abordagens
lineares tradicionais na identificação precoce
do risco cardiovascular em adultos jovens.
Palavras-chave: Risco cardiovascular,
População jovem, Aprendizagem
automática, Dados longitudinais,
Hipertensão arterial, Previsão clínica
Introducción
Las enfermedades cardiovasculares (ECV)
representan la principal causa de mortalidad
global, generando una demanda creciente de
recursos sanitarios y un impacto económico
considerable asociado a hospitalizaciones,
tratamientos crónicos y pérdida de
productividad (WHO, 2023). Comprender las
ECV como un proceso acumulativo y
progresivo, no como eventos aislados, se vuelve
fundamental para la práctica médica moderna y
el diseño de estrategias preventivas efectivas
(Rajkomar et al., 2019). Investigaciones
recientes demuestran que las alteraciones
cardiovasculares comienzan en edades
tempranas. Factores como el aumento
progresivo de la presión arterial, dislipidemia
subclínica y aumento del índice de masa
corporal aparecen desde la juventud, incluso de
manera asintomática (Salah y Srinivas, 2022;
Liu et al., 2023). El riesgo cardiovascular se
operacionaliza mediante la predicción de
hipertensión arterial (HTA) incidente, ya que la
presión arterial elevada en edades tempranas es
un determinante clave en la progresión futura de
enfermedad cardiovascular (Martin et al.,
2024). La población joven (18-35 años)
constituye un grupo sustancial que determina la
evolución del riesgo cardiovascular a largo
plazo.
Los modelos tradicionales de estimación de
riesgo cardiovascular, como Framingham Risk
Score o ASCVD, no han sido diseñados para
población joven, mostrando desempeño