Científico de Datos, Investigador y Economista
Ofrezco servicios de consultoría profesional y soluciones en análisis de datos, desarrollo de sistemas de información, investigación económica, estadística y finanzas para todo tipo de empresas, en especial las del sector Salud, industrial y eCommerce. Soy un Científico de datos y economista con una amplia experiencia y formación en datos, cuento con más de 3 años de experiencia prestando servicios a entidades públicas y privadas.
Este proyecto aborda la detección de fraude con tarjetas de crédito, un problema de clasificación binaria con desbalance extremo. A partir del dataset público (cargado con kagglehub), se realiza una exploración inicial enfocada en sesgos de distribución y separabilidad por clase: transformación logarítmica del monto (AmountLog) para estabilizar colas, KDE por clase y gráficos hexbin para evitar sobrecarga visual, además de una revisión de los componentes principales V1–V28 (PCA). Con base en esa EDA, se derivan características: transformaciones del monto (log/sqrt/zscore), selección de V’s con mayor diferencia entre clases y agregados (sum/mean/std/skew), más funciones no lineales (abs, cuadrado, log_abs). Se elimina ruido con una limpieza de outliers por clase mediante IQR, y se establece una partición estratificada train/test para preservar prevalencias.
El modelado se articula en Pipelines con un ColumnTransformer que escala solo variables no-PCA (RobustScaler), y tres estrategias comparadas con validación cruzada estratificada: base, sobremuestreo y submuestreo. El clasificador es XGBoost, sintonizado con RandomizedSearchCV optimizando Average Precision (AUPRC), métrica idónea en escenarios desbalanceados. Tras elegir el mejor pipeline por AUPRC, se reentrena y evalúa en test reportando ROC-AUC, AUPRC, F1, balanced accuracy y matriz de confusión; se extrae importancia de variables para diagnóstico. Finalmente, se define un umbral operativo sobre las probabilidades (partiendo de 0.05 hasta 0.95) y se realiza un análisis económico coste‑beneficio (fraudes evitados, fraudes perdidos, costo de investigación y falsas alarmas) barriendo thresholds para maximizar ahorro neto/ROI, alineando la decisión del modelo con el impacto de negocio.
Notebook y diapositiva ejecutiva disponibles: https://github.com/XxHurtadoxX/Credit-Card-Fraud-Detection
Aquí encontrarás proyectos y análisis relacionados con los fundamentos económicos, teorías y conceptos claves.
Adéntrate en el mundo de la ciencia de datos y descubre cómo utilizo herramientas y técnicas avanzadas para extraer información valiosa de conjuntos de datos complejos.
Descubre proyectos relacionados con la gestión financiera, modelado, análisis de inversiones y más.
Ofrezco consultorías empresariales que combinan el análisis económico, la gestión financiera y el desarrollo de soluciones de analítica avanzada. Te ayudo a mejorar la eficiencia operativa, optimizar el uso de recursos y transformar datos en información accionable para una toma de decisiones más inteligente. Mi objetivo es que tu empresa alcance sus metas, minimice riesgos y aumente de forma sostenible su rentabilidad.
Brindo servicios especializados de investigación y consultoría académica, orientados a respaldar a investigadores, instituciones y profesionales en el diseño, desarrollo, análisis y presentación de proyectos. Garantizo rigor metodológico, solidez en el manejo de datos y resultados claros que aporten valor académico y práctico.