¿Qué es godml?
📦PyPIv1.1.1✅CIpassing🐍Python3.11 · 3.12 · 3.13🛡️SLSALevel 3📊Coverage54%+🔏Sigstoreverified⚖️LicenseMIT🔐OpenSSFScorecard
godml es un framework open-source de Python que convierte un archivo YAML en un pipeline de machine learning completo — con compliance automático, tracking en MLflow y soporte para AWS SageMaker.
¿Primera vez aquí?
Ve directo al Quickstart de 5 minutos para tener tu primer modelo entrenado antes de seguir leyendo.
El problema que resuelve
La mayoría de proyectos de ML terminan así:
train.py ← solo funciona en mi máquina
predict.py ← sin versionado
notebook.ipynb ← sin reproducibilidad
# y cero compliance
godml lo resuelve con un contrato explícito:
godml.yml
name: customer-churn
version: 1.0.0
provider: mlflow # o sagemaker
dataset:
uri: ./data/churn.csv
target: churned
governance:
compliance: pci-dss # masking automático de PII
policy: mask_sensitive
model:
type: xgboost
hyperparameters:
max_depth: 6
eta: 0.3
metrics:
- name: auc
threshold: 0.80
godml run -f godml.yml
Un archivo. Un comando. Pipeline completo.
Qué hace godml por ti
Comparativa rápida
| godml | sklearn puro | MLflow solo | SageMaker SDK | |
|---|---|---|---|---|
| Pipeline declarativo en YAML | ✅ | ❌ | ❌ | ❌ |
| Compliance PCI-DSS automático | ✅ | ❌ | ❌ | ❌ |
| Local + AWS sin cambiar código | ✅ | ❌ | Parcial | ❌ |
| CLI one-command | ✅ | ❌ | ❌ | ❌ |
Modelos soportados
model.type | Algoritmo | local | AWS |
|---|---|---|---|
xgboost | XGBoost | ✅ | ✅ |
random_forest | Random Forest | ✅ | ✅ |
logistic_regression | Logistic Regression | ✅ | ✅ |
lightgbm | LightGBM | ✅ | ✅ |
lstm | LSTM (Keras) | ✅ | ❌ |
linear_regression | Linear Regression | ✅ | ❌ |