MongoDB - Lesson 7: Agregación de datos

El aggregation pipeline te permite transformar y combinar documentos. Es como hacer un GROUP BY en SQL, pero mucho más potente.

Estructura del pipeline

Una agregación es un array de etapas. Cada etapa transforma los documentos y los pasa a la siguiente:

db.unicorns.aggregate([
    { $match: { ... } },    // Etapa 1: filtrar
    { $group: { ... } },    // Etapa 2: agrupar
    { $sort: { ... } }      // Etapa 3: ordenar
])

Etapa $group

La etapa más importante es $group. Agrupa documentos y calcula valores:

// Contar unicornios por género
db.unicorns.aggregate([
    {
        $group: {
            _id: '$gender',
            total: { $sum: 1 }
        }
    }
])

Resultado:

[
    { _id: 'f', total: 4 },
    { _id: 'm', total: 4 }
]

El campo _id indica por qué campo agrupar. El símbolo $ antes de un nombre de campo significa "el valor de este campo".

Operadores de acumulación

Dentro de $group puedes usar estos operadores:

$sum: suma valores

db.unicorns.aggregate([
    {
        $group: {
            _id: '$gender',
            totalWeight: { $sum: '$weight' }
        }
    }
])

$avg: calcula la media

db.unicorns.aggregate([
    {
        $group: {
            _id: '$gender',
            avgVampires: { $avg: '$vampires' }
        }
    }
])

$min: valor mínimo

db.unicorns.aggregate([
    {
        $group: {
            _id: '$gender',
            minWeight: { $min: '$weight' }
        }
    }
])

$max: valor máximo

db.unicorns.aggregate([
    {
        $group: {
            _id: '$gender',
            maxVampires: { $max: '$vampires' }
        }
    }
])

$addToSet: array con valores únicos

db.unicorns.aggregate([
    {
        $group: {
            _id: '$gender',
            names: { $addToSet: '$name' }
        }
    }
])

Etapa $match

Filtra documentos antes de agrupar. Es como find:

// Peso medio de unicornios con menos de 600
db.unicorns.aggregate([
    { $match: { weight: { $lt: 600 } } },
    {
        $group: {
            _id: '$gender',
            avgWeight: { $avg: '$weight' }
        }
    }
])

Etapa $sort

Ordena los resultados:

db.unicorns.aggregate([
    {
        $group: {
            _id: '$gender',
            total: { $sum: 1 }
        }
    },
    { $sort: { total: -1 } }
])

Etapa $limit

Limita el número de resultados:

// Top 3 géneros con más unicornios
db.unicorns.aggregate([
    {
        $group: {
            _id: '$gender',
            total: { $sum: 1 }
        }
    },
    { $sort: { total: -1 } },
    { $limit: 3 }
])

Etapa $unwind

Descompone un array en documentos separados. Muy útil para analizar arrays:

// ¿Qué comida es la más popular?
db.unicorns.aggregate([
    { $unwind: '$loves' },
    {
        $group: {
            _id: '$loves',
            count: { $sum: 1 }
        }
    },
    { $sort: { count: -1 } },
    { $limit: 1 }
])

Ejemplo completo

Vamos a encontrar el alimento favorito de los unicornios pesados (más de 500):

db.unicorns.aggregate([
    // 1. Filtra unicornios pesados
    { $match: { weight: { $gt: 500 } } },

    // 2. Descompone el array de comidas
    { $unwind: '$loves' },

    // 3. Agrupa por comida y cuenta
    {
        $group: {
            _id: '$loves',
            total: { $sum: 1 },
            unicorns: { $addToSet: '$name' }
        }
    },

    // 4. Ordena por popularidad
    { $sort: { total: -1 } },

    // 5. Solo el top 1
    { $limit: 1 }
])

Actividad 1

Calcula el peso total de todos los unicornios
Encuentra el número de unicornios por género
Calcula el promedio de vampiros por género
Encuentra qué comida es la favorita de los unicornios (la que más aparece)
Cuenta cuántos unicornios hay con más de 50 vampiros

Este trabajo está bajo una licencia Attribution-NonCommercial-NoDerivatives 4.0 International.

¿Me invitas a un café?

Comentarios

Todavía no hay ningún comentario.

7. Agregación de datos

Estructura del pipeline

Etapa $group

Operadores de acumulación

Etapa $match

Etapa $sort

Etapa $limit

Etapa $unwind

Ejemplo completo

¿Me invitas a un café?

Comentarios

Visitantes en tiempo real

Estructura del pipeline

Etapa $group

Operadores de acumulación

Etapa $match

Etapa $sort

Etapa $limit

Etapa $unwind

Ejemplo completo

Desafíos de programación atemporales y multiparadigmáticos

¿Me invitas a un café?

Comentarios

Visitantes en tiempo real