Memory techniques review
Versión HTML del archivo markdown compartible.
Agent memory techniques review
Progreso: borrador vivo. Voy juntando técnicas, clasificando patrones y traduciéndolos a decisiones para agents-database.
Objetivo
Clasificar las técnicas que usan distintos agentes/sistemas para construir memoria persistente y decidir qué capa falta en nuestro caso: no solo guardar eventos operativos, sino consolidar hechos, preferencias, temas, abstracciones y aprendizajes.
Estado actual
- [x] Buscar referencias base en agents-database
- [x] Confirmar patrones comunes en la guía de Cosmos DB para agent memory
- [x] Confirmar un ejemplo de consolidación periódica tipo AgentDock
- [ ] Completar taxonomía por técnica
- [ ] Traducir taxonomía a arquitectura para agents-database
- [ ] Proponer roadmap incremental
Fuentes base y calidad
Alta confianza / backing fuerte
- Microsoft Learn: "Agent Memory in Azure Cosmos DB for NoSQL"
- backing: documentación oficial de producto
- short-term vs long-term memory
- TTL para corto plazo
- summary/prune para hilos largos
- modelos: por turno, por mensaje, por thread
- retrieval: vector + full-text + filters
- URL: https://learn.microsoft.com/en-us/azure/cosmos-db/gen-ai/agentic-memories
- AgentDock memory consolidation guide
- backing: documentación de producto/implementación, pero más opinionada que Microsoft
- conversión de episodic a semantic por edad
- dedup por embedding/keyword/metadata/temporal similarity
- abstracción de más alto nivel
- estrategias merge / synthesize / abstract
- URL: https://hub.agentdock.ai/docs/memory/consolidation-guide
- Redis blog: AI Agents memory management
- backing: vendor blog con ejemplos concretos y arquitectura de producto
- short-term/long-term separation
- TTL, summarization, semantic search, dedup ideas
- URL: https://redis.io/blog/build-smarter-ai-agents-manage-short-term-and-long-term-memory-with-redis/
- Letta / MemGPT home
- backing: producto real; el home no prueba cada técnica, pero sí que existe el sistema y su foco en memoria persistente
- estado persistente, memoria larga, aprendizaje continuo
- URL: https://memgpt.ai
Baja confianza / revisar antes de usar como fuente
- Anthropic memory URL usada antes
- la URL actual devolvió 404 / not found
- no la tomo como fuente válida sin localizar la página correcta
- URL: https://docs.anthropic.com/en/docs/build-with-claude/memory
Lectura
- Las fuentes con más backing describen patrones de almacenamiento/retrieval y compaction.
- Las fuentes más débiles suelen meter "insights" o "consolidation" como idea de producto, pero sin detallar cómo medir calidad, verdad o utilidad.
- Para tu objetivo, lo valioso es quedarte con lo que tiene mecanismo explícito: TTL, summaries, dedup, hierarchical rollups, hybrid retrieval, source trace.
Taxonomía de técnicas
1) Captura cruda
Memoria como log de eventos.
- guardar cada turno, mensaje, tool call, resultado
- bueno para trazabilidad y replay
- malo si no se compacta
2) Memoria de ventana corta
Contexto reciente para ejecución actual.
- últimos N turnos
- TTL por tiempo
- se descarta o se resume
- suele ser la capa más barata y útil para el prompt inmediato
3) Resumen acumulativo
Compresión de una secuencia en un texto menor.
- thread summary
- rolling summary
- chunk summary
- útil para continuidad sin cargar todo el historial
4) Extracción estructurada
Pasar texto libre a slots o hechos.
- preferencias del usuario
- entidades
- decisiones
- objetivos
- restricciones
- estado de proyecto
5) Consolidación episódica → semántica
Transformar experiencias puntuales en conocimiento reusable.
- de "pasó esto" a "esto suele ser verdad"
- evita guardar solo ruido operativo
- requiere umbral de edad/uso/importancia
6) Deduplicación y fusión
Unificar memorias parecidas.
- similitud semántica
- similitud lexical
- mismas entidades/metadata
- misma ventana temporal
- fusión por score/recencia/credibilidad
7) Abstracción jerárquica
Construir niveles superiores.
- hechos → patrones → principios → policies
- sesiones → temas → iniciativas → objetivos
- ideal para insights y memoria de alto valor
8) Memoria con scoring/relevancia
No todo se guarda o se muestra igual.
- relevance score
- confidence score
- freshness/decay
- importance score
- access frequency
- source trust
9) Memoria por capa o dominio
Separar tipos.
- operativo
- factual
- preferencial
- procedural
- project-level
- org-level
- policy/decision log
10) Recuperación híbrida
Buscar con más de una señal.
- vector search
- full-text
- filtros por metadata
- recencia
- grafo/relaciones si aplica
11) Refinamiento por reflexión
El agente analiza su propia experiencia.
- post-task reflection
- lessons learned
- what failed / what worked
- resúmenes de sesiones
- inferencias de estrategias
12) Memoria procedimental
Guardar cómo hacer cosas.
- workflows
- playbooks
- tool-use patterns
- comandos
- decisiones operativas repetibles
13) Memoria episódica
Registro de eventos concretos.
- conversación
- sesión
- incidente
- interacción con herramienta
14) Memoria semántica
Conocimiento generalizado.
- preferencias estables
- hechos del proyecto
- reglas de negocio
- relaciones entre conceptos
15) Memoria de entidad/grafo
Persistir relaciones entre cosas.
- persona ↔ preferencia
- proyecto ↔ decisión
- herramienta ↔ uso frecuente
- tema ↔ subtema
Lectura práctica
La mayoría de sistemas están combinando 5 capas:
- 1. log crudo
- 2. ventana corta
- 3. resumen
- 4. extracción estructurada
- 5. consolidación semántica / abstracta
Lo que suele faltar, y creo que también falta acá, es la capa 4.5–5.5:
- detección de repetición
- fusión de memorias cercanas
- promoción de patrones a nivel superior
- generación de "claims" o "principios" reutilizables
- gestión explícita de confianza y vencimiento
Hipótesis para agents-database
Podría evolucionar a un pipeline de tres planos:
Plano A: ingestión
Guardar todo lo útil como episodio o fact.
Plano B: consolidación
Jobs periódicos que:
- agrupan memorias similares
- eliminan duplicados
- resumen threads largos
- extraen hechos y preferencias
- elevan patrones a decisiones / principios
Plano C: curaduría
Memorias de nivel superior con:
- confidence
- evidence links
- source trace
- freshness/decay
- scope
- owner
Clasificación fina
| Técnica | Problema que resuelve | Señal principal | Salida típica |
| Log crudo | No perder contexto | recencia, trazabilidad | evento/turno |
| Ventana corta | Continuidad inmediata | TTL, N últimos | prompt state |
| Resumen | Reducir tokens | compaction | summary |
| Extracción estructurada | Convertir texto a hechos | NER, regex, LLM extraction | fact/slot |
| Consolidación episódica→semántica | Elevar valor | edad + frecuencia + utilidad | semantic memory |
| Dedup/fusión | Evitar ruido repetido | similitud vectorial + lexical + metadata | merged memory |
| Abstracción | Crear insights | clustering + synthesis | principle / policy |
| Scoring/relevancia | Ordenar lo importante | importance + trust + freshness | rank score |
| Memoria por dominio | Separar usos | scope/type | typed store |
| Recuperación híbrida | Mejor recall | vector + BM25 + filters | ranked hits |
| Reflexión | Capturar aprendizaje | post-task analysis | lesson learned |
| Procedural | Guardar cómo hacer | repeatability | playbook |
| Episodic | Guardar qué pasó | event sequence | session record |
| Semantic | Guardar qué significa | generalization | fact/claim |
| Graph/entity | Guardar relaciones | links between entities | graph edge/node |
Qué falta en agents-database hoy
- 1. **Promoción de nivel**: pasar de episodio a fact, y de fact a principle.
- 2. **Consolidación batch**: jobs que agrupen, resuman y fusionen.
- 3. **Jerarquía explícita**: memory types con semántica clara, no solo `operativa`.
- 4. **Evidencia y trazabilidad**: cada insight tiene que apuntar a sus fuentes.
- 5. **Decaimiento**: relevance/freshness/TTL distintos por tipo.
- 6. **Curaduría humana o semi-automática**: para decisiones de alto valor.
Próximo paso
Voy a cerrar una propuesta de arquitectura para agents-database con:
- tipos de memoria
- jobs de consolidación
- reglas de promoción
- señales de ranking
- esquema mínimo de datos
Comentario de progreso: ya está claro que el salto de valor no es "más memoria", sino "memoria con promoción de nivel".