Memory techniques review

Versión HTML del archivo markdown compartible.

Agent memory techniques review

Progreso: borrador vivo. Voy juntando técnicas, clasificando patrones y traduciéndolos a decisiones para agents-database.

Objetivo

Clasificar las técnicas que usan distintos agentes/sistemas para construir memoria persistente y decidir qué capa falta en nuestro caso: no solo guardar eventos operativos, sino consolidar hechos, preferencias, temas, abstracciones y aprendizajes.

Estado actual

[x] Buscar referencias base en agents-database
[x] Confirmar patrones comunes en la guía de Cosmos DB para agent memory
[x] Confirmar un ejemplo de consolidación periódica tipo AgentDock
[ ] Completar taxonomía por técnica
[ ] Traducir taxonomía a arquitectura para agents-database
[ ] Proponer roadmap incremental

Fuentes base y calidad

Alta confianza / backing fuerte

Microsoft Learn: "Agent Memory in Azure Cosmos DB for NoSQL"

- backing: documentación oficial de producto

- short-term vs long-term memory

- TTL para corto plazo

- summary/prune para hilos largos

- modelos: por turno, por mensaje, por thread

- retrieval: vector + full-text + filters

- URL: https://learn.microsoft.com/en-us/azure/cosmos-db/gen-ai/agentic-memories

AgentDock memory consolidation guide

- backing: documentación de producto/implementación, pero más opinionada que Microsoft

- conversión de episodic a semantic por edad

- dedup por embedding/keyword/metadata/temporal similarity

- abstracción de más alto nivel

- estrategias merge / synthesize / abstract

- URL: https://hub.agentdock.ai/docs/memory/consolidation-guide

Redis blog: AI Agents memory management

- backing: vendor blog con ejemplos concretos y arquitectura de producto

- short-term/long-term separation

- TTL, summarization, semantic search, dedup ideas

- URL: https://redis.io/blog/build-smarter-ai-agents-manage-short-term-and-long-term-memory-with-redis/

Letta / MemGPT home

- backing: producto real; el home no prueba cada técnica, pero sí que existe el sistema y su foco en memoria persistente

- estado persistente, memoria larga, aprendizaje continuo

- URL: https://memgpt.ai

Baja confianza / revisar antes de usar como fuente

Anthropic memory URL usada antes

- la URL actual devolvió 404 / not found

- no la tomo como fuente válida sin localizar la página correcta

- URL: https://docs.anthropic.com/en/docs/build-with-claude/memory

docs.zep.dev

- no resolvió; no usar sin URL actualizada

Lectura

Las fuentes con más backing describen patrones de almacenamiento/retrieval y compaction.
Las fuentes más débiles suelen meter "insights" o "consolidation" como idea de producto, pero sin detallar cómo medir calidad, verdad o utilidad.
Para tu objetivo, lo valioso es quedarte con lo que tiene mecanismo explícito: TTL, summaries, dedup, hierarchical rollups, hybrid retrieval, source trace.

Taxonomía de técnicas

1) Captura cruda

Memoria como log de eventos.

guardar cada turno, mensaje, tool call, resultado
bueno para trazabilidad y replay
malo si no se compacta

2) Memoria de ventana corta

Contexto reciente para ejecución actual.

últimos N turnos
TTL por tiempo
se descarta o se resume
suele ser la capa más barata y útil para el prompt inmediato

3) Resumen acumulativo

Compresión de una secuencia en un texto menor.

thread summary
rolling summary
chunk summary
útil para continuidad sin cargar todo el historial

4) Extracción estructurada

Pasar texto libre a slots o hechos.

preferencias del usuario
entidades
decisiones
objetivos
restricciones
estado de proyecto

5) Consolidación episódica → semántica

Transformar experiencias puntuales en conocimiento reusable.

de "pasó esto" a "esto suele ser verdad"
evita guardar solo ruido operativo
requiere umbral de edad/uso/importancia

6) Deduplicación y fusión

Unificar memorias parecidas.

similitud semántica
similitud lexical
mismas entidades/metadata
misma ventana temporal
fusión por score/recencia/credibilidad

7) Abstracción jerárquica

Construir niveles superiores.

hechos → patrones → principios → policies
sesiones → temas → iniciativas → objetivos
ideal para insights y memoria de alto valor

8) Memoria con scoring/relevancia

No todo se guarda o se muestra igual.

relevance score
confidence score
freshness/decay
importance score
access frequency
source trust

9) Memoria por capa o dominio

Separar tipos.

operativo
factual
preferencial
procedural
project-level
org-level
policy/decision log

10) Recuperación híbrida

Buscar con más de una señal.

vector search
full-text
filtros por metadata
recencia
grafo/relaciones si aplica

11) Refinamiento por reflexión

El agente analiza su propia experiencia.

post-task reflection
lessons learned
what failed / what worked
resúmenes de sesiones
inferencias de estrategias

12) Memoria procedimental

Guardar cómo hacer cosas.

workflows
playbooks
tool-use patterns
comandos
decisiones operativas repetibles

13) Memoria episódica

Registro de eventos concretos.

conversación
sesión
incidente
interacción con herramienta

14) Memoria semántica

Conocimiento generalizado.

preferencias estables
hechos del proyecto
reglas de negocio
relaciones entre conceptos

15) Memoria de entidad/grafo

Persistir relaciones entre cosas.

persona ↔ preferencia
proyecto ↔ decisión
herramienta ↔ uso frecuente
tema ↔ subtema

Lectura práctica

La mayoría de sistemas están combinando 5 capas:

1. log crudo
2. ventana corta
3. resumen
4. extracción estructurada
5. consolidación semántica / abstracta

Lo que suele faltar, y creo que también falta acá, es la capa 4.5–5.5:

detección de repetición
fusión de memorias cercanas
promoción de patrones a nivel superior
generación de "claims" o "principios" reutilizables
gestión explícita de confianza y vencimiento

Hipótesis para agents-database

Podría evolucionar a un pipeline de tres planos:

Plano A: ingestión

Guardar todo lo útil como episodio o fact.

Plano B: consolidación

Jobs periódicos que:

agrupan memorias similares
eliminan duplicados
resumen threads largos
extraen hechos y preferencias
elevan patrones a decisiones / principios

Plano C: curaduría

Memorias de nivel superior con:

confidence
evidence links
source trace
freshness/decay
scope
owner

Clasificación fina

Log crudo	No perder contexto	recencia, trazabilidad	evento/turno
Técnica	Problema que resuelve	Señal principal	Salida típica
Ventana corta	Continuidad inmediata	TTL, N últimos	prompt state
Resumen	Reducir tokens	compaction	summary
Extracción estructurada	Convertir texto a hechos	NER, regex, LLM extraction	fact/slot
Consolidación episódica→semántica	Elevar valor	edad + frecuencia + utilidad	semantic memory
Dedup/fusión	Evitar ruido repetido	similitud vectorial + lexical + metadata	merged memory
Abstracción	Crear insights	clustering + synthesis	principle / policy
Scoring/relevancia	Ordenar lo importante	importance + trust + freshness	rank score
Memoria por dominio	Separar usos	scope/type	typed store
Recuperación híbrida	Mejor recall	vector + BM25 + filters	ranked hits
Reflexión	Capturar aprendizaje	post-task analysis	lesson learned
Procedural	Guardar cómo hacer	repeatability	playbook
Episodic	Guardar qué pasó	event sequence	session record
Semantic	Guardar qué significa	generalization	fact/claim
Graph/entity	Guardar relaciones	links between entities	graph edge/node

Qué falta en agents-database hoy

1. **Promoción de nivel**: pasar de episodio a fact, y de fact a principle.
2. **Consolidación batch**: jobs que agrupen, resuman y fusionen.
3. **Jerarquía explícita**: memory types con semántica clara, no solo `operativa`.
4. **Evidencia y trazabilidad**: cada insight tiene que apuntar a sus fuentes.
5. **Decaimiento**: relevance/freshness/TTL distintos por tipo.
6. **Curaduría humana o semi-automática**: para decisiones de alto valor.

Próximo paso

Voy a cerrar una propuesta de arquitectura para agents-database con:

tipos de memoria
jobs de consolidación
reglas de promoción
señales de ranking
esquema mínimo de datos

Comentario de progreso: ya está claro que el salto de valor no es "más memoria", sino "memoria con promoción de nivel".