Memory techniques review

Versión HTML del archivo markdown compartible.

Agent memory techniques review

Progreso: borrador vivo. Voy juntando técnicas, clasificando patrones y traduciéndolos a decisiones para agents-database.

Objetivo

Clasificar las técnicas que usan distintos agentes/sistemas para construir memoria persistente y decidir qué capa falta en nuestro caso: no solo guardar eventos operativos, sino consolidar hechos, preferencias, temas, abstracciones y aprendizajes.

Estado actual

Fuentes base y calidad

Alta confianza / backing fuerte

Baja confianza / revisar antes de usar como fuente

Lectura

Taxonomía de técnicas

1) Captura cruda

Memoria como log de eventos.

2) Memoria de ventana corta

Contexto reciente para ejecución actual.

3) Resumen acumulativo

Compresión de una secuencia en un texto menor.

4) Extracción estructurada

Pasar texto libre a slots o hechos.

5) Consolidación episódica → semántica

Transformar experiencias puntuales en conocimiento reusable.

6) Deduplicación y fusión

Unificar memorias parecidas.

7) Abstracción jerárquica

Construir niveles superiores.

8) Memoria con scoring/relevancia

No todo se guarda o se muestra igual.

9) Memoria por capa o dominio

Separar tipos.

10) Recuperación híbrida

Buscar con más de una señal.

11) Refinamiento por reflexión

El agente analiza su propia experiencia.

12) Memoria procedimental

Guardar cómo hacer cosas.

13) Memoria episódica

Registro de eventos concretos.

14) Memoria semántica

Conocimiento generalizado.

15) Memoria de entidad/grafo

Persistir relaciones entre cosas.

Lectura práctica

La mayoría de sistemas están combinando 5 capas:

  1. 1. log crudo
  2. 2. ventana corta
  3. 3. resumen
  4. 4. extracción estructurada
  5. 5. consolidación semántica / abstracta

Lo que suele faltar, y creo que también falta acá, es la capa 4.5–5.5:

Hipótesis para agents-database

Podría evolucionar a un pipeline de tres planos:

Plano A: ingestión

Guardar todo lo útil como episodio o fact.

Plano B: consolidación

Jobs periódicos que:

Plano C: curaduría

Memorias de nivel superior con:

Clasificación fina

TécnicaProblema que resuelveSeñal principalSalida típica
Log crudoNo perder contextorecencia, trazabilidadevento/turno
Ventana cortaContinuidad inmediataTTL, N últimosprompt state
ResumenReducir tokenscompactionsummary
Extracción estructuradaConvertir texto a hechosNER, regex, LLM extractionfact/slot
Consolidación episódica→semánticaElevar valoredad + frecuencia + utilidadsemantic memory
Dedup/fusiónEvitar ruido repetidosimilitud vectorial + lexical + metadatamerged memory
AbstracciónCrear insightsclustering + synthesisprinciple / policy
Scoring/relevanciaOrdenar lo importanteimportance + trust + freshnessrank score
Memoria por dominioSeparar usosscope/typetyped store
Recuperación híbridaMejor recallvector + BM25 + filtersranked hits
ReflexiónCapturar aprendizajepost-task analysislesson learned
ProceduralGuardar cómo hacerrepeatabilityplaybook
EpisodicGuardar qué pasóevent sequencesession record
SemanticGuardar qué significageneralizationfact/claim
Graph/entityGuardar relacioneslinks between entitiesgraph edge/node

Qué falta en agents-database hoy

  1. 1. **Promoción de nivel**: pasar de episodio a fact, y de fact a principle.
  2. 2. **Consolidación batch**: jobs que agrupen, resuman y fusionen.
  3. 3. **Jerarquía explícita**: memory types con semántica clara, no solo `operativa`.
  4. 4. **Evidencia y trazabilidad**: cada insight tiene que apuntar a sus fuentes.
  5. 5. **Decaimiento**: relevance/freshness/TTL distintos por tipo.
  6. 6. **Curaduría humana o semi-automática**: para decisiones de alto valor.

Próximo paso

Voy a cerrar una propuesta de arquitectura para agents-database con:

Comentario de progreso: ya está claro que el salto de valor no es "más memoria", sino "memoria con promoción de nivel".