RADIA — Council Feedback Loop (Bucle de Retroalimentación del Consejo)

Estudio de diseño técnico — v1.0
Fecha: 17 abril 2026
Estado: Propuesta para revisión
Clasificación: Decisión arquitectónica — requiere aprobación antes de implementar

1. Resumen Ejecutivo

Se propone que en modo Asteroid, cuando el DeepSeek Council (junta médica IA) identifique discrepancias sustanciales con los hallazgos de los modelos de visión (Gemini/Groq), el sistema desencadene automáticamente un re-análisis focalizado de esos hallazgos con prompts enriquecidos que incluyan las críticas del Council.

El resultado es un sistema de debate adversarial entre modelos especializados: los radiólogos IA defienden o revisan sus hallazgos frente a las objeciones de un clínico razonador IA.

Impacto en costes operativos: $0 adicionales (mismo nº de llamadas Gemini, DeepSeek ya integrado).

2. Flujo Actual vs. Flujo Propuesto

2.1 Flujo actual (Asteroid Finalize)

Finalize Start
  │
  ├─ [1] Deep Analysis (top 3 por severidad) ─── hasta 30s en paralelo
  │       Gemini analiza ±5 cortes por hallazgo
  │       ❌ SIN contexto del Council (aún no ha ejecutado)
  │
  ├─ [2] Time check: ¿elapsed < 70s?
  │
  ├─ [3] DeepSeek Council ─── hasta 25s
  │       Recibe hallazgos CON deep_analysis ya hecho
  │       Identifica falsos positivos, diagnósticos alternativos
  │       ⚠️ Sus críticas NO se aplican — el análisis ya terminó
  │
  ├─ [4] DB updates + response
  │
  └─ Total: ~57s peor caso

Problema clave: El Council identifica discrepancias después de que el deep analysis ya terminó. Sus observaciones se almacenan pero nunca influyen en el análisis. Es como si un jefe de servicio hiciera comentarios brillantes que nadie lee.

2.2 Flujo propuesto — Council-First (Opción Recomendada)

Finalize Start
  │
  ├─ [1] DeepSeek Council ─── hasta 25s
  │       Recibe hallazgos RAW (sin deep analysis)
  │       Identifica disputas, falsos positivos, diferenciales
  │       ✅ SUS CRÍTICAS GUÍAN el paso siguiente
  │
  ├─ [2] Deep Analysis GUIADO ─── hasta 30s en paralelo
  │       Top 3 hallazgos por PRIORIDAD DEL COUNCIL (no solo severidad)
  │       Prompts enriquecidos con las objeciones del Council
  │       Gemini recibe: "El consejo dice X, ¿confirmas o rebates?"
  │       ✅ RETROALIMENTACIÓN CERRADA
  │
  ├─ [3] DB updates + response (con debate trail)
  │
  └─ Total: ~57s peor caso ── MISMO PRESUPUESTO DE TIEMPO

Cambio fundamental: Invertir el orden. Council primero → Deep Analysis después, informado por el Council.

3. Análisis de Opciones

Se han evaluado tres arquitecturas. Se recomienda la Opción B.

Opción A — Fase 4 "Reconcile" (nueva acción del cliente)

Client: scan360 init → batches → finalize (council runs)
        ↓
        Si council.disputes > 0 → scan360 action=reconcile
        ↓
        Server: re-analiza hallazgos disputados → response actualizada

Aspecto	Evaluación
Timeout	✅ Sin riesgo — nueva request = 100s frescos
Complejidad cliente	❌ Requiere nuevo loop en frontend
Complejidad servidor	⚠️ Nueva action + lógica de selección
UX	⚠️ El usuario ve resultados → esperan → se actualizan
Latencia total	❌ +25-30s extra (nuevo roundtrip HTTP)
Coste	✅ $0 extra
Compatibilidad	⚠️ Clientes existentes no lo llamarían

Veredicto: Funcional pero over-engineered. Añade complejidad innecesaria al cliente y al protocolo de batching.

Opción B — Council-First Finalize (RECOMENDADA) ⭐

Finalize:
  1. Council revisa hallazgos raw (25s)
  2. Deep analysis guiado por council (30s paralelo, top 3)
  3. DB updates (2s)
  Total: ~57s — CABE EN EL MISMO PRESUPUESTO

Aspecto	Evaluación
Timeout	✅ Mismo presupuesto 70s — solo reordena los pasos
Complejidad cliente	✅ CERO cambios en frontend
Complejidad servidor	✅ Refactor del orden en finalize + prompt enriquecido
UX	✅ Transparente — usuario no nota cambio
Latencia total	✅ ~57s (igual que ahora)
Coste	✅ $0 extra
Compatibilidad	✅ 100% backward-compatible
Calidad del análisis	✅✅ Mejora sustancial — deep analysis informado

Veredicto: Máximo impacto con mínima complejidad. Solo reordena e inyecta contexto.

Opción C — Doble pasada (Deep → Council → Re-Deep)

Finalize:
  1. Deep analysis estándar (30s)
  2. Council con deep analysis data (25s)
  3. Re-deep analysis de disputados (30s)
  Total: ~85s — ⚠️ EXCEDE presupuesto 70s, roza límite CF 100s

Aspecto	Evaluación
Timeout	❌ 85s peligrosamente cerca del límite CF 100s
Calidad	✅✅✅ Máxima — council tiene deep analysis + re-check
Riesgo	❌ 524 timeouts en estudios grandes
Coste	⚠️ Doble llamadas Gemini para hallazgos disputados

Veredicto: Mejor calidad teórica pero inviable por timing. Reservar para futuro si Cloudflare amplía límites o movemos a background jobs.

4. Diseño Detallado — Opción B (Council-First)

4.1 Cambios en el orden de ejecución

// ════════ ANTES (actual) ════════
// 1. Deep Analysis (paralelo, top 3 por severidad)
// 2. Council (DeepSeek, todos los hallazgos + deep_analysis)

// ════════ DESPUÉS (propuesto) ════════
// 1. Council (DeepSeek, todos los hallazgos RAW)
// 2. Deep Analysis GUIADO (paralelo, top 3 por PRIORIDAD COUNCIL)

4.2 Algoritmo de priorización de hallazgos para Deep Analysis

Actualmente se seleccionan los top 3 por severidad:

-- ACTUAL
SELECT * FROM radia_findings 
WHERE study_id = ? AND severity IN ('suspicious', 'malignant', 'indeterminate')
ORDER BY CASE severity 
  WHEN 'malignant' THEN 0 
  WHEN 'suspicious' THEN 1 
  ELSE 2 END, confidence DESC
LIMIT 3

Propuesta — Prioridad híbrida Council + Severidad:

function selectFindingsForDeepAnalysis(allFindings, councilResult) {
  const priorityList = [];
  const added = new Set();

  // ─── PRIORIDAD 1: Hallazgos que el Council disputa ─────────
  // Falsos positivos sospechosos (el council quiere verificación visual)
  if (councilResult?.false_positive_suspects) {
    for (const suspect of councilResult.false_positive_suspects) {
      const match = allFindings.find(f => 
        f.title === suspect.finding_title && !added.has(f.id)
      );
      if (match) {
        priorityList.push({ 
          finding: match, 
          reason: 'council_false_positive',
          councilContext: suspect 
        });
        added.add(match.id);
      }
    }
  }

  // ─── PRIORIDAD 2: Hallazgos con diagnóstico diferencial del Council ──
  if (councilResult?.differential_diagnoses) {
    for (const dd of councilResult.differential_diagnoses) {
      const match = allFindings.find(f => 
        f.title === dd.finding && !added.has(f.id)
      );
      if (match) {
        priorityList.push({ 
          finding: match, 
          reason: 'council_differential',
          councilContext: dd 
        });
        added.add(match.id);
      }
    }
  }

  // ─── PRIORIDAD 3: Fallback — top por severidad (comportamiento actual) ──
  const severityOrder = { malignant: 0, suspicious: 1, indeterminate: 2 };
  const remaining = allFindings
    .filter(f => !added.has(f.id) && ['suspicious', 'malignant', 'indeterminate'].includes(f.severity))
    .sort((a, b) => (severityOrder[a.severity] ?? 3) - (severityOrder[b.severity] ?? 3) 
                     || (b.confidence ?? 0) - (a.confidence ?? 0));

  for (const f of remaining) {
    if (!added.has(f.id)) {
      priorityList.push({ finding: f, reason: 'severity_based', councilContext: null });
      added.add(f.id);
    }
  }

  // Máximo 3 hallazgos (presupuesto de tiempo)
  return priorityList.slice(0, 3);
}

Escenarios:

Council dice	Resultado
2 falsos positivos + 1 diferencial	Se analizan los 3 flagged por council
1 falso positivo, 0 diferenciales	1 council-flagged + 2 por severidad
Sin disputas (todo ok)	3 por severidad (comportamiento actual)
Council falló/timeout	3 por severidad (fallback idéntico al actual)

4.3 Prompt enriquecido para Deep Analysis con contexto del Council

function getCouncilEnrichedDeepPrompt(studyType, finding, sliceImages, region, demoLines, councilItem) {
  // Base: el prompt de deep analysis actual (sin cambios)
  const basePrompt = getDeepAnalysisPrompt(studyType, finding, sliceImages, region, demoLines);

  // Si no hay contexto del council, devolver el prompt estándar
  if (!councilItem?.councilContext) return basePrompt;

  // ─── Inyección del contexto del Council ───
  let councilBlock = '\n\n═══ ⚕️ REVISIÓN DEL CONSEJO CLÍNICO ═══\n';
  councilBlock += 'La junta médica (clinical council) ha revisado este hallazgo ';
  councilBlock += 'y ha expresado las siguientes observaciones que debes evaluar:\n\n';

  if (councilItem.reason === 'council_false_positive') {
    const suspect = councilItem.councilContext;
    councilBlock += `⚠️ SOSPECHA DE FALSO POSITIVO\n`;
    councilBlock += `Razón del consejo: "${suspect.reason}"\n`;
    councilBlock += `Confianza revisada por el consejo: ${suspect.revised_confidence}\n\n`;
    councilBlock += `INSTRUCCIONES ESPECIALES:\n`;
    councilBlock += `- Examina las imágenes con atención FORENSE al área del hallazgo\n`;
    councilBlock += `- ¿Es un artefacto de imagen, volumen parcial o variante anatómica normal?\n`;
    councilBlock += `- Si confirmas el hallazgo como REAL, proporciona evidencia visual específica\n`;
    councilBlock += `- Si coincides con el consejo (falso positivo), indica updated_severity="normal"\n`;
    councilBlock += `- Incluye un campo "council_response" en tu JSON explicando tu posición\n`;
  }

  if (councilItem.reason === 'council_differential') {
    const dd = councilItem.councilContext;
    councilBlock += `📋 DIAGNÓSTICOS ALTERNATIVOS PROPUESTOS POR EL CONSEJO\n`;
    councilBlock += `El consejo sugiere considerar:\n`;
    dd.alternatives.forEach((alt, i) => {
      councilBlock += `  ${i + 1}. ${alt}\n`;
    });
    councilBlock += `\nINSTRUCCIONES ESPECIALES:\n`;
    councilBlock += `- Evalúa cada alternativa propuesta contra la evidencia visual\n`;
    councilBlock += `- ¿Hay signos patognomónicos que favorezcan una sobre otra?\n`;
    councilBlock += `- Ordena las posibilidades por probabilidad según lo que VES\n`;
    councilBlock += `- Incluye un campo "council_response" en tu JSON con tu evaluación\n`;
  }

  // Insertar el bloque del council ANTES de "═══ ANÁLISIS REQUERIDO ═══"
  return basePrompt.replace(
    '═══ ANÁLISIS REQUERIDO ═══',
    councilBlock + '\n═══ ANÁLISIS REQUERIDO ═══'
  );
}

4.4 Schema de respuesta ampliado para Deep Analysis

{
  "confirmed": true,
  "detailed_description": "...",
  "dimensions_mm": "15 x 12 x 8 mm",
  "borders": "bien definidos",
  "density": "radiopaco",
  "adjacent_structures": "...",
  "differential_diagnosis": ["...", "..."],
  "recommendations": "...",
  "updated_severity": "suspicious",
  "updated_confidence": 0.92,
  "clinical_significance": "...",

  "council_response": "NUEVO — respuesta del radiólogo a las objeciones del consejo",
  "council_agrees": false
}

El campo council_response es la joya: contiene la defensa explícita del radiólogo IA ante la crítica del Council. Ejemplo real:

{
  "council_response": "El consejo sugiere que esta imagen puede ser un artefacto de volumen parcial. Sin embargo, la lesión persiste en 5 cortes consecutivos (cortes 23-27), presenta bordes bien definidos y densidad homogénea hipodensa. Un artefacto de volumen parcial no mantendría consistencia en 5 cortes ni presentaría bordes definidos. CONFIRMO el hallazgo como verdadero positivo.",
  "council_agrees": false
}

O cuando el Council tiene razón:

{
  "council_response": "Coincido con la observación del consejo. Al re-examinar con mayor atención, la aparente 'lesión' corresponde a la inserción normal del ligamento periodontal en un diente con leve giroversión. La variante anatómica explica la radiolucencia focal. Reclasificado como variante normal.",
  "council_agrees": true,
  "updated_severity": "normal",
  "updated_confidence": 0.15
}

4.5 Almacenamiento del debate trail

Se propone añadir un campo council_review al JSON de deep_analysis para crear un audit trail completo:

// En la actualización del finding tras deep analysis guiado
const deepResult = {
  ...parsed,
  council_review: {
    triggered_by: councilItem.reason,  // 'council_false_positive' | 'council_differential'
    council_concern: councilItem.councilContext,  // lo que dijo el council
    vision_response: parsed.council_response,  // lo que respondió el radiólogo
    vision_agrees_with_council: parsed.council_agrees ?? null,
    review_timestamp: new Date().toISOString()
  }
};

await DB.prepare(
  `UPDATE radia_findings SET deep_analysis = ?, severity = ?, confidence = ? WHERE id = ?`
).bind(
  JSON.stringify(deepResult).slice(0, 10000),
  deepResult.updated_severity || finding.severity,
  deepResult.updated_confidence ?? finding.confidence,
  finding.id
).run();

4.6 Respuesta al cliente (sin cambios en schema)

La respuesta de finalize no cambia de estructura. El campo clinicalCouncil ya existe y los findings incluyen deep_analysis. El frontend ya renderiza ambos — solo necesitaría interpretar council_review dentro de deep_analysis para mostrar el badge de debate.

{
  "success": true,
  "totalFindings": 12,
  "findings": [
    {
      "id": "find_xxx",
      "title": "Quiste periapical D16",
      "severity": "suspicious",    // puede haber cambiado por el feedback loop
      "confidence": 0.92,
      "deep_analysis": {
        "confirmed": true,
        "council_review": {         // NUEVO — debate trail
          "triggered_by": "council_false_positive",
          "council_concern": { "reason": "Posible artefacto...", "revised_confidence": 0.3 },
          "vision_response": "CONFIRMO — persiste en 5 cortes...",
          "vision_agrees_with_council": false
        }
      }
    }
  ],
  "clinicalCouncil": { /* sin cambios */ },
  "asteroidMode": true
}

5. Restricciones de Timing — Análisis Exhaustivo

5.1 Presupuesto actual

Constante	Valor	Origen
Cloudflare Worker max	~100s	Límite de plataforma (hard)
`FINALIZE_BUDGET_MS`	70s	Margen de seguridad definido en código
Deep Analysis timeout/finding	30s	AbortController en scan360.js
Council timeout	25s	AbortController en scan360.js
Deep Analysis (3 en paralelo)	~30s real	Promise.allSettled (peor caso ≈ timeout de 1 finding)

5.2 Timeline actual vs. propuesto

═══ ACTUAL ═══
T=0s  ────── Deep Analysis (hasta 30s, 3 findings en paralelo) ──────── T≈30s
T=30s ────── Time check ── si < 70s → Council ──────────────────── T≈55s  
T=55s ────── DB updates + response ──────────────────────────────── T≈57s
                                                     Margen: 43s ✅

═══ PROPUESTO ═══
T=0s  ────── Council (hasta 25s) ────────────────────────────────── T≈20s
T=20s ────── Deep Analysis GUIADO (hasta 30s, 3 en paralelo) ───── T≈45s
T=45s ────── DB updates + response ──────────────────────────────── T≈47s
                                                     Margen: 53s ✅✅

Observación clave: El orden propuesto es incluso más seguro porque el Council real suele responder en 10-15s (el timeout de 25s es conservador), lo que deja más margen total.

5.3 Escenarios de timing adverso

Escenario	Actual	Propuesto	Veredicto
Todo rápido (deep 10s + council 10s)	~22s	~22s	✅ Igual
Deep lento (deep 28s + council 15s)	~45s	~45s	✅ Igual
Council lento (deep 15s + council 24s)	~41s	~41s	✅ Igual
Ambos lentos (deep 29s + council 24s)	~55s	~55s	✅ Igual
Council timeout total (25s) + deep OK	~45s	~45s	✅ Igual
Todo timeout (deep 30s + council 25s)	~57s	~57s	✅ Igual
Council falla → fallback a deep estándar	~32s	~32s	✅ Igual

Conclusión: NO hay impacto en timing. El presupuesto total es el mismo porque solo se reordena, no se añade un paso.

5.4 ¿Qué pasa si el Council falla?

// Fallback — comportamiento idéntico al actual
let councilResult = null;
try {
  councilResult = await callDeepSeekClinicalCouncil(env, rawFindings, study);
} catch (err) {
  console.warn('[RADIA Council] Failed (non-blocking):', err.message);
}

// Si council falló → selectFindingsForDeepAnalysis recibe councilResult=null
// → fallback a top 3 por severidad (comportamiento actual exacto)
const deepTargets = selectFindingsForDeepAnalysis(allFindings, councilResult);
// deepTargets usará PRIORIDAD 3 (severidad) porque no hay council data

6. Impacto en Council — ¿Pierde calidad sin deep_analysis?

6.1 Qué recibe el Council actualmente

═══ HALLAZGOS DETECTADOS (3) ═══
1. [gemini-2.5-flash] "Quiste periapical D16"
   Severity: suspicious, Confidence: 0.88, Slice: 45
   Descripción: Lesión radiolúcida periapical de 12mm
   Localización: Región periapical diente 16
   Análisis profundo: Confirmado, 15x12x8mm, bordes definidos...   ← ESTO
   Dx diferencial previo: Quiste radicular, Granuloma periapical   ← Y ESTO

6.2 Qué recibiría en el flujo propuesto

═══ HALLAZGOS DETECTADOS (3) ═══
1. [gemini-2.5-flash] "Quiste periapical D16"
   Severity: suspicious, Confidence: 0.88, Slice: 45
   Descripción: Lesión radiolúcida periapical de 12mm
   Localización: Región periapical diente 16
   (sin análisis profundo — se realizará después)

6.3 ¿Es peor?

No. El Council es un modelo de razonamiento clínico (DeepSeek Reasoner), no un modelo de visión. Su valor está en:

Lógica clínica: "Un paciente de 25 años con lesión periapical en D16 — ¿tiene antecedentes de trauma?" → Esto NO necesita deep analysis.
Detección de falsos positivos: "Una sombra en corte 45 podría ser artefacto de volumen parcial" → Esto se basa en UBICACIÓN + SEVERIDAD + CONFIANZA, no en medidas mm exactas.
Correlación entre hallazgos: "Si hay pérdida ósea en D15-D16 Y lesión periapical en D16, probablemente es patología endodóntica crónica" → Esto se basa en POSICIÓN RELATIVA, no en deep analysis.
Diagnóstico diferencial: "En un paciente de 25 años, un quiste periapical es más probable que un ameloblastoma" → Esto se basa en EPIDEMIOLOGÍA + DATOS CLÍNICOS.

Conclusión: El Council NO pierde calidad significativa sin deep_analysis. De hecho, opera en un nivel de abstracción superior donde la información scan360 raw es suficiente. Lo que SÍ gana es influencia real: sus observaciones ahora conducen a acción concreta.

7. Criterios de Disputa — ¿Cuándo se activa el re-análisis?

El feedback loop se activa para hallazgos que el Council ha cuestionado de forma sustancial. Se propone un umbral doble:

7.1 Disputa por Falso Positivo

// Se activa si el Council reduce la confianza significativamente
const isSubstantialDispute = (suspect) => {
  // El council asigna revised_confidence — si baja >0.3 respecto al original, es sustancial
  const original = allFindings.find(f => f.title === suspect.finding_title);
  if (!original) return false;
  const drop = (original.confidence ?? 0.5) - (suspect.revised_confidence ?? 0.5);
  return drop >= 0.3; // Caída de ≥30% en confianza
};

Ejemplo:

Finding: Confianza original 0.88
Council revised_confidence: 0.3 → Drop = 0.58 → SÍ disputa (≥0.3)
Council revised_confidence: 0.7 → Drop = 0.18 → NO disputa (<0.3)

7.2 Disputa por Diagnóstico Diferencial

Siempre se considera sustancial si el Council propone alternativas que implican cambio de manejo clínico:

const hasClinicalImpact = (dd) => {
  // Si las alternativas incluyen cambio de categoría (ej. benigno vs. maligno)
  return dd.alternatives && dd.alternatives.length >= 2;
};

7.3 Override por evaluación global

// Si el Council dice "critical" pero los findings son todos "benign/normal"
// → disputa implícita — deep-analizar los de mayor confianza
const globalDispute = councilResult.overall_assessment === 'critical' 
  && !allFindings.some(f => ['suspicious', 'malignant'].includes(f.severity));

8. Ejemplo Completo de Flujo

Caso: CBCT dental, paciente 42 años, masculino

Paso 1 — Scan360 batches completan:

Finding 1: "Quiste periapical D16" — suspicious, confidence 0.88
Finding 2: "Sombra ósea periférica D38" — indeterminate, confidence 0.62
Finding 3: "Pérdida ósea horizontal D15-D17" — benign, confidence 0.91
Finding 4: "Engrosamiento mucoso seno maxilar derecho" — benign, confidence 0.78

Paso 2 — Council analiza hallazgos raw:

{
  "clinical_debate": "El paciente de 42 años presenta un cuadro compatible con patología endodóntica crónica en sector posterior derecho. Sin embargo, el hallazgo 'Sombra ósea periférica D38' genera dudas: su localización y severidad indeterminada sugieren que podría tratarse de un artefacto de volumen parcial típico de la transición cortical-esponjosa en la zona retromolar...",
  
  "false_positive_suspects": [
    {
      "finding_title": "Sombra ósea periférica D38",
      "reason": "Localización retromolar con densidad ambigua — patrón típico de artefacto de volumen parcial en CBCT. La zona retromolar presenta frecuentemente sombras por la superposición de la cresta milohioidea.",
      "revised_confidence": 0.20
    }
  ],
  
  "differential_diagnoses": [
    {
      "finding": "Quiste periapical D16",
      "alternatives": [
        "Quiste radicular (más probable — antecedentes endodónticos)",
        "Granuloma periapical (probable — <15mm sugiere granuloma)",
        "Queratoquiste odontogénico (improbable — localización atípica)"
      ]
    }
  ],
  
  "correlations": [
    {
      "findings": ["Quiste periapical D16", "Pérdida ósea horizontal D15-D17"],
      "significance": "Patrón sugestivo de patología endoperiodontal combinada"
    }
  ],
  
  "overall_assessment": "moderate_risk"
}

Paso 3 — Selección de hallazgos para Deep Analysis:

Prioridad 1 (council_false_positive): "Sombra ósea periférica D38"
   → Drop de confianza: 0.62 → 0.20 = 0.42 (≥0.3) → DISPUTA SUSTANCIAL
   
Prioridad 2 (council_differential): "Quiste periapical D16"  
   → Tiene 3 alternativas → IMPACTO CLÍNICO

Prioridad 3 (severidad fallback): no hace falta — ya tenemos 2 council-flagged
   → Se añade "Engrosamiento mucoso seno maxilar" como 3º por severidad

Paso 4 — Deep Analysis con prompts enriquecidos:

Finding "Sombra ósea periférica D38" (council_false_positive):

...prompt base de deep analysis...

═══ ⚕️ REVISIÓN DEL CONSEJO CLÍNICO ═══
La junta médica ha revisado este hallazgo y ha expresado las siguientes observaciones:

⚠️ SOSPECHA DE FALSO POSITIVO
Razón del consejo: "Localización retromolar con densidad ambigua — patrón típico 
de artefacto de volumen parcial en CBCT. La zona retromolar presenta frecuentemente 
sombras por la superposición de la cresta milohioidea."
Confianza revisada por el consejo: 0.20

INSTRUCCIONES ESPECIALES:
- Examina las imágenes con atención FORENSE al área del hallazgo
- ¿Es un artefacto de imagen, volumen parcial o variante anatómica normal?
- Si confirmas el hallazgo como REAL, proporciona evidencia visual específica
- Si coincides con el consejo (falso positivo), indica updated_severity="normal"
- Incluye un campo "council_response" en tu JSON explicando tu posición

═══ ANÁLISIS REQUERIDO ═══
...resto del prompt...

Respuesta del radiólogo IA (Gemini):

{
  "confirmed": false,
  "detailed_description": "Al re-examinar con enfoque en la zona retromolar D38, la sombra corresponde efectivamente a la superposición de la cresta milohioidea con el borde posterior del cuerpo mandibular. No se observa expansión ósea, remodelación cortical ni cambio de densidad interno que sugiera patología real.",
  "updated_severity": "normal",
  "updated_confidence": 0.12,
  "council_response": "COINCIDO con el consejo. La sombra es consistente con un artefacto de volumen parcial en la transición cortical-esponjosa de la zona retromolar, acentuado por la cresta milohioidea. No hay evidencia visual de patología real.",
  "council_agrees": true,
  "differential_diagnosis": ["Artefacto de volumen parcial (confirmado)"],
  "recommendations": "No requiere seguimiento — hallazgo descartado como artefacto"
}

Resultado: El finding pasa de indeterminate (0.62) → normal (0.12). Un falso positivo eliminado automáticamente gracias al debate entre modelos.

9. Impacto en Producto

9.1 Diferenciación competitiva

Ningún competidor conocido en imagen médica IA implementa un sistema adversarial de debate entre modelos. Los competidores típicos usan:

Modelo único → hallazgos → fin
Ensemble de modelos → promedio de severidad → fin

RADIA propone: Modelo visual → Modelo razonador que desafía → Modelo visual que defiende o corrige. Esto replica el workflow clínico real de una junta médica (tumor board).

9.2 Métricas esperadas

Métrica	Estimación	Razón
Reducción de falsos positivos	~15-25%	Council identifica artefactos que el modelo visual no distingue
Precisión diagnóstica	+5-10%	Deep analysis focalizado en puntos débiles
Confianza clínica del usuario	Alta	Ver el debate explícito genera confianza profesional
Incremento de coste	$0	Mismo nº de llamadas API, solo reordenadas
Incremento de latencia	0s	Mismo presupuesto de tiempo, solo reordenado

9.3 Valor para el discurso comercial

"RADIA no solo detecta — debate internamente. Tres modelos de IA especializados replican una junta médica real: dos radiólogos analizan las imágenes, un clínico senior cuestiona los hallazgos, y los radiólogos defienden o corrigen su diagnóstico. El resultado es un análisis que ha sobrevivido a un interrogatorio adversarial antes de llegar al profesional."

10. Plan de Implementación

10.1 Cambios en código

Archivo	Cambio	Complejidad
`functions/api/analysis/scan360.js`	Reordenar finalize: council → deep analysis	Media
`functions/api/analysis/scan360.js`	Nueva función `selectFindingsForDeepAnalysis()`	Baja
`functions/api/analysis/scan360.js`	Inyección de contexto council en deep prompt	Baja
`functions/lib/prompts.js`	`getCouncilEnrichedDeepPrompt()` wrapper	Baja
Frontend (React)	Badge "Council-reviewed" en finding cards	Baja
Frontend (React)	Expandible con debate trail en deep analysis	Media

10.2 Estimación de líneas de código

Nueva función selectFindingsForDeepAnalysis: ~40 líneas
Nueva función getCouncilEnrichedDeepPrompt: ~50 líneas
Refactor del orden en finalize: ~20 líneas movidas + 10 nuevas
Frontend badge + debate trail: ~30 líneas JSX

Total: ~150 líneas de código nuevo (no es un feature masivo — es un refactor inteligente).

10.3 Testing

Test unitario: selectFindingsForDeepAnalysis con diferentes inputs de council
Test de integración: Finalize con council mock que reporta disputas
Test de timeout: Council falla → fallback a deep analysis estándar
Test de calidad: Comparar findings antes/después del feedback loop en estudios reales
Test end-to-end: Asteroid scan completo con todas las fases

10.4 Rollout

Fase 1: Implementar en código, activar solo para plan business (beta cerrada)
Fase 2: Monitorizar métricas (falsos positivos eliminados, debate trail quality)
Fase 3: Activar para plan pro tras validación
Fase 4: Marketing: "Clinical Debate Protocol" — material para consultora

11. Riesgos y Mitigaciones

Riesgo	Probabilidad	Impacto	Mitigación
Council timeout → deep analysis sin enriquecer	Media	Bajo	Fallback a comportamiento actual (ya implementado)
Gemini ignora el contexto del council	Baja	Medio	Testing intensivo de prompts; campo `council_response` es obligatorio en schema
Falso negativo: council descarta hallazgo válido	Baja	Alto	Deep analysis puede REBATIR al council; se guarda audit trail completo
JSON truncation en deep analysis enriquecido	Baja	Bajo	Misma lógica de recovery de JSON parcial ya existente
Council matching por `finding_title` falla (títulos no coinciden exacto)	Media	Medio	Usar fuzzy matching o normalizar títulos (lowercase + trim)

11.1 Riesgo especial: Matching de títulos

El Council devuelve finding_title en su JSON — pero no está garantizado que coincida exactamente con el title del finding en DB. Ejemplo:

DB: "Quiste periapical diente 16"
Council: "Quiste periapical D16"

Mitigación: Normalización + fuzzy matching:

function matchFinding(councilTitle, findings) {
  const normalize = s => s.toLowerCase().replace(/\s+/g, ' ').trim();
  const ct = normalize(councilTitle);
  
  // Exacto
  const exact = findings.find(f => normalize(f.title) === ct);
  if (exact) return exact;
  
  // Inclusión parcial
  const partial = findings.find(f => 
    normalize(f.title).includes(ct) || ct.includes(normalize(f.title))
  );
  if (partial) return partial;
  
  // Similaridad por palabras (Jaccard simplificado)
  const ctWords = new Set(ct.split(/\s+/));
  let bestMatch = null, bestScore = 0;
  for (const f of findings) {
    const fWords = new Set(normalize(f.title).split(/\s+/));
    const intersection = [...ctWords].filter(w => fWords.has(w)).length;
    const union = new Set([...ctWords, ...fWords]).size;
    const score = intersection / union;
    if (score > bestScore && score > 0.5) {
      bestScore = score;
      bestMatch = f;
    }
  }
  return bestMatch;
}

Alternativa más limpia para el futuro: incluir el finding_id en el prompt del Council para que lo devuelva como referencia.

12. Decisiones Pendientes para el Equipo

Antes de implementar, necesitamos consenso en:

D1: ¿Council-First (Opción B) o Phase 4 Reconcile (Opción A)?

Recomendación: Opción B (Council-First). Misma calidad, cero impacto en timing, cero cambios en frontend batch loop.

D2: ¿Umbral de disputa?

Recomendación: Drop de confianza ≥0.3 para falsos positivos. Cualquier diferencial con ≥2 alternativas para diferenciales. Se puede ajustar con datos reales.

D3: ¿Máximo de hallazgos re-analizados?

Recomendación: 3 (mismo que ahora). El presupuesto de tiempo no permite más en paralelo dentro de finalize.

D4: ¿Activar solo para Asteroid o también para análisis estándar?

Recomendación: Solo Asteroid. El análisis estándar no tiene council ni deep analysis — activarlo ahí requeriría añadir ambos, lo cual cambia significativamente el producto y los costes.

D5: ¿Nombre del feature para marketing?

Opciones:

"Clinical Debate Protocol" (profesional, diferenciador)
"Council Feedback Loop" (técnico, preciso)
"AI Tumor Board" (impactante, familiar para clínicos)
"Adversarial Clinical Review" (técnico, potente pero quizás intimidante)

Recomendación: "Clinical Debate Protocol" para marketing externo, "Council Feedback Loop" como nombre interno en código.

13. Diagrama de Arquitectura Final

                    ╔══════════════════════════════════════════════════╗
                    ║         ASTEROID MODE — FINALIZE FLOW           ║
                    ║           (Council Feedback Loop)                ║
                    ╚══════════════════════════════════════════════════╝

   ┌─────────────────────────────────────────────────────────────────────┐
   │ PASO 1: COUNCIL (DeepSeek Reasoner) — hasta 25s                    │
   │                                                                     │
   │  Input: Hallazgos RAW de scan360 + datos clínicos del paciente     │
   │                                                                     │
   │  ┌──────────────┐    ┌──────────────┐    ┌──────────────────────┐  │
   │  │ false_positive│    │ differential │    │ correlations +       │  │
   │  │ _suspects[]   │    │ _diagnoses[] │    │ priority_order[]     │  │
   │  └──────┬───────┘    └──────┬───────┘    └──────────────────────┘  │
   │         │                   │                                       │
   └─────────┼───────────────────┼───────────────────────────────────────┘
             │                   │
             ▼                   ▼
   ┌─────────────────────────────────────────────────────────────────────┐
   │ PASO 2: SELECCIÓN INTELIGENTE (selectFindingsForDeepAnalysis)      │
   │                                                                     │
   │  Prioridad 1: Council false_positive_suspects (drop ≥ 0.3)        │
   │  Prioridad 2: Council differential_diagnoses (≥ 2 alternativas)   │
   │  Prioridad 3: Fallback top severidad (si council no flaggea)      │
   │                                                                     │
   │  → Máximo 3 hallazgos seleccionados                                │
   └──────────────────────────┬──────────────────────────────────────────┘
                              │
                              ▼
   ┌─────────────────────────────────────────────────────────────────────┐
   │ PASO 3: DEEP ANALYSIS GUIADO (Gemini 2.5 Flash) — hasta 30s       │
   │         ┌──────────────────────────────────────────────────────┐    │
   │         │                  EN PARALELO                         │    │
   │         │                                                      │    │
   │         │  Finding A              Finding B            Finding C│    │
   │         │  ┌────────────┐        ┌────────────┐    ┌──────────┐│    │
   │         │  │ Prompt base│        │ Prompt base│    │Prompt    ││    │
   │         │  │ + Council  │        │ + Council  │    │base      ││    │
   │         │  │ critique   │        │ DDx list   │    │(estándar)││    │
   │         │  │ "¿Artefac- │        │ "Evalúa    │    │          ││    │
   │         │  │ to o real?"│        │ estos Dx"  │    │          ││    │
   │         │  └─────┬──────┘        └─────┬──────┘    └────┬─────┘│    │
   │         │        │                     │                │      │    │
   │         │        ▼                     ▼                ▼      │    │
   │         │  council_response     council_response    standard   │    │
   │         │  + council_agrees     + council_agrees    deep       │    │
   │         │                                           analysis   │    │
   │         └──────────────────────────────────────────────────────┘    │
   └──────────────────────────┬──────────────────────────────────────────┘
                              │
                              ▼
   ┌─────────────────────────────────────────────────────────────────────┐
   │ PASO 4: ACTUALIZACIÓN + RESPUESTA                                  │
   │                                                                     │
   │  • Findings actualizados (severity, confidence, deep_analysis)     │
   │  • council_review trail almacenado en deep_analysis JSON           │
   │  • study.clinical_council almacenado                               │
   │  • Response al cliente: findings[] + clinicalCouncil               │
   └─────────────────────────────────────────────────────────────────────┘

14. Conclusión

El Council Feedback Loop es un refactor inteligente, no un feature masivo. Al invertir el orden de council y deep analysis dentro de finalize, conseguimos que el razonamiento clínico de DeepSeek influya activamente en el análisis visual de Gemini.

Lo que ganamos:

Reducción estimada de 15-25% en falsos positivos
Deep analysis con foco guiado por razonamiento clínico
Audit trail de debate adversarial entre modelos
Diferenciación competitiva sin precedentes en el mercado

Lo que NO cambia:

Presupuesto de tiempo (57s → 57s)
Coste operativo ($0 adicionales)
Interfaz del cliente (cero cambios en frontend batch loop)
Compatibilidad backward (mismo schema de respuesta)

Lo que cuesta:

~150 líneas de código nuevo + ~20 líneas refactorizadas
Testing de prompts enriquecidos con casos reales
Badge mínimo en frontend para mostrar debate trail

Nombre interno: Council Feedback Loop
Nombre comercial: Clinical Debate Protocol™

Documento preparado para revisión conjunta. No implementar sin aprobación del equipo.

RADIA — Council Feedback Loop (Bucle de Retroalimentación del Consejo)

RADIA — Council Feedback Loop (Bucle de Retroalimentación del Consejo)

1. Resumen Ejecutivo

2. Flujo Actual vs. Flujo Propuesto

2.1 Flujo actual (Asteroid Finalize)

2.2 Flujo propuesto — Council-First (Opción Recomendada)

3. Análisis de Opciones

Opción A — Fase 4 "Reconcile" (nueva acción del cliente)

Opción B — Council-First Finalize (RECOMENDADA) ⭐

Opción C — Doble pasada (Deep → Council → Re-Deep)

4. Diseño Detallado — Opción B (Council-First)

4.1 Cambios en el orden de ejecución

4.2 Algoritmo de priorización de hallazgos para Deep Analysis

4.3 Prompt enriquecido para Deep Analysis con contexto del Council

4.4 Schema de respuesta ampliado para Deep Analysis

4.5 Almacenamiento del debate trail

4.6 Respuesta al cliente (sin cambios en schema)

5. Restricciones de Timing — Análisis Exhaustivo

5.1 Presupuesto actual

5.2 Timeline actual vs. propuesto

5.3 Escenarios de timing adverso

5.4 ¿Qué pasa si el Council falla?

6. Impacto en Council — ¿Pierde calidad sin deep_analysis?

6.1 Qué recibe el Council actualmente

6.2 Qué recibiría en el flujo propuesto

6.3 ¿Es peor?

7. Criterios de Disputa — ¿Cuándo se activa el re-análisis?

7.1 Disputa por Falso Positivo

7.2 Disputa por Diagnóstico Diferencial

7.3 Override por evaluación global

8. Ejemplo Completo de Flujo

Caso: CBCT dental, paciente 42 años, masculino

9. Impacto en Producto

9.1 Diferenciación competitiva

9.2 Métricas esperadas

9.3 Valor para el discurso comercial

10. Plan de Implementación

10.1 Cambios en código

10.2 Estimación de líneas de código

10.3 Testing

10.4 Rollout

11. Riesgos y Mitigaciones

11.1 Riesgo especial: Matching de títulos

12. Decisiones Pendientes para el Equipo

D1: ¿Council-First (Opción B) o Phase 4 Reconcile (Opción A)?

D2: ¿Umbral de disputa?

D3: ¿Máximo de hallazgos re-analizados?

D4: ¿Activar solo para Asteroid o también para análisis estándar?

D5: ¿Nombre del feature para marketing?

13. Diagrama de Arquitectura Final

14. Conclusión

Codex interno v1.1