Camins d’Habilitats Onboarding

Propòsit

Aquesta guia és el camí d’integració únic per a ambdós modes d’ús de Decision Gate:

DG guarda l’execució de competències externes.
DG es coneix com una habilitat d’avaluació determinista.

També defineix com compondre ambdós modes de manera segura (bucles recursius) sense permetre la deriva de polítiques autoritzades per LLM.

Quin camí utilitzar

Intent	Path	Enforcement Strength
Mutar l’estat extern (`deploy`, `delete`, `pay`, `publish`)	DG protege l’execució de habilitats	Límite dur (fallar-tancat)
Produir anàlisi/informes/suport a la decisió	DG com a habilitat d’avaluació	Càlcul només a menys que estigui embolcallat per un límit
Cicles d’agents de múltiples passos que autoritzen i després executen	Composició recursiva (guàrdia exterior + avaluació interior)	Límite dur a l’anell exterior

Camí A: Execució de les habilitats dels guàrdies DG (Predeterminat de producció)

Utilitzeu això quan les accions tinguin efectes secundaris.

Contracte Operatiu

La propietat de la porta és humana/propietat de polítiques.
Les especificacions de la porta són artefactes versionats, no inventions de LLM en temps d’execució.
Cada truc de habilitat mutadora ha de passar l’avaluació DG en viu abans de l’execució.
Els resultats no vàlids (hold, fail, unknown) bloquegen l’execució.

Llista de verificació de configuració

Define un mapa de portes per acció.
Autor i registrar les especificacions de l’escenari per a cada classe d’acció.
Implementar un wrapper de runtime prim: evaluate -> allow/deny -> execute.
Exporta i verifica els runpacks per a l’auditoria.

Exemple de mapa d’accions:

{
  "deploy_to_prod": {
    "scenario_id": "release-boundary-v1",
    "required_min_lane": "verified",
    "allowed_outcomes": ["advance", "complete"]
  },
  "publish_external_report": {
    "scenario_id": "publication-boundary-v1",
    "required_min_lane": "verified",
    "allowed_outcomes": ["complete"]
  }
}

Exemple de lògica de wrapper:

def guarded_skill_call(action_name, action_args):
    policy = action_gate_map[action_name]
    run_id = start_run(policy["scenario_id"])
    result = scenario_next(policy["scenario_id"], run_id, feedback="trace")
    outcome = extract_outcome_kind(result)
    if outcome not in policy["allowed_outcomes"]:
        return {"allowed": False, "reason": "gate_not_satisfied", "result": result}
    skill_result = call_external_skill(action_name, action_args)
    runpack = runpack_export(policy["scenario_id"], run_id)
    verify = runpack_verify(runpack["dir"], runpack["manifest_path"])
    return {"allowed": True, "skill_result": skill_result, "runpack_verify": verify}

Referències d’implementació:

scenario_define, scenario_start, scenario_next: integration_patterns.md
runpack audit path: integration_patterns.md
exemple de flux en viu de principi a fi: openai_agents_live_loop.py

Camí B: Habilitat d’Avaluació DG

Utilitzeu això per a l’anàlisi estructurada quan no s’executa cap acció d’efecte secundari directe.

Contracte Operatiu

DG s’invoca com a un avaluador de reclamacions determinista.
Les sortides impulsen l’explicació/informe, no la mutació directa.
Si es sol·licita una mutació més tard, canvia primer a la frontera del Camí A.

Flux d’Eines Típic

Descobreix capacitats: providers_list, provider_contract_get, provider_check_schema_get.
Construir artefactes: claim_inventory, capability_matrix, claim_condition_map.
Avaluar: precheck per a la iteració, després scenario_next en viu quan la política requereix prova en viu.
Verifiqueu la integritat quan s’exigeixi una auditoria: runpack_export, runpack_verify.

Contracte canònic: llm_native_playbook.md

Camí C: Composició Recursiva (Cicle d’Autoria + Límits d’Execució)

Aquesta és la preocupació comuna del “flux de treball DG dins de DG”.

Utilitza un model d’anell:

Anell interior: DG-as-skill per a l’assistència en la descomposició/verificació de reclamacions.
Anell exterior: guarda DG per a l’acció conseqüent.

Regles estrictes:

El cercle interior pot proposar mapes; no pot relaxar la política del cercle exterior.
Les definicions de la porta de l’anell exterior romanen autoritzades pel sistema i versionades.
Bloquejos de l’anell exterior sobre qualsevol reclam requerit no resolt independentment del text de confiança de l’anell interior.
La verificació de Runpack a l’anell exterior és la font d’auditoria de veritat.

Patró anti a evitar:

"The agent self-evaluated with DG and therefore can deploy."

Patró correcte:

"The agent used DG for analysis, then the system-enforced deployment gate passed live, then deploy executed."

Ruta d’Integració Ràpida (Repositori)

Utilitzeu aquesta seqüència quan incorporeu humans o agents LLM a ambdós camins.

Executa el ràpid inici de comanda provat (ambdues rutes + cas de denegació forçada):

scripts/bootstrap/skill_pathways_quickstart.sh configs/presets/quickstart-dev.toml

Llegeix llm_native_playbook.md i aquesta guia.
Instal·lar habilitats:

scripts/skills/install_local.sh

Executar el procés d’integració de principi a fi:

python3 examples/frameworks/openai_agents_live_loop.py \
  --fixture-dir examples/agentic/onboarding/basic

Executar la matriu de correcció determinista:

python3 scripts/skills/eval_runner.py \
  --mode deterministic \
  --trials 1 \
  --cases all \
  --out-dir .tmp/skills/eval-deterministic-local

Executar el verificador de correcció d’integració:

python3 scripts/onboarding/provider_onboarding_check.py \
  --cases all \
  --out-dir .tmp/onboarding/local

Definició de Fet (Mínim Sense Errors)

Abans de declarar l’adopció completa:

Les habilitats de mutació estan envoltades per la lògica de límit del Camí A.
Les especificacions de la porta són versionades i propietat de la política (no text de prompt ad hoc).
Les instruccions orientades a LLM inclouen regles de parada estrictes explícites.
Els informes d’evaluació de competències deterministes passen per als casos requerits.
El informe de correcció d’integració marca tots els casos com a complets.
Passos de verificació de runpack en fluxos de treball de límit en viu.

Camins d’Habilitats Onboarding

Propòsit

Quin camí utilitzar

Camí A: Execució de les habilitats dels guàrdies DG (Predeterminat de producció)

Contracte Operatiu

Llista de verificació de configuració

Camí B: Habilitat d’Avaluació DG

Contracte Operatiu

Flux d’Eines Típic

Camí C: Composició Recursiva (Cicle d’Autoria + Límits d’Execució)

Ruta d’Integració Ràpida (Repositori)

Definició de Fet (Mínim Sense Errors)

Referències Creuades