braintrustdata · max-braintrust · Jun 10, 2026 · Jun 9, 2026 · Jun 9, 2026 · john (j13huang)
diff --git a/.changeset/late-buses-enjoy.md b/.changeset/late-buses-enjoy.md
@@ -0,0 +1,5 @@
+---
+"braintrust": minor
+---
+
+Add support for preserving explicit origin metadata on inline eval cases, so evals that run transformed or pre-resolved rows can retain their source-row provenance.
diff --git a/js/src/framework.ts b/js/src/framework.ts
@@ -1169,6 +1169,17 @@ async function runEvaluatorInternal(
           : Dataset.isDataset(evaluator.data)
             ? evaluator.data
             : undefined;
+        const origin =
+          datum.origin ??
 z.object({ data: z.array(z.unknown()) }), 
 z.object({ data: z.array(z.unknown()) }), 
+          (eventDataset && datum.id && datum._xact_id
+            ? {
+                object_type: "dataset",
+                object_id: await eventDataset.id,
+                id: datum.id,
+                created: datum.created,
+                _xact_id: datum._xact_id,
+              }
+            : undefined);
 
         const baseEvent: StartSpanArgs = {
           name: "eval",
@@ -1179,16 +1190,7 @@ async function runEvaluatorInternal(
             input: datum.input,
             expected: "expected" in datum ? datum.expected : undefined,
             tags: datum.tags,
-            origin:
-              eventDataset && datum.id && datum._xact_id
-                ? {
-                    object_type: "dataset",
-                    object_id: await eventDataset.id,
-                    id: datum.id,
-                    created: datum.created,
-                    _xact_id: datum._xact_id,
-                  }
-                : undefined,
+            origin,
             ...(datum.upsert_id ? { id: datum.upsert_id } : {}),
           },
         };

diff --git a/js/src/logger.ts b/js/src/logger.ts
@@ -77,6 +77,7 @@ import {
   type PromptType as PromptRow,
   type PromptSessionEventType as PromptSessionEvent,
   type RepoInfoType as RepoInfo,
+  type ObjectReferenceType as ObjectReference,
   type PromptBlockDataType as PromptBlockData,
   type ResponseFormatJsonSchemaType as ResponseFormatJsonSchema,
 } from "./generated_types";
@@ -6223,13 +6224,15 @@ export class ObjectFetcher<RecordType> implements AsyncIterable<
 
 export type BaseMetadata = Record<string, unknown> | void;
 export type DefaultMetadataType = void;
+export type EvalCaseOrigin = ObjectReference;
 export type EvalCase<Input, Expected, Metadata> = {
   input: Input;
   tags?: string[];
   // These fields are only set if the EvalCase is part of a Dataset.
   id?: string;
   _xact_id?: TransactionId;
   created?: string | null;
+  origin?: EvalCaseOrigin;
   // This field is used to help re-run a particular experiment row.
   upsert_id?: string;
   // The number of times to run the evaluator for this specific input.