livekit · nightcityblade · Jun 16, 2026 · Jun 17, 2026
@@ -1728,7 +1728,11 @@ def _on_input_speech_stopped(self, ev: llm.InputSpeechStoppedEvent) -> None:
 
     def _on_input_audio_transcription_completed(self, ev: llm.InputTranscriptionCompleted) -> None:
         self._session._user_input_transcribed(
-            UserInputTranscribedEvent(transcript=ev.transcript, is_final=ev.is_final)
+            UserInputTranscribedEvent(
+                transcript=ev.transcript,
+                is_final=ev.is_final,
+                item_id=ev.item_id,
+            )
         )
 
         if ev.is_final:

@@ -315,6 +315,8 @@ class UserInputTranscribedEvent(BaseModel):
     type: Literal["user_input_transcribed"] = "user_input_transcribed"
     transcript: str
     is_final: bool
+    item_id: str | None = None
+    """Provider-specific ID for the transcribed input item, when available."""
     speaker_id: str | None = None
     language: LanguageCode | None = None
     created_at: float = Field(default_factory=time.time)

@@ -26,9 +26,7 @@
     inference,
     vad,
 )
-from livekit.agents.llm import (
-    FunctionToolCall,
-)
+from livekit.agents.llm import FunctionToolCall, InputTranscriptionCompleted
 from livekit.agents.llm.chat_context import ChatContext, ChatMessage
 from livekit.agents.stt import SpeechData, SpeechEvent, SpeechEventType
 from livekit.agents.utils import aio
@@ -92,6 +90,31 @@ async def on_user_turn_completed(self, turn_ctx: ChatContext, new_message: ChatM
 SESSION_TIMEOUT = 60.0
 
 
+def test_realtime_user_input_transcription_preserves_item_id() -> None:
+    captured_events: list[UserInputTranscribedEvent] = []
+
+    class DummySession:
+        def _user_input_transcribed(self, ev: UserInputTranscribedEvent) -> None:
+            captured_events.append(ev)
+
+    activity = object.__new__(AgentActivity)
+    activity._session = DummySession()
+
+    AgentActivity._on_input_audio_transcription_completed(
+        activity,
+        InputTranscriptionCompleted(
+            item_id="item_123",
+            transcript="hello",
+            is_final=False,
+        ),
+    )
+
+    assert len(captured_events) == 1
+    assert captured_events[0].transcript == "hello"
+    assert captured_events[0].is_final is False
+    assert captured_events[0].item_id == "item_123"
+
+
 async def test_events_and_metrics() -> None:
     speed = 1
     actions = FakeActions()