From 3214be51c729b3f60cb93a339404f0c9143b6d14 Mon Sep 17 00:00:00 2001
From: Jianke LIN <crayozakka@gmail.com>
Date: Mon, 25 May 2026 22:26:45 +0200
Subject: [PATCH 1/5] fix(stdio): drain responses after stdin EOF

---
 src/mcp/server/lowlevel/server.py    |  1 +
 src/mcp/shared/jsonrpc_dispatcher.py | 24 ++++---
 src/mcp/shared/session.py            | 15 ++++-
 tests/server/test_cancel_handling.py | 34 ++++------
 tests/server/test_stdio.py           | 96 +++++++++++++++++++++++++++-
 5 files changed, 140 insertions(+), 30 deletions(-)

diff --git a/src/mcp/server/lowlevel/server.py b/src/mcp/server/lowlevel/server.py
index d2536189d0..dc60c5c247 100644
--- a/src/mcp/server/lowlevel/server.py
+++ b/src/mcp/server/lowlevel/server.py
@@ -416,6 +416,7 @@ async def run(
                 # the next request (spec says SHOULD NOT, not MUST NOT) sees
                 # the initialized state instead of failing the init-gate.
                 inline_methods=frozenset({"initialize"}),
+                close_write_stream_on_read_close=False,
             )
             runner = ServerRunner(
                 server=self,
diff --git a/src/mcp/shared/jsonrpc_dispatcher.py b/src/mcp/shared/jsonrpc_dispatcher.py
index 457e6b6f77..d8dd040a4d 100644
--- a/src/mcp/shared/jsonrpc_dispatcher.py
+++ b/src/mcp/shared/jsonrpc_dispatcher.py
@@ -23,6 +23,7 @@
 import contextvars
 import logging
 from collections.abc import Awaitable, Callable, Mapping
+from contextlib import AsyncExitStack
 from dataclasses import dataclass, field
 from typing import Any, Generic, Literal, TypeVar, cast, overload
 
@@ -226,6 +227,7 @@ def __init__(
         peer_cancel_mode: PeerCancelMode = "interrupt",
         raise_handler_exceptions: bool = False,
         inline_methods: frozenset[str] = frozenset(),
+        close_write_stream_on_read_close: bool = True,
     ) -> None: ...
     @overload
     def __init__(
@@ -237,6 +239,7 @@ def __init__(
         peer_cancel_mode: PeerCancelMode = "interrupt",
         raise_handler_exceptions: bool = False,
         inline_methods: frozenset[str] = frozenset(),
+        close_write_stream_on_read_close: bool = True,
     ) -> None: ...
     def __init__(
         self,
@@ -247,6 +250,7 @@ def __init__(
         peer_cancel_mode: PeerCancelMode = "interrupt",
         raise_handler_exceptions: bool = False,
         inline_methods: frozenset[str] = frozenset(),
+        close_write_stream_on_read_close: bool = True,
     ) -> None:
         self._read_stream = read_stream
         self._write_stream = write_stream
@@ -259,6 +263,7 @@ def __init__(
         )
         self._peer_cancel_mode: PeerCancelMode = peer_cancel_mode
         self._raise_handler_exceptions = raise_handler_exceptions
+        self._close_write_stream_on_read_close = close_write_stream_on_read_close
         # Request methods handled inline in the read loop (awaited before the
         # next message is dequeued) instead of spawned concurrently. Use for
         # methods whose side effects must be observable to the next message,
@@ -400,13 +405,17 @@ async def run(
         `await tg.start(dispatcher.run, ...)` resumes when `send_raw_request`
         is usable.
         """
+        normal_eof = False
         try:
             async with anyio.create_task_group() as tg:
                 self._tg = tg
                 self._running = True
                 task_status.started()
                 try:
-                    async with self._read_stream, self._write_stream:
+                    async with AsyncExitStack() as stack:
+                        await stack.enter_async_context(self._read_stream)
+                        if self._close_write_stream_on_read_close:
+                            await stack.enter_async_context(self._write_stream)
                         try:
                             async for item in self._read_stream:
                                 # Duck-typed: `_context_streams.ContextReceiveStream`
@@ -425,14 +434,13 @@ async def run(
                     # (callers outside this task group) with CONNECTION_CLOSED.
                     self._running = False
                     self._fan_out_closed()
+                    normal_eof = True
                 finally:
-                    # Transport closed: cancel in-flight handlers. Without this
-                    # the task-group join waits for them, and a handler that
-                    # outlives its caller (its request timed out client-side, or
-                    # the client disconnected mid-call) would keep `run()` from
-                    # returning forever. Same behaviour as `Server.run()` before
-                    # the dispatcher rework.
-                    tg.cancel_scope.cancel()
+                    if not normal_eof:
+                        # Transport closed abnormally: cancel in-flight handlers.
+                        # On normal EOF, let already-received handlers drain
+                        # their responses before the task group exits.
+                        tg.cancel_scope.cancel()
         finally:
             # Covers the cancel/crash paths where the inline fan-out above is
             # never reached. Idempotent.
diff --git a/src/mcp/shared/session.py b/src/mcp/shared/session.py
index 50597e10e8..cd4d6b31e8 100644
--- a/src/mcp/shared/session.py
+++ b/src/mcp/shared/session.py
@@ -148,14 +148,24 @@ def __init__(
         write_stream: WriteStream[SessionMessage],
         # If none, reading will never time out
         read_timeout_seconds: float | None = None,
+        # When True, closing/EOF on the read stream closes the write stream too.
+        #
+        # For full-duplex transports (e.g., stdio), an input EOF can be a
+        # half-close: the peer is done sending requests but still expects
+        # responses on the output stream. In that case, callers may opt out so
+        # in-flight handlers can drain their responses before shutdown.
+        close_write_stream_on_read_close: bool = True,
     ) -> None:
         self._read_stream = read_stream
         self._write_stream = write_stream
         self._response_streams = {}
         self._request_id = 0
         self._session_read_timeout_seconds = read_timeout_seconds
+        self._close_write_stream_on_read_close = close_write_stream_on_read_close
         self._progress_callbacks = {}
         self._exit_stack = AsyncExitStack()
+        self._exit_stack.push_async_callback(self._read_stream.aclose)
+        self._exit_stack.push_async_callback(self._write_stream.aclose)
 
     async def __aenter__(self) -> Self:
         self._task_group = anyio.create_task_group()
@@ -291,7 +301,10 @@ def _receive_notification_adapter(self) -> TypeAdapter[ReceiveNotificationT]:
         raise NotImplementedError
 
     async def _receive_loop(self) -> None:
-        async with self._read_stream, self._write_stream:
+        async with AsyncExitStack() as stack:
+            await stack.enter_async_context(self._read_stream)
+            if self._close_write_stream_on_read_close:
+                await stack.enter_async_context(self._write_stream)
             try:
 
                 async def _handle_session_message(message: SessionMessage) -> None:
diff --git a/tests/server/test_cancel_handling.py b/tests/server/test_cancel_handling.py
index cff5a37c15..2d663a25cd 100644
--- a/tests/server/test_cancel_handling.py
+++ b/tests/server/test_cancel_handling.py
@@ -19,6 +19,7 @@
     InitializeRequestParams,
     JSONRPCNotification,
     JSONRPCRequest,
+    JSONRPCResponse,
     ListToolsResult,
     PaginatedRequestParams,
     TextContent,
@@ -100,29 +101,18 @@ async def first_request():
 
 
 @pytest.mark.anyio
-async def test_server_cancels_in_flight_handlers_on_transport_close():
-    """When the transport closes mid-request, server.run() must cancel in-flight
-    handlers rather than join on them.
-
-    Without the cancel, the task group waits for the handler, which then tries
-    to respond through a write stream that _receive_loop already closed,
-    raising ClosedResourceError and crashing server.run() with exit code 1.
-
-    This drives server.run() with raw memory streams because InMemoryTransport
-    wraps it in its own finally-cancel (_memory.py) which masks the bug.
-    """
+async def test_server_drains_in_flight_handlers_on_transport_read_eof():
+    """When the transport's read side hits EOF (e.g., stdio stdin closes), the
+    server must drain already-started handlers so their responses reach the
+    peer via the still-open write side."""
     handler_started = anyio.Event()
-    handler_cancelled = anyio.Event()
+    handler_allowed_to_finish = anyio.Event()
     server_run_returned = anyio.Event()
 
     async def handle_call_tool(ctx: ServerRequestContext, params: CallToolRequestParams) -> CallToolResult:
         handler_started.set()
-        try:
-            await anyio.sleep_forever()
-        finally:
-            handler_cancelled.set()
-        # unreachable: sleep_forever only exits via cancellation
-        raise AssertionError  # pragma: no cover
+        await handler_allowed_to_finish.wait()
+        return CallToolResult(content=[TextContent(type="text", text="ok")])
 
     server = Server("test", on_call_tool=handle_call_tool)
 
@@ -167,9 +157,13 @@ async def run_server():
             # handler gets CancelledError, server.run() returns.
             await to_server.aclose()
 
-            await server_run_returned.wait()
+            handler_allowed_to_finish.set()
+
+            response = await from_server.receive()
+            assert isinstance(response.message, JSONRPCResponse)
+            assert response.message.id == 2
 
-    assert handler_cancelled.is_set()
+            await server_run_returned.wait()
 
 
 @pytest.mark.anyio
diff --git a/tests/server/test_stdio.py b/tests/server/test_stdio.py
index 054a157b3b..e827a8ae47 100644
--- a/tests/server/test_stdio.py
+++ b/tests/server/test_stdio.py
@@ -8,10 +8,28 @@
 import anyio
 import pytest
 
+from mcp.server import Server, ServerRequestContext
 from mcp.server.mcpserver import MCPServer
 from mcp.server.stdio import stdio_server
 from mcp.shared.message import SessionMessage
-from mcp.types import JSONRPCMessage, JSONRPCRequest, JSONRPCResponse, jsonrpc_message_adapter
+from mcp.types import (
+    LATEST_PROTOCOL_VERSION,
+    CallToolRequestParams,
+    CallToolResult,
+    ClientCapabilities,
+    Implementation,
+    InitializeRequestParams,
+    JSONRPCError,
+    JSONRPCMessage,
+    JSONRPCNotification,
+    JSONRPCRequest,
+    JSONRPCResponse,
+    ListToolsResult,
+    PaginatedRequestParams,
+    TextContent,
+    Tool,
+    jsonrpc_message_adapter,
+)
 
 
 @pytest.mark.anyio
@@ -169,3 +187,79 @@ async def lifespan(server: MCPServer) -> AsyncIterator[None]:
     assert events == ["setup", "cleanup"]
     response = jsonrpc_message_adapter.validate_json(captured.getvalue().decode().strip())
     assert response == JSONRPCResponse(jsonrpc="2.0", id=1, result={})
+
+
+@pytest.mark.anyio
+async def test_stdio_server_drains_in_flight_responses_on_stdin_eof():
+    """When stdin reaches EOF (e.g., bash-redirected input), already-received
+    requests must still be able to emit their responses on stdout."""
+    stdin = io.StringIO()
+    stdout = io.StringIO()
+
+    tool_started_count = 0
+    both_tools_started = anyio.Event()
+    allow_tools_to_finish = anyio.Event()
+
+    async def handle_list_tools(ctx: ServerRequestContext, params: PaginatedRequestParams | None) -> ListToolsResult:
+        return ListToolsResult(tools=[Tool(name="slow", description="test", input_schema={})])
+
+    async def handle_call_tool(ctx: ServerRequestContext, params: CallToolRequestParams) -> CallToolResult:
+        nonlocal tool_started_count
+        tool_started_count += 1
+        if tool_started_count == 2:
+            both_tools_started.set()
+        await allow_tools_to_finish.wait()
+        return CallToolResult(content=[TextContent(type="text", text="ok")])
+
+    server = Server("test", on_list_tools=handle_list_tools, on_call_tool=handle_call_tool)
+
+    init_req = JSONRPCRequest(
+        jsonrpc="2.0",
+        id=0,
+        method="initialize",
+        params=InitializeRequestParams(
+            protocol_version=LATEST_PROTOCOL_VERSION,
+            capabilities=ClientCapabilities(),
+            client_info=Implementation(name="test", version="1.0"),
+        ).model_dump(by_alias=True, mode="json", exclude_none=True),
+    )
+    initialized = JSONRPCNotification(jsonrpc="2.0", method="notifications/initialized")
+    call_1 = JSONRPCRequest(
+        jsonrpc="2.0",
+        id=1,
+        method="tools/call",
+        params=CallToolRequestParams(name="slow", arguments={}).model_dump(by_alias=True, mode="json"),
+    )
+    call_2 = JSONRPCRequest(
+        jsonrpc="2.0",
+        id=2,
+        method="tools/call",
+        params=CallToolRequestParams(name="slow", arguments={}).model_dump(by_alias=True, mode="json"),
+    )
+
+    for message in (init_req, initialized, call_1, call_2):
+        stdin.write(message.model_dump_json(by_alias=True, exclude_none=True) + "\n")
+    stdin.seek(0)
+
+    async with stdio_server(stdin=anyio.AsyncFile(stdin), stdout=anyio.AsyncFile(stdout)) as (
+        read_stream,
+        write_stream,
+    ):
+        with anyio.fail_after(5):
+            async with anyio.create_task_group() as tg:
+                tg.start_soon(server.run, read_stream, write_stream, server.create_initialization_options())
+                await both_tools_started.wait()
+                allow_tools_to_finish.set()
+
+    stdout.seek(0)
+    ids: set[int | str] = set()
+    for line in stdout.readlines():
+        line = line.strip()
+        if not line:
+            continue
+        message = jsonrpc_message_adapter.validate_json(line)
+        if isinstance(message, JSONRPCResponse | JSONRPCError):
+            assert message.id is not None
+            ids.add(message.id)
+    assert 1 in ids
+    assert 2 in ids

From 1521370f0ac5493f0ce8dee559b88884d2d4cfb2 Mon Sep 17 00:00:00 2001
From: Jianke LIN <crayozakka@gmail.com>
Date: Mon, 25 May 2026 22:59:26 +0200
Subject: [PATCH 2/5] test: cover stdio EOF drain and shutdown edges

---
 tests/server/test_cancel_handling.py | 117 +++++++++++++++++++++++++++
 tests/server/test_stdio.py           |  18 ++---
 2 files changed, 125 insertions(+), 10 deletions(-)

diff --git a/tests/server/test_cancel_handling.py b/tests/server/test_cancel_handling.py
index 2d663a25cd..9544c91fb8 100644
--- a/tests/server/test_cancel_handling.py
+++ b/tests/server/test_cancel_handling.py
@@ -166,6 +166,123 @@ async def run_server():
             await server_run_returned.wait()
 
 
+@pytest.mark.anyio
+async def test_server_reraises_handler_cancellation_when_server_is_cancelled():
+    """If the server task is cancelled (e.g. KeyboardInterrupt), in-flight
+    request handlers will get cancelled too. Cancellation must be re-raised so
+    the task group can unwind cleanly."""
+    handler_started = anyio.Event()
+    server_run_returned = anyio.Event()
+    cancel_scope = anyio.CancelScope()
+
+    async def handle_call_tool(ctx: ServerRequestContext, params: CallToolRequestParams) -> CallToolResult:
+        handler_started.set()
+        await anyio.sleep_forever()
+        raise AssertionError  # pragma: no cover
+
+    server = Server("test", on_call_tool=handle_call_tool)
+
+    to_server, server_read = anyio.create_memory_object_stream[SessionMessage | Exception](10)
+    server_write, from_server = anyio.create_memory_object_stream[SessionMessage](10)
+
+    async def run_server():
+        try:
+            with cancel_scope:
+                await server.run(server_read, server_write, server.create_initialization_options())
+        finally:
+            server_run_returned.set()
+
+    init_req = JSONRPCRequest(
+        jsonrpc="2.0",
+        id=1,
+        method="initialize",
+        params=InitializeRequestParams(
+            protocol_version=LATEST_PROTOCOL_VERSION,
+            capabilities=ClientCapabilities(),
+            client_info=Implementation(name="test", version="1.0"),
+        ).model_dump(by_alias=True, mode="json", exclude_none=True),
+    )
+    initialized = JSONRPCNotification(jsonrpc="2.0", method="notifications/initialized")
+    call_req = JSONRPCRequest(
+        jsonrpc="2.0",
+        id=2,
+        method="tools/call",
+        params=CallToolRequestParams(name="slow", arguments={}).model_dump(by_alias=True, mode="json"),
+    )
+
+    with anyio.fail_after(5):
+        async with anyio.create_task_group() as tg, to_server, server_read, server_write, from_server:
+            tg.start_soon(run_server)
+
+            await to_server.send(SessionMessage(init_req))
+            await from_server.receive()  # init response
+            await to_server.send(SessionMessage(initialized))
+            await to_server.send(SessionMessage(call_req))
+
+            await handler_started.wait()
+            cancel_scope.cancel()
+            await server_run_returned.wait()
+
+
+@pytest.mark.anyio
+async def test_server_drops_response_when_write_stream_closes_mid_request():
+    """If the write side closes while a handler is in-flight, responding may
+    raise (ClosedResourceError/BrokenResourceError). The handler task should
+    exit without crashing the server."""
+    handler_started = anyio.Event()
+    allow_finish = anyio.Event()
+    server_run_returned = anyio.Event()
+
+    async def handle_call_tool(ctx: ServerRequestContext, params: CallToolRequestParams) -> CallToolResult:
+        handler_started.set()
+        await allow_finish.wait()
+        return CallToolResult(content=[TextContent(type="text", text="ok")])
+
+    server = Server("test", on_call_tool=handle_call_tool)
+
+    to_server, server_read = anyio.create_memory_object_stream[SessionMessage | Exception](10)
+    server_write, from_server = anyio.create_memory_object_stream[SessionMessage](10)
+
+    async def run_server():
+        await server.run(server_read, server_write, server.create_initialization_options())
+        server_run_returned.set()
+
+    init_req = JSONRPCRequest(
+        jsonrpc="2.0",
+        id=1,
+        method="initialize",
+        params=InitializeRequestParams(
+            protocol_version=LATEST_PROTOCOL_VERSION,
+            capabilities=ClientCapabilities(),
+            client_info=Implementation(name="test", version="1.0"),
+        ).model_dump(by_alias=True, mode="json", exclude_none=True),
+    )
+    initialized = JSONRPCNotification(jsonrpc="2.0", method="notifications/initialized")
+    call_req = JSONRPCRequest(
+        jsonrpc="2.0",
+        id=2,
+        method="tools/call",
+        params=CallToolRequestParams(name="slow", arguments={}).model_dump(by_alias=True, mode="json"),
+    )
+
+    with anyio.fail_after(5):
+        async with anyio.create_task_group() as tg, to_server, server_read, server_write, from_server:
+            tg.start_soon(run_server)
+
+            await to_server.send(SessionMessage(init_req))
+            await from_server.receive()  # init response
+            await to_server.send(SessionMessage(initialized))
+            await to_server.send(SessionMessage(call_req))
+
+            await handler_started.wait()
+            await server_write.aclose()
+
+            allow_finish.set()
+            await to_server.aclose()
+
+            await server_run_returned.wait()
+
+
 @pytest.mark.anyio
 async def test_server_handles_transport_close_with_pending_server_to_client_requests():
     """When the transport closes while handlers are blocked on server→client
diff --git a/tests/server/test_stdio.py b/tests/server/test_stdio.py
index e827a8ae47..25da9edd16 100644
--- a/tests/server/test_stdio.py
+++ b/tests/server/test_stdio.py
@@ -19,7 +19,6 @@
     ClientCapabilities,
     Implementation,
     InitializeRequestParams,
-    JSONRPCError,
     JSONRPCMessage,
     JSONRPCNotification,
     JSONRPCRequest,
@@ -224,6 +223,7 @@ async def handle_call_tool(ctx: ServerRequestContext, params: CallToolRequestPar
         ).model_dump(by_alias=True, mode="json", exclude_none=True),
     )
     initialized = JSONRPCNotification(jsonrpc="2.0", method="notifications/initialized")
+    list_tools = JSONRPCRequest(jsonrpc="2.0", id=10, method="tools/list")
     call_1 = JSONRPCRequest(
         jsonrpc="2.0",
         id=1,
@@ -237,7 +237,7 @@ async def handle_call_tool(ctx: ServerRequestContext, params: CallToolRequestPar
         params=CallToolRequestParams(name="slow", arguments={}).model_dump(by_alias=True, mode="json"),
     )
 
-    for message in (init_req, initialized, call_1, call_2):
+    for message in (init_req, initialized, list_tools, call_1, call_2):
         stdin.write(message.model_dump_json(by_alias=True, exclude_none=True) + "\n")
     stdin.seek(0)
 
@@ -252,14 +252,12 @@ async def handle_call_tool(ctx: ServerRequestContext, params: CallToolRequestPar
                 allow_tools_to_finish.set()
 
     stdout.seek(0)
+    output_lines = [line.strip() for line in stdout.readlines()]
+    messages = [jsonrpc_message_adapter.validate_json(line) for line in output_lines]
     ids: set[int | str] = set()
-    for line in stdout.readlines():
-        line = line.strip()
-        if not line:
-            continue
-        message = jsonrpc_message_adapter.validate_json(line)
-        if isinstance(message, JSONRPCResponse | JSONRPCError):
-            assert message.id is not None
-            ids.add(message.id)
+    for message in messages:
+        assert isinstance(message, JSONRPCResponse)
+        ids.add(message.id)
+
     assert 1 in ids
     assert 2 in ids

From f6be89c23f32faa273e60649e2726ab28d38d24c Mon Sep 17 00:00:00 2001
From: Jianke LIN <crayozakka@gmail.com>
Date: Mon, 25 May 2026 23:05:59 +0200
Subject: [PATCH 3/5] test: ignore coverage branch arc on 3.14

---
 tests/server/test_stdio.py | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/tests/server/test_stdio.py b/tests/server/test_stdio.py
index 25da9edd16..92e63a8543 100644
--- a/tests/server/test_stdio.py
+++ b/tests/server/test_stdio.py
@@ -246,7 +246,7 @@ async def handle_call_tool(ctx: ServerRequestContext, params: CallToolRequestPar
         write_stream,
     ):
         with anyio.fail_after(5):
-            async with anyio.create_task_group() as tg:
+            async with anyio.create_task_group() as tg:  # pragma: no branch
                 tg.start_soon(server.run, read_stream, write_stream, server.create_initialization_options())
                 await both_tools_started.wait()
                 allow_tools_to_finish.set()

From aa6a7e6d6e2303a9cae5af960963be265c570013 Mon Sep 17 00:00:00 2001
From: Jianke LIN <crayozakka@gmail.com>
Date: Mon, 25 May 2026 23:17:06 +0200
Subject: [PATCH 4/5] fix(server): opt-in drain on read EOF

---
 src/mcp/server/lowlevel/server.py    |  6 +++++-
 src/mcp/server/mcpserver/server.py   |  1 +
 tests/server/test_cancel_handling.py |  2 +-
 tests/server/test_stdio.py           | 11 ++++++++++-
 4 files changed, 17 insertions(+), 3 deletions(-)

diff --git a/src/mcp/server/lowlevel/server.py b/src/mcp/server/lowlevel/server.py
index dc60c5c247..3229f5691b 100644
--- a/src/mcp/server/lowlevel/server.py
+++ b/src/mcp/server/lowlevel/server.py
@@ -406,6 +406,10 @@ async def run(
         # the initialization lifecycle, but can do so with any available node
         # rather than requiring initialization for each connection.
         stateless: bool = False,
+        # When True, treat read EOF as a half-close and allow in-flight handlers
+        # to drain their responses via the still-open write stream (e.g. stdio
+        # with bash-redirected stdin).
+        drain_on_read_close: bool = False,
     ) -> None:
         async with self.lifespan(self) as lifespan_context:
             dispatcher: JSONRPCDispatcher[TransportContext] = JSONRPCDispatcher(
@@ -416,7 +420,7 @@ async def run(
                 # the next request (spec says SHOULD NOT, not MUST NOT) sees
                 # the initialized state instead of failing the init-gate.
                 inline_methods=frozenset({"initialize"}),
-                close_write_stream_on_read_close=False,
+                close_write_stream_on_read_close=not drain_on_read_close,
             )
             runner = ServerRunner(
                 server=self,
diff --git a/src/mcp/server/mcpserver/server.py b/src/mcp/server/mcpserver/server.py
index fdb69571d8..647bb8c573 100644
--- a/src/mcp/server/mcpserver/server.py
+++ b/src/mcp/server/mcpserver/server.py
@@ -848,6 +848,7 @@ async def run_stdio_async(self) -> None:
                 read_stream,
                 write_stream,
                 self._lowlevel_server.create_initialization_options(),
+                drain_on_read_close=True,
             )
 
     async def run_sse_async(  # pragma: no cover
diff --git a/tests/server/test_cancel_handling.py b/tests/server/test_cancel_handling.py
index 9544c91fb8..a988b30be6 100644
--- a/tests/server/test_cancel_handling.py
+++ b/tests/server/test_cancel_handling.py
@@ -120,7 +120,7 @@ async def handle_call_tool(ctx: ServerRequestContext, params: CallToolRequestPar
     server_write, from_server = anyio.create_memory_object_stream[SessionMessage](10)
 
     async def run_server():
-        await server.run(server_read, server_write, server.create_initialization_options())
+        await server.run(server_read, server_write, server.create_initialization_options(), drain_on_read_close=True)
         server_run_returned.set()
 
     init_req = JSONRPCRequest(
diff --git a/tests/server/test_stdio.py b/tests/server/test_stdio.py
index 92e63a8543..8f97c679a8 100644
--- a/tests/server/test_stdio.py
+++ b/tests/server/test_stdio.py
@@ -247,7 +247,16 @@ async def handle_call_tool(ctx: ServerRequestContext, params: CallToolRequestPar
     ):
         with anyio.fail_after(5):
             async with anyio.create_task_group() as tg:  # pragma: no branch
-                tg.start_soon(server.run, read_stream, write_stream, server.create_initialization_options())
+
+                async def run_server() -> None:
+                    await server.run(
+                        read_stream,
+                        write_stream,
+                        server.create_initialization_options(),
+                        drain_on_read_close=True,
+                    )
+
+                tg.start_soon(run_server)
                 await both_tools_started.wait()
                 allow_tools_to_finish.set()
 

From 1380ede0bf47814569e8a06e15829abb3b8ba23f Mon Sep 17 00:00:00 2001
From: Jianke LIN <crayozakka@gmail.com>
Date: Tue, 2 Jun 2026 19:23:11 +0200
Subject: [PATCH 5/5] fix(stdio): bound EOF drain wait

---
 src/mcp/server/lowlevel/server.py    |  6 +++
 src/mcp/shared/jsonrpc_dispatcher.py | 11 ++++-
 tests/server/test_cancel_handling.py | 72 +++++++++++++++++++++++++++-
 3 files changed, 87 insertions(+), 2 deletions(-)

diff --git a/src/mcp/server/lowlevel/server.py b/src/mcp/server/lowlevel/server.py
index 3229f5691b..9439809b29 100644
--- a/src/mcp/server/lowlevel/server.py
+++ b/src/mcp/server/lowlevel/server.py
@@ -69,6 +69,8 @@ async def main():
 
 logger = logging.getLogger(__name__)
 
+DEFAULT_READ_EOF_DRAIN_TIMEOUT_SECONDS = 1.0
+
 LifespanResultT = TypeVar("LifespanResultT", default=Any)
 
 _ParamsT = TypeVar("_ParamsT", bound=BaseModel, default=BaseModel)
@@ -410,6 +412,9 @@ async def run(
         # to drain their responses via the still-open write stream (e.g. stdio
         # with bash-redirected stdin).
         drain_on_read_close: bool = False,
+        # Maximum time to wait for in-flight handlers to drain after read EOF.
+        # None means wait indefinitely.
+        read_eof_drain_timeout_seconds: float | None = DEFAULT_READ_EOF_DRAIN_TIMEOUT_SECONDS,
     ) -> None:
         async with self.lifespan(self) as lifespan_context:
             dispatcher: JSONRPCDispatcher[TransportContext] = JSONRPCDispatcher(
@@ -421,6 +426,7 @@ async def run(
                 # the initialized state instead of failing the init-gate.
                 inline_methods=frozenset({"initialize"}),
                 close_write_stream_on_read_close=not drain_on_read_close,
+                read_eof_drain_timeout_seconds=read_eof_drain_timeout_seconds,
             )
             runner = ServerRunner(
                 server=self,
diff --git a/src/mcp/shared/jsonrpc_dispatcher.py b/src/mcp/shared/jsonrpc_dispatcher.py
index d8dd040a4d..739707767f 100644
--- a/src/mcp/shared/jsonrpc_dispatcher.py
+++ b/src/mcp/shared/jsonrpc_dispatcher.py
@@ -228,6 +228,7 @@ def __init__(
         raise_handler_exceptions: bool = False,
         inline_methods: frozenset[str] = frozenset(),
         close_write_stream_on_read_close: bool = True,
+        read_eof_drain_timeout_seconds: float | None = None,
     ) -> None: ...
     @overload
     def __init__(
@@ -240,6 +241,7 @@ def __init__(
         raise_handler_exceptions: bool = False,
         inline_methods: frozenset[str] = frozenset(),
         close_write_stream_on_read_close: bool = True,
+        read_eof_drain_timeout_seconds: float | None = None,
     ) -> None: ...
     def __init__(
         self,
@@ -251,6 +253,7 @@ def __init__(
         raise_handler_exceptions: bool = False,
         inline_methods: frozenset[str] = frozenset(),
         close_write_stream_on_read_close: bool = True,
+        read_eof_drain_timeout_seconds: float | None = None,
     ) -> None:
         self._read_stream = read_stream
         self._write_stream = write_stream
@@ -264,6 +267,7 @@ def __init__(
         self._peer_cancel_mode: PeerCancelMode = peer_cancel_mode
         self._raise_handler_exceptions = raise_handler_exceptions
         self._close_write_stream_on_read_close = close_write_stream_on_read_close
+        self._read_eof_drain_timeout_seconds = read_eof_drain_timeout_seconds
         # Request methods handled inline in the read loop (awaited before the
         # next message is dequeued) instead of spawned concurrently. Use for
         # methods whose side effects must be observable to the next message,
@@ -436,17 +440,22 @@ async def run(
                     self._fan_out_closed()
                     normal_eof = True
                 finally:
-                    if not normal_eof:
+                    if not normal_eof or self._close_write_stream_on_read_close:
                         # Transport closed abnormally: cancel in-flight handlers.
                         # On normal EOF, let already-received handlers drain
                         # their responses before the task group exits.
                         tg.cancel_scope.cancel()
+                    elif self._read_eof_drain_timeout_seconds is not None:
+                        tg.cancel_scope.deadline = anyio.current_time() + self._read_eof_drain_timeout_seconds
         finally:
             # Covers the cancel/crash paths where the inline fan-out above is
             # never reached. Idempotent.
             self._running = False
             self._tg = None
             self._fan_out_closed()
+            if not self._close_write_stream_on_read_close:
+                with anyio.CancelScope(shield=True):
+                    await self._write_stream.aclose()
 
     async def _dispatch(
         self,
diff --git a/tests/server/test_cancel_handling.py b/tests/server/test_cancel_handling.py
index a988b30be6..32088abe6e 100644
--- a/tests/server/test_cancel_handling.py
+++ b/tests/server/test_cancel_handling.py
@@ -120,7 +120,13 @@ async def handle_call_tool(ctx: ServerRequestContext, params: CallToolRequestPar
     server_write, from_server = anyio.create_memory_object_stream[SessionMessage](10)
 
     async def run_server():
-        await server.run(server_read, server_write, server.create_initialization_options(), drain_on_read_close=True)
+        await server.run(
+            server_read,
+            server_write,
+            server.create_initialization_options(),
+            drain_on_read_close=True,
+            read_eof_drain_timeout_seconds=None,
+        )
         server_run_returned.set()
 
     init_req = JSONRPCRequest(
@@ -166,6 +172,70 @@ async def run_server():
             await server_run_returned.wait()
 
 
+@pytest.mark.anyio
+async def test_server_bounds_drain_on_read_eof_when_handler_never_finishes():
+    handler_started = anyio.Event()
+    handler_cancelled = anyio.Event()
+    server_run_returned = anyio.Event()
+
+    async def handle_call_tool(ctx: ServerRequestContext, params: CallToolRequestParams) -> CallToolResult:
+        handler_started.set()
+        try:
+            await anyio.sleep_forever()
+        finally:
+            handler_cancelled.set()
+        raise AssertionError  # pragma: no cover
+
+    server = Server("test", on_call_tool=handle_call_tool)
+
+    to_server, server_read = anyio.create_memory_object_stream[SessionMessage | Exception](10)
+    server_write, from_server = anyio.create_memory_object_stream[SessionMessage](10)
+
+    async def run_server():
+        await server.run(
+            server_read,
+            server_write,
+            server.create_initialization_options(),
+            drain_on_read_close=True,
+            read_eof_drain_timeout_seconds=0.05,
+        )
+        server_run_returned.set()
+
+    init_req = JSONRPCRequest(
+        jsonrpc="2.0",
+        id=1,
+        method="initialize",
+        params=InitializeRequestParams(
+            protocol_version=LATEST_PROTOCOL_VERSION,
+            capabilities=ClientCapabilities(),
+            client_info=Implementation(name="test", version="1.0"),
+        ).model_dump(by_alias=True, mode="json", exclude_none=True),
+    )
+    initialized = JSONRPCNotification(jsonrpc="2.0", method="notifications/initialized")
+    call_req = JSONRPCRequest(
+        jsonrpc="2.0",
+        id=2,
+        method="tools/call",
+        params=CallToolRequestParams(name="slow", arguments={}).model_dump(by_alias=True, mode="json"),
+    )
+
+    with anyio.fail_after(2):
+        async with anyio.create_task_group() as tg, to_server, server_read, server_write, from_server:
+            tg.start_soon(run_server)
+
+            await to_server.send(SessionMessage(init_req))
+            await from_server.receive()  # init response
+            await to_server.send(SessionMessage(initialized))
+            await to_server.send(SessionMessage(call_req))
+
+            await handler_started.wait()
+            await to_server.aclose()
+
+            await server_run_returned.wait()
+
+    assert handler_cancelled.is_set()
+
+
 @pytest.mark.anyio
 async def test_server_reraises_handler_cancellation_when_server_is_cancelled():
     """If the server task is cancelled (e.g. KeyboardInterrupt), in-flight