Async 單線程 vs 多線程：為什麼 IO 操作時 Async 更快？

核心概念：開銷差異

線程開銷

創建成本：每個線程需要 1-8MB 記憶體
切換成本：OS 級別的 context switch（微秒級）
數量限制：系統通常難以支撐超過 1000 個線程
同步開銷：需要鎖、信號量等機制

Async 協程開銷

創建成本：每個協程僅需約 1KB 記憶體
切換成本：用戶態切換（奈秒級）
數量限制：輕鬆處理 10000+ 併發
同步開銷：單線程無需同步機制

為什麼單線程能處理併發？

阻塞 vs 非阻塞 IO 運作原理

多線程（阻塞 IO）

線程1: 發起請求A → [等待1秒，線程被阻塞] → 處理結果
線程2: 發起請求B → [等待1秒，線程被阻塞] → 處理結果
結果: 需要 2 個線程才能並行處理

Async（非阻塞 IO）

單線程: 
  0ms: 發起請求A → 註冊回調 → 繼續執行
  1ms: 發起請求B → 註冊回調 → 繼續執行
  2ms: 發起請求C → 註冊回調 → 繼續執行
  ...
  1000ms: 請求A完成 → 執行回調
  1001ms: 請求B完成 → 執行回調
  1002ms: 請求C完成 → 執行回調
結果: 單線程處理多個並發請求

Event Loop 工作原理

事件循環執行流程

檢查任務隊列：是否有待執行的回調
執行同步代碼：處理當前任務
發起 IO 操作：註冊回調，不等待結果
讓出控制權：切換到下一個任務
IO 完成通知：系統通知 IO 操作完成
執行回調：處理 IO 結果

視覺化時間軸

時間    事件
----    ----
0ms     Task A 開始 → 發起 IO → 註冊回調 → 讓出控制
1ms     Task B 開始 → 發起 IO → 註冊回調 → 讓出控制  
2ms     Task C 開始 → 發起 IO → 註冊回調 → 讓出控制
3ms     Event Loop 檢查就緒的 IO
...
100ms   Task A 的 IO 完成 → 執行回調
101ms   Task B 的 IO 完成 → 執行回調
102ms   Task C 的 IO 完成 → 執行回調

整個過程只用一個線程！

性能比較數據

資源使用對比（1000 個併發 IO 操作）

指標	多線程	Async 單線程	差異
記憶體使用	~100MB	~1MB	100x
創建時間	~50ms	~1ms	50x
Context Switch	OS 級別（微秒）	用戶態（奈秒）	1000x
最大併發數	<1000	>10000	10x

實際測試結果

100 個併發請求測試

多線程（10 個線程）：0.52 秒
Async（單線程）：0.12 秒
Async 快 4.3x

檔案 IO 測試（100 個檔案）

線程池（10 線程）：0.083 秒
Async（單線程）：0.021 秒
Async 快 3.9x

適用場景分析

多線程適合

CPU 密集型任務：需要真正的並行計算
阻塞式 API：必須使用阻塞 IO 的舊版 API
簡單並發：少量並發任務（<100）

Async 適合

IO 密集型任務：網路請求、檔案讀寫、資料庫查詢
高併發場景：需要處理數千個同時連接
即時應用：WebSocket、聊天伺服器、推送服務
微服務架構：API 閘道、反向代理

關鍵洞察

1. IO 等待不需要 CPU

IO 操作主要是等待（網路延遲、磁碟讀寫），期間 CPU 是空閒的，不需要多個線程來等待。

2. 事件驅動更高效

單線程 + 事件循環避免了線程創建和切換的開銷，讓 CPU 專注於實際的處理工作。

3. C10K 問題的解決方案

Async 模型是解決 C10K（同時處理萬級連接）問題的主要方案，傳統線程模型無法擴展到這個規模。

4. 記憶體效率

1000 個協程使用的記憶體 < 10 個線程的記憶體使用，這對於高併發伺服器至關重要。

實際應用案例

成功案例

Node.js：單線程事件循環，處理高併發 Web 應用
Nginx：事件驅動架構，高性能 Web 伺服器
Redis：單線程模型，高性能快取資料庫
Python asyncio：異步框架，用於高併發網路應用

程式碼範例

Python Async 範例

import asyncio
import aiohttp

async def fetch_data(session, url):
    async with session.get(url) as response:
        return await response.json()

async def main():
    urls = [f"https://api.example.com/data/{i}" for i in range(100)]
    
    async with aiohttp.ClientSession() as session:
        # 單線程同時處理 100 個請求
        results = await asyncio.gather(
            *[fetch_data(session, url) for url in urls]
        )
    
    return results

# 執行
results = asyncio.run(main())

多線程範例（對比）

import requests
from concurrent.futures import ThreadPoolExecutor

def fetch_data(url):
    response = requests.get(url)
    return response.json()

def main():
    urls = [f"https://api.example.com/data/{i}" for i in range(100)]
    
    # 需要創建線程池
    with ThreadPoolExecutor(max_workers=10) as executor:
        results = list(executor.map(fetch_data, urls))
    
    return results

# 執行
results = main()

總結

Async 單線程在 IO 密集型操作上優於多線程的原因：

更少的開銷：無需創建和管理多個線程
更高的效率：避免 OS 級別的 context switch
更好的擴展性：可處理更多併發連接
更簡單的程式模型：無需處理線程同步問題

這解釋了為什麼現代高性能網路應用普遍採用異步事件驅動架構，而不是傳統的多線程模型。選擇正確的併發模型對應用性能有決定性影響！

Keyboard shortcuts

Jason's Notes