視訊治療該看哪裡?用眼神策略在 Zoom 上建立工作同盟
視訊會談天生帶著一道眼神接觸的兩難。本文提供實用的視線與設備擺位策略,讓個案在螢幕上也能真正感受到「被看見」。

重點摘要
在視訊遠距治療中,臨床工作者面臨一道結構性的「視差兩難」:看著螢幕讀取個案的表情,從對方角度卻像是在迴避眼神;看著鏡頭製造「眼神接觸」,又會錯過自己賴以追蹤情感的細微臉部線索。多重迷走神經理論說明了這為何重要——人腦從眼睛讀取安全感,而數位中介會扭曲這個訊號。實用的調整包括:在攝影鏡頭旁放一個視線錨點、把自己的非語言行為說出來、保持讓雙手與手勢入鏡的距離,並善用 AI 文書工具,讓你能全然臨在於個案。
「你到底有沒有在看我?」視訊治療中眼神接觸的隱形難題
如今視訊會談已是臨床實務中固定的一環,多數治療師都遇過同一種說不出口的挫折:要讓個案隔著螢幕感受到真正的連結,實在很難。在診療室裡毫不費力的眼神接觸,一旦中間隔了一台螢幕,就變得彆扭又像在演戲。看著螢幕上個案的臉,在對方眼中你卻像在別處張望;直視鏡頭去「對上眼神」,又會錯過你賴以追蹤情感的微表情。這就是視差兩難——一種內建於媒介本身的結構性錯位,而非你視訊技巧不佳的徵兆。
數十年的研究都指向工作同盟是治療成效最強的預測因子之一,而眼神接觸往往是這份同盟的第一條線。但在 Zoom 這類平台上,我們從小演化而來的社會訊號系統會被扭曲。那些揮之不去的疑問——我看起來像在分心嗎?我的同理真的傳達到了嗎?——會推高視訊疲勞,也鈍化臨床直覺。本文要把視線的處理重新框定為一項刻意鍛鍊的臨床技巧,而非外觀上的小毛病,並提供你今天就能做出的具體調整。
為什麼視訊上的眼神接觸更累、也更難
你在視訊會談中感到的吃力,並不只是對科技不熟悉。它源於人類神經系統演化的方式與螢幕所能傳遞的內容之間的落差。多重迷走神經理論主張,我們大多從對方眼周肌肉與視線方向來讀取安全感。在視訊遠距治療中,這個線索抵達時已被扭曲、壓縮或略微延遲——而神經系統會察覺。先指認出這個差異,是繞過它的第一步。
| 實體會談 | 視訊遠距治療 | |
|---|---|---|
| 視線 | 可以自然地相互對視 | 發送(看鏡頭)與接收(看螢幕)被切割開來 |
| 非語言資訊 | 完整姿勢、呼吸、細微顫抖都容易觀察 | 多半只剩頭肩部;細節因解析度與光線而流失 |
| 沉默 | 在同一空間中共享、「同在」的沉默 | 可能被誤讀為斷線或聲音卡頓 |
| 認知負荷 | 自動、直覺地處理 | 需有意識地解碼劣化的非語言線索(耗能高) |
表 1. 實體與視訊會談在溝通機制上的差異。
如表所示,視訊要求臨床工作者付出多得多的認知努力。而由於「看著鏡頭」才會被讀成「看著個案」,你必須有意識地布置自己的視線。這並非虛偽的表演——而是一項主動的治療介入,用以克服媒介的限制、向個案傳遞一種被感受到的安全感。
深化連結的四個視線與擺位策略
超越「就看著鏡頭」這種籠統建議,以下是你能立刻套用的細部調整。
1. 用便利貼做視線錨定
鏡頭冰冷又機械,盯著它對你自己來說也不舒服。在攝影鏡頭旁放一個小提示——一張笑臉貼紙,或寫著*「此刻,我們同在這裡」*之類字句的便利貼。它會自然把你的視線引向鏡頭,每次瞥到也讓你獲得一點正向情感。同樣重要:把個案的視訊視窗拖到螢幕的正上方中央、緊貼在鏡頭下方,讓「看著對方」與「看著鏡頭」之間的落差幾乎消失。
2. 把你的非語言行為說出來
在診療室裡,當你低頭時,個案會直覺地讀成他正在記筆記。在螢幕上,同樣的動作卻可能看起來像分心或無聊。所以,把它說出來。簡短、透明的說明——「我低頭一下,把這個重要的部分記下來」或「讓我閉眼幾秒,整理一下思緒」——能讓個案正確理解你的行為而不致誤讀,安全感也因此維持住。
3. 數位空間關係學:距離與手部的運用
一張塞滿整個畫面的臉,會帶來一種無意識的侵入感;坐得太後面,個案又覺得被推得遠遠的。最佳位置要讓你的上胸、肩膀,以及——關鍵的——手勢都留在畫面裡(大約離鏡頭 60–80 公分/24–32 吋)。當個案能看見你點頭或做出帶有同理的手勢,這些動作就成了有力的關係工具,足以彌補螢幕上眼神接觸的不完美。
4. 讓眼睛清晰可辨的光線與構圖
個案賴以讀取的神經系統線索就住在你的眼睛裡,所以要讓它們被看見。把主要光源放在你前方(一扇窗或一盞朝向你的燈),而非背後,並把鏡頭抬到接近視線高度,讓你不必低頭看它。光線充足、視線平視的構圖會默默地起作用:讓你的視線可被讀取,讓你的臨在更穩定。
維持臨在的技術支援:回到工作本身
視訊工作最難的一環,就是多工。你一邊維持眼神接觸、傳遞同理,一邊還要追蹤個案的敘事並加以記錄。鍵盤的喀噠聲變成雜音;低頭書寫則打斷了視線。這正是合適的工具能幫你打造*「一個讓你得以始終把目光放在個案(鏡頭)上的環境」*之處。
通用型的逐字稿工具——Otter.ai、Fireflies 或 Zoom AI Companion——能即時擷取並摘要對話,而專為臨床打造的工具則走得更遠。當 AI 系統把會談轉成文字並浮現關鍵主題,你就能放下「什麼都得親手寫下」的強迫。這不只是減少行政工作而已。它意味著,你不必再低頭動筆,而是能透過鏡頭再多送出一個溫暖、專注的眼神。(提醒一句:臨床會談涉及敏感的受保護健康資訊(PHI),因此請優先選擇具備強健安全性、清楚的資料處理政策,並在適當情況下備有商業夥伴協議(BAA)的工具,而非消費級錄音裝置。)
這正是像 Modalia AI 這樣安全優先的夥伴所為而生的角色:以臨床等級的隱私處理逐字稿、個案概念化支援與文書工作,讓認知負荷從鍵盤上移開,重新回到關係本身。
歸根究柢,視訊治療的核心不在於完美無瑕的技術——而在於臨床工作者那穩定、反覆傳遞的訊號:「我在這裡,專注於你」,即便身處媒介的限制之中。藉由視線錨定、用心拿捏的距離、良好的光線,以及 AI 文書工具的支援,你就能以真實的共鳴,觸及螢幕另一端的個案。
參考資料
- 1.
常見問題
視訊會談時,我該看鏡頭還是看個案的臉?
刻意交替。在情緒重要的時刻看向鏡頭,製造眼神接觸的知覺;其餘時間瞥向個案的視訊視窗以讀取情感。把對方的視窗放在你攝影鏡頭的正下方,能縮小兩者之間的落差,讓切換幾乎看不出來。
為什麼視訊治療比實體工作累得多?
視訊迫使你有意識地去解碼那些大腦原本會自動處理的非語言線索,而鏡頭與螢幕之間的切割又破壞了我們賴以讀取安全感的視線訊號。這份額外的認知負荷,正是視訊疲勞的主要來源。
我該離鏡頭多遠?
大約 60–80 公分(24–32 吋)——近到足以感覺臨在,又遠到讓你的肩膀與手勢留在畫面裡。看得見的手勢與點頭,有助於彌補螢幕上眼神接觸的不完美。
會談中使用 AI 工具做筆記可以嗎?
可以,前提是該工具符合臨床的隱私標準。由於會談含有敏感的受保護健康資訊,請選擇安全優先、具清楚資料處理政策、並在適用情況下備有商業夥伴協議的平台,而非消費級錄音裝置。
本文依據 Modalia AI 臨床指引撰寫與審閱,並在發布前經過專業人員的人工審核。


