今年 2 月 7 日,微軟將 Bing 結合 ChatGPT(更確切是整合 OpenAI,叫做 Copilot),5 月 10 日,Google 用 Bard 應戰,在美國開始測試 SGE (Search Generative Experience),讓搜尋結果優先顯示 AI 推薦的內容,網路上有不少文章在討論此一趨勢(1, 2),未來 SEO 要爭的不只是第一頁,而是「前 3 名」!
目錄:
一、AI 結合搜尋會有哪些改變?
由於目前台灣還不在 Google 的 SGE 的開放地區中,因此筆者無法實測,下文以 Google 的公開資訊及 New Bing 的邏輯去拆解在「AI 搜尋」時代的一些觀察。
(一) 整合:基於知識框架「整理資料」並跨越「語言鴻溝」
AI 搜尋可以讓使用者在關鍵字中口語的加入更多條件,例如以往使用者要搜尋「安全性高的豪華品牌的中型 SUV」,只能先搜「豪華品牌中型 SUV」或「豪華品牌安全性」再自行過濾,但加入 AI 後,可以一氣呵成完成查詢。
更有意義的是,AI 的生成的內容打破了傳統搜尋結果頁「一筆一筆」的資料,而是「融會貫通」成一段有意義的說明,並能根據使用者所提供的知識框架整理搜尋結果的資料(如圖 2 整理成表格);之前網路上更有有高手示範,直接叫 Bing 做 SWOT 分析,包辦搜尋與整理。
此外,大型語言模型(Large Language Model,下文稱「LLM」)自帶翻譯屬性,因此透過 AI 生成的「解答」可以整合各種語言的答案,打破語言的鴻溝。
(二) 延伸:針對搜尋結果進一步探究、討論
不管是 New Bing 跟這次 Google 發表的 SGE 都充分展現出 AI 搜尋能夠做到「對話式的深入」。以往只能人工對搜尋結果進一步比對,但是 AI 可以基於搜尋結果,進一步跟使用者探討有興趣的細節。
例如 Google 範例中(圖 3),使用者透過 SGE 搜尋「家裡有 3 歲小孩跟狗,去布萊斯峽谷或拱門哪個好?(原文:what’s better for a family with kids under 3 and a dog, bryce canyon or arches.)」,在 Google 生成的推薦下方,還可以接著追問「跟小孩去布萊斯峽谷可以待多久?(原文:How long to spend at Bryce Canyon with kids?)」
(三) 壟斷:繼社群平台壟斷流量,搜尋成為新的壟斷
AI 已經把「第一名」給使用者,並寫出推薦原因,你覺得使用者還會點開第三名的連結嗎?
當 AI 的推薦越來越準,減少了使用者自行過濾資料,得到的結果是「資料壟斷」。其實就算是出現在 AI 推薦結果的第一名,使用者也不一定會像以前點進去看內容,因為 AI 已經把使用者想知道的整理出來了!
如同社群平台都在努力做閉環(直接在平台中做商務,導向外部網站越來越困難),AI 加入搜尋會讓純靠廣告流量的內容平台更賺不到錢,大概只有自己賣商品或雲端服務才有線上獲利空間;而內容平台可能要透過「導購」,讓 AI 被強勢內容洗腦,推薦商品給使用者,來獲取導購收入。
二、網站經營者應該如何應對?
基於以上衝擊,以下討論網站主可能的應對策略。
(一) GSEO:用 AI 的邏輯來建立搜尋關鍵字
AI 結合搜尋是透過「AI 生成搜尋條件」及「AI 整理搜尋結果」來完成,要控制 AI 的搜尋結果,就必須去破解 AI 生成搜尋條件的邏輯,針對這些關鍵字去做 SEO,為了跟傳統給人類搜尋的 SEO 有區別,筆者將它稱為「生成式搜尋引擎最佳化(GSEO, Generative Search Engine Optimize)」。
使用過 New Bing 的人一定會注意到,當 Bing 向網路搜尋(Web Browsing)時會告訴你他用什麼關鍵字,經過 3 個月有系統的整理,筆者歸納出 3 個觀察:
1. 不會錯過搜尋第一名,但也很愛懶人包
以 New Bing 來說,通常會先推薦搜尋第一名的結果,接著如果有整理好的評比文章,會義不容辭地引用,否則會繼續使用排名作推薦。AI 為了能有效率的生成不誤導使用者的內容,有更高機率參考來自Blog的「真實體驗懶人包」,畢竟連搜尋大哥 Google 的文件都說「建立實用、可靠且以使用者為優先的內容」,因此品牌自行撰寫或與部落客合作提供「懶人包」、「推薦包」,就目前來看是洗腦 AI 非常有效的方法。
2. 以「如何寫…」、「…範例」句型來生成解答
AI 生成解答時,常使用「如何…」或「…範例」的句型對外查詢,例如「如何寫出吸睛的文章」或「商務人士自我介紹範例」等等。筆者實際以「如何寫出吸睛的文章」搜尋,可以發現 AI 的參考資料都出現在搜尋結果中。因此如果網頁標題預判了 AI 搜尋的關鍵字,就有更高的機會出現在 AI 給出的答案中。
3. 英文仍是 AI 的母語
當以「使用者的語言」無法找到解答,New Bing 會改以英文搜尋。之前微軟官方分享,GPT3.5 的訓練資料中,中文內容不到 3%,所以 ChatGPT 會先把中文先轉成英文,生成英文內容後,再轉回中文輸出。雖然 ChatGPT 與 Bing 不同,且筆者實測起來搜尋中文,Bing 的結果還是中文優先,不過我想多國語言的 SEO 仍有一定重要性,畢竟目前 Google Bard 還不支援中文(SGE 更只給美國用),要被 AI 推薦「會講英文」還是很重要的。
(二) 基本面:網站架構符合 AI 需求
除了以「GSEO」的「技術面」,其實還有網站架構的「基本面」要顧。
例如可以考慮使用「Google 結構化資料」來提昇對搜尋引擎爬蟲的友善度,讓這個「過渡期」中觀眾更容易點開你的網站,提升搜尋排名,使未來 AI 更容易參考到這篇內容。例如筆者對「HowTo 結構化資料」就很有興趣,因為它有可能讓 AI 更容易認為你的網站有他要的「如何…」關鍵字。
另外,如果希望讓第三方服務有機會加入您網站中的內容(例如現在的 ChatGPT Plugin ),也要注意設置防火牆或 robots.txt 放行 ChatGPT 爬蟲(感謝 Cheng-Ho Wu 提醒,如何設定可參考官方文件)。
三、大型語言模型 (LLM) 的應用趨勢
大型語言模型的強項是「詞彙替換」,把簡短或初步構想改寫成完整 Email 或新聞稿是「擴寫」的替換;把一段文字變為英文或程式碼是「翻譯」的替換,其實大型語言模型說穿了就是透過大量的文本資料,去建立詞的相關性,真的不用過度神化。
觀察目前的 LLM,筆者認為未來的應用有以下 3 個發展方向:
(一) 如何「輸入」更有意義、個人化的內容?
隨著大型語言模型持續發展,Google 或 OpenAI 生成結果的差異必然縮小,但是如何「餵給」LLM 個人化或有意義的資料,將創造應用效果的巨大差異。
舉例來說,如果下個 prompt:「寫一封道歉信」,我們的 LLM 可以用作者習慣的口吻,或根據大量社群資料去分析出「對什麼族群的人用什麼方法道歉最能被接受」,去優化 prompt 並給予 LLM 有意義的參考資料,而不是「標準版四平八穩的道歉信」,那才有機會創造出差異及價值。
(二) 如何「輸出」成熟演算法所需的內容?
「詞彙替換」不只可以替換成人的語言,也可以替換為機器所需的結構化資料。例如要使用傳統的監督學習(Supervised learning,機器學習的一種)自動判斷 IG 帳號是「品牌」還是「網紅」,過去需要先人工對上萬個 IG 帳號標記「類別」,才能用帶有類別資料去建立分類模型 (model)。但是現在有 LLM 可以自動化標記,建立模型的速度可以比過去快上數倍!
另外,過去資料檢索系統礙於資料庫限制,只能接受固定的查詢條件。例如要查詢「楊建民老師指導的論文,要有電子檔」,必須要輸入關鍵字「楊建民」,再勾選「指導教授」及「電子全文」。但是有了 LLM,完全可以做到把上述的需求轉換成結構化的查詢條件,在傳到傳統資料庫中查詢,傳統的系統瞬間變得有智慧。
(三) 整合既有流程,才能發揮綜效
除非 LLM 相較於現有方法,有超級突破的品質、成本或效率,不然筆者認為很難單獨存在。就像 ChatGPT 發展至今,我們也很難會特地去 ChatGPT 生成內容,再貼進 LINE 跟別人聊天,因為大部分情況這樣太麻煩了!
把 LLM 與工作流程結合,才不會讓 LLM 顯的雞肋,筆者分享 2 個好的整合案例:
1. Teams 進階版
Teams 是微軟的工作通訊軟體,加入 OpenAI 技術,讓線上會議可以即時顯示字幕,所以未來再也不用怕憋腳的英文老外聽不懂,不同語言的人可以直接看字幕就能流暢溝通;另外 Teams 還可以即時生成會議紀錄,讓半途加入會議的人馬上進入狀況,開完會後也可以直接看到結論與待辦事項,是筆者目前看到最殺手級的應用。
2. PicSee 縮短網址
PicSee 來自台灣新創公司,除了產出短網址,還可以根據網頁內容配給使用者 4 種風格的社群貼文建議(活潑小編、官方正式、電商、網紅業配)。使用者則可以一鍵複製「貼文建議 + 短網址」,在不產生額外的流程下,挽救小編的腦細胞。
四、總結
隨著人工智慧的日趨成熟,筆者認為「下關鍵字」的苦差事早晚會從人類交棒給 AI,到時候 SEO 的對象是 AI,要怎麼讓 AI 搜尋到,才有了這麼長篇大論的討論(筆者甚至假鬼假怪的提出 GSEO)。
引用筆者朋友的一篇貼文:
所以筆者相信,這些擔心都是暫時的,因為未來很快就會有一隻 AI,來告訴每個網站主「Google 的 Bard 會用什麼關鍵字來搜尋」,然後網站的 SEO 再交給 AI 來做就好了。
最後投資人說:「這篇教人家怎麼用 SEO 業配,原來你也在業配你的 PicSee 呀!」