生成式人工智能 Generative AI

生成式人工智能是甚麼?

自ChatGPT的出現以來,大家對人工智能的關注急速上升,到底人工智能是甚麼?它可以做甚麼?我們就以ChatGPT為起點討論人工智能吧!它其實屬於生成式人工智能(Generative AI),顧名思義是用以產生內容,包括文字、圖像、音樂甚至程式碼。近日在社交媒體不斷看到的人類及模型合成照是由Google推出的圖像生成及編輯模型Genmini 2.5 Flash Image生成的。這個模型屬於Gemini系列,結合了Gemini出色的語言理解能力與圖像生成能力。而「2.5」也顯示了版本的升級,可見公司不斷地優化模型以提升模型的生成速度及圖張質素。而其他被廣泛使用的生成式人工智能包括由OpenAI開發並專注於文本生成的ChatGPT及由GitHub及OpenAI共同開發並專注於編程的GitHub Copilot等。這類機械人不僅以預設的規則回答問題,而且透過深度學習神經網絡,創造內容,讓人讚嘆其進步並思考人工智能的能力和應用。

 

生成式人工智能訓練

生成式人工智能先閱讀數以兆計啲資料,之後透過深度學習「思考」,最後生成內容。生成對抗網絡(Generative Adversarial Network)及大型語言模型(Large Language Model)是生成式人工智能其中兩個重要的深度學習模型,分別負責生成影像及文字。我們可以想像深度學習技術為模擬人腦運作的方式,以多層神經網絡逐步理解意思,並預測結果。訓練生成式人工智能的難度在於準備真實、公正而合乎法律規管的海量資料。以GPT-4為例,訓練時需約千億個參數以調整模型輸入數據的反應,當模型的理解及生成能力相對高,可以生成更自然及精準的内容。然而,這也帶出了它需要海量的數據進行訓練,約為維基百科全文的數百倍,龐大的參數需要強大的運算資源,包括運算設備、雲端平台、存儲資源及網絡基礎設施。成本相當高。

 

生成式人工智能應用

作為生成式人工智能,聊天機械人經常被視為「行走的百科全書」,解答我們各類的問題。就着文本生成,除了回答問題,它還可以根據我們給予的提示詞生成各類的內容,例如時間表、旅遊行程及簡報等。其出色之處在於理解我們的要求,並搜索資訊以提供個人化的建議。而其他類型的生成式人工智能同讓受人歡迎,你記得眼睛很大的木條、穿着球鞋的鯊魚、身穿芭蕾舞衣的卡布其諾人嗎?這些都是意大利大腦腐蝕(Italian brainrot)的內容,不論是圖像,還是具意大利口音的配音都是有人工智能生成。這些內容被廣泛上傳至串流平台,以 ‘brainrot’ 為主題的影片更獲得高達一億以上的觀看次數,是2025年的熱話之一。

 

濫用

生成式人工智能確實為我們帶來很多便利,但當它被騙徒或不法分子濫用時便會對社會的安定造成威脅。人工智能平台的普及讓大家都能輕易生成內容,若人們的影像被用以生成不實甚或不雅的內容並流傳,會對其聲譽及心理健康造成很大的損害。加上生成內容的質素一直隨著訓練提升,增加我們分辨內容真偽的難度,容易不慎跌入騙徒的圈套。深度偽造影像(Deepfake)的技術引起大眾極大的關注,原因在於經過重重訓練的人工智能生成的圖像實在太過真實了,配合模擬聲線的技術,要以特定人物為主角生成一段具影像和聲音的短片,可說是易如反掌。這些技術帶出了人工智能的技術不再只是人們作為娛樂的工具,更有機會成為騙徒的犯案工具。

 

人工智能的出現提升了我們的辦事效率,亦喚醒了我們對資訊科技安全的警覺。然而,我們應善用人工智能,而非濫用它作為。

 

想一想

  1. 你會運用生成式人工智能嗎?如果會,你會生成甚麼內容?
  2. 你認為生成式人工智能對教育有甚麼影響?
  3.  

其他文章

生成式人工智能
生成式人工智能 Generative AI
人工智能泡沫
人工科技泡沫
用科技令學生嘅創意成真
用科技(AI、Arduino、3D打印)令學生嘅創意成真