生成式人工智能 Generative AI

生成式人工智能是甚麼？

自ChatGPT的出現以來，大家對人工智能的關注急速上升，到底人工智能是甚麼？它可以做甚麼？我們就以ChatGPT為起點討論人工智能吧！它其實屬於生成式人工智能（Generative AI），顧名思義是用以產生內容，包括文字、圖像、音樂甚至程式碼。近日在社交媒體不斷看到的人類及模型合成照是由Google推出的圖像生成及編輯模型Genmini 2.5 Flash Image生成的。這個模型屬於Gemini系列，結合了Gemini出色的語言理解能力與圖像生成能力。而「2.5」也顯示了版本的升級，可見公司不斷地優化模型以提升模型的生成速度及圖張質素。而其他被廣泛使用的生成式人工智能包括由OpenAI開發並專注於文本生成的ChatGPT及由GitHub及OpenAI共同開發並專注於編程的GitHub Copilot等。這類機械人不僅以預設的規則回答問題，而且透過深度學習神經網絡，創造內容，讓人讚嘆其進步並思考人工智能的能力和應用。

生成式人工智能訓練

生成式人工智能先閱讀數以兆計啲資料，之後透過深度學習「思考」，最後生成內容。生成對抗網絡（Generative Adversarial Network）及大型語言模型（Large Language Model）是生成式人工智能其中兩個重要的深度學習模型，分別負責生成影像及文字。我們可以想像深度學習技術為模擬人腦運作的方式，以多層神經網絡逐步理解意思，並預測結果。訓練生成式人工智能的難度在於準備真實、公正而合乎法律規管的海量資料。以GPT-4為例，訓練時需約千億個參數以調整模型輸入數據的反應，當模型的理解及生成能力相對高，可以生成更自然及精準的内容。然而，這也帶出了它需要海量的數據進行訓練，約為維基百科全文的數百倍，龐大的參數需要強大的運算資源，包括運算設備、雲端平台、存儲資源及網絡基礎設施。成本相當高。

生成式人工智能應用

作為生成式人工智能，聊天機械人經常被視為「行走的百科全書」，解答我們各類的問題。就着文本生成，除了回答問題，它還可以根據我們給予的提示詞生成各類的內容，例如時間表、旅遊行程及簡報等。其出色之處在於理解我們的要求，並搜索資訊以提供個人化的建議。而其他類型的生成式人工智能同讓受人歡迎，你記得眼睛很大的木條、穿着球鞋的鯊魚、身穿芭蕾舞衣的卡布其諾人嗎？這些都是意大利大腦腐蝕（Italian brainrot）的內容，不論是圖像，還是具意大利口音的配音都是有人工智能生成。這些內容被廣泛上傳至串流平台，以 ‘brainrot’ 為主題的影片更獲得高達一億以上的觀看次數，是2025年的熱話之一。

濫用

生成式人工智能確實為我們帶來很多便利，但當它被騙徒或不法分子濫用時便會對社會的安定造成威脅。人工智能平台的普及讓大家都能輕易生成內容，若人們的影像被用以生成不實甚或不雅的內容並流傳，會對其聲譽及心理健康造成很大的損害。加上生成內容的質素一直隨著訓練提升，增加我們分辨內容真偽的難度，容易不慎跌入騙徒的圈套。深度偽造影像（Deepfake）的技術引起大眾極大的關注，原因在於經過重重訓練的人工智能生成的圖像實在太過真實了，配合模擬聲線的技術，要以特定人物為主角生成一段具影像和聲音的短片，可說是易如反掌。這些技術帶出了人工智能的技術不再只是人們作為娛樂的工具，更有機會成為騙徒的犯案工具。

人工智能的出現提升了我們的辦事效率，亦喚醒了我們對資訊科技安全的警覺。然而，我們應善用人工智能，而非濫用它作為。

想一想

你會運用生成式人工智能嗎？如果會，你會生成甚麼內容？
你認為生成式人工智能對教育有甚麼影響？

其他文章

生成式人工智能 Generative AI

人工科技泡沫

用科技（AI、Arduino、3D打印）令學生嘅創意成真

Tagged AI