AI Coding python

【AI學習】AI學習心得、心路歷程與資源分享|給新手小白的一封信

前言

就AI發展的時間來講說長不長,說短不短,就在幾年前而已AI被是大眾認為只有一些科學家或大企業能談論的話題。

但隨著硬體技術上的進步(尤其在多個資料平行處理),大大增加了AI入門的門檻,雖然尖端技術目前都掌握在大公司手中,但就在資本主義的發展之下,也快速推動著AI技術的發展。

無論是一開始震撼全球的AlphaGO,至今ChatGPT在推出短短2個月,估計1個月註冊用戶就達到1億之多(仍持續增長中),或是汽車吵的沸沸揚揚的自動駕駛,都是AI技術的展現。

自己當初會想學AI也沒有太大的志向,就是最簡單的刪去發法。

開發網站是我目前的主軸,所以想找相關類型的技術來精進。前陣子也有嘗試資安類的方向,雖然比賽小有成績,但好像沒想像中的那麼有趣。夢想破滅後只好尋求其他學習的目標。

之後誤打誤撞在工作上遇到「影像辨識」的技術,有激起了我新的學習方向。

所以到底是怎麼開始的!

相信現在有在教AI這方面的台灣學校一定也不多,資源也是散佈在網路上,想要自學的話很多好的資源又是ABC的,除了要有基礎資訊上的知識已以外,還要有一定的英外語實力,不然學的時候都不知道到底是在學英文還是學中文orz

我自己也是迷茫很久,先是查了ptt也查了各大論壇,看到越來越多不懂的專有名詞,最後決定到「天瓏書局」直接翻書最快!

於是就找了下班時間翻遍書架上看到標題有興趣的書,就算看了一輪還是不懂也沒關係,用google查一下書名相信也有機會有人會推薦,如果真的資金不足,就努上網找pdf或是查查哪間圖書館有一樣的藏書杯。

目前在在啃這本

附上中文版

我要是數學大師嗎?

基本上高中數學矩陣Matrix, Vector, Sigma 還有概念的話,其實不用拘泥一定要把書上的公式像數學系一樣從頭到尾試證一遍。

除非大學教授要你硬刻出一個演算法,不然現在很多程式的函數在初階學習的時候就非常夠用了。

我想挑戰實作?

最近也正在讀這本《Generative AI on Aws: Building Multimodal Generative AI Applications》,雖然是英文版的,不過我覺得內容講解的淺顯易懂,當然很多專有名詞還是要強記,並將許多新的知識一點一點的累積,才能慢慢掌握AI領域的技術跟用詞。

主要內容

本書詳細介紹了生成式AI專案的完整生命週期,包括:

  • 使用案例定義
  • 模型選擇策略
  • 模型微調技術
  • 檢索增強生成(RAG)方法
  • 人類反饋強化學習(RLHF)
  • 模型量化、優化和部署

書中探討了不同類型的模型:

  • 大型語言模型(LLMs)
  • 多模態模型,如用於圖像生成的Stable Diffusion
  • 圖像問答模型如Flamingo/IDEFICS

實用技能與工具

讀者將學習如何:

  • 將生成式AI應用於特定業務場景
  • 為特定任務選擇最合適的模型
  • 執行提示詞工程和上下文學習
  • 使用低秩適應(LoRA)技術在自有數據集上微調模型
  • 透過人類反饋強化學習使模型符合人類價值觀
  • 使用檢索增強生成提高模型回答的準確性
  • 運用LangChain和ReAct等庫開發AI代理和動作
  • 使用Amazon Bedrock構建生成式AI應用

這本書特別適合CTO、機器學習從業者、應用開發人員、業務分析師、數據工程師和數據科學家,幫助他們在企業環境中有效地實施和利用生成式AI技術的力量。

【Coursera】Generative AI with Large Language Models

這本《Generative AI on Aws: Building Multimodal Generative AI Applications》我也有搭配 Coursera 的這個課程《Generative AI with Large Language Models》,上面提到的這本書也是這項課程的推薦書籍。

這門中級課程將教授生成式AI的運作原理以及如何在實際應用中部署。課程特別專注於大型語言模型(LLMs)的基礎知識和實踐應用,建議是已經會 Python 跟基本 機器學習基礎知識(如監督和非監督學習、損失函數、資料集分割等)再來註冊這個課程。

完成課程後,你將能夠:

  • 深入理解生成式AI:掌握LLM生成式AI生命週期的關鍵步驟,從資料收集、模型選擇到性能評估和部署
  • 熟悉Transformer架構:詳細了解支撐LLMs的Transformer架構、訓練方法,以及如何透過微調使LLMs適應各種特定用例
  • 應用經驗縮放法則:學習如何在資料集大小、計算預算和推理需求之間優化模型的目標函數
  • 掌握先進技術:運用最新的訓練、調整、推理、工具和部署方法,在專案特定限制內最大化模型性能
  • 探討商業機會與挑戰:通過行業研究人員和從業者的案例,討論生成式AI為企業創造的機會和挑戰

完成這個課程後就會有像這樣的證照證明你已經完成了這項課程,也算是滿有成就感的

當然,如果你覺得這個課程難度太難的話,也可以多去找找 Coursera 或是 Udemy 這些平台上的課程看看有沒有適合自己的課程喔!

要讀英文還是中文的書 orz

我是覺得選擇讀英文或是讀中文各有利弊,要評估自己有沒有辦法駕馭中文書的話,我的方法是,拿一本中文翻譯版,再拿英文原版來看。

假設中文版的還吞得下去的話,代表基本知識概念應該是足夠的,再換到英文版時,如果光是讀一個句子,例如作者使用英文解釋專有名詞時還要整句貼到google翻譯,我相信這對學習一個新東西反而是本末倒置。

我自己最後是買了英文版,但最大的衝擊果然還是價錢orz ,上面那本美金69.99大概台幣2000左右……。

買原版另一個方面是反正以後學習資源都是英語居多,那就直接讀英文版的啦,專有名詞也不用一位翻譯不同搞得好多同義字。

———重點小節———

Q. 買英文買中文書

A.
1. 看得懂英文就買英文,看不懂就買中文!
2. 不嫌英文版貴那就買吧!

除此之外我要知道什麼呀?

當然學AI前,程式能力一定是基本,至少要選一種程式語言學習,我自己是學Python 的,有興趣可以看我這篇【2020】我的Python學習心路歷程

如果連最基本程式要怎麼執行或如何建立環境都不到的話,學AI這步可能就太快了,概念就像你要先會寫字才能寫作文一樣。

也有很多線上學習平台推薦大家學習【2023】10個使用線上平台學習的好處|學生、工程師、各行各業皆適用

除此之外有很多youtube頻道內容也是非常專業 3Blue1Brown 是我這陣子看 youtube頻道,主要是針對在AI世界中有用到的數學如線性代數等等。台大的 陳縕儂教授 Vivian NTU MiuLab李弘毅副教授的影片也相關有趣,現在數位發達的時代有這麼多免費學習的資源真的非常的幸福。Mu Li 老師的論文精讀也是非常的專業。個人認為很適合初入門的大家觀看。

除此之外,現在越來越多相關的研討會,不論是最近剛結束的 2023 AI EXPO 或是去年「111年內政大數據分析應用研討會」都很適合有相關興趣的朋友一起參與,在研討會上除了能快速掌握最新消息之外,也可以看到許多業界都在這一方面做了什麼樣的貢獻。

看完以上內容還有興趣!

看完以上內容如果還抱著強烈的學習慾望的話,恭喜你!看起來是對AI是有興趣的人,只要每天都花一點點時間摸索,不管是忙碌的上班族還是迷茫的學生,都一定會得到許許多多的經驗及學識!

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *