Pinned台灣化 LLM 的實踐經驗分享 2 | Continual Pretraining — 訓練模型在這個章節中,我們會介紹 LLM Continual Pretraining 的方式、一些節省 GPU Memory 與加速訓練的方法。Feb 9Feb 9
Pinned台灣化 LLM 的實踐經驗分享 3 | Chat Vector — 神奇的 LLM 積木我想先來介紹這篇在 TAIDE 時發表的論文: Chat Vector: A Simple Approach to Equip LLMs with Instruction Following and Model Alignment in New Languages 。Feb 9Feb 9
PinnedDeepseek 模型的簡單科普介紹這幾天過年看到 deepseek 把全世界炸了一波,有許多神人發表神奇的高見,身為職業的LLM套模仔,忍不住想就技術面說幾句話,希望大家能在有正確基本認知的情況下再延伸討論其他議題,我盡量用普通民眾也能聽懂的說法解釋,難免會有些錯誤的地方,歡迎大家就技術面一起討論~Jan 28Jan 28