APMIC CaiGunn 模型
CaiGunn 34B | CaiGunn 34Bx2(即將推出) | |
---|---|---|
訓練架構 | APMIC Brainformers + 知名框架 Llama | Mamba + Transformer + MoDE |
運算架構 | NeMo Framework | ANF |
硬體需求 |
|
|
特色 |
|
|
成本少一半,評測也不低
- check完成 APMIC 的模仿學習(Imitation Learning)後,推論成本能減少 50% 以上。
- check中文與英文表現在特定評測標準上優於知名模型
- check支持透過 CaiGunn 平台的特定領域微調
MMLU 排行(英文)
公司名稱 | 模型 | 分數 |
---|---|---|
OpenAI | GPT-4無法落地 | 86.5 |
APMIC | CaiGunn | 75.7 |
Gemini Pro無法落地 | 71.8 | |
Mistral AI | Mixtral-8x7B | 71.4 |
OpenAI | GPT-3.5無法落地 | 70.0 |
Meta | LLaMA 65B | 68.9 |
Gemma 7B | 64.6 |
TMMLU+ 排行(繁中)
公司名稱 | 模型 | 分數 |
---|---|---|
OpenAI | GPT-4無法落地 | 60.40 |
APMIC | CaiGunn-zh | 55.20 |
Media Tek | Breeze-7B | 40.35 |
Mistral AI | Mixtral-8x7B | 36.93 |
NTU | Taiwan-LLM-13B | 21.36 |
Innolux | Bailong-instruct-7B | 6.80 |
可處理 OpenAI 的 21 倍資料量
相同成本下可處理的 Input 資料量
公司名稱 | 模型 | Tokens |
---|---|---|
APMIC | CaiGunn | 21.4x |
Gemini | 12.0x | |
OpenAI | GPT3.5-Turbo | 1x |
相同成本下可處理的 Output 資料量
公司名稱 | 模型 | Tokens |
---|---|---|
APMIC | CaiGunn | 8.7x |
Gemini | 5.3x | |
OpenAI | GPT3.5-Turbo | 1x |
彈性自由部署
雲端即刻使用
透過CaiGunn即刻使用知名大語言模型,平台內建自動文字前處理、RAG、圖文輸出、版本控制、模型測試、預覽、部署等功能,同時可支持客製化模型訓練、微調、推論,在雲端也能擁有自己的模型。
企業地端使用
CaiGunn的企業版提供強大功能,除了支援NVIDIA DGX、HGX的硬體之外,也同時支援混合雲、私有雲的架構,包含AWS、Azure、Google、Oracle Cloud、DGX Cloud等雲端廠商,確保資料隱私與保護。
開發者專區
CaiGunn 的模型目前部署在台灣,我們提供使用者使用模型,透過 CaiGunn API,除了 No-Code,更能夠二次開發!。
低推論成本
透過微調之後,在特定領域訓練的模型就能提供較低的推論成本
支援應用場景
語言模型只是核心,我們能支援更多由APMIC推出應用系統,像是客服、知識管理、合約辨識等。
資料保密
搭配NVIDIA H100同級以上的機密運算(Confidential Computing)技術,能確保資料從訓練到部署都能保密到家。