APMIC CaiGunn 模型

	CaiGunn 34B	CaiGunn 34Bx2（即將推出）
訓練架構	APMIC Brainformers + 知名框架 Llama	Mamba + Transformer + MoDE
運算架構	NeMo Framework	ANF
硬體需求	建議需求 GPU VRAM 需超過 70G 相容 A100、H100、H200、B100 以上等級的 GPU	建議需求 GPU VRAM 需 80G~140GB 相容 A100、H100、H200、B100 以上等級的 GPU
特色	check支援英文與中文 check可地端運行 check4K Context window check可搭配 CaiGunn 平台進行微調 checkMMLU 分數高過於 GPT 3.5	check支援英文與中文 check可地端運行 check8K Context window check可搭配 CaiGunn 平台進行微調

下載模型免費試用

成本少一半，評測也不低

check完成 APMIC 的模仿學習（Imitation Learning）後，推論成本能減少 50% 以上。
check中文與英文表現在特定評測標準上優於知名模型
check支持透過 CaiGunn 平台的特定領域微調

MMLU 排行（英文）

公司名稱	模型	分數
OpenAI	GPT-4無法落地	86.5
APMIC	CaiGunn	75.7
Google	Gemini Pro無法落地	71.8
Mistral AI	Mixtral-8x7B	71.4
OpenAI	GPT-3.5無法落地	70.0
Meta	LLaMA 65B	68.9
Google	Gemma 7B	64.6

TMMLU+ 排行（繁中）

公司名稱	模型	分數
OpenAI	GPT-4無法落地	60.40
APMIC	CaiGunn-zh	55.20
Media Tek	Breeze-7B	40.35
Mistral AI	Mixtral-8x7B	36.93
NTU	Taiwan-LLM-13B	21.36
Innolux	Bailong-instruct-7B	6.80

可處理 OpenAI 的 21 倍資料量

相同成本下可處理的 Input 資料量

公司名稱	模型	Tokens
APMIC	CaiGunn	21.4x
Google	Gemini	12.0x
OpenAI	GPT3.5-Turbo	1x

相同成本下可處理的 Output 資料量

公司名稱	模型	Tokens
APMIC	CaiGunn	8.7x
Google	Gemini	5.3x
OpenAI	GPT3.5-Turbo	1x

彈性自由部署

雲端即刻使用

透過CaiGunn即刻使用知名大語言模型，平台內建自動文字前處理、RAG、圖文輸出、版本控制、模型測試、預覽、部署等功能，同時可支持客製化模型訓練、微調、推論，在雲端也能擁有自己的模型。

免費試用arrow_forward

企業地端使用

CaiGunn的企業版提供強大功能，除了支援NVIDIA DGX、HGX的硬體之外，也同時支援混合雲、私有雲的架構，包含AWS、Azure、Google、Oracle Cloud、DGX Cloud等雲端廠商，確保資料隱私與保護。

了解更多arrow_forward

開發者專區

CaiGunn 的模型目前部署在台灣，我們提供使用者使用模型，透過 CaiGunn API，除了 No-Code，更能夠二次開發！。

低推論成本

透過微調之後，在特定領域訓練的模型就能提供較低的推論成本

支援應用場景

語言模型只是核心，我們能支援更多由APMIC推出應用系統，像是客服、知識管理、合約辨識等。

資料保密

搭配NVIDIA H100同級以上的機密運算(Confidential Computing)技術，能確保資料從訓練到部署都能保密到家。

查看開發者文件免費開始

產品

CaiGunn

OpenTalk

JustDig

Contractopia

Model

GPT 代工一站式服務