Model open-source mengubah lanskap LLM yang menjanjikan keamanan yang lebih baik, efisiensi biaya, dan penyesuaian untuk penerapan AI. Meskipun ChatGPT memiliki lebih dari 180 juta pengguna, solusi on-premises telah menguasai lebih dari separuh pasar LLM, dengan proyeksi yang mengindikasikan pertumbuhan yang berkelanjutan di tahun-tahun mendatang. Trennya jelas: sejak awal tahun 2023, rilis model open-source baru telah meningkat hampir dua kali lipat dibandingkan dengan model closed-source.
Kali ini kita akan menyelami dunia LLM open-source dan :
Baca terus untuk mengetahuinya!
Untuk artikel ini, kami telah memilih 11 open-source model LLM yang populer, dengan fokus pada model yang digunakan secara luas dan tersedia di Ollama.
Ulasan kami mencakup berbagai model “dasar” yang sudah terlatih dan varian yang sudah disetel dengan baik. Model-model ini tersedia dalam berbagai ukuran, dan Anda bisa menggunakannya secara langsung atau memilih versi yang sudah disetel dengan baik dari pengembang asli atau sumber pihak ketiga.
Meskipun pre-trained model memberikan fondasi yang kuat, namun versi instruction-tuned biasanya diperlukan untuk aplikasi yang praktis dan khusus untuk tugas tertentu. Banyak vendor menawarkan pre-fine-tuned model, tetapi pengguna dapat membuat dataset mereka sendiri untuk menyempurnakan lebih lanjut untuk kasus penggunaan yang lebih khusus.
Berikut adalah tabel LLM open-source dari kami:
Model | Developer | Parameter | Context | Implementasi |
---|---|---|---|---|
Llama3 | Meta | 1B, 3B, 8B, 70B, 405B | 8k, 128k | GeneralGeneral text generation, Multilingual tasks, Code generation, Long-form content, Fine-tuning untuk domain spesifik |
Mistral | Mistral AI | 3B-124B | 32k-128k | High-complexity tasks, Multilingual processing, Code generation, Image understanding, Edge computing, On-device AI, Efficient large-scale processing |
Falcon 3 | TII | 1B, 3B, 7B, 10B | 8k-32k | General text generation, Code generation, Mathematical tasks, Scientific knowledge, Multilingual applications, Fine-tuning untuk domain spesifik |
Gemma 2 | 2B, 9B, 27B | 8k | General text generation, Question answering, Summarization, Code generation, Fine-tuning untuk domain spesifik | |
Phi-3.x/4 | Microsoft | 3.8B (mini) 7B (small) 14B (medium) 42B (MoE) | 4k, 8k, 128k, 16k (Phi-4) | General text generation, Multi-lingual tasks, Code understanding, Math reasoning, Image understanding (vision model), On-device inference |
Command R | Cohere | 7B, 35B, 104B | 128k | Conversational AI, RAG, Tool use, Multilingual tasks, Long-form content generation |
StableLM2 | Stability AI | 1.6B, 3B, 12B | Up to 16k | Multilingual text generation, Code generation and understanding, Fine-tuning for specific tasks, Research and commercial applications |
StarCoder2 | BigCode | 3B, 7B, 15B | 16k | Code completion, Multi-language programming, Code understanding, Fine-tuning for specific tasks |
Yi | 01.Ai | 6B, 9B, 34B | 4k, 8k, 200k | Bilingual text generation, Code understanding and generation, Math and reasoning tasks, Fine-tuning untuk domain spesifik |
Qwen2.5 | Alibaba | 0.5B to 72B | 128k | General text generation, Multilingual tasks, Code generation, Mathematical reasoning, Structured data processing |
DeepSeek-V2.x/V3 | DeepSeek AI | 16B, 236B, 671B for V3 (2.4B-37B activated) | 32k-128k | General text generation, Multilingual tasks, Code generation, Fine-tuning, Advanced reasoning (V3) |
Untuk daftar LLM lebih lengkap yang tersedia di luar artikel ini, Anda dapat melihat repositori Awesome-LLM GitHub, yang menyediakan katalog ekstensif model bahasa dan sumber daya terkait.
Berikut beberapa kelebihan LLM open-source:
Terlepas dari kelebihannya, LLM open-source memiliki beberapa kelemahan potensial:
Mari kita bahas satu per satu LLM open-source dan lihat lebih dekat!
Paling cocok untuk: aplikasi umum dengan kebutuhan skalabilitas.
Llama 3 adalah generasi terbaru dari model bahasa besar open-source Meta, yang menawarkan kinerja tinggi di berbagai tugas. Model Llama 3.3 70B terbaru menawarkan performa yang sebanding dengan model parameter 405B dengan biaya komputasi yang lebih murah, sehingga menjadi pilihan yang menarik bagi para pengembang dan peneliti.
Kasus penggunaan Llama 3
Paling cocok untuk: AI pada perangkat dengan pemanggilan fungsi.
Mistral AI, sebuah perusahaan rintisan asal Prancis, dengan cepat menjadi pemain utama dalam bidang LLM open-source. Model Mistral dirancang untuk memenuhi berbagai macam aplikasi, mulai dari perangkat canggih hingga solusi perusahaan berskala besar. Perusahaan ini menawarkan model open-source di bawah lisensi Apache 2.0 dan model komersial dengan lisensi yang dapat dinegosiasikan. Model Ministral terbaru (3B dan 8B) sangat terkenal karena kinerjanya dalam skenario komputasi edge, mengungguli model-model berukuran serupa dari raksasa teknologi.
Kasus penggunaan Mistral AI
Paling cocok untuk: lingkungan dengan sumber daya terbatas.
Falcon 3 adalah iterasi terbaru dari model bahasa besar open-source yang dikembangkan oleh Technology Innovation Institute (TII) di Abu Dhabi. Rangkaian model ini menunjukkan kinerja yang mengesankan untuk LLM kecil sekaligus mendemokratisasi akses ke AI canggih dengan memungkinkan pengoperasian yang efisien pada infrastruktur ringan, termasuk laptop.
Kasus penggunaan Falcon 3
Paling cocok untuk: pengembangan dan penerapan AI yang bertanggung jawab
Gemma 2 adalah keluarga LLM open-source terbaru dari Google, yang dibangun di atas penelitian dan teknologi yang sama yang digunakan untuk membuat model Gemini. Menawarkan kinerja yang kuat untuk ukurannya, Gemma 2 dirancang dengan fokus pada pengembangan AI yang bertanggung jawab dan penerapan yang efisien.
Kasus penggunaan Gemma 2
Paling cocok untuk: solusi AI yang hemat biaya
Phi-3.x / 4 adalah keluarga Small Language Model (SLM) Microsoft yang open-source, yang dirancang untuk menjadi sangat mumpuni dan hemat biaya. Pembaruan Phi-3.5 menghadirkan dukungan multi-bahasa yang disempurnakan, pemahaman gambar multi-bingkai yang lebih baik, dan arsitektur MoE yang baru. Phi-4, model terbaru, menekankan kualitas data daripada ukuran data. Ini dilatih pada data sintetis, konten publik yang disaring, dan sumber daya akademis. Model ini mencapai kinerja yang mengesankan pada berbagai tolok ukur hanya dengan parameter 16B.
Kasus penggunaan Phi 3.x / 4
Paling cocok untuk: conversational AI tingkat perusahan dan RAG
Command R adalah rangkaian LLM andalan Cohere untuk aplikasi tingkat perusahaan dengan fokus pada interaksi percakapan dan tugas-tugas dengan konteks yang panjang. Rangkaian produk ini meliputi Command R, Command R+, dan Command R7B yang ringkas, masing-masing dioptimalkan untuk kasus penggunaan yang berbeda.
Kasus penggunaan Command R
Paling cocok untuk: pembuatan prototipe dan eksperimen cepat
StableLM adalah seri LLM open-source dari Stability AI, yang menawarkan kinerja kompetitif dalam ukuran yang ringkas. Rangkaian produk ini mencakup berbagai ukuran model dan spesialisasi. Model 1.6B, yang dilatih dengan sekitar 2 triliun token, mengungguli banyak model di bawah parameter 2B pada berbagai tolok ukur. Stability AI menyediakan versi dasar dan versi yang disetel dengan instruksi, bersama dengan pos pemeriksaan pra-pelatihan untuk memfasilitasi penyempurnaan lebih lanjut.
Kasus penggunaan StableLM
Paling cocok untuk: tugas-tugas terkait kode dan bahasa pemrograman
StarCoder2 adalah generasi berikutnya dari model bahasa open-source yang dilatih secara transparan untuk source code, yang dikembangkan oleh proyek BigCode. Model ini menawarkan kinerja tinggi untuk tugas-tugas terkait kode di berbagai bahasa pemrograman. Model 15B, khususnya, menyamai kinerja model 33B+ yang jauh lebih besar pada banyak evaluasi, sedangkan model 3B menyamai kinerja model StarCoder 15B sebelumnya, yang menunjukkan peningkatan signifikan dalam efisiensi dan kemampuan.
Kasus penggunaan Starcoder
Paling cocok untuk: aplikasi dwibahasa (Inggris dan Mandarin)
Yi adalah seri LLM open-source yang dikembangkan oleh 01.AI, yang menawarkan kinerja yang kuat dalam bahasa Inggris dan Mandarin di berbagai tugas. Seri Yi-1.5, versi upgrade dari model Yi yang asli, memberikan kemampuan yang lebih baik dalam pengkodean, matematika, penalaran, dan mengikuti instruksi.
Kasus penggunaan Yi
Paling cocok untuk: tugas-tugas multibahasa dan khusus (koding dan matematika)
Qwen2.5 adalah seri terbaru LLM open-source Alibaba dengan berbagai macam ukuran dan varian khusus untuk pengkodean dan matematika. Model-model ini mewakili kemajuan yang signifikan dalam kemampuan multibahasa dan kinerja khusus untuk tugas-tugas tertentu.
Kasus penggunaan Qwen2.5
Paling coock untuk: pemrosesan bahasa berskala besar yang efisien
DeepSeek adalah seri LLM open-source yang kuat yang dikembangkan oleh DeepSeek AI, yang menampilkan arsitektur inovatif untuk kesimpulan yang efisien dan pelatihan yang hemat biaya. Model DeepSeek-V2 dan V2.5 tersedia untuk digunakan dengan Ollama. Sementara DeepSeek-V3 yang baru saja dirilis menawarkan kemampuan yang lebih mengesankan dengan parameter 671B, namun belum tersedia di Ollama pada saat artikel ini ditulis.
Kasus penggunaan Deepseek 2.x / 3