Meskipun Large Language Models (LLM) mendominasi perhatian dalam pengembangan Artificial Intelligence (AI), tantangan terkait biaya pelatihan yang tinggi (mencapai jutaan dolar), waktu pelatihan yang lama (berbulan-bulan), dan kebutuhan sumber daya komputasi yang besar mendorong pergeseran tren. Banyak perusahaan perangkat lunak, terutama yang ingin mempercepat pengembangan solusi AI, kini mulai beralih ke Small Language Models (SLM).
SLM menawarkan pendekatan yang lebih efisien karena membutuhkan daya komputasi dan memori yang lebih rendah. Model ini dapat dilatih menggunakan dataset yang lebih kecil dan dirancang untuk tugas-tugas yang lebih spesifik, sehingga tidak hanya lebih cepat untuk dilatih dan diimplementasikan, tetapi juga mampu menyaingi atau bahkan melampaui model lain dengan ukuran serupa untuk tugas tersebut.
Dengan parameter yang lebih sedikit, SLM dapat dibangun atau diadaptasi dari LLM yang sudah ada. Ukurannya yang lebih kecil juga memungkinkan SLM dijalankan secara lokal (on-premise) tanpa ketergantungan penuh pada penyimpanan cloud.
SLM yang bersifat open-source menjadi semakin ideal bagi bisnis. Dengan pelatihan menggunakan dataset perusahaan yang dipilih secara selektif, model ini dapat membantu menyaring konten yang tidak relevan atau tidak pantas, serta mengatasi isu krusial seperti tata kelola, risiko, privasi, dan mitigasi bias.
SLM sangat cocok untuk bisnis yang ingin mengadopsi AI, terutama dengan keterbatasan sumber daya, anggaran, atau waktu. Pasar SLM diproyeksikan akan tumbuh stabil sebesar 15% dalam lima tahun ke depan.
Dalam konteks perencanaan bisnis, AI diperkirakan dapat menyederhanakan proses dengan foundation model yang lebih cepat dalam meramalkan variabel. Sebagai contoh, SLM seperti Tiny Time Mixers (TTM) mampu menghasilkan outputberbasis waktu secara cepat untuk memprediksi tren di berbagai bidang, termasuk kemacetan lalu lintas, konsumsi listrik, keuangan, dan ritel.
Kolaborasi antara SLM dan LLM juga menunjukkan potensi besar. Misalnya, TTM dapat bekerja sama dengan LLM seperti Granite 3.2 dari IBM. Kombinasi ini memanfaatkan kecepatan TTM dengan kemampuan penalaran mendalam dan pemahaman kontekstual dari Grani...

1 tahun yg lalu





![[Tabligh Akbar] Dari Banten untuk Indonesia Damai - Ustadz Adi Hidayat](https://i1.ytimg.com/vi/0IjyKlfB3Lo/maxresdefault.jpg)


![[LIVE] 40 Hadits Pokok Dalam Islam - Ustadz Adi Hidayat](https://i1.ytimg.com/vi/M98MxIs-cn4/maxresdefault.jpg)