Pelancaran Model AI Minggu Ini: Qwen 3.7, Command A+, Gemini 3.5
Tinjauan praktikal pelancaran model AI minggu ini. Kami mengulas Qwen3.7-Max dari Alibaba, Command A+ dari Cohere, dan Gemini 3.5 Flash dari Google untuk perniagaan Malaysia.
Perkembangan AI terus pesat, dengan model dan kemas kini baharu dikeluarkan hampir setiap hari. Bagi syarikat di Malaysia yang cuba mengikuti perkembangan ini, sukar untuk membezakan antara kemas kini kecil dan anjakan yang signifikan. Ringkasan ini merangkumi pelancaran model AI minggu ini yang utama, dengan tumpuan kepada aspek penting untuk aplikasi praktikal: keupayaan, kos, dan masalah spesifik yang dapat diselesaikannya.
Pelancaran Model AI Utama Minggu Ini
Tiga pelancaran penting minggu lalu telah menolak sempadan keupayaan model bahasa raya (LLM), terutamanya dalam pembinaan ejen autonomi. Alibaba Cloud memperkenalkan Qwen3.7-Max, sebuah model proprietari yang direka untuk ketahanan. Cohere mengeluarkan Command A+, alternatif sumber terbuka yang berkuasa. Manakala di persidangan I/O, Google melancarkan Gemini 3.5 Flash, model yang dioptimumkan untuk kelajuan dan kecekapan berskala. Setiap satu menawarkan set pertukaran nilai yang berbeza untuk pembangun perisian dan perniagaan.
Qwen3.7-Max dari Alibaba: Dibina untuk Ejen Jangka Panjang
Pelancaran Qwen3.7-Max oleh Alibaba Cloud pada 21 Mei disasarkan terus untuk 'era ejen'. Model utama proprietari ini direka untuk tugasan yang memerlukan autonomi jangka panjang. Ciri utamanya ialah tetingkap konteks 1 juta token, yang membolehkannya memproses dan mengingati jumlah maklumat yang sangat besar—bersamaan ratusan muka surat teks—dalam satu sesi.
Dalam satu demonstrasi, model ini berjaya melaksanakan tugasan yang berjalan selama 35 jam dan melibatkan lebih 1,000 panggilan alatan (tool calls) tanpa sebarang campur tangan manusia. Keupayaan ini amat penting untuk aliran kerja yang kompleks dan memakan masa berhari-hari. Bagi syarikat logistik di Malaysia, ini boleh bermakna ejen AI menguruskan keseluruhan proses penghantaran, dari pesanan awal hingga pengesahan penghantaran, sambil mengendalikan sebarang masalah dan berkomunikasi dengan sistem yang berbeza.
Harganya ditetapkan pada $2.50 per juta token input dan $7.50 per juta token output. Ini meletakkannya sebagai pilihan premium untuk perniagaan yang memerlukan automasi jangka panjang yang boleh dipercayai untuk proses kritikal.
Command A+ dari Cohere: Pilihan Sumber Terbuka untuk Enterprise
Pada 20 Mei, Cohere memperkenalkan Command A+, sebuah model sumber terbuka yang menyediakan alternatif berkuasa kepada sistem proprietari. Dikeluarkan di bawah lesen Apache 2.0, ia percuma untuk kegunaan komersial dan pengubahsuaian. Ini merupakan kelebihan besar bagi syarikat di Malaysia yang ingin membina keupayaan AI canggih tanpa menanggung yuran pelesenan yang tinggi.
Spesifikasi utamanya termasuk:
- Tetingkap konteks 128,000 token: Mencukupi untuk kebanyakan tugasan perniagaan yang kompleks.
- Penggunaan alatan natif: Direka dari awal untuk berinteraksi dengan API luaran dan sumber data.
- Input multimodal: Boleh memproses teks dan imej, membuka peluang untuk analisis dokumen, pengecaman produk, dan banyak lagi.
Oleh kerana ia sumber terbuka, perniagaan boleh mengehos Command A+ sendiri, memberikan mereka kawalan penuh ke atas data dan infrastruktur. Ini amat penting bagi industri dengan keperluan privasi data yang ketat. Namun, ia memerlukan kepakaran teknikal dalaman untuk pemasangan dan penyelenggaraan. Bagi pasukan yang betul, ia menawarkan keseimbangan kuasa dan keberkesanan kos yang sangat baik untuk membina ejen peringkat enterprise.
Gemini 3.5 Flash dari Google: Kelajuan dan Skala untuk Tugasan Berfrekuensi Tinggi
Diumumkan di Google I/O pada 19 Mei, Gemini 3.5 Flash direka untuk kelajuan. Google menggambarkannya sebagai menawarkan "penaakulan tahap Pro pada kependaman kelas Flash." Ini menjadikannya sesuai untuk aplikasi di mana masa tindak balas adalah kritikal, seperti chatbot sokongan pelanggan masa nyata atau papan pemuka analisis data interaktif.
Seperti Qwen3.7-Max, ia mempunyai tetingkap konteks 1 juta token. Kekuatan utamanya terletak pada pengoptimuman untuk tugasan berfrekuensi tinggi, terutamanya dalam pengekodan dan aliran kerja agentik. Ia mempunyai sokongan natif untuk panggilan fungsi, pelaksanaan kod, dan penjanaan output berstruktur seperti JSON, yang memudahkan integrasi ke dalam sistem perisian sedia ada.
Dengan harga $1.50 per juta token input dan $9.00 per juta token output, ia adalah pilihan paling kos efektif untuk tugasan yang banyak menggunakan input di kalangan model proprietari baharu. Bagi platform e-dagang di Malaysia, model ini boleh menguasakan bot khidmat pelanggan yang mengendalikan ribuan perbualan serentak dengan pantas dan tepat, meningkatkan pengalaman pengguna sambil menguruskan kos.
Pertimbangan Praktikal untuk Perniagaan di Malaysia
Pemilihan model yang tepat bergantung sepenuhnya pada masalah perniagaan spesifik yang anda cuba selesaikan. Tiada satu model yang 'terbaik' untuk semua keadaan.
-
Kos vs. Prestasi: Command A+ adalah percuma untuk digunakan tetapi memerlukan pelaburan dalam pengehosan dan penyelenggaraan. Untuk model berasaskan API, Gemini 3.5 Flash adalah yang termurah untuk memproses dokumen besar (input), manakala Qwen3.7-Max lebih ekonomik untuk menjana respons yang panjang dan terperinci (output).
-
Spesifikasi Kes Penggunaan: Jika aplikasi anda memerlukan ejen untuk berjalan secara autonomi selama berhari-hari dan mengendalikan ratusan langkah, Qwen3.7-Max dibina khusus untuk itu. Jika anda memerlukan respons hampir serta-merta untuk aplikasi berhadapan pelanggan, Gemini 3.5 Flash adalah pilihan yang lebih mantap. Jika anda mahukan kawalan penuh ke atas data anda dan ingin mengelak daripada terikat dengan satu vendor, laluan sumber terbuka dengan Command A+ adalah yang paling sesuai.
-
Kawalan dan Penyesuaian: Model proprietari dari Google dan Alibaba menawarkan kemudahan penggunaan dan akses kepada teknologi terkini melalui panggilan API yang mudah. Model sumber terbuka seperti Command A+ memerlukan lebih banyak kerja teknikal tetapi memberikan fleksibiliti yang tiada tandingan untuk penalaan halus model pada data anda sendiri dan mengintegrasikannya secara mendalam ke dalam infrastruktur anda.
Di JRV Systems, apabila kami membina perisian untuk pelanggan kami di Seremban dan di seluruh negara, kami bermula dengan keperluan perniagaan. SaaS pengurusan klinik mungkin menggunakan model pantas seperti Gemini 3.5 Flash untuk meringkaskan nota pesakit, manakala sistem automasi pengebilan yang kompleks boleh memanfaatkan keupayaan konteks panjang Qwen untuk menganalisis data transaksi selama berbulan-bulan. Aliran pelancaran model AI minggu ini yang berterusan menyediakan lebih banyak alatan khusus untuk menyelesaikan masalah dunia sebenar ini dengan berkesan.