Pelancaran Model AI Minggu Ini: Kemas Kini Claude, DeepSeek & Gemini
Pelancaran model AI minggu ini membawakan kemas kini besar dari Anthropic, DeepSeek, dan Google. Kami huraikan impak Claude 4.8, DeepSeek yang lebih murah, dan Gemini 3.5 untuk perniagaan di Malaysia.
Perkembangan teknologi AI bergerak dengan sangat pantas. Setiap minggu ada sahaja model baharu, potongan harga, dan peningkatan keupayaan yang boleh mengubah ekonomi pembinaan perisian. Bagi pengasas dan pembuat keputusan di Malaysia, mengikuti perkembangan ini bukan untuk mengejar populariti; ia adalah untuk mencari kelebihan praktikal. Artikel ini menghuraikan pelancaran model AI paling signifikan minggu ini dan maksudnya untuk perniagaan anda.
Impak pelancaran model AI minggu ini untuk pembangun Malaysia
Tema untuk akhir bulan Mei 2026 adalah jelas: AI menjadi lebih murah, lebih pantas, dan jauh lebih baik dalam melaksanakan tugasan kompleks yang memerlukan pelbagai langkah. Peralihan ke arah 'aliran kerja agentik'—di mana model boleh merancang, melaksana, dan membetulkan sendiri satu siri tindakan—kini disokong oleh pengurangan harga yang besar. Nama-nama utama dalam berita ialah Anthropic dengan Claude 4.8, DeepSeek dengan potongan harga kekal untuk model V4-Pro, dan Google yang melancarkan Gemini 3.5 Flash untuk kegunaan umum. Setiap perkembangan ini membuka peluang tersendiri untuk perniagaan di Seremban dan seluruh Malaysia.
Claude 4.8 Anthropic: Ejen Lebih Pintar, Kos Lebih Rendah
Anthropic telah melancarkan Claude Opus 4.8 pada 28 Mei, dengan fokus utama untuk meningkatkan prestasi bagi aliran kerja agentik dan pengekodan yang kompleks. Laporan awal menunjukkan model ini mempunyai pertimbangan dan kebolehpercayaan yang lebih baik apabila ditugaskan untuk melaksanakan satu urutan arahan. Bagi sebuah studio perisian seperti JRV Systems, ini adalah sesuatu yang penting. Ia membawa kami lebih dekat kepada penggunaan AI untuk tugasan seperti diagnostik sistem automatik sepenuhnya atau menguruskan tiket sokongan pelanggan yang rumit dari awal hingga akhir.
Kemas kini yang paling memberi impak kepada perniagaan di Malaysia ialah pengurangan harga sebanyak 3 kali ganda untuk "mod pantas" Claude 4.8, yang beroperasi 2.5 kali lebih laju daripada model standard. Ini menjadikan tugasan berprestasi tinggi seperti ejen lebih efektif dari segi kos. Walaupun harga standard kekal pada $5 per juta token input dan $25 per juta token output, mod pantas yang lebih murah ini membuka kes penggunaan baharu yang sebelum ini terlalu mahal untuk dijalankan secara besar-besaran.
Anthropic juga memperkenalkan ciri dalam Claude Code yang dipanggil "aliran kerja dinamik." Ia membolehkan model memecahkan masalah berskala besar, seperti migrasi keseluruhan pangkalan kod, kepada tugasan lebih kecil yang diuruskan oleh sub-ejen selari. Ini adalah keupayaan termaju yang boleh mengurangkan usaha manual dalam projek kejuruteraan perisian yang besar.
DeepSeek V4-Pro: Prestasi Termaju pada Harga Jauh Lebih Murah
Pada 23 Mei, syarikat pemula AI dari China, DeepSeek, telah mengambil langkah besar dengan menjadikan harga promosinya untuk DeepSeek V4-Pro sebagai harga tetap. Ini merupakan potongan harga sebanyak 75%, yang mengubah secara asas struktur kos untuk AI berprestasi tinggi. Bagi pembangun perisian di Malaysia, ini adalah berita baik. Ia menjadikan model berkemampuan tinggi dengan tetingkap konteks 1 juta token tersedia pada harga yang sukar untuk diabaikan.
Harga API kini serendah $0.87 per juta token output. Sebagai perbandingan, ia hanyalah sebahagian kecil daripada kos model lain dalam tahap prestasinya. Ini meletakkan DeepSeek sebagai pilihan utama untuk syarikat pemula dan PKS yang perlu memproses data dalam jumlah besar. Aplikasi yang berpotensi termasuk:
- Analisis Dokumen: Memproses dan meringkaskan kontrak perundangan, laporan kewangan, atau kertas penyelidikan yang panjang.
- RAG Lanjutan: Membina bot sokongan pelanggan atau pangkalan pengetahuan dalaman yang sangat berpengetahuan, yang boleh merujuk kepada ribuan halaman dokumentasi.
- Pemprosesan Data: Menyusun dan menganalisis set data tidak berstruktur yang besar untuk papan pemuka risikan perniagaan.
Gabungan tetingkap konteks yang besar dan kos yang sangat rendah menjadikan DeepSeek V4-Pro alat yang berkuasa untuk aplikasi intensif token yang sebelum ini terlalu mahal bagi kebanyakan perniagaan di Malaysia.
Gemini 3.5 Flash Google: Dibina untuk Kelajuan dan Ejen
Diumumkan pertama kali di Google I/O, Gemini 3.5 Flash kini tersedia untuk umum mulai 19 Mei. Google telah meletakkan model ini sebagai pilihan utama untuk tugasan yang pantas, berskala, dan agentik. Ia dilaporkan mengatasi prestasi Gemini 3.1 Pro sebelumnya dalam penanda aras pengekodan dan penaakulan, sambil berjalan dengan lebih pantas dan pada kos yang lebih rendah.
Bagi pembangun di Malaysia, Gemini 3.5 Flash menawarkan tetingkap konteks 1 juta token pada harga yang kompetitif: $1.50 per juta token input dan $9.00 per juta token output. Ini menjadikannya pilihan pertengahan yang mantap—lebih berkebolehan dan pantas daripada banyak model kecil, tetapi lebih murah daripada model peringkat atasan seperti GPT-4 atau Claude Opus.
Apa yang penting, Google juga melancarkan "Managed Agents" dalam API Gemini. Ia adalah platform yang direka untuk membantu pembangun membina, mengurus, dan menggunakan ejen autonomi yang dikuasakan oleh model Gemini. Ini menandakan bahawa Google sedang membina ekosistem penuh untuk menyokong pembangunan aplikasi agentik, yang memudahkan proses untuk para pembina.
Rumusan Praktikal untuk Perniagaan di Malaysia
Siri pelancaran model AI minggu ini memberikan beberapa rumusan yang jelas untuk pengasas dan pemimpin teknikal.
- Kos bukan lagi penghalang kepada prestasi tinggi. Dengan harga baharu DeepSeek V4-Pro, perniagaan kecil pun mampu menjalankan beban kerja AI yang canggih pada set data yang besar. Ini mendemokrasikan akses kepada teknologi yang berkuasa.
- 'Ejen' adalah sempadan seterusnya. Fokus daripada Anthropic dan Google pada aliran kerja agentik adalah petunjuk jelas ke mana arah tuju industri. Di JRV Systems, kami sedang giat meneroka model-model ini untuk membina automasi WhatsApp yang lebih maju dan sistem pengebilan dalaman yang boleh menguruskan pengecualian secara sendiri.
- Strategi pelbagai model adalah penting. Pendekatan terbaik bukan lagi dengan memilih satu penyedia model sahaja. Strategi yang bijak melibatkan penggunaan portfolio model: DeepSeek untuk pemprosesan data pukal, Gemini 3.5 Flash untuk interaksi pantas dengan pengguna, dan Claude 4.8 Opus untuk tugas penaakulan yang kompleks dan berisiko tinggi.
- Integrasi menjadi lebih mudah. Sebagai nota sampingan, pelancaran Qwen3.7-Max oleh Alibaba Cloud baru-baru ini turut menyokong protokol API Anthropic. Trend ke arah saling kendali ini bermakna ia menjadi lebih mudah untuk bertukar antara model, membolehkan perniagaan memilih alat terbaik untuk sesuatu tugasan tanpa terikat kepada satu ekosistem sahaja.