MiniMax M2.7 adalah model open source pertama yang bisa mengoptimalkan dirinya sendiri. Temukan kemampuan coding, agent teams, dan performa benchmark yang mengesankan.
MiniMax baru saja membuka akses penuh ke model terbaru mereka, MiniMax M2.7. Kamu bisa langsung download weights-nya di Hugging Face dan mulai eksplorasi.
Ini bukan sekadar model coding biasa. M2.7 adalah model pertama dari MiniMax yang aktif berpartisipasi dalam pengembangan dirinya sendiri. Bayangkan AI yang bisa memperbaiki kode pendukungnya sendiri selama lebih dari 100 iterasi.
Arsitekturnya pakai Mixture-of-Experts atau MoE. Artinya hanya sebagian parameter yang aktif saat inference, jadi lebih cepat dan lebih murah operasionalnya dibanding model dense dengan kualitas serupa.
Ada tiga fokus utama: software engineering profesional, pekerjaan kantoran, dan Agent Teams. Fitur terakhir ini memungkinkan multi-agent berkolaborasi secara native untuk tugas kompleks.
Di benchmark SWE-Pro yang menguji kemampuan debugging sistem produksi nyata, M2.7 mencetak 56.22%. Skor ini setara dengan GPT-5.3-Codex. Bedanya, SWE-Pro itu jauh lebih realistis dari sekadar tes algoritma standar.
Terminal Bench 2 juga dipecahkan dengan skor 57.0%. Benchmark ini menuntut pemahaman sistem-level yang mendalam, bukan cuma generate kode.
Yang menarik, di VIBE-Pro untuk repo-level code generation, M2.7 dapat 55.6% — hampir menyamai Opus 4.6. Jadi kamu bisa serahkan tugas Web, Android, iOS, atau simulasi langsung ke model ini.
Tim MiniMax pernah menguji M2.7 untuk handle alert produksi. Model ini bisa mengkorelasikan metrik monitoring dengan timeline deployment, melakukan causal reasoning, sampling trace, verifikasi database, sampai submit merge request.
Waktu recovery untuk insiden produksi berhasil dipangkas jadi di bawah tiga menit. Ini level SRE, bukan cuma coding assistant.
Sekarang bagian paling unik: self-evolution. M2.7 ditugaskan mengoptimalkan scaffold internal untuk programming performance.
Dia berjalan sepenuhnya autonomus selama 100+ putaran. Setiap iterasi: analisis failure, plan changes, modifikasi kode scaffold, run evaluation, compare results, lalu decide keep atau revert.
Hasilnya? M2.7 menemukan optimasi sendiri: mencari kombinasi optimal sampling parameters, mendesain workflow guidelines yang lebih spesifik, dan menambah loop detection. Peningkatan performa di evaluation set internal: 30%.
Di tim reinforcement learning MiniMax sendiri, M2.7 sekarang handle 30-50% workflow end-to-end. Peneliti manusia cuma intervensi untuk keputusan kritis.
MiniMax juga uji M2.7 di MLE Bench Lite — 22 kompetisi machine learning dari OpenAI yang bisa jalan di single A30 GPU. Setup-nya sederhana: short-term memory, self-feedback, dan self-optimization.
Setelah tiap iterasi, agent generate memory file, self-criticism, dan arahan optimasi untuk putaran berikutnya. Tiga trial dengan window 24 jam masing-masing.
Hasil terbaik: 9 gold medal, 5 silver, 1 bronze. Rata-rata medal rate 66.6%, hanya kalah dari Opus-4.6 dan GPT-5.4, sejajar dengan Gemini-3.1.
Untuk pekerjaan kantoran, M2.7 ranking tertinggi di antara model open source di GDPval-AA dengan ELO 1495. Di Toolathon dapat 46.3% accuracy, masuk tier global top.
Di MM Claw — benchmark berdasarkan pola penggunaan nyata dari platform OpenClaw — M2.7 maintain 97% skill compliance rate di 40 skill kompleks. Overall accuracy 62.7%, mendekati Sonnet 4.6.
Untuk finansial, M2.7 bisa baca annual report dan earnings call transcript, cross-reference research reports, desain asumsi, build revenue forecast model, sampai produce PPT dan Word report.
Levelnya seperti junior analyst yang paham konteks, bisa membuat judgment, dan deliver output lengkap.
Practical takeaway untuk kamu: MiniMax M2.7 sekarang tersedia gratis dengan kualitas frontier-grade. Kalau kamu developer atau researcher, ini kesempatan deploy model agentic tanpa biaya API yang membengkak.
Fokuskan penggunaan di tiga area: debugging produksi yang butuh reasoning mendalam, automation workflow dengan multi-agent collaboration, dan task kompleks dengan context window panjang.
Keunggulan self-evolution juga bisa jadi inspirasi — bayangkan kalau kamu build sistem yang bisa iterasi dan improve scaffold-nya sendiri berdasarkan feedback loop.
AI Updates lagi bergerak cepat, jadi jangan cuma lihat headline.
MarkTechPost
Catatan redaksi
Kalau lo cuma ambil satu hal dari artikel ini
AI Updates update dari MarkTechPost.
Sumber asli
Artikel ini merupakan rewrite editorial dari laporan MarkTechPost.
Baca artikel asli di MarkTechPost→


