Penjana kod AI memerlukan model besar yang boleh menguruskan tetingkap konteks yang lebih luas, dapat mengendalikan sekitar 100,000 baris kod. Campuran model pakar (MOE) yang direka untuk agensi dan penalaran AI juga cukup besar. Walau bagaimanapun, model -model besar -besaran ini cenderung agak mahal, dengan harga antara $ 10 hingga $ 15 per juta token output pada GPU semasa. Ini membentangkan pembukaan untuk seni bina AI yang inovatif untuk mencabar dominasi GPU.
Sistem Cerebras melancarkan Big AI dengan QWEN3-235B
Sistem Cerebras (pelanggan Cambrian-AI Research) telah memperkenalkan sokongan untuk model Qwen3-235B yang besar, yang menyokong panjang konteks 131K (kira-kira 200-300 halaman teks), empat kali sebelum ini. Di Sidang Kemuncak Raise di Paris, Cerebras menyerlahkan QWEN3-235B Alibaba, yang memanfaatkan senibina campuran yang sangat cekap untuk mencapai kecekapan pengiraan yang luar biasa. Walau bagaimanapun, kejayaan sebenar adalah bahawa Cerebras dapat mengendalikan model ini hanya pada $ 0.60 per juta token input dan per juta token output-kurang daripada sepersepuluh harga model tertutup yang sama. Walaupun ramai melihat enjin skala wafer cerebras sebagai mahal, data ini mencabar kepercayaan itu.
Soalan yang sering saya terima ialah: Jika cerebras begitu cepat, mengapa ia tidak mempunyai lebih banyak pelanggan? Salah satu sebabnya ialah ia tidak mempunyai sokongan untuk tingkap konteks yang besar dan model yang lebih besar. Pemaju yang ingin membuat kod tidak mahu memecahkan masalah menjadi serpihan yang lebih kecil agar sesuai, katakan, konteks 32KB. Sekarang, halangan jualan ini telah hilang.
"Kami melihat permintaan yang ketara daripada pemaju untuk model canggih dengan konteks lanjutan, terutamanya untuk penjanaan kod," kata Andrew Feldman, Ketua Pegawai Eksekutif dan pengasas Cerebras Systems. "Qwen3-235b pada Cerebras adalah model pertama kami yang bersaing secara langsung dengan model-model terkemuka seperti Claude 4 dan Deepseek R1 dan dengan konteks penuh 131k, pemaju kini boleh menggunakan cerebras untuk aplikasi pengekodan peringkat pengeluaran dan mendapatkan respons di bawah kedua dan menanti-nantikan GPU."
Cerebras telah meningkatkan panjang konteksnya yang disokong dari token 32K hingga 131K-memadankan maksimum yang disokong oleh QWEN3-235B. Peningkatan ini memberi kesan kepada keupayaan model untuk memproses codebase besar dan dokumentasi kompleks. Walaupun konteks 32K cukup untuk tugas penjanaan kod asas, konteks 131k membolehkan model untuk mengendalikan puluhan fail dan puluhan ribu baris kod, membolehkan pembangunan untuk aplikasi gred pengeluaran.
QWEN3-235B melakukan yang sangat baik dalam tugas-tugas yang menuntut penalaran logik yang mendalam, matematik lanjutan, dan penjanaan kod, terima kasih kepada keupayaannya untuk beralih antara "mod pemikiran" (untuk tugas-tugas kompleksiti tinggi) dan "mod tidak berfikir" (untuk dialog tujuan umum). Panjang konteks 131k memberi kuasa kepada model untuk menelan dan menganalisis kod besar (puluhan ribu baris), tugas sokongan seperti refactoring kod, dokumentasi, dan pengesanan pepijat.
Cerebras juga mendedahkan pertumbuhan lebih lanjut dalam ekosistemnya, mendapat sokongan dari Amazon AWS, Datarobot, Docker, Cline, dan tanggapan. Kemasukan AWS sangat penting;
Di manakah tajuk ini?
Big AI terus dikurangkan dan dioptimumkan, mencapai peningkatan yang signifikan dalam prestasi, pengurangan saiz model, dan kos berkurangan. Trend ini mungkin akan diteruskan tetapi akan diimbangi oleh peningkatan keupayaan, ketepatan, kecerdasan, dan ciri -ciri yang benar -benar baru di seluruh modaliti yang berbeza. Oleh itu, jika anda berpuas hati dengan AI tahun lepas, anda berada dalam keadaan baik kerana ia terus menjadi lebih murah.
Tetapi jika anda mencari ciri dan fungsi terkini, anda memerlukan model terbesar dan panjang konteks input terpanjang.
Ia adalah yin dan yang ai.
Atas ialah kandungan terperinci Siapa yang memerlukan model AI besar?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undress AI Tool
Gambar buka pakaian secara percuma

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Ingat banjir model Cina sumber terbuka yang mengganggu industri Genai awal tahun ini? Walaupun Deepseek mengambil sebahagian besar tajuk utama, Kimi K1.5 adalah salah satu nama yang terkenal dalam senarai. Dan model itu agak sejuk.

Menjelang pertengahan tahun 2025, AI "perlumbaan senjata" dipanaskan, dan Xai dan Anthropic kedua-duanya mengeluarkan model perdana mereka, Grok 4 dan Claude 4. Kedua-dua model ini berada di hujung falsafah reka bentuk dan platform penempatan, namun mereka

Tetapi kita mungkin tidak perlu menunggu 10 tahun untuk melihatnya. Malah, apa yang boleh dianggap sebagai gelombang pertama yang benar-benar berguna, mesin seperti manusia sudah ada di sini. Tahun -tahun kebelakangan ini telah melihat beberapa prototaip dan model pengeluaran melangkah keluar dari T

Dibina di atas enjin kedalaman saraf proprietari Leia, aplikasinya memproses imej dan menambah kedalaman semula jadi bersama -sama dengan gerakan simulasi -seperti kuali, zum, dan kesan paralaks -untuk membuat gulungan video pendek yang memberikan kesan melangkah ke SCE

Sehingga tahun sebelumnya, kejuruteraan segera dianggap sebagai kemahiran penting untuk berinteraksi dengan model bahasa yang besar (LLM). Walau bagaimanapun, baru -baru ini, LLM telah maju dengan ketara dalam kebolehan pemikiran dan pemahaman mereka. Sememangnya, jangkaan kami

Gambar sesuatu yang canggih, seperti enjin AI yang bersedia memberikan maklum balas terperinci mengenai koleksi pakaian baru dari Milan, atau analisis pasaran automatik untuk perniagaan yang beroperasi di seluruh dunia, atau sistem pintar yang menguruskan armada kenderaan yang besar.

Satu kajian baru dari penyelidik di King's College London dan University of Oxford berkongsi hasil apa yang berlaku ketika Openai, Google dan Anthropic dibuang bersama dalam pertandingan cutthroat berdasarkan dilema banduan berulang. Ini tidak

Para saintis telah menemui kaedah yang bijak namun membimbangkan untuk memintas sistem. Julai 2025 menandakan penemuan strategi yang rumit di mana penyelidik memasukkan arahan yang tidak kelihatan ke dalam penyerahan akademik mereka - arahan rahsia ini adalah ekor
