ニュース
推論性能がさらに向上した「DeepSeek-R1-0528」公開
2025年5月30日 14:40
DeepSeekは、同社が開発する大規模言語モデル(LLM)の最新バージョン「DeepSeek-R1-0528」を公開した。推論性能のさらなる向上を実現したという。
従来バージョンと比べ、計算リソースの増強やポストトレーニングにおけるアルゴリズム最適化メカニズムの導入などにより、推論の深さや推論能力を大幅に向上。AIME 2025を使ったテストで精度が70%から87.5%に改善するなど、OpenAI-o3やGemini-2.5-Pro-0506に迫る性能を実現したという。
あわせて、ハルシネーションの抑制、関数呼び出しのサポート強化、バイブコーディング(AIに指示しながらコードを生成していく手法)の体験向上なども図った。
また、蒸留モデルの「DeepSeek-R1-0528-Qwen3-8B」も用意しており、AIME 2024によるテストではベースとなるQweb3-8Bより10%性能が向上し、よりパラメータ数の多いQwen3-235B-A22Bと比べても同等の性能を達成したとしている。