要約
GLM 5.2は、Zhipu AIが開発したオープンウェイトモデルで、IDOR検出において、Claude Codeを上回る39%のF1スコアを記録しました。この結果は、同じデータセットとプロンプトを使用したベンチマークで得られたもので、セキュリティタスクにおけるAIエージェントの利用が進む中、非常に注目されます。
GLM 5.2は、MITライセンスのもとでパラメータが公開されており、ユーザーが自身のハードウェアで実行したり、ファインチューニングしたりできる点が特に重要です。また、7500億のパラメータを持ちながらも、トークンごとに約400億のアクティブパラメータを使用するミクスチャー・オブ・エキスパート(MoE)モデルで、長いコンテキストを扱う能力にも優れています。
このモデルの成功は、セキュリティチームにとって重要な意味を持ちます。特に、IDORのようなアクセス制御の問題に対して、異なるファイルを横断して推論を行う能力が求められるため、GLM 5.2の性能が注目されています。セキュリティタスク向けの新たな選択肢として、GLM 5.2の実力がどのように活かされるのか、今後の展開が期待されます。
元記事: https://semgrep.dev/blog/2026/we-have-mythos-at-home-glm-52-beats-claude-in-our-cyber-benchmarks/
公開日: Sun, 28 Jun 2026 17:50:47 +0000
この記事はAIアシスト編集により作成されています。
📰 元記事: 元記事を読む